
VideoJAM 是 Meta 推出的,用在增强 视频生成 模型运动连贯性的框架。 基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段基于模型自身的运动预测作为动态引导信号,生成更连贯的运动。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/videojam.html -APPMARK
VideoJAM 是 Meta 推出的,用在增强 视频生成 模型运动连贯性的框架。 基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段基于模型自身的运动预测作为动态引导信号,生成更连贯的运动。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/videojam.html -APPMARK
智谱清影是智谱清言创作的 AI 视频智能体,依托于智谱大模型团队自研的视频生成大模型 CogVideo,支持文生视频,图生视频等能力。