Goku 是香港大学与字节跳动合作开发的视频生成模型,支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构,通过多模态训练,Goku能够生成自然互动的广告视频,显著降低制作成本。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/goku.html -APPMARK
Goku 是香港大学与字节跳动合作开发的视频生成模型,支持文本到视频、图像到视频、文本到图像等多种生成任务。基于 Rectified Flow Transformer 架构,通过多模态训练,Goku能够生成自然互动的广告视频,显著降低制作成本。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/goku.html -APPMARK
Stable Video Diffusion 是 Stability AI 发布的一种开源潜在扩散模型,支持文本生成视频和图像生成视频以及物体从单一视角到多视角的 3D 合成。