计算机:Vidu直接对标Sora,AI时代不可忽视视频革命
- 2024-05-06 12:16:11上传人:心中**野马
-
Aa 小 中 大
国内视频大模型Vidu发布,性能直接对标国际领先水平。4月27日,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型Vidu。Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达16秒、分辨率高达1080P的高清视频内容。Vidu不仅能够模拟真实物理世界,还具备丰富想象力,具
- 1. Vidu引领国产视频大模型革命
- 2. U-ViT架构厚积薄发,工程实践大放异彩
- 3. 海内外大模型瞄准视频领域,加速向应用端延伸
- 4. 投资建议
- 5. 风险提示
- 行业点评 计算机
- 3 / 13 请务必阅读正文之后的信息披露和法律声明
- 图1:AI《创世纪》预告片镜头语言单一
- 图2:Vidu的“海边小屋 ”实现多镜头切换
- 图3:Vidu在“带珍珠耳环的猫 ”中保持时空一致性
- 图4:Sora“一辆老式 SUV 行驶在山坡上 ”效果
- 图5:Vidu“一辆老式 SUV 行驶在山坡上 ”效果
- 图6:Vidu模拟画室中的 “帆船”与“海浪”
- 图7:Vidu模拟“鱼缸女孩 ”
- 图8:Vidu生成“弹吉他的熊猫 ”
- 图9:Vidu研发团队的 成果梳理
- 图10:Sora核心技术架构 DiT
- 图11:Vidu自研技术架构 U-ViT
- 图12:UniDiffuser具有较强的扩展性,能够实现多种功能图文转换
- 图13:Sora采用了DALL・E 3的重标注技术以生成更高质量的视频
- 图14:Sora可生成1分钟长视频
- 图15:Gemini输入文本、图像、语音和视频后输出文本图像
- 图16:Open-Sora开源文生视频模型可生成 16s、720P的长视频
- 图17:Adobe的PR实现在视频中添加物体、消除物体以及生成视频片段
- 表1:Vidu与Sora的对比
报告网所有机构报告是由用户上传分享,未经用户书面授权,请勿作商用!