计算机软件行业研究:Sora开启创意领域iPhone时刻,关注全球文生图/视频投资机会
- 2024-02-19 15:21:53上传人:On**守ぢ
-
Aa 小 中 大
行业观点Sora问世,视频创作领域迎来“iPhone时刻”。2023年2月15日,OpenAI发布视频生成大模型Sora,通过文本指令,Sora可以直接输出长达60秒的高清视频,包含高度写实的背景、复杂的多角度镜头以及富有情感的多角色叙事,更为可贵的是,Sora生成的视频表现出对于真实世界物理常识的深刻理解。部分媒体报道惊叹——“Sora
- 1.OpenAI视频大模型 Sora:不止于视频,剑指世界模型,初步理解物理规律
- 1.1 Sora问世:OpenAI发布视频生成大模型,剑指物理世界通用模拟工具
- 1.2 技术路径:基于 Patches视觉特征标记的 Diffusion Transformer模型
- 1.3 算法实现: Patches实现更灵活的采样 +更优化的构图
- 1.4 功能解读:文生视频 +视频编辑,确保 “物理世界常识 ”始终在场的通用模拟工具
- 2. 文生图/视频海外标杆: AI应用端焦点,技术及产品迭代迅速
- 2.1 文生图/视频为当下 AI应用焦点:相关产品流量排序名列前茅
- 2.2 文生图-T2I(Text to Image):Diffusion 模型奠定文生图商业化基石,新老玩家广泛入局
- 2.2.1 Adobe:老牌创意软件巨头向 AIG出征,发布下一代 Firefly支持多种文生图功能
- 2.2.2 Midjourney:文生图模型新锐,提升创意设计工作效率,广泛实现商业化落地
- 2.3 文生视频 -T2V(Text to Video):创意产业工作流变革前夜, MGC时代大幕下的先行者
- 2.3.1 Pika:AI初创公司发布 1.0工具,支持一键生成 3秒共计72帧视频
- 2.3.2 Runway:拥有最早商业化的 T2V模型之一 -Runway Gen-2
- 3. 文生图/视频国内映射:万兴、美图头部标杆,相继发布视觉大模型,订阅收入占比势能向上
- 3.1 万兴科技:发布 “天幕”大模型整合 T2V/I能力,AI赋能订阅及续约率双增
- 3.2 美图公司:自研视觉大模型 MiracleVision 4.0,订阅业务收入占比逐年增长
- 4. 投资建议
- 5. 风险提示
- 行业深度研究
- 敬请参阅最后一页特别声明 3
- 扫码获取更多服务 扫码获取更多服务
- 图表1: OpenAI发布文生视频大模型 Sora
- 图表2: Sora技术路径:基于 Patches视觉特征标记的 Diffusion Transformer模型
- 图表3: Why Patches?——更灵活的采样 +更优化的构图
- 图表4: 基于DALL·E 3 DCS的描述性标题重述与基于 GPT的标题扩写
- 图表5: Sora功能一览:文生视频 +视频编辑,确保 “物理世界常识 ”始终在场
- 图表6: Midjourney高居AI产品流量榜首
- 图表7: AI图片生成约占前十 AI产品流量的 74%
- 图表8: T2I模型近年来加速迭代演进
- 图表9: Diffusion模型的前向阶段噪声化和逆向阶段去噪过程
- 图表10: Adobe Firefly目前能够支持的部分 AI功能
- 图表11: Midjourney文生图创意作品已广泛商业化落地
- 图表12: Latent Video Diffusion模型基于文字描述与初始图像编辑视频
- 图表13: 以Sora为代表的 T2V大模型有望深刻改变影视产业工作流
- 图表14: Pika 1.0工具主要功能
- 图表15: Runway Gen-2主要功能
- 图表16: 万兴大模型 “天幕”宣传片中透露七大 AI功能,涉及视频、图片、音频等多模态领域
- 图表17: 2023年以来万兴 T2V/I产品相继更新 /发布
- 图表18: 万兴旗下 T2V/I多款拳头产品已进行 AI功能更新,价格 /月活/收入数据相对积极
- 图表19: AI赋能万兴订阅收入占比及订阅续约率双双逐年增长
- 图表20: 美图发布 MiracleVision 4.0赋能多行业生产力工作流,开放 API支持T2I/I2I功能
- 图表21: 2020年以来美图订阅业务收入占比逐年增长
- 图表22: 推荐关注创意软件厂商万兴科技、美图公司; AI技术龙头虹软科技、科大讯飞
报告网所有机构报告是由用户上传分享,未经用户书面授权,请勿作商用!