传媒互联网及海外行业:AI音频软硬结合声动未来,AI视频扬帆起航
- 2024-10-16 20:25:36上传人:无法**y-
-
Aa
小
中
大
本期内容提要:OpenAIDevDayAI音频更新亮眼,有望催化AI语音交互应用成熟。2024年10月1日,OpenAI开发者大会上,公司公布了几大创新:实时API、提示词缓存、模型蒸馏、视觉微调。与ChatGPT的高级语音模式类似,RealtimeAPI支持使用六种预设声音进行自然的语音对语音对话。文本输入令牌的价格为5美元/1Mtokens,输出令牌的价
- 一、 AI+ 视频持续火热: Meta 、字节发布新模型,可灵、 Pika 、美图迭代版本
- 二、 OpenAI DevDay AI 音频更新亮眼,有望催化 AI 语音交互应用成熟
- 三、投资建议
- 四、风险因素
- 表 目 录
- 表 1:OpenAI Realtime 音频 API 价格和其他模型文本价格比较
- 表 2:相关上市公司估值表(截至 2024.10. 15)
- 图 目 录
- 图 1:Meta Movie Gen 基础架构
- 图 2:Meta Movie Gen 视频模型和其他模型量化指标比较
- 图 3:Meta Movie Gen 视频模型生成效果比较
- 图 4:Meta Movie Gen 模型视频编辑原理
- 图 5:Meta Movie Gen 模型可生成带有音频的视频
- 图 6:字节 PixelDance 视频模型复杂 prompt 时序性指令生成
- 图 7:可灵 AI 0930 更新“对口型”功能
- 图 8:Pika 1.5 官网更新视频效果
- 图 9:美图 MOKI 一键成片功能展示
- 图 10:Speak 接入 OpenAI Realtime API 支持其角色扮演进行新语言联系功能
- 图 11:Duolingo 2024 Duocon 更新功能( video call with Lily, Adventures, Math,Music )
- 图 12:20Q3 -24Q2Duolingo 日活和月活用户数
- 图 13:20Q1 -24Q2Duolingo 付费订阅用户数
- 图 15:西湖心辰 Lingo AI 语音交互演示
- 图 16:盛天网络给麦 AI 功能迭代
- 图 17:昆仑万维 Mureka 创作页面