2023年中国语音合成声学(TTS)行业词条报告
- 2023-05-30 11:07:05上传人:望见**如水
-
Aa 小 中 大
- 政策内容: 鼓励智能语音、量子通信等设备研发、制造
- 政策解读: 此政策鼓励外商进入中国进行智能语音行业的投资,对智能语音行业看好,并在政策上给予相应支持,促进该行业的未来发展以及带动相关的产业。
- 政策名称: 《关于进一步优化地方政务服务便民热线的指导意见》 颁布主体: 国务院办公厅 生效日期: 2021-0 1 影 响: 8 政策性质: 鼓励性政策
- 政策内容: 各地区要做好热线接通能力保障建设,提供与需求相适应的人工服务,同时拓展互联网渠道,丰富受理方式,满足企业和群众个性化、多样化需求。加强自
- 助下单、智能文本客服、智能语音等智能化应用,方便企业和群众反映诉求建议。
- 政策解读: 该政策为优化政务服务便民热线,对于有效利用政务资源、提高服务效率、加强监督考核、提升企业和群众满意度,鼓励政府加强自助下单、智能文本客
- 服、智能语音等智能化应用,推动了语音合成的场景应用。
- 语 音合成( TTS )竞争格局 8
- 当 前,中国语音合成产品已经从初步发展走向成熟,语音合成产品的拟人化程度、自然度已实现飞跃,涌现出一批优质企业如科大讯飞等。
- 价格方面: 科大讯飞和深声科技的价格最高,价格最低的为百度,其中科大讯飞和百度主要为通用型 TTS ,深声科技主要为个性化 TTS 。
- 自然度: 科大讯飞保持较大优势,多次在国际语音合成大赛 Bliz za rd C halle nge 中取得第一名,其 MOS 值在 2019 年已经达到了 4.5 ,与真人的 4.7 区别细微
- 错误率: 中国厂商语音合成错误率保持在 9.2 % ~9.8 % 之间,差距较为微弱
- 语音种类: 语音种类的丰富程度也在一定程度上展示了语音合成厂家的能力。科大讯飞凭借 19 个语种, 11 种方言, 2 种民族语言独占鳌头,灵伴科技拥有 50 种合成音
- 色,为客户提供多种选择
- 可离线程度: 从离线程度来看,部分厂商已实现了离线语音合成,但离线语音合成质量各不相同,部分厂商只能实现半离线语音合成或实现在弱网环境下语音合成
- X轴 名称: 领域覆盖
- Y轴 名称: 价格
- α轴 名称: 语音种类
- β轴 名称: 自然度
- x轴 为企业的领域覆盖度, y 轴为企业产品的价格指数,气泡的大小为企业产品支持的语音种类,气泡颜色的深度为企业产品的自然度。
- 上市公司速览
- 语 音合成声学( TTS )代表企业分析 9
- 杭 州倒映有声科技有限公司
- 杭州倒映有声科技有限公司融资信息
- 杭州倒映有声科技有限公司竞争优势
- 倒映有声官网
- 类型名称 类型说明
- 前端语言分析 负责文本的语言解析和处理,其处理内容主要包括语种、分词、词性预测、多音字处理、韵律预测、情感等。
- 后端声学系统 通过前端语言分析把文本上的发音的这些信息都预测出来之后,将信息发送给 TTS 的后端系统,后台声学系统融
- 合这些信息之后,将内容转化为语音。
- 上游环节 上游说明 上游参与方
- 数据产品及服务 人工智能数据产品及服务隶属于人工智能产业链的基础层,是自主研发人工智能技术的
- 企业与机构必需的基础生产要素,其数量多寡和质量高低将会直接影响到人工智能产业
- 链内企业的研发周期、产品性能和可扩展性。语音合成企业需要向上游购买训练数据或
- 服务,以达成人工智能模型的实现。
- 北京百度网讯科技有限公司 、 阿里巴巴
- (中国)网络技术有限公司 、 北京海天瑞
- 声科技股份有限公司 、 北京爱数智慧科技
- 有限公司 、 倍赛信息技术(北京)有限公
- 司 、 深圳莫比嗨客树莓派智能机器人有限
- 公司 、 腾讯云计算(北京)有限责任公司
- 中游环节 中游说明 中游参与方
- 语音合成行业 语音合成主要分为 通用 TTS 发音和个性化 TTS 发音。 通用 TTS 发音相对的机械化,但其
- 优点在于通用 TTS 口齿清晰。因此,通用 TTS 适用于导航、语音播报、智能客服和大多
- 数语音交互场景, 制作成本整体而言较为低廉。 个性化 TTS 在通用 TTS 的基础上更加注
- 重音色和情感,这类声音主要应用于对声音质量较高的教育,长音频、直播以及影视游
- 戏配音等场景当中。现阶段, 互联网大企业涉足个性化 TTS 服务这一业务较少,创新型
- 中小企业踊跃出现。 相比通用型 TTS ,个性化 TTS 的 制作成本相对高昂。 TTS 中游利润
- 保持在 60~80% ,但前期研发投入大,部分企业仍未盈利。
- 云知声智能科技股份有限公司 、 杭州倒映
- 有声科技有限公司 、 思必驰科技股份有限
- 公司 、 微软(中国)有限公司 、 科大讯飞
- 股份有限公司 、 标贝(北京)科技有限公
- 司 、 北京百度网讯科技有限公司 、 阿里巴
- 巴(中国)网络技术有限公司
- 下游环节 下游说明 下游参与方
- 应用领域 个性化 TTS 最早落地于 导航领域产品 ,其原因主要在于导航语音的话术较为固定,只有
- 约20% 变量的部分是用 TTS 合成出来的,基于个性化 TTS 的早期水平并不成熟,因此,
- 个性化 TTS 的 IP 价值首先体现在了导航领域。 长音频是个性化 TTS 发展的有利平台。 TT
- S 技 术能够大大减少将文字转为语音的时间和财务成本,极大的压缩了长音频广播剧,
- 有声书等的制作周期,能够更快节奏的,及时的将长音频作品呈现到用户眼前。
- 高德软件有限公司 、 中文在线数字出版集
- 团股份有限公司 、 上海喜马拉雅科技有限
- 公司 、 掌阅科技股份有限公司 、 北京猿力
- 教育科技有限公司 、 北京捷派教育咨询有
- 限公司
- 竞争参与方 横轴 纵轴 气泡大小 气泡色深 得分依据 气泡显示 名称显示
- 科大讯飞股份有限公司 4.6 2 .7 4 .8 4 .5
- 云 知声智能科技股份有限
- 公司
- 广 州深声科技有限公司 4 2.5 4 4 .1
- 杭 州灵伴科技有限公司 2.5 2 .7 4 3 .5
- 北 京百度网讯科技有限公
- 司
- 股 票代码 上市公司 总市值 营收规模 同比增长 (% ) 毛 利率 (% )
- 002230 安 徽科大讯飞信息科技股份有限公司 82978400000 350,5 98.5 0 万元 40.1 7 40.5 3
- 688100 威 胜信息技术股份有限公司 10970000000 94,8 43.2 0 万元 11.4 7 36.9 4
- 300229 拓 尔思信息技术股份有限公司 7813000000 42,4 94.8 6 万元 8.5 3 67.9 5
- 09988 阿 里巴巴集团控股有限公司 37640.7 4 亿 853,0 62,0 00,0 00.0 0 18.9 300
- 0 0700 腾 讯控股有限公司 3493000000000 560,1 18,0 00,0 00.0 0 16.1 900 43.9 1
- 融 资时间 披露时间 投资企业 金额 轮次 投资比例 估值
- 2021-0 5-1 0 2021-0 5-1 0 中 文在线 千万级人民币 Pre -A 轮
- 2019-0 8-0 7 天 使湾创投,凌晨资
- 本
- 未披露 天使轮
- 一 体化趋势明显
- TTS 产业链的上中游呈现一体化的融合趋势
- 语音合成企业需要向上游购买训练数据或服务,以达成人工智能模型的实现。部分数据标记企业为了使业务能够可持续发展而不受到产业自身限制,也开始拓展自
- 己的业务边界,开拓了自有 TTS 的产品线。
- 研 发投入较大
- 个性化 TTS 的制作成本相对高昂,前期研发投入较多导致部分 TTS 企业尚未实现盈利
- 个性化 TTS 在通用 TTS 的基础上更加注重音色和情感,情感和声音的表现力比通用型 TTS 更强,这类声音主要应用于对声音质量较高的教育,长音频、直播以及影
- 视游戏配音等场景当中。现阶段,互联网大企业涉足个性化 TTS 服务这一业务较少,创新型中小企业踊跃出现。个性化 TTS 的制作成本相对高昂, TTS 中游利润率
- 保持在 60~80% 之间,但前期研发投入较多导致部分 TTS 企业尚未实现盈利。
- 进 入难度大
- TTS 行业发展成熟,新进入者难以生存
- TTS 行业的发展可追溯到 1990s ,到现阶段,技术发展较为成熟。原有竞争者已经占领了结构性优势,保持其原有地位。除非新进入者能够弯道超车,或实现产品
- 差异化,才有可能生存下来。但鉴于 TTS 的发展已经较为成熟,因此在技术的突破范围有限。这造成了新进入者难以发展的局面。
- 企业状态 存续 注册资本 123.4 568 万人民币
- 企业总部 杭州市 行业 软件和信息技术服务业
- 法人 肖朔 统一社会信用代码 91330110M A2G M LLM 6E
- 企 业类型 有限责任公司 ( 自然人投资或控股 ) 成立时间 2019-0 5-2 8
- 品 牌名称 杭州倒映有声科技有限公司
- 经营范围 服务:基础软件服务,应用软件服务,计算机系统服务,计算机系统集成、互联网信息服务,产品设计,网页设计,电脑动漫设计,个人
- 形象设计,市场营销策划,企业形象策划,技术进出口(法律、行政法规禁止经营的项目除外,法律、行政法规限制经营的项目取得许可
- 证后方可经营)(依法须经批准的项目,经相关部门批准后方可开展经营活动)
- 倒映有声是一家致力于利用语音合成技术打造 AI 音频科技创新的高新技术企业。该公司研发的基于端到端的神经网络音频合成系统和解决
- 方案,在音色模拟、情感展现、定制化服务、多语种等方面表现较好。 2021 年 5 月,倒映有声取得了来自中文在线的千万级 Pre -A 轮融资。
- 倒映有声的技术优势主要存在于个性化 TTS 而非通用 TTS ,倒映有声的产品的技术应用场景主要应用于有声书阅读,广播剧、游戏等泛娱
- 乐领域以及教育等场景,这些场景对 TTS 的质量和情感有较高的要求,更能发挥倒映有声的差异化技术优势。倒映有声已经与超过 5 家版权
- 方合作,上线了共 10 多部作品。
- 倒映有声的产品主要分为三类:( 1 )第一类为有声合成系统,用户可通过云端产品,自助或半自助的实现文字作品的有声化,该产品主要
- 服务于版权方和融媒体领域;( 2 )第二类为 AI 主播定制,主要分为自有 AI 主播授权使用和定制服务,客户可以去倒映有声的库里选择满足
- 自己需求的 AI 主播声音,也可以根据自身需求定制属于自己的 AI 主播,倒映有声会通过联合语音合成的上下游为客户提供定制音频的全流
- 程服务;( 3 )第三类产品的覆盖范围更加广泛,基于倒映有声的产品特点和技术优势,企业致力于布局 TTS 在泛娱乐行业的应用,其中包
- 括对于文学的承包制作和 IP 运营,倒映有声不仅仅把产品的目光落脚于技术层面,而为 TTS 找到了商业落地的途径,通过这种方式打开语
- 音合成应用的途径。这种将技术和商业应用相结合的方式有利于倒映有声抢占市场蓝海。
- 中国市场上目前个性化语音合成的企业有限,倒映有声作为为数不多的企业之一, 2021 年 5 月,倒映有声取得了来自中文在线的千万级 Pre
- A 轮融资,市场看好企业在行业中的发展。倒映有声进入行业时间早,把握市场的蓝海,占领结构性优势。倒映有声的产品专业化程度
- 高,语音质量高,且专注于泛娱乐合成语音的打造,覆盖面专业,商业思维也较为活跃,在后疫情时代将会有较大的发展空间。
报告网所有机构报告是由用户上传分享,未经用户书面授权,请勿作商用!