定制流程
1
需求提出
客户填写信息收集表,明确调用方式与使用权归属等细节,并提供业务话术及少量的录音数据用于评估。
参与方:客户
2
数据评估及方案确定
天润智力评估录音数据是否清晰可用,需求评估通过后,天润智力给出录音数据采集的具体要求和规范。
参与方:天润智力
3
合同签署
双方签署合同,确定开发时间周期及商务报价。
参与方:客户与天润智力
4
数据准备
客户按照天润智力设计的文案及规范进行录音。
参与方:客户
5
录音标注
天润智力安排数据处理和标注。
参与方:天润智力
6
模型训练
标注数据返回后,启动模型训练,测试并调试合成效果。
参与方:天润智力
7
交付上线
客户调用并验收,数据优化,交付完成。
参与方:客户
产品优势
技术领先
使用最新推出的Knowledge-Aware Neural TTS (KAN-TTS) 语音合成技术,基于深度神经网络和机器学习,将文本转换成真实饱满、抑扬顿挫、富有表现力的语音。合成效果与真人录音相比,几乎以假乱真。
数据量门槛低
在中文普通话场景,实现优质数据2000句起即可合成自然流畅效果的声音。加入英文数据后,还可实现中英混读效果。
节省成本
由于数据量门槛低,录音和标注的时间成本大幅减少,尽显价格优势。
深度定制
支持客户指定自有数据合成TTS声音。同时提供海量候选发音人资源, 多种音色和风格源备选,且保证顶级录音棚采集高品质录音数据。
适用场景
智能客服
提供多行业多场景的智能客服语音合成能力。热线业务提高解答效率,提升客户满意度,催收业务降低呼叫中心人工成本。
智能语音交互
为智能家居,音箱,车载,可穿戴设备及人工智能赋予一个最有温度的声音。
文学有声阅读
让富有感染力的声音给你讲故事,读小说,播新闻,满足“懒人”的阅读需求。
无障碍播报及多媒体音频
无论是健全人还是残疾人,无论是年轻人还是老年人,将应用、H5、视频中的文字,转成流畅动听的自然语言声音。
合作方
更多产品与服务
语言模型自学习工具
用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出上传音频数据对声学模型进行定制。
了解更多