207
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度智能云离线语音合成SDK简介

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>



点击这里点击这里申请百度智能云特邀VIP帐号,立即体验语音技术产品>>>

百度智能云离线语音合成SDK简介

在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音,提供稳定一致、流畅自然的合成体验。

Hi,您好,欢迎使用百度语音能力引擎(SPEECH)服务。

本文档主要针对API开发者,描述百度语音能力引擎接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

  • 在百度智能云控制台内提交工单,咨询问题类型请选择人工智能-语音能力引擎 SPEECH;
  • 客服电话:400-920-8999。

注意!

请勿通过任何第三方插件使用百度语音能力引擎服务,使用第三方非法插件会导致您的 AppID、API Key、Secret Key、Access Token 泄露,他人即可盗用您的账户进行任意消费,如因产生的恶意消费,需您自行承担责任。

如您已经使用了第三方插件,建议您立即删除对应appid并更新账户密码!

接口能力

接口名称接口能力简要描述
语音识别采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。
短语音识别将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
短语音识别极速版采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一,提升语音交互体验。
实时语音识别实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。
音频文件转写 (16k)音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。
EasyDL语音识别可以通过自助训练语言模型的方式有效提升您业务场景下的识别准确率。
语音合成基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求。
短文本在线合成基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件。
最长可支持1024GBK字节的文本。
长文本在线合成长文本在线合成接口可以将10万字以内文本一次性合成,异步返回音频。支持多种优质音库,将超长文本快速转换成稳定流畅、饱满真实的音频。适用于阅读听书、新闻播报等客户。
离线语音合成在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音,提供稳定一致、流畅自然的合成体验 。
呼叫中心语音呼叫中心服务分为呼叫中心解决语音方案及呼叫中心音频文件转写。可用于智能语音IVR、智能外呼、客服内容质检等场景。
音频文件转写 (8k)音频文件转写接口可以将大批量的音频文件异步转写为文字。适合批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。
呼叫中心语音解决方案MRCP Server端,集成了呼叫中心8K采样率语音识别(ASR)和呼叫中心专属发音人语音合成(TTS)两种能力。


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!