207
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度智能云语音识别技术-音频文件转写极速版API-邀测

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>



点击这里点击这里申请百度智能云特邀VIP帐号,立即体验语音技术产品>>>

百度智能云语音识别技术-音频文件转写极速版API-邀测

接口描述:支持提取视频、音频文件中的语音内容,极速返回识别结果及时间戳,适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。(本接口处于邀测阶段,请联系客户经理申请测试)

请求接口:https://aip.baidubce.com/rest/2.0/speech/publiccloudspeech/v1/asr/topspeed

HTTP 方法:POST

Headers参数:

参数参数值是否必须
Content-Typeapplication/json

Body参数如下:

参数名称类型是否必须对外状态备注
access_tokenstr必须
通过 API Key 和 Secret Key 获取的 access_token,参考Access Token获取
rateint必须
音频对应的采样率,目前只支持传16000
cuidstr必须
用户的唯一标识,调用时自己保证唯一即可
dev_pidint必须
调用的转写模型,不同模型有不同的转写效果,目前只支持传80006
speechstr必须
对视频或音频文件进行base64编码后的结果,音频文件最多支持一小时的时长,整体文件不能超过500M。支持pcm、wav、mp3、m4a、mp4、mov等常见音视频文件格式
enable_subtitleint非必须根据常见字幕规则返回识别结果及对应时间戳取值范围:[0,1,2]
0:关闭字幕功能(默认)
1:开启字幕功能
2:开启字幕模式,返回字粒度时间戳
其他取值:报错
subtitle_puncint非必须字幕结果中是否有标点取值范围:[0,1]
0:过滤字幕中的标点(默认)
1:不过滤字幕中的标点
其他取值:报错
仅当字幕模式开启时生效
smooth_textint非必须文本顺滑(标点优化、数字格式优化、口语过滤)取值范围:[0(不开启文本顺滑,默认), 1(开启文本顺滑)]
smooth_text_paramlist非必须具体开启的文本顺滑功能,仅当smooth_text=1时生效取值范围:[0(开启文本顺滑全部功能,默认),1(标点),2(数字),3(口语)]
列表中参数必须为int类型,自定义所需功能,例如:
传入[0]或 [1, 2, 3],开启标点+数字+口语功能
传入[1, 2],开启标点+数字
传入[3],开启口语
filter_sensitiveint非必须敏感词过滤取值范围:[0(不开启敏感词过滤,默认), 1(开启敏感词过滤)]

Body请求示例:

{
    "access_token":"24.578xxxxxxxxxxxxxxxxx", 
    "rate": 16000,
    "cuid": "baidu_asr",
    "dev_pid": 80006, 
    "speech": "UklGRqAfQgBXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAATEl…" 
    "enable_subtitle":1,
    "smooth_text": 1,
}

返回参数:

参数名称类型是否必须备注其他信息
resultstr []非必须完整的转写结果,取元素0即是对应的文字item 类型: string
error_codeint非必须错误码
error_messagestr非必须错误信息
audio_durationint非必须音频整体时长,单位:毫秒
detailed_resultobject []非必须每一句转写详情,含时间戳等信息item 类型: object
+ resstr []非必须每句转写的文字结果,取元素0即是对应的文字item 类型: string
+ end_timeint非必须文字结束时间,单位:毫秒
+ begin_timeint非必须文字开始时间,单位:毫秒
+ snstr非必须分句转写的id,反馈问题时使用
+ corpus_nostr非必须整段转写的id,反馈问题时使用

返回示例:

{
    "error_code":0,
    "error_message":"请求成功",
    "audio_duration":1300,
    "result":["欢迎使用百度语音,"],
    "detailed_result":[
        {
        "begin_time":0,
        "corpus_no":"632690ff-40e8-4e59-9964-a381e4c64818_ws",
        "end_time":1300,
        "res":["欢迎使用百度语音,"],
        "sn":"632690ff-40e8-4e59-9964-a381e4c64818_ws_ws_0","words_info":[]
        },
    ……]
 }


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!