207
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度智能云语音识别技术-实时语音识别-音频文件转写API

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>



点击这里点击这里申请百度智能云特邀VIP帐号,立即体验语音技术产品>>>

百度智能云语音识别技术-实时语音识别-音频文件转写API

Demo

Python Demo 点击下载 (文件为.zip压缩包,若无法打开时,可尝试在文件后上增加".zip“后缀)

在线调试

您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

创建音频转写任务

接口描述:根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务

请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/create

HTTP 方法:POST

URL参数:

参数取值
access_token通过 API Key 和 Secret Key 获取的 access_token,参考Access Token获取

JSON方式上传音频 Body中放置请求参数,语音数据和其他参数通过标准 JSON 格式串行化 POST 上传,包括的参数如下:

参数名类型是否必需对外状态取值范围
speech_urlstr音频url可使用百度云对象存储进行音频存储,生成云端可外网访问的url链接,音频大小不超过500MB
formatstr音频格式["mp3", "wav", "pcm","m4a","amr"]单声道,编码 16bits 位深
pidint语言类型[80001(中文语音近场识别模型极速版), 80006(中文音视频字幕模型,1737(英文模型)]
rateint采样率[16000] 固定值

若音频采样率为8k,请使用呼叫中心音频文件转写

Body请求示例:

{
    "speech_url": "https://platform.bj.bcebos.com/sdk%2Fasr%2Fasr_doc%2Fdoc_download_files%2F16k.pcm",
    "format": "pcm",
    "pid": 80001,
    "rate": 16000
}

返回参数

参数名类型是否必需对外状态
log_idintlog id
task_idstr任务id
task_statusstr任务状态
error_codeint错误码
error_msgstr错误信息

Body返回示例:

# 创建成功
{
    "log_id": 12345678,
    "task_status": "Created",
    "task_id":  "234acb234acb234acb234acb"  #注意保存该id,用于后续请求识别结果
}
# 创建失败,缺少参数
{
    "error_code": 336203,
    "error_msg": "missing param: speech_url",
    "log_id": 5414433131138366128
}

注意:查询识别结果时,需要该步骤返回的task_id来进行请求。请注意保存task_id列表。


查询音频转写任务结果

根据task_id的数组批量查询音频转写任务结果 请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/query HTTP 方法:POST URL参数:

参数取值
access_token通过API Key和Secret Key获取的access_token,参考Access Token获取

Body中放置请求参数,参数如下:

参数名类型是否必需描述取值范围
task_idslist任务idtask_ids为空,返回空任务结果列表;单次查询任务数不超过200个

例:

{
    "task_ids":  ["234acb234acb234acb234acb", "234acb234acb234acb234acd", "234acb234acb234acb234acbe"]
}

Body返回示例:

参数名类型是否必需描述
log_idintlog id
tasks_infolist多个任务的结果
+task_idstr任务id
+task_statusstr任务状态
+task_resultdict转写结果的json格式
++corpus_nostr
++resultstr转写结果
++audio_durationint音频时长(毫秒)
++detailed_resultlist转写详细结果
++err_noint转写失败错误码
++err_msgstr转写失败错误信息
++snstr
error_codeint请求错误码
error_msgstr请求错误信息
error_infolist错误的或查询不存在的taskid数组

例:

{
    "log_id": 12345678,
    "tasks_info": [
	    { # 转写中
	    	"task_status": "Running"
		    "task_id": "234acb234acb234acb234acb",
	    },
	    { # 转写失败
	    	"task_status": "Failure"
		    "task_id": "234acb234acb234acb234acd",
		    "task_result": {
			    "err_no":  3301
			    "err_msg": "speech quality error",
			    "sn": "xxx"
		    }
	    },
	    { # 转写成功
		    "task_status": "Success",
		    "task_result": {
		    	"result": [
			        "观众朋友大家好,欢迎收看本期视频哦。毕竟..."
			    ],
                "audio_duration": 6800,
			    "detailed_result": [
			        {
			        	"res": [
			                "观众朋友大家好,欢迎收看本期视频哦。"
			            ],
			            "end_time": 6700,
			            "begin_time": 4240,
			            "words_info": [],
			            "sn": "257826606251573543780",
			            "corpus_no": "6758319075297447880"
			        }
			        ...
			    ],
			    "corpus_no": "6758319075297447880" 
			},
			"task_id": "234acb234acb234acb234ace"
	    }
	]
}


这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!