1、 “语音转写 ”与 “语音听写 ”的区别是?
产品名称支持的音频时长 使用场景语音听写一分钟以内人机对话,如输入法、语音搜索语音转写五小时以内更自然地贴近日常的对话、演讲
2、 “已录制音频转写”和“实时音频流转写”的区别是?
已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
实时语音转写已上线,欢迎使用。
3、语音转写支持什么语言?
答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:
l 方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)
l 语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语
l 民族语言:藏语、维语
4、目前语音转写支持的音频格式为:
已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz
5、语音转写支不支持并发?
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。