微软语音识别出错率达5.1%创新低比肩专业速录员_大数据_计算头条_中国计算网——工业互联网一站式服务平台—

据科技博客TechCrunch北京时间8月21日报道，微软公司在当地时间周日宣布，其对话式语音识别系统的出错率达到5.1%，创下目前为止的最低水平，超过了去年微软人工智能及研究事业部一组研究人员所实现的5.9%出错率，达到了专业速录员的同等水平。在此次研究中，专业速录员具备重复收听录音等优势。

这两次研究转录的是Switchboard语料库中的录音。Switchboard语料库包含了2400段电话对话，自上世纪90年代以来一直被研究人员作为测试语音识别系统的样本。

新研究由微软人工智能及研究事业部的一组研究人员实施，目标是在出错率上达到一组速录员的同等水平，后者可以反复收听录音样本，了解对话语境，与其他速录员合作。

整体来说，通过改进微软语音识别系统中基于神经网络的听觉和语言模型，实施最新研究的研究人员能够在去年基础上把出错率降低大约12%。显然，他们还可以让语音识别器了解整体对话，适应录音样本的语境，预测对话中很可能出现的下一个词汇或短语。这正是人类在与其他人对话时的做法。

微软的语音识别系统已被用于语音助手“小娜”、实时翻译字幕功能PresentationTranslator以及微软认知服务中。

微软语音识别出错率达5.1%创新低 比肩专业速录员