【手机中国 软件】8月3日,搜狗旗下的语音交互引擎“知音”正式亮相,它让人机交互变得更加自然,不仅能听会说,甚至可以理解和思考。“知音”具有识别速度快、纠错能力强、支持更加复杂多轮的交互等特点。在发布会上,搜狗CTO杨洪涛、搜狗语音交互技术中心负责人王砚峰为大家详细介绍了“知音”的不俗之处。
王砚峰说到,当前语音交互的重要性逐渐凸显,当手眼被占用时、无法使用键盘输入时、打字不方便时都会用到语音功能。但语音交互也存在着不少问题,一是用户要收着说,二是机器不够聪明,为此,搜狗带来了更自然的语音交互。
“知音”引擎使用着互联网上规模最大的语音数据,在线语音输入日请求规模超过了1.4亿,每天用户产生出来的语料规模是11.7万小时,如此庞大的数据帮助搜狗大幅提升了语音识别的准确率。在过去一年中,“知音”引擎语音识别错误率进一步下降30%,识别速度提升了3倍。
过去,由于技术水平的限制,用户在语音输入错误,或较复杂的语音指令时无法正确识别,而“知音”支持用户修正输入内容,并使用更为自然的语言发布指令,比如把“张”改为立早“章”。
王砚峰在会上播放了一段视频,将“知音”引擎横向对比了几款提供同类服务的语音工具,结果显示“知音”可以理解用户语音指令的逻辑关系,同时可感知用户在语音请求背后真正的需求。
总结一下,“知音”引擎具备基于端到端技术的语音识别能力、利用自然语言交互的语音纠错能力、基于知识图谱技术的行业知识整合能力,以及多轮对话技术的复杂语义理解能力。
在会上搜狗CTO杨洪涛向大家透露,不久之后搜狗会推出一款语音工具类产品,功能主要面向记者,猜测可能会是语音转文字类的工具。最后,王砚峰表示搜狗一直秉承着开放的态度,未来希望与行业能力强的合作伙伴一起推动用户交互体验的提升。