• 欢迎使用千万蜘蛛池,网站外链优化,蜘蛛池引蜘蛛快速提高网站收录,收藏快捷键 CTRL + D

百度软件接口(百度开放商用智能编程助手)


欧界报道:

什么才是未来应有的人机交互方式?最开始大多数人通过键盘来键入一些关键信息,发展到互联网时代后我们可以打开图形网站进行随意浏览追踪,到今天随着终端设备体积进一步缩小,大多数人变成了“低头党”来获取资讯,人机交互的内涵正在变得越来越丰富。而随着AI时代的到来,用嘴说,用耳听则可能成为我们以后最时髦的机器交互方式。

11月30日,百度在AI开发者广州实战营中,就丢出来一个重磅消息:语音技术全系列接口将永久免费开放给所有用户,提供包括语音识别、语音合成、语音唤醒多个平台(IOS、Android等)的SDK(软件开发工具包)资料和服务,以求更好全方位地支持其合作伙伴。

其中,在百度的语音识别和语音合成接口上,用户每天在每个接口上分别拥有5万和20万免费的调用量,超过后均可申请获得更多的免费调用量;在语音唤醒接口方面,每个用户每月可导入三次3个自定义的唤醒词。可以看出来,目前的百度已经打造出从模型算法、开发组件、场景覆盖到行业应用的全链条。

那么什么行业会更深切地用到这项技术呢?很明显我们如今处于一个信息大爆炸的时代,身边的资讯无处不在,因此就有不少人急切需要拓宽自己对外界接触信息的渠道,而用耳听,用嘴说,无疑就是很好的一种方式,比如很多人喜欢在网上浏览书籍,那么就有不少阅读软件可以借助语音合成技术直接阅览书籍,这与通过录音来实现书籍阅读的传统方式不同,不光需要语音技术进行文字识别,还需要根据情感的不同进行对断句、语调、语速进行自动调节,其背后技术支持者便是百度的语音合成。

而在2017年的百度世界大会中,百度也首次展示了AI语音技术在千人级大会应用场景下的实时语音识别翻译功能,一行行的中英文随着演讲者的讲话直接展示在了大屏幕上。不仅如此,在其展示语音交互的视频中,用户在打开手机百度用语音播报内容时,只需说“上一条”、“下一条”、“返回”,就可以用语音自由地操控手机百度的信息流,同时也可以直接向手机百度提出你想问的问题。中间不需要按着说话,更不需要唤醒词。

智能音箱的出现无疑是语音助手一个最好的载体,自上半年开始,各大科技巨头不约而同地加码人工智能,更企图以语音识别技术抢占市场高地,而这其中,又属阿里的天猫精灵、百度的“raven H”以及小米的“小爱同学”性能尤为出众,作为一款试图实现家居智联的交互设备,语音识别的准确度是决定产品体验的关键因素,而通过此项技术,消费者就可以摆脱以往繁琐的按键方式,通过语音命令来完成关灯、开空调等任务。因此,有不少行业专家和企业也坚信,语音识别将会是未来人机交互的主流。

当然目前的智能音箱也还面临着各种问题,如人机自由对话程度还不够高,在复杂环境下智能音箱的识别能力还有待提高等等。除此之外,方言、口音、同义词等因素也会影响语音识别准确度。如何让识别技术突破语义、语音的限制,给消费者更好的用户体验,也是各大科技企业应该占据的下一个技术高点。

新一代人机交互方式的出现不得不让我们惊叹AI就在我们身边,相信在不久的未来我们就能够更好地和AI对话,早日步入理想的智慧生活。

来源:线上采编,如文章涉及版权问题或者寻求报道,请及时联系欧界传媒网 o2ojie.com!

欧界科技 | Jie Media

深度报道环球前沿科技

本文链接:https://www.24zzc.com/news/169271327722537.html

相关文章推荐

    无相关信息