本次峰会重点聚焦虚拟现实、人工智能、未来交通、消费升级等时下热门领域。搜狗CEO王小川在演讲中总结了目前人工智能领域的发展现状及搜狗在智能语音技术方面所取得的成绩。他指出,今天大家可能过多高估了人工智能的未来。在今年上半年,AlphaGo这样一场跨世纪的比赛,4:1的比分。那么之后就像一场启蒙运动,所有的公司所有的投资把眼光都看向了人工智能,在全球范围内的投资异常地活跃,中国也一样。
在王小川看来,“这个时候我更多想谈到,我们得小心什么地方是陷阱,什么地方是真的人工智能的未来。深度学习我们认为可以做很多的事情,但是到现在我们人类的技术掌握还是比较浅的。那么我也谈到在语音识别这样一个话题,今天语音识别已经到了比较高的准确度,已经接近实用,但是其实还是很多的限制。比如说我们需要安静的环境,当有噪音的时候同时有两个人说话机器就搞不定了,我们的办法是,比如说在汽车环境里面,预先录制发动机引擎的声音,或者是噪音加到识别里面去,就把没有见过的环境变成机器能够见过的环境,就能够做识别。”
在展会中,搜狗还通过“语速测试”和“语音修改”两个互动环节展示了其在语音技术方面的最新成果。用户通过语音输入的内容可实时变为文字,不仅如此,通过语音修改按钮,还可以对显示的文字进行修改调整,不再需要双手的配合,这不仅极大的节省了用户的时间和沟通成本,同时解决了用户在语音输入时经常需要手动改错的痛点。目前,这些功能可在多种场景下进行:比如当用户开车不方便输入文字的时候,通过语音的方式可以在搜狗输入法产品中用语音进行修改,像说出“是欢度佳节的佳”就可以把文字“世纪嘉园”修正成“世纪佳园”。
据了解,目前搜狗语音识别的准确率已高于97%,识别速度高达每分钟400字以上,在语音修改方面,支持替换、插入、删除等几百种改错操作,修改成功率达到90%以上,均处于行业领先水平。
搜狗有关负责人在展会现场表示,搜狗语音技术已经成功应用到搜狗输入法、地图、搜狗搜索、语音助手等产品中,与用户实现了更自然、更容易接受和理解的交互。未来,搜狗语音将在语音识别、语义理解以及多轮交互等技术上持续创新,并且在人工智能领域不断做深服务,将语音产品和技术运用到更多的场景中,为用户带来更好的交互和服务体验。