教会机器人如何开展真正的对话,是人工智能所面临的最艰难挑战之一。
智能语音赛道上,亚马逊或将是百应最大的竞争对手。
这个竞赛名字叫——Alexa Prize。
赛事目的:鼓励大众,创造出能够像人类那样聊天的人工智能机器人。
获奖标准:创建一个使用 Alexa 的聊天机器人,且能正常地与人类交谈 20 分钟。
奖励: 150 万美元的奖金(另外还有 200 万美元的其它赠款和奖品)。
「作为 Alexa Prize 的一部分,参赛者打造出的所有技术都适用于 Alexa。」
未来,亚马逊希望Alexa将可以像人类那样进行对话,谈论诸如电影、新闻和体育之类的话题,回答人们所关心的细节问题。
但是如何将Alexa打造成一个像钢铁侠的贾维斯那样内敛而机智的虚拟助手呢?
对于今年 Alexa Prize 的参赛队伍来说,解决这项艰巨任务有两个基本方法。
第一种是利用机器学习,尤其是深度学习,去分析大量数据,并慢慢筛选出一个正常对话的模式。
这是最令人兴奋且最新式的选择,然而,不断有团队表示,这也是最不切实际的做法。
一位参赛选手说道:「每个人都从机器学习开始,最终,每个人都意识到它并不真的管用。」
原因是什么呢?
人类语言是由严格的语法、音调以及多样的变化构成的,同时也充满了不确定性,人们可以使用无限多的词语来传达相同的基本信息。人工智能系统很难仅仅通过数据去学习这些知识,也很难保证正确率。
第二种方法则是为聊天机器人编写一个可遵照的话术模板,这是一种被称为「手工制作」或「硬编码」的人工智能设计方式。例如,如果一个用户说「最喜爱的球队」这个词,并以问句的形式表达出来,那么计算机可能会扫描特定运动方面的索引,找到提及「棒球」的相关内容,然后输出一个预先写好的回复:「我最喜欢的球队是洋基队」。
来自瑞典皇家理工学院(KTH)的 Fantom 聊天机器人团队就使用了这种方法,用一个众包平台 Turk为聊天机器人写回复。他们将收到的每一个会话问题,发送给一个人类 Turker,由人类来编辑话术并将其发送回去。
虽然他们的聊天机器人利用人类来生成回复,但是在回复会话的反馈方式方面,蕴含着一个强大的机器学习元素。每次聊天机器人听到一个无法回复的新问题时,它会把问题发送给 Turker,并把他们的回复添加到一个巨大的对话树中。
机器学习将有助于识别出那些已经遇到过的问题的变种。如果聊天机器人已经回答过某个问题,例如“我喜欢足球。你最喜欢的球队是哪个?”,那么当它被问及“你最喜欢的足球队是哪个?”时,它就可以使用同样的回复。
“随着时间的推移,我们将开发出越来越多的智能策略来填充这棵对话树”,团队的Ulme Wennberg 说,“以便让它能够理解我们刚刚谈论了什么,你想谈论什么,我们应该谈论什么。”
这种方法可以获得想要的与提问相一致的结果,但设计过程费时,且只能处理有限数量的话题。
这一种方法也是百应目前采用的方法。但是,百应的做法似乎更高明。一是,百应自己开发了一套语音识别行业模型,指定话术所属行业,机器人识别和回复匹配更精准。二是,百应发布了涵盖各个行业的话术模板(陆续上线中),可以迅速复制成熟的机器人话术,然后再次基础上稍加个性化修改即可。百应的方案,有效解决了「硬编码」人工智能设计方式所暴露出的适应范围小、设计费时费力的难点。
亚马逊高管表示,Alexa Prize 展示了他们的一种决心。
「我可以看到制造商正在制造什么,我们的算法团队正在提出什么,最尖端的科技是什么。我和我的团队可以将这些点相连接,为客户想要的未来去做一些冒险。」
他认为,客户想要的是一种通过与空气对话就可以掌控身边数字化世界的钥匙。
这也解释了为什么亚马逊会豪掷350万美金来举办一个竞赛:智能语音交互就是未来,或者更准确地说,它是未来的一部分。
注:Mechanical Turk 是亚马逊旗下的一个劳务众包平台。平台上的任务通常是费力和重复性的,包括音频录制、数据录入、识别照片和视频中的对象等。而这些正是人工智能所要自动化的任务,对于许多需要生成训练数据或测试其系统的人工智能研究人员来说,Mechanical Turk 是一个不可或缺的的工具。
参考资料:《奖金高达350万美元的Alexa Price竞赛背后,是亚马逊在聊天机器人上的野心》,机器之心