通过模仿人类小孩学习语言的过程,计算机学家首次教会机器人说出实际的单词。
一开始的时候,机器人宝宝只是发出一些语无伦次的噪音,但是几分钟后,它突然发出了完整清晰的单词:“红色”,接着另一个单词:“盒子”。这样只是通过与人类交流,呀呀学语的机器人首次说出实际的单词。
这一机器人技术的飞跃发展可能有助于新型机器人的研发,它能够以一种更自然、类人的方式说话,同时也能够揭示幼儿理解语言的奥秘。
幼儿在6个月大到14个月大之间,会从发出一些含糊不清的音节向能够说出真正的单词转变,这是完全掌握语言的必要步骤。某些“锚”一样的单词一旦被建立,它们就提供了通往词汇大门的线索,因此这时幼儿学说话也变得容易。
受到这种过程的启示,一支由英国赫特福德大学计算机科学家凯若琳?莱恩(Caroline Lyon)带领的团队向他们的iCub仿人机器人迪奇编入程序,程序中几乎包含了英语中所有的大约4000个音节。通过任意将音节组合在一起,迪奇可以像一个婴儿那样呀呀学语。
研究人员同时也招募了34个志愿者扮演老师的角色,他们被要求将迪奇当成是一个婴儿。迪奇和每位老师有8分钟的对话,在每段对话的间隙里,迪奇的记忆都被储存、擦除和重启,因此对于每位老师而言实验都是重新开始的。在每段对话开始时,迪奇词汇里每一个音节的分数都是完全相同的。
为词汇计分
课程开始后,一切都改变了。迪奇内部的程序设置是先听老师的讲话,然后再学着说,它把老师的讲话变成一个一个的音节,合计讲话中的音节个数。然后更新它的词汇分数,给每个曾经被老师用过的音节加分。当迪奇下一次讲话的时候,由于这些音节的得分高,因此更可能被迪奇重复。
莱恩说这让人联想起人类婴儿的学习方式,“当他们听到频繁出现的声音时,他们就会对这些声音变得敏感”,莱恩说,“他们更喜欢熟悉的声音”。
当迪奇说出可辨认的单词的时候,老师就会给予得分奖励,模仿学习通过这种方式得到提高。迪奇内部的程序会检测这些评论,并给予得到老师认可的音节额外的分数。当然不可避免的是,一些毫无意义的音节也会得到额外的得分。但是由于这种过程是不断重复的,只有那些可以组成单词的音节才能够持续不断地出现在获得认可的单词串中。
尽管迪奇依然会发出毫无意义的音节,但是在8分钟对话快结束的时候,实际单词持续出现的频率要比迪奇只是随机选择音节时的频率高。
在呀呀学语的时候,学习单词可以借助于一种基于统计的学习过程而不是具体的语法,这一事实证明了该阶段的语言学习并不需要强调语法能力,莱恩说到。
荷兰蒂尔堡大学的认知科学家保罗?沃格特对这一成果印象深刻,“对于开发能够帮助我们学习语言的机器人而言,这是非常有趣的第一步,”
目前,迪奇的说话能力离完全成熟的语言表达还很遥远,但是从呀呀学语开始可能是创造表达自然的机器人的最好方法。“如果你希望机器人能够表达得自然,那你可能需要从最初开始教它”,莱恩说到。
唯一重要的因素
并不是所有单词的组成都是相同的,当英国赫特福德大学凯若琳?莱恩的团队教给机器人一些基本的单词时,它更喜欢某些类型的单词,比如描述形状和色彩的单词包括“红色”、“绿色”、“心脏”、“方形”、“盒子”,它们比“这”或者“和”出现的更频繁。莱恩说,老师在进行教导的时候,“这”、 “和”出现得很频繁但是由于它们有时却一起被其他单词所遮盖,这使得机器人很难辨认它们。而一些显著的单词比如“红色”或者“绿色”,不管它们在句子的哪里出现,它们的发音都倾向于一致。莱恩的团队猜测,由于一些单词对于年龄较小的孩子而言有着更高的“信息价值”,或许正是这一区别帮助孩子们最先学习它们。