说得直白点,大意是 “在网络试验中,
机器人搅局小淘气,反而促进人类协作”。
这篇论文提了一个好问题,机器人与人能否和谐相处?机器人的参与,是否能促进而不是破坏,人类的社会协作?
论文设计了一个交互行为被严格限定的游戏,来证实存在这么一种可能性:
在某些特定任务中,人与机器人,是可以和谐相处,并且相互促进的。
可能性固然重要,但是更重要的,是要找到一种方法,来教育机器人应该如何行动,才能帮助人与机器人组成的群体,实现整个群体的最优目标。以及为了实现全局最优,在什么情况下,机器人需要搅局,以牺牲局部收益为代价,打破僵局。
其实这个方法是现成的,这就是Reinforcement Learning (强化学习)。尤其值得关注的是,强化学习与深度学习的杂交,Deep Reinforcement Learning。
DeepMinders 用 Deep Reinforcement Learning 技术,在几十个游戏上,击败了人类玩家。
令人好奇的是,如果让机器人参与团队对战游戏,每个团队有多人组成。而且团队中不仅可以有人类玩家,也可以有机器人。
如果用深度强化学习技术来训练机器人,是否会提升人机团队的战绩?
遇到危险的时候,机器人是否会主动自我牺牲,以便保全人类玩家?
或者,机器人是否会以团队战绩为最高目标,不惜牺牲人类玩家,保全机器人,来取得整个团队的战绩?
先前人们普遍认为,机器人的行为取决于算法,而算法是人类编写的。所以,机器人的行为,完全是人类预先设定的。但是当机器人的行为是通过 “机器学习算法” 学习来的,机器人的行为,就不再那么严丝合缝地符合人类的预期了。
更进一步,不久的将来,机器将拥有 “Learn to learn” 的能力,届时,人类更无法准确地预期机器人的行为了。
除了玩游戏,机器学习技术,能够在现实生活中,发挥作用?
从技术方面讲,Chatbot 技术日臻完善,现在已经开发了不少客服机器人。节省人工,提高客服质量。如果机器对话的技术障碍解决了,下一个问题,是如何让机器人助力网上社区的运营。
客服与运营有很大不同。客服是一对一的对话,而运营的核心是群体的协调,包括挑起争论、幽默搞笑舒缓气氛、转移话题降温争吵,等等。运营中最难的又最重要的,是时事营销。人类编辑的反应速度,肯定比不上永远在线,永远不知疲倦的机器人。
互联网让人与人的交流更方便,同时互联网也产生了大量数据。如何挖掘这些数据,如何从中提炼出协调人群的有效算法,是大数据和机器学习的工作。
机器人参与人类社会的互动和协作,多半是从网络互动开始的。
机器人监管促进人类社会的协作,多半是从社区的运营开始的。