OpenAI 和 Google 是如何预防人工智能失控的？

日期：2017-08-14 来源：新创作者：dc136 评论：0

标签： 人工智能 OpenAI Google

　　在刚过去的周末，OpenAI 的人工智能花了 10 分钟就打败了人类的 Dota 世界冠军。正如许多读者所知，游戏是许多研发人员用来训练人工智能的工具。

　　在 OpenAI 位于旧金山的办公室里，研究人员 Dario Amodei 正在通过赛船冠军赛（Coast Runners）来训练人工智能。不过，这个人工智能好像有点失控了。

　　赛船冠军赛的游戏规则很简单，如果想赢，选手必须收集到最多的分数，然后跨过终点线。

　　但 Amodei 的人工智能玩着玩着有点过火了，它在不断地追求高分，非但毫无跨过终点线的意思，反倒为了要多转几个圈拿高分，它开始和其它赛船碰撞，或是在过程中自己撞墙爆炸了。

　　为了应对，Amodei 和 OpenAI 的同事 Paul Christiano 正在研发一套不仅可以自我学习，同时也愿意接受人工监控的算法。

　　（Amodei 在告知人工智能，怎样的操作模式才更好）

　　在赛船游戏的训练中， Amodei 和同事将不时通过按键来指出人工智能的不当之处，告知人工智能，不仅要赢分数，同时也要跨过终点线。他们认为，这种包含了人工干预成分的算法可以确保系统安全性。

　　而在 Google 旗下 DeepMind 的研究人员也同意 Amodei 和同事的想法。两个团队，分别代表了 OpenAI 和 DeepMind，最近罕有地合作发表了部分人工智能安全方面的研究论文。

　　除此以外，Google 旗下的 Google Brain，以及来自伯克利大学和斯坦福大学的研究团队，都设有该方向研究课题，从不同方面考虑人工智能安全问题。

　　除了这种在自我学习过程中“搞错重点”的潜在危险，另一个可预想的人工智能危险在于“为了完成任务，拒绝被开发者关机”。

　　一般在设计人工智能时，研发人员都会给它设定“目标”，就像赛艇游戏中的“得分”一样。一旦人工智能将获得“分数”为终极目标，它可能会产生一个方法论——想要获得更加多的分数，其中一个方法就是不关闭自己，这样就能无止境地获取分数了。

　　伯克利大学的研究人员 Dylan Hadfield-Menell 和团队最近发布了讨论这个问题的论文。他们认为，如果在设计算法的时候，让人工智能对目标保持一定不确定性，它们才有可能愿意保留自己的“关机键”。他们采用了数字方式来尝试实现这个设置，目前还处于理论阶段。

　　除了人工智能自我“失控”，研究人员还在考虑黑客对人工智能的干预影响。

　　现代计算机视觉基于深度神经网络（deep neural networks），它通过学习分析大批量数据来形成对模式的了解。也就是说，如果要让计算机学会什么是“狗”，那就让它分析大批量狗的图片，并从中寻找规律。

　　但 Google 的 Ian Goodfellow 则认为，这种模式可能会为黑客提供“蒙骗”人工智能的机会。Goodfellow 和其它研究人员曾展示，只要修改图片中的几个特定像素，他们就能让神经网络相信图片中的大象是一辆汽车。

　　如果这个神经网络是应用在安保镜头的话，这样就问题大了。

　　即便你用了数百万张标志了‘人’的照片来训练一个物件识别系统，你还是可以轻易拿出系统和人工识别 100% 不同意的图片。我们需要认清这种现象。

　　Goodfellow 说道。虽然这些研究大多仍处于理论阶段，但这群致力于将意外扼制于摇篮的研究人员坚信，越早开始考虑这个问题越好。DeepMind 人工智能安全方面的负责人 Shane Legg 说道：

　　虽然我们还不能确定，人工智能将以多块地速度发展。但我们的责任是尝试理解并猜测，这种技术将有可能以哪种方式被误用，并尝试找出不同的应对方式。

更多> 相关开云电子链接

0条 相关评论

推荐图文

推荐开云电子链接

点击排行

• 北京启动建设国家人工智能创新应用先导区	• 人工智能是否可信？专家：一些疾病诊断AI准确率
• 17个领域崛起，约1500家企业聚集，北京人工智能	• 潘云鹤院士：大力培养人工智能一流Kaiyun官方网站app登录构建AI+X
• 中国人工智能有多强？专利申请量颇多，是美国的	• 清华大学人工智能虚拟学生首次亮相
• 如何采用人工智能规划试点项目	• 全球首个中文新闻人工智能模型发布！
• 优必选科技：以AI助力教育公平，让孩子看到“更	• 中国智能产业快速联网成片