人工智能再次战胜人类玩家

日期：2022-12-06 来源：中国科学报评论：0

标签： 人工智能科技创新

　　下棋、玩游戏，在与人类的博弈中，人工智能（AI）正在不断成长。近日，英国DeepMind公司的AI智能体DeepNash，就在西洋陆军棋（Stratego）中达到了专业级人类玩家的水平。该成果12月1日发表于《科学》。

　　事实上，在DeepNash攻克Stratego前，就有报道称AI能够玩“强权外交”这款类似的经典桌游。这是一款具有外交深度的游戏，玩家间存在合作与竞争关系，必要时须通过谈判结交盟友。

　　“近年来，AI掌握本质不同的游戏的速度相当惊人。”美国密歇根大学计算机科学家Michael Wellman表示，Stratego和“强权外交”这两款游戏大不相同，但它们都极具挑战性，与此前AI已经掌握的游戏也截然不同。

　　Stratego是一款需在信息缺失情况下进行战略思考的棋盘游戏，类似于中国的军棋。它要比此前AI掌握的国际象棋、围棋或扑克复杂得多。

　　在游戏中，双方各有40枚棋子，且彼此看不到棋子的真实“身份”。双方轮流移动棋子，来消灭对手的棋子，最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此，玩家需要进行战略部署、收集信息，并与对方博弈。

　　一局Stratego游戏中会有10535种可能的布局。相比之下，围棋的布局有10360种可能。此外，在Stratego中，AI需要推理对手超过1066种部署策略，这使德州扑克中初始的106种可能情况相形见绌。

　　“Stratego中可能出现的结果数量之多及其复杂性，意味着在信息完全的游戏中表现出色的算法，甚至在扑克游戏中表现良好的算法，在这款游戏中都不起作用。”DeepMind研究员Julien Perolat说。

　　所以Perolat和同事开发了DeepNash，该命名致敬了提出纳什均衡的美国数学家约翰·纳什。

　　纳什均衡是博弈论中一种解的概念，指满足以下条件的策略组合：任何一位玩家在此策略组合下单方面改变自己的策略（其他玩家策略不变），都不会提高自身的收益。

　　DeepNash将强化学习算法与深度神经网络相结合，以找到纳什均衡。强化学习包括为游戏的每个状态找到最佳策略。为了学习最佳策略，DeepNash已经与自己进行了55亿次博弈。

　　今年4月，DeepNash在网络游戏平台Gravon上与人类Stratego玩家进行了两周的比赛。在50场比赛后，DeepNash目前在所有Gravon Stratego玩家中排名第三。

　　“我们的研究表明，像Stratego这样复杂的涉及不完善信息的游戏，不需要通过搜索技术来解决。”团队成员、DeepMind研究员Karl Tuyls表示，“这是AI迈出的一大步。”

　　而曾于2019年报告了玩扑克的AI——Pluribus的me ta AI研究员Noam Brown团队，则将目光投向了一个不同的挑战：建立一个可以玩“强权外交”的AI。

　　“强权外交”是一个最多可由7位玩家参与的游戏，每位玩家代表第一次世界大战前欧洲的主要力量，游戏目标是通过移动部队控制供应中心。重要的是，该游戏需要玩家间进行私人交流和合作，而不是像围棋或Stratego那样进行双人博弈。

　　“当进行超过两人的零和博弈时，纳什均衡思想对游戏就不再有用了。”Brown说，他们成功训练出了AI——Cicero。在11月22日发表于《科学》的论文中，该团队报告称，在40场游戏中，“Cicero的平均得分是人类玩家的两倍多，在玩过一场以上游戏的参与者中排名前10%”。

　　Brown认为，可以与人类互动并解释次优甚至非理性人类行为的游戏AI，可以为其在现实世界的应用铺平道路。（徐锐）

　　相关论文信息：

　　https://doi.org/10.1126/science.add4679

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 电能是过渡氢能是未来，你知道氢能源车离你有多	• 车企造电池，“竞合”博弈利弊几何？
• 百度Apollo公布无人驾驶关键技术助力实现自动驾	• 元宇宙如何“喂养”人工智能模型？
• 2023年人工智能发展预测企业如何成功采用AI？	• 梅赛德斯-奔驰和博世无人驾驶停车系统获准商用
• 智能驾驶产业链格局和未来的发展方向	• 无人驾驶技术“全面开花”，智能汽车商业化还有
• 清华AI芯片天才，再次风口创业，吸金上亿美元	• 美媒：创造性人工智能的另一面

恰佩克奖	机器人高峰论坛	北大机器人	金属加工在线	AI中国网	机气林	工博会
赶考网	中国机床网	ITES深圳工业展	电气自动化网	高压电气网	人工智能机器人	亚洲工业网
二手设备网	工博士	上海机器人产业技术研究院	库卡机器人	中国传动网	索比光伏网	数控机床市场网
国家标准化委员会