记者 张峰
从最早的AI在国际象棋中战胜人类开始,AI先后攻克了中国象棋、德州扑克、围棋、DOTA、星际争霸等多种游戏,为什么AI研究者都喜欢挑战游戏领域呢?
在去年的世界人工智能大会上,时任微软全球副总裁沈向洋表示,游戏一直是人工智能研究的最佳试验田,训练游戏AI的过程可以不断提升人工智能的算法和人工智能处理复杂问题的能力。在现实世界中,金融市场预测、物流优化等很多问题与麻将游戏有着相同的特点,包括复杂的操作/奖励规则、信息的不完全性等等。
微软全球副总裁沈向洋
那么这次战胜人类的麻将AI的出现有什么意义呢?记者采访了浙江大学人工智能研究所所长吴飞。他告诉记者,很多AI的研发都是针对某个领域或某个具体任务进行的研究,这些AI的诞生的目的当然不仅仅在某个游戏胜过人类这么简单,都是为了
应用到我们实际生活中去。
吴飞告诉记者:“微软这款麻将AI所采取的策略其实和围棋当中的Alphago是类似的,框架还是基于强化学习、深度学习和蒙特卡洛树搜索。只不过它是针对麻将这个具体问题进行优化,如针对麻将中不同出牌的策略专门进行学习。围棋的难主要体现在状态空间非常复杂,它是19×19 的棋盘上每一个位置都有“黑、白、无”三种状态,这样的复杂度差不多是10的172次方。在完美信息下只要算力足够,就能通过搜索采样的方式找到最优的策略,AlphaGo就是利用蒙特卡洛树搜索和深度强化学习,成功解决了这一难题。而麻将这种属于不完全信息,有个序贯决策问题,它虽然所需要探索的空间相比围棋要小,但是序贯决策问题难在你的每一步对后续产生的结果都是未知的。”
浙江大学人工智能研究所所长吴飞
在吴飞看来,不论是围棋还是麻将,现有的规则和标准都是可以用机器语言描述出来的,属于“大数据小任务”,因此只要有足够多的数据的支撑,加上在该特定领域内强化学习和深度学习,AI战胜人类在大部分棋牌类游戏中都是可以实现的,但这不代表现在的AI就比人类厉害了,因为人类行为是“小数据大任务”,不只是单一问题的集合,实际的应用场景比游戏要复杂的多。
“比如现在大家关注度比较高的自动驾驶、城市大脑,这些场景更加复杂,没有足够多的数据,也没有足够准确的机器语言去描述,因此目前的人工智能在实际使用中还很局限。不过这类AI的出现对我们解决序贯决策问题还是很有帮助的,比如对经济活动的调整的预测和分析,来帮助经营者作出更好的决策;在交通、物流领域进行效率优化,降低成本提高收益等。” (记者:张峰)