人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产处一种新的能以人类只能相似的方式做出反应的智能机器。所以,简而言之,它的目标是能够像人类一样的思考、判断,模拟人的行为甚至超越人的行为。
但是为什么是围棋一下子就让人工智能火了?为什么不是五子棋?或者象棋?其实,这要从围棋的复杂度说起。在过去的二三十年里,国际象棋、挑起、黑白棋、扑克牌等领域纷纷被人工智能拿下,唯独围棋是个例外。
首先,围棋是一个19X19=361个点的棋盘,棋盘远大于其他棋类,计算起来,可能有10的170次方的走法,这个数字甚至大于宇宙中原子的数量,而同为棋类的国际象棋可能也只有10的70次方左右。
其次,棋盘的每个棋子在落子前子力是相同的,也就是说不会有象棋一样车马炮的大小之分,每一个子地位平等,不会因为一子定胜负,但是却又牵一发而动全身,需要全局的决策。机器的算法源于规则,而围棋的规则并不能用简单的数学的赋权值的方法去判断。
再而,围棋的落子地点没有限制,棋盘上任何一个点都有黑、白、空三种可能。
传统的计算机算法是将所有可能的走法建立成一个搜索树,尽可能去猜测所有的可能情况从而选出最优选,通过穷举作出判断。但这种方法对于复杂性超高的围棋则不适合,除了以上的几个方面,也同时因为围棋可以在任意一个阶段计算胜率,alphaGo的做法是对棋盘进行模拟,采用搭建类似于大脑神经网络的方式,一方面选择下一步走法,也即策略网络,一方面预测比赛的胜利,也即价值网络。而alpha Zero更进一步,将两个网络合二为一。而且只设定围棋基本规则,从随机游戏开始,完全自我训练强化,消除了人工智能依赖于大量数据集训练的难题。