人工智能学家质疑谷歌围棋AI有科学欺诈表现

人工学家质疑谷歌围棋AI有科学欺诈表现

文/刘锋(来源:人工智能学家)

“把大象关进冰箱要几步”涉及的科学漏洞

人工学家质疑谷歌围棋AI有科学欺诈表现

在讨论谷歌围棋AI及其比赛问题之前,我们先看那个著名的笑话“把大象关进冰箱要几步“,2000年中国春晚,赵本山、宋丹丹的小品《钟点工》,曾经用到了这个笑话:问“把大象放进冰箱总共分几步?”答:“三步,第一步把冰箱门打开;第二步把大象放进去,第三步把冰箱门带上”。

小品中的情景只是一个笑话,但从科研角度看,因为故意忽视最为关键的第二步,使得这个原本伟大的科学实验,变成了笑话段子。本文提出谷歌围棋AI及其比赛有科学欺诈表现,根源也在这里。

谷歌围棋AI在Nature上究竟说了什么

谷歌在Nature发表论文阐述了其围棋AI程序AlphaGo的运行原理,这个原理描述相对专业,这里我们也力争用通俗易懂的语言描述谷歌究竟说了什么,谷歌围棋AI程序AlphaGo在下棋过程中主要通过四步完成工作,它们分别是:

第一步快速判断:用于快速的观察围棋的盘面,类似于人观察盘面获得的第一反应

第二步深度模仿 :AlphaGo学习近万盘人类历史高手的棋局来进行模仿学习,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。

第三步自学成长:AlphaGo不断与“自己”对战,下了3000万盘棋局,总结出经验作为棋局中的评估依据。

第四步全局分析:利用第三步学习结果对整个盘面的赢面判断,实现从全局分析整个棋局。

判断欺诈的第一个原因,谷歌的把大象关冰箱问题

人工学家质疑谷歌围棋AI有科学欺诈表现

Nature论文阐述的AlphaGo基本原理,按照人工智能专家的评价:”其基本原理并没有新东西“,但核心价值是学习了近万盘人类历史高手的棋局,和自我对战下的3000万盘棋局总结的经验。

请注意,这个关键内容,也就是AlphaGo到底终结出什么围棋规律,或者其神经网络的权重值是什么,谷歌并没有发表出来。也就是谷歌在”大象关进冰箱要几步“问题上,说出了如何打开围棋战胜人类的冰箱大门,和如何关上围棋战胜人类的冰箱大门,但唯独在第二步 围棋如何战胜人类的方法塞进冰箱,同样做了隐藏。

我们知道,围棋之所以很难被人工智能攻破,战胜人类高手,就是其可能的组合数异常庞大。至于多么异常,2016年1月普林斯顿的研究人员给出了最新研究结果:对于一个19x19的围棋棋盘而言,一共有361个位置,而每个位置可以单独放置黑棋、白棋或者留空,理论上所有的可能组合是3^361种。但根据围棋规则,不是所有位置都可合法落子,例如在围棋术语中没有气的位置就不能落子。那么排除掉这些不合法的棋局后总共还剩多少种呢?

普林斯顿的研究人员给出的19x19格围棋的精确合法棋局数:208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935

我们给它多分几行:

2081681993819799846

9947863334486277028

6522453884530548425

6394568209274196127

3801537852564845169

8519643907259916015

6281285460898883144

2712971531931755773

6620397247064840935

不用数了,一共171位数! 这个数字比我们地球所有的沙粒数量还要多!比人类已知宇宙的所有星球数量还要多!对比一下,谷歌学习的近万盘人类棋局是5位数,谷歌自行对战的3000万盘是8位数。而围棋所有可能的棋局盘数是171位数。如果规避还有可能的重复变化,我们把大头去掉,那也有70位数的棋局变化。