李开复:AlphaGo胜率仅有1.1%_人工智能_计算头条_中国计算网——工业互联网一站式服务平台—

谷歌人工智能AlphaGo和世界围棋冠军李世乭将于3月9日在韩国进行人机大战，科技将全程直播。创新工场CEO李开复在知乎上回答“AlphaGo能战胜李世乭吗？”问题时表示：“如果对弈一盘，AlphaGo尚有11%的获胜的可能性，而整个比赛五盘胜出三盘或更多，AlphaGo就只有1.1%的可能性了。”

以下为李开复在知乎上的回答原文：

先直接回答这个问题，下面再分析AlphaGo和人工智能的未来。我认为AlphaGo这次的比赛打败李世乭比较悬，但是1-2年之内必然完胜人类。

按照两者的Elo（围棋等级分），可以算出去年年底的AlphaGo打败李世乭的概率相当低。如何算出的呢？AlphaGo去年年底的顶级分布式版本的Elo是3168（见下面第一张图），而李世乭的Elo大约是3532（全球围棋手Elo: Go Ratings ，见下面第二张图）。

李开复:AlphaGo胜率仅有1.1%

按照这两个等级分的两个棋手对弈，李世乭每盘的胜算为89%（公式见：How to Guide: Converting Elo Differences To Winning Probabilities : chess）。如果对弈一盘，AlphaGo尚有11%的获胜的可能性，而整个比赛五盘胜出三盘或更多，AlphaGo就只有1.1%的可能性了。（当然，这是几个月前的AlphaGo，也许今天已经超越了：见下面第三点）。

AlphaGo不是打败了欧洲冠军吗？有些人认为AlphaGo去年底击败了欧洲冠军樊麾，所以挑战（前）世界冠军应有希望。但是，樊麾只是职业二段（Elo 3000左右），而李世乭是职业九段（ELO 3532）。这两位的差别是巨大的，完全不能混为一谈。就比如说一个人乒乓球打败了非洲冠军，并不代表他就可以成功挑战中国冠军。

AlphaGo有可能在这几个月突飞猛进，进而击败李世乭吗？AlphaGo的负责人说：”外界不知道我们这几个月进步了非常多“。（来自：Odds favor machine over human in big Go showdown ）。这点确实有可能。AlphaGo进步的方法有两个：（1）增加硬件：我们从Nature的文章可以看到：从1202个CPU到1920个CPU，AlphaGo的ELO只增加了28，而且线性地增加CPU，不会看到线性的ELO成长。若要达到364 ELO积分的提升，需要的CPU将达到天文数字（有篇文章估计至少要10万个CPU：AlphaGo and AI Progress）。当然，谷歌有钱有机器，但是纯粹加机器将会碰到并行计算互相协调的瓶颈（就是说假设有十万万台机器，它们的总计算能力很强，但是彼此的协调将成为瓶颈）。在几个月之内增加两个数量级的CPU并调节算法，降低瓶颈，应该不容易。（2）增加学习功能：AlphaGo有两种学习功能，第一种是根据高手棋谱的学习，第二种是自我对弈，自我学习。前者已经使用了16万次高手比赛，而后者也在巨大机组上训练了8天。这方面肯定会有进步，但是要超越世界冠军可能不容易。最后，换一种分析方式：如果从过去深蓝击败世界冠军的“成长过程”来看，深蓝大约1993年达到职业大师水平，4年后才在一场六盘的比赛中击败世界冠军（大约500Elo积分点的提升）。今天的AlphaGo应该和1993年的深蓝相似，刚进入职业大师水平。若要击败世界冠军，虽然未必需要4年的时间，但是几个月似乎不够。

还有什么以上未考虑的因素，导致AlphaGo获胜吗？如果谷歌刻意未出全力和樊麾对抗，或者有其它学习或并行计算方面超越了Nature里面的描述，那AlphaGo完全有可能获胜。

既然写了这么多，就对这个题目再发表一些看法：

AlphaGo 是什么？在今年一月的Nature (http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html )有AlphaGo的详细介绍，AlphaGo是一套为了围棋优化的设计周密的深度学习引擎，使用了神经网路加上MCTS (Monte Carlo tree search），并且用上了巨大的谷歌云计算资源，结合CPU+GPU，加上从高手棋谱和自我学习的功能。这套系统比以前的围棋系统提高了接近1000分的Elo，从业余5段提升到可以击败职业2段的水平，超越了前人对围棋领域的预测，更达到了人工智能领域的重大里程碑。

AlphaGo 是科学的创新突破吗？AlphaGo是一套设计精密的卓越工程，也达到了历史性的业界里程碑，不过Nature文章中并没有新的“发明”，AlphaGo的特点在于：不同机器学习技术的整合（例如：reinforcement learning, deep neural network, policy+value network, MCTS的整合可谓创新）、棋谱学习和自我学习的整合、相对非常可扩张的architecture（让其充分利用谷歌的计算资源）、CPU+GPU并行发挥优势的整合。这套“工程”不但有世界顶级的机器学习技术，也有非常高效的代码，并且充分发挥了谷歌世界最宏伟的计算资源（不仅仅是比赛使用，训练AlphaGo时也同样关键）。

1/3 1 2 3 下一页尾页