李开复万字长文科普人工智能:AI是什么 将带我们去哪儿?

人工智能正以前所未有的态势汹涌而来,一方面是风投和创业创新,都把人工智能当做了下一个尚未被开垦的宝地;另一方面是应用,比起概念盛行的阶段,现在的无人车、AlphaGo等已经把人工智能技术带到了“看得到摸得着”的境地。

  那人工智能到底是什么?这个领域包含哪些要素?它将如何改变当今世界,又面临哪些问题和瓶颈?对于人工智能的应用和商业化,哪些领域会最快显现效果出来?

  在清华大学“清华学堂计算机科学实验班”题为《人工智能的黄金时代》的演讲中,创新工场董事长兼CEO李开复对“人工智能”进行了深入浅出的讲解分析。

  在讲解中,这位机器学习领域的博士对人工智能追古溯源、引用知名商业案例,并结合Google等巨头的布局和调整,为受众勾勒了人工智能的框架、要素、商用领域和条件,并且强调了人工智能当前的瓶颈和对当前互联网市场的影响。

  值得一提的是,这位中国最知名的创业导师还给有志于在人工智能领域进行创业的创业者们提供了建议。

  在这篇长达万字的演讲实录里,关于人工智能、深度学习、Google的野心等,首次“科普式”地得以展现。

  以下是李开复演讲实录:

  谢谢大家!非常高兴有这个机会又一次来到清华,尤其是在我最尊敬的姚期智教授的邀请和介绍之下。姚教授的姚班在全球已经享有盛名,我从Google到创新工场,看到有非常多成功的工程师,都是在姚老师的培养之下成为了计算机界的顶尖人才。

  在讲人工智能之前,我想向大家介绍一下我的一些可能不太为人熟知的背景:其实在进入几个国际大公司任职之前,也就是在30多年前,我就进入了人工智能领域。我是在1980年首先做的自然语言处理,1982年做的计算机视觉,1983做的语音识别,1985年做的人机对弈,1996年做的VR/AR……但我们现在知道,那时候我的这些选择基本上都是非常“糟糕错误”的职业选择,因为每一件事情,我都是在它的黄金时代之前、白银时代之前,甚至破铜烂铁都不是的时代就涉足了。从这个事情上,其实我也想说,做计算机研究这个领域,本身的素质能力当然都非常重要,但是还要在正确的时候选择正确的事情。我在错误的时候太过狂热的跳进了人工智能领域,与此同时,过去的三四十年人工智能也是起起伏伏,一下很火,一下又跌入谷底。

  但现在是人工智能的黄金时代。可能各位也会问,凭什么这次说是人工智能的黄金时代?为了说明这个问题,这次我肯定不只用一些理论来说服大家,毕竟我过去也做了这么多“错误的选择”——我今天还带一些实际的数据来跟大家分享为什么我对今天的人工智能充满信心。人工智能有很多分支,其中之一是机器学习,机器学习里面还有一个分支是深度学习,今天我更多的会用深度学习作为案例。

  人工智能是一种工具

  最近人工智能成为全球热门新闻话题,很多是因为大家看到AlphaGo在几个月前击败了李世石,最近在网上还传出年底之前它要挑战柯杰的消息。但在这个新闻的热度之下,有一点让我觉得很可惜:大家对这个话题讨论的重心都放在了人工智能是不是在模仿人脑,“奇点”是否即将来临这样的问题上,却没有真正关注人工智能对我们的现实影响。

  “奇点”认为未来机器将有各种的智能、人类必须做一些事情来保护自己。我们在座的没有任何一个人能够证明或否定“奇点”,但就我个人而言,我认为人工智能要取代人还是一个非常遥远的事情。我觉得我们需要更关注的事情是人工智能是今天能够拿来用的工具,它能帮助人类解决问题,能取代重复性的工作,能创造商业价值。正因为这个理由,我认为我们今天进入了人工智能的黄金时代。

  随便举几个例子:今天很多的工作以后大部分都会消失,比如说翻译,虽然现在还不是做的那么完美,但是每年进步的都很快,再过几年人工的翻译可能就会非常难找到工作了。记者也同样如此,如今90%美联社的文章都是用机器来写的。几乎所有思考模式可以被理性推算的工作岗位,在有足够数据支撑的时候,都会被取代。有人说十年之内一半的工作会消失,有人说十五年之内一半的工作会消失,我觉得这些都是合理的揣测。

  我想在座大部分都会相信这个理论,而如果你对此还有怀疑,你可以想想,为什么AlphaGo这么厉害?就是因为它可以动用到几千台机器每天和自己对弈上万盘的围棋,而这人是做不到的;以后为什么自动驾驶会这么厉害呢?因为它可以用它的各种的sensor在路上搜集数据,这不是任何一个司机可以匹敌的。所以这些都是一些必然的过程。

  何为人工智能

  到底什么是人工智能呢?我觉得大概来说可能是有几个部分。

  首先是感知,感知就是包括视觉、语音、语言;然后是决策,刚刚讲的做一些预测,做一些判断,这些是决策层面的;那当然如果你要做一套完整的系统,就像机器人或是自动驾驶,它会需要一个反馈。

什么是人工智能?

  什么是人工智能?

  在这些例子上可以看到,感知可能更多的是帮助识别图里面一个婴儿在沙发上抱着泰迪熊这种。在推荐上面,我举的例子是一个用Google now通过你过去做的一些事情推测你下面要做什么,在最下面的例子你会看到有一个无人驾驶的汽车,它有各种的sensor,它捕捉的信息可以用来做最后的决策,比如怎么去操作方向盘、油门、刹车等等的。其实这三件事情的总和就是今天所被归纳为的人工智能。

  再从博弈、感知决策以及反馈四个方面回顾一下人工智能的发展历程。博弈今天就不讲太多了,但是基本上我可以看到从我在大学做的Othello到Checkers再到DeepBlue chess,经过很长的一段时间,终于有了今天AlphaGo打败了围棋世界冠军。我们从中可以看到,这是一条长达三十多年的路程。

人工智能的各阶段发展里程碑事件

  人工智能的各阶段发展里程碑事件

  在感知方面,从我的博士论文发表到Nuance成为一个顶尖的公司,从中国诞生了科大讯飞到美国的Deep Face、中国的Face++等等做得越来越好的企业,这些年也有很多的进步。还有一些很特殊的例子,比如最近看到一些搞笑的比较Microsoft Tay在Twitter上开始跟人家交流一下子就讲了一堆不堪的话,就被Microsoft撤回了,所以这里有很多的成功例子,也有很多有趣的事件。

  决策方面,从早期Microsoft Office里的工具到Google广告的推荐,然后到金融行业的很多智能决策公司的出现,进步迅速。Google auto mail可能大家还没有看过,但是如果你现在还在用gamil的话,会发现你有时候收到email,Google会跳出来问要不要发回复,有时候它连回复都帮你写好了,而且写的很精确。这也是人工智能的体现。可能以后我们讲话都不用,助理能帮我们搞定,人工智能的助理肯定也是一个方向。

  最后是反馈,从CMU Boss早期的无人驾驶到Amazon用Kiva推动物流,再到最近的Pepper、Google car,我们可以看到这个领域过去三四年特别的热,有很多看起来商业化已经做的非常好。

  科普深度学习

  在这里,我要稍微深度讲一下深度学习。

  深度学习是一种神经网络,与但与之前的相比,它的特点是使用了多层网络,能够学习抽象概念,同时融入自我学习,而且收敛相对快速。收敛快速可能是一种技巧,不见得是一个理论,但是有一批人通过它解决了很多重要的问题。

  简单的来说,如果我们有很多笑脸,然后我们把笑脸的像素输入到一个神经网络里面去,最后你那儿希望让机器能识别这是姚明,那是马云,但是因为你这个深度学习的网络很深,要一次性学会这么多也会比较困难,所以就需要用到一个比较快速收敛的技巧——自我学习。通过自我学习,机器会逐步从大量的样本中逐层抽象出相关的概念,然后做出理解,最终做出判断和决策。

  比如它可以有好几层的nodes和connection,经过这些nodes和connection,它在每一个层次会感知到不同的抽象特征,且一层比一层更为高级。这些都是通过自我学习实现的,而不是人教的。经过自我学习,从一个脸输进去再从同样的一个脸输出来,它就从里面抽象的学习到了一个人的脸重要特征。

深度学习的分层无监督训练

  深度学习的分层无监督训练

  经过这个学习之后,我再去做监督训练,看机器是否能够识别他们,如果不能,就在训练之后做微调。例如,如果我输入了马云的脸,出来的却是王宝强,那训练系统就会告诉你的网络说这个是错误的:这不是王宝强,这是马云。那接下来就是要进行微调,以便于下一次机器看到这个脸时,能识别出是马云的概率高一些,出来王宝强的概率低一些。

分层无监督训练

  分层无监督训练

  但是这么一调也不能调的太过火了,要不然就会有overtraining的问题,我们就对整个数学公式做一点微调,用大量的数据,不断重复的去教它,经过不断微调,那么它就很可能在多次之后降低识别错误。

  其实这一整套理论在二三十年前就已经有了,我在做我博士论文的时候,很多我的同事就在做训练神经网络的工作。

  深度学习在最初的时候训练速度特别特别慢,所以比较难进入工业级别或者是应用级别,比如,你的手机是做不来这个的,因为它的速度实在太慢了。但经过这么多年,我们的计算机变的越来越快,另外也有了更多取巧的训练和识别做法,深度学习的应用可能性也发生了变化,它能被应用的领域越来越宽。多年前,我过早的进入了这一领域,但是现在,人工智能大规模应用的时机已经到了。

  凭什么这么说?一个很简单的评估标准就是,我们的深度学习或者是任何的机器学习,它是不是超越人类的能力表现,如果超越的话,可能很多应用就会产生。比如在机场,如果机器识别人脸的准确度超过人,那么我们那些边防的人就可能不需要那么多。这并不是说机器不会犯错,而是说既然人不能比机器做的更好,那我不妨就用机器取代。

  深度学习的应用领域

  在过去的五年,深度学习的准确度从75%多提升到了97%左右,而人的表现准确率大概是95%。从95%到97%听起来只进步了2%,但实际上是把错误率降低了40%,这是很大的进步。如果这种进步持续,未来人工智能必然会超过人类的表现,同时也将可以进入一些可应用的领域。这就是今天我讲人工智能进入黄金时代的证据:在很多领域,也包括我们在face++做的人脸识别,包括了Apple、Google,科大讯飞的语音识别,它们的认知水平将在未来几年的时间内超过人类,而一旦超过人类,应用就会快速的增加。

深度学习的应用领域举例

  深度学习的应用领域举例

  深度学习首先可以应用于识别,包括人脸识别和语音识别等,这些可以用于安防,安检等。

  人脸语音的数据来之不易,但是BI,商业的流程、互联网的数据却非常丰富。Google、百度很早就已经在搜索,在广告以及推荐系统里面充分使用了类机器学习技术,解决该推荐什么商品,一个商品怎么定价,在什么位置会卖的最多,应该把这样的产品卖给谁等问题。这一类的推销可以直接产生经济价值,而社交媒体营销,整个互联网广告,这每一个领域都是几十亿,几百亿甚至更大的市场。

  将智能用于炒股其实也是一个不错的选择。在国内在国外,很多人都在做这方面创业的工作。利用智能,我可以随时来算一篮子股票和期货应该如何对冲,以寻求最大的利润。顶尖金融分析师也会做这个,但是他不可能把所有的股票的排列组合都考虑一遍,但是机器可以二十四小时不睡觉,每天都在算怎么能赚最多的钱。除此之外,deep learning深度学习的技术可以把各种的因素都融合进来,比如这个公司的高管有没有变动,今天出了什么新闻,行业里还有没有什么变动……甚至你可以对一个智能系统说如果明天巴西发生了地震,什么股票该被购买,甚至你可以说发生了地震不要问我,你直接去买它就可以了。

  银行保险方面,比如说贷款该不该审批,则无论是银行的贷款,还是P2P的贷款,都可以通过机器来判断,而且数据未必要来自银行内部。

  医学方面,因为我自己生过病,也深深的受过这方面的痛苦,我也感觉到在今天的医生的判断真的不是最完善的。一方面医生有好有坏,顶尖的医生是非常少的;第二方面比如在癌症方面,它每一年都有新的药出来,那每个医生每天忙着看病人,就不见得有时间去研究这些药物,那些药物也不是每个国家都可以使用的。还有就是每一个人,他的各种特质,不见得就适合用这个药。这些其实都是可以用机器学习来做出来的。

  前一阵我在美国碰到了一些科学家,他们正在用机器学习的方法来发明新药。我们的科学研究方面当然要有聪明的头脑和很好的实验,但是其中有一个很关键的部分,就要是一定的程度去排列组合:试很多东西,对小白鼠先试试这个有没有用,再试试看那个有没有用,然后再在猿猴身上实验,再进行人体实验。在以前,这整个过程都是由人脑完成,但是这个交给机器来做也许会更精准。甚至有一家公司它养了非常多的白老鼠,他里面所有的实验都是通过机器学习精准进行:每天白老鼠活了几只,死了几只,什么药可以进到下一步……这些都是靠机器学习加上非常精密的系统来做。

  我们发明的很多新的材料,都不是靠纯粹的科学方法推出来的,也是去试一试,把这个碰到那个,就产生了有很特殊效应的材料。这些知识都可以输入我们的信息学习系统,通过它我们可以帮助发明新的事物。

  在教育方面也有应用。在学习的过程中,如果基础没有打好,下一个层次根本学不下去。智能化的教育系统会识别你的学习水平,然后根据你的水平确定学习内容。比如,你的乘法没有学好,机器就不可能让你去学除法。

  当然学习外语也是很好的例子,我们今天的语音识别做的这么好,为什么我们学外语还是一定要找外教,为什么语音识别不能再上一层楼呢?所以,当你的技术一提高了,语音识别应用就不会只是我的讲话进去然后文字出来,它还有可能用在教育领域。

  在这么多机会之下,这个人工智能会重塑亿万级别的领域。当然这个不是明天就会发生,因为我觉得人工智能在很多方面还是相当大的欠缺……

  人工智能将重塑亿万级别的领域

  人工智能会重塑很多亿万级别的领域。当然这个不是明天就会发生,因为今天我们在很多相关方面仍存在相当大的欠缺。

  比如,在我们的计算架构上面,现在还是需要时间去做算法的改进提升,需要去研究如何部署云端架构,另外深度学习用时仍太长,这些还都是需要探索的内容,而且并没有一个标准化的答案。

  另外,算法框架也非常重要。我们可以看到有一些重要技术的推进,实际上是因为有了开源或者API或者标准的出现,但现在仍有很多方面还没有出现相关标准。当然我们知道Google的TensorFlow等提供了一些开源的方法,但是其实他们还没有真正的平台化,比如你把TensorFlow丢给一个没学过机器学习的人,哪怕是清华大学顶尖的计算机系学生,他也很难用其创造价值。如果清华的学生都不能,那它的普及性就有问题了。

  为什么iOS、安卓能够做的很好,就是因为它产生了平台化效应,使得很多人能够比较容易的介入。然后我们可以看到像Hadoop这样七八年前很多人觉得很高深的东西现在也慢慢变得平台化了。今天,如何使得整个机器学习的体系平台化,以便于让更多的非专业人士能够使用,这个是目前面临的一个很大的瓶颈,需要一定的发展时间才能得以突破。

  在一些领域中,很多技术性问题可以在两三年内得到解决,但是还有很多问题并非如此简单,比如说语义。我们说语音识别是相对简单的:音进来,字出去,这个非常明确,一个API就可以调动。但是音进来,确定是何种情境的语义出去就很难。这些我觉得两三年远远还不够,还需要更多的时间去理解。

  传感器一定程度来说是价格的问题、如何普及的问题。现在我们看到Google Car虽然做的很牛,但是正如驭势科技的吴甘沙说的,Google Car实际商业化的一个巨大瓶颈就是价位的问题:传感器实在太贵了。因此要把这件事做下来就是一个鸡和蛋的问题——降低价格就需要量,但量怎么起来?价格不下去量也起不来。要解决这个问题也需要一定的时间。

  最后还有很多机械方面的问题。控制机械运动的算法,硬件运动后给出的回馈等等在机械部门也还需要一些开发。

  整体来说,虽然我认为机器学习、深度学习在突破人类的精确度方面已经做的非常好,但是以上几个领域还是需要一些时间才能取得突破。但是这一天肯定是会来临的,我们怎么知道会来临呢?

  Google的野心

  我们知道,不久前Google重新组织了公司架构,将搜索业务和其他前沿项目子公司都放进了控股公司Alphabet公司。很多分析师说,Google把搜索和其他的业务分开来做Alphabet,是为了优化它的股价,其实这种说法太表面了,他们没有了解一个真正有野心的公司在做什么。

  一定程度上,Google之所以成立了Alphabet,是因为Google经过搜索和广告业务的积累,逐步发展了一套我们可以简称为GoogleBrain的模式。Google Brain其实就是机器学习的大脑,这个机器包括了平台也包括了专家,如果它用在搜索领域就是一个搜索引擎,如果它能够用在医学领域,那它可能就是一个癌症诊断系统,它也可以用于人类寿命的延续以及智能家电等各种不同领域。所以Google的野心就是把机器学习作为一个核心,然后用它去解决非计算机非互联网领域的各种问题。

  当然它现在还不是一个整体平台,但Google 就会找一些极聪明的人来进军这些领域,有平台的用平台,平台未成形的就用聪明才智来想办法。现在看来,Google这种模式也做成了很多有意义的事情。所以,对于Google,我们千万不要低估了它的能力,因为这家公司可能是未来推动人工智能平台化的最大力量。

  怎么证明这是真的呢?从最近Jeff Dean演讲的一张图我们就可以看到Google内部有多少项目在用深度学习。

Google内部对深度学习的大量应用

  Google内部对深度学习的大量应用

  我们可以看到,从2012年到今天,Google对深度学习的利用在快速增长,应用领域也极为广泛。从这张图我们就可以看到Google,也就是现在的 Alphabet在人工智能方面是多么的有野心。

  再回到我原来的问题,我们现在是不是生逢其时,可以在正确的时候选择进入人工智能这个领域呢?如果我们相信Google这帮人很聪明,如果我们相信Google对深度学习的使用逻辑,我们也要相信人工智能的应用期即将来临。

  深度学习的挑战

深度学习也面临挑战

  深度学习也面临挑战

  但是深度学习以及机器学习还面临很多挑战。这里有几个问题。

  第一个问题,就是我刚刚提到的:目前仍然没有一个统一的平台。在深度学习方面,现在的人懂就是懂,不懂就是不懂。这就是为什么Google最近花了重金不断在挖业界顶尖的人才,给年轻人开出的年薪甚至超过200万美元。这些人也就是二十来岁,博士刚毕业不久,怎么会这么值钱呢?

  其实就是因为两个理由,第一,这些人进入了公司之后,会被投入到健康、医疗、预防等等各个领域的研究。他们虽然每年拿走公司的两百万美金年薪,但是也许两年后他们就能在相关领域创造出两亿美金的价值,所以对Google公司而言,这些人才实际上不贵,是非常划算的。

  第二个理由就是Google多雇一个,Facebook就得少雇一个。这不是开玩笑。因为在美国有三个大公司在疯狂挖人工智能的人才——Google、Facebook和Microsoft,他们之间竞争激烈,对人才的吸引力也不相上下。

  第二就是深度学习的网络太大,需要海量的数据。

  第三,因为数据太多,所以计算特别的慢,所以需要非常大的计算量。

  第四点有点奇怪但也合理:机器无法用人的语言告知做事的动机和理由。即便机器训练做了很棒的深度学习,人脸识别、语音识别做的非常棒,但它不能和人一样,它讲不出来这是怎么做到的。虽然有人也在做这方面的研究,但是在今天,如果一个领域是不断需要告诉别人该怎么做,需要向别人去解释为什么的,那这个领域对于深度学习来讲还是比较困难的。比如Alpha Go打败李世石,你要问Alpha Go是为什么走这步棋,它是答不上来的。

  即便有如此多的局限,我们还是认为人工智能在很多领域可以迅速应用,并且可以帮助企业打造竞争壁垒。

  人工智能如何帮企业打造竞争壁垒?可以从如下四个方面思考:

  第一,如果你有垄断性的大数据,你就会有很大的优势。关于数据需要注意的几点是,首先垄断性大数据不是公开的数据,不是剽来的数据,也不是买来的数据,因为这样的事情你能做竞争对手也能做。其次,无标签的数据也不会给你带来优势。再次,如果是人工标签的数据也不行,因为人工标签太慢了。最好的数据是闭环的数据,所谓闭环的数据就是在你应用的时候可以捕捉到数据并且知道最终你根据数据做出的抉择对或不对。我们投资的face++,它有和美图、阿里的合作,就一定程度形成了特别大的数据的优势。

  第二,拥有庞大的机群。机群是很重要的,包括需要什么处理系统的支持,怎么去部署,用什么样的计算架构等等。

  第三,你要有一批特别懂的人。没有平台的时候,你就只能把一批人丢进去,让他们去解决特别大的问题。

  第四,当你没有平台的时候怎么办?我们就可以找一批特别聪明的人,让他们不断的调节算法——当然这构成一个短期的竞争优势,从长期看,一旦大的人工智能平台出来,这种优势就不存在了。所以现在来做人工智能,抓到这个先机是特别特别重要的。

  人工智能如何快速商业化?

人工智能如何快速商业化

  人工智能如何快速商业化

  第一,不要用人工智能去取代人。

  机器不一定要取代人,很多情况之下他只要能辅助人就可以了。我谈到了很多工作会消失,但医生会全部失业吗?一定不会,应该是最高明的医生创造很多机器人给他人使用。记者就不再需要了吗?写深度文章还是需要的,但简单拼拼凑凑的文字就不需要了。所以这些工具一定程度上是在辅助人而不是取代人。

  第二,要聪明的找到容错的用户界面。

  想想搜索引擎,搜索引擎的精确度其实是很低的,你想一想,当你去百度,Google搜索的时候,它们给出的第一条就是你要的答案的情况有多少?我估计不会超过50%,但是为什么我们都说搜索引擎聪明,不说他笨呢?第一个理由当然是因为它博学,第二个则是因为它的界面做的非常的聪明:它给用户提供很多结果,而用户只要能找到他满意的那个,就会认为搜索引擎很棒,因为没有它的话,用户可能什么也找不到。这一类的容错的界面,即便它的识别率很低,给你很多结果,让你在一定时间里得到满足,其实还是达到了一定的可用度。

  第三,让用户提供自然的大数据。

  当Siri推出的时候很多人都说“这就是个玩具而已”,认为它没有真实的用处,但是苹果靠Siri收集了很多人的真实语音,收集了大量数据。

  很多人把Siri当成一个搞笑工具,会问它诸如“你是男是女”这种无聊问题,苹果就把这些无聊的问题深度分析了一下,去了解人们最常问的都是什么问题,然后他们就考虑能不能优化Siri,让它对正常问题的解答能让人们在一定程度上得到满足。人们满足了以后,就会继续的问,如此问题越问越多,苹果也就可以得到更多的数据。

  苹果的这种数据收集方法非常聪明,值得借鉴。我们以前在学语音对话的时候,问的都是非常正经的问题,到最后分析来分析去,不过是那固定的几万句,一直没有跳出这个框框,得到的结果也就不会让人满意。但用一种有趣的方式,你就可以像草船借箭一样,去“借”到几亿个数据。这些数据哪怕不精确也无妨,因为整体来说深度学习非常聪明,能把那些不精确不精准的东西忽略掉。

  第四,关注局限领域。

  Google很伟大,它要做全天候全路况的无人驾驶,它想把全部竞争对手都击败,最后就剩一个Google。这个计划很宏伟,但是是不是一定要这么做呢?我觉得不见得。其实我们完全可以先做一个用于局限领域的无人车,把这样的一个产品先做起来,然后我们通过它获取数据,学习教训,不断改进。

  想想无人驾驶叉车。这个叉车是产生价值的,因为它取代了一个叉车工人去开叉车;它技术难度相对低,因为它只要知道从A走到B;它不上路,不用担心政府的法律法规,不需要考虑撞到人怎么办,是不是要停下。

  Google Car能在高速公路上比99%以上的人都开的更好,但是它碰到一些极端的情况,比如大风大雨的漆黑天,它就没辙了,因为它不知道该怎么办,从来没看到过这种情况。这种情况下只有把车子停下来,但那一停会发生什么呢?当然就追尾了。

  既然这种情况连Google也避免不了,为什么我们不先考虑做一些可控环境下的商业驾驶项目?这也是一个值得思考的问题,不是说Google的路线不对,而是说有两种路线可以走。

  总结:人工智能的未来蓝图

李开复:人工智能的未来蓝图

李开复:人工智能的未来蓝图

  上图是我认为的人工智能的未来蓝图,这是我们创新工场现在对这一领域的理解,以及可能会发生的顺序。

  大数据应用方面,现阶段我们已经看到很多互联网应用,BI、商业自动化马上也会使用相关的技术,未来几年,离钱最近、产生用户最多、产生价值最大的领域可能就是金融、医疗、教育,当然也包括任何有大数据的行业。

  在感知方面,今天的人脸识别、语音识别已经做的蛮好。对于VR/AR,我们在短期还不是太乐观,但是随着它三五年以后慢慢得到普及,一定需要非常多的新的自然语言的界面。此外,我们大胆预测三到五年之内会有一个人工智能平台出现。

  我们并不认可家庭机器人会很快出现,理由是消费者的期望值是最高的,今天机器人的技术还不行,犯错也太多,而且有时候会看起来太傻,另外价格也太贵,感应器不够灵敏。基于这些理由,我们对家用机器人的投资还只限于一些给小朋友的玩具,或者小鱼在家这种用于沟通的工具,这一类的家庭应用我觉得还是合理的,但要一个能够在家里帮你扫地做菜的机器人出现,恐怕还是一个非常长期的事情。任何行业都要有经济理由来投资这个领域,不断迭代优化它的技术,再进入下一个阶段,所以机器人简单来说应该是工业、商业,最后普及到家庭,所以今天很多对家庭机器人过火的观点和做法我们是不认可的。

  关于无人驾驶,我们的观点是虽然Google Car很伟大,但是因为它要去适应各种路况,所以要到应用阶段也还需要很长的时间。我们认为可以先在局限环境中慢慢推进无人驾驶。

  从长期看,未来人工智能会在所有的领域彻底改变人类,产生更多的价值,取代更多人的工作,也会让很多现在重复性的工作被取代,然后让人去做人真正应该去做的事情。短期来说,人工智能商业价值也很大,短期在很多领域都能产生价值。

李开复和清华大学姚期智院士

  李开复和清华大学姚期智院士

  演讲后问答实录:

  问题一:刚才听到了人工智能的介绍,真的认为人工智能给我们带来了很多的便捷,的确是快要步入到一个黄金时代,很多人可以从劳动密集型的工作中解放出来。我的问题是,如果很多事儿都可以交给机器来完成,那么剩余的劳动力是否会催生另一个黄金产业,比如服务业等等?

  李开复:这个问题很好,我曾经写过一篇文章《如果十年之后有一半的人失业了,下面该发生什么》,讲过这个问题。悲观的预测是,因为现在的95后,00后大部分成长在虚拟世界里,现实世界只是他们一个小小的补充,所以他们可能深陷其中而不能自拔了。反正人工智能让他们失业,也找不到工作,同时政府也可以养着他们,他们不需要工作,那么干脆每天带着虚拟眼镜起来就玩游戏,不思进取就好了。这个是我特别担心的,也是可能发生的。

  乐观的是上天让我们来到这个世界,本来就不是让我们来做中介、助理这类劳力的工作,我们被生为有感知,有大脑,应该是有更高的目标。那么,是不是上天让人工智能来到我们面前,就是让一批有思考能力的人帮人类找到一条新的出路,让我们每个人能够找到自己的更高目标,让一半失业的人找到他们的归宿,有自我实现的机会呢?

  我对年轻人的建议是做最有热情的事情,要不然机器肯定取代你,要做就要做顶尖最棒最有创意的事情,要不然你肯定会被取代。

  问题二:您讲了很多前景中的事情,我们都觉得美好,但是在实现前景的道路上,最大的几个技术瓶颈在哪里?在解决瓶颈的过程中,您看到的大公司解决这些瓶颈的方案是什么?

  李开复:最大的瓶颈就是人工智能的平台。平台化会带来井喷的效应,但这个平台是什么我今天也无法描述。你可以看到iOS的平台,安卓的平台等等,每一次都造成了井喷式的效应,所以平台化是必然的也是必须的。对于无人驾驶和机器人方面,主要是感应器的价格等问题,一旦问题解决,这些领域也会发生井喷效应。这些都需要聪明的大脑试着去解决。

  问题三:第一个问题,您刚才提到人工智能的黄金时代到来了,那么您能举一个到三个导致这种黄金时代到来的创新明星吗?第二个问题,当人工智能呼啸而来的时候,大家很快意识到人工智能第一个急需解决的问题是人,如果人类把持不住,可能人的时代就过去了。

  李开复:今天有四位CEO,分别代表了芯片领域、金融领域、视觉识别领域和无人驾驶领域,这四个公司虽然目前领域不同,但在到达下一个阶段后,一定会做平台,一定要扩张。任何一个领域都是先做一个切入的应用,做好了之后再扩大,变成一个平台,最终获利最多的就是那些有上下平台连接的公司。

  关于你的第二个问题,即人类将面临的下一个挑战问题,不是机器人占领了世界,我们被机器统治这样的问题。虽然我不排除这些事情发生的可能性,但是我呼吁大家先要应对一个现实问题——下一阶段50%的人可能失业的问题。这可能是一个最大的问题,毕竟在过去的工业时代也好,信息时代也好,失业率从来没有这么高过,今天的政治经济体系也不能承担这么高的失业率。所以我觉得聪明的人应该赶快解决这个问题,这个问题可能十年后就要到来了,当这个问题解决完了之后,我们再去想下一个问题。

  问题四:您讲到的人工智能在各个领域都会以极快的速度超过人的领域,但是它是不是只在某些领域做的更好,在某些人类没有开拓的领域,它有没有自我开拓的能力,根据已有的领域和问题,开拓新的领域?“奇点”真的出现,是不是就说明人工智能有跨领域思考学习的能力?

  李开复:从过去已经发生的事情来看,还不存在人工智能的自我开创,未来有没有可能,这其实是一个蛮有意思的话题。我想即便是一些人类未曾进入的领域,只要你能把它量化,变成一个input/output,我觉得机器还是可以学成的。但是我也相信大部分人类的伟大创意都不是那么容易量化的。

  第二个关于奇点的问题,回到刚才讲的,机器学习并不知道它自己在干什么,它只是一个非常聪明的input/output而已。另外它没有自我意识。科幻小说和现实生活很大的差别是因为科幻小说里面的机器都有自我意识,所以我觉得,由于机器的自我意识和自我创造力,还有自我解释的行动能力,这三者都不存在,奇点来临也就不是那么容易的事情。我相信在未来的一百年,这三点都有可能被克服,也会给人类带来机会和灾难,但是我们现在真正面临的问题还是50%的人可能失业的问题。