AI领域的总结与思考:未来将面临的五大考验

目前人工智能在学习上遵循的理论依然是上个世纪80年代提出的,人们并没有从本质上理解人类的学习原理,从监督学习到无监督学习的方法还在探索。如果将人工智能比作建造太空火箭,计算能力和数据是燃料,理论就是发动机。如果你有许多燃料但只拥有小功率发动机,你的火箭大概无法飞离地面。如果你拥有大功率发动机但只有一点点燃料,你的火箭即使飞上天也无法进入轨道。

目前的人工智能技术多数都要依靠形态匹配,在监督式学习下,输入训练数据,每组训练数据有一个明确的标识或结果。人们将预测结果与「训练数据」的实际结果进行比较,不断调整预测模型,直到模型的预测结果达到一个预期的准确率。

而无监督学习中,计算机无需人类帮助的情况下,像人类一样自己学习知识。计算机并不被告知怎么做,而是采用一定的激励制度来训练机器人培养出正确的分类。无监督学习方式是机器人工智能发展的关键技能之一。“目前朝着良性的趋势发展,但还未达到我们希望的阶段。”微软亚洲研究院院长芮勇表示。

第二大考验:知识表达问题。

许多输入的数据其实都经过了人脑抽象,但大家看不到,就好比你看到地面上的竹子每一根都是独立的,但它的地下茎联系是非常紧密的。若要完成形式化知识结构的搭建,是需要很多知识的,而机器中没有人脑中的背景知识,所以数据中蕴含的信息是不完整的,继而计算不出正确的结果。

如果将这些信息补足,是有可能用机器处理的。但同时要看到的是这些信息很难补足,一方面是因为很多人脑中的知识难以形式化,另一方面,补什么补多少才能达到特定的效果,很难衡量。并且人脑输出的信息带宽太小,很难通过一个人来补足机器中没有的知识,而多人协同又存在知识相互不兼容的问题。所以知识太多,知识难以形式化,人脑输出太慢,成为了知识表达的三大障碍。

海云数据的首席数据科学家赵丹表示,目前大公司基本上通过知识图谱来解决知识表达的问题,但这不是根本的解决方法。知识图谱虽然能在小的特定领域解决一部分数据稀疏问题,但图谱本身也有稀疏的问题,并且依赖人工构建,规模有限。迁移学习也能够发挥一定作用,但目前还没有把这些解决技术整合起来,形成一个完整的智能体系的理论架构。

同时赵丹还认为,深度学习的研究一定程度上已经到达瓶颈期,现在到了需要将深度学习现有的成果转化成产品的时候,比如Deepmind前段时间发布的唇语识别成果,再往前比如AlphaGo的博弈策略学习。“而形成产品是件很难的事情,像我们熟知的人脸识别,虽然已有不少创业公司做了好几年,但现在仍然没有生产出成熟的产品。工程上的坑不比研究上的少,如若跨不过去就没有办法做出产品。”

在科学理论上的进步很多是偶然事件,说不准下次会是什么时候。深度学习的成果转换期,到下次深度学习的进步期之间其实还是会有可能出现寒潮。

第三大考验:人才问题。

图像识别方面的成就像一把发令枪,启动了一场人才争夺赛。有人曾说:“这个领域的人才战相当血腥,一流的人才就像NFL足球运动员。”

谷歌在2011年推出专注深度学习的谷歌大脑计划(Google Brain Project),2013年3月得到了神经网络先驱Geoffrey Hinton的加入,现在有超过1000个深度学习项目。

Yann LeCun,现任Facebook人工智能研究部门主管。

Facebook在2013年12月聘请了法国神经网络创新者Yann LeCun作为它的新AI实验室的带头人。平均每天使用神经网络翻译来自超过40种语言国家的20亿用户的帖子,这些翻译的内容每天被8000万用户阅读。

百度在2014年4月聘请了谷歌脑计划的前负责人吴恩达作为它的人工智能实验室的领头人,主攻语音识别等关键领域。

但蒋涛指出:现在人工智能领域的理论掌握在顶尖教授手上,但应用的数据在公司手上。顶尖教授一般会有与同行进行交流、发表研究成果的诉求,但公司的研发却要求不能透露商业核心秘密,甚至要将这个科学家雪藏起来,比如苹果现在人工智能的领导者是谁,我们都还不知道。这里面存在天然的冲突,很可能成为制约人工智能发展的瓶颈。