实验室主任余凯:百度大脑让连接更智能

2014百度世界大数据论坛在北京大饭店举行,百度研究院副院长余凯给大家分享了对深度学习构建百度大脑的思考,下面是余凯的演讲内容。

以下为百度深度学习实验室主任余凯演讲实录:

余凯:各位来宾、各位同行、各位朋友,欢迎来到百度大数据论坛,刚才祥云医疗胡总举的例子,其中拍照识别皮肤病技术是我们IDL的小伙伴们开发的基于深度学习的图象识别技术,通过我们的技术创新让大家的生活更加健康,更加美好,这就是我们工作的意义所在。下面我给大家分享一下我们从事深度学习构建百度大脑的思考。

人工智能很重要

这个是麻省理工学院科技理工杂志在三天前提供的一个文章,他讲的是介绍百度的人工智能之梦,介绍百度技术、人才方面的积累。百度从它诞生的第一天开始它就是一个人工智能公司,一方面我们通过搜索引擎满足用户每天的搜索请求,产生大量的用户数据。另一方面我们提供价值,连接人和广告,让千千万万的商家能够找到他的顾客资源,这种从数据到价值之间有一个桥梁,这个桥梁在百度就是基于百度大数据人工智能,包括自然语言的理解,包括机器学习,也包括今天Robin和劲都提到语音识别图象识别等方方面面的技术,使得百度能够把大量的海量数据转化成商业价值。

在座某些朋友可能知道这个著名的曲线,这个是Gartner每年都要发表的趋势表,显示出科技往前发展的趋势,这个HYPE是什么意思,可以理解为我们中国人讲的“忽悠”,所以比如说3D打印到现在到一个期望的顶点。但是当前的技术并不是那么成熟,因此大家对他的期待会降低。但是市场不断往前推进,同时技术也会逐渐成熟,慢慢真正的市场机会来临,比如语音识别,图像识别就是。

这个图表里面大量的技术,比如说语音识别,虚拟现实,机器人,智能推荐,都是跟人工智能有关。人工智能就是如此重要,包括最近我们看到在美国的Google,Facebook,他们都相当重视人工智能。在中国,百度是最重视人工智能研发的互联网公司。前不久,我们的国家领导人习总书记在院士大会上也提及人工智能是第三代产业革命。

核心战略——深度学习

人工智能取得最突破性的进展并且迅速在工业界产生影响的一个极为成功的例子,就是深度学习。同样这也是麻省理工学院科技评论杂志将深度学习技术列为十大通用技术之首的原因,这个最初来自学术界的研究成果影响到各大高科技公司的速度和广度是非常罕见的。我们有幸把包括Google大脑之父吴恩达在内的世界最顶级专家吸引到百度,他是在这个领域赫赫有名的人物。

百度在整个互联网业和高科技行业是领先者,因为我们是最早把深度学习做为公司的核心战略方向的高科技公司。我们在去年年初宣布成立IDL,这是百度历史上第一次宣布成立研究机构,核心目标是研究基于大数据的人工智能。

机器学习在过去30多年的时间里大致分为两个阶段,第一个阶段是浅层学习。第二个阶段从2006年开始进行更深层的学习。深度学习最吸引大家的一个原因在于它在很大程度上模拟了人脑神经网络的结构和行为,这里面的细节不多讲,但是就我们目前所知道的比如说对于图象的处理,我们通过训练得到的深度卷积网络,跟我们目前所知道的对人的视觉皮层神经元的行为有惊人的类似,我们同样发现人对听觉感知也有类似的情况。

百度大脑经过过去一年多的时间,它经历了一个高速发展的阶段。今天,百度大脑无时无刻不在学习,就像人脑一样,今天和昨天是不一样的,会越来越聪明。我们现在能构建世界上最大的深度神经网络,达到百亿级参数。刚刚永忠提到我们的GPU,我们的数据中心,方方面面的能力不是一朝一夕能够积累的,百度过去在大数据方方面面的积累,通过这种能力我们才能更好的开发各自不同的深度学习模型,应用于图像和语音识别,搜索,和广告推荐技术等等。