实验室主任余凯:百度大脑让连接更智能

百度大脑智能连接

百度大脑让连接更智能。首先人来到百度这个平台,表达他的搜索需求,这个搜索需求有可能是关键词,有可能是一段话,有可能是拍个照片,就要靠百度大脑来识别用户的意图,在精确识别用户搜索意图后,我们用深度学习来对网页语义相关性排序,从而匹配用户需求,这就完成了人与信息的连接。另一方面是连接人与广告和服务,我们通过大规模的深度学习,去估计和优化点击率和转化率,进而把人连接到所需要的广告和服务。我们的深度学习已经用在百度核心业务的方方面面,真正实现智能连接人和信息,智能连接人和服务。

深入百度大脑,百度大脑里用到一种叫深度语义神经网络的模型,它是百度大脑用于自然语言,去匹配query和网页的语义相关性,这是业界第一次把深度学习用于提升搜索精度的成功案例,也是迄今为止深度学习用于语言文本信息最成功的应用。另外,我们的凤巢广告系统,它背后基于机器学习的点击率预估模型,从第一代浅层的机器学习模型,已经过度到到用更复杂的模型、更深的模型的时代。

同样我们不断的讲到大数据,大数据实际上给深度学习给人工智能带来很大的机会。但如何处理大数据、如何获得大知识、给我们带来了新的技术挑战。怎么样去处理?我们是世界上最早大规模的利用GPU做深度学习的高科技公司,我们通过各种各样的数据并行,模型并行去处理这些海量数据。我们还可以支持,生成,配置针对不同的应用、不同的场景和不一样的网络结构。在今天Robin也提到了,在中文语音移动搜索的方面,在基于内容的图像搜索方面,我们现在做到了世界领先,这个是跟我们在大数据训练深度神经网络所取得的进展分不开的。

基于深度学习的OCR技术,还可以像人一样读懂文字。比如一个实际的例子,我一个外国朋友在上海看到某个菜单,他想知道这个菜单中是否满足他想要的菜品需求,他拍照用百度翻译,识别菜单上道菜是牛肉拉面,通过识别后翻译成英文,并有语音的合成,所以这一款小小的APP,体现了百度在方方面面的人工智能领域都有非常深的积累。

我们刚刚上线的拍照答题,在一款产品叫作业帮里。我估计在小朋友们的暑假中可得到广泛应用,如果假期玩得很开心,但临近开学还没有做作业怎么办。就像这页PPT显示的例子,他们可以用这款产品拍下题目,我们的作业帮马上就识别题目,并能找到答案。小朋友们该多开心埃当然,也许这个对于家长就不那么喜欢了。

不仅是中文OCR,在英文OCR识别方面,我们也都做到世界领先。这里展现的这些例子,人不一定都认清的英文,但是我们的机器能够识别。

百度拥有世界领先的基于内容的图像搜索技术,比如跟我们的竞争对手比,无论是识别结果还是搜索相关性都大幅度领先。希望机器能够像人一样去理解图片,这个是很有挑战性的。在两个礼拜前百度推出了百度移动搜索APP5.5版本,这个是历史的进步。这是世界上第一款基于深度学习的拍照实物搜索。看这些例子:拍书可以知道这个书的价格,知道它在哪里能够买到;小朋友拿着爸爸妈妈的手机,看着好玩的玩具直接下单,这是多么开心的一件事情;再比如说你要是看见朋友的衣服或者包包非常好看,拍了直接可以下单。

我们在这里看看百度大脑的全景图。我们以前是获取互联网信息,然后做搜索做广告,所有一切都是在虚拟世界完成。但是现在所有的服务离现实世界越来越近,离人越来越近,所以我们通过自然交互,通过穿戴式,了解人的需求,另外物理世界的信息,比如商店,场景,街道,天气等等,都跟我们推送的服务的相关性息息相关,我们现在需要通过智能感知技术获取人和场景的信息,才能推荐更加相关的服务。还有,我们看服务的执行阶段,以前互联网上完成一个预测,做出一个决策,之后是由人去执行,从而完成整个互联网服务环节。未来的互联网服务,需要机器,或者说机器人,自动的完成这服务的最后一公里。比如说某一个人想吃披萨,在网上下单后,一般是要由人来完成制作披萨,然后递送到家的。但是,这个体验不一定最好,因为如果机器知道个性化的口味需求,能千人千面的私人定制这个披萨,而且,自动驾驶能更高效便捷的将披萨送到家里。所以说,互联网的人工智能一定会从数字世界的智能延伸到物理世界的智能,机器人是大势所趋。