百度首席科学家吴恩达:语音识别将会推动物联网革命

 

  我们百度做的是什么事情呢?我们把所有这些东西都替代掉,用先进的人工智能技术替代掉,用先进的深度学习技术来替代掉,这就是我们百度的深度语音,我们的火箭发动机。大家看到这个话音识别的结果如下,很多公司用的是依靠大量的数据,而百度忘掉那些数据吧,我们将用1万的数据集进行人工智能处理,这就是我们的火箭燃料,我们形成了一些研究的结果。大家可以看到,基本上结果是不可想象的。

 

  人们之前从来不会想到能利用这么多的数据,我们使用神经元系统以及数据燃料,我们发布了这样一个结果,我们可以极大地提高语音识别的准确性。根据我们的计算结果,我们的调查结果,我们现在正处于这样一个环境,如果你对着手机说话提出你的要求,我们的接口是做得越来越好了。我们可以很好地处理背景噪音,使手机更好地识别你自己讲出的话。我非常兴奋,我们能够在这方面做得越来越精确,做得越来越好。在百度,我们已经看到了使用话音识别的用户越来越多了。因此在这个领域,我们还有很多要提高的。很多人是低估了95%的准确率和99%的语音识别准确率的差别。如果我们能够做到95%的话,也就是今天的状况,你说话要非常清楚,要离话筒非常近,必须这样才能识别出来。如果我们将来能做到99%的准确率的话,这和95%简直是天壤之别,这会彻底改变我们的玩法。如果我们能真正做到99%,我们甚至可以把所有手机的接口做重新的设计和修改,使我们自己更加习惯于语音通话指令的发送方式,这可以推动这个领域的革新。你手里的东西将不是传统上的手机了。

 

  在手机之外,我觉得我们的话音识别还会推动物联网的革命,从汽车界面到家用设备到可穿戴设备将会发生很多的改变。我在家里有5个遥控可以控制的东西,我想再过几年再回过头来看,我们会觉得这5个遥控太少了,比如你只是遥控电视,只是遥控空调,简直不够了,看来都是小儿科的东西。在几年的时间内,或者在未来几年,我们将能够和电视通话,和更多的家电通话,这将是未来面临的发展,我们将有很多的路由器内置到这些机器当中。

 

  这是对语音识别的介绍,下面再看一下最后一个部分,也就是行为这块。

 

  我们看到很多技术公司现在都能够获取到一些大数据来了解人们在互联网的环境当中究竟是什么样的行为,这是技术的发展。我们可以从这些数据当中挖掘更多的价值。正如很多人都知道的,我们百度的广告也是在人工智能方面下了很大的工夫,我们有很多数据搜集过来是关于人的行为的,而这些深度学习可以使我们了解人们的行为是什么样的,他们倾向于做什么事情,他们喜欢做什么事情。因为我们的数据中心还有很多数据搜集起来,使我们了解不仅仅是人的行为,还有机器人行为。今天的深度学习确实是一个非常强大的工具,使我们可以了解机器在做什么,来更好地管理数据中心。比如我们可以使用这方面我们了解的信息来更好地使机器运作。我们也可以更好地了解计算机是如何工作的,我们还可以使用深度学习来提高计算机的安全性。

 

  这是我们百度正在做的事情,我们觉得很多行为数据给我们带来的机会,包括人的行为,包括机器的行为,可能比我们今天所了解到的要广得多。美国、中国和欧洲现在都越来越多使用深度学习来了解人的行为,了解机器的行为。在IT世界当中以及IT世界之外挖掘更多的机会,这也推动了我们未来的成功。我非常兴奋地了解到深度学习在上述三个领域都给我们带来了巨大的改变或者将会带来巨大的改变,我刚才用了火箭的引擎和燃料来做类比,使大家更生动地了解我们所面临的改变。

 

  最后我跟大家分享一个框架,人工智能能给我们带来什么,人工智能的循环发展是非常迅速的,在15年前,我们有这张图,我们有这个想法,这就是AI人工智能的良性循环。那时候我们如果能够构造优秀的产品可以吸引更多的用户,有了更多的用户就可以获得更加大量的数据。现在这个良性循环确实已经就位了,现实就是这样。而还没有发生的事情,我们以前想过但还没有发生的事情,更多的数据通过人工智能被你更好地利用,来推动更多的优秀产品被生产出来,而这个只是在最近几年我们才做的事情。而我们的火箭引擎现在不够大了,而我们的燃料变得越来越大了,现实世界是这种情况。大家搜集到的数据越来越多了,可是引擎不够大,所以不能深度地利用这些数据。在我们搜集更多数据的过程中,推动更多应用发生的过程中,这是我们之前那些老的算法是连想都不会想的。而深度学习之所以能给我们带来更多的价值就是因为我们现在可以从越来越多的数据当中受益,获得越来越好的结果,开发越来越多的潜能。所以我说深度学习确实改变着我们的生活,改变着传统的人工智能,使我们最终可以把链接做得特别好,把发动机和燃料的链接做得特别好,把产品、大量用户和海量数据之间的连接做得更加通畅。