专访陆奇:微软最有权势的华人谈云计算和AI

上周五,微软为它的人工智能机器人“小冰”举行了一场成人礼。

从2014年5月29日发布以来,“小冰”已经更新到了第四代,年纪也从16岁长到了18岁。过去两年多时间里,小冰在微信、微博、美图等平台上积累了上千万的用户,对话量超过了200亿条。

在相互的对话过程中,她也表现得越来越像一个正常人。比如她可以识别你发给她的图片,能在文字和语音之间进行切换,能够采用某种“策略”把你带出消极情绪,甚至,可以跟你打电话。

“小冰”已经成为了微软在人工智能领域的一个战略级产品,而作为这个项目的领导者之一,微软全球执行副总裁陆奇也从美国飞到了北京。在发布会结束之后,他跟我们聊起了小冰、微软的人工智能战略,还有如何在过去几年进行产品和业务转型升级。

陆奇认为,人工智能最终将表现在“对话”这个核心的诉求点上。当人工智能可以向电影《她》中那样与人类自然对话,与人类产生情感联系,那么将给整个社会带来巨在的变化。而微软小冰已经在这条路上走了两年多。

陆奇在进入微软之前,很长一段时间就职于雅虎。当被问到微软这个巨人应该如何转身,而避免雅虎的悲剧时,他觉得两个公司面临的情况并不太相同。雅虎的门户已经被搜索引擎和社交网络取代,而微软在借助云计算技术之后,把原有的产品重新推向了一个更为广阔的市常

以下是采访实录。

关于微软小冰

问:小冰一个很大的特色是它的情感计算框架。但是人类的情感是很复杂的,包括积极的情感、消极的情感。从目前现看,小冰基本上表现的都是积极的情感,与人平等的对话可能会涉及消极的表达,小冰在这方面会有学习吗?

陆奇:按照我们人工智能、大数据和机器学习技术,人的情感只要有数字化的介入,行为的规范基本上是可以学出来的。微软想要建立人工智能是代表正能量的,是为人类服务,帮助人类的。所以在这种情况下,我们想要建立的对话,采用的策略,基本上引导人类从他的消极或者负面环境(中走出来)。

问:小冰已经可以做到和人类打电话了。但人和机器之间文字的交流,实时的讲话,实时的了解人的语境,进行语音的反馈,这方面是挺难的吧?

陆奇:从某种意义上来讲,我们为人工智能所产生的对话能力,提出了一个新的标准,如何在实时性方向,非常智能的,就像人与人之间交流,确实技术上有很大的问题。

我们首先要听得懂,语音识别要非常清楚,速度得非常非常快;第二,交互的能力非常广,但是如何把这些技术,有难度的核心技术提高到一定的层次,把它集合起来,使整个的用户体验,真的像人与人之间智能交互,这是非常重要的。

刚才有一位女士上去试了一下,小冰可能今天没法测试说今天给我打电话的是个男的还是女的,有很多事情要解决。

问:为什么要赋予小冰这样一种实时对话的能力?

陆奇:人类跟任何种类不一样的地方,我们发明了语言,人与人之间近距离的交换,后来有了电话以后,可以远距离的交换,就是实时的交换,不光把人类进化,而且产生人类知识,人生整个演进过程中起了非常大的作用,人工智能会成为新的人与人之间交流的基准桥梁。

其实是蛮振奋人心的,虽然我们没有完全把技术问题解决,但是我们至少定义了这是一个新的里程碑,将来不管是机器人也好,它是一个自然的交流形式,完全可以连续实时的、可以不断的,毫无保留的讲。

问:我们离这个理想的自然交流状态有多远?

陆奇:根据我们现在的深度学习技术,只是一个时间问题。把数据输进去,不断地去训练,在2009年之前,错误率接近30%,这么几年已经从30%降到8%,可以预测再过一两年,就差不多1.5%左右,这也是我们技术上可以解决的。