人工智能会全面超越人类吗?

科学家们其实并没搞清楚究竟什么是意识,所以霍金、埃隆马斯克等对人工智能会产生意识的担心和人类最初的神灵崇拜其实同根同源。按照这种思路我们同样可以相信地球深处也存在某种意志,所以至少眼下这种担心并没有太大价值,但人工智能对人类的冲击却是真实存在的并且也更值得关注。

|技术视角下人工智能的真实水平

截止2016年3月人工智能在语音和图像上已经取得了阶段性成果,但语义上暂时还看不到能彻底解决的迹象:

1、语音识别

形象来讲是这是一个最近几年已经被深度学习攻克的领域,只要花足够的钱,那识别精确度可以达到99%。在语音识别这种领域,最后几个点精度的提升很可能比前面达成90%精度还要费劲,但最后这几个点的精度往往正是跨越能用和不能用的关键。没有深度学习之前,人们已经尝试攻克语音识别很多年,一般来讲1952年贝尔实验室研究的第一个能识别10个英文数字发音的语音识别系统被认为是语音识别的起点,这样算起来人类已经在这事上努力了60多年。

在上个世纪70年代搞定了小词汇量的语音识别,在80年代搞定了大词汇量的语音识别,然后精度就卡在那里了,大概在85%左右徘徊,一卡就接近30年。微软、IBM当年都曾经尝试把这技术应用起来,但显然没什么后果,好多人甚至不记得他们干过着件事情。深度学习导入语音识别后,使事情有了根本性的变化,现在只要有足够的数据进行训练,大多的公司自己都可以训练出足够精确的语音识别模型。这技术基本上要货品化了,越来越可以认为这是一种不要特别多的投入就可以搞定的技术。

2、图像识别

图像识别比语音识别要麻烦一些,因为语音识别的对象总是各种有限的语言。但图像里人脸和猫的识别落到具体实现上还不能用一个模型来处理。当前的状态是如果选定一个点比如人脸识别,砸入几十个PhD,几百块GPU,那花个一到两年,如果还能找到落地点不断获得数据,那就可以做到非常高的精度(99%以上),但这种精度眼下还没办法一下子就覆盖到其它领域,只能一个点一个点来搞定。像人脸这种领域因为有切实的落地场景(银行等),所以一下子就发展起来了,其它的领域要想都达到同样的水平,那还需要一点时间。

3、语义理解

和语音识别与图像识别不一样,语义理解处在一种基本没搞定的状态。很多时候我们看演示的时候能看到一个机器人或智能型产品与人进行流畅的交流。达成这状况有两种可能,一种是作弊,后面放了个人,属于人工的人工智能;一种是对话被限定在特定的场景下,比如汽车里打电话,让地图导航等。

语义理解的难度与所要处理的概念数有关,当要处理的概念数在几千个以下的时候,那针对特定场景按照基于规则的方式还是可能搞定,做的比较流畅的。但一旦这个范围扩大到整个社会生活,那最多也就是GoogleNow和Siri那个样子。与这点密切相关的应用一个是各种智能语音助手在对话时的智能程度,一个则是翻译。

在这些里程碑被陆续达成的过程中,世界也会改变它的样子,恰如汽车的出现带来了马路和交通规则一样。而要想理解这种影响的范围,那就要考察人类与人工智能的分工边界。

|人类与人工智能的分工边界

如果有一天我们想种什么植物,那只要对着身边的智能助手说一声;我们想生产什么东西,只要选定好样式和材料工厂就可以按需生产;我们想吃什么,机器人都可以帮我们做好;我们想出门的时候,自动驾驶汽车就会等在门口;想看病的时候,身体的各种参数就会和过往的病例自动对比分析。那人类到底还应该做点什么?

由这点可以引出旷日持久的各种争论,比如软件在吞噬世界、人工智能在吞噬世界、机器人在吞噬世界等等,但这并没价值,其关键在于既然有些岗位注定被消灭,那就要知道究竟究竟什么样的工作会是人类的保留地。当然这里用工作可能不太准确,古代富家翁也种花,但这和花农种花其实有着本质的区别。