AI智商达到多少了?未来智能实验室启动AI智商评测

赞助本站

本文选自:人工智能学家(公众号 AItists)

一、人工智能能否超越人类智慧的争议

21世纪以来,人工智能领域陆续爆发很多重要事件。其中最吸引人们眼球的,当属2016年战胜了人类围棋冠军并开始能够从0自我学习的AlphaGo,

10月1日,美国CBNC,麻省理工科技评论等媒体报道根据中国研究团队的研究,谷歌、Siri、百度、Bing等人工智能系统智商仍然大幅度低于人类6岁儿童。

而与之形成鲜明对比的是,10月26日,软银CEO孙正义在沙特阿拉伯举行的未来投资计划大会上称,未来30年内AI的智商(IQ)将达到10000。这次大会上机器人公民索菲亚(Sophia)被宣布成为沙特阿拉伯的机器公民,这些事件让人工智能与人类关系的讨论变得更热烈,更多人担心机器人最终会使得人类变成无用的生物,甚至会导致人类的灭绝。

包括著名的物理学家霍金,微软创始人比尔盖茨,特斯拉CEO马斯克,软银集团创始人孙正义等。发表观点指出人工智能将超越人类并对人类产生威胁。

另一方面,人工智能领域科学家对人工智能威胁论也提出了反驳或不同意见。这其中就包括Facebook人工智能实验室主任YannLeCun,前谷歌大脑创始人吴恩达等。

二、AI智商评测的发展与困难

面对AI的突然爆发,人工智能威胁论的广泛传播,那么AI究竟能不能超越人类,AI智能水平究竟达到什么水平,各种智能产品究竟有多少智能,各种爆炸性的AI和机器人突破事件究竟是否真实?

这些问题需要在科学上有一套方法,能够对包括AI系统,人类和其他智能体进行统一的智能水平测试,以判断它们的发展水平。

目前人工智能定量评测面临两个重要挑战:第一,人工智能系统目前没有形成统一的模型;第二,人工智能系统与以人类为代表的生命体之间的比较目前没有统一的模型。

这两个挑战都指向了同一个问题,即对于所有的人工智能系统和所有生命体(特别是以人类为代表的生命体)需要有一个统一的模型进行描述,只有这样才能在这个模型上建立智力测量方法并进行测试。

从1950年图灵测试提出以来,科学家已经为人工智能发展的评价体系做了很多工作。

1950年,图灵提出了著名的图灵实验,采用提问和人类裁判的方法,判断一台计算机是否具有同人相当的智力。作为最被广泛应用的人工智能测试方法,但图灵测试并不检验Ai的智能发展水平,只是判断智能系统能否与人类智能相同,而且受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试,

2015年3月24日“美国科学院院刊(PNAS)发表一篇论文,提出一种新的图灵测试方法“Visual Turing test” ,这种测试方法用来对计算机的图像认知能力进行更为深入的评估。

2014年美国佐治亚技术学院的瑞德教授(Mark O. Riedl)认为,智能的本质在于创造力。他设计了一个叫做Lovelace 2.0版本的测试。Lovelace 2.0的测试范围包括:创作有虚拟故事的小说、诗歌创作、油画和音乐等。

在解决人工智能定量测试的问题上,包括图灵测试在内的各种方案还存在两个问题:第一,这些测试方法没有形成统一的智能模型,并以此为基础进行分析,区分智能的多个分类。导致无法将不同的智能系统包括人类进行统一的测试;第二是这些测试方法无法定量分析人工智能,或者只定量分析智能的某个方面,但这个系统究竟达到人类智慧的百分之多少,发展速度与人类智慧发展速度比率如何,这些问题在上述研究中没有涉及。

三、标准智能模型的建立与AI智商测试

针对这一问题,科学院虚拟经济与数据科学研究中心刘锋、石勇、刘颖团队参考冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW模型体系等。从2014年开始发表论文建立“标准智能模型”,统一描述人工智能系统和人类的特征和属性。