对话AI先驱布莱克:AI人才竞争白热化 巨头赌注太大

另外他表示,人工智能道德领域的研究还处于较早的阶段。“在过去的一两年中,人工智能道德方面的算法大量涌现,比如实验算法,以及关于算法的论文。这些算法研究如何将透明、公平、尊重隐私的道德原则纳入机器学习算法中,目前还没有定论。我认为人们才刚刚开始思考这个问题,因为人们最近才意识到这将是一个关键的问题。因此,这项工作正在进行中。但人们有一种强烈的紧迫感,因为大家意识到这一点至关重要。所以让我们一起来看这将如何演变吧。”

在苹果的问题上,他认为人工智能创新和隐私不一定是相互排斥的。“未来将会有好的技术解决方案。”他接着说,“我们必须努力工作,认真思考。广泛的人工智能包括机器学习和其他计算机科学领域如差异化隐私,我对此有信心,大家都知道这个话题热度很高,而人们真的在努力工作解决这个问题。我们还没有找到所有的答案,但我很有信心,我们会找到很好的办法。”

当然,在人工智能方面,并非所有的数据获得都是平等的。布莱克说,他的学术兴趣来源于构建一个机器学习系统的主意,他想造一个机器学习系统,在它学习的过程中它不需要太多外界帮助就从数据中提取有用的理解,而不是必须在有人监督的情况下才能进行学习。

“让我着迷的一件事是,人类都是在没有大数据的情况下进行学习的。这件事并不是那么简单。”他指出,蹒跚学步的孩子们了解周围世界的情况,并不需要知道他们看到的每一样事物的名称。孩子们可能会被数次告知杯子是“杯子”,但并不是每一个他们遇到的杯子都是“杯子”。如果机器能够以同样的精益方式从原始数据中学习,那么这将给人工智能领域带来变革。布莱克认为,破解无人监督学习将是人工智能研究人员面临的下一个重大挑战。

“我们现在必须区分两种数据原始数据和标签数据。标签数据的价格很高。而那些没有标签的数据,只是你在浏览世界的过程中得到的体验,但你还是会从中受益。所以标签数据之间有一种非常有趣的合作关系,标签数据并不多,而且很难获得。但没有标签的数据很多,并且无时无刻不在流动。”

“因此,我认为这将是未来10年人工智能和机器学习面临的巨大挑战,我们如何才能最大限度地利用有限且昂贵的标签数据?我认为,未来5到10年,大家最关注的将是找到获取无标签数据最有效的方法并从中受益,并认识到标签数据非常短缺。”

“我们要怎么做呢?我们如何才能获得它呢?自动驾驶汽车将是一项很有前途的技术,它显然将受益于这一领域的突破。因为人类驾驶的汽车已经配备了摄像头,而且如果这些机器能够从无标签的数据中学习,来自汽车的数据流也可以用于训练车辆自动驾驶。”

FiveAI的网站表示这也是它的目标,它正在用“更强的人工智能”来解决自动驾驶汽车在复杂的城市环境中安全航行的挑战,而不需要“高度精确的3D地图和本地化”。这个挑战被标榜为“自主的最高级别L5”。

布莱克补充说:“我个人很感兴趣人类是如何用不同方式学习的。目前,我们的机器正在学习这个。人类并不是一直都在从大数据中学习。人能够从少得可怜的数据中学习。”他引用了麻省理工学院的Josh Tenenbaum的研究,来展示人类是如何在接触一到两种东西后学习新事物的。“我们在做什么?”他想知道。“这是一个令人着迷的挑战。我认为,这是一个非常重要的问题。目前,我们真的不知道答案。我认为,世界各地的研究机构将会有一场大竞赛,来看看并了解人类是如何学习的。”

他推测,推动前进的答案可能在于回顾人工智能的历史,比如用概率或逻辑推理之类的方法,但之前没有成功,因为它们并没有带来深度学习所代表的突破,但这或许值得我们重新思考下一篇章的内容。他说:“早期的先驱们试图用逻辑来做人工智能,但出于种种原因,这绝对行不通。但逻辑似乎有一种属性,或许我们可以从这一点上进行研究,那就是通过逻辑我们能够高效并令人尊重地获取数据,但是获得数据的成本很高。所以,即使是一份数据,也要穷尽它。用逻辑学习的一个特性是,可以非常快速地进行学习,只需要一个或两个例子就行。”