各方大佬都投资的硅谷最神秘人工智能公司Vicarious在干什么?

简单的说,拿到一张图片,生成模型需要懂得图片中需识别的物体的较为完整的信息,需要懂得此物体的构建的过程(所谓“生成”)。因为生成模型本身“懂”物体,天然地它就可以“创造”新的、未见的物体实例。如下图,一旦Vicarious的模型懂得了字符“A”,它就可以“想象”出很多种可能的“A”的实例。也就是说,如果在实际场景中观察到这些不同变化的“A”,Vicarious的模型都可以很好的识别出来。

当然,从应用角度来说,基于深度学习的判别模型更容易上手,但生成模型有更强的解释性,大部分变量都有实际的意义,更容易调试(debug),在通往建立通用人工智能(AGI)的道路会更有竞争力。

此外,人脑的工作模式更有层次感,比如人眼观察东西,先是从形状出发,接下来可能是看颜色,在往下可能是材料和材质。深度学习则往往无法不能很好的把问题分解(factorization),而Vicarious的模型能够很好的把问题分解,更接近于人类的思考方式。

Vicarious此次公开的三篇论文和生成模型有关,另外两篇是《Hierarchical compositional feature learning》和《A backward pass through a CNN using a generative model of its activations》(微信回复“论文”获得三篇论文的下载链接)。

Vicarious的技术特点二:基于神经科学和脑科学的成果

Vicarious约有20%的神经科学家和脑科学家,来研究人脑的工作机制和人的行为特点,这是Vicarious的一大特点。剩下50%约为机器学习背景的研究者,来基于神经科学和脑科学模型来建模,还有一部分是计算机视觉的研究者。

Vicarious认为认知(Perception)依旧是人工智能的最大难点之一,所以Vicarious目前研究的重点是视觉(Computer Vision),主要出发点是在现实世界中,视觉是非常重要的输入来源,而针对视觉的脑科学研究也有些突破。

而基于脑科学的一些研究,能够为建立模型带来很多启发,比如Vicarious发表在NIPS上的论文,里面就利用了脑科学上非常成熟的成果:人类的神经系统系统普遍存在的侧向抑制的现象,这引导Vicarious在他们在模型上实现了侧向约束(Lateral Constraints)。

在字母验证码识别这个具体问题上,Vicarious基于生成型形状模型的系统能够只用1406张图片作为训练集,就超越了利用深度学习的800万图片达到的效果。

Vicarious的顾问团队包括计算机视觉领域的斯坦福教授Fei-fei Li,神经科学领域的UC Berkeley教授Bruno Olshausen 和UCLA教授Alan Yuille。

(Fei-fei Li)

Vicarious目前没有自然语言处理和语音等方向的研究项目。

Vicarious如何赚钱?

Vicarious目前的商业化主要集中于仓储机器人领域,希望通过提供高智能、高效率的机器人来支持现代商业中至关重要的产业,例如仓储物流和工业生产线。另一方面,Vicarious的投资方对这个方向也表现出浓厚的兴趣,例如ABB和亚马逊等。

ABB是全球最大的工业机器人公司,而Vicarious正努力将他们的研究成果把机器人变得更智能。而亚马逊的仓储机器人也有潜在的应用场景。

由于目前深度学习的局限性,深度学习很难达到通用人工智能。Vicarious目前的研究,是深度学习的有益补充。

无论是在学术界还是工业界,研究方向和产品的多样性都有利于推进人工智能的进步。

文章来源:微信公众号硅谷密探

(责任编辑:柳苏源 HN091)

登陆|注册欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!