各方大佬都投资的硅谷最神秘人工智能公司Vicarious在干什么？_人工智能_计算头条_中国计算网——工业互联网一站式服务平台—

简单的说，拿到一张图片，生成模型需要懂得图片中需识别的物体的较为完整的信息，需要懂得此物体的构建的过程（所谓“生成”）。因为生成模型本身“懂”物体，天然地它就可以“创造”新的、未见的物体实例。如下图，一旦Vicarious的模型懂得了字符“A”，它就可以“想象”出很多种可能的“A”的实例。也就是说，如果在实际场景中观察到这些不同变化的“A”，Vicarious的模型都可以很好的识别出来。

当然，从应用角度来说，基于深度学习的判别模型更容易上手，但生成模型有更强的解释性，大部分变量都有实际的意义，更容易调试(debug)，在通往建立通用人工智能（AGI）的道路会更有竞争力。

此外，人脑的工作模式更有层次感，比如人眼观察东西，先是从形状出发，接下来可能是看颜色，在往下可能是材料和材质。深度学习则往往无法不能很好的把问题分解(factorization)，而Vicarious的模型能够很好的把问题分解，更接近于人类的思考方式。

Vicarious此次公开的三篇论文和生成模型有关，另外两篇是《Hierarchical compositional feature learning》和《A backward pass through a CNN using a generative model of its activations》（微信回复“论文”获得三篇论文的下载链接）。

Vicarious的技术特点二：基于神经科学和脑科学的成果

Vicarious约有20%的神经科学家和脑科学家，来研究人脑的工作机制和人的行为特点，这是Vicarious的一大特点。剩下50%约为机器学习背景的研究者，来基于神经科学和脑科学模型来建模，还有一部分是计算机视觉的研究者。

Vicarious认为认知（Perception）依旧是人工智能的最大难点之一，所以Vicarious目前研究的重点是视觉(Computer Vision)，主要出发点是在现实世界中，视觉是非常重要的输入来源，而针对视觉的脑科学研究也有些突破。

而基于脑科学的一些研究，能够为建立模型带来很多启发，比如Vicarious发表在NIPS上的论文，里面就利用了脑科学上非常成熟的成果：人类的神经系统系统普遍存在的侧向抑制的现象，这引导Vicarious在他们在模型上实现了侧向约束（Lateral Constraints）。

在字母验证码识别这个具体问题上，Vicarious基于生成型形状模型的系统能够只用1406张图片作为训练集，就超越了利用深度学习的800万图片达到的效果。

Vicarious的顾问团队包括计算机视觉领域的斯坦福教授Fei-fei Li，神经科学领域的UC Berkeley教授Bruno Olshausen 和UCLA教授Alan Yuille。

（Fei-fei Li）

Vicarious目前没有自然语言处理和语音等方向的研究项目。

Vicarious如何赚钱？

Vicarious目前的商业化主要集中于仓储机器人领域，希望通过提供高智能、高效率的机器人来支持现代商业中至关重要的产业，例如仓储物流和工业生产线。另一方面，Vicarious的投资方对这个方向也表现出浓厚的兴趣，例如ABB和亚马逊等。

ABB是全球最大的工业机器人公司，而Vicarious正努力将他们的研究成果把机器人变得更智能。而亚马逊的仓储机器人也有潜在的应用场景。

由于目前深度学习的局限性，深度学习很难达到通用人工智能。Vicarious目前的研究，是深度学习的有益补充。

无论是在学术界还是工业界，研究方向和产品的多样性都有利于推进人工智能的进步。

文章来源：微信公众号硅谷密探

（责任编辑：柳苏源 HN091）

登陆|注册欢迎登陆本站，认识更多朋友，获得更多精彩内容推荐！

3/4 首页上一页 1 2 3 4 下一页尾页