苹果公司2亿美元购入专门挖"暗数据"的AI小公司

美国的《福布斯》报道了人工智能初创公司Lattice.io 被苹果收购的消息,苹果随后官方确认了这次收购。此后,又有媒体爆料收购的金额为2亿美元,收购在数周前已经完成,Lattice.io的20名员工加入苹果。

(图片来源:Lattice.io公司主页)

Lattice.io

虽然成立时间不长,但是创始人大有来头。Mike Cafarella是密歇根大学的助理教授,也是著名的数据库系统领域的专家,曾与别人共同设计了

Hadoop 系统。而另一位创始人 Christopher Re

教授来自斯坦福大学,此前曾构建了机器学习系统DeepDive。Lattice公司的成立正是为了实现 DeepDive 系统的商业化。

Lattice 的投资方包括谷歌风险资本(GV)和 Madrona 等机构。

简单地来说,Lattice.io可以从大量从未被仔细研究过的暗数据(dark data)中挖掘出有价值的信息。虽然每天传感器、互联网和移动设备等都会产生大量的数据,但是这些数据往往杂乱无章,缺乏结构。

举个例子,全世界的学者都会发表成千上万篇论文,但这些论文中既有统计数据,又有图片数据、引用数据、文本数据等等内容,非常难以实现结构化。

Lattice.io 的 DeepDive 系统正是可以从这样一些杂乱无章的数据中提取出结构化的信息,储存在结构化的数据库里。

目前,DeepDive

已经在很多领域产生应用,比如对抗人口贩卖活动。根据国际刑警组织的分析,人口贩卖已经成为仅次于毒品和武器走私的全球第三大非法贸易。贩卖的人口主要在工厂中从事强迫性的苦力工作或者被迫成为性工作者,人口贩子可以从相关的流程中获得分成。作为商业流程中不可或缺的一环,贩卖人口的广告也总会在网上露出一些痕迹。

于是,Lattice

参与了美国国防部领导的 Memex 项目,负责从网页求职广告数据中抽取出与人口贩卖相关的结构化数据。互联网上有海量的广告网页,可以理解成一个个

HTML 文件,里面既有 HTML 的标签,也有非结构化的文本内容。项目的其他参与者从网上找到了3000万条和性服务有关的广告。

虽然不同的广告形式、内容、风格都不相同。不过通过DeepDive系统,可以把这些广告所含的信息整理成表,包括不同的列,比如:广告的链接、广告中联系人的姓名和电话号码、工作地点,以及工资等。这样,网络广告数据就变成了一张可以存储在

SQL 甚至 Excel 中的表格。

图丨DeepDive的人口贩卖跟踪系统(图片来源:DeepDive主页)

在赋予了数据结构后,数据分析师就可以利用这些表格进行有目的的数据分析工作,比如,回答了以下几个问题:如何判断某个工作广告是否面向被贩卖的人口?如何了解人口贩卖组织的内部结构?如何帮助执法者找到危害最大的人口贩卖集团,解救处境最危险的受害者?

因为有了DeepDive,复杂的分析性工作变成了简答的数据库查询任务。

例如,人口贩子经常移动受害者,保持对他们的控制。所以如果求职者经常变换工作地点,说明他们更有可能被人控制。

此外,没有被贩卖的性工作者存在经济上的理性,会提出合理的价格并规避风险加大的行为。如果一个求职个体要求非市场化的价格或提供非正常性的服务,就应该引起执法者的注意。

关于苹果公司的AI布局

苹果公司并没有过多地透露这次收购的具体细节,只是在一则声明中表示:“苹果公司会不时收购一些小型技术公司,但我们通常不讨论收购的目的和计划。”

Lattice.io

是苹果在在过去2年多时间里收购的至少第三家人工智能公司。2015年10月,苹果收购了语音技术公司VocalIQ,此举被认为用于增强语音助手 Siri 和未来的汽车搭载交互系统。2016年8月,苹果又斥资2