Factual:让应用不必依靠谷歌也能用上位置数据

Factual:让应用不必依靠谷歌也能用上位置数据

9月10日消息,《连线》杂志发布文章称,目前,应用开发者要获得位置数据往往需要利用谷歌、Foursquare等公司的API.但使用那些API也会产生利益冲突,与提供方竞争的开发者不大可能能够得到想要的数据。“AdSense之父”创办的Factual公司想要解决这一问题,帮助开发者利用位置数据使得应用变得更加智能,更符合人们的需求,能够提前预测人们的需求。

以下是文章主要内容:

吉尔·埃尔巴兹(Gil Elbaz)从小就对数据非常痴迷。他会去想诸如“哪里是世界上最冷的地方?”的问题,他父母得拿出一本厚厚的工具书让他来寻找答案。“书本最烦人的地方之一是你不能够进行信息整理。”埃尔巴兹说,“因此,你要知道最冷的地方,唯一的办法就是在一本100页的书中翻遍所有的温度数据。”

正因为此,他很喜欢电子表格,表格的行与列非常整齐,且易于整理。他仍很记得自己曾坐在一台早期的苹果电脑前专心致志地收集和整理各类主题的信息。“我那时只是在想:‘哇哦,数据就是解答很有趣的问题的方式。’”埃尔巴兹说道。

他习得这项技能已有数十年时间,最终由于儿时的痴迷而创建了Applied Semantics公司。Applied Semantics后来以1.02亿美元的价格卖给了谷歌。Applied Semantics的主要产品是内容关联广告工具,该工具如今一年可给该搜索巨头带来大约136亿美元的收入。

新征程

在谷歌担任工程主管4年后,埃尔巴兹在研发技术来在企业利用数据的方式上产生同样深远的影响。他的新公司Factual创立于2008年,致力于开发世界上最大的位置相关数据集。Factual还不是家喻户晓的公司,虽然知道它的消费者并不多,但它已经积累了相当多的知名企业客户,其中包括Yelp、Bing和三星。客户们利用Factual的位置数据来让它们面向消费者的产品变得更有活力,更加智能。

埃尔巴兹希望通过创造这种数据中心来催生能够随用户所在位置而作出反响的新一代应用。“透过位置,你就可以了解人们的生活模式,判断他们喜欢的东西,他们在那里,他们在做什么,他们要去做什么等等。”他说,“每一个行业都得涉足这种新游戏,否则就无法让用户满意。”

Factual的使命既具有风险,技术上也非常复杂。它意味着Factual要与一众的公司竞争,包括Foursquare和本身也是大型数据提供商的谷歌。谷歌和Foursquare均提供API(应用程序接口)让开发者访问位置数据。不过,使用那些API的开发者也得冒着与谷歌和Foursquare争夺用户和广告收入的风险。例如,像Bing、Yelp这样的服务不大可能能够从谷歌获得数据,因为正如埃尔巴兹所指出的,“谷歌将它们看作是竞争对手。”

Factual则不会面临这种情况,因为它并没有面向消费者的产品。埃尔巴兹说,“我们想要成为人人都能够合作与信任的中立数据网络。”

在某种程度上,Factual代表科技公司使用数据的方式演变的下一个阶段。这些年来,像谷歌这样的公司开发了精细的数据挖掘方式,小型开发者都乐于利用它们所提供的信息。但在Factual看来,开发者不应需要依靠谷歌来过滤和供给数据。他们应当能够自行直接访问那些信息。因此,Factual想要将数据本身变成产品。

“人人都在讨论找到工具来挖掘大数据。”Index Ventures合伙人丹尼·里默(Danny Rimer)指出,“但我们相信数据集本身存在着另一个大机遇。”Index Ventures参与了Factual的一轮2500万美元融资。

熟悉的对手

这并不是埃尔巴兹第一次跟谷歌正面交锋。在启动AdSense项目之前,Applied Semantics团队在开发一个基于语义的搜索引擎,该搜索引擎不仅仅在网页上搜索特定单词,还搜索相关单词——这是谷歌早年还未掌握的技术。

例如,Applied Semantics系统知道如果用户搜索过斋菜馆,那他可能也对素食餐馆有兴趣,因为二者有着紧密的联系。该技术非常好使,但说到打败谷歌,埃尔巴兹坦言,“我们输得很惨。”

尽管如此,该系统后来成为了开发AdSense的基础部分。AdSense会根据网页的语境匹配广告。现在,埃尔巴兹将Factual看作是那个工具的模拟版本。由于移动技术的不断普及,人们在网上看些什么并不重要,重要的是他们是在什么地方、在什么时候进行该项活动。

“如果你想要个性化一款应用,我们也觉得所有应用都应该个性化,你就得了解你的用户,而位置就是了解你的用户的最佳途径。”埃尔巴兹说道。

用算法预测真实信息

目前,Factual拥有的数据覆盖7500万个位置,涵盖50个国家的商户、公园和其它的景点。Factual收集的位置信息很简单(如手机号码、地址和营业时间),但积累的过程可一点都不容易。在开始打造数据库以及开发相关技术之前,埃尔巴兹和他的团队足足准备了两年时间。

Factual与来自全球各地的愿意分享数据的数百家商户进行合作,每天分析数十亿个数据点。例如,Yext是一家专注于帮助小企业营销者管理公司的线上信息的公司,它与Factual分享了其数十万个小企业客户的准确数据。

Factual的系统还会在网络上抓取公开的数据,但据埃尔巴兹称,通过这种途径来提取准确信息是公司最困难的任务之一。手机号码很多都是不准确的,地址也往往不完整,在很多国家甚至找不到没有相关的资料。“而最困难的任务就是,要怎么开发算法来预测真实信息?”埃尔巴兹说。

由于很多国家的数据不可靠,Factual需要当地的人来建造他所说的“黄金标准数据库”.这些人会手动建立数据库,比如覆盖日本100家餐馆的数据库。然后,Factual会针对那些数据库测试它的算法。“如果我们的算法能够自动找到跟人工一样的答案,那说明它们是可行的。”他说。里默说,对于Factual来说,这种硬核审查必不可少。“要有效地展开工作,你就得提供全面的服务。”他说,“光带来信息是不足够的,我们还需要确保它们的准确性。”

无限的机会

维持这种质量控制对于一家在寻求扩展的公司来说会是挑战。据埃尔巴兹称,Factual带来的机会甚至比AdSense还要大。要知道,AdSense对谷歌的营收贡献比例接近四分之一。

“我们能够分析进入商户的人群种类,判断他们在做什么,能够就地球上的任何一个地方进行这种分析,这意味着能够整合的信息是无穷无尽的。”埃尔巴兹说道。

目前,Yelp、Bing等公司在利用Factual的数据库来寻求国际扩张。与此同时,创业公司纷纷利用它来提高其应用的智能程度。例如,Shopular根据附近的商店来给用户推送优惠券。该服务的联合创始人汤米·蔡(Tommy Tsai)坦言,要是没有Factual,Shopular就无法展开该项业务。“一开始,我们是想着自行构建位置数据库,但在看过Factual的数据后,我们清楚地认识到我们的数据质量达不到Factual的水准。”

Factual不仅仅给企业推送位置数据,还从那些公司提取数据,并将它变成关于其用户的细分信息。举例来说,如果用户频繁访问一个被Factual识别为高尔夫练习场的位置,那Factual就会将该用户归类为高尔夫球手。

人们真愿意被追踪吗?

该公司正在寻求整合移动广告平台,促使品牌商在定向投放广告的时候不仅能够针对特定地区,还能够针对高尔夫球手、购物者、通勤者和数十种其他的人群。“这一切都是在不知道人们的姓名、邮箱地址或其它私密信息的情况下做到的。”埃尔巴兹指出,“应用负责收集信息。而我们只是在后台帮助这些公司理解它们手头的信息。”

当然,不管那些信息匿名与否,Factual的工作还是会提出一个备受关注的问题:消费者是否愿意一直被追踪?Factual的大愿景是,使得应用变得更加智能,更符合我们的需求,能够提前预测我们的需求。但随着像Factual这样的公司使得应用变得比以往任何时候都要个性化,消费者会拥抱这种变化吗?会觉得这让人毛骨悚然吗?人们真的想要Factual要创造的未来吗?

这些问题的答案谁也说不准,埃尔巴兹倒有一个预言。“令人毛骨悚然的东西的范围将会出现巨大变化。”他说,“几年后,对于你现在担心的问题你压根不会考虑。人们的信息分享量将呈10到100倍增长。你将有健康监测器时时刻刻追踪你的心跳,相关数据将在应用之间共享。我们现在只不过看到了冰山一角。不过,必须要确保应用开发者不是作恶者。”