数据API经济与大规模数据流通:从水的寓言说起

摘要:近期数据API接口服务逐渐兴起,正因数据API服务允许需求方“挑数据”,并具备“开箱即用”以及降低交易成本与门槛等优点,将会成为数据能力开放与交易流通的重要手段。但数据API从当前的实践来看远非完美,运营不慎会导致类似金融领域洗钱行为的“洗数”活动出现,并在隐私保护、计费方面存在不足,因此本文提出了“增强型数据交换导向API”的概念,使得数据API经济能在深思熟虑的顶层设计下运行。本文将从一个寓言故事引出上述探讨。

文:胡嘉琪/亚信数据银行行业线资深顾问

水的寓言故事:自古以来,水资源都是分布不均的,大多数湖泊、河流系统互不相通,人们自发地从附近的水源地打水灌溉、饮用。然而远离水源的居民要么亲自跋山涉水取得用水,要么从水商人处购买用水--生活在水源附近的居民慢慢发现,水源的水除了自身使用以外,原来还能对外开放卖钱。逐渐有经济头脑、希望将自身水资源变现的水商人出现了,最早的水商人将水放到水车里面直接整车水出售,但逐渐发现这种方法效率低下,因为用户即使仅仅需要一点点水做饭,也不得不买回整车水。这时候,一个聪明的水商人发明了自来水--直接将水从水源地通过水管接入用户家,打开水龙头就能用水了,并按使用量收费,大大减少了运输成本,也为用户提供了按需使用的便利。

看到这个巨大的商机,越来越多的水商人开始发展自来水服务,希望能把自己的水龙头接到用户家。面对同质化竞争,相信大家也会想到结果:逆向选择产生了。部分水商人们开始以次充好,通过接入有污染的水源降低成本从而取得市场,诚信的水商人逐渐被赶出市场,脏水最终充斥于管道中。人们不得不额外购买净水设备,最终成本一算还不如直接整车买水,整个自来水市场陷入崩溃。这时候,国王出来了,制定了自来水供应的标准规范,规定了水源质量标准、水管用料、水龙头性能、水表构造等一系列通用标准,并强制水商人按标准使用,逐渐杜绝了自来水逆向选择现象,人们最终用上了安全、放心的廉价自来水。

数据API服务的划时代意义

如果把数据比作水资源的话,数据交易与流通最原始的形态,就是以数据集为交易单位的批数据交易与流通,如同寓言故事中水商人将水整车出售。然而采取整批数据交易与流通的方式无疑是低效的,首先数据的价值具有较强的相对性,假设有一个包括中国13亿人的兴趣爱好标签数据集需要流通,实际上大部分企业只需要其中的一部分数据,让数据需求方把全体数据买回去无疑是不经济的,数据交易与流通需要给予数据需求方“挑数据”的能力。其次,整个数据集的流通必然带来很大的数据应用难度--需求方还需要额外对数据集进行数据处理、分析、挖掘才能获取其中的价值,无法达到数据“开箱即用”的便利性;最后,批数据交易方式本身,同时抬高了交易成本与门槛。毕竟这种一锤子买卖的方式将购买方置于信息不对称的一端,在获取到数据之前通常很难准确判断其真实价值,就如同购买玉石原石一样,在切开前仅能凭经验与运气判断其成色,无疑大幅提高了交易因为信息不对称导致的交易成本。

而数据API接口的产生,赋予了数据交易与流通犹如“拧水龙头”一样的使用方式,相对完美地解决了上述数据交易与流通中“挑数据”、“开箱即用”以及降低交易成本与门槛三个关键问题。了解IT技术的人都清楚API(Application Program interface,应用程序接口)是关于两个不同主体(如数据供需双方)程序间“交流”和“交换”数据方式的规范,通过API规范能实现主体之间数据的精确交换。如一个典型的“三元验真”数据API是这样的:

业务场景:帮助金融机构核实申请人的身份准确性,具体而言金融机构拥有申请人的姓名、身份证以及手机号三个元素,希望有途径核实三者是能对应上的,从而防范虚假身份申请。

数据源:运营商的实名制数据恰好能匹配这个需求。

数据API形态:金融机构向运营商传输一组申请人的姓名、身份证以及手机号,API返回是否匹配的结果。

这种犹如“拧水龙头”的数据使用方式,对于需求方来说可谓完美地解决了 “挑数据”的需求,并赋予了需求方直接挑数据项的精度;同时也是一项“开箱即用”的数据服务,相信这点无须论述,需求方唯一需要做的仅是部署简单的本地程序;而最为有意义的是,数据API大大降低了数据交易的成本和门槛,对激活交易市场非常有帮助,因为一方面数据API是按需消费,无需购买全量数据,同时很大程度地减少数据质量的争议。如果需求方查询了几个数据发现都不可靠,那就自然不会继续使用了。这不仅有利于减少需求方对数据质量的疑虑,同时倒逼供给方做好数据质量。