数据交易史话:隐私、定价、交易与策略初探

(作者 亚信数据 胡嘉琪)当今肆虐中东多国的ISIS将“伊斯兰恐惧症”带到了全世界。但在这块土地上,一千多年前存在过一个强大的阿拉伯帝国,帝国甚至把版图延伸到了整个印度西北部,哈里发的军队从印度人处发现了一种先进的数学符号体系,后来这个体系随着帝国的铁骑和商队被扩散到了整个亚欧大陆,并催生了后来欧洲先进的数学体系,这一奠定了近代工业与航海基础的瑰宝,当然这个数学符号体系就是现在大家熟知的阿拉伯数字。

时光回到70年前,二战在摧残人类文明的同时,也间接推动着科技以数倍于和平时代的速度前进。战后计算机很快就出现了,使得过往一直困扰着人类的信息存储与计算问题得到完善的解决。数据逐渐成为了治理所有产业的核心基础之一,数据科学以不可思议的方式改变了工业界和日常生活。

以上是两个有着极端跳跃性、并永远改变人类命运的“奇点”,而随着当前人类总数据正在经历着指数式的爆发,也许在不久的将来,我们将会见证数据史上的第三个“奇点”。

但是如今,指数爆发的数据实际上并没有汇聚为一片蓝海,而是以碎片割裂的方式分散在不同地方。“一盘散沙”的数据难以获得最大的价值,只有让数据流动起来,保证数据能被具有相应“炼数成金”禀赋的人加以利用,才能催生不可估量的价值。

在这个背景下,数据交易成为了如今炙手可热的话题,但又由于数据本身的特征,世界上也许没有第二种商品的交易会像数据交易那样需要具备想象力和创造性。本文取名数据交易史话其实不太恰当,因为数据交易是一条艰难的道路,而且没有太多的历史经验可借鉴,本文希望以不太长的篇幅,将数据交易这个课题做系统性的剖析,同时竭力探讨数据交易中的个人隐私保护、数据定价、交易成本降低、数据交易市场、保障数据不被二次出售等有趣的关键点。

作为开篇,本文首先会介绍数据交易的本质特征,了解这些特征就能够感受数据交易究竟难在什么地方。

第一部分 数据交易的4个本质特征

数据的本质,是蕴含在数据背后的信息和知识,与普通商品流通有着完全不一样的特征,对于数据交易这个崭新的事物,采取传统的贴价格标签出售的方式,是无法将数据交易的蛋糕做大的,因此我们需要首先深入探索,数据交易本身的固有特征。

首先,数据是一种无形、能反复交易的物品。数据的交易,与传统商品流通或者互联网的流量交易与变现的最大区别就是数据的可反复交易性。一项商品卖给了A客户以后,就不能同时卖给B,但数据从理论上说是可以同时卖给N个不同的买家,因为数据出售的边际成本接近零,在这个特征上,与数据非常类似的有数字内容。数字内容包括了软件技术、游戏、电影、唱片等拥有明确版权的无形商品,他们的共有特征同样都是内容制作需要大量的成本,但后续销售的边际成本接近零。

作为一个有趣的类比,我们不妨看看苹果iTunes里面,所有者是如何为自己的数字内容定价的。在定价理论里,供应量无限的商品,其最优定价是客户群的平均客户感知价值(CPV,即买家内心感知该商品的实际价值,相当于买家意愿中的最高出价)。下图是iTunes中一款专业图形比对软件Kaleidoscope 2在历史不同价格(横坐标,美元)的总体收益分布图,通过反复调价,Kaleidoscope 2找到了价格位于60.60美元与65.28美元之间、能达到利润的最大化的定价最优点。

写到这里可能有人会说,数字内容里面,不是有大量的应用采取免费策略的吗?如果数据同样采取免费策略,最终建立一个全人类的共享大数据云,并免费为所有人开放,那岂不是成为造福一方的千古功绩?的确在应用里免费使用、后向变现已经成为了最重要的一种业态,原因在于免费应用通过会员制、流量变现等方式能构筑严密的商业模式闭环。而数据则带有准生产资源性质,只要能合理分发到特定的需求方,数据很容易就能转变为价值。而对于一个商业模式最为关键的一点,就是能创造显著与持续的收益,数据免费大规模共享并不是长期上总体收益最大化的模式。免费的数据共享,就如央行为每个老百姓发一张1000万的“均富卡”,并希望能长期刺激国家内需一样滑稽。