解码大数据征信:大数据征信的“是与非”

最终仅剩两三家?

但值得注意的是,与其它很多行业不同,征信市场的“容量”却十分有限。

对比美国,1960年代末美国的征信公司曾一度多达2200家,但随着行业不断发展和整合,如今已减少到400家左右。其中,艾可飞(Equifax)、益百利(Experian)和全联(Trans Union)三大巨头便占到了90%的市场份额。

芝麻信用曾在内部提到,当下大数据征信还处于第一阶段,即个人征信机构跑马圈地、百花齐放;而到了第二阶段,征信行业或出现大规模并购,最大的两三家公司将占据市场60%以上份额或者更多,其他几家共享细分市场。

这个预判基本已经成为行业共识。

顾凌云认为,中国的征信市场在三到五年之内不会一统天下,原因是因为到目前为止中国征信市场还处在第一步,也就是数据源整合这一步。但是在今后四五年之后应该会有两到三家成为最终的赢家。

许凌认为,大数据征信需要前期投入巨大的人力、物力,不仅周期长且回报慢。尤其是个人征信这部分,对于数据、资金、技术,以及场景都有很高的要求,最终只会有两三家主导市场。

眼下国内的个人征信市场刚刚放开,还处于群雄逐鹿的阶段。尽管首批仅有八家机构申请牌照,但在业内人士看来,相比牌照,数据和技术才是个人征信领域更为关键的门槛。

平安证券在一份报告中称,根据征信行业的产业链,个人征信公司经营成功的关键在于:数据来源的范围和准确性、数据处理能力、数据产品是否能够满足客户要求、是否具有多样性。

目前来看,除了获得牌照的机构之外,掌握信息搜索和网页浏览数据的百度、整合了电商、金融、生活服务数据的京东、积累了九年数据的互联网金融机构宜信、以及正在积极布局中国大数据征信市场的FICO都是有力的竞争者。

二. 解码大数据征信:大数据征信的“是与非”

1463494341-7099-20160515143348-2297

传统信用评估模型是根据一个人的借贷历史和还款表现,通过逻辑回归的方式来判断这个人的信用情况。而大数据征信的数据源则十分广泛,包括电子商务、社交网络和搜索行为等都产生了大量的数据。

大数据征信可以通过我们在互联网上留下的这些“足迹”清晰地描绘出一个人,但如何把控数据源的“量”与“度”,各家机构还在不断尝试。更重要的是,最终绘制出的人物“肖像”与个人信用究竟有多大的关联度,至今仍存有争议。

此前亦有接近监管部门人士对《第一财经日报》记者表示,个人征信牌照迟迟未能落地,其原因之一也在于监管部门对于大数据征信的商业化应用存有疑虑。尤其,以人脸识别为代表的关键技术的可靠性还有待进一步检验。

何为大数据征信?

在FICO中国区总裁陈建看来,征信的本质就是采集和记录信用信息并在整理加工后提供给决策者,而如今,得益于大数据、云计算、人脸识别、深度算法等技术的进步,征信有了更广泛的意义和用途。

“只要对消费者的特征描绘和风险判断有显著作用的就可以叫征信。”陈建认为, 现在一切信息皆可以成为信用数据,经过分析后用于证明一个人或企业的信用状况。因为数据覆盖广、维度多,因此形成了广义的征信,也就是大数据征信。

陈建表示,有价值的大数据具备几个因素:第一要覆盖面广,用户足够多,例如银联、电信的数据;第二维度要有效,能够有效转为结构化的数据,例如电商的数据;第三信息要稳定。

不过,对于这种日益崛起的征信新业态,今年7月在上海外滩举办的“2015上海新金融年会”上,央行征信中心副主任王晓蕾直截了当地提出了疑问,“我不知道你们说的‘征信’是什么”?

央行的征信系统是一个“放贷人之间的信息共享数据库”,主要采集的数据位身份信息、信贷信息、非金融负债信息三类,以及部分公共信息。因此,王晓蕾对于征信的基本定义为,“从放贷人那里采集借款人信息”。

而另一个“纠结”的概念在于,王晓蕾认为,放贷机构之“征信”是放贷机构基于内部信息的风险管理过程,而征信行业之“征信”是为放贷机构的风险管理提供外部信息支持的活动,征信机构应该是一个纯粹的独立第三方。