芝麻开门 大数据征信体系揭秘

1月28日,蚂蚁金融服务集团(下称“蚂蚁金服”)旗下的芝麻信用首次测试个人征信系统,这也是1月5日央行发布允许8家机构进行个人征信业务准备工作通知后,首家推出该系统的公司。据21世纪经济报道记者了解,在1月5日央行发布通知后,蚂蚁金服便迅速注册公司,组建团队。其骨干成员大部分为数据科学 家,同时开始大规模招聘相关人员。芝麻信用总经理则从招商银行“挖”来胡滔担任。据悉,这8家机构目前均处于准备阶段,既无行政许可,也无牌照。按照通知 要求,准备期为6个月。

芝麻信用采取和支付宝钱包合作的方式,用户在支付宝钱包8.5版本“财富”栏中可看到这一功能。但目前只有参与测试的用户才能看到信用分数。相比传统意义上的央行征信报告,芝麻信用采用的形式更加简单——信用分。芝麻信用分最低350分、最高950分,分数越高代表信用程度越好,违约可能性越低。

芝麻信用测试版推出意味着市场化的个人征信在中国正式起步,未来越来越多的机构将为每个人建立起一套信用档案,它将成为每个用户的一张名片。

但就目前而言,无论对于用户,还是征信机构,都将面临一个长期的认知和构建过程。如何采集个人信息、如何形成信用分数、如何使用个人信用、个人信用对用户意味着什么等都是一个全新的挑战。

构建信用维度

芝麻信用背靠阿里巴巴,而阿里巴巴目前覆盖数亿计互联网用户,仅支付宝就拥有超过3亿用户。同时,芝麻信用拥有阿里的电商交易数据和蚂蚁金服的互联网金融数据,比纯粹的网络社交数据含金量更高,这也成为芝麻信用进入征信行业的一大独特优势。

传统的金融机构征信多采用借贷领域的数据,并且覆盖人群有限。据之前的一份统计数据显示,截止到2013年底,央行银行个人征信系统中收录有信贷记录的自然人约3.2亿,还不到总人口数的1/4,而在美国征信体系的覆盖率已经达到了85%。

“在信用领域我们更多是央行征信的补充。”蚂蚁金服信用业务拓展负责人邓一鸣曾在一次小范围沟通会上表示。这也意味着,市场化、互联网化的个人征信将大大拓展覆盖人群范围和增加个人信用评判维度。

但在实践中,如何构建一个如此庞大而又重要的体系,在国内目前并未有成熟的案例参考。阿里巴巴虽然有如此庞大的数据,形成产品仍将是一件系统性的工程。

首先是维度,蚂蚁金服公关部张道生接受21世纪经济报道记者采访时表示,芝麻信用分这一看似简单的分数,背后是芝麻信用对海量信息数据的综合处理和评估,芝麻信用建立个人信用维度方面也参照了美国著名的征信机构FICO。

蚂蚁金服首席信用数据科学家俞吴杰介绍了国外的一些经验,归纳起来可分为,一、基本信息,包括职业、收入、工作稳定性、街区、放假及居住稳定性;二、借贷信息,包括车贷、房贷、信用卡和学生贷等;三、消费信息,商场和网络消费频次、额度等;四、公共信息。法院判决、税务拖欠、地铁逃票、交通违章、亲友欠款等。这也就意味着,个人信用当中涵盖了每个人生活工作中的各个方面。他还举例称,用户的公益行为也会影响到个人信用。

据了解,在此基础上,芝麻信用则采用了五大维度:用户信用历史、行为偏好、履约能力、身份特质、人脉关系,分别对应过往信用账户还款记录及信用账户历史;在购物、缴费、转账、理财等活动中的偏好及稳定性;享用各类信用服务并确保及时履约;在使用相关服务过程中留下的足够丰富和可靠的个人基本信息;好友的身份特征以及跟好友互动程度。

数据来源和计算

阿里巴巴拥有淘宝、天猫、聚划算等电商平台以及蚂蚁金服的互联网金融平台,同时业务开始深入水电煤缴费、打车、医疗等领域,本身已积累了大量的数据。

张道生表示,和传统征信数据主要来源于借贷领域有所不同,脱胎于互联网的芝麻信用数据来源更广、种类更丰富,时效性也更强,涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、住址搬迁历史、社交关系等方方面面。

互联网产生的数据最大的特征是实时,留有痕迹,容易追踪,相对于传统线下的采集和整合更加全面和准确。