凭安征信杨茂江:大数据环境下征信相关问题探究

第五,我发起这个数据是全程密文的,作为中间的接口人我也获取不了数据真正的内容。整个数据设计了一套机制,他的质量是可以跟踪追诉的。最后是整个体系完全透明,没必要藏掖着,刚才的用户协议不存在这个问题,我到哪儿采集了就是不告诉你,这里我们很清楚,我告诉你,谁有你的数据,真正保护了用户的知情权。刚才讲的这两个问题是凭安在过去这段时间里结合整个大数据的信息,特别是征信行业领域的应用,征信大家都认可是大数据应用里非常典型的应用,但是有两个核心问题,数据的存储和用户个人隐私的保护,如果这两点解决不好,整个行业有很大的坑在前面等着。我们做了小小的尝试和思考,具体实现,他是用块链的方式做,我们申请了一些专利,通过思考,我们建议数据采集的标准,韩博士做的是行业标准。第二是信息共享的机制,专利不是壁垒,专利主要是担心行业外的人如果申请可能对大家不利,所以我们把所有的方法,我们愿意跟业内完全免费开放。这是我们在这两个点上的思考跟大家分享一下。后面还有一点小的分享和工作。

凭安征信是取得了企业征信的资质,我主要讲一下在企业征信分析的案例,讲讲大数据征信怎么做的,这是一个典型的案例,是我们和360一起合作的,国家发改委下达的一个任务,希望我们对双十一当天全网的电商交易的信用状况进行监测,我们监测了1.27亿件商品,阿里一说几千亿,几万亿,我们也关心到底是多少,所以我们就干了,我们监测了1.27亿商品,我们也想知道双十一当天有多少商品成交,双十一当天有3470万件商品有交易,其中90万件商品销量比前一天翻了一倍,双十一当天是九百多亿,那么多亿只有90万件商品是畅销的。我们还进行了分类,每个商品分在什么类目上,类别的分布情况和占比是多少,双十一当天还是3C产品占总销量最大。用户的分布这些都比较平常,我们这个报告有一个特点,我们基本上采样量是目前所有的各式各样的报告里最大的,我们可能采集了全网至少40%的用户得出的结论,有些做市场分析的号称有15万客户端采集的用户数据,这个东西信则有,我们至少采集了全网40%得到了这个数据。发改委给我们的课题是双十一网络交易信用监测,什么叫信用,说一不二叫信用,双十一当天买的东西到底便宜不便宜,这是一个很有意思的话题。

畅销商品里双十一当天往前推两个月,当天的价格并不是最低价格比例占到75%。在两个月内提价占比86%,先提起来再降下去,这一周占4.5%11月4号的一周占了7%,还有提价的幅度大于200%,降了2.6%。这是双十一涨价的32%,这个报告网上有,是发改委发布的。

信用还关系到政府的一些监管,我们通过对用户商品的分析页面的内容,我们发现这个叫虚假宣传大家多少,违禁词多少等等。凭安征信在大数据征信方面,有一些独立的思考,我们把这些思考在这里跟大家分享,目的是我们一起来思考这个行业怎么能够一步一步更加稳健,让这个行业更加蒸蒸日上,谢谢大家。