银行与互联网金融,所讲的大数据是一回事吗?

昨天的文章《大数据在金融业中的应用》发布之后,便有朋友留言问,“银行的大数据和互金的大数据应用有没有什么不同?”的确,说到金融大数据,我们会发现有两类机构都在提,当互联网金融企业都把大数据挂在嘴边、当大数据风控成为新金融的代表性模式时,被称作“传统金融机构”的银行业也坐不住了,站出来讲,银行业才是典型的大数据企业,银行内部有大量的数据,既有结构性数据,也有非结构性数据,只是没有把这个数据富矿更好地利用罢了。

所以,问题就来了。银行与互金,所讲的大数据是一回事吗?二者究竟有何区别呢?下面分享我的观点,未尽事宜,欢迎大家留言(订阅号:洪言微语)讨论。

差异始于自有数据的不同

对于任何一类机构而言,其数据的构成都是自有数据+外部数据,外部数据则包括既公开数据,也包括第三方购买数据和其他渠道获得的数据,如下图所示。照理来讲,外部数据的获取是可以做到大致相似的,自有数据便构成了金融机构数据差异化的基础。

微信图片_20170516101022

先来看看银行业

本质上,整个银行业的一切活动和产品都是与数据有关的,甚至说银行的所有产品都是数据也不为过,比如说你的存款、你的贷款、你的理财产品等,实际上就是在银行系统内记录的一组数据而已。正是由于银行产品和业务的天然数据属性,所以银行业在产生数据和应用数据方面一直走在各行各业的前列。据悉,计算机由军用转为民用时,率先利用计算机技术来提升行业管理能力和发展能力的就是银行业。

银行的自有数据主要是各种业务数据,是对全行客户业务活动过程和结果的记录。同时,为了更好地开展业务,还会要求用户提供诸如电话、职业、教育、住址等信息,如果有过贷款申请行为,还会包括收入、房产等强信用属性数据。此外,所有人的工资都是银行代发,公积金流水也在银行,房贷和车贷也都在银行,银行在业务过程中还产生了大量的文档、资讯、图片、音像等非结构化数据。

换个角度来看,银行账户是经济社会所有活动的起点和重点,所有人的财富状况和变动情况都会在银行留有痕迹,所以,要判断一个人有钱没钱,找银行就对了。为何保险产品、基金产品都喜欢交给银行来销售,一方面是银行有着庞大的线下渠道,更重要的在于,银行知道哪些用户有钱,从而进行更好的产品匹配销售。

本质上讲,若能精准地判断一个人有钱没钱、有多少钱,无论是进行精准营销还是风险防控,基本也不太需要太多的其他数据了。但问题在于,银行业的数据是割裂的,除了信贷类的关键信息会以征信的形式报送央行征信中心,实现一定程度上的共享外,其他的各类财富相关数据,都分别沉淀在各家银行。比如张三,在中国银行有1000块存款,在建设银行有20万块存款,在工商银行没有存款,那么,在建行看来,这是个有钱人;在中行看来,这是个再普通不过的用户,在工行看来,这个人的财富状况无法判断。

再来看看互金平台

如果是创业型互金平台,其自有数据也主要是各类业务数据,这点与银行相似,不过数据量要少得多,受单一的业务模式制约,数据维度也很单一,单靠其自有数据,是几乎谈不上什么大数据应用的。而几大互金巨头就不同了,比如BAT,其本身就是互联网时代的数据黑洞,沉淀了巨量的用户数据,当其转型做金融时,之前积累的电商数据、社交数据、行为数据等便成为其可用的自有数据。当然,互金巨头对用户财富数据的掌握程度远远比不上银行,不过好在银行最有价值的金融数据——信贷数据已经在征信中心实现了共享。

金融数据的日月星辰之光

数据的多少或优劣,只能通过其对业务的促进作用来进行比较,我们以信贷业务为例进行分析。不考虑房产抵押、存款质押、理财质押等抵质押类贷款产品,从纯信用类的消费贷款产品来看,排除欺诈风险的因素,大数据风控要解决的是核心问题是:一个人的还款意愿、还款能力、还款稳定性等因素。判断这些因素,这个人的信贷行为数据、历史借款数据、历史违约信息等征信类信息是最有效的数据,我们可以从FICO分的构成进行验证。