AI应用在金融领域,究竟是“黑科技”般的存在,还是技术宅的狂欢呢?

另外在我们的实践应用过程中,我们发现在突破单个风险点来临的时候,整个网络会出现一些局部风险,并形成连接,比如说形成一些三角或者四角的关系等。从长远的时间上看,这样的关系可能未必不正常,但是一定时间内,你的申请人形成了非常紧密的联系,这件事情是值得注意的。     

除了个人局部的风险特征以外,还有全局的。我们用到了一些优化后的算法,每一个人在整个网络中,都会出现一些高的风险点,对和他有社交关系的人也会存在辐射效应。对于个人来说,可能在一度二度三度关系上,会和一个或是几个坏人有一些联系,现在社交比较发达,如果出现大片这样子的人,可以通过辐射算法捕捉到这样的信号。     

另外在网络这块,很重要的一点就是整个系统的回转和流程优化。因为网络欺诈有一个特性,对于实时性甄别以及实时修改性上限要求特别高,同时我们学习的目标,不是一个纯事实,很多都是学习专家认定为欺诈的经验,这样的结果对本身的优化是很有价值的,从整个产品来看,形成了数据加工、数据计算和反馈的闭环。  

  我们也有专家的界面,网络捕捉风险之后,我们的专家都可以看到。    

 下面分享一下我们氪信在特征加工上的实践。可能了解AI的人特别清楚,我们最后做模型结果的时候,如果是优秀的话,这个优秀的绝大部分来自于我们非常辛苦的加工过程。    

 我们会看到个人的加工方法,很多时候会有一些不局限性,比如说文本的特征,通过一些方法或者通过不同时间维度的方法,可以描绘出几百个维度的特征,但是不可能达到完备的状态,我们确实需要借助技术本身的能力达到提升。    

 氪信在小额信用贷的场景里面,尝试用深度学习像循环神经网络处理时序的数据一样处理文本,效果还是非常不错的,我们整个的特征过程是包含了

专家的部分以及深度学习自动生成的特征共同传递给模型,并且进行了最终的预测和识别。     这边举一个具体的例子,刚才我提到时序的特征。比如我在不同的时间窗口,是不是要穷尽所有的特征?有可能我们花费了大量的时间,只可以覆盖80%的部分,但是我们用循环神经网络利用长短时记忆的特征,可以捕捉数据在不同窗口趋势类、统计类等不同的特征,从而衍生出来上万种特征,最后我们把这些交给模型,让它来识别哪些是有效的。  

  建模部分。我们曾做过很多相关的实践,像浅层的偏现金的模式,有它的优势,比较稳定,人也好理解。也尝试过中间阶段端到端的深度学习的方法,通过反神经网络的方法捕捉之间的关联。    

 最后通过实践结果,我们认为集成模型在金融风控场景里,是一个判断好坏既稳定又有效的手段。集成模型的思想是用不同的子分类器,处理不同的数据。我会选择最好的分类器处理面临的数据,在上面去做一个集成,优势就出来了,就是好而不同,说的直白一点就是三个臭皮匠顶个诸葛亮。从模型性能来看,集成方法无论是拟合能力、模型的预测能力,以及换一个场景它的稳定能力都是非常好的。同时,集成模型在各个场景里也可以实现迁移。现在在氪信的产品体系里面,也融合了这个方法。  

  在信用贷场景里面,我们和传统模型相比性能提升了1倍,稳定在KS值0.3以上,坏账率直接下降46%。这使得我们很兴奋,是技术给业务直接带来了效果。    

 氪信要做的就是把AI技术加到金融风控里面,而这个领域里面还是有很多事情可以做的。我们在实践的过程中,同时把方法形成一套产品体系,帮助金融机构解决问题。我们氪信有相应的云数据的服务,有机器学习建模平台,有在线风控引擎,可以帮助完成企业互联网+的升级。     数据核心是我们沉淀的这条金融图谱的知识体系,从原始的需要用什么数据,到加工挖掘数据,再到上层怎么连接管理它,形成精准完备的画像。  

  另外在系统的整个过程和AI的运营中,从设备接入到数据的加工处理,到得出结果等等,整个都是自动化的过程。现在现金贷的量非常大,解放人力已经成为重要需求,因此我们确确实实需要这样一套数据智能一体化的产品。