如何谨慎使用“数据驱动”的风控模型?-财经视野-热点资讯-野望文存 财经 
    欢迎来到野望文存 财经!
当前位置:野望文存 财经 > 热点资讯 > 财经视野 >  如何谨慎使用“数据驱动”的风控模型?

如何谨慎使用“数据驱动”的风控模型?

发表时间:2020-07-31 10:14:00  来源:野望文存  浏览:次   【】【】【




现金贷中的风险模型浅谈 番外篇(五)

如何谨慎使用“数据驱动”的风控模型?




什么是“数据驱动”的风控模型


首先说主语风控模型,这里的风控模型如果广义的说,应该的意思就是我们金融机构风控方法或风控策略;从狭义来说应指的是在风控策略中使用的信用评分模型。从影响范围来讲,前一种风控模型对于信贷业务的影响应该是远大于信用评分模型的。


再来说“数据驱动”,相对于“数据驱动”,应该就是叫做“业务驱动”或“信贷逻辑驱动”,他们的区别就是“数据驱动”往往关注的是“相关关系”,但“业务驱动”更多关心的是“因果关系”。在信贷业务中,能够广泛被大家认可的“因果关系”主要有:


  • 通过收入评估推断偿债能力,能力越高风险越小;

  • 通过负债来判断,负债越低风险越高;

  • 通过历史的信贷记录来判断,记录越好风险越小;

  • 通过借款用途来判断,用途越明确风险越低;

  • 抵押物的价值越高风险越低。


当然还有很多其他的因果关系,这里不一一列举,相信大家也都能看出,这些朴素的金融逻辑与潜在风险之间是存在着很强的因果关系,因此在绝大多数传统的金融机构,都是通过对此类信息的判断来推断借款人的风险。这些规则是被千百年来人类社会的实践所验证过的,也许只要资本主义存在一天,这些规则对于信贷的判断就永不会过时,而只要严格的按照类似的规则来对借款人进行审核,借款人的风险一定会在一个可控的范围内。但这些信息对于在很多互联网实时的场景中获取难度大,成本高。


近年来随着大数据、人工智能等技术被神化,以及数据获取成本,难易程度等多方面的原因,“相关关系“逐渐被应用到信贷审查的流程中,通常”相关关系“指的是那种通过数据分析发现的某些与风险相关的指标,但难于被业务或金融逻辑所解释的关系。这个可能就是我们题目中的”数据驱动了。但由于此类关系,受限于数据量、经济环境等因素,在实际业务中的稳定性,比较难保证或者需要严密的监控。但由于信贷业务获取还款数据的滞后性,通常还需要一些基于业务逻辑的预判才能更好的运用这些相关关系。


从我刚刚的描述,大家应该可以看出“因果关系”和“相关关系”其实各有优缺点,一个稳,一个准,本来他们的结合可以更好的促进业务的发展,同时对于相关关系的深入研究,来发现其中的因果关系,可以更好的促进我们对于借款人行为的理解,将其转化为“因果关系”,这是王道;但近些年来,个别人或企业,也许处于无知,也许出于各种各样的目的,过分强化了“相关关系”在信贷业务中的作用,蒙蔽了很多吃瓜群众。作为一个有操守的从业人员,虽然一直在大声疾呼,怎可奈人微言轻。


如何谨慎使用“数据驱动”的风控模型


从大的思路上来讲,应该正确的掌握好因果关系和相关关系的平衡,用因果关系严守金融业务底线,用相关关系更好的指导和促进因果关系的认知和运用。


从具体的措施上来说,个人浅见,要做好一下几点。



建立完善的风控模型管理制度




不管是广义的还是狭义的风控模型,一般会经历几个阶段才能进入真正的业务流程:


模型研发。通过数据分析,调查走访,案例分析等发现具体风控模型或规则。

模型验证。通过历史数据或业务经验,对模型进行各种维度的校验,这里不仅仅包括哪些很多人都不知道到底是什么东西的KS、AUC等,也报过对模型的解释和业务逻辑验证。

模型评审。在模型经过充分的验证之后,最好由各相关部门人员(一般是负责人)组成的类似风险委员会对模型进行全方面的评审,俗话说的好,兼听则明,偏信则暗,当大家从不同的角度对模型进行评估时,往往能对模型的潜在风险有充分的认知,我们不怕风险,我们只怕无知。

模型部署。如果是系统审批,则需要将模型的逻辑转化为计算机代码,以支持实际的业务。

模型校验。模型的校验主要是为了能够保证在系统中运行的逻辑与模型设计逻辑是一致的,避免由于数据源、软件逻辑、沟通偏差等原因造成模型没有被正确部署。

模型应用监测。当模型在实际业务中运行时,对模型进行严密的监控,以及时发现问题,修正模型。


在实际业务中,以上的每个流程都会对模型的正确应用产生很重要的影响,但实际上,貌似上面的很多步骤会被之间简化成模型研发和模型部署两部,这其实就不仅仅是“不谨慎”了,而是“草率”了。



建立完善的风控模型档案制度



其实档案制度是管理制度中很重要的一部分,在我刚刚毕业的时候,有一次领导找我谈话,问我最近有什么心得体会,我说我觉得写文档这事很烦,回头想想当时还真是 “too young, sometime naive!”。模型文档的完整和流程的可追溯,是业务持续运行,降低风险的重要保证,很多时候对于格式和美观的过分追求倒不是特别必要,但该有的还是要有啊。



对于数理模型的解释



逻辑回归及评分卡模型的解释性自不必说,大家通常的认知是包括各种集成树算法(GBDT,XGboost,LightGBM等)在内的算法是一个黑盒,那么运用这些方法是不是就是“不谨慎”呢?毕竟用一个你看不见或看不懂的东西总是很大的风险。


但其实不是这样的,正如我们看不见风,但我们通过树叶的摆动来判断风的存在;我们看不见电,但我们却可以测量电压和电流;我们无法证明广义相对论,但却可以通过探测引力波来验证广义相对论。


虽然机器学习算法的显示表达式表面上看起来已经负责的超出了人类所能认知范围,但是通过蒙特卡洛模拟等一些数学手段,我们还是可以评估或是解构这些模型中X和Y的关联关系的。具体方案由于技术性过强,这里不做赘述。


总之呢,把上面说的都做到了,那应该就是“不能谨慎更多“了吧


小结


业务肯定是好业务,但大家还是要以马克思列宁主义、毛泽东思想、邓小平理论、三个代表重要思想、科学发展观、新时代中国特色社会主义思想为指导,并且符合各项法律规定,合规经营哦。





责任编辑:廖金声