随着互联网金融的发展,对数据分析的需求越来越大。数据分析的目的其实是为了找到风险和收益的平衡点。高收益伴随着高风险,而低风险的回报又如同鸡肋。所以,太高的风险,太低的收益都不行。平衡点通俗来讲就是风险在控制范围之中,收益也可以接受。为了找到平衡点,我们通常会计算许多风控指标,这些风控指标是什么意思,他们有什么作用,我们挑几个金融领域比较常用的指标说说。

信贷风险管理是一门艺术,更是一门科学。资产质量分析中常会涉及到三个理论:

  • 账龄分析(Vintage Analysis):用以分析账户成熟期、变化规律等。
  • 滚动率分析(Roll Rate Analysis):用以定义账户好坏程度。
  • 迁移率分析(Flow Rate Analysis):用以分析不同逾期状态之间的转化率。

Part 1. 基础风控指标概念

为了更容易理解后续内容,我们先介绍一些基础的风控指标概念。
定义一:账龄(Month on Book,MOB)
资产放款月份。类似于婴孩一出生就有了年龄,一旦申贷订单被放款,也便拥有了账龄和生命周期。

  • MOB0:放款日至当月月底
  • MOB1:放款后第二个完整的月份
  • MOB2:放款后第三个完整的月份

MOB的最大值取决于信贷产品期限。如果是12期产品,那么该资产的生命周期是12期,MOB最大到MOB12。
例如,2019年11月13日放款的订单,2019年11月是MOB0,2019年12月是MOB1,以此类推。
定义二:逾期天数(Days Past Due,DPD)
逾期天数 = 实际还款日 - 应还款日。
DPDN+表示逾期天数 >= N天,如DPD30+表逾期天数 >=30天的资产
例如,若还款日是每月8号,那么9号就是逾期第一天。如果客户在10号还款,那么逾期2天。
定义三:逾期期数(M)
实际还款日与应还款日之间的逾期天数,并按区间划分后的逾期状态。M取自Month on Book的第一个单词。(注:不同机构所定义的区间划分可能存在差异)

  • M0:当前未逾期(或用C表示,取自Current)
  • M1: 逾期1-30日
  • M2:逾期31-60日
  • M3:逾期61-90日
  • M4:逾期91-120日
  • M5:逾期121-150日
  • M6:逾期151-180日
  • M7:逾期180日以上。此时也被称为呆账(Bad Debts),会予以注销账户(write-off)


Part 2. Vintage Analysis

Vintage一词最初来源于葡萄酒业 。由于每年采摘的葡萄会受到日照、气温、降水等因素的影响,最终酿造的葡萄酒品质会存在差异。在窖藏一定年份后,葡萄酒的品质将趋于稳定,也就是品质成熟,这段年份数被称为成熟期(maturity)。
简便起见,我们以酒精浓度作为衡量葡萄酒品质的标准,约定:浓度越高,品质越好。首先,记录入窖年份作为该批次葡萄酒的标签,这也被称为Vintage或者Cohort。之后,我们将每年定期抽样测量酒精浓度,保存记录数据,如图1所示。

经过几年的数据积累,我们就可以绘制出酒精浓度随时间变化的Vintage曲线。俗话说,酒越酿越醇,Vintage曲线通常是单调递增的,如图1所示。

image.png
我们可以利用Vintage曲线做什么呢?如图2所示,主要用途包括:

  1. 分析变化规律:评估不同年份的葡萄酒的品质随着窖藏时间推移的变化规律。某些年份的葡萄酒浓度在入窖第1年就能达到较高的水平,但上升缓慢;有些起点低,但上升快 。
  2. 确定最终品质:Vintage曲线最终稳定值,表明了这批葡萄酒的最终酒精浓度 。
  3. 确定成熟期:由图1可知,在入窖第6年后,酒精浓度稳定不变,可以确定成熟期是6年,我们最早在第6年就可以开桶品尝 。
  4. 分析影响因素:根据Vintage曲线特征,我们可以分析某个年份的葡萄所受到的环境影响因素,从而改善生产工艺。比如,由于某一年的光照不充分,糖分积累少,酒精浓度可能最终就比较低。我们就可以人工增加光照强度 。

在信贷领域中,我们也可以用Vintage曲线分析资产(portfolio)质量的成熟过程变化规律。为更容易理解,在此列举了Vintage分析过程中两个领域的对应关系,如图3所示。
image.png

首先,我们来分析为什么要确定账户的表现期?在《风控特征—时间滑窗统计特征体系》一文中,我们提到过:
表现期越长,信用风险暴露将越彻底,但意味着观察期离当前越远,用以提取样本特征的历史数据将越陈旧,建模样本和未来样本的差异也越大。反之,表现期越短,风险还未暴露完全,但好处是能用到更近的样本。
image.png
例如,对于一个12期分期还款的信贷产品,理论上当用户在12期结束,并还清所有的钱后,我们才能定义为绝对的好客户;反之,我们只能说到目前为止是一个好客户,但并不能知道未来几期用户会不会逾期不还钱。
因此,我们需要确定一个合适的表现期能覆盖足够多的坏客户即可。

image.png
举例来说,今天是2018年5月25日,我们取今天贷款第一期到期的客户作为观察群体,观察他们今后29天的还款情况。如果你将将今天所有贷款到期的客户作为观察群体(里面有第一期到期的,也有第二期到期的,也有第三期到期的,等等),那么这个群体里面的客户就不是位于同一层面上了。

  1. 到了下个月,625号,我们取625号贷款第一期到期的客户作为观察群体,观察他们之后29天的还款情况。这样你就可以比较525号的群体和625号的群体的还款情况差异。如果625号的群体还款质量有显著性降低(如下图),那么你可能会审视一下你这一个月来的营销策略是否变宽松了,或者这一个月来国家政策有什么改动等等。<br />根据图5的信贷产品Vintage曲线,我们可以得到哪些信息呢?
  1. 账龄最长为12个月,代表产品期限为12期。随着12期结束,账户的生命周期走到尽头。
  2. 账龄MOB1、MOB2、MOB3的逾期率都为0,说明逾期指标为M4+(逾期超过90天)风险。
  3. 由放贷月份从2018年1月~12月的账户的最终逾期率都在降低,说明资产质量在不断提升,可能是因为风控水平在不断提升。
  4. 2018年5月相对于2018年1~4月的逾期率大幅度下降,说明该阶段风控策略提升明显。
  5. 不同月份放款的M4+在经过9个MOB后开始趋于稳定,说明账户成熟期是9个月

绘制Vintage曲线时,就不得不提到纵坐标中逾期率的定义。通常有两种计算口径:

  • 第一种,订单口径,逾期率 = 逾期订单数 / 总放贷订单数
  • 第二种,金额口径,逾期率 = 逾期剩余本金 / 总放贷本金

目前互联网金融各家机构的口径定义存在差异,因此仅仅根据各家发布的Vintage曲线,有时并不能客观分析资产质量和风控水平。
计算逻辑详见:《求是汪在路上:Vintage分析表计算过程详解

Part 3. Roll Rate Analysis

滚动率分析就是从某个观察点之前的一段时间(观察期)最坏的状态,向观察点之后的一段时间(表现期)最坏的状态的发展变化情况,如图6所示。
⚠️注意:一般大家也习惯把vintage中的成熟期叫做表现期,因此出现一定的混淆。但意思是都是未来的一段时间窗。
image.png
图 6 - 客户逾期状态转化
滚动率分析的具体操作步骤为:

  • step 1. 确定数据源。一般利用客户还款计划表(repayment schedule)。
  • step 2. 选择观察点,以观察点为截止时间,统计客户在观察期(如过去6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 3. 以观察点为起始时间,统计客户在表现期(如未来6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 4. 交叉统计每个格子里的客户数,如图6中表1所示。
  • step 5. 统计每个格子里的客户占比,如图6中表2所示。
  • step 6. 为了排除观察点选择时的随机影响,一般会选择多个观察点。重复step1 ~5。

例如,选择观察点为2018年6月30日,我们取10,000个客户作为研究对象,统计该10,000个客户从观察期到表现期的最大逾期状态的变化情况,如图7所示。
image.png
图 7 - 滚动率分析矩阵
观察图7,我们可以发现以下规律:

  1. 逾期状态为M0的客户,在未来6个月里,有96%会继续保持正常状态,4%会恶化为M1和M2;
  2. 逾期状态为M1的客户,未来有81%会回到正常状态,即从良率为81%,有7%会恶化,13%会保持M1状态;
  3. 逾期状态为M2的客户,从良率为23%,有39%会恶化为M3和M4+;
  4. 逾期状态为M3的客户,从良率为14.7%,有60.7%会恶化为M4+;
  5. 逾期状态为M4+的客户,从良率仅为4%,有80%会继续保持此状态。

因此,我们认为历史逾期状态为M4+的客户已经坏透了,几乎不会从良。为了让风控模型有更好的区分能力,需要将客户好坏界限尽可能清晰,可以定义:
坏用户(bad)= 逾期状态为M4+(逾期超过90天)

滚动率

前面说的Vintage可以用于分析客户表现的趋势、稳定的时间等,对于客户好坏程度的定义没有涉及,而通过滚动率分析可以对客户好坏程度进行定义。

滚动率分析就是从某个观察点之前的一段时间(称为观察期)的最坏的状态向观察点之后的一段时间(称为表现期)的最坏状态的发展变化情况,如下图。
image.png

在观察点2018年6月30日,取1万个客户,统计该1万个客户从观察期到表现期的最大逾期的变化情况,如下表。
image.png

从该表可以看出:

1、正常的客户,在未来6个月里,有96%会保持正常状态;

2、逾期1期的客户,未来有81%会回到正常状态,即从良率为81%,有7%会恶化;

3、逾期2期的客户,从良率为23%,有39%会恶化;

4、逾期3期的客户,从良率为14%,有61%会恶化;

5、逾期4期及以上的客户,从良率仅为4%,有82%会继续此状态。

在对坏客户进行定义时,应将坏客户定义得尽可能坏,以与好客户尽可能的区分开来,因此可以将逾期4期及以上的定义为坏,而逾期2期和3期定义为中度坏,逾期1期为轻度坏。当然,在开发模型或规则时,还要结合样本量,如果M1占比较高,可以将M1划为好客户,M4+为坏客户,M2和M3为灰度客户,从样本中剔除;如果M1占比很低,也可以将M1和M2、M3一起归为灰度客户,从样本中剔除。
————————————————
版权声明:本文为CSDN博主「寸草心2130」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_35531549/article/details/92830739

Part 4. 如何确定目标变量Y

在风控建模中,由于是有监督学习,我们非常关心如何定义合适的目标变量Y?这就需要结合滚动率分析和Vintage分析,两者的分工在于:

  • 滚动率分析用于定义客户的好坏程度
  • Vintage分析用于确定合适的表现期

定义目标变量Y的具体操作步骤为:

  • step 1. 利用滚动率分析定义坏客户,例如上文案例中定义:M4+为坏客户
  • step 2. 以M4+作为资产质量指标,统计Vintage数据表,绘制Vintage曲线。目的是分析账户成熟期,例如上文案例确定:账户成熟期是9个月。

你可能还是会比较疑惑,为什么还需要通过Vintage分析来确定表现期?
这是因为:虽然滚动率分析确定了M4+作为坏的程度,但是对于12期的产品,有些账户是在前4期MOB(也就是MOB1 ~ MOB4,经过4个表现期)就达到M4+,有些是在后几期才达到M4+。
对于这个Vintage里所有的账户,我们的目的是抓住尽可能多的坏客户。
现在进一步补充Vintage曲线的绘制过程:如图8所示,对于这10,000个账户,以MOB1为起点,把前N个MOB作为一个窗口,滑窗统计坏客户率,得到图5-表1中的Vintage数据,并绘制Vintage曲线。我们可以发现:经过9期,我们几乎能够抓住所有的坏客户。
image.png
图 8 - 不同客户的逾期状态(红=逾期,绿=正常)
因此,我们将两者结合起来,定义:

  • Bad = 账户经过9期表现期后,逾期状态为M4+(逾期超过90天)。此时 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图10
  • Good = 经过9期表现期,但未达到M4+逾期状态。此时 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图11
  • Intermediate = 未进入9期表现期,账户还未成熟,无法定义好坏,也就是不定样本。

    Part 5. Flow Rate Analysis

    迁移率分析法(Flow Rate)也叫做净流量滚动比例法(Net Flow Rate),能形象展示客户贷款账户在整个生命周期中的变化轨迹,也是预测未来坏账损失的最常用的方法。
    核心假设为:处于某一逾期状态(如M2)的账户,一个月后,要么从良为M0账户,要么恶化为更坏的下一个逾期状态(如M3)。
    迁移率 = 前一期逾期金额到下一期逾期金额的转化率
    一般缩写为M0-M1、M4-M5等形式,例如:

  • M0-M1 = 当月进入M1的贷款余额 / 上月末M0的贷款余额

  • M2-M3 = 当月进入M3的贷款余额 / 上月末M2的贷款余额

迁移率分析的具体操作步骤为:

  • step 1. 定义逾期状态,如前文所述的M0、M1、M2等。
  • step 2. 计算各逾期状态之间的迁移率,如M0-M1、M2-M3等。
  • step 3. 计算不同月份(也可称为Vintage)的平均迁移率。目的是对本平台在不同时期的资产的迁移率有整体的认知。
  • step 4. 根据平均迁移率和不良资产回收率,计算净坏账损失率。

接下来,我们以数值案例(非真实业务数据)展示上述过程。
image.png
图 9 - 迁移率分析
图9-表2中,2月份的逾期M1资产只能从1月份的正常M0资产滚动而来,因此从逾期M0资产向M1的转化率为 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图13
以此类推,我们可以计算所有月份的资产恶化率。黄色部分为不良资产的恶化迁移路径,其计算口径为:

  • 截止1月末,正常M0资产为 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图14 元,这是起点。
  • 截止2月末,1月末的正常M0资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图15 恶化为逾期M1资产。
  • 截止3月末,2月末的逾期M1资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图16 恶化为逾期M2资产。
  • 截止4月末,3月末的逾期M2资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图17 恶化为逾期M3资产。
  • 截止5月末,4月末的逾期M4资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图18 恶化为逾期M5资产。此时已过催收黄金期(90天以内)。
  • 截止6月末,5月末的逾期M5资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图19 恶化为逾期M6资产。这可能采用了委外催收、司法手段等催收策略,效果显著。
  • 截止7月末,6月末的逾期M5资产中有 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图20 恶化为逾期M7资产。此时将视为不良资产,打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。

通过迁移率,我们可以清晰观察到每个Vintage的资产在各逾期状态的演变规律。
图9-表2中,我们从横向比较每个月的迁移率,发现不完全一样。这是因为随着时间推移、外在宏观经济环境、内部政策等变化而产生一定的波动。我们可以利用这些数据:

  1. 观察迁移率的发展轨迹,监控坏账的发展倾向和催收效果。
  2. 通过对多个月份的迁移率计算平均值,从而使迁移率更加稳定。

    Part 6. 坏账准备金的计算

    呆帐风险是信贷机构必须面对的风险,主要来源于信用风险和欺诈风险等。为了应对未来呆帐的可能,信贷机构一般都会设定一个储备资金,这就是坏账准备金(Bad Debt Reserve)。那么我们该如何计算坏账准备金?
    一般做法是,把未清偿贷款余额乘以一定的准备金比例(Reserve Ratio)所得。可以理解,资产逾期等级越高(越差),准备金比例也应该越高,因为恶化为呆帐的可能性也更高。如图10所示,正常M0资产恶化为呆帐的可能性最低,因此我们预留的准备金比例也就最少。
    我们总结下计算坏账准备金的步骤为:
  • step 1. 统计未清偿贷款金额的分布,也就是M0~M6状态分别对应的资产余额。
  • step 2. 为每个逾期状态的资产分配一个准备金比例。
  • step 3. 每个子项目的准备金金额 = 未清偿贷款余额 x 准备金比例。
  • step 4. 每个子项目的准备金金额相加,得到最终的准备金。

image.png
图 10 - 坏账准备金计算示例
你或许会问,这里最关键的准备金比例是如何给出的?
由于坏账准备金是用来覆盖预期的未来呆帐损失的,准备金比例必须等于处于各个逾期状态的资产未来演变为呆帐的比例
回到迁移率分析中,我们发现从正常M0资产迁移至逾期M7资产(呆帐)需经过7次迁移,如图11所示。那么,我们只要把各个状态之间的转化率相乘,不就得到准备金比例了?
image.png
图 11 - 各逾期状态的迁移率和毛坏账率计算
因此,我们定义正常M0资产对应的毛坏账损失率,也就是迁移到呆帐的转化率为
毛坏账损失率 = 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图23
在本案例中,正常M0资产对应的毛坏账损失率为:
【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图24
在实际中,信贷机构会将不良资产打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。因此,我们定义净坏账损失率为:
净坏账损失率 = 毛坏账损失率 - 不良资产外卖回收率
由于M7不良资产的平均回收率为 【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图25 ,则可计算净坏账损失率为:
【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图26
同理,我们可以计算正常资产到不同逾期状态资产的毛损失率和净损失率如下:
image.png
图 12 - 毛损失率和净损失率
根据图12所示的损失率表,我们定义:

  • 当月应计拨备额 = SUM(净坏账损失率 * 月末应收账款余额)
  • 拨备率 = 当月应计拨备额 / 总资产金额

其中,拨备率是用来预防不良资产的发生而准备的金额的比例。拨备率应越低越好。拨备率越高说明风险越大,损失越大,利润越小。
image.png
图 13 - 2018年7月的资产预计期望损失计算
在本案例中,当月应计拨备额为65421元,如图13所示。拨备率为:【2】vintage、迁移率、滚动率、入催率概念深入理解 - 图29

Part 7. 总结

本文所整理的主要知识点包括:

  1. Vintage、滚动率、迁移率的概念和区别。
  2. 如何根据数据分析来确定风控建模中的好坏定义。
  3. 拨备率的概念,以及如何根据迁移率来计算拨备率。

    致谢

    感谢参考资料作者提供的数据和思路。本文是站在巨人肩膀上的学习笔记,尚有理解不当之处,欢迎指正。

    版权声明

    欢迎转载分享请在文章中注明作者和原文链接,感谢您对知识的尊重和对本文的肯定。
    原文作者:求是汪在路上(知乎ID)
    原文链接:https://zhuanlan.zhihu.com/p/81027037/
    ⚠️著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处,侵权转载将追究相关责任

[

](https://blog.csdn.net/weixin_38030978/article/details/80446475)