1. 风控指标体系

账龄分析(vintage analysis):用以分析账户成熟期以及变化规律等
滚动率分析(roll rate analysis):用以定义账户好坏程度
迁移率分析(flow rate analysis):用以分析不同逾期状态之间的转化率

1.1 基础指标概念

账龄(Month of Book,MOB)
指资产放款月份。一旦申贷订单被放款,也便拥有了账龄和生命周期

  • MOB0,放款日至当月月底
  • MOB1,放款后第二个完整月份
  • MOB2,放款后第三个完整月份

MOB最大值取决于信贷产品期限,如果是12期产品,MOB最大就是12期

逾期天数(Days Past Due,DPD)
逾期天数 = 实际还款日 - 应还款日
DPD30+表示逾期天数大于30天的资产

逾期期数(M)
指实际还款日与应还款日之间的逾期天数,并按区间划分后的逾期状态。

  • M0:当前未逾期(或用C表示,取自Current)
  • M1: 逾期1-30日
  • M2:逾期31-60日
  • M3:逾期61-90日
  • M4:逾期91-120日
  • M5:逾期121-150日
  • M6:逾期151-180日
  • M7:逾期180日以上。此时也被称为呆账(Bad Debts),会予以注销账户(write-off)

1.2 Vintage Analysis

  1. 确定资产质量:一般以逾期率来定义资产质量,也就是曲线平缓后对应的逾期率。
  2. 分析变化规律:资产质量(例如逾期率指标)的变化情况,如果前几期逾期率上升很快,那么说明短期风险没有捕捉住,欺诈风险较高;反之,如果曲线一直在上升,说明信用风险识别能力不佳。
  3. 确定账户成熟期:用来判断客户展现好坏的时间因素,从而帮助定义表现期
  4. 分析影响因素:风控策略收紧或放松、客群变化、市场环境、政策法规等都会影响资产质量。分析影响因素,可以用来指导风控策略的调整。

那么逾期风险(目标变量Y)是如何定义的?如何确定M3,还是M6? 这就需要使用滚动率分析

为什么要确定账户的表现期,因为表现期越长,信用风险暴露就越彻底,但也意味着观察期离当前越远,用以提取样本特征的历史数据将越陈旧,建模样本和未来样本的差异也越大;反之,表现期越短,风险可能没有没有彻底暴露,但是好处是可以获得更近期的样本;
image.png
对于一个12期分期还款的信贷产品,理论上当用户在12期结束,并还清所有的钱后,我们才能定义为绝对的好客户;反之,我们只能说到目前为止是一个好客户,但并不能知道未来几期用户会不会逾期不还钱。
因此,我们需要确定一个合适的表现期能覆盖足够多的坏客户即可

根据上图的信贷产品Vintage曲线,我们可以得到哪些信息呢?

  1. 账龄最长为12个月,代表产品期限为12期。随着12期结束,账户的生命周期走到尽头。
  2. 根据2018年5月放贷的订单完全走完账龄生命周期,而2018年6月却没走完,说明数据统计时间为2019年6月初
  3. 账龄MOB1、MOB2、MOB3的逾期率都为0,说明逾期指标为M4+(逾期超过90天)风险。
  4. 由放贷月份从2018年1月~12月的账户的最终逾期率都在降低,说明资产质量在不断提升,可能是因为风控水平在不断提升。
  5. 2018年5月相对于2018年1~4月的逾期率大幅度下降,说明该阶段风控策略提升明显。
  6. 不同月份放款的M4+在经过9个MOB后开始趋于稳定,说明账户成熟期是9个月

绘制Vintage曲线时,就不得不提到纵坐标中逾期率的定义。通常有两种计算口径:

  • 第一种,订单口径,逾期率 = 逾期订单数 / 总放贷订单数
  • 第二种,金额口径,逾期率 = 逾期金额 / 总放贷金额

1.3 Roll Rate Analysis

滚动率分析就是从某个观察点之前的一段时间的最坏状态,向观察点之后的一段时间的最坏状态的发展变化情况。
滚动率分析的具体操作步骤为:

  • step 1. 确定数据源。一般利用客户还款计划表(repayment schedule)。
  • step 2. 选择观察点,以观察点为截止时间,统计客户在观察期(如过去6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 3. 以观察点为起始时间,统计客户在表现期(如未来6个月)的最长逾期期数,按最坏逾期状态将用户分为几个层次,如C、M1、M2、M3、M4+。
  • step 4. 交叉统计每个格子里的客户数,如图6中表1所示。
  • step 5. 统计每个格子里的客户占比,如图6中表2所示。
  • step 6. 为了排除观察点选择时的随机影响,一般会选择多个观察点。重复step1 ~5。

image.png

  1. 逾期状态为M0的客户,在未来6个月里,有96%会继续保持正常状态,4%会恶化为M1和M2;
  2. 逾期状态为M1的客户,未来有81%会回到正常状态,即从良率为81%,有7%会恶化,13%会保持M1状态;
  3. 逾期状态为M2的客户,从良率为23%,有39%会恶化为M3和M4+;
  4. 逾期状态为M3的客户,从良率为14.7%,有60.7%会恶化为M4+;
  5. 逾期状态为M4+的客户,从良率仅为4%,有80%会继续保持此状态。

因此,我们认为历史逾期状态为M4+的客户已经坏透了,几乎不会从良。为了让风控模型有更好的区分能力,需要将客户好坏界限尽可能清晰,可以定义:
坏用户(bad)= 逾期状态为M4+(逾期超过90天)

1.4 如何确定目标变量Y

在风控建模中,由于是有监督学习,我们非常关心如何定义合适的目标变量Y?这就需要结合滚动率分析和Vintage分析,两者的分工在于:

  • 滚动率分析用于定义客户的好坏程度
  • Vintage分析用于确定合适的表现期

定义目标变量Y的具体操作步骤为:

  • step 1. 利用滚动率分析定义坏客户,例如上文案例中定义:M4+为坏客户
  • step 2. 以M4+作为资产质量指标,统计Vintage数据表,绘制Vintage曲线。目的是分析账户成熟期,例如上文案例确定:账户成熟期是9个月。

你可能还是会比较疑惑,为什么还需要通过Vintage分析来确定表现期?
这是因为:虽然滚动率分析确定了M4+作为坏的程度,但是对于12期的产品,有些账户是在前4期MOB(也就是MOB1 ~ MOB4,经过4个表现期)就达到M4+,有些是在后几期才达到M4+。
对于这个Vintage里所有的账户,我们的目的是抓住尽可能多的坏客户。
现在进一步补充Vintage曲线的绘制过程:如图8所示,对于这10,000个账户,以MOB1为起点,把前N个MOB作为一个窗口,滑窗统计坏客户率,得到图5-表1中的Vintage数据,并绘制Vintage曲线。我们可以发现:经过9期,我们几乎能够抓住所有的坏客户。
商业分析-金融风控 - 图3
图 8 - 不同客户的逾期状态(红=逾期,绿=正常)
因此,我们将两者结合起来,定义:

  • Bad = 账户经过9期表现期后,逾期状态为M4+(逾期超过90天)。此时 。
  • Good = 经过9期表现期,但未达到M4+逾期状态。此时 。
  • Intermediate = 未进入9期表现期,账户还未成熟,无法定义好坏,也就是不定样本。

    1.5 Flow Rate Analysis

    迁移率分析法(Flow Rate)也叫做净流量滚动比例法(Net Flow Rate),能形象展示客户贷款账户在整个生命周期中的变化轨迹,也是预测未来坏账损失的最常用的方法。
    核心假设为:处于某一逾期状态(如M2)的账户,一个月后,要么从良为M0账户,要么恶化为更坏的下一个逾期状态(如M3)。 迁移率 = 前一期逾期金额到下一期逾期金额的转化率 一般缩写为M0-M1、M4-M5等形式,例如:

  • M0-M1 = 当月进入M1的贷款余额 / 上月末M0的贷款余额

  • M2-M3 = 当月进入M3的贷款余额 / 上月末M2的贷款余额

迁移率分析的具体操作步骤为:

  • step 1. 定义逾期状态,如前文所述的M0、M1、M2等。
  • step 2. 计算各逾期状态之间的迁移率,如M0-M1、M2-M3等。
  • step 3. 计算不同月份(也可称为Vintage)的平均迁移率。目的是对本平台在不同时期的资产的迁移率有整体的认知。
  • step 4. 根据平均迁移率和不良资产回收率,计算净坏账损失率。

接下来,我们以数值案例(非真实业务数据)展示上述过程。
商业分析-金融风控 - 图4
图 9 - 迁移率分析
图9-表2中,2月份的逾期M1资产只能从1月份的正常M0资产滚动而来,因此从逾期M0资产向M1的转化率为 。
以此类推,我们可以计算所有月份的资产恶化率。黄色部分为不良资产的恶化迁移路径,其计算口径为:

  • 截止1月末,正常M0资产为 元,这是起点。
  • 截止2月末,1月末的正常M0资产中有 恶化为逾期M1资产。
  • 截止3月末,2月末的逾期M1资产中有 恶化为逾期M2资产。
  • 截止4月末,3月末的逾期M2资产中有 恶化为逾期M3资产。
  • 截止5月末,4月末的逾期M4资产中有 恶化为逾期M5资产。此时已过催收黄金期(90天以内)。
  • 截止6月末,5月末的逾期M5资产中有 恶化为逾期M6资产。这可能采用了委外催收、司法手段等催收策略,效果显著。
  • 截止7月末,6月末的逾期M5资产中有 恶化为逾期M7资产。此时将视为不良资产,打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。

通过迁移率,我们可以清晰观察到每个Vintage的资产在各逾期状态的演变规律。
图9-表2中,我们从横向比较每个月的迁移率,发现不完全一样。这是因为随着时间推移、外在宏观经济环境、内部政策等变化而产生一定的波动。我们可以利用这些数据:

  1. 观察迁移率的发展轨迹,监控坏账的发展倾向和催收效果。
  2. 通过对多个月份的迁移率计算平均值,从而使迁移率更加稳定。

    1.6 坏账准备金的计算

    呆帐风险是信贷机构必须面对的风险,主要来源于信用风险和欺诈风险等。为了应对未来呆帐的可能,信贷机构一般都会设定一个储备资金,这就是坏账准备金(Bad Debt Reserve)。那么我们该如何计算坏账准备金?
    一般做法是,把未清偿贷款余额乘以一定的准备金比例(Reserve Ratio)所得。可以理解,资产逾期等级越高(越差),准备金比例也应该越高,因为恶化为呆帐的可能性也更高。如图10所示,正常M0资产恶化为呆帐的可能性最低,因此我们预留的准备金比例也就最少。
    我们总结下计算坏账准备金的步骤为:
  • step 1. 统计未清偿贷款金额的分布,也就是M0~M6状态分别对应的资产余额。
  • step 2. 为每个逾期状态的资产分配一个准备金比例。
  • step 3. 每个子项目的准备金金额 = 未清偿贷款余额 x 准备金比例。
  • step 4. 每个子项目的准备金金额相加,得到最终的准备金。

商业分析-金融风控 - 图5
图 10 - 坏账准备金计算示例
你或许会问,这里最关键的准备金比例是如何给出的?
由于坏账准备金是用来覆盖预期的未来呆帐损失的,准备金比例必须等于处于各个逾期状态的资产未来演变为呆帐的比例
回到迁移率分析中,我们发现从正常M0资产迁移至逾期M7资产(呆帐)需经过7次迁移,如图11所示。那么,我们只要把各个状态之间的转化率相乘,不就得到准备金比例了?
商业分析-金融风控 - 图6
图 11 - 各逾期状态的迁移率和毛坏账率计算
因此,我们定义正常M0资产对应的毛坏账损失率,也就是迁移到呆帐的转化率为 毛坏账损失率 =
在本案例中,正常M0资产对应的毛坏账损失率为:

在实际中,信贷机构会将不良资产打包转卖给第三方公司,这样就能回收部分不良资产,减少损失。因此,我们定义净坏账损失率为: 净坏账损失率 = 毛坏账损失率 - 不良资产外卖回收率 由于M7不良资产的平均回收率为 ,则可计算净坏账损失率为:

同理,我们可以计算正常资产到不同逾期状态资产的毛损失率和净损失率如下:
商业分析-金融风控 - 图7
图 12 - 毛损失率和净损失率
根据图12所示的损失率表,我们定义:

  • 当月应计拨备额 = SUM(净坏账损失率 * 月末应收账款余额)
  • 拨备率 = 当月应计拨备额 / 总资产金额

其中,拨备率是用来预防不良资产的发生而准备的金额的比例。拨备率应越低越好。拨备率越高说明风险越大,损失越大,利润越小。
商业分析-金融风控 - 图8
图 13 - 2018年7月的资产预计期望损失计算
在本案例中,当月应计拨备额为65421元,如图13所示。拨备率为:

1.7 总结

本文所整理的主要知识点包括:

  1. Vintage、滚动率、迁移率的概念和区别。
  2. 如何根据数据分析来确定风控建模中的好坏定义。
  3. 拨备率的概念,以及如何根据迁移率来计算拨备率。

2. 风控建模

3. 数据分析