「状态序列」什么是迁徙率(全方位了解风控中的迁徙率与时间序列详解)

互联网 2022-04-26 11:02:50

今天,神州网给大家普及下关于「状态序列」什么是迁徙率(全方位了解风控中的迁徙率与时间序列详解)的知识。

上次,番茄风控第61节的星球课堂:风控人必知的风控知识—《迁徙率预估》,课程中跟各位童鞋继续介绍了迁徙率(滚动率)和时间序列相关内容。

有不少童鞋对相关的内容似乎还不是特别了解,今天再跟大家稍微讲解迁徙率与时间序列如何做坏账预估。

一.迁徙率

1.1.迁徙率预估具体实操

迁徙率预估一个重要的步骤就是获取到每个阶段的资产金额分布:

全方位了解风控中的迁徙率与时间序列

编辑切换为居中

添加图片注释,不超过 140 字(可选)

有了这个阶段的资产便可以计算每个阶段的迁徙率,对应的数据如下:

全方位了解风控中的迁徙率与时间序列

编辑切换为居中

添加图片注释,不超过 140 字(可选)

有了以上数据,可以通过计算平均的迁徙率:

全方位了解风控中的迁徙率与时间序列

编辑切换为居中

添加图片注释,不超过 140 字(可选)

再通过这个平均迁徙率,就可以看到每个阶段的迁徙率数据:

全方位了解风控中的迁徙率与时间序列

编辑

添加图片注释,不超过 140 字(可选)

通过以上的每个阶段的迁徙率,就能得到整体的阶段迁徙率预估,如M0的迁徙率其计算方式是采用:连乘的方式进行,转化为具体算式就是:=M0*P1*P2*P3*P4*P5*P6

其中P1~P6为以上所对应的迁徙率预估数据:

全方位了解风控中的迁徙率与时间序列

编辑

添加图片注释,不超过 140 字(可选)

1.2.建模中的迁徙率分析

迁徙率分析(RollRateAnalysis),是信贷风险管理资产质量分析中的重要概念,是指从某个观察点之前的一段时间(观察期)的最坏状态,向观察点之后一段时间(表 现期)的最坏状态的发展变化情况。

全方位了解风控中的迁徙率与时间序列

编辑切换为居中

添加图片注释,不超过 140 字(可选)

迁徙率分析的具体过程如下:

1、明确数据来源,“客户还款计划表(CustomerRepaymentSchedule)”较为 常见(具体表名不同业务方可能有区别);2、选定观察时点,观察点往前推m个月定义为观察期,观察点往后推n个月定 义为表现期(观察期与表现期时长根据产品特征定义);

3、提取分析样本,对于选定的样本用户,需要限定其放款日期在观察期前,最后一期还款日期在表现期后(这样保证样本用户的分析时间周期一致);

4、统计观察期逾期状态,以观察点为截止时点,统计客户在观察期(观察点前m 个月)的最长逾期期数,以对应最坏逾期状态,如C、M1、M2、M3+等(C表示当 前未逾期,M1表示逾期1-30天,M2表示逾期31-60天,M3+表示逾期61天及以上);

5、统计表现期逾期状态,以观察点为起始时点,统计客户在表现期(观察点后n个月)的最长逾期期数,以对应最坏逾期状态,如C、M1、M2、M3+等;

6、构建逾期情况矩阵,以观察期的逾期情况和表现期的逾期情况进行交叉统计, 依次形成样本数量矩阵表、样本占比矩阵表(即迁徙率分析表);

7、分析迁徙率数据表,根据不同状态的变化率情况大小,定义目标变量的逾期状态阈值;

8、对比多个观察时点,为了排除某个观察点选择时的随机影响,一般会选择多个观察点数据,重复前述过程,形成多个迁徙率分析表进行对比,得出最终目标定义。

假设有一场景示例:某网贷小额分期产品,一次性放款,分12期按月等本等息还款,现结合以上迁徙率分析步骤,简述迁徙率分析过程与结果。

我们选取20200630为观察时点,前推3个月为观察期(20200101-20200630),后推3个月为表现期(20200701-20201230),统计用户的逾期状态分为C、DPD7+、 DPD15+、DPD30+、DPD60+共6种情况,其中C表示未逾期,

DPD7+表示逾期8~15天,DPD15+表示逾期16~30天,

DPD30+表示逾期31~60天,

DPD60+表示逾期61及以上。

全方位了解风控中的迁徙率与时间序列

编辑

添加图片注释,不超过 140 字(可选)

(表1逾期状态样本数量)

全方位了解风控中的迁徙率与时间序列

编辑

添加图片注释,不超过 140 字(可选)

(表2逾期状态样本占比)

从表2滚动率分析表可以分析得出:

(1)在观察期状态为正常(C)的用户,在表现期有86.21%仍保持正常状态,有13.79%转变为逾期状态(DPD7+、DPD15+、DPD30+、DPD60+);

(2)在观察期最高逾期状态为DPD7+的用户,在表现期有61.37%转变为正常 状态,有20.93%仍保持DPD7+状态,有17.70%转变为更高逾期状态(DPD15+、 DPD30+、DPD60+);

(3)在观察期最高逾期状态为DPD60+的用户,在表现期仅有0.82%转变为正 常状态,有4.86%转变为较低逾期状态(DPD7+、DPD15+、DPD30+),而有94.32% 仍保持DPD60+逾期状态;

(4)在观察期最高逾期状态为DPD15+、DPD30+的用户,在表现期变化状态 的分析思路同上;

(5)表中的“回滚率”表示用户从观察期到表现期的逾期状态降低的样本占比, 如从DPD7+转变为C,从DPD15+转变为C或DPD7+,从DPD30+转变为C或 DPD7+或DPD15+,从DPD60+转变为C或DPD7+或DPD15+或DPD30+。由表 中回滚率统计结果可知,在观察期随着逾期状态的升高,对应表现期的回滚率逐渐降低,在观察期逾期状态DPD7+的用户,在表现期有61.3%转变为正常,说明观察期 逾期为DPD7+的用户较多仍为“好”用户;在观察期逾期状态为DPD30+的用户,在表现期有32.49%转变为较低逾期状态,说明观察期逾期为DPD30+的用户仍存在

部分用户后期向“好”的方向变化;但在观察期逾期状态为DPD60+的用户,在表现 期仅有5.68%转变为较低逾期状态,说明观察期逾期为DPD60+的用户大多数已成为“坏”用户;

(6)根据以上分析,认定逾期状态为DPD60+的用户,在后期降低逾期程度的 概率很低,故可以将DPD60作为目标变量Y的定义范围,即逾期61天及以上的用户定义为“坏”用户,其余为“好”用户。

以上为风控中的迁徙率率的知识点,更系统性的内容更可以参考我们目前ing的课程《第五期全线条训练营课程》。

全方位了解风控中的迁徙率与时间序列

编辑切换为居中

添加图片注释,不超过 140 字(可选)

二.时间序列

时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。

时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。

构成要素:长期趋势,季节变动,循环变动,不规则变动。

1)长期趋势(T)现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。

2)季节变动(S)现象在一年内随着季节的变化而发生的有规律的周期性变动。

3)循环变动(C)现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。

4)不规则变动(I)是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型。

时间序列在消费金融公司运用场景:

1、销售数据预测

2、Vintage坏账预估

3、回收率预估

常见方法:移动平均法、指数平滑法:指数平滑法实际上是一种特殊的加权移动平均法。

指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。