上次,番茄風控第61節(jié)的星球課堂:風控人必知的風控知識—《遷徙率預估》,課程中跟各位童鞋繼續(xù)介紹了遷徙率(滾動率)和時間序列相關內容。有不少童鞋對相關的內容似乎還不是特別
上次,番茄風控第61節(jié)的星球課堂:風控人必知的風控知識—《遷徙率預估》,課程中跟各位童鞋繼續(xù)介紹了遷徙率(滾動率)和時間序列相關內容。
有不少童鞋對相關的內容似乎還不是特別了解,今天再跟大家稍微講解遷徙率與時間序列如何做壞賬預估。
一.遷徙率
1.1.遷徙率預估具體實操
遷徙率預估一個重要的步驟就是獲取到每個階段的資產金額分布:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
有了這個階段的資產便可以計算每個階段的遷徙率,對應的數據如下:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
有了以上數據,可以通過計算平均的遷徙率:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
再通過這個平均遷徙率,就可以看到每個階段的遷徙率數據:
編輯
添加圖片注釋,不超過 140 字(可選)
通過以上的每個階段的遷徙率,就能得到整體的階段遷徙率預估,如M0的遷徙率其計算方式是采用:連乘的方式進行,轉化為具體算式就是:=M0*P1*P2*P3*P4*P5*P6
其中P1~P6為以上所對應的遷徙率預估數據:
編輯
添加圖片注釋,不超過 140 字(可選)
1.2.建模中的遷徙率分析
遷徙率分析(RollRateAnalysis),是信貸風險管理資產質量分析中的重要概念,是指從某個觀察點之前的一段時間(觀察期)的最壞狀態(tài),向觀察點之后一段時間(表 現期)的最壞狀態(tài)的發(fā)展變化情況。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
遷徙率分析的具體過程如下:
1、明確數據來源,“客戶還款計劃表(CustomerRepaymentSchedule)”較為 常見(具體表名不同業(yè)務方可能有區(qū)別);2、選定觀察時點,觀察點往前推m個月定義為觀察期,觀察點往后推n個月定 義為表現期(觀察期與表現期時長根據產品特征定義);
3、提取分析樣本,對于選定的樣本用戶,需要限定其放款日期在觀察期前,最后一期還款日期在表現期后(這樣保證樣本用戶的分析時間周期一致);
4、統計觀察期逾期狀態(tài),以觀察點為截止時點,統計客戶在觀察期(觀察點前m 個月)的最長逾期期數,以對應最壞逾期狀態(tài),如C、M1、M2、M3+等(C表示當 前未逾期,M1表示逾期1-30天,M2表示逾期31-60天,M3+表示逾期61天及以上);
5、統計表現期逾期狀態(tài),以觀察點為起始時點,統計客戶在表現期(觀察點后n個月)的最長逾期期數,以對應最壞逾期狀態(tài),如C、M1、M2、M3+等;
6、構建逾期情況矩陣,以觀察期的逾期情況和表現期的逾期情況進行交叉統計, 依次形成樣本數量矩陣表、樣本占比矩陣表(即遷徙率分析表);
7、分析遷徙率數據表,根據不同狀態(tài)的變化率情況大小,定義目標變量的逾期狀態(tài)閾值;
8、對比多個觀察時點,為了排除某個觀察點選擇時的隨機影響,一般會選擇多個觀察點數據,重復前述過程,形成多個遷徙率分析表進行對比,得出最終目標定義。
假設有一場景示例:某網貸小額分期產品,一次性放款,分12期按月等本等息還款,現結合以上遷徙率分析步驟,簡述遷徙率分析過程與結果。
我們選取20200630為觀察時點,前推3個月為觀察期(20200101-20200630),后推3個月為表現期(20200701-20201230),統計用戶的逾期狀態(tài)分為C、DPD7+、 DPD15+、DPD30+、DPD60+共6種情況,其中C表示未逾期,
DPD7+表示逾期8~15天,DPD15+表示逾期16~30天,
DPD30+表示逾期31~60天,
DPD60+表示逾期61及以上。
編輯
添加圖片注釋,不超過 140 字(可選)
(表1逾期狀態(tài)樣本數量)
編輯
添加圖片注釋,不超過 140 字(可選)
(表2逾期狀態(tài)樣本占比)
從表2滾動率分析表可以分析得出:
(1)在觀察期狀態(tài)為正常(C)的用戶,在表現期有86.21%仍保持正常狀態(tài),有13.79%轉變?yōu)橛馄跔顟B(tài)(DPD7+、DPD15+、DPD30+、DPD60+);
(2)在觀察期最高逾期狀態(tài)為DPD7+的用戶,在表現期有61.37%轉變?yōu)檎?狀態(tài),有20.93%仍保持DPD7+狀態(tài),有17.70%轉變?yōu)楦哂馄跔顟B(tài)(DPD15+、 DPD30+、DPD60+);
(3)在觀察期最高逾期狀態(tài)為DPD60+的用戶,在表現期僅有0.82%轉變?yōu)檎?常狀態(tài),有4.86%轉變?yōu)檩^低逾期狀態(tài)(DPD7+、DPD15+、DPD30+),而有94.32% 仍保持DPD60+逾期狀態(tài);
(4)在觀察期最高逾期狀態(tài)為DPD15+、DPD30+的用戶,在表現期變化狀態(tài) 的分析思路同上;
(5)表中的“回滾率”表示用戶從觀察期到表現期的逾期狀態(tài)降低的樣本占比, 如從DPD7+轉變?yōu)镃,從DPD15+轉變?yōu)镃或DPD7+,從DPD30+轉變?yōu)镃或 DPD7+或DPD15+,從DPD60+轉變?yōu)镃或DPD7+或DPD15+或DPD30+。由表 中回滾率統計結果可知,在觀察期隨著逾期狀態(tài)的升高,對應表現期的回滾率逐漸降低,在觀察期逾期狀態(tài)DPD7+的用戶,在表現期有61.3%轉變?yōu)檎?,說明觀察期 逾期為DPD7+的用戶較多仍為“好”用戶;在觀察期逾期狀態(tài)為DPD30+的用戶,在表現期有32.49%轉變?yōu)檩^低逾期狀態(tài),說明觀察期逾期為DPD30+的用戶仍存在
部分用戶后期向“好”的方向變化;但在觀察期逾期狀態(tài)為DPD60+的用戶,在表現 期僅有5.68%轉變?yōu)檩^低逾期狀態(tài),說明觀察期逾期為DPD60+的用戶大多數已成為“壞”用戶;
(6)根據以上分析,認定逾期狀態(tài)為DPD60+的用戶,在后期降低逾期程度的 概率很低,故可以將DPD60作為目標變量Y的定義范圍,即逾期61天及以上的用戶定義為“壞”用戶,其余為“好”用戶。
以上為風控中的遷徙率率的知識點,更系統性的內容更可以參考我們目前ing的課程《第五期全線條訓練營課程》。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
二.時間序列
時間序列是按照時間排序的一組隨機變量,它通常是在相等間隔的時間段內依照給定的采樣率對某種潛在過程進行觀測的結果。
時間序列數據本質上反映的是某個或者某些隨機變量隨時間不斷變化的趨勢,而時間序列預測方法的核心就是從數據中挖掘出這種規(guī)律,并利用其對將來的數據做出估計。
構成要素:長期趨勢,季節(jié)變動,循環(huán)變動,不規(guī)則變動。
1)長期趨勢(T)現象在較長時期內受某種根本性因素作用而形成的總的變動趨勢。
2)季節(jié)變動(S)現象在一年內隨著季節(jié)的變化而發(fā)生的有規(guī)律的周期性變動。
3)循環(huán)變動(C)現象以若干年為周期所呈現出的波浪起伏形態(tài)的有規(guī)律的變動。
4)不規(guī)則變動(I)是一種無規(guī)律可循的變動,包括嚴格的隨機變動和不規(guī)則的突發(fā)性影響很大的變動兩種類型。
時間序列在消費金融公司運用場景:
1、銷售數據預測
2、Vintage壞賬預估
3、回收率預估
常見方法:移動平均法、指數平滑法:指數平滑法實際上是一種特殊的加權移動平均法。
指數平滑法是在移動平均法基礎上發(fā)展起來的一種時間序列分析預測法,它是通過計算指數平滑值,配合一定的時間序列預測模型對現象的未來進行預測。其原理是任一期的指數平滑值都是本期實際觀察值與前一期指數平滑值的加權平均。