2.3.2 账龄分析与时间窗口设计

时间窗口分为表现窗口和观测窗口,表现窗口中的时间称为表现期,观察窗口中的时间称为观察期。如果定义用户为负样本的依据是到期后的3个月内发生逾期,则称表现期为3个月。在用户贷款前12个月的数据切片中,抽取用户的历史行为表现作为变量,用于后续建模,则称观察期为12个月,如图2-2所示。

图2-2 观察期与表现期

通常,时间窗口的确定,需要考虑当前数据集的数据是否充足。如果表现窗口设计过小,则用户的风险暴露不充分,但观察窗口可以变长,因此有更丰富的变量信息用于建模。如果表现窗口过大,则观察窗口可能过小,以至于变量的效果显著下降。为了更好地确定时间窗口,通常使用账龄分析来分析账户成熟期,进而给出表现期与观察期的合理划分。

账龄(Vintage)一词最初来源于葡萄酒业,意思是葡萄酒的酿造年份。葡萄成长期缺水、采收期日照不足或者降雨过多等情况都会影响该年葡萄酒的产量与品质,但随着窖藏年份增加,酒的品质最终将逐渐趋于稳定。因此,葡萄酒厂家通过绘制不同酿造年份的品质曲线,观察其随酿造时间的变换规律,进而给出葡萄酒的成熟期、确定最终品质、分析品质影响因素等。

信贷产品中的账龄分析与葡萄酒行业中的酿造年份分析非常类似。信贷Vintage曲线主要用途包括以下几点。

确定资产质量:曲线平缓后可以观察得到该月份放款客群对应的最终逾期占比。

分析变化规律:如果前几期逾期率上升很快,随后风险暴露进入平稳期,说明短期风险捕捉能力较差,客群欺诈风险可能较高,需要优化欺诈检测系统。如果曲线一直在上升,说明信用风险识别能力较差,需要对策略和信用评估模型进行优化。

确定账户成熟期:确定用户风险暴露所需周期,从而定义建模样本的表现期。

分析影响因素:放款月的不同会导致很多的因素不同,如风控策略收紧或放松、客群变化、市场环境、政策法规等都会影响资产质量。因此分析影响因素可以用来指导风控策略的调整,在未来市场环境或政策变动时有更好的应对方法。

常见的信贷Vintage图如图2-3所示,展示了11个季度的Vintage曲线。其中2017Q1代表2017年第一季度,2019Q2代表2019年第二季度,以此类推。

图2-3 Vintage图示

图2-3中的横轴表示账龄,纵轴表示该部分客群的逾期占比,每一条曲线表示一个放款季度的客户。由于用户可以在平台进行复贷,因此用户的历史最大逾期会逐步增长,即用户的真实风险会随着时间推移逐渐暴露。而当大多数曲线趋于平稳的月份取值都接近某特殊值的时候,即可使用该月份维度作为表现期。