一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于排序损失的信用风控系统的制作方法

2023-02-04 15:57:30 来源:中国专利 TAG:

1.本发明涉及风控、信用风险评估领域,特别涉及一种基于排序损失的信用风控系统。


背景技术:

2.随着大数据技术在风控领域应用的普及,采用机器学习技术对风控场景进行建模几乎是大势所趋。一般而言,现有的信用风险模型的构建是以一个固定表现期来建模,往往对于短账龄和长账龄的风险无法同时兼顾,坏样本的定义为短账龄风险,则长账龄的风险无法兼顾,同理坏样本定义为长账龄风险,则短账龄的风险无法兼顾。现有的方案中往往都是针对短账龄标签做一个模型,针对长账龄标签做一个模型,两个模型结合起来使用,但在实际的上线过程中,模型之间不断的切换也会导致人群变动,不利于策略指定阈值;
3.那么如何设计一个模型能够对整个风控的生命周期都有良好的预测能力是本专利要解决的问题。常规的模型都是将一个问题转化为二分类问题,建模的样本只有好样本和坏样本两种标签。损失函数一般都是针对二分类问题的,例如交叉熵损失函数。但其实同样都为坏的样本中,其实坏的程度也是有区分的,我们在交叉熵损失的基础上新增加一个模块,用来对不同周期的坏人进行排序。
4.通过在交叉熵损失的基础上叠加一个排序损失模块,可以让模型既对短账龄的坏人有一个良好的区分度,同时对长账龄的坏人也有一个良好的区分度。


技术实现要素:

5.本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于排序损失的信用风控系统。
6.本发明提供了如下的技术方案:
7.本发明一种基于排序损失的信用风控系统,包括以下步骤:
8.(1)输入用户的样本中通常包括特征和标签,特征数据一般有“用户信息数据”、“用户行为数据”等,标签不同样本发生在发生坏的账龄,比如在mob2的适合逾期30 ,则定义这个样本标签为2;
9.(2)标签转换模块,计算不同账龄下逾期30天并最终转换为坏账的比例,并将这个值映射为标签;
10.(3)排序损失模块:在交叉熵损失函数的基础上叠加ndcg函数
[0011][0012]
(4)评估模块,因为传入的标签是mob,所以评估函数auc需要修改。参考如下:
[0013]
defauc2(y_prob,train):
[0014]
y_true=list(train.get_label())
[0015]
y_true=[1ifint(item)!=0else 0for item in y_true]
[0016]
y_prob=list(y_prob)
[0017]
return'auc',roc_auc_score(y_true,y_prob);
[0018]
(5)模型训练,将排序损失模块与评估模块带入模型中进行训练;
[0019]
(6)模型计算输出样本为坏人的概率。
[0020]
与现有技术相比,本发明的有益效果如下:
[0021]
本发明将不同账龄的坏样本均纳入到模型学习的过程中,既学习到了早期坏样本的特征,同时也学习到了中长期的坏样本特征,可以让模型在客户的整个生命周期中发挥作用;
[0022]
引入了排序损失模块,相比于交叉熵损失,不仅仅是可以处理label为0、1的变量,还可以处理多分类问题,同时对于每个类别的坏转换为实际的坏账损失概率代入损失模块,一方面能够学习到更多坏样本的信息,另外以一方面对于不同的坏也给了一个实际的权重。
具体实施方式
[0023]
应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0024]
实施例1
[0025]
本发明提供一种基于排序损失的信用风控系统,包括以下步骤:
[0026]
(1)输入用户的样本中通常包括特征和标签,特征数据一般有“用户信息数据”、“用户行为数据”等,标签不同样本发生在发生坏的账龄,比如在mob2的适合逾期30 ,则定义这个样本标签为2;
[0027]
(2)标签转换模块,计算不同账龄下逾期30天并最终转换为坏账的比例,并将这个值映射为标签;
[0028]
(3)排序损失模块:在交叉熵损失函数的基础上叠加ndcg函数
[0029][0030]
(4)评估模块,因为传入的标签是mob,所以评估函数auc需要修改。参考如下:
[0031]
defauc2(y_prob,train):
[0032]
y_true=list(train.get_label())
[0033]
y_true=[1ifint(item)!=0else 0for item in y_true]
[0034]
y_prob=list(y_prob)
[0035]
return'auc',roc_auc_score(y_true,y_prob);
[0036]
(5)模型训练,将排序损失模块与评估模块带入模型中进行训练;
[0037]
(6)模型计算输出样本为坏人的概率。
[0038]
和现有技术相比,主要优势在于:传统的建模坏样本往往为固定的表现期,如fpd30等,这样的模型在识别早期逾期的客群往往有较好的区分度,但是到了长账龄样本的表现上往往没有很好的区分度。本专利将不同账龄的坏样本均纳入到模型学习的过程中,
既学习到了早期坏样本的特征,同时也学习到了中长期的坏样本特征,可以让模型在客户的整个生命周期中发挥作用;
[0039]
和现有技术相比,主要创造性在于:引入了排序损失模块,相比于交叉熵损失,不仅仅是可以处理label为0、1的变量,还可以处理多分类问题,同时对于每个类别的坏转换为实际的坏账损失概率代入损失模块,一方面能够学习到更多坏样本的信息,另外以一方面对于不同的坏也给了一个实际的权重。
[0040]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。


技术特征:
1.一种基于排序损失的信用风控系统,其特征在于,包括以下步骤:(1)输入用户的样本中通常包括特征和标签,特征数据一般有“用户信息数据”、“用户行为数据”等,标签不同样本发生在发生坏的账龄,比如在mob2的适合逾期30 ,则定义这个样本标签为2;(2)标签转换模块,计算不同账龄下逾期30天并最终转换为坏账的比例,并将这个值映射为标签;(3)排序损失模块:在交叉熵损失函数的基础上叠加ndcg函数(4)评估模块,因为传入的标签是mob,所以评估函数auc需要修改。参考如下:defauc2(y_prob,train):y_true=list(train.get_label())y_true=[1ifint(item)!=0else 0for itemin y_true]y_prob=list(y_prob)return'auc',roc_auc_score(y_true,y_prob);(5)模型训练,将排序损失模块与评估模块带入模型中进行训练;(6)模型计算输出样本为坏人的概率。

技术总结
本发明公开了一种基于排序损失的信用风控系统,主要包括以下模块:第一个模块为“标签转换模块”;第二个模块为“排序损失模块”,第三个模块为“评价函数模块”。本发明将不同账龄的坏样本均纳入到模型学习的过程中,既学习到了早期坏样本的特征,同时也学习到了中长期的坏样本特征,可以让模型在客户的整个生命周期中发挥作用;引入了排序损失模块,相比于交叉熵损失,不仅仅是可以处理label为0、1的变量,还可以处理多分类问题,同时对于每个类别的坏转换为实际的坏账损失概率代入损失模块,一方面能够学习到更多坏样本的信息,另外以一方面对于不同的坏也给了一个实际的权重。于不同的坏也给了一个实际的权重。


技术研发人员:刘正夫 黄少博
受保护的技术使用者:天翼电子商务有限公司
技术研发日:2022.10.30
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献