一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于GBDT算法与逻辑回归模型的企业违约风险评估方法设备及介质与流程

2022-05-21 02:42:44 来源:中国专利 TAG:

技术特征:
1.基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法包括:获取多个样本企业的企业经营数据,其中,所述企业经营数据为第三方主体存储的与样本企业有关的数据,且所述企业经营数据包括以下至少一种:工商管理数据、征信数据、互联网数据;对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,计算与每种标准化数据对应的woe值与iv值,并根据所述woe值对变量进行数值区间的划分,根据所述iv值对变量进行筛选;将完成数值区间划分与筛选的变量作为输入数据集,采用gbdt算法进行训练,构造出适用于逻辑回归模型的入模变量;将所述入模变量输入至逻辑回归模型,构建企业违约风险评估模型;获取待评估企业的企业经营数据,采用所述企业违约风险评估模型对所述待评估企业进行评估,得到待评估企业的违约风险评估结果。2.如权利要求1所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,包括:对所述企业经营数据进行规范化处理得到原始数据,其中,所述规范化处理包括以下至少一项:将所述企业经营数据进行融合对齐,去除所述企业经营数据中的噪声数据和/或冗余数据;对所述原始数据进行计算处理,将所述原始数据中的字符型数据转化成数值型数据;对计算处理后的所述原始数据进行标准化处理,消除所述原始数据的量纲,得到标准化数据。3.如权利要求2所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于:采用大数据etl技术对所述企业经营数据进行规范化处理得到原始数据。4.如权利要求3所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于:采用z-score标准化方法对计算处理后的所述原始数据进行标准化处理,消除所述原始数据的量纲,得到标准化数据。5.如权利要求1所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:根据预定义的违约风险标准对所述多个样本企业进行划分,将所述多个样本企业划分为正常企业与具有违约风险的企业,其中,所述预定义的违约风险标准包括以下至少一项:逾期、企业在金融黑名单中、企业在失信企业名单中、企业欠税、企业经营异常。6.如权利要求1所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:获取样本企业的多种企业经营数据,若所述多种企业经营数据中的一种或几种数据缺失,则获取该种企业经营数据缺失的原因;根据数据缺失的原因判断该种企业经营数据对构建企业风险评估模型的影响,若该种
企业经营数据在多个样本企业中缺失率大于60%,则对该种企业经营数据进行剔除。7.如权利要求1所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:采用roc曲线对构建的所述企业风险评估模型进行评价;和/或采用auc值对构建的所述企业风险评估模型进行评价。8.如权利要求1所述的基于gbdt算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:通过将分值表示为比率对数的线性表达式来定义评分卡的分值刻度,将所述企业违约风险评估模型得到的待评估企业的违约风险评估结果转换成评分卡结果。9.一种基于gbdt算法与逻辑回归模型的企业违约风险评估的设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取多个样本企业的企业经营数据,其中,所述企业经营数据为第三方主体存储的与样本企业有关的数据,且所述企业经营数据包括以下至少一种:工商管理数据、征信数据、互联网数据;对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,计算与每种标准化数据对应的woe值与iv值,并根据所述woe值对变量进行数值区间的划分,根据所述iv值对变量进行筛选;将完成数值区间划分与筛选的变量作为输入数据集,采用gbdt算法进行训练,构造出适用于逻辑回归模型的入模变量;将所述入模变量输入至逻辑回归模型,构建企业违约风险评估模型;获取待评估企业的企业经营数据,采用所述企业违约风险评估模型对所述待评估企业进行评估,得到待评估企业的违约风险评估结果。10.一种基于gbdt算法与逻辑回归模型的企业违约风险评估的非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:获取多个样本企业的企业经营数据,其中,所述企业经营数据为第三方主体存储的与样本企业有关的数据,且所述企业经营数据包括以下至少一种:工商管理数据、征信数据、互联网数据;对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,计算与每种标准化数据对应的woe值与iv值,并根据所述woe值对变量进行数值区间的划分,根据所述iv值对变量进行筛选;将完成数值区间划分与筛选的变量作为输入数据集,采用gbdt算法进行训练,构造出适用于逻辑回归模型的入模变量;将所述入模变量输入至逻辑回归模型,构建企业违约风险评估模型;获取待评估企业的企业经营数据,采用所述企业违约风险评估模型对所述待评估企业进行评估,得到待评估企业的违约风险评估结果。

技术总结
本申请公开了基于GBDT算法与逻辑回归模型构建企业违约风险评估模型的方法、设备及介质。方法包括获取多个样本企业的数据,对获取的数据进行整合、处理得到标准化数据,计算标准化数据的WOE值与IV值,通过WOE值与IV值进行变量分箱、筛选,使用GBDT算法作为逻辑回归模型的前置算法,由GBDT算法构造出新的组合特征,输入至逻辑回归模型从而构建企业违约风险评估模型,最后由企业违约风险评估模型对待评估企业进行评估,得到企业违约风险评估结果,识别企业违约风险概率。上述方法采用GBDT算法对逻辑回归模型的入模变量进行组合,选取对模型贡献更大的变量,同时对变量的重要性进行分析,使模型评估结果更合理,有效地提高了模型评估的准确性。评估的准确性。评估的准确性。


技术研发人员:刘先淇 郭英楠 崔乐乐
受保护的技术使用者:天元大数据信用管理有限公司
技术研发日:2022.02.16
技术公布日:2022/5/20
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献