一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型的训练方法和装置、评分方法和装置、设备、介质与流程

2022-09-14 22:41:20 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种模型的训练方法和装置、评分方法和装置、设备、介质。


背景技术:

2.评分卡模型是一个应用广泛的模型,例如可以应用于征信评估、相关风险评估等。目前,对于评分卡模型的一般训练流程是:先获取大量的历史特征数据,并对历史特征数据进行清洗、特征工程等处理,再基于相关算法进行二分类建模;当前训练评分卡模型的方式,过于依赖大量的历史特征数据,训练出的评分卡模型的预测性能不佳。


技术实现要素:

3.本技术实施例的主要目的在于提出了一种模型的训练方法和装置、评分方法和装置、设备、介质,训练得到的评分卡模型的预测性能有所提高。
4.为实现上述目的,本技术实施例的第一方面提出了一种模型的训练方法,用于训练评分卡模型,所述方法包括:
5.获取n个样本对象的样本属性特征;其中,所述样本属性特征用于表征每一所述样本对象的对象属性,每一所述样本对象包括m个所述样本属性特征;
6.对所述样本属性特征进行预处理,以得到样本初始特征;其中,所述样本初始特征的维度是n*m;
7.对所述样本初始特征进行分解处理,以得到样本隐含特征;其中,所述样本隐含特征包括每一所述样本对象的样本对象隐含特征和每一所述样本属性特征的样本属性隐含特征,所述样本对象隐含特征的维度为n*k,所述样本属性隐含特征的维度为k*m,k为常数;
8.将所述样本对象隐含特征输入至预设的原始分类模型;
9.通过所述样本对象隐含特征对所述原始分类模型进行模型训练,以得到所述评分卡模型。
10.在一些实施例中,所述样本属性特征至少包括以下特征类型之一:数值型特征、离散型特征,对应地,所述对所述样本属性特征进行预处理,以得到样本初始特征,至少包括以下步骤之一:
11.对所述数值型特征进行归一化处理,以得到样本初始特征;
12.对所述离散型特征进行独热编码处理,以得到所述样本初始特征。
13.在一些实施例中,所述通过所述样本对象隐含特征对所述原始分类模型进行模型训练,以得到所述评分卡模型,包括:
14.获取所述样本属性特征的原始评分信息;
15.通过所述样本对象隐含特征对所述原始分类模型进行模型训练,以得到目标评分信息;
16.根据所述目标评分信息和所述原始评分信息对所述原始分类模型进行模型训练,
以得到所述评分卡模型。
17.在一些实施例中,所述根据所述目标评分信息和所述原始评分信息对所述原始分类模型进行模型训练,以得到所述评分卡模型,包括:
18.根据所述目标评分信息和所述原始评分信息确定损失值;
19.根据所述目标评分信息和所述原始评分信息对所述原始分类模型进行参数调整,直至所述损失值满足预设训练结束条件,以得到所述评分卡模型。
20.为实现上述目的,本技术实施例的第二方面提出了一种评分方法,所述方法包括:
21.获取目标对象的原始数据特征;
22.对所述原始数据特征进行预处理,以得到目标初始特征;
23.获取预设的属性隐含特征,所述属性隐含特征是上述第一方面任一项所述的方法中的样本属性隐含特征;
24.对所述目标初始特征和所述属性隐含特征进行内积计算,以得到目标隐含特征;
25.将所述目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果;其中,所述考评结果用于表征所述目标对象的信用程度,所述评分卡模型根据上述第一方面任一项所述的方法训练得到。
26.在一些实施例中,所述方法还包括:
27.根据所述考评结果确定所述目标对象的信用等级;
28.根据所述信用等级为所述目标对象开放目标业务权限。
29.为实现上述目的,本技术实施例的第三方面提出了一种评分卡模型的训练装置,所述装置包括:
30.第一获取模块,用于获取n个样本对象的样本属性特征;其中,所述样本属性特征用于表征每一所述样本对象的对象属性,每一所述样本对象包括m个所述样本属性特征;
31.第一预处理模块,用于对所述样本属性特征进行预处理,以得到样本初始特征;其中,所述样本初始特征的维度是n*m;
32.分解模块,用于对所述样本初始特征进行分解处理,以得到样本隐含特征;其中,所述样本隐含特征包括每一所述样本对象的样本对象隐含特征和每一所述样本属性特征的样本属性隐含特征,所述样本对象隐含特征的维度为n*k,所述样本属性隐含特征的维度为k*m,k为常数;
33.模型输入模块,用于将所述样本对象隐含特征输入至预设的原始分类模型;
34.模型训练模块,用于通过所述样本对象隐含特征对所述原始分类模型进行模型训练,以得到评分卡模型。
35.为实现上述目的,本技术实施例的第四方面提出了一种评分装置,所述装置包括:
36.第二获取模块,用于获取目标对象的原始数据特征;
37.第二预处理模块,用于对所述原始数据特征进行预处理,以得到目标初始特征;
38.第三获取模块,用于获取预设的属性隐含特征,所述属性隐含特征是上述第一方面任一项所述的方法中的样本属性隐含特征;
39.内积计算模块,用于对所述目标初始特征和所述属性隐含特征进行内积计算,以得到目标隐含特征;
40.评分处理模块,用于将所述目标隐含特征输入至预训练的评分卡模型进行信用考
评处理,以得到考评结果;其中,所述考评结果用于表征所述目标对象的信用程度,所述评分卡模型根据上述第一方面任一项所述的方法训练得到。
41.为实现上述目的,本技术实施例的第五方面提出了一种计算机设备,包括:
42.至少一个存储器;
43.至少一个处理器;
44.至少一个计算机程序;
45.所述至少一个计算机程序被存储在所述至少一个存储器中,所述至少一个处理器执行所述至少一个计算机程序以实现上述第一方面所述的方法或上述第二方面所述的方法。
46.为实现上述目的,本技术实施例的第六方面提出了一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于使计算机执行上述第一方面所述的方法或上述第二方面所述的方法。
47.本技术实施例提出的模型的训练方法和装置、评分方法和装置、设备、介质,首先,通过获取n个样本对象的样本属性特征,其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征。为了提高模型的训练效率,通过对样本属性特征进行预处理,以得到样本初始特征,其中,样本初始特征的维度是n*m。由于模型的输入数据对模型输出的预测结果影响大,本技术实施例通过对样本初始特征进行分解处得到的样本隐含特征作为原始分类模型的输入,并对原始分类模型进行训练,得到的评分卡模型可以提高预测信用考评的准确率。然后将样本对象隐含特征输入至预设的原始分类模型,并通过样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。本技术实施例能够通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高,根据训练得到的评分卡模型对目标对象进行信用考评,提高了对目标对象的信用考评的准确率。
附图说明
48.图1是本技术实施例提供的模型的训练方法的流程图;
49.图2是图1中的步骤s150的流程图;
50.图3是图2中的步骤s230的流程图;
51.图4是本技术实施例提供的评分方法的第一流程图;
52.图5是本技术实施例提供的评分方法的第二流程图;
53.图6是本技术实施例提供的评分卡模型的训练装置的结构示意图;
54.图7是本技术实施例提供的评分装置的结构示意图;
55.图8是本技术实施例提供的计算机设备的硬件结构示意图。
具体实施方式
56.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
57.需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻
辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
58.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
59.首先,对本技术中涉及的若干名词进行解析:
60.人工智能(artificial intelligence,ai):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
61.奇异值分解(singular value decomposition,svd):是线性代数中的一种矩阵分解方法,使用svd对矩阵进行分解,能得到代表矩阵最本质变化的矩阵元素,即可以将复杂矩阵所代表的线性变换表示为由若干个简单矩阵所代表的线性变换组合的形式。
62.归一化处理:指将数据特征按比例缩放,使之落入一个小的特定区间,以去除数据特征的单位限制,将其转化为无量纲的纯数值,便于使用不同单位或量级的指标进行比较和加权。
63.独热编码(one-hot encoding):又称一位有效编码,其方法是使用x位状态寄存器来对x个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,只有一位有效,x为整数。
64.评分卡模型是一个应用广泛的模型,例如可以应用于征信评估、相关风险评估等。目前,对于评分卡模型的一般训练流程是:先获取大量的历史特征数据,并对历史特征数据进行清洗、特征工程等处理,再基于相关算法进行二分类建模;当前训练评分卡模型的方式,过于依赖大量的历史特征数据,训练出的评分卡模型的预测性能不佳。
65.基于此,本技术实施例提供了模型的训练方法和装置、评分方法和装置、设备、介质,训练得到的评分卡模型的预测性能有所提高。
66.本技术实施例提供的模型的训练方法和装置、评分方法和装置、设备、介质,具体通过如下实施例进行说明,首先描述本技术实施例中的一种模型的训练方法。
67.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
68.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
69.本技术实施例提供的模型的训练方法,涉及人工智能技术领域。本技术实施例提供的模型的训练方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现模型的训练方法的应用等,但并不局限于以上形式。
70.本技术可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络个人计算机(personal computer,pc)、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
71.请参阅图1,图1是本技术实施例提供的模型的训练方法的一个可选的流程图,该方法用于训练评分卡模型,图1中的方法可以具体包括但不限于步骤s110至步骤s150,下面结合图1对这五个步骤进行详细介绍。
72.步骤s110,获取n个样本对象的样本属性特征;其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征;
73.步骤s120,对样本属性特征进行预处理,以得到样本初始特征;其中,样本初始特征的维度是n*m;
74.步骤s130,对样本初始特征进行分解处理,以得到样本隐含特征;其中,样本隐含特征包括每一样本对象的样本对象隐含特征和每一样本属性特征的样本属性隐含特征,样本对象隐含特征的维度为n*k,样本属性隐含特征的维度为k*m,k为常数;
75.步骤s140,将样本对象隐含特征输入至预设的原始分类模型;
76.步骤s150,通过样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。
77.在一些实施例的步骤s110至步骤s150中,通过获取n个样本对象的样本属性特征,其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征。为了提高模型的训练效率,通过对样本属性特征进行预处理,以得到样本初始特征,其中,样本初始特征的维度是n*m。由于模型的输入数据对模型输出的预测结果影响大,本实施例通过对样本初始特征进行分解处得到的样本隐含特征作为原始分类模型的输入,对原始分类模型进行训练,得到的评分卡模型可以提高预测信用考评的准确率。然后将样本对象隐含特征输入至预设的原始分类模型,并通过样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。本技术实施例能够通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高,根据训练得到的评分卡模型对目标
对象进行信用考评,提高了对目标对象的信用考评的准确率。
78.在一些实施例的步骤s110中,为了训练得到评分卡模型,首先,获取n个样本对象的样本属性特征,其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征,即n表示样本对象的数量,m表示每一样本对象具有的样本属性特征的数量。具体地,n和m都为整数,当n取10,m取3,即表示获取10个样本对象的样本属性特征,且每一样本对象包括3个样本属性特征。例如,当样本对象包括年龄、收入、性别三个样本属性特征,则分别获取10个样本对象的年龄、收入、性别三个样本属性特征。
79.需要说明的是,样本对象可以是已存储到数据库的历史样本对象和/或潜在样本对象,其中,历史样本对象和/或潜在样本对象的用户类型包括个人用户和机构用户,且潜在样本对象表示将要开展业务的样本对象。
80.需要说明的是,一些实施例中样本属性特征的获取可以通过编写网络爬虫或者脚本程序,进行有目标性地爬取数据得到。
81.在一些实施例的步骤s120中,为了提高模型的训练效率,对样本属性特征进行预处理,以得到样本初始特征;其中,样本初始特征的维度是n*m。具体地,为了使获取的不同维度的数据特征具有相同的维度,提高模型训练的准确率,将得到的多个样本属性特征进行预处理,以得到具有相同维度的样本初始特征。
82.需要说明的是,对样本属性特征的预处理还可以包括对样本属性特征进行数据清洗,和/或缺失值处理,和/或异常值处理,以提高样本属性特征的数据质量,以避免因数据质量的问题对模型训练产生不良的影响,提高训练的模型的准确率。
83.在一些实施例的步骤s130中,为了避免输入数据对模型输出的预测结果的影响,通过对样本初始特征进行分解处理,以得到样本隐含特征。其中,样本隐含特征包括每一样本对象的样本对象隐含特征和每一样本属性特征的样本属性隐含特征,样本对象隐含特征的维度为n*k,样本属性隐含特征的维度为k*m,k为常数。具体地,可采用奇异值分解的方式对样本初始特征p进行分解处理,以得到每一样本对象的样本对象隐含特征n*k和每一样本属性特征的样本属性隐含特征k*m。本技术实施例通过对样本初始特征进行分解处理,能够有效地去除样本初始特征中的干扰信息,根据得到的样本隐含特征进行模型训练,减少了数据质量对模型训练的影响,提高了训练的模型的准确率。例如,样本属性隐含特征中包括身高和体重两个隐含特征,若身高是165厘米、体重是50公斤,则对应样本对象隐含特征中的隐含特征是样本对象的性别,且其性别为女性;若隐含特征中的身高是180厘米、体重是80公斤,则对应样本对象隐含特征中的隐含特征是样本对象的性别,且其性别为男性。
84.需要说明的是,本技术实施例还可以采用三角分解法、正交三角分解等分解方法对样本初始特征进行分解处理,在此不再赘述。
85.在一些实施例的步骤s140中,为了根据样本对象的样本对象隐含特征训练得到所需的评分卡模型,首先,将样本对象隐含特征输入至预设的原始分类模型。具体地,可以选择基于逻辑回归算法的原始分类模型,将样本对象隐含特征作为输入,训练该原始分类模型。
86.需要说明的是,原始分类模型也可以选择基于决策树、支持向量机、朴素贝叶斯等算法的原始分类模型,在此不再赘述。
87.在一些实施例的步骤s150中,为了训练得到评分卡模型,通过样本对象隐含特征
对原始分类模型进行模型训练,以得到评分卡模型,本技术实施例通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高,根据训练得到的评分卡模型对目标对象进行信用考评,提高了对目标对象的信用考评的准确率。
88.需要说明的是,本技术实施例提供的模型的训练方法用于训练得到评分卡模型,该评分卡模型可以应用于不同的业务场景,例如,对目标对象授信阶段提交的资料的信用考评,或对信贷后目标对象的用户信息的信用考评,或对已逾期的目标对象的可回款能力的信用考评等。
89.需要说明的是,在本技术的各个具体实施方式中,当涉及到需要根据用户信息、用户行为数据、用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时,都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关国家和地区的相关法律法规和标准。此外,当本技术实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本技术实施例能够正常运行的必要的用户相关数据。
90.在本技术的一些实施例中,样本属性特征至少包括以下特征类型之一:数值型特征、离散型特征,对应地,步骤s120具体至少包括以下步骤之一:
91.对数值型特征进行归一化处理,以得到样本初始特征;
92.对离散型特征进行独热编码处理,以得到样本初始特征。
93.在一些实施例,样本属性特征至少包括以下特征类型之一:数值型特征、离散型特征,为了避免输入数据对模型输出的预测结果的影响,对样本属性特征进行预处理,以得到样本初始特征。具体地,当样本属性特征为数值型特征,对数值型特征进行归一化处理,以得到样本初始特征;当样本属性特征为离散型特征,对离散型特征进行独热编码处理,以得到样本初始特征。
94.需要说明的是,对数值型特征进行归一化处理,以得到样本初始特征,具体地,对数值型的样本属性特征进行归一化处理后,使其映射到指定范围内,可默认是0至1之间,使不同的样本属性特征具有相同的维度,使其具有可比性,减少了输入数据对模型输出的预测结果的影响。
95.需要说明的是,对离散型特征进行独热编码处理,以得到样本初始特征,具体地,采用独热编码方法对离散型的的样本属性特征进行独热编码处理,以将离散型特征的取值扩展到欧式空间,离散型特征中的每个取值就对应欧式空间的某一点,即将得到的样本初始特征能够更好地进行特征之间的距离计算,减少了输入数据对模型输出的预测结果的影响。
96.请参阅图2,图2是本技术一些实施例的步骤s150的具体方法的流程图。在本技术的一些实施例中,步骤s150具体包括但不限于步骤s210至步骤s230,下面结合图2对这三个步骤进行详细介绍。
97.步骤s210,获取样本属性特征的原始评分信息;
98.步骤s220,通过样本对象隐含特征对原始分类模型进行模型训练,以得到目标评分信息;
99.步骤s230,根据目标评分信息和原始评分信息对原始分类模型进行模型训练,以
得到评分卡模型。
100.在一些实施例的步骤s210中,首先,获取样本属性特征的原始评分信息。具体地,获取n个样本对象的样本属性特征和每个每样属性特征对应的原始评分信息,从而根据原始评分信息与模型训练后的结果进行比较,以得到评分卡模型。
101.在一些实施例的步骤s220和步骤s230中,为了训练得到评分卡模型,通过样本对象隐含特征对原始分类模型进行模型训练,以得到目标评分信息。并根据得到的目标评分信息和原始评分信息对原始分类模型进行模型训练,以得到评分卡模型。本技术实施例能够通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高。
102.请参阅图3,图3是本技术一些实施例的步骤s230的具体方法的流程图。在本技术的一些实施例中,步骤s230具体包括但不限于步骤s310和步骤s320,下面结合图3对这两个步骤进行详细介绍。
103.步骤s310,根据目标评分信息和原始评分信息确定损失值;
104.步骤s320,根据目标评分信息和原始评分信息对原始分类模型进行参数调整,直至损失值满足预设训练结束条件,以得到评分卡模型。
105.在一些实施例的步骤s310中,为了提高所得到的评分卡模型对目标对象预测的准确率,在通过样本对象隐含特征对原始分类模型进行模型训练,得到目标评分信息后,根据目标评分信息和原始评分信息确定损失值。具体地,根据原始分类模型预设的损失函数对目标评分信息和原始评分信息进行损失计算,得到损失值。
106.需要说明的是,损失函数可以为0-1损失函数、绝对值损失函数、对数损失函数、指数损失函数、hinge损失函数等任一种,可以根据实际需求进行选择和调整,在此不再赘述。
107.在一些实施例的步骤s320中,根据目标评分信息和原始评分信息对原始分类模型进行参数调整,直至损失值满足预设训练结束条件,以得到评分卡模型。具体地,根据损失值对原始分类模型进行参数调整,并不断计算参数调整后得到的目标评分信息,直至根据目标评分信息和原始评分信息得到的损失值能够满足预设训练结束条件,得到评分卡模型和该评分卡模型对应的目标模型参数。本技术实施例能够通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高。
108.需要说明的是,预设训练结束条件可以为当损失值小于预设的损失值阈值,或当评分卡模型的识别准确率大于或等于预设的准确率阈值。
109.本技术实施例提供的一种模型的训练方法,用于训练评分卡模型,首先,获取n个样本对象的样本属性特征,其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征。为了提高模型的训练效率,通过对样本属性特征进行预处理,以得到样本初始特征,样本初始特征的维度是n*m。其中,样本属性特征至少包括以下特征类型之一:数值型特征、离散型特征,对应地,当样本属性特征为数值型特征,对数值型特征进行归一化处理,以得到样本初始特征;当样本属性特征为离散型特征,对离散型特征进行独热编码处理,以得到样本初始特征。为了避免模型的输入数据对模型输出的预测结果的影响,通过对样本初始特征进行分解处理,以得到样本隐含特征,其中,样本隐含特征包括每一样本对象的样本对象隐含特征和每一样本属性特征的样本属性隐含特征,样本对象隐含特征的维度为n*k,样本属性隐含特征的维度为k*m,k为常数。然后将样本对象隐含特
征输入至预设的原始分类模型,并通过样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。本技术实施例能够通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高,根据训练得到的评分卡模型对目标对象进行信用考评,提高了对目标对象的信用考评的准确率。
110.请参阅图4,图4是本技术实施例提供的评分方法的一个可选的流程图,图4中的方法可以具体包括但不限于步骤s410至步骤s450,下面结合图4对这五个步骤进行详细介绍。
111.步骤s410,获取目标对象的原始数据特征;
112.步骤s420,对原始数据特征进行预处理,以得到目标初始特征;
113.步骤s430,获取预设的属性隐含特征,属性隐含特征是上述模型的训练方法中的样本属性隐含特征;
114.步骤s440,对目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征;
115.步骤s450,将目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果;其中,考评结果用于表征目标对象的信用程度,评分卡模型根据如上述模型的训练方法训练得到。
116.在一些实施例的步骤s410中,为了实现对目标对象的信用考评,通过获取目标对象的原始数据特征,具体地,目标对象的原始数据特征的获取与上述实施例中样本属性特征的获取方式相同,在此不再赘述。
117.在一些实施例的步骤s420中,为了提高对目标对象的信用考评的效率,通过对原始数据特征进行预处理,以得到目标初始特征。具体地,原始数据特征至少包括以下特征类型之一:数值型特征、离散型特征,对应地,原始数据特征根据不同的特征类型进行预处理的具体过程与上述实施例根据不同的特征类型对样本属性特征进行预处理的过程相同,在此不再赘述。
118.在一些实施例的步骤s430和步骤s440中,本技术实施例是将样本对象隐含特征输入至预设的原始分类模型,进而根据样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。对目标对象进行评分时,通过获取预设的属性隐含特征,属性隐含特征是指上述模型的训练方法中的样本属性隐含特征。为了避免评分卡模型的输入数据对评分卡模型输出的预测结果的影响,对得到的目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征,其中,所得到的目标隐含特征满足训练的评分卡模型的输入形式。
119.在一些实施例的步骤s450中,为了实现对目标对象的信用考评,将得到的目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果;其中,考评结果用于表征目标对象的信用程度,评分卡模型根据上述模型的训练方法训练得到,在此不再赘述。
120.请参阅图5,图5是本技术实施例提供的评分方法的另一个可选的流程图。在本技术的一些实施例中,该评分方法具体还包括但不限于步骤s510和步骤s520,下面结合图5对这两个步骤进行详细介绍。
121.步骤s510,根据考评结果确定目标对象的信用等级;
122.步骤s520,根据信用等级为目标对象开放目标业务权限。
123.在一些实施例的步骤s510和步骤s520中,为了实现评分卡模型在实际业务场景下的应用,本技术实施例可以根据考评结果确定目标对象的信用等级,并根据信用等级为目
标对象开放目标业务权限。具体地,例如,在金融领域的风险控制场景下,可以根据目标对象的原始数据特征,利用预训练的评分卡模型,对目标对象的信用进行评分,得到目标对象的考评结果。并根据预设的考评标准阈值对考评结果进行判断,确定目标对象的信用等级,进而根据信用等级为目标对象开放目标业务权限,以减少在金融交易业务场景中存在的交易风险。
124.在一具体的实施例中,根据金融领域的风险控制场景下不同的业务阶段,可以分为三种类型的评分卡,如申请评分卡(application score card,a卡)、行为评分卡(behavior score card,b卡)和催收评分卡(collection score card,c卡)。例如,当对目标对象进行a卡的信用考评,则所获取的目标对象的原始数据特征可以为根据目标对象填写的基本信息,如年龄、婚姻、收入等原始数据特征,进而对原始数据特征进行预处理,以得到目标初始特征。获取预设的属性隐含特征,并对目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征。将目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果。并根据预设的a卡考评标准阈值对得到的考评结果进行判断,确定考评结果对应的信用等级,即得到了目标对象的信用等级。其中,a卡可划分为多个信用等级,每个信用等级对应一个评分区间,当根据得到的考评结果确定对应的评分区间和信用等级,则根据目标对象的信用等级可以确定目标对象开放的目标业务权限,如是否授信、授信的额度、授信的利率等。
125.在另一具体实施例中,例如,当对目标对象进行c卡的信用考评,由于c卡是对已逾期目标对象未来出催能力的考评,则原始数据特征中需要加入催收后目标对象的反应等属性数据。则通过对原始数据特征进行预处理,以得到目标初始特征。获取预设的属性隐含特征,并对目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征。将目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果。根据预设的c卡考评标准阈值对该考评结果进行判断,确定考评结果对应的信用等级,即得到了目标对象的信用等级,其中,c卡的信用等级可以划分为轻度、中轻度、中度和重度。每个信用等级对应了不同的业务权限,则根据目标对象的考评结果确定其在c卡下的信用等级,进而根据信用等级可以确定目标对象开放的目标业务权限,如进行催收的方式、催收周期等,例如,催收方式包括短信催收、电话催收、实地催收等,催收周期包括每周、每月等。
126.本技术实施例提供的一种评分方法,首先,获取目标对象的原始数据特征,为了提高对目标对象的信用考评的效率,对原始数据特征进行预处理,以得到目标初始特征。其中,原始数据特征至少包括以下特征类型之一:数值型特征、离散型特征,对应地,当原始数据特征为数值型特征,对数值型特征进行归一化处理,以得到目标初始特征;当原始数据特征为离散型特征,对离散型特征进行独热编码处理,以得到目标初始特征。为了避免评分卡模型的输入数据对评分卡模型输出的预测结果的影响,通过获取预设的属性隐含特征,并对目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征。然后将目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果;其中,考评结果用于表征目标对象的信用程度。最后,根据考评结果确定目标对象的信用等级,并根据信用等级为目标对象开放目标业务权限。本技术实施例通过提取样本对象的隐含特征以训练评分卡模型,训练得到的评分卡模型的预测性能有所提高,根据训练得到的评分卡模型对目标对象进行信用考评,提高了对目标对象的信用考评的准确率。
127.请参阅图6,图6是本技术实施例提供的评分卡模型的训练装置的结构示意图,该装置可以实现上述实施例的模型的训练方法,该装置包括第一获取模块610、第一预处理模块620、分解模块630、模型输入模块640和模型训练模块650。
128.第一获取模块610,用于获取n个样本对象的样本属性特征;其中,样本属性特征用于表征每一样本对象的对象属性,每一样本对象包括m个样本属性特征;
129.第一预处理模块620,用于对样本属性特征进行预处理,以得到样本初始特征;其中,样本初始特征的维度是n*m;
130.分解模块630,用于对样本初始特征进行分解处理,以得到样本隐含特征;其中,样本隐含特征包括每一样本对象的样本对象隐含特征和每一样本属性特征的样本属性隐含特征,样本对象隐含特征的维度为n*k,样本属性隐含特征的维度为k*m,k为常数;
131.模型输入模块640,用于将样本对象隐含特征输入至预设的原始分类模型;
132.模型训练模块650,用于通过样本对象隐含特征对原始分类模型进行模型训练,以得到评分卡模型。
133.需要说明的是,本技术实施例的评分卡模型的训练装置用于实现上述实施例的模型的训练方法,本技术实施例的评分卡模型的训练装置与前述的模型的训练方法相对应,具体的处理过程请参照前述的模型的训练方法,在此不再赘述。
134.请参阅图7,图7是本技术实施例提供的评分装置的结构示意图,该装置可以实现上述实施例的评分方法,该装置包括第二获取模块710、第二预处理模块720、第三获取模块730、内积计算模块740和评分处理模块750。
135.第二获取模块710,用于获取目标对象的原始数据特征;
136.第二预处理模块720,用于对原始数据特征进行预处理,以得到目标初始特征;
137.第三获取模块730,用于获取预设的属性隐含特征,属性隐含特征是上述任一实施例的模型的训练方法中的样本属性隐含特征;
138.内积计算模块740,用于对目标初始特征和属性隐含特征进行内积计算,以得到目标隐含特征;
139.评分处理模块750,用于将目标隐含特征输入至预训练的评分卡模型进行信用考评处理,以得到考评结果;其中,考评结果用于表征目标对象的信用程度,评分卡模型根据上述的模型的训练方法训练得到。
140.需要说明的是,本技术实施例的评分装置用于实现上述实施例的评分方法,本技术实施例的评分装置与前述的评分方法相对应,具体的处理过程请参照前述的评分方法,在此不再赘述。
141.本技术实施例还提供了一种计算机设备,该计算机设备包括:至少一个存储器,至少一个处理器,至少一个计算机程序,至少一个计算机程序被存储在至少一个存储器中,至少一个处理器执行至少一个计算机程序以实现上述实施例中任一种的模型的训练方法或评分方法。该计算机设备可以为包括平板电脑、车载电脑等任意智能终端。
142.请参阅图8,图8示意了另一实施例的一种计算机设备的硬件结构,该计算机设备包括:
143.处理器810,可以采用通用的中央处理器(central processing unit,cpu)、微处理器、应用专用集成电路(application specific integrated circuit,asic)、或者一个
或多个集成电路等方式实现,用于执行相关程序,以实现本技术实施例所提供的技术方案;
144.存储器820,可以采用只读存储器(read only memory,rom)、静态存储设备、动态存储设备或者随机存取存储器(random access memory,ram)等形式实现。存储器820可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器820中,并由处理器810来调用执行本技术实施例的模型的训练方法或评分方法;
145.输入/输出接口830,用于实现信息输入及输出;
146.通信接口840,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信;
147.总线850,在设备的各个组件(例如处理器810、存储器820、输入/输出接口830和通信接口840)之间传输信息;
148.其中处理器810、存储器820、输入/输出接口830和通信接口840通过总线850实现彼此之间在设备内部的通信连接。
149.本技术实施例还提供了一种存储介质,该存储介质为计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序用于使计算机执行上述实施例中模型的训练方法或评分方法。
150.存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
151.本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
152.本领域技术人员可以理解的是,图1至5中示出的技术方案并不构成对本技术实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
153.以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
154.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
155.本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
156.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
157.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
158.上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
159.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
160.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例的方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序的介质。
161.以上参阅附图说明了本技术实施例的优选实施例,并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本技术实施例的权利范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献