一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于实体列表的风险识别方法、装置、设备及存储介质与流程

2021-11-24 20:27:00 来源:中国专利 TAG:


1.本技术涉及金融科技(fintech)的机器学习技术领域,尤其涉及一种基于实体列表的风险识别方法、装置、设备及存储介质。


背景技术:

2.随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
3.随着计算机技术的发展,联邦学习的应用越来越广泛。当前,根据用户与实体之间的交互流水信息进行风险预测时,需要先对实体进行分类,进而将实体类别和动作的类型、时间交互后,对动作量进行聚合,例如,客户凌晨时分从消费金融类公司的申请贷款总笔数,消费金融类为实体类别,申请贷款和凌晨时分分别对应动作类型和时间,总笔数对应动作量的聚合,从而进行模型预测,然而,分类需要人工标注时间成本较高且无法保证覆盖所有实体主题,进一步地,部分实体可能没有具体信息进行类别判断,比如实体可能只有极短的名称描述,使得无法判断实体实际用途,进而导致模型预测的准确度较低。


技术实现要素:

4.本技术的主要目的在于提供一种基于实体列表的风险识别方法、装置、设备及存储介质,旨在解决现有技术中的模型预测的准确度低的技术问题。
5.为实现上述目的,本技术提供一种基于实体列表的风险识别方法,所述基于实体列表的风险识别方法包括:
6.获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息;
7.基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的;
8.基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果。
9.可选地,所述基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量的步骤包括:
10.基于各所述交互流水数据,通过预设实体词典将各所述实体信息转化为各实体向量;
11.对各所述交互流水数据对应的动作信息进行特征预处理操作,获得各所述动作信息对应的特征向量;
12.将各所述实体向量和各所述特征向量输入所述预设向量共享模型,输出各所述交互特征向量。
13.可选地,所述基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果的步骤包括:
14.将各所述交互特征向量进行纵向聚合,获得聚合交互向量;
15.基于所述聚合交互向量,通过所述风险预测模型对所述待预测用户进行预测,获得所述风险识别结果。
16.可选地,在所述基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于待训练交互流水数据对应的实体向量以及动作特征向量进行迭代训练优化得到的步骤之前,所述基于实体列表的风险识别方法还包括:
17.获取待训练向量共享模型;
18.获取样本用户和各样本实体之间的待训练交互流水数据;
19.基于各所述待训练交互流水数据和预设实体词典,将各所述待训练交互流水数据对应的样本实体转化为各所述待训练实体向量;
20.提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量;
21.基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量。
22.可选地,所述提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量的步骤包括:
23.提取各所述待训练交互流水数据对应的动作特征,并将各所述动作特征进行分箱处理,获得各分组动作信息;
24.对各所述分组动作信息进行编码,获得各所述样本实体对应的待训练动作特征向量。
25.可选地,在所述基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量的步骤之后,所述基于实体列表的风险识别方法还包括:
26.获取待训练风险预测模型;
27.将各所述待训练交互向量进行纵向聚合,获得训练聚合交互向量;
28.基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型。
29.可选地,所述基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型的步骤包括:
30.将所述训练聚合交互向量输入所述待训练风险预测模型,输入所述样本用户对应的预测标签;
31.基于所述预测标签和所述样本用户对应的真实标签之间的差异度,计算模型损失;
32.基于所述模型损失计算的梯度,对所述待训练风险预测模型进行迭代训练优化,获得所述风险预测模型。
33.本技术还提供一种基于实体列表的风险识别装置,所述基于实体列表的风险识别
装置为虚拟装置,所述基于实体列表的风险识别装置包括:
34.获取模块,用于获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息;
35.特征提取模块,用于基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的;
36.预测模块,用于基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果。
37.本技术还提供一种基于实体列表的风险识别设备,所述基于实体列表的风险识别设备为实体设备,所述基于实体列表的风险识别设备包括:存储器、处理器以及存储在所述存储器上的基于实体列表的风险识别程序,所述基于实体列表的风险识别程序被所述处理器执行时可实现如上述的基于实体列表的风险识别方法的步骤。
38.本技术还提供一种存储介质,所述介质为可读存储介质,所述可读存储介质上存储有基于实体列表的风险识别程序,所述基于实体列表的风险识别程序被处理器执行时实现如上述的基于实体列表的风险识别方法的步骤。
39.本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的基于实体列表的风险识别方法的步骤或者实现如上述的数据预测方法的步骤。
40.本技术提供了一种基于实体列表的风险识别方法、装置、设备及存储介质,相比于现有技术采用的根据用户与实体之间的交互流水信息进行模型预测时,需事先对实体进行分类以根据实体类别和交互动作信息进行风险预测的技术手段,本技术首先获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息,进而基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的,进一步地,基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果,实现了基于各所述交互流水数据中的实体信息和动作信息,通过模型直接进行预测,以实体本身直接作为信息特征,从而无需事先对实体进行分类,进一步地,由于模型输入的是实体本身,不依赖于实体的描述,使得对隐藏描述信息的实体也能够加以利用,进而使得预设向量共享模型更够学习到各所述交互流水数据中最有效的信息,从而获得交互特征向量,进而提高所述风险预测模型对各所述交互向量识别能力,提升了模型预测的精准度,克服了现有技术中需事先人工对实体进行分类,然而,部分实体可能没有具体信息进行类别判断,使得无法判断实体实际用途,进而导致模型预测的准确度较低的技术缺陷,从而提高了模型预测的准确性。
附图说明
41.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
42.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而
言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
43.图1为本技术基于实体列表的风险识别方法第一实施例的流程示意图;
44.图2为本技术基于实体列表的风险识别方法第二实施例的流程示意图;
45.图3为本技术基于实体列表的风险识别方法第三实施例的流程示意图;
46.图4为本技术基于实体列表的风险识别方法中的模型结构框架示意图;
47.图5为本技术实施例中基于实体列表的风险识别方法涉及的硬件运行环境的设备结构示意图。
48.本技术的目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
50.本技术实施例提供一种基于实体列表的风险识别方法,在本技术基于实体列表的风险识别方法的第一实施例中,参照图1,所述基于实体列表的风险识别方法包括:
51.步骤s10,获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息;
52.在本实施例中,需要说明的是,所述实体可以是实物,也可以是个虚拟概念,实体可是使用实体序号进行表示,例如,用户在银行申请了贷款,则银行是一个实体,或者用户点击了某个app,则该app本身也是一个实体,进一步地,所述交互流水数据为用户与实体之间的交互信息,所述交互信息包括实体信息和动作信息,其中,所述动作信息包括动作类型、时间、动作量(次数、天数、金额等),例如,用户在近一个月内点击app的次数流水信息。
53.获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息,具体地,在预设观察时间周期内,收集待预测用户与各所述实体之间的交互信息。
54.步骤s20,基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的;
55.在本实施例中,基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的,具体地,首先,基于预设实体词典,其中,所述实体词典中存储了各所述实体信息中的实体序号对应的实体向量,将各所述交互流水数据对应的实体信息转化为各实体向量,进而提取所述待预测用户与各所述实体之间的交互流水数据对应的动作信息,以将各所述实体向量和各所述实体向量对的动作信息进行拼接,进而输入至所述预设向量共享模型中,获得各所述交互特征向量,由于以实体本身直接作为特征,即使实体隐藏了描述信息,也能够通过模型学习到实体本身的有效信息。
56.其中,所述基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量的步骤包括:
57.步骤s21,基于各所述交互流水数据,通过预设实体词典将各所述实体信息转化为各实体向量;
58.在本实施例中,需要说明的是,所述预设实体词典预先存储了实体序号对应的实体向量,所述实体向量的向量长度可以人工设定,在此不作限制。
59.基于各所述交互流水数据,通过预设实体词典将各所述实体信息转化为各实体向量,具体地,在所述预设实体词典中,根据各所述实体信息对应的实体序号,确定各所述实体序号分别对应的实体向量。
60.步骤s22,对各所述交互流水数据对应的动作信息进行特征预处理操作,获得各所述动作信息对应的特征向量;
61.在本实施例中,需要说明的是,所述动作信息为用户于实体之间的交互信息,例如,用户对网站的点击次数。
62.对各所述交互流水数据对应的动作信息进行特征预处理操作,获得各所述动作信息对应的特征向量,具体地,提取各所述交互流水数据对应的动作信息,将各所述动作信息进行分箱处理以及编码处理,其中,所述分箱处理为将动作信息进行数据分段的处理方式,所述编码处理包括独热编码(one

hot)以及其他数据编码处理等方法,进而获得各所述动作信息分别对应的特征向量,从而使得获得特征向量变得离散化,以增强模型的稳定性避免模型过拟合;
63.步骤s23,将各所述实体向量和各所述特征向量输入所述预设向量共享模型,输出各所述交互特征向量。
64.在本实施例中,将各所述实体向量和各所述特征向量输入所述预设向量共享模型,输出各所述交互特征向量,具体地,分别将各所述实体向量以及与各所述实体向量关联的各特征向量进行拼接,获得各拼接交互信息,进而将各所述拼交互信息输入所述预设向量共享模型,获得各所述交互特征向量。
65.步骤s30,基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果。
66.在本实施例中,基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果,具体地,将各所述交互特征向量进行纵向聚合,获得聚合交互向量,进而将所述聚合交互向量输入所述风险预测模型中,以对所述待预测用户进行风险识别,获得所述风险识别结果。
67.其中,所述基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果的步骤包括:
68.步骤s31,将各所述交互特征向量进行纵向聚合,获得聚合交互向量;
69.在本实施例中,需要说明的是,所述聚合包括求和和求平均等处理方式。
70.将各所述交互特征向量进行纵向聚合,获得聚合交互向量,具体地,将各所述交互特征向量进行求和,获得所述待预测用户对应的聚合交互向量。
71.步骤s32,基于所述聚合交互向量,通过所述风险预测模型对所述待预测用户进行预测,获得所述风险识别结果。
72.基于所述聚合交互向量,通过所述风险预测模型对所述待预测用户进行预测,获得所述风险识别结果,具体地,将所述聚合交互向量输入所述风险预测模型,以对所述待预测用户进行风险预测,获得所述风险识结果,以根据所述风险识别结果判断所述待预测用户是否为目标用户。
73.本技术实施例提供了一种基于实体列表的风险识别方法,相比于现有技术采用的根据用户与实体之间的交互流水信息进行模型预测时,需事先对实体进行分类以根据实体类别和交互动作信息进行风险预测的技术手段,本技术实施例首先获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息,进而基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的,进一步地,基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果,实现了基于各所述交互流水数据中的实体信息和动作信息,通过模型直接进行预测,以实体本身直接作为信息特征,从而无需事先对实体进行分类,进一步地,由于模型输入的是实体本身,不依赖于实体的描述,使得对隐藏描述信息的实体也能够加以利用,进而使得预设向量共享模型更够学习到各所述交互流水数据中最有效的信息,从而获得交互特征向量,进而提高所述风险预测模型对各所述交互向量识别能力,提升了模型预测的精准度,克服了现有技术中需事先人工对实体进行分类,然而,部分实体可能没有具体信息进行类别判断,使得无法判断实体实际用途,进而导致模型预测的准确度较低的技术缺陷,从而提高了模型预测的准确性。
74.进一步地,参照图2,基于本技术中第一实施例,在本技术的另一实施例中,所述在所述基于各所述交互流水数据和预设向量共享模型,构建各交互特征向量,其中,所述预设向量共享模型是通过基于待训练交互流水数据对应的实体向量以及动作特征向量进行迭代训练优化得到的步骤之前,所述基于实体列表的风险识别方法还包括:
75.步骤a10,获取待训练向量共享模型;
76.步骤a20,获取样本用户和各样本实体之间的待训练交互流水数据;
77.在本实施例中,需要说明的是,用户因为某种原因和需求与某个实体发生了关联动作时,就会产生交互流水数据,例如,用户在金融公司贷款的总贷款笔数或者用户点击某个app的次数等
78.步骤a30,基于各所述待训练交互流水数据和预设实体词典,将各所述待训练交互流水数据对应的样本实体转化为各所述待训练实体向量;
79.在本实施例中,基于各所述待训练交互流水数据和预设实体词典,将各所述待训练交互流水数据对应的样本实体转化为各所述待训练实体向量,具体地,基于各所述待训练交互流水数据和预设实体词典,确定各所述样本实体的实体序号对应的待训练实体向量。
80.步骤a40,提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量;
81.在本实施例中,需要说明的是,所述动作特征为所述样本用户和样本实体进行交互时的关联动作。例如,用户对某个app的点击次数等。
82.提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量,具体地,分别提取所述样本用户和各所述样本实体之间的待训练交互流水数据中对应的动作特征,并将各所述动作特征进行分箱处理以及独热编码处理,获得各所述样本实体对应的待训练动作特征向量。
83.其中,所述提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特
征进行特征预处理操作,获得各待训练动作特征向量的步骤包括:
84.步骤a41,提取各所述待训练交互流水数据对应的动作特征,并将各所述动作特征进行分箱处理,获得各分组动作信息;
85.在本实施例中,需要说明的是,所述分箱处理为将数据进行分组或者分段的处理方式。
86.提取各所述待训练交互流水数据对应的动作特征,并将各所述动作特征进行分箱处理,获得各分组动作信息,具体地,在所述待训练交互流水数据提取各动作特征后,将各所述动作特征进行分箱处理,获得各分组动作信息,从而使得各所述分组动作信息变得离散化,避免模型过拟合的情况。
87.步骤a42,对各所述分组动作信息进行编码,获得各所述样本实体对应的待训练动作特征向量。
88.在本实施例中,需要说明的是,所述编码为将分组动作信息进行向量化的处理方式。
89.对各所述分组动作信息进行编码,获得各所述样本实体对应的待训练动作特征向量,具体地,分别将各所述分组动作信息进行独热编码(one

hot),获得各所述样本实体对应的待训练动作特征向量。
90.步骤a50,基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量。
91.在本实施例中,基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量,具体地,分别将各所述待训练实体向量和各所述样本实体对应的待训练动作特征向量进行拼接,获得各待训练拼接交互向量,并将各所述待训练拼接交互向量作为所述待训练向量共享模型的输入,以迭代训练优化所述待训练向量共享模型,获得所述预设向量共享模型,并输出各待训练交互向量。
92.本技术实施例提供了一种基于实体列表的风险识别方法,也即,获取待训练向量共享模型,以及获取样本用户和各样本实体之间的待训练交互流水数据,进而基于各所述待训练交互流水数据和预设实体词典,将各所述待训练交互流水数据对应的样本实体转化为各所述待训练实体向量,进一步地,提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量,进而基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量,实现了通过样本实体本身的特征以及动作特征向量对所述待训练向量共享模型进行训练,无需根据实体的描述以对实体进行分类,使得模型也能够学习到隐藏信息的实体的有效信息,提高模型预测的可靠性,为克服现有技术中根据用户与实体之间的交互流水信息进行模型预测时,需事先人工对实体进行分类,然而,部分实体可能没有具体信息进行类别判断,使得无法判断实体实际用途,进而导致模型预测的准确度较低的技术缺陷奠定了基础。
93.进一步地,参照图3,基于本技术中第一实施例,在本技术的另一实施例中,所述在所述基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量的步骤之后,所述
基于实体列表的风险识别方法还包括:
94.步骤b10,获取待训练风险预测模型;
95.步骤b20,将各所述待训练交互向量进行纵向聚合,获得训练聚合交互向量;
96.在本实施例中,将各所述待训练交互向量进行纵向聚合,获得训练聚合交互向量,具体地,将各所述待训练交互向量进行纵向求和,从而获得所述训练聚合交互向量。
97.步骤b30,基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型。
98.在本实施例中,基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型,具体地,将所述训练聚合交互向量输入所述待训练风险预测模型,输出预测标签,进而通过预设损失函数计算所述预测标签和所述待预测用户对应的真实标签之间的模型损失,进而结合反向传播算法对所述待训练风险预测模型的参数进行计算,以优化所述待训练风险预测模型,直至达到预设训练结束条件,获得所述风险预测模型,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件。
99.其中,所述基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型的步骤包括:
100.步骤b31,将所述训练聚合交互向量输入所述待训练风险预测模型,输入所述样本用户对应的预测标签;
101.在本实施例中,将所述训练聚合交互向量输入所述待训练风险预测模型,输入所述样本用户对应的预测标签,具体地,将所述训练聚合交互向量作为所述待训练风险预测模型的输入,进而获得所述样本用户对应的预测标签。
102.步骤b32,基于所述预测标签和所述样本用户对应的真实标签之间的差异度,计算模型损失;
103.在本实施例中,基于所述预测标签和所述样本用户对应的真实标签之间的差异度,计算模型损失,具体地,根据所述预测标签和所述样本用户对应的真实标签之间的差异度,通过预设损失函数计算模型损失,以根据模型损失迭代优化所述待训练风险预测模型。
104.步骤b33,基于所述模型损失计算的梯度,对所述待训练风险预测模型进行迭代训练优化,获得所述风险预测模型。
105.在本实施例中,基于所述模型损失计算的梯度,对所述待训练风险预测模型进行迭代训练优化,获得所述风险预测模型,具体地,根据模型损失,计算模型对应的梯度,进而基于所述梯度,对所述待训练风险预测模型进行迭代训练,以优化所述待训练风险预测模型,进而判断所述优化后的待训练风险预测模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若满足,则获得所述风险预测模型,若不满足,则返回执行步骤:获取样本用户和各样本实体之间的待训练交互流水数据。
106.本技术实施例提供了一种基于实体列表的风险识别方法,也即,获取待训练风险预测模型,进而将各所述待训练交互向量进行纵向聚合,获得训练聚合交互向量,进一步地,基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型,实现了根据各样本实体对应的待训练实体向量以及待训练动作特征向量构建的待训练交互向量,对待训练风险预测模型进行迭代训练,使得所述待训练风险预测模型能够学
习到各样本实体本身的有效信息,进而通过训练得到的风险预测模型在进行预测过程中,不依赖实体的描述,从而提高所述风险一簇额模型的识别能力,为克服现有技术中根据用户与实体之间的交互流水信息进行模型预测时,需事先人工对实体进行分类,然而,部分实体可能没有具体信息进行类别判断,使得无法判断实体实际用途,进而导致模型预测的准确度较低的技术缺陷奠定了基础。
107.参照图4,图4为本技术基于实体列表的风险识别方法中的模型结构框架示意图,其中,人所述待预测用户,动作为所述动作信息,实为所述实体,实体emb词典为所述预设实体词典,实体emb为所述实体向量,动作特征为所述特征向量,交互emb为所述交互特征向量,sum_emb为所述聚合交互向量,共享dnn为所述预设向量共享模型,dnn为所述风险预测模型,y为所述风险识别结果。
108.参照图5,图5是本技术实施例方案涉及的硬件运行环境的设备结构示意图。
109.如图5所示,该基于实体列表的风险识别设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
110.可选地,该基于实体列表的风险识别设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi

fi接口)。
111.本领域技术人员可以理解,图5中示出的基于实体列表的风险识别设备结构并不构成对基于实体列表的风险识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
112.如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于实体列表的风险识别程序。操作系统是管理和控制基于实体列表的风险识别设备硬件和软件资源的程序,支持基于实体列表的风险识别程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于实体列表的风险识别方法系统中其它硬件和软件之间通信。
113.在图5所示的基于实体列表的风险识别设备中,处理器1001用于执行存储器1005中存储的基于实体列表的风险识别程序,实现上述任一项所述的基于实体列表的风险识别方法的步骤。
114.本技术基于实体列表的风险识别设备具体实施方式与上述基于实体列表的风险识别方法各实施例基本相同,在此不再赘述。
115.本技术还提供一种基于实体列表的风险识别装置,所述基于实体列表的风险识别装置包括:
116.获取模块,用于获取待预测用户和各实体之间分别对应的交互流水数据,其中,所述交互流水数据包括实体信息和动作信息;
117.特征提取模块,用于基于各所述交互流水数据和预设向量共享模型,构建各交互
特征向量,其中,所述预设向量共享模型是通过基于预先收集的交互流水数据对应的待训练实体向量以及待训练动作特征向量进行迭代训练优化得到的;
118.预测模块,用于基于各所述交互特征向量,通过风险预测模型对所述待预测用户进行预测,获得风险识别结果。
119.可选地,所述特征提取模块还用于:
120.基于各所述交互流水数据,通过预设实体词典将各所述实体信息转化为各实体向量;
121.对各所述交互流水数据对应的动作信息进行特征预处理操作,获得各所述动作信息对应的特征向量;
122.将各所述实体向量和各所述特征向量输入所述预设向量共享模型,输出各所述交互特征向量。
123.可选地,所述预测模块还用于:
124.将各所述交互特征向量进行纵向聚合,获得聚合交互向量;
125.基于所述聚合交互向量,通过所述风险预测模型对所述待预测用户进行预测,获得所述风险识别结果。
126.可选地,所述风险识别装置还用于:
127.获取待训练向量共享模型;
128.获取样本用户和各样本实体之间的待训练交互流水数据;
129.基于各所述待训练交互流水数据和预设实体词典,将各所述待训练交互流水数据对应的样本实体转化为各所述待训练实体向量;
130.提取各所述待训练交互流水数据对应的动作特征,以对各所述动作特征进行特征预处理操作,获得各待训练动作特征向量;
131.基于各所述待训练实体向量和各所述待训练动作特征向量,对所述待训练向量共享模型进行迭代训练,获得所述预设向量共享模型,并输出各待训练交互向量。
132.可选地,所述风险识别装置还用于:
133.提取各所述待训练交互流水数据对应的动作特征,并将各所述动作特征进行分箱处理,获得各分组动作信息;
134.对各所述分组动作信息进行编码,获得各所述样本实体对应的待训练动作特征向量。
135.可选地,所述风险识别装置还用于:
136.获取待训练风险预测模型;
137.将各所述待训练交互向量进行纵向聚合,获得训练聚合交互向量;
138.基于所述训练聚合交互向量,对待训练风险预测模型进行迭代训练优化,获得风险预测模型。
139.可选地,所述风险识别装置还用于:
140.将所述训练聚合交互向量输入所述待训练风险预测模型,输入所述样本用户对应的预测标签;
141.基于所述预测标签和所述样本用户对应的标签之间的差异度,计算模型损失;
142.基于所述模型损失计算的梯度,对所述待训练风险预测模型进行迭代训练优化,
获得所述风险预测模型。
143.本技术基于实体列表的风险识别装置的具体实施方式与上述基于实体列表的风险识别方法各实施例基本相同,在此不再赘述。
144.本技术实施例提供了一种存储介质,所述介质为可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于实体列表的风险识别方法的步骤。
145.本技术可读存储介质具体实施方式与上述基于实体列表的风险识别方法各实施例基本相同,在此不再赘述。
146.本技术实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于实体列表的风险识别方法的步骤。
147.本技术计算机程序产品具体实施方式与上述基于实体列表的风险识别方法各实施例基本相同,在此不再赘述。
148.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利处理范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献