一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

风险信息确定方法、模型训练方法、设备、程序产品与流程

2021-12-07 21:49:00 来源:中国专利 TAG:


1.本公开涉及人工智能技术,尤其涉及一种风险信息确定方法、模型训练方法、设备、程序产品。


背景技术:

2.目前,网络购物平台已经发展的越来越成熟,各个网络购物平台也会推出多种优惠活动,以促进商品的成交量。随着优惠活动的增多,催生了基于网络购物平台的黑灰产业。一些用户储备大量的网络购物平台的账号,并利用这些账号参与优惠活动,进行套利。
3.为了应对网络购物平台的黑灰产业,现有技术中存风险评估技术,通过对用户参与优惠活动的全链路各个环节进行风险评估,是防止黑灰产业的有效手段。风险评估技术又分为基于规则的风险评估方法,以及基于算法模型的风险评估方法。
4.其中,基于规则的风险评估方法对专家经验的依赖性较强,且规则发布周期长,对黑灰产业的打击相对滞后。而基于算法模型的风险评估方法中,由于参与优惠活动产生的数据不仅特征维度高,且稀疏性强,传统的建模或者神经网络结构,无法有效的学习到这些数据的特性。


技术实现要素:

5.本公开提供一种风险信息确定方法、模型训练方法、设备、程序产品,以解决现有技术中无法准确的评估业务活动风险的问题。
6.本公开的第一个方面是提供一种业务活动的风险信息确定方法,包括:
7.获取与所述业务活动对应的待评估业务数据;所述待评估业务数据包括多个数据特征,每个所述数据特征对应于一个特征域;
8.将与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;
9.将与所述特征域对应的特征向量输入注意力层,得到包括各个所述特征向量之间关系的总向量;
10.将所述总向量输入确定子模块,利用所述确定子模块确定与所述待评估业务数据对应的期望;
11.根据所述期望确定与所述待评估业务数据对应的风险信息,所述风险信息用于指示所述待评估业务数据的风险程度。
12.本公开的第二个方面是提供一种用于评估业务活动风险的模型的训练方法,所述模型包括:与每个特征域对应的编码网络、注意力层、确定子模块;
13.所述方法包括:
14.获取与所述业务活动对应的多个样本数据;每一所述样本数据包括多个数据特征,每个所述数据特征对应于一个特征域;
15.将每个样本数据中与同一特征域对应的所述数据特征,输入与所述特征域对应的
编码网络,得到与所述特征域对应的特征向量;
16.将与所述特征域对应的特征向量输入所述注意力层,得到与每个样本数据对应的包括各个所述特征向量之间关系的总向量;
17.将每个样本数据的所述总向量输入所述确定子模块,利用所述确定子模块确定每个所述样本数据的期望,并根据每一样本数据的期望训练所述模型,得到用于评估业务活动风险的模型。
18.本公开的第三个方面是提供一种业务活动的风险信息确定装置,包括:
19.获取模块,用于获取与所述业务活动对应的待评估业务数据;所述待评估业务数据包括多个数据特征,每个所述数据特征对应于一个特征域;
20.编码模块,用于将与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;
21.嵌入模块,用于将与所述特征域对应的特征向量输入注意力层,得到包括各个所述特征向量之间关系的总向量;
22.期望确定模块,用于将所述总向量输入确定子模块,利用所述确定子模块确定与所述待评估业务数据对应的期望;
23.风险确定模块,用于根据所述期望确定与所述待评估业务数据对应的风险信息,所述风险信息用于指示所述待评估业务数据的风险程度。
24.本公开的第四个方面是提供一种用于评估业务活动风险的模型的训练装置,所述模型包括:与每个特征域对应的编码网络、注意力层、确定子模块;
25.所述装置包括:
26.获取模块,用于获取与所述业务活动对应的多个样本数据;每一所述样本数据包括多个数据特征,每个所述数据特征对应于一个特征域;
27.编码模块,用于将每个样本数据中与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;
28.嵌入模块,用于将与所述特征域对应的特征向量输入所述注意力层,得到与每个样本数据对应的包括各个所述特征向量之间关系的总向量;
29.期望确定模块,用于将每个样本数据的所述总向量输入所述确定子模块,利用所述确定子模块确定每个所述样本数据的期望;
30.训练模块,用于根据每一样本数据的期望训练所述模型,得到用于评估业务活动风险的模型。
31.本公开的第五个方面是提供一种电子设备,包括:
32.存储器;
33.处理器;以及
34.计算机程序;
35.其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如上述第一方面所述的业务活动的风险信息确定方法或第二方面所述的用于评估业务活动风险的模型的训练方法。
36.本公开的第六个方面是提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面所述的业务活动的风险信息确定方
法或第二方面所述的用于评估业务活动风险的模型的训练方法。
37.本公开的第七个方面是提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的业务活动的风险信息确定方法或第二方面所述的用于评估业务活动风险的模型的训练方法。
38.本公开提供的风险信息确定方法、模型训练方法、设备、程序产品的技术效果是:
39.本公开提供的风险信息确定方法、模型训练方法、设备、程序产品,包括:获取与业务活动对应的待评估业务数据;待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域;将与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量;将与特征域对应的特征向量输入注意力层,得到包括各个特征向量之间关系的总向量;将总向量输入确定子模块,利用确定子模块确定与待评估业务数据对应的期望;根据期望确定与待评估业务数据对应的风险信息,风险信息用于指示待评估业务数据的风险程度。本公开提供的方案中,通过与特征域对应的编码网络,对属于该特征域的数据特征进行处理,能够充分进行域内信息的组合和强化,得到该特征域的特征向量,进而可以在业务活动的数据特征稀疏性强的情况下,准确的提取业务活动的特征向量,能够准确的得到业务活动的风险评估结果。
附图说明
40.图1为本技术一示例性实施例示出的业务活动的风险信息确定方法的流程示意图;
41.图2为本技术一示例性实施例示出的风险评估模型的示意图;
42.图3为本技术一示例性实施例示出的各编码网络的结构示意图;
43.图4为本技术一示例性实施例示出的注意力层的处理过程示意图;
44.图5为本技术另一示例性实施例示出的业务活动的风险信息确定方法的流程示意图;
45.图6为本技术一示例性实施例示出的用于评估业务活动风险的模型的训练方法的流程示意图;
46.图7为本技术一示例性实施例示出的风险评估模型的示意图;
47.图8为本技术另一示例性实施例示出的用于评估业务活动风险的模型的训练方法的流程示意图;
48.图9为本技术一示例性实施例示出的业务活动的风险信息确定装置的结构图;
49.图10为本技术另一示例性实施例示出的业务活动的风险信息确定装置的结构图;
50.图11为本技术一示例性实施例示出的用于评估业务活动风险的模型的训练装置的结构图;
51.图12为本技术另一示例性实施例示出的用于评估业务活动风险的模型的训练装置的结构图;
52.图13为本发明一示例性实施例示出的电子设备的结构图。
具体实施方式
53.目前,为了应对网络购物平台的黑灰产业,需要风险评估技术对业务活动进行有
效的评估,以确定该业务活动是否容易被黑灰产业利用。风险评估技术在业务活动的全链路各个环节中,对营销资源进行实时的风险评估,从而能够对中高风险的套利行为及时采取资源下线或账号拦截等一系列风控处置手段。风险评估技术又分为基于规则的风险评估方法,以及基于算法模型的风险评估方法。
54.其中,可以根据规则产生方式划分对基于规则的风险评分方法进一步的划分,可以分为基于专家经验的规则和使用特征重要性挖掘等技术产生的规则;规则使用方式划分,可以分为单一规则和组合规则,单一规则使用一条判定规则即可完成判断,组合规则需要其他条件或规则组合判断。
55.但是,基于规则的风险评分方法强依赖专家经验,规则的制定发布周期较长,面对黑灰产的实时对抗存在滞后性。此外,随着业务的变化需要不断的迭代规则,不然会面临对抗效果衰减的情况。面对复杂业务场景海量维度特征的情况下,即便是专家也很难制定覆盖所有风险问题的线上规则。通过规则来进行风险评估,不具备方案的整体迁移性,需要根据不同场景个性化定制。
56.其中,基于算法模型的风险评估方法即采用机器学习、深度学习等人工智能技术,对营销场景数据进行特征加工、模型训练,根据模型结果进行风险预测。
57.机器学习领域的异常检测技术在电商风控领域发挥着至关重要的作用,与传统的监督建模对抗不同,无监督的异常检测技术不需要特定的标签训练,能自主的挖掘数据中的模式与联系,更快、更广的发掘异常数据。
58.一般来说,异常检测方法主要分为以下四类:(1)统计检验方法,一般假设正常数据服从正态分布,异常数据则相对正常数据有较大的偏移;(2)时序检测方法,通过检测序列中与模式不一致的异常点,比如突然的上升或下降、趋势改变、层级变换等等来发掘异常数据;(3)监督学习方法,将异常检测转化为二分类的问题,正常数据一类,异常数据一类,并利用成熟的二分类机器学习或深度学习算法来进行异常检测;(4)无监督学习方法,一般通过聚类的方法来进行检测,如果某个数据和类中心都相对较远,则该数据为异常数据。
59.但是,基于聚类或空间划分的风险挖掘方法依然无法处理海量高维的特征情况。而基于先降维后挖掘离群点的方法,尽可能保留高维特征蕴含的信息,后将低维向量通过聚类或者空间划分找出异常点。两个训练过程是解耦的,具有方向不同的两个优化目标,一些关键信息可能会在降维的过程中损失,这会导致最终的效果很容易到达次优解。网络购物平台中业务活动的特征不仅维度高、稀疏性强,且特征按域划分明显,传统建模或者神经网络拟合均无法很好的学到稀疏特征域之间的关系。此外,模型最终输出的异常分值,通常是以样本距各个类簇中心距离或子空间离散程度来表示,分值浮动范围大不能对业务起到很好的量化指导意义。
60.为了解决上述技术问题,本技术提供的方案中,按特征域划分业务活动的数据特征,并通过与特征域对应的各编码网络提取各特征域的数据特征的特征向量,再根据与各特征域对应的特征向量对业务活动进行风险评估,这种方式可以在业务活动的数据特征稀疏性强的情况下,准确的提取业务活动的特征向量,进而可以准确的得到业务活动的风险评估结果。
61.图1为本技术一示例性实施例示出的业务活动的风险信息确定方法的流程示意图。
62.如图1所示,本技术提供的业务活动的风险信息确定方法,包括:
63.步骤101,获取与业务活动对应的待评估业务数据;待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域。
64.其中,本技术提供的方法可以由具备计算能力的电子设备来执行,该电子设备比如可以是电商平台的后台服务器。
65.具体的,可以预先训练得到风险评估模型,并将训练完毕的风险评估模型部署在电子设备中。电子设备可以基于部署的风险评估模型,对业务活动的待评估业务数据进行评估处理。
66.图2为本技术一示例性实施例示出的风险评估模型的示意图。
67.如图2所示,本技术提供的风险评估模型中可以包括多个编码网络21、注意力层22、确定子模块23。编码网络21、注意力层22、确定子模块23依次连接,业务活动的待评估业务数据可以被输入到编码网络21中,基于编码网络21、注意力层22、确定子模块23依次进行处理,可以得到该待评估业务数据的期望,电子设备可以再根据该期望,确定用于指示待评估业务数据的风险程度风险信息。
68.进一步的,电子设备可以获取与业务活动对应的待评估业务数据,该待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域。
69.实际应用时,可以预先设置多个特征域,比如,可以设置与注册账号信息相关的第一特征域,还可以设置与非法倒卖优惠信息相关的第二特征域。可以将数据特征中,与注册账号相关的特征划分为第一特征域,从而使这些特征与第一特征域具有对应关系,还可以将非法倒卖优惠信息的特征划分为第二特征域。通过这种方式,能够将用于表征同种信息的数据特征划分为同一特征域,进而可以关注用于表征同种信息的数据特征之间的关联关系。
70.比如,待评估业务数据中包括n个数据特征,可以根据各个数据特征所表征的信息,将这n个特征划分为k个特征域。
71.步骤102,将与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量。
72.其中,本技术提供的方案中,设置有与各特征域对应的多个编码网络,通过与特征域对应的编码网络,对该特征域的数据特征进行处理,从而得到该特征域对应的特征向量。
73.图3为本技术一示例性实施例示出的各编码网络的结构示意图。
74.如图3所示,比如设置有与第一特征域对应的第一编码网络31,设置有与第二特征域对应的第二编码网络32,设置有与第k特征域对应的第k编码网络3k。
75.电子设备可以将待评估业务数据的多个数据特征中,与同一特征域对应的数据特征输入该特征域对应的编码网络中,进而可以利用该编码网络对该特征域的数据特征进行处理。
76.比如,将被划分为第一特征域的多个数据特征311,输入第一编码网络31,将被划分为第二特征域的多个数据特征321,输入第二编码网络32。
77.电子设备基于编码网络对输入该编码网络的数据特征进行处理,得到特征向量,比如,电子设备基于第一编码网络31对输入的数据特征311进行处理,得到特征向量312。电子设备基于第二编码网络32对输入的数据特征321进行处理,得到特征向量322。
78.具体的,每一个特征域的稀疏的特征通过编码网络编码为指定维度的稠密的特征向量e
k
为:
79.e
k
=σ(x
k
;θ
f
)
80.其中e
k
表示待评估业务数据在k个不同特征域上的特征向量。
81.由于属于同一特征域的数据特征用于表征同一类信息,比如属于第一特征域的数据特征,是用于表征注册账号的特征,而属于第二特征域的数据特征,是用于表征非法倒卖优惠信息的特征。因此,通过与该特征域对应的编码网络,对属于该特征域的数据特征进行处理,能够充分进行域内信息的组合和强化,得到该特征域的特征向量。
82.因此,通过多个编码网络,能够提取到与各特征域对应的特征向量。进而可以提取到待评估业务数据中,与多个特征域对应的多个特征向量,进而得到用于表征各个特征域对应的信息类别的多个特征向量。比如,能够得到该待评估业务数据中用于表征注册账号的特征向量,再比如,能够得到该待评估业务数据中用于表征倒卖优惠信息的特征向量。
83.具体的,各个编码网络中的权重参数可以不相同,具体可以在模型训练过程中调整并确定。各个编码网络的结构可以相同,也可以不同,具体可以根据需求设置。
84.步骤103,将与特征域对应的特征向量输入注意力层,得到包括各个特征向量之间关系的总向量。
85.进一步的,本技术提供的方案中,风险评估模型中还包括注意力层,可以将与各特征域对应的特征向量输入注意力层。注意力层可以对各个特征域的特征向量进行处理,以得到包括各个特征向量之间关系的总向量。
86.图4为本技术一示例性实施例示出的注意力层的处理过程示意图。
87.如图4所示,可以将各个特征域对应的各特征向量41输入注意力层42,电子设备可以根据注意力层42对输入注意力层42的特征向量进行处理,以确定出这些特征向量之间的关系,从而可以得到包括各个所述特征向量之间关系的总向量43。
88.实际应用时,电子设备可以根据注意力层中的权重,确定两两特征向量之间的关系,可以基于特征向量与其他各个特征向量间的关系,确定该特征向量的新表达,使得该新表达中可以嵌入其他特征向量的信息。比如,可以根据第一特征向量与其他每一特征向量间的关系,确定第一特征向量的新表达。
89.其中,电子设备可以根据各个特征向量的新表达,构建包括各个特征向量之间关系的总向量。该总向量中包括各特征向量间的关系,因此,该特征向量能够综合待评估数据中多个信息类别的特征向量,进而准确的提取出该待评估数据中包括的信息。
90.具体的,注意力层中的权重值,可以通过对模型进行训练得到。
91.步骤104,将总向量输入确定子模块,利用确定子模块确定与待评估业务数据对应的期望。
92.进一步的,风险评估模型中还包括确定子模块,电子设备可以将步骤103中确定的总向量输入到确定子模块中,并根据确定子模块中的权重值,对总向量进行处理,得到与待评估业务数据的期望。
93.一种实施方式中,电子设备可以先对总向量进行压缩,降低总向量的维度,再对降低维度后的向量进行处理,得到该总向量的期望,也就是待评估业务数据对应的期望。
94.实际应用时,在确定子模块中可以设置有高斯分布参数,该高斯分布参数可以通
过对模型进行训练得到。比如,共设置有k个特征域,则可以设置k个高斯分布的参数。
95.其中,可以根据各高斯分布的参数对上述总向量或者压缩后的总向量进行处理,确定待评估业务数据对应的期望,该期望用于表征待评估业务数据与各个高斯分布之间的距离。进而可以根据待评估业务数据与各个高斯分布之间的距离,确定出该待评估业务数据是否异常。
96.步骤105,根据期望确定与待评估业务数据对应的风险信息,风险信息用于指示待评估业务数据的风险程度。
97.具体的,可以将风险评估模型确定出的期望转换为风险信息,进而通过该风险信息指示待评估业务数据的风险程度。比如,可以预先设置映射函数,可以通过映射函数将待评估业务数据的期望映射到0

1范围内的分值。比如可以通过平移对数变换、sigmoid映射等方式将期望映射到0

1范围内。
98.这种实施方式,若不同的待评估数据的期望之间浮动范围较大,则可以将这些数值映射到同一分值尺度内,进而更好的表征待评估数据的风险程度。
99.一种实施方式中,还可以设置风险阈值,若确定的风险信息超出该风险阈值,还可以进行警示。
100.本实施例提供的方法用于业务活动的风险信息,该方法由设置有本实施例提供的方法的设备执行,该设备通常以硬件和/或软件的方式来实现。
101.本技术提供的业务活动的风险信息确定方法,包括:获取与业务活动对应的待评估业务数据;待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域;将与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量;将与特征域对应的特征向量输入注意力层,得到包括各个特征向量之间关系的总向量;将总向量输入确定子模块,利用确定子模块确定与待评估业务数据对应的期望;根据期望确定与待评估业务数据对应的风险信息,风险信息用于指示待评估业务数据的风险程度。本技术提供的方法中,通过与特征域对应的编码网络,对属于该特征域的数据特征进行处理,能够充分进行域内信息的组合和强化,得到该特征域的特征向量,进而可以在业务活动的数据特征稀疏性强的情况下,准确的提取业务活动的特征向量,能够准确的得到业务活动的风险评估结果。
102.图5为本技术另一示例性实施例示出的业务活动的风险信息确定方法的流程示意图。
103.如图5所示,本技术提供的业务活动的风险信息确定方法,包括:
104.步骤501,获取与业务活动对应的离线特征;获取与业务活动对应的实时数据。
105.步骤502,根据离线特征、实时数据,确定业务活动的待评估数据;待评估业务数据包括多个数据特征,每个数据特征对应于一个特征域。
106.其中,待评估数据中的特征既可以包括离线特征,又可以包括实时特征。比如,可以预先设置与业务活动对应的离线特征,当存在与该业务活动对应的实时数据后,可以获取业务活动的离线特征,并与实时数据一起进行加工,得到该业务活动对应的待评估业务数据。
107.具体的,离线特征能够准确的体现业务活动的特性,而线上的实时数据能够是实时产生的,通过对业务活动的实时特征以及离线特征进行处理,既能够提取出与业务活动
准确的特征信息,又能够保证待评估业务数据的实时性,从而提高对业务活动进行评估的准确性。
108.进一步的,还可以设置特征加工引擎。比如,在生成与第一业务活动相关的实时数据后,可以获取第一业务活动的离线特征,并利用特征加工引擎对离线特征、实时数据进行加工处理,以得到包括多个数据特征的待评估业务数据x。
109.步骤503,将与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量。
110.步骤503与步骤102的执行原理、方式相似,不再赘述。
111.步骤504,根据与各个特征域对应的特征向量,确定每两个特征向量之间的特征相似度。
112.步骤505,根据各个特征相似度,确定包括各个特征向量之间关系的总向量。
113.电子设备可以将步骤503中得到的与各特征域对应的各特征向量,输入到模型的注意力层中,并通过注意力层确定包括各个特征向量之间关系的总向量。具体可以执行步骤504、505。
114.其中,电子设备可以根据与各个特征域对应的特征向量,确定每两个特征向量之间的特征相似度。比如,可以设置用于计算相似度的函数,通过该函数确定各特征向量中两两特征向量之间的相似度。
115.比如,可以设置相似度函数φ,针对两个特征向量e1和e2,可以通过相似度函数φ确定e1和e2之间的特征相似度φ(e1,e2)。特征相似度能够能够表征属于不同特征域的特征向量之间的关系。
116.针对任意两个特征向量em、ek的组合,为:
[0117][0118]
其中的w
query
、w
key
为转换矩阵,可以在对模型训练过程中更新矩阵中的值。
[0119]
具体的,可以根据两两特征向量之间的特征相似度,确定包括各个所述特征向量之间关系的总向量。具体可以根据各特征相似度确定每一特征向量的新表达,再根据各个特征向量的新表达确定总向量p,该总向量中包括各特征向量本身的信息,还包括个特征向量之间的信息。
[0120]
进一步的,可以根据每个特征向量与其他特征向量之间的特征相似度,确定每个特征向量与其他特征向量之间的关系系数。比如,针对特征向量em,可以确定其与其他任一特征向量ek之间的相似度φ(em,ek)。可以根据em的各个特征相似度φ(em,ek),确定em与其他各个特征向量之间的关系系数。
[0121]
实际应用时,可以预先设置用于确定关系系数的方式,进而可以根据该方式确定每个每个特征向量与其他特征向量之间的关系系数,所述关系系数用于表征两个特征向量之间的关系。具体可以基于下式确定特征向量em和特征向量ek之间的关系系数:
[0122][0123]
特征向量em和特征向量ek是各编码网络确定的各特征向量中的任两个。k是特征域的数量。
[0124]
其中,还可以根据每个特征向量与其他特征向量之间的关系系数、各个特征向量,确定每个特征向量的特征域嵌入向量;其中,总向量包括每个特征向量的特征域嵌入向量。
[0125]
具体的,针对任意两个特征向量,都具有关系系数,因此,可以根据一个特征向量与其他特征向量之间的关系系数,确定该特征向量的特征域嵌入向量,该特征域嵌入向量中包括该特征向量的信息,还包括其他特征向量的信息。
[0126]
进一步的,针对任一特征向量em,其特征域嵌入向量可以为:
[0127][0128]
其中的w
value
是转换矩阵,可以在对模型训练过程中更新矩阵中的值。
[0129]
实际应用时,可以根据各特征向量的特征域嵌入向量,生成总向量。总向量代表对各个不同特征域嵌入向量进行全局池化的结果。
[0130]
总向量p可以为:
[0131][0132]
步骤506,将总向量输入压缩网络,得到压缩向量。
[0133]
其中,本技术提供的方案中,确定子模块中包括压缩网络,电子设备能够利用压缩网络对总向量进行处理,得到与总向量对应的压缩向量。
[0134]
具体的,压缩网络中具有权重参数,权重参数是通过对模型进行训练得到的。压缩网络负责对总向量p进行降维。
[0135]
进一步的,基于压缩网络对总向量进行处理时,可以根据编码函数、第一神经网络参数,对总向量进行编码,得到编码向量。该第一神经网络参数是通过对模型进行训练得到的。
[0136]
总向量p的编码向量zc为:
[0137]
z
c
=h(p;θ
e
)
[0138]
其中的h()为编码函数,θe为第一神经网络参数。
[0139]
实际应用时,在压缩网络中还可以设置解码函数,电子设备可以根据该解码函数、第二神经网络参数对编码向量进行解码处理,得到解码向量。该第二神经网络参数是通过对模型进行训练得到的。
[0140]
编码向量zc的解码向量x’为:
[0141]
x

=g(z
c
;θ
d
)
[0142]
其中的g()为解码函数,θd为第二神经网络参数。
[0143]
具体的,可以根据待评估数据x中包括的特征、解码向量x

,确定重构误差zr。重构误差zr用于表征解码向量x

与待评估数据x的特征之间的差异。
[0144]
进一步的,z
r
=f(x,x

)。其中的函数f()是用于确定编码向量与待评估数据的特征之间的差异。比如,可以将解码向量与待评估数据的特征相减,得到重构误差zr。
[0145]
实际应用时,可以根据编码向量z
c
、重构误差z
r
,确定压缩向量z。压缩向量z为:
[0146]
z=[z
c
,z
r
]
[0147]
其中,可以对z
c
,z
r
进行拼接,得到压缩向量z。
[0148]
具体的,通过这种方式对总向量进行处理得到压缩向量,能够避免通过编码网络
提取待评估数据中各特征域的特征时,丢失特征信息,造成得到的总向量p不能准确的体现待评估数据中包括的信息的问题。
[0149]
步骤507,根据压缩向量、与各高斯分布对应的预设参数,确定与待评估数据对应的期望;高斯分布的数量为特征域的数量;期望用于表征待评估数据与各高斯分布之间的距离。
[0150]
进一步的,确定子模块中还可以设置与各高斯分布对应的预设参数,可以通过模型训练的方式确定该预设参数。
[0151]
实际应用时,共设置有k个高斯分布的预设参数,即设置有与特征域数量一致的高斯分布,通过对模型进行训练,每个高斯分布的预设参数能够表征一个特征域的特性。
[0152]
其中,可以根据压缩向量、与各高斯分布对应的预设参数,确定与待评估数据对应的期望;期望用于表征待评估数据与各高斯分布之间的距离。通过该期望能够确定出待评估数据是否存在异常情况。
[0153]
具体的,每个高斯分布的预设参数都可以包括该高斯分布的出现概率均值协方差矩阵可以根据各个高斯分布的预设参数,对压缩编码进行处理,确定出期望,也就是待评估数据的期望。
[0154]
进一步的,第i条待评估数据的期望e(z)为:
[0155][0156]
其中zi表征第i条待评估数据的压缩向量。
[0157]
具体的,期望用于表征待评估数据与各高斯分布之间的距离,因此,通过期望能够确定出待评估数据是否存在异常情况。
[0158]
步骤508,根据预设映射函数,将待评估数据的期望映射为风险评分。
[0159]
实际应用时,本技术提供的方案中还设置有预设映射函数,该预设映射函数用于将待评估数据的期望映射为风险评分。由于不同待评估数据的期望之间存在较大的浮动范围,因此,将待评估数据的期望映射为风险评分,可以将各个期望映射到到同一尺度范围内,以便提供可参考的风险评分。
[0160]
其中,第i条待评估数据z
i
的风险评分score(z
i
)可以为:
[0161]
mscore(z
i
)=sigmoid(log(e(z) abs(γ(e(z)) ε))
[0162]
具体的,γ(e(z))为所有样本空间的阈值划分函数,可以选择min、average、k

σ等,ε作为超参数可取0.01。
[0163]
步骤508,若风险评分大于阈值,则进行预警。
[0164]
进一步的,还可以设置用于评估风险评分的阈值,若风险评分大于阈值,则可以发出预警。比如,可以向与业务活动相关的用户发送预警信息。
[0165]
图6为本技术一示例性实施例示出的用于评估业务活动风险的模型的训练方法的流程示意图。
[0166]
如图6所示,本技术提供的用于评估业务活动风险的模型的训练方法,包括:
[0167]
步骤601,获取与业务活动对应的多个样本数据;每一样本数据包括多个数据特
征,每个数据特征对应于一个特征域。
[0168]
其中,本技术提供的方法可以由具备计算能力的电子设备来执行,该电子设备比如可以是计算机。
[0169]
具体的,可以预先搭建风险评估模型,该风险评估模型中包括:与每个特征域对应的编码网络、注意力层、确定子模块。再对搭建完毕的模型进行训练。训练完毕的风险评估模型可以部署在电商平台的服务器中,该服务器可以基于部署的风险评估模型,对业务活动的待评估业务数据进行评估处理。
[0170]
图7为本技术一示例性实施例示出的风险评估模型的示意图。
[0171]
如图7所示,本技术提供的风险评估模型中可以包括多个编码网络71、注意力层72、确定子模块73。编码网络71、注意力层72、确定子模块73依次连接,可以利用业务活动的样本数据对该模型进行训练。
[0172]
进一步的,电子设备可以获取与业务活动对应的多个样本数据,每个样本数据都可以包括多个数据特征,每个数据特征对应于一个特征域。比如,可以获取m条样本数据,每个样本数据都可以包括n个特征。
[0173]
实际应用时,可以预先设置多个特征域,比如,可以设置与注册账号信息相关的第一特征域,还可以设置与非法倒卖优惠信息相关的第二特征域。可以将样本数据的数据特征中,与注册账号相关的特征划分为第一特征域,从而使这些特征与第一特征域具有对应关系,还可以将非法倒卖优惠信息的特征划分为第二特征域。通过这种方式,能够将用于表征同种信息的数据特征划分为同一特征域,进而可以使模型学习用于表征同种信息的数据特征之间的关联关系。
[0174]
比如,待评估业务数据中包括n个数据特征,可以根据各个数据特征所表征的信息,将这n个特征划分为k个特征域。
[0175]
步骤602,将每个样本数据中与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量。
[0176]
其中,搭建的模型中设置有与各特征域对应的多个编码网络,通过与特征域对应的编码网络,对该特征域的数据特征进行处理,从而得到该特征域对应的特征向量。
[0177]
电子设备可以将样本数据的多个数据特征中,与同一特征域对应的数据特征输入该特征域对应的编码网络中,进而可以利用该编码网络对该特征域的数据特征进行处理。比如,将被划分为第一特征域的多个数据特征,输入第一编码网络,将被划分为第二特征域的多个数据特征,输入第二编码网络。
[0178]
电子设备基于编码网络对输入该编码网络的数据特征进行处理,得到特征向量,比如,电子设备基于第一编码网络对输入的数据特征进行处理,得到特征向量。电子设备基于第二编码网络对输入的数据特征进行处理,得到特征向量。
[0179]
因此,通过与该特征域对应的编码网络,对属于该特征域的数据特征进行处理,能够充分进行域内信息的组合和强化,得到该特征域的特征向量。
[0180]
具体的,每一个特征域的稀疏的特征通过编码网络编码为指定维度的稠密的特征向量e
k
为:
[0181]
e
k
=σ(x
k
;θ
f
)
[0182]
x
k
为第k条样本数据的特征向量,θ
f
是编码网络中的参数。
[0183]
具体的,各个编码网络中的权重参数可以在训练迭代过程中不断更新。各个编码网络的结构可以相同,也可以不同,具体可以根据需求设置。
[0184]
步骤603,将与特征域对应的特征向量输入注意力层,得到与每个样本数据对应的包括各个特征向量之间关系的总向量。
[0185]
进一步的,本技术提供的方案中,搭建的模型中还包括注意力层,可以将与各特征域对应的特征向量输入注意力层。注意力层可以对各个特征域的特征向量进行处理,以得到包括各个特征向量之间关系的总向量。
[0186]
实际应用时,电子设备可以根据注意力层中的权重,确定两两特征向量之间的关系,注意力层中的权重可以在训练过程中进行更新。注意力层可以基于特征向量与其他各个特征向量间的关系,确定该特征向量的新表达,使得该新表达中可以嵌入其他特征向量的信息。比如,可以根据第一特征向量与其他每一特征向量间的关系,确定第一特征向量的新表达。
[0187]
其中,电子设备可以根据各个特征向量的新表达,构建包括各个特征向量之间关系的总向量。该总向量中包括各特征向量间的关系,因此,该特征向量能够综合每条样本数据中多个信息类别的特征向量,进而准确的提取出该样本数据中包括的信息。
[0188]
步骤604,将每个样本数据的总向量输入确定子模块,利用确定子模块确定每个样本数据的期望,并根据每一样本数据的期望训练模型,得到用于评估业务活动风险的模型。
[0189]
进一步的,搭建的模型中还包括确定子模块,电子设备可以将确定的总向量输入到确定子模块中,并根据确定子模块中的权重值,对总向量进行处理,得到各样本数据的期望。
[0190]
一种实施方式中,电子设备可以先对各样本数据的总向量进行压缩,降低总向量的维度,再对降低维度后的向量进行处理,得到各总向量的期望,也就是各样本数据对应的期望。
[0191]
实际应用时,可以根据各样本数据压缩后的总向量,确定各样本属于各高斯分布的概率向量。比如,共设置有k个特征域,则可以设置k个高斯分布。针对每批样本数据,都可以确定这批样本数据中各样本数据属于的高斯分布,进而可以得到样本属于各高斯分布的概率向量。
[0192]
其中,还可以根据上述概率向量、样本数据的数量以及各样本数据压缩后的总向量,估计各高斯分布的参数。在训练迭代过程中,各高斯分布的参数也会被更新。
[0193]
可以根据估计出的各高斯分布参数、各样本数据压缩后的总向量,确定各样本数据的期望。期望能够用于表示样本属于k个高斯分布的概率。其中,通过大量的样本对模型进行训练,能够在模型中构建出各个样本数据属于k个高斯分布的概率,也就是构建出了个多个高斯分布空间。当利用该模型对待评估业务数据进行处理时,也能够确定出该待评估业务数据属于各高斯分分布的概率,进而确定该待评估业务数据与各高斯分布空间的距离,进而能够识别出异常的样本数据。
[0194]
还可以设置目标函数,可以基于各样本的期望构建目标函数,并通过目标函数进行梯度回传,更新模型中与每个特征域对应的编码网络、注意力层、确定子模块的权重值。
[0195]
图8为本技术另一示例性实施例示出的用于评估业务活动风险的模型的训练方法的流程示意图。
[0196]
如图8所示,本技术提供的用于评估业务活动风险的模型的训练方法,包括:
[0197]
步骤801,获取与业务活动对应的离线特征;获取与业务活动对应的每一实时数据。
[0198]
步骤802,根据离线特征、每一实时数据,确定业务活动的每一样本数据;每一样本数据包括多个数据特征,每个数据特征对应于一个特征域。
[0199]
其中,样本数据中的特征既可以包括离线特征,又可以包括实时特征。比如,可以预先设置与业务活动对应的离线特征,当存在与该业务活动对应的实时数据后,可以获取业务活动的离线特征,并与实时数据一起进行加工,得到该业务活动对应的样本数据。
[0200]
具体的,离线特征能够准确的体现业务活动的特性,而线上的实时数据能够是实时产生的,通过对业务活动的实时特征以及离线特征进行处理,既能够提取出与业务活动准确的特征信息,又能够保证样本数据的实时性,从而提高训练得到的模型的准确度。
[0201]
进一步的,还可以设置特征加工引擎。比如,在生成与第一业务活动相关的实时数据后,可以获取第一业务活动的离线特征,并利用特征加工引擎对离线特征、实时数据进行加工处理,以得到包括多个数据特征的样本数据x。
[0202]
步骤803,将每个样本数据与同一特征域对应的数据特征,输入与特征域对应的编码网络,得到与特征域对应的特征向量。
[0203]
步骤803与步骤602的执行原理、方式相似,不再赘述。
[0204]
步骤804,根据与各个特征域对应的特征向量,确定每两个特征向量之间的特征相似度。
[0205]
步骤805,根据各个特征相似度,确定包括各个特征向量之间关系的总向量。
[0206]
电子设备可以将步骤803中得到的与各特征域对应的各特征向量,输入到模型的注意力层中,并通过注意力层确定包括各个特征向量之间关系的总向量。具体可以执行步骤804、805。
[0207]
其中,电子设备可以根据每个样本数据中与各个特征域对应的所述特征向量,确定每个样本数据中每两个特征向量之间的特征相似度。比如,可以设置用于计算相似度的函数,通过该函数确定各特征向量中两两特征向量之间的相似度。
[0208]
比如,可以设置相似度函数φ,针对两个特征向量e1和e2,可以通过相似度函数φ确定e1和e2之间的特征相似度φ(e1,e2)。特征相似度能够能够表征属于不同特征域的特征向量之间的关系。
[0209]
针对一个样本数据中任意两个特征向量em、ek的组合,为:
[0210][0211]
其中的w
query
、w
key
为转换矩阵,可以在模型训练过程中更新矩阵中的值。
[0212]
具体的,可以根据每个样本数据的各个特征相似度,确定每个样本数据包括各个特征向量之间关系的总向量。具体可以根据一个样本数据的各特征相似度,确定每一特征向量的新表达,再根据各个特征向量的新表达确定总向量p,该总向量中包括各特征向量本身的信息,还包括个特征向量之间的信息。
[0213]
进一步的,可以根据每个特征向量与其他特征向量之间的特征相似度,确定每个特征向量与其他特征向量之间的关系系数,关系系数用于表征两个特征向量之间的关系。
比如,针对一个样本数据中的特征向量em,可以确定其与该样本数据中其他任一特征向量ek之间的相似度φ(em,ek)。可以根据em的各个特征相似度φ(em,ek),确定em与样本数据中其他各个特征向量之间的关系系数。
[0214]
实际应用时,可以预先设置用于确定关系系数的方式,进而可以根据该方式确定每个特征向量与其他特征向量之间的关系。具体可以基于下式确定特征向量em和特征向量ek之间的关系系数:
[0215][0216]
特征向量em和特征向量ek是各编码网络确定的样本数据的各特征向量中的任两个。k是特征域的数量。
[0217]
其中,还可以根据样本数据中每个特征向量与其他特征向量之间的关系系数、各个特征向量,确定该样本数据中每个特征向量的特征域嵌入向量;其中,总向量包括每个特征向量的特征域嵌入向量。
[0218]
具体的,针对样本数据中任意两个特征向量,都具有关系系数,因此,可以根据样本数据中一个特征向量与该样本数据中其他特征向量之间的关系系数,确定该特征向量的特征域嵌入向量,该特征域嵌入向量中包括该特征向量的信息,还包括样本数据中其他特征向量的信息。
[0219]
进一步的,针对任一特征向量em,其特征域嵌入向量可以为:
[0220][0221]
其中的w
value
是转换矩阵,可以在对模型训练过程中更新矩阵中的值。
[0222]
实际应用时,可以根据每个样本数据中各特征向量的特征域嵌入向量,生成每个样本数据的总向量。总向量代表对各个不同特征域嵌入向量进行全局池化的结果。
[0223]
总向量p可以为:
[0224][0225]
步骤806,将每个样本数据的总向量输入压缩网络,得到每个样本数据的压缩向量。
[0226]
其中,本技术提供的方案中,确定子模块中包括压缩网络,电子设备能够利用压缩网络对各个样本数据的总向量进行处理,得到各个样本数据的压缩向量。
[0227]
具体的,压缩网络中具有权重参数,权重参数可以在模型训练过程中进行更新。压缩网络负责对各个样本数据的总向量p进行降维。
[0228]
进一步的,基于压缩网络对样本数据的总向量进行处理时,可以根据编码函数、第一神经网络参数,对各样本数据的总向量进行编码,得到每个样本数据的编码向量。该第一神经网络参数可以在模型训练过程中进行更新。
[0229]
一个样本数据的总向量p的编码向量zc为:
[0230]
z
c
=h(p;θ
e
)
[0231]
其中的h()为编码函数,θe为第一神经网络参数。
[0232]
实际应用时,在压缩网络中还可以设置解码函数,电子设备可以根据该解码函数、第二神经网络参数对一个样本数据的编码向量进行解码处理,得到该样本数据的解码向量。该第二神经网络参数在模型训练过程中被更新。
[0233]
一个样本数据的编码向量zc的解码向量x’为:
[0234]
x

=g(z
c
;θ
d
)
[0235]
其中的g()为解码函数,θd为第二神经网络参数。
[0236]
具体的,可以根据每个样本数据x中包括的数据特征、每个样本数据的解码向量x

,确定每个样本数据的重构误差zr。重构误差zr用于表征每个样本数据的解码向量x

与每个样本数据x的特征之间的差异。
[0237]
进一步的,z
r
=f(x,x

)。其中的函数f()是用于确定样本数据的解码向量与样本数据的数据特征之间的差异。比如,可以将解码向量与样本数据的特征相减,得到重构误差zr。
[0238]
实际应用时,可以根据每个样本数据的编码向量z
c
、每个样本数据的重构误差z
r
,确定每个样本数据的压缩向量z。压缩向量z为:
[0239]
z=[z
c
,z
r
]
[0240]
其中,可以对z
c
,z
r
进行拼接,得到压缩向量z。
[0241]
具体的,通过这种方式对每个样本数据的总向量进行处理得到压缩向量,能够避免通过编码网络提取各个样本数据中各特征域的特征时,丢失特征信息,造成得到的总向量p不能准确的体现样本数据中包括的信息的问题。
[0242]
在一种可选的实施方式中,还可以根据每个样本数据的重构误差z
r
修正与各个特征域对应的编码网络中的参数。
[0243]
进一步的,可以通过编码网络对样本数据中与各个特征域对应的数据特征x进行处理,得到与各个特征域对应的特征向量e。通过对各个特征域对应的特征向量e进行处理,能够得到解码向量x

。若编码网络能够准确的提取样本数据中的特征,得到准确的特征向量,那么最终得到的解码向量x

能够表整出样本数据中各数据特征x,那么基于各样本数据的解码向量x

和数据特征x确定的重构误差zr应当趋近于0,可以将重构误差zr的预设条件设置为0,并基于该约束条件更新各编码网络中的参数θ
f

[0244]
步骤807,将每个样本数据的压缩向量输入估计网络,得到每个样本数据属于各高斯分布的概率向量;其中,高斯分布的数量为特征域的数量。
[0245]
实际应用时,确定子模块中还设置有估计网络,估计网络用于根据各样本数据的压缩向量估计各高斯分布的概率向量。
[0246]
其中,估计网络中设置有第三神经网络参数、预设函数,电子设备可以根据估计网络中设置的参数对各样本数据的压缩向量进行处理。
[0247]
具体的,样本数据的输出特征为p为:
[0248]
p=mln(z;θ
m
)
[0249]
进一步的,z为样本数据的压缩向量,θ
m
为第三神经网络参数。mln()为神经网络,电子设备将z作为输入,利用mln()以及第三神经网络参数,对z进行处理,得到p。mln()可以是估计网络中的子网络。
[0250]
比如,一次训练过程使用了m个样本数据,那么针对这m个样本数据可以得到m个压
缩向量,进而得到m个输出特征p。
[0251]
实际应用时,估计网络中还可以设置预设函数,该预设函数用于确定各样本数据属于各个高斯分布的概率向量。
[0252]
其中,各高斯分布的概率向量为:
[0253][0254]
具体的,softmax()为预设函数,p为样本数据的输出特征。比如,每得到一个输出特征p,就通过softmax()对已得到的输出特征进行处理,得到各高斯分布的概率向量
[0255]
若共有m个样本数据,共有k个高斯分布,则概率向量可以是m*k维的。概率向量中的每个数值可以与包括一个样本数据、一个高斯分布的组合对应,该数值用于表征该样本数据是否属于该高斯分布,比如,若数值为1,则表征该样本数据属于该高斯分布空间。
[0256]
比如,对应于第一个样本数据、第二个高斯分布空间,则可以表征第一个样本数据是否属于第二个高斯分布空间。
[0257]
进一步的,可以设置k个高斯分布,k为特征域的数量。通过大量的样本数据,能够得到k个高斯分布的概率向量
[0258]
步骤808,根据每个样本数据属于各高斯分布的概率向量、每个样本数据的压缩向量,确定每个样本数据的期望;其中,期望用于表征样本数据与各高斯分布之间的距离。
[0259]
实际应用时,可以先根据每个样本数据属于各高斯分布的概率向量、每个样本数据的压缩向量构建各个高斯分布的空间,再根据各高斯分布的空间,确定各样本数据的期望。期望用于表征样本数据与各高斯分布之间的距离。
[0260]
其中,可以根据每个样本数据属于各高斯分布的概率向量、每个样本数的压缩向量,确定各高斯分布的参数,进而构建出各个高斯分布空间。
[0261]
具体的,每个高斯分布的参数中都可以包括出现概率、均值、协方差矩阵。可以根据每个样本数据属于各高斯分布的概率向量、各个样本数据的压缩向量,确定各个高斯分布的概率、均值以及协方差矩阵。
[0262]
进一步的,根据每个样本数据属于各高斯分布的概率向量、样本数据的数量,确定每个高斯分布的出现概率。
[0263]
第k个高斯分布的出现概率为:
[0264][0265]
其中,若第i个样本数据属于第k个高斯分布,则否则,共有m个样本数据。可以根据每个样本数据属于各高斯分布的概率向量,确定出与第k个高斯分布对应的多个进而确定出第k个高斯分布的出现概率。用于表征第k个高斯分布在多个样本中的出现概率,进而能够通过各个高斯分布的出现概率体现各个高斯分布空间的特性。
[0266]
具体的,还可以根据每个样本数据属于各高斯分布的概率向量、每个样本数据的压缩向量,确定每个高斯分布的均值。
[0267]
进一步的,第k个高斯分布的均值为:
[0268][0269]
实际应用时,zi为第i个样本数据的压缩向量。能够表征属于第k个高斯分布的样本数据的压缩向量的均值,通过各个样本数据的均值,能够表征出各个高斯分布的特征信息。
[0270]
其中,还可以根据每个高斯分布的均值、每个样本数据属于各高斯分布的概率向量、每个样本数据的压缩向量,确定每个高斯分布的协方差矩阵。
[0271]
具体的,第k个高斯分布的协方差矩阵为:
[0272][0273]
进一步的,可以通过上述方法确定出各个高斯分布的概率、均值、协方差矩阵,进而得到高斯分布参数,高斯分布的参数能够表征一个高斯分布的特性。每次通过样本对模型进行训练时,都可以根据样本数据的压缩向量更新高斯分布参数。比如,针对第一批样本数据进行训练,能够得到高斯分布的参数,针对第二批样本数据进行处理时,还可以结合第一批样本数据的压缩变量,以及第二批样本数据的压缩变量,更新高斯分布的参数。
[0274]
实际应用时,在利用样本数据对模型进行训练的过程中,每次确定出高斯分布的参数后,都可以根据当前批次的每个样本数据的压缩向量、各高斯分布的参数,确定每个样本数据的期望。
[0275]
其中,期望用于表征样本数据与各高斯分布之间的距离,比如,针对第一样本的第一期望,用于表征第一样本与各高斯分布之间的距离。
[0276]
具体的,可以根据确定出的各个高斯分布的参数,对各个样本数据的压缩编码进行处理,确定出各个样本数据的期望。
[0277]
进一步的,第i条样本数据的期望e(z)为:
[0278][0279]
其中zi表征第i条样本数据的压缩向量。
[0280]
步骤809,根据每一样本数据的期望,修正注意力层、确定子模块中的网络参数,得到用于评估业务活动风险的模型。确定子模块包括压缩网络、估计网络。
[0281]
具体的,可以预先设置用于训练模型的函数,该函数可以用于训练编码网络、注意力层、确定子模块中的网络参数。具体可以通过下式对模型进行训练:
[0282][0283]
[0284][0285]
其中的θe为压缩网络中的第一神经网络参数,θd为压缩网络中的第二神经网络参数,θ
m
为估计网络中的第三神经网络参数。
[0286]
通过本方法训练得到的模型,可以应用在图所示的方法中。
[0287]
图9为本技术一示例性实施例示出的业务活动的风险信息确定装置的结构图。
[0288]
如图9所示,本实施例提供的业务活动的风险信息确定装置900,包括:
[0289]
获取模块910,用于获取与所述业务活动对应的待评估业务数据;所述待评估业务数据包括多个数据特征,每个所述数据特征对应于一个特征域;
[0290]
编码模块920,用于将与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;
[0291]
嵌入模块930,用于将与所述特征域对应的特征向量输入注意力层,得到包括各个所述特征向量之间关系的总向量;
[0292]
期望确定模块940,用于将所述总向量输入确定子模块,利用所述确定子模块确定与所述待评估业务数据对应的期望;
[0293]
风险确定模块950,用于根据所述期望确定与所述待评估业务数据对应的风险信息,所述风险信息用于指示所述待评估业务数据的风险程度。
[0294]
本实施例提供的业务活动的风险信息确定装置的具体原理和实现方式均与图1所示的实施例类似,此处不再赘述。
[0295]
图10为本技术另一示例性实施例示出的业务活动的风险信息确定装置的结构图。
[0296]
如图10所示,在上述实施例的基础上,本实施例提供的业务活动的风险信息确定装置1000,所述嵌入模块930,包括:
[0297]
相似度确定单元931,用于根据与各个特征域对应的所述特征向量,确定每两个特征向量之间的特征相似度;
[0298]
嵌入单元932,用于根据各个特征相似度,确定包括各个所述特征向量之间关系的总向量。
[0299]
可选的,嵌入单元932具体用于:
[0300]
根据每个特征向量与其他特征向量之间的特征相似度,确定每个特征向量与其他特征向量之间的关系系数,所述关系系数用于表征两个特征向量之间的关系;
[0301]
根据每个特征向量与其他特征向量之间的关系系数、每个所述特征向量,确定每个特征向量的特征域嵌入向量;其中,所述特征域嵌入向量用于表征嵌入有其他特征向量信息的特征向量;
[0302]
根据各特征域嵌入向量,确定包括各个所述特征向量之间关系的总向量。
[0303]
可选的,所述期望确定模块940,包括:
[0304]
压缩单元941,用于将所述总向量输入压缩网络,得到压缩向量;
[0305]
期望确定单元942,用于根据所述压缩向量、与各所述高斯分布对应的预设参数,确定与所述待评估数据对应的期望;所述高斯分布的数量为所述特征域的数量;所述期望用于表征所述待评估数据与各所述高斯分布之间的距离。
[0306]
可选的,压缩单元941具体用于:
[0307]
根据编码函数、第一神经网络参数,对所述总向量进行编码,得到编码向量;
[0308]
根据解码函数、第二神经网络参数,对所述编码向量进行解码,得到解码向量;
[0309]
根据所述待评估数据的特征、所述解码向量,确定重构误差;所述重构误差用于表征所述解码向量与所述待评估数据的特征之间的差异;
[0310]
根据所述编码向量、所述重构误差,确定所述压缩向量。
[0311]
风险确定模块950具体用于:
[0312]
根据预设映射函数,将所述待评估数据的所述期望映射为所述风险评分。
[0313]
可选的,获取模块910包括:
[0314]
获取单元911,用于获取与所述业务活动对应的离线特征,获取与业务活动对应的实时数据;
[0315]
确定单元912,用于根据所述离线特征、所述实时数据,确定所述业务活动的待评估数据。
[0316]
可选的,所述装置还包括预警模块960,用于:
[0317]
若所述风险评分大于阈值,则进行预警。
[0318]
本实施例提供的装置的具体原理和实现方式均与图5所示的实施例类似,此处不再赘述。
[0319]
图11为本技术一示例性实施例示出的用于评估业务活动风险的模型的训练装置的结构图。
[0320]
所述模型包括:与每个特征域对应的编码网络、注意力层、确定子模块;
[0321]
如图11所示,本技术提供的用于评估业务活动风险的模型的训练装置1100,包括:
[0322]
获取模块1110,用于获取与所述业务活动对应的多个样本数据;每一所述样本数据包括多个数据特征,每个所述数据特征对应于一个特征域;
[0323]
编码模块1120,用于将每个样本数据中与同一特征域对应的所述数据特征,输入与所述特征域对应的编码网络,得到与所述特征域对应的特征向量;
[0324]
嵌入模块1130,用于将与所述特征域对应的特征向量输入所述注意力层,得到与每个样本数据对应的包括各个所述特征向量之间关系的总向量;
[0325]
期望确定模块1140,用于将每个样本数据的所述总向量输入所述确定子模块,利用所述确定子模块确定每个所述样本数据的期望;
[0326]
训练模块1150,用于根据每一样本数据的期望训练所述模型,得到用于评估业务活动风险的模型。
[0327]
本实施例提供的装置的具体原理和实现方式均与图6所示的实施例类似,此处不再赘述。
[0328]
图12为本技术另一示例性实施例示出的用于评估业务活动风险的模型的训练装置的结构图。
[0329]
如图12所示,在上述实施例基础上,本技术提供的用于评估业务活动风险的模型的训练装置1200的基础上,所述嵌入模块1130包括:
[0330]
相似度确定单元1131,用于根据每个样本数据中与各个特征域对应的所述特征向量,确定每个样本数据中每两个特征向量之间的特征相似度;
[0331]
嵌入单元1132,用于根据每个样本数据中各个特征相似度,确定每个样本数据包括各个所述特征向量之间关系的总向量。
[0332]
可选的,所述嵌入单元1132具体用于:
[0333]
根据每个样本数据的各个特征相似度,确定每个样本数据中每个特征向量与其他特征向量之间的关系系数;所述关系系数用于表征两个特征向量之间的关系;
[0334]
根据每个样本数据中每个特征向量与其他特征向量之间的关系系数、各个所述特征向量,确定每个样本数据中每个特征向量的特征域嵌入向量;
[0335]
根据每个样本数据中各特征向量的特征域嵌入向量,生成每个样本数据的总向量。
[0336]
可选的,所述期望确定模块1140,包括:
[0337]
压缩单元1141,用于将每个样本数据的所述总向量输入压缩网络,得到每个样本数据的压缩向量;
[0338]
估计单元1142,用于将每个样本数据的所述压缩向量输入估计网络,得到所述每个样本数据属于各高斯分布的概率向量;其中,所述高斯分布的数量为所述特征域的数量;
[0339]
期望确定单元1143,用于根据每个所述样本数据属于各高斯分布的概率向量、每个样本数据的所述压缩向量,确定每个所述样本数据的期望;其中,所述期望用于表征所述样本数据与各所述高斯分布之间的距离。
[0340]
可选的,所述压缩单元1141具体用于:
[0341]
根据编码函数、第一神经网络参数,对每个样本数据的所述总向量进行编码,得到每个样本数据的编码向量;
[0342]
根据解码函数、第二神经网络参数,对每个样本数据的所述编码向量进行解码,得到每个样本数据的解码向量;
[0343]
根据每个样本数据的数据特征、每个样本数据的所述解码向量,确定每个样本数据的重构误差;所述重构误差用于表征每个样本数据的数据特征与每个样本数据的解码向量之间的差异;
[0344]
根据每个样本数据的所述编码向量、每个样本数据的所述重构误差,确定每个样本数据的所述压缩向量。
[0345]
可选的,所述训练模块1150包括第一训练单元1151,用于:
[0346]
根据每个样本数据的所述重构误差修正与各个所述特征域对应的编码网络中的参数。
[0347]
可选的,所述估计单元1142具体用于:
[0348]
根据第三神经网络参数,将每个样本数据的所述压缩向量转换为输出特征;
[0349]
根据预设函数、每个样本数据的所述输出特征,确定每个样本数据的属于各高斯分布的概率向量。
[0350]
可选的,所述期望确定单元1143,具体用于:
[0351]
根据每个样本数据属于各高斯分布的概率向量、每个样本数的所述压缩向量,确定各所述高斯分布的参数;
[0352]
根据每个所述样本数据的压缩向量、各所述高斯分布的参数,确定每个所述样本数据的期望。
[0353]
可选的,所述高斯分布的参数包括出现概率、均值、协方差矩阵;
[0354]
所述期望确定单元1143具体用于:
[0355]
根据每个样本数据属于各高斯分布的概率向量、所述样本数据的数量,确定每个高斯分布的出现概率;
[0356]
根据每个样本数据属于各高斯分布的概率向量、每个样本数据的所述压缩向量,确定每个高斯分布的均值;
[0357]
根据每个高斯分布的均值、每个样本数据属于各高斯分布的概率向量、每个样本数据的所述压缩向量,确定每个高斯分布的协方差矩阵。
[0358]
可选的,所述训练模块1150包括第二训练单元1152,用于:
[0359]
根据每一样本数据的期望,修正所述注意力层、所述确定子模块中的网络参数,得到用于评估业务活动风险的模型。
[0360]
可选的,所述获取模块1110,包括:
[0361]
获取单元1111,用于获取与所述业务活动对应的离线特征,获取与业务活动对应的每一实时数据;
[0362]
确定单元1112,用于根据所述离线特征、每一所述实时数据,确定所述业务活动的每一样本数据。
[0363]
本实施例提供的装置的具体原理和实现方式均与图8所示的实施例类似,此处不再赘述。
[0364]
图13为本发明一示例性实施例示出的电子设备的结构图。
[0365]
如图13所示,本实施例提供的电子设备包括:
[0366]
存储器131;
[0367]
处理器132;以及
[0368]
计算机程序;
[0369]
其中,所述计算机程序存储在所述存储器131中,并配置为由所述处理器132执行以实现如上所述的任一种业务活动的风险信息确定方法或用于评估业务活动风险的模型的训练方法。
[0370]
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,
[0371]
所述计算机程序被处理器执行以实现如上所述的任一种业务活动的风险信息确定方法或用于评估业务活动风险的模型的训练方法。
[0372]
本实施例还提供一种计算机程序,包括程序代码,当计算机运行所述计算机程序时,所述程序代码执行如上所述的任一种业务活动的风险信息确定方法或用于评估业务活动风险的模型的训练方法。
[0373]
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0374]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进
行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献