一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

预测模型训练方法、数据处理装置和系统与流程

2021-11-18 01:24:00 来源:中国专利 TAG:


1.本公开涉及信息处理领域,特别涉及一种预测模型训练方法、数据处理装置和系统。


背景技术:

2.基于联邦学习(federated learning)的分布式训练技术,已广泛应用于区块链、医疗数据建模、个性化搜索推荐等领域。联邦学习算法采用传统的类似逻辑回归等机器学习方法,数据样本在生成过程和传输过程分布在各个不同参与方,保证数据安全共享。


技术实现要素:

3.发明人通过研究发现,在现有的联邦学习系统中,由于位于不同平台上的机器学习模型在训练过程中需要更新全部参数,因此计算量较大,无法提升模型的训练效率。
4.据此,本公开提供一种预测模型训练方案,通过在联邦学习系统中的两个机器学习模型之间进行信息交互,以便进行前向传播和反向传播。由于计算量较小,从而可有效提升模型的训练效率。
5.根据本公开实施例的第一方面,提供一种预测模型训练方法,由联邦学习系统中的第一数据处理装置执行,包括:从所述联邦学习系统中的第二数据处理装置接收第一用户特征样本数据;根据所述第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本;将所述训练样本输入第一机器学习模型,并将所述训练样本发送给所述第二数据处理装置,以便所述第二数据处理装置将所述训练样本输入第二机器学习模型;将所述第二数据处理装置提供的所述第二机器学习模型的第一调整参数输入所述第一机器学习模型以进行前向传播;利用所述第二机器学习模型的损失值输入所述第二机器学习模型以进行反向传播,从而得到用户行为预测模型。
6.在一些实施例中,根据所述第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本包括:将所述第一用户特征样本数据和所述用户特征第二样本数据中具有相同用户标识的样本数据进行拼接,以生成所述训练样本。
7.在一些实施例中,将所述第二数据处理装置提供的所述第二机器学习模型的第一调整参数输入所述第一机器学习模型包括:从所述第二数据处理装置接收所述第二机器学习模型的第一调整参数;利用所述第一调整参数和第一权值生成第一偏置参数,利用所述第一机器学习模型的第二调整参数和第二权值生成第二偏置参数;将所述第一偏置参数发送给所述第二数据处理装置;从所述第二数据处理装置接收第一融合参数,其中所述第一融合参数包括所述第一偏置参数和利用所述第一调整参数和第三权值生成的第三偏置参数;利用所述第一融合参数和所述第二偏置参数生成第一梯度参数;将所述第一梯度参数输入所述第一机器学习模型以进行前向传播。
8.在一些实施例中,所述第一偏置参数为所述第一调整参数和所述第一权值的乘积;所述第二偏置参数为所述第二调整参数和所述第二权值的乘积;所述第三偏置参数为
所述第一调整参数和所述第三权值的乘积;所述第一融合参数为所述第一偏置参数和所述第三偏置参数的和值;所述第一梯度参数为所述第一融合参数和所述第二偏置参数的和值。
9.在一些实施例中,所述第一偏置参数为所述第一调整参数和所述第一权值的乘积与第一随机数的和值;所述第二偏置参数为所述第二调整参数和所述第二权值的乘积;所述第三偏置参数为所述第一调整参数和所述第三权值的乘积;所述第一融合参数为所述第一偏置参数和所述第三偏置参数的和值;所述第一梯度参数为所述第一融合参数和所述第二偏置参数的和值减去所述第一随机数的差值。
10.在一些实施例中,利用所述第二机器学习模型的损失值输入所述第二机器学习模型以进行反向传播包括:利用所述损失值和所述第二调整参数对所述第二权值进行更新;利用所述损失值和更新后的第二权值确定第一反向传播参数;将所述第一反向传播参数输入所述第一机器学习模型以进行反向传播。
11.在一些实施例中,所述更新后的第二权值为所述损失值和所述第二调整参数的乘积;所述第一反向传播参数为所述损失值和所述更新后的第二权值的乘积。
12.在一些实施例中,将所述损失值发送给所述第二数据处理装置,以便所述第二数据处理装置将所述损失值输入所述第二机器学习模型以进行反向传播。
13.在一些实施例中,将所述损失值发送给所述第二数据处理装置包括:利用所述损失值和所述第一调整参数生成第一训练参数,并将所述第一训练参数发送给所述第二数据处理装置;从所述第二数据处理装置接收第二融合参数以及所述第三权值,其中所述第二融合参数包括所述第一训练参数和利用第二随机数生成的第二训练参数;利用所述第二融合参数对所述第一权值进行更新;利用所述损失值、更新后的第一权值和所述第三权值生成第二反向传播参数;将所述第二反向传播参数发送给所述第二数据处理装置,以便所述第二数据处理装置将所述第二反向传播参数输入所述第二机器学习模型以进行反向传播。
14.在一些实施例中,所述第一训练参数为所述损失值和所述第一调整参数的乘积;所述第二训练参数为所述第二随机数和预设参数的比值;所述第二融合参数为所述第一训练参数和所述第二训练参数的和值;所述第二反向传播参数为所述损失值与所述更新后的第一权值的乘积与所述第三权值的和值;利用所述第二融合参数对所述第一权值进行更新包括:将所述第一权值减去所述预设参数与第二融合参数的乘积的差值作为更新后的第一权值。
15.在一些实施例中,所述第一训练参数为所述损失值和所述第一调整参数的乘积与第三随机数的和值;所述第二训练参数为所述第二随机数和预设参数的比值;所述第二融合参数为所述第一训练参数和所述第二训练参数的和值;所述第二反向传播参数为所述损失值与所述更新后的第一权值的乘积与所述第三权值的和值;利用所述第二融合参数对所述第一权值进行更新包括:将所述第二融合参数减去所述第三随机数的差值以得到第一差值;将所述第一权值减去所述预设参数与所述第一差值的乘积的第二差值作为更新后的第一权值。
16.在一些实施例中,所述第一机器学习模型和所述第二机器学习模型为二分类机器学习模型。
17.根据本公开实施例的第二方面,提供一种预测模型训练装置,所述预测模型训练
装置为联邦学习系统中的第一数据处理装置,包括:第一处理模块,被配置为从所述联邦学习系统中的第二数据处理装置接收第一用户特征样本数据,根据所述第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本,将所述训练样本输入第一机器学习模型,并将所述训练样本发送给所述第二数据处理装置,以便所述第二数据处理装置将所述训练样本输入第二机器学习模型;第二处理模块,被配置为将所述第二数据处理装置提供的所述第二机器学习模型的第一调整参数输入所述第一机器学习模型以进行前向传播,利用所述第二机器学习模型的损失值输入所述第二机器学习模型以进行反向传播,从而得到用户行为预测模型。
18.在一些实施例中,第一处理模块被配置为将所述第一用户特征样本数据和所述用户特征第二样本数据中具有相同用户标识的样本数据进行拼接,以生成所述训练样本。
19.在一些实施例中,第二处理模块被配置为从所述第二数据处理装置接收所述第二机器学习模型的第一调整参数,利用所述第一调整参数和第一权值生成第一偏置参数,利用所述第一机器学习模型的第二调整参数和第二权值生成第二偏置参数,将所述第一偏置参数发送给所述第二数据处理装置,从所述第二数据处理装置接收第一融合参数,其中所述第一融合参数包括所述第一偏置参数和利用所述第一调整参数和第三权值生成的第三偏置参数,利用所述第一融合参数和所述第二偏置参数生成第一梯度参数,将所述第一梯度参数输入所述第一机器学习模型以进行前向传播。
20.在一些实施例中,所述第一偏置参数为所述第一调整参数和所述第一权值的乘积;所述第二偏置参数为所述第二调整参数和所述第二权值的乘积;所述第三偏置参数为所述第一调整参数和所述第三权值的乘积;所述第一融合参数为所述第一偏置参数和所述第三偏置参数的和值;所述第一梯度参数为所述第一融合参数和所述第二偏置参数的和值。
21.在一些实施例中,所述第一偏置参数为所述第一调整参数和所述第一权值的乘积与第一随机数的和值;所述第二偏置参数为所述第二调整参数和所述第二权值的乘积;所述第三偏置参数为所述第一调整参数和所述第三权值的乘积;所述第一融合参数为所述第一偏置参数和所述第三偏置参数的和值;所述第一梯度参数为所述第一融合参数和所述第二偏置参数的和值减去所述第一随机数的差值。
22.在一些实施例中,第二处理模块被配置为利用所述损失值和所述第二调整参数对所述第二权值进行更新,利用所述损失值和更新后的第二权值确定第一反向传播参数,将所述第一反向传播参数输入所述第一机器学习模型以进行反向传播。
23.在一些实施例中,所述更新后的第二权值为所述损失值和所述第二调整参数的乘积;所述第一反向传播参数为所述损失值和所述更新后的第二权值的乘积。
24.在一些实施例中,第二处理模块被配置为将所述损失值发送给所述第二数据处理装置,以便所述第二数据处理装置将所述损失值输入所述第二机器学习模型以进行反向传播。
25.在一些实施例中,第二处理模块被配置为利用所述损失值和所述第一调整参数生成第一训练参数,并将所述第一训练参数发送给所述第二数据处理装置,从所述第二数据处理装置接收第二融合参数以及所述第三权值,其中所述第二融合参数包括所述第一训练参数和利用第二随机数生成的第二训练参数,利用所述第二融合参数对所述第一权值进行
更新,利用所述损失值、更新后的第一权值和所述第三权值生成第二反向传播参数,将所述第二反向传播参数发送给所述第二数据处理装置,以便所述第二数据处理装置将所述第二反向传播参数输入所述第二机器学习模型以进行反向传播。
26.在一些实施例中,所述第一训练参数为所述损失值和所述第一调整参数的乘积;所述第二训练参数为所述第二随机数和预设参数的比值;所述第二融合参数为所述第一训练参数和所述第二训练参数的和值;所述第二反向传播参数为所述损失值与所述更新后的第一权值的乘积与所述第三权值的和值;第二处理模块还被配置为将所述第一权值减去所述预设参数与第二融合参数的乘积的差值作为更新后的第一权值。
27.在一些实施例中,所述第一训练参数为所述损失值和所述第一调整参数的乘积与第三随机数的和值;所述第二训练参数为所述第二随机数和预设参数的比值;所述第二融合参数为所述第一训练参数和所述第二训练参数的和值;所述第二反向传播参数为所述损失值与所述更新后的第一权值的乘积与所述第三权值的和值;第二处理模块还被配置为将所述第二融合参数减去所述第三随机数的差值以得到第一差值,将所述第一权值减去所述预设参数与所述第一差值的乘积的第二差值作为更新后的第一权值。
28.在一些实施例中,所述第一机器学习模型和所述第二机器学习模型为二分类机器学习模型。
29.根据本公开实施例的第三方面,提供一种数据处理装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。
30.根据本公开实施例的第四方面,提供一种数据处理系统,包括:第一数据处理装置,为上述任一实施例所述的数据处理装置;第二数据处理装置,被配置为将第一用户特征样本数据发送给所述第一数据处理装置,将所述第一数据处理装置发送的训练样本输入第二机器学习模型,将所述第二机器学习模型的第一调整参数发送给所述第一数据处理装置。
31.在一些实施例中,所述第二数据处理装置被配置为在接收到所述第一数据处理装置发送的第一偏置参数后,利用所述第一调整参数和第三权值生成第三偏置参数,将第一融合参数发送给所述第一数据处理装置,其中所述第一融合参数包括所述第一偏置参数和所述第三偏置参数。
32.在一些实施例中,所述第三偏置参数为所述第一调整参数和所述第三权值的乘积;所述第一融合参数为所述第一偏置参数和所述第三偏置参数的和值。
33.在一些实施例中,所述第二数据处理装置被配置为将所述第一数据处理装置发送的损失值输入所述第二机器学习模型以进行反向传播。
34.在一些实施例中,所述第二数据处理装置被配置为在接收到所述第一数据处理装置发送的第一训练参数后,利用第二随机数生成第二训练参数,将第二融合参数发送给所述第一数据处理装置,其中所述第二融合参数包括所述第一训练参数和利用第二随机数生成的第二训练参数,利用所述第二随机数对第三权值进行更新,将更新后的第三权值发送给所述第一数据处理装置,将所述第一数据处理装置发送的第二反向传播参数输入所述第二机器学习模型以进行反向传播。
35.在一些实施例中,所述第二训练参数为所述第二随机数和预设参数的比值;所述
第二融合参数为所述第一训练参数和所述第二训练参数的和值;所述第二数据处理装置将所述第三权值与所述第二随机数的和值作为更新后的第三权值。
36.根据本公开实施例的第五方面,提供一种预测方法,包括:提取用户特征数据;将用户特征数据输入用户行为预测模型,以得到用户行为预测结果,其中所述用户行为预测模型通过上述任一实施例所述的训练方法得到。
37.根据本公开实施例的第六方面,提供一种预测装置,包括:提取模块,被配置为提取用户特征数据;预测模块,被配置为将用户特征数据输入用户行为预测模型,以得到用户行为预测结果,其中所述用户行为预测模型通过上述任一实施例所述的训练方法得到。
38.根据本公开实施例的第七方面,提供一种预测装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的预测方法。
39.根据本公开实施例的第八方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。
40.通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
41.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
42.图1为本公开一个实施例的预测模型训练方法的流程示意图;
43.图2为本公开另一个实施例的预测模型训练方法的流程示意图;
44.图3为本公开又一个实施例的预测模型训练方法的流程示意图;
45.图4为本公开又一个实施例的预测模型训练方法的流程示意图;
46.图5为本公开一个实施例的预测模型训练装置的结构示意图;
47.图6为本公开另一个实施例的预测模型训练装置的结构示意图;
48.图7为本公开一个实施例的数据处理系统的结构示意图;
49.图8为本公开又一个实施例的预测模型训练方法的流程示意图;
50.图9为本公开又一个实施例的预测模型训练方法的流程示意图;
51.图10为本公开又一个实施例的预测模型训练方法的流程示意图;
52.图11为本公开一个实施例的预测方法的流程示意图。
53.图12为本公开一个实施例的预测装置的结构示意图;
54.图13为本公开另一个实施例的预测装置的结构示意图。
具体实施方式
55.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使
用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
56.除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
57.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
58.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
59.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
60.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
61.图1为本公开一个实施例的预测模型训练方法的流程示意图。在一些实施例中,下列的预测模型训练方法由联邦学习系统中的第一数据处理装置执行。
62.在步骤101,从联邦学习系统中的第二数据处理装置接收第一用户特征样本数据。
63.在步骤102,根据第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本。
64.在一些实施例中,将第一用户特征样本数据和用户特征第二样本数据中具有相同用户标识的样本数据进行拼接,以生成训练样本。
65.在步骤103,将训练样本输入第一机器学习模型,并将训练样本发送给第二数据处理装置,以便第二数据处理装置将训练样本输入第二机器学习模型。
66.在步骤104,将第二数据处理装置提供的第二机器学习模型的第一调整参数输入第一机器学习模型以进行前向传播。
67.在一些实施例中,上述步骤104如图2所示。
68.在步骤201,从第二数据处理装置接收第二机器学习模型的第一调整参数。
69.在步骤202,利用第一调整参数和第一权值生成第一偏置参数,利用第一机器学习模型的第二调整参数和第二权值生成第二偏置参数。
70.在步骤203,将第一偏置参数发送给第二数据处理装置。
71.在步骤204,从第二数据处理装置接收第一融合参数,其中第一融合参数包括第一偏置参数和利用第一调整参数和第三权值生成的第三偏置参数。
72.在步骤205,利用第一融合参数和第二偏置参数生成第一梯度参数。
73.在步骤206,将第一梯度参数输入第一机器学习模型以进行前向传播。
74.在一些实施例中,第一机器学习模型中设有交互层,通过将第一梯度参数输入第一机器学习模型的交互层以进行前向传播。
75.在一些实施例中,第一偏置参数为第一调整参数和第一权值的乘积,第二偏置参数为第二调整参数和第二权值的乘积,第三偏置参数为第一调整参数和第三权值的乘积,第一融合参数为第一偏置参数和第三偏置参数的和值,第一梯度参数为第一融合参数和第二偏置参数的和值。
76.在另一些实施例中,第一偏置参数为第一调整参数和第一权值的乘积与第一随机
数的和值,第二偏置参数为第二调整参数和第二权值的乘积,第三偏置参数为第一调整参数和第三权值的乘积,第一融合参数为第一偏置参数和第三偏置参数的和值,第一梯度参数为第一融合参数和第二偏置参数的和值减去第一随机数的差值。
77.返回图1。在步骤105,将第二机器学习模型的损失值输入第二机器学习模型以进行反向传播,从而得到用户行为预测模型。
78.在一些实施例中,将第二机器学习模型的损失值输入第二机器学习模型的交互层以进行反向传播。
79.在一些实施例中,上述步骤105如图3所示。
80.在步骤301,利用损失值和第二调整参数对第二权值进行更新。
81.例如,损失值为预测值与真实值的差值。
82.在步骤302,利用损失值和更新后的第二权值确定第一反向传播参数。
83.在步骤303,将第一反向传播参数输入第一机器学习模型以进行反向传播。
84.在一些实施例中,更新后的第二权值为损失值和第二调整参数的乘积,第一反向传播参数为损失值和更新后的第二权值的乘积。
85.在一些实施例中,如图4所示,通过将损失值发送给第二数据处理装置,以便第二数据处理装置将损失值输入第二机器学习模型的交互层以进行反向传播。
86.在步骤401,利用损失值和第一调整参数生成第一训练参数,并将第一训练参数发送给第二数据处理装置。
87.在步骤402,从第二数据处理装置接收第二融合参数以及第三权值,其中第二融合参数包括第一训练参数和利用第二随机数生成的第二训练参数。
88.在步骤403,利用第二融合参数对第一权值进行更新。
89.在步骤404,利用损失值、更新后的第一权值和第三权值生成第二反向传播参数。
90.在步骤405,将第二反向传播参数发送给第二数据处理装置,以便第二数据处理装置将第二反向传播参数输入第二机器学习模型以进行反向传播。
91.在一些实施例中,第一训练参数为损失值和第一调整参数的乘积,第二训练参数为第二随机数和预设参数的比值,第二融合参数为第一训练参数和第二训练参数的和值,第二反向传播参数为损失值与更新后的第一权值的乘积与第三权值的和值,此外将第一权值减去预设参数与第二融合参数的乘积的差值作为更新后的第一权值。
92.在另一些实施例中,第一训练参数为损失值和第一调整参数的乘积与第三随机数的和值,第二训练参数为第二随机数和预设参数的比值,第二融合参数为第一训练参数和第二训练参数的和值,第二反向传播参数为损失值与更新后的第一权值的乘积与第三权值的和值,此外将第二融合参数减去第三随机数的差值以得到第一差值,将第一权值减去预设参数与第一差值的乘积的第二差值作为更新后的第一权值。
93.在一些实施例中,第一机器学习模型和第二机器学习模型为诸如gbdt(gradient boosting decision tree,梯度提升迭代决策树)的二分类机器学习模型。
94.例如,联邦学习系统中的第一数据处理装置位于第一平台,联邦学习系统中第二数据处理装置位于第二平台。第一平台具有少量的用户行为特征,第二平台具有用户在相关业务领域的较多的行为特征。通过第一数据处理装置和第二数据处理装置之间的交互,以便第一平台处的机器学习模型和第二平台处的机器学习模型进行前向传播和反向传播,
从而得到用户行为预测模型。利用该用户行为预测模型就能预测出该用户针对相关业务的行为特征。由于计算量较小,从而可有效提升模型的训练效率。
95.图5为本公开一个实施例的预测模型训练装置的结构示意图。图5所示的预测模型信令装置为联邦学习系统中的第一数据处理装置。如图5所示,预测模型训练装置包括第一处理模块51和第二处理模块52。
96.第一处理模块51从联邦学习系统中的第二数据处理装置接收第一用户特征样本数据,根据第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本,将训练样本输入第一机器学习模型,并将训练样本发送给第二数据处理装置,以便第二数据处理装置将训练样本输入第二机器学习模型。
97.在一些实施例中,第一处理模块51将第一用户特征样本数据和用户特征第二样本数据中具有相同用户标识的样本数据进行拼接,以生成训练样本。
98.第二处理模块52被配置为将第二数据处理装置提供的第二机器学习模型的第一调整参数输入第一机器学习模型以进行前向传播,利用第二机器学习模型的损失值输入第二机器学习模型以进行反向传播,从而得到用户行为预测模型。
99.在一些实施例中,第二处理模块52从第二数据处理装置接收第二机器学习模型的第一调整参数,利用第一调整参数和第一权值生成第一偏置参数,利用第一机器学习模型的第二调整参数和第二权值生成第二偏置参数,将第一偏置参数发送给第二数据处理装置,从第二数据处理装置接收第一融合参数,其中第一融合参数包括第一偏置参数和利用第一调整参数和第三权值生成的第三偏置参数,利用第一融合参数和第二偏置参数生成第一梯度参数,将第一梯度参数输入第一机器学习模型以进行前向传播。
100.在一些实施例中,第一偏置参数为第一调整参数和第一权值的乘积,第二偏置参数为第二调整参数和第二权值的乘积,第三偏置参数为第一调整参数和第三权值的乘积,第一融合参数为第一偏置参数和第三偏置参数的和值,第一梯度参数为第一融合参数和第二偏置参数的和值。
101.在另一些实施例中,第一偏置参数为第一调整参数和第一权值的乘积与第一随机数的和值,第二偏置参数为第二调整参数和第二权值的乘积,第三偏置参数为第一调整参数和第三权值的乘积,第一融合参数为第一偏置参数和第三偏置参数的和值,第一梯度参数为第一融合参数和第二偏置参数的和值减去第一随机数的差值。
102.在一些实施例中,第二处理模块52利用损失值和第二调整参数对第二权值进行更新,利用损失值和更新后的第二权值确定第一反向传播参数,将第一反向传播参数输入第一机器学习模型以进行反向传播。
103.例如,更新后的第二权值为损失值和第二调整参数的乘积,第一反向传播参数为损失值和更新后的第二权值的乘积。
104.在一些实施例中,第二处理模块52将损失值发送给第二数据处理装置,以便第二数据处理装置将损失值输入第二机器学习模型以进行反向传播。
105.例如,第二处理模块52利用损失值和第一调整参数生成第一训练参数,并将第一训练参数发送给第二数据处理装置,从第二数据处理装置接收第二融合参数以及第三权值,其中第二融合参数包括第一训练参数和利用第二随机数生成的第二训练参数,利用第二融合参数对第一权值进行更新,利用损失值、更新后的第一权值和第三权值生成第二反
向传播参数,将第二反向传播参数发送给第二数据处理装置,以便第二数据处理装置将第二反向传播参数输入第二机器学习模型以进行反向传播。
106.在一些实施例中,第一训练参数为损失值和第一调整参数的乘积,第二训练参数为第二随机数和预设参数的比值,第二融合参数为第一训练参数和第二训练参数的和值,第二反向传播参数为损失值与更新后的第一权值的乘积与第三权值的和值,第二处理模块还被配置为将第一权值减去预设参数与第二融合参数的乘积的差值作为更新后的第一权值。
107.在另一些实施例中,第一训练参数为损失值和第一调整参数的乘积与第三随机数的和值,第二训练参数为第二随机数和预设参数的比值,第二融合参数为第一训练参数和第二训练参数的和值,第二反向传播参数为损失值与更新后的第一权值的乘积与第三权值的和值,第二处理模块还被配置为将第二融合参数减去第三随机数的差值以得到第一差值,将第一权值减去预设参数与第一差值的乘积的第二差值作为更新后的第一权值。
108.在一些实施例中,第一机器学习模型和第二机器学习模型为诸如gbdt的二分类机器学习模型。
109.图6为本公开另一个实施例的数据处理装置的结构示意图。如图6所示,数据处理装置包括存储器61和处理器62。
110.存储器61用于存储指令,处理器62耦合到存储器61,处理器62被配置为基于存储器存储的指令执行实现如图1至图4中任一实施例涉及的方法。
111.如图6所示,该数据处理装置还包括通信接口63,用于与其它设备进行信息交互。同时,该数据处理装置还包括总线64,处理器62、通信接口63、以及存储器61通过总线64完成相互间的通信。
112.存储器61可以包含高速ram存储器,也可还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。存储器61也可以是存储器阵列。存储器61还可能被分块,并且块可按一定的规则组合成虚拟卷。
113.此外,处理器62可以是一个中央处理器cpu,或者可以是专用集成电路asic,或是被配置成实施本公开实施例的一个或多个集成电路。
114.本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图1至图4中任一实施例涉及的方法。
115.图7为本公开一个实施例的数据处理系统的结构示意图。如图7所示,数据处理系统包括第一数据处理装置71和第二数据处理装置72。第一数据处理装置71为图5或图6中任一实施例涉及的数据处理装置。
116.第二数据处理装置72将第一用户特征样本数据发送给第一数据处理装置71,将第一数据处理装置71发送的训练样本输入第二机器学习模型,将第二机器学习模型的第一调整参数发送给第一数据处理装置71。
117.在一些实施例中,第二数据处理装置72在接收到第一数据处理装置71发送的第一偏置参数后,利用第一调整参数和第三权值生成第三偏置参数,将第一融合参数发送给第一数据处理装置71,其中第一融合参数包括第一偏置参数和第三偏置参数。
118.例如,第三偏置参数为第一调整参数和第三权值的乘积,第一融合参数为第一偏置参数和第三偏置参数的和值。
119.在一些实施例中,第二数据处理装置72将第一数据处理装置71发送的损失值输入第二机器学习模型以进行反向传播。
120.在一些实施例中,第二数据处理装置72在接收到第一数据处理装置71发送的第一训练参数后,利用第二随机数生成第二训练参数,将第二融合参数发送给第一数据处理装置71,第二融合参数包括第一训练参数和利用第二随机数生成的第二训练参数,利用第二随机数对第三权值进行更新,将更新后的第三权值发送给第一数据处理装置71,将第一数据处理装置71发送的第二反向传播参数输入第二机器学习模型以进行反向传播。
121.在一些实施例中,第二训练参数为第二随机数和预设参数的比值。第二融合参数为第一训练参数和第二训练参数的和值。第二数据处理装置72将第三权值与第二随机数的和值作为更新后的第三权值。
122.图8为本公开又一个实施例的预测模型训练方法的流程示意图。
123.在步骤801,第二数据处理装置将第一用户特征样本数据发送给第一数据处理装置。
124.在步骤802,第一数据处理装置根据第一用户特征样本数据和自身参与训练的第二用户特征样本数据确定训练样本。
125.在步骤803,第一数据处理装置将训练样本发送给第二数据处理装置。
126.在步骤804,第一数据处理装置将训练样本输入第一机器学习模型。
127.在步骤805,第二数据处理装置将训练样本输入第二机器学习模型。
128.在步骤806,第一数据处理装置将交互信息输入第一机器学习模型以进行前向传播和反向传播。
129.在步骤807,第二数据处理装置将交互信息输入第二机器学习模型以进行反向传播。
130.在步骤808,将经过训练的第一机器学习模型作为用户行为预测模型。
131.在一些实施例中,第一机器学习模型进行前向传播如图9所示。
132.在步骤901a,第二数据处理装置确定用于前向传播的第一调整参数a(p)。
133.在步骤901b,第二数据处理装置确定用于前向传播的第二调整参数a(a)。
134.在步骤902,第二数据处理装置将第一调整参数a(p)加密以得到第一加密参数[a(p)],并将第一加密参数[a(p)]发送给第一数据处理装置。
[0135]
在步骤903,第一数据处理装置对第一加密参数[a(p)]解密以得到第一调整参数a(p),并计算第一偏置参数z(p)和第二偏置参数z(a),其中z(p)=a(p)*w(p) ε(a),w(p)为第一权值,ε(a)为随机数。z(a)=a(a)*w(a),w(a)为第二权值。
[0136]
在步骤904,第一数据处理装置将第一偏置参数z(p)加密后以得到第二加密参数[a(p)*w(p) ε(a)],并将第二加密参数[a(p)*w(p) ε(a)]发送给第二数据处理装置。
[0137]
在步骤905,第二数据处理装置对第二加密参数解密后,计算第一融合参数,其中第一融合参数为a(p)*w(p) ε(a) a(p)*ε(acc),ε(acc)为第三权值。
[0138]
在步骤906,第二数据处理装置将第一融合参数发送给第一数据处理装置。
[0139]
在步骤907,第一数据处理装置利用第一融合参数和第二偏置参数计算第一梯度参数z,z=z(a) (a(p)*w(p) ε(a) a(p)*ε(acc))

ε(a)。
[0140]
在步骤908,利用激活函数f计算前向传播参数f(z)。
[0141]
在步骤909,第一机器学习模型利用f(z)进行前向传播。
[0142]
在一些实施例中,第一机器学习模型和第二机器学习模型进行反向传播如图10所示。
[0143]
在步骤1001,第一数据处理装置计算损失值δ。
[0144]
在步骤1002,第一数据处理装置计算第一训练参数,第一训练参数为δ*a(p) ε(a),ε(a)为随机值。
[0145]
在步骤1003,第一数据处理装置将加密后的第一训练参数[δ*a(p) ε(a)]发送给第二数据处理装置。
[0146]
在步骤1004,第二数据处理装置将加密后的第一训练参数解密后,计算融合参数,融合参数为δ*a(p) ε(a) ε(p)/η,ε(p)为随机数,η为预设参数。
[0147]
在步骤1005,第二数据处理装置将融合参数发送第一数据处理装置。
[0148]
在步骤1006,第一数据处理装置在接收到融合参数后,对第一权值w(p)进行更新,即w(p)=w(p)

η((δ*a(p) ε(a) ε(p)/η)

ε(a))。
[0149]
在步骤1007,第二数据处理装置将第三参数ε(acc)进行更新,即ε(acc)=ε(acc) ε(p)。
[0150]
在步骤1008,第二数据处理装置将更新后的第三参数ε(acc)进行加密以得到[ε(acc)],并将[ε(acc)]发送给第一数据处理装置。
[0151]
在步骤1009,第一数据处理装置对接收到的[ε(acc)]进行解密以得到第三参数ε(acc),并计算反向传播参数δ(p),δ(p)=δ*w(p) ε(acc)。
[0152]
在步骤1010,第一数据处理装置将反向传播参数δ(p)加密以得到[δ(p)],并将[δ(p)]发送给第二数据处理装置。
[0153]
在步骤1011,第二数据处理装置对[δ(p)]解密后以得到反向传播参数δ(p)。
[0154]
在步骤1012,第二数据处理装置将δ(p)输入第二机器学习模型以进行反向传播。
[0155]
在步骤1013,第一数据处理装置对第二权值w(a)进行更新,即w(a)=δ*a(a)。
[0156]
在步骤1014,第一数据处理装置利用损失值和更新后的第二权值确定反向传播参数δ(a),δ(a)=δ*w(a)。
[0157]
在步骤1015,第一数据处理装置将反向传播参数δ(a)输入第一机器学习模型以进行反向传播。
[0158]
图11为本公开一个实施例的预测方法的流程示意图。在一些实施例中,下列的预测方法由预测装置执行。
[0159]
在步骤1101,提取用户特征数据。
[0160]
在步骤1102,将用户特征数据输入预测模型,以得到预测结果。
[0161]
这里需要说明的是,预测模型通过图1

4中任一实施例的训练方法得到。
[0162]
图12为本公开一个实施例的预测装置的结构示意图。如图12所示,预测装置包括提取模块1201和预测模块1202。
[0163]
提取模块1201被配置为提取用户特征数据。
[0164]
预测模块1202被配置为将用户特征数据输入预测模型,以得到预测结果。预测模型通过图1

4中任一实施例的训练方法得到。
[0165]
图13为本公开另一个实施例的预测装置的结构示意图。如图13所示,预测装置包
括存储器1301、处理器1302、通信接口1303和总线1304。图13与图6的不同之处在于,在图13所示实施例中,处理器1302被配置为基于存储器存储的指令执行实现如图11中任一实施例涉及的方法。
[0166]
本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图11中任一实施例涉及的方法。
[0167]
在一些实施例中,在上面所描述的功能单元模块可以实现为用于执行本公开所描述功能的通用处理器、可编程逻辑控制器(programmable logic controller,简称:plc)、数字信号处理器(digital signal processor,简称:dsp)、专用集成电路(application specific integrated circuit,简称:asic)、现场可编程门阵列(field

programmable gate array,简称:fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。
[0168]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0169]
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献