数据处理方法和装置与流程

2021-11-30 21:43:00 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，尤其涉及一种数据处理方法和装置。

背景技术：

2.随着互联网的发展，互联网上的内容越来越丰富，用户往往需要花费大量时间和精力从这些海量内容中筛选需要的信息。因此，如何快速找出用户感兴趣的内容成为了互联网非常重要的研究方向。其中，点击率预估(click-through-rate,ctr)模型是解决这一问题的关键技术之一，点击率预估模型可以根据用户的特点和历史行为，预测用户点击候选信息的概率。
3.在现有技术中，最初是直接将离散的特征输入点击率预估模型从而得到模型的输出结果，而不对特征数据进行任何挖掘，比如，这使得点击率预估模型的输出结果存在预估准确率低、效果差等问题。为了解决上述问题，现有技术提出了embedding(嵌入)方法。embedding方法是将样本中的离散特征映射为一个特征向量，并通过对特征向量进行操作以进一步挖掘隐藏特征。
4.在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有的embedding方法存在特征挖掘不充分、特征挖掘过程中噪声较大等问题，进而导致最终的点击率预估模型的输出结果的准确率仍然比较低，预估效果不理想。

技术实现要素：

5.有鉴于此，本发明提供一种数据处理方法和装置，能够优化embe dding向量的表示，提高点击率预估模型输出结果的准确性。
6.为实现上述目的，根据本发明的一个方面，提供了一种数据处理方法。
7.本发明的数据处理方法包括：对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵；其中，所述样本数据包括多个离散特征；所述第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量；对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；对所述第二特征矩阵、以及所述第三特征矩阵和/或所述第四特征矩阵进行融合处理，以得到融合处理后的结果；将所述融合处理后的结果输入点击率预估模型，以得到所述目标信息的点击率预估结果。
8.可选地，所述对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵包括：对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；对所述第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵，和/或，对所述第二特征矩阵中的元素之
间进行运算处理，根据运算处理结果得到第四特征矩阵。
9.可选地，所述对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵包括：基于自注意力机制对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间的关系进行建模，以得到第一关系矩阵；根据所述第一关系矩阵和所述第一特征矩阵，构建所述第二特征矩阵。
10.可选地，所述根据所述第一关系矩阵和所述第一特征矩阵，构建所述第二特征矩阵包括：将所述第一关系矩阵和所述第一特征矩阵进行矩阵乘法运算，并将所述矩阵乘法运算的结果与第一特征矩阵进行矩阵加法运算，以得到第二特征矩阵。
11.可选地，所述对所述第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵包括：基于自注意力机制对所述第二特征矩阵中的特征向量之间的关系进行建模，以得到第二关系矩阵；根据所述第二关系矩阵和所述第二特征矩阵，构建所述第三特征矩阵。
12.可选地，所述对所述第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵包括：将第二特征矩阵输入深度神经网络模型，以基于深度神经网络模型对所述第二特征矩阵中的元素之间进行运算处理，并将所述深度神经网络模型的输出结果作为第四特征矩阵。
13.可选地，所述对所述第二特征矩阵、以及所述第三特征矩阵和/或所述第四特征矩阵进行融合处理，以得到融合处理后的结果包括：将所述第二特征矩阵、第三特征矩阵和所述第四特征矩阵进行拼接，并将拼接得到的矩阵作为所述融合处理后的结果。
14.为实现上述目的，根据本发明的另一个方面，提供了一种数据处理装置。
15.本发明的数据处理装置包括：映射模块，用于对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵；其中，所述样本数据包括多个离散特征；所述第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量；挖掘模块，用于对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；融合模块，用于对所述第二特征矩阵、以及所述第三特征矩阵和/或所述第四特征矩阵进行融合处理，以得到融合处理后的结果；预估模块，用于将所述融合处理后的结果输入点击率预估模型，以得到所述目标信息的点击率预估结果。
16.为实现上述目的，根据本发明的再一个方面，提供了一种电子设备。
17.本发明的电子设备，包括：一个或多个处理器；以及，存储装置，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明的数据处理方法。
18.为实现上述目的，根据本发明的又一个方面，提供了一种计算机可读介质。
19.本发明的计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明的数据处理方法。
20.上述发明中的一个实施例具有如下优点或有益效果：通过对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵；对所述第一特征矩阵中由所述多个特征向
量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；对第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵进行融合处理，将融合处理后的结果输入点击率预估模型这些步骤，能够优化embedding向量的表示，提高点击率预估模型输出结果的准确性。
21.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
22.附图用于更好地理解本发明，不构成对本发明的不当限定。其中：
23.图1是根据本发明第一实施例的数据处理方法的主要流程示意图；
24.图2是根据本发明第二实施例的数据处理方法的主要流程示意图；
25.图3是根据本发明实施例的维度向量、特征向量、元素之间关系建模的原理示意图；
26.图4是根据本发明实施例的由第一特征矩阵构建第二特征矩阵的原理示意图；
27.图5是根据本发明第三实施例的数据处理装置的主要模块示意图；
28.图6是本发明实施例可以应用于其中的示例性系统架构图；
29.图7是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
30.以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
31.需要指出的是，在不影响本发明实施的情况下，本发明的实施例以及实施例中的特征可以相互组合。
32.图1是根据本发明第一实施例的数据处理方法的主要流程示意图。如图1所示，本发明实施例的数据处理方法包括：
33.步骤s101、对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵。
34.示例性地，所述目标信息可以为图像信息、文本信息、或者视频信息中的任一种或者多种格式的组合。比如，所述目标信息可以为文本形式或者图像形式的商品信息。
35.其中，所述与目标信息相对应的样本数据包括多个离散的特征。具体实施时，假设一个样本包含m个原始特征，对于其中的连续性特征，可以通过划分区间等方法将其转化为离散特征，例如对于年龄特征来说，可以以每10岁为一个年龄段将年龄特征离散化，进而可由m个原始特征得到m个离散特征。
36.在该步骤中，可通过对与目标信息相对应的样本数据进行映射处理，得到第一特征矩阵。其中，第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量。例如，假设一个样本中有m个离散特征，通过映射处理将每个离散特征都映射为一个d维的特征向量，进而可得到由m个特征向量构成的第一特征矩阵。
37.步骤s102、对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵。
38.在一个可选实施方式中，步骤s102具体包括：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；然后，对第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵；对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
39.例如，假设第一特征矩阵由3个特征向量组成，分别为：
40.(v
11
,v
12
,v
13
,v
14
)、(v
21
,v
22
,v
23
,v
24
)、(v
31
,v
32
,v
33
,v
34
)，则由这3个特征向量中的同一维度元素构成的向量分别为(v
11
,v
21
,v
31
)、(v
12
,v
22
,v
32
)、(v
13
,v
23
,v
33
)、(v
14
,v
24
,v
34
)，则可先对这4个向量之间进行运算处理，并根据运算处理结果得到第二特征矩阵；假设第二特征矩阵由3个特征向量组成，分别为(e
11
,e
12
,e
13
,e
14
)、(e
21
,e
22
,e
23
,e
24
)、(e
31
,e
32
,e
33
,e
34
)，则接下来可对第二特征矩阵中的这3个特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵；对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
41.在另一个可选实施方式中，步骤s102具体包括：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；然后，对第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵。
42.在再一个可选实施方式中，步骤s102具体包括：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；然后，对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
43.需要指出的是，步骤s102并不限于以上三种可选实施方式。在不影响本发明实施的情况下，步骤s102还可以采取其他可选实施方式。例如，还可以先对第一特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵，然后，对第三特征矩阵中由多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；对第三特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
44.步骤s103、对第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵进行融合处理，以得到融合处理后的结果。
45.在一个可选实施方式中，步骤s103包括：对第二特征矩阵、第三特征矩阵和第四特征矩阵进行融合处理，以得到融合处理后的结果。示例性地，所述融合处理可以为拼接处理。例如，可将第二特征向量、第三特征向量、第四特征向量分别展开为1行d*m列的向量理。例如，可将第二特征向量、第三特征向量、第四特征向量分别展开为1行d*m列的向量再将这三个向量进行拼接，并将拼接得到的向量再将这三个向量进行拼接，并将拼接得到的向量作为融合处理后的结果。
46.在另一个可选实施方式中，步骤s103包括：对第二特征矩阵和第三特征矩阵进行融合处理，以得到融合处理后的结果。
47.在再一个可选实施方式中，步骤s103包括：对第二特征矩阵和第四特征矩阵进行融合处理，以得到融合处理后的结果。
48.步骤s104、将融合处理后的结果输入点击率预估模型，以得到目标信息的点击率预估结果。
49.示例性地，可将融合处理后的结果输入点击率预估函数(比如逻辑回归函数)，并将输出的函数值作为目标信息的点击率预估结果。
50.在本发明实施例中，在通过映射处理得到第一特征矩阵后，通过对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；对第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵进行融合处理，将融合处理后的结果输入点击率预估模型这些步骤，能够优化embedding向量的表示，提高点击率预估模型输出结果的准确性。
51.图2是根据本发明第二实施例的数据处理方法的主要流程示意图。如图2所示，本发明实施例的数据处理方法包括：
52.步骤s201、获取与目标信息相对应的样本数据。
53.示例性地，所述目标信息可以为图像信息、文本信息、或者视频信息中的任一种或者多种格式的组合。比如，所述目标信息可以为文本形式或者图像形式的商品信息。
54.其中，所述与目标信息相对应的样本数据包括多个离散的特征。具体实施时，假设一个样本包含m个原始特征，对于其中的连续性特征，可以通过划分区间等方法将其转化为离散特征，例如对于年龄特征来说，可以以每10岁为一个年龄段将年龄特征离散化，进而可由m个原始特征得到m个离散特征。比如，当目标信息为商品信息时，样本数据可包括离散化处理后的商品特征(比如商品价格、商品颜色等)和用户特征(比如用户年龄、用户性别等)。
55.步骤s202、对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵。
56.在该步骤中，可通过对与目标信息相对应的样本数据进行映射处理，得到第一特征矩阵。其中，第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量。例如，假设一个样本中有m个离散特征，通过映射处理将每个离散特征都映射为一个d维的特征向量，进而可得到由m个特征向量构成的第一特征矩阵。进一步，第一特征矩阵可表示为：
[0057][0058]
其中，v表示第一特征矩阵，表示第i个特征向量(即第i个离散特征的向量表示)，v
ij
表示第i个特征向量中的第j个元素。
[0059]
步骤s203、对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵。
[0060]
示例性地，步骤s203具体包括：步骤a1、基于自注意力机制对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间的关系进行建模，以得到第一关系矩阵；步骤a2、根据所述第一关系矩阵和所述第一特征矩阵，构建所述第二特征矩阵。
[0061]
注意力机制模仿了生物观察行为的内部过程，即一种将内部经验和外部感觉对齐从而增加部分区域的观察精细度的机制。注意力机制可以快速提取稀疏数据的重要特征，因此被广泛用于自然语言处理任务。自注意力机制是一种特殊的注意力机制，其擅长捕捉数据的内部相关性。
[0062]
进一步，在步骤a1中，可基于如下公式计算第一关系矩阵：
[0063]
s＝softmax(vv
t
)
[0064]
其中，s表示第一关系矩阵，s
j,i
为第一关系矩阵中的元素，其表示“由第一特征矩阵中各个特征向量中的第i个维度元素组成的向量”对“由第一特征矩阵中各个特征向量中的第j个维度元素组成的向量”的影响大小；v表示第一特征矩阵，其由d行m列元素组成，每一列表示一个特征向量；v
t
表示第一特征矩阵的转置。
[0065]
进一步，在步骤a2中，可将所述第一关系矩阵和所述第一特征矩阵进行矩阵乘法运算，并将所述矩阵乘法运算的结果与第一特征矩阵进行矩阵加法运算，以得到第二特征矩阵。具体计算公式如下：
[0066]
e＝sv v；
[0067]
其中，e表示第二特征矩阵，s表示第一关系矩阵，v表示第一特征矩阵。
[0068]
在以上计算公式中，不仅考虑了由第一特征矩阵中各个特征向量中的同一维度元素组成的向量之间的关系对第二特征矩阵的影响，区分出不同维度的重要性，而且保留了上一层的信息(具体为第一特征矩阵的信息)，进而，通过以上计算公式计算第二特征矩阵，能够获取到更丰富的特征，优化特征的向量表达，有助于提高后续的点击率预估结果。
[0069]
步骤s204、对所述第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵。
[0070]
示例性地，步骤s204包括：步骤b1、基于自注意力机制对所述第二特征矩阵中的特征向量之间的关系进行建模，以得到第二关系矩阵；步骤b2、根据所述第二关系矩阵和所述第二特征矩阵，构建所述第三特征矩阵。
[0071]
进一步，在步骤b1中，可基于如下公式计算第二关系矩阵：
[0072]
h＝softmax(e
t
e)
[0073]
其中，h表示第二关系矩阵，h
j,i
为第二关系矩阵中的元素，其表示“第一特征矩阵中的第i个特征向量”对“第一特征矩阵中第j个特征向量”的影响大小；e表示第二特征矩阵，其由d行m列元素组成，每一列表示一个特征向量；e
t
表示第二特征矩阵的转置。
[0074]
进一步，在步骤b2中，可将所述第二关系矩阵和所述第二特征矩阵进行矩阵乘法运算，并将所述矩阵乘法运算的结果与第二特征矩阵进行矩阵加法运算，以得到第三特征矩阵。具体计算公式如下：
[0075]
f＝eh e；
[0076]
其中，f表示第三特征矩阵，h表示第二关系矩阵，e表示第二特征矩阵。
[0077]
在以上计算公式中，不仅考虑了由第一特征矩阵中各个特征向量之间的关系对第三特征矩阵的影响，区分出不同特征向量的重要性，而且保留了上一层的信息(具体为第二特征矩阵的信息)，进而，通过以上计算公式计算第三特征矩阵，能够获取到更丰富的特征，优化特征的向量表达，有助于提高后续的点击率预估结果。
[0078]
步骤s205、对所述第二特征矩阵中的元素之间进行运算处理，根据运算处理结果
得到第四特征矩阵。
[0079]
示例性地，步骤s205包括：将第二特征矩阵输入深度神经网络模型，以基于深度神经网络模型(dnn模型)对所述第二特征矩阵中的元素之间进行运算处理，并将所述深度神经网络模型的输出结果作为第四特征矩阵。具体实施时，为了挖掘到高阶的特征信息，可以叠加多个dnn模型进行特征挖掘。
[0080]
dnn模型采用全连接的建模方式，依赖于非线性的激活函数和深度结构，能够学习到数据高阶非线性的关系。在dnn模型中，具体的计算公式如下：
[0081]
h
i 1
＝f(w
i
h
i
b
i
)
[0082]
其中，h
i
表示dnn模型中第i层的输入(例如，第一层的输入为第二特征矩阵)；h
i 1
表示dnn模型中第i层的输出(例如，最后一层的输出为第四特征矩阵)；w
i
表示权重矩阵；b
i
表示偏移量；f(x)表示激活函数，例如，可采用线性整流函数(rectified linear unit,relu)作为激活函数。
[0083]
步骤s206、对第二特征矩阵、以及第三特征矩阵和第四特征矩阵进行融合处理，以得到融合处理后的结果。
[0084]
示例性地，所述融合处理可以为拼接处理。例如，可将第二特征向量、第三特征向量、第四特征向量分别展开为1行d*m列的向量量、第四特征向量分别展开为1行d*m列的向量再将这三个向量进行拼接，并将拼接得到的向量接，并将拼接得到的向量作为融合处理后的结果。
[0085]
步骤s207、将所述融合处理后的结果输入点击率预估模型，以得到所述目标信息的点击率预估结果。
[0086]
示例性地，可将融合处理后的结果输入点击率预估函数(比如逻辑回归函数)，并将输出的函数值作为目标信息的点击率预估结果。
[0087]
在本发明实施例中，在通过映射处理得到第一特征矩阵后，通过对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、特征向量之间、以及元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和第四特征矩阵；对第二特征矩阵、以及第三特征矩阵、和第四特征矩阵进行融合处理，将融合处理后的结果输入点击率预估模型这些步骤，能够挖掘出更丰富的隐藏特征，优化特征的向量表示，减少特征挖掘中的噪声，提高点击率预估模型输出结果的准确性。
[0088]
图3是根据本发明实施例的维度向量、特征向量、元素之间关系建模的原理示意图。如图3所示，假设第一特征矩阵由三个1*4维的特征向量组成，分别为特征向量1(比如其为离散特征“年龄”的向量表示)、特征向量2(比如其为离散特征“性别”的向量表示)、特征向量3(比如其为离散特征“类目”的向量表示)，则在本发明实施例中，可对第一特征矩阵中的维度向量(即由第一特征矩阵中这三个特征向量中的同一维度元素构成的向量)之间的关系、特征向量之间的关系、以及元素之间的关系分别进行建模，以挖掘出更丰富的隐藏特征，优化embedding向量的表示。
[0089]
图4是根据本发明实施例的由第一特征矩阵构建第二特征矩阵的原理示意图。如图4所示，在输入第一特征矩阵v之后，可对第一特征矩阵v进行转置处理，然后对第一特征矩阵v和第一特征矩阵的转置v
t
进行矩阵乘法运算，并将矩阵乘法运算的结果输入softmax
函数(归一化指数函数)，以得到第一关系矩阵s；再将第一关系矩阵s与第一特征矩阵进行矩阵乘法运算，并将矩阵乘法运算的结果与第一特征矩阵v进行矩阵加法运算，以得到第二特征矩阵e。
[0090]
图5是根据本发明第三实施例的数据处理装置的主要模块示意图。如图5所示，本发明实施例的数据处理装置500包括：映射模块501、挖掘模块502、融合模块503、预估模块504。
[0091]
映射模块501，用于对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵。
[0092]
示例性地，所述目标信息可以为图像信息、文本信息、或者视频信息中的任一种或者多种格式的组合。比如，所述目标信息可以为文本形式或者图像形式的商品信息。
[0093]
其中，所述与目标信息相对应的样本数据包括多个离散的特征。具体实施时，假设一个样本包含m个原始特征，对于其中的连续性特征，可以通过划分区间等方法将其转化为离散特征，例如对于年龄特征来说，可以以每10岁为一个年龄段将年龄特征离散化，进而可由m个原始特征得到m个离散特征。
[0094]
其中，第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量。例如，假设一个样本中有m个离散特征，通过映射模块501进行映射处理，可将每个离散特征都映射为一个d维的特征向量，进而可得到由m个特征向量构成的第一特征矩阵。
[0095]
挖掘模块502，用于对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵。
[0096]
在一个可选实施方式中，挖掘模块502具体用于：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；然后，对第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵；对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
[0097]
例如，假设第一特征矩阵由3个特征向量组成，分别为：
[0098]
(v
11
,v
12
,v
13
,v
14
)、(v
21
,v
22
,v
23
,v
24
)、(v
31
,v
32
,v
33
,v
34
)，则由这3个特征向量中的同一维度元素构成的向量分别为(v
11
,v
21
,v
31
)、(v
12
,v
22
,v
32
)、(v
13
,v
23
,v
33
)、(v
14
,v
24
,v
34
)，则可先对这4个向量之间进行运算处理，并根据运算处理结果得到第二特征矩阵；假设第二特征矩阵由3个特征向量组成，分别为(e
11
,e
12
,e
13
,e
14
)、(e
21
,e
22
,e
23
,e
24
)、(e
31
,e
32
,e
33
,e
34
)，则接下来可对第二特征矩阵中的这3个特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵；对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
[0099]
在另一个可选实施方式中，挖掘模块502具体用于：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；然后，对第二特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵。
[0100]
在再一个可选实施方式中，挖掘模块502具体用于：先对第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二
特征矩阵；然后，对第二特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
[0101]
需要指出的是，挖掘模块502并不限于采用以上三种可选实施方式。在不影响本发明实施的情况下，挖掘模块502还可以采取其他可选实施方式。例如，挖掘模块502还可以先对第一特征矩阵中的特征向量之间进行运算处理，根据运算处理结果得到第三特征矩阵，然后，对第三特征矩阵中由多个特征向量中的同一维度元素构成的向量之间进行运算处理，根据运算处理结果得到第二特征矩阵；对第三特征矩阵中的元素之间进行运算处理，根据运算处理结果得到第四特征矩阵。
[0102]
融合模块503，用于对第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵进行融合处理，以得到融合处理后的结果。
[0103]
在一个可选实施方式中，融合模块503具体用于：对第二特征矩阵、第三特征矩阵和第四特征矩阵进行融合处理，以得到融合处理后的结果。示例性地，所述融合处理可以为拼接处理。例如，融合模块503可将第二特征向量、第三特征向量、第四特征向量分别展开为1行d*m列的向量再将这三个向量进行拼接，并将拼接得到的向量作为融合处理后的结果。
[0104]
在另一个可选实施方式中，融合模块503具体用于：对第二特征矩阵和第三特征矩阵进行融合处理，以得到融合处理后的结果。
[0105]
在再一个可选实施方式中，融合模块503具体用于：对第二特征矩阵和第四特征矩阵进行融合处理，以得到融合处理后的结果。
[0106]
预估模块504，用于将融合处理后的结果输入点击率预估模型，以得到目标信息的点击率预估结果。
[0107]
示例性地，预估模块504可将融合处理后的结果输入点击率预估函数(比如逻辑回归函数)，并将输出的函数值作为目标信息的点击率预估结果。
[0108]
在本发明实施例中，在通过映射模块映射得到第一特征矩阵后，通过挖掘模块对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，并根据运算处理结果得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；通过融合模块对第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵进行融合处理，通过预估模块将融合处理后的结果输入点击率预估模型，能够优化embedding向量的表示，提高点击率预估模型输出结果的准确性。
[0109]
图6示出了可以应用本发明实施例的数据处理方法或数据处理装置的示例性系统架构600。
[0110]
如图6所示，系统架构600可以包括终端设备601、602、603，网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
[0111]
用户可以使用终端设备601、602、603通过网络604与服务器605交互，以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用，例如车辆调度管理类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0112]
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0113]
服务器605可以是提供各种服务的服务器，例如对用户利用终端设备601、602、603所浏览的购物类应用或网站提供支持的后台管理服务器。后台管理服务器可以对接收到的点击率预估请求等数据进行分析等处理，并将处理结果(例如点击率预估结果)用于后续商品推荐等处理流程中。
[0114]
需要说明的是，本发明实施例所提供的数据处理方法一般由服务器605执行，相应地，数据处理装置一般设置于服务器605中。
[0115]
应该理解，图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
[0116]
下面参考图7，其示出了适于用来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的计算机系统仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
[0117]
如图7所示，计算机系统700包括中央处理单元(cpu)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中，还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0118]
以下部件连接至i/o接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0119]
特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时，执行本发明的系统中限定的上述功能。
[0120]
需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，
其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合适的组合。
[0121]
附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0122]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括映射模块、挖掘模块、融合模块和预估模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，映射模块还可以被描述为“对与目标信息相对应的样本数据进行映射处理的模块”。
[0123]
作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：对与目标信息相对应的样本数据进行映射处理，以得到第一特征矩阵；其中，所述样本数据包括多个离散特征；所述第一特征矩阵包括多个具有相同维度、且与所述离散特征相对应的特征向量；对所述第一特征矩阵中由所述多个特征向量中的同一维度元素构成的向量之间、以及特征向量之间和/或元素之间，按照预设顺序分别进行运算处理，以得到与之对应的第二特征矩阵、以及第三特征矩阵和/或第四特征矩阵；对所述第二特征矩阵、以及所述第三特征矩阵和/或所述第四特征矩阵进行融合处理，以得到融合处理后的结果；将所述融合处理后的结果输入点击率预估模型，以得到所述目标信息的点击率预估结果。
[0124]
根据本发明实施例的技术方案，能够优化embedding向量的表示，提高点击率预估模型输出结果的准确性。
[0125]
上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：视网膜图像分类模型训练方法、系统、存储介质及设备与流程

数据处理方法和装置与流程

相关文献

最热文献