确定目标用户的方法和装置与流程

2021-11-20 03:23:00 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，尤其涉及一种确定目标用户的方法和装置。

背景技术：

2.随着互联网技术以及依托互联网的新型业态的快速发展，服务方需要更为精准地触达目标用户，例如具有较高消费倾向的高潜力用户。目前，服务方一般基于固定的物品品类维度或者品牌维度构建目标用户判断模型，此类模型一般是二分类机器学习模型，主要通过用户在品类或者品牌上的行为信息以及用户属性信息构建统计特征，并以用户是否进行消费作为目标变量。
3.在实现本发明的过程中，发明人发现现有技术至少存在以下问题：首先，由于固定的物品品类或品牌割裂了不同品类物品或不同品牌物品之间的关联关系，因此现有技术无法精准刻画用户针对多种物品的行为轨迹特点，进而无法通过用户行为来描述其针对特定物品池的消费预期；其次，现有技术中的模型与固定的物品品类或品牌关联，其使用范围因此较为固定，这与动态变化的、物品之间基于用户行为的关联关系不符；另外，现有技术中需要耗费大量的人力物力对原始数据进行etl(extract、transform、load，即抽取、转换、加载)，不利于实现业务的快速迭代。

技术实现要素：

4.有鉴于此，本发明实施例提供一种确定目标用户的方法和装置，能够基于预先确定的物品群组进行目标用户的精准判别，并且使用机器学习方法自动构建特征，由此避免执行etl处理对实际业务的不利影响。
5.为实现上述目的，根据本发明的一个方面，提供了一种确定目标用户的方法。
6.本发明实施例的确定目标用户的方法包括：判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组；其中，所述物品群组是依据多种物品在同一用户行为序列中的出现次数和/或出现顺序确定的；对于每一目标群组：获取该目标群组的多个初选用户，将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中，获得该初选用户在该目标群组的优化特征数据；将所述优化特征数据输入预先训练完成、并且对应于该目标群组的用户分类模型中，获得该初选用户在该目标群组的分类结果；利用每一初选用户在每一目标群组的分类结果判断该初选用户是否为对应于所述物品集合的目标用户。
7.可选地，所述物品群组通过以下步骤确定：依据多种物品在同一用户行为序列中的出现次数和/或出现顺序生成用于表征所述多种物品之间关联关系的物品图谱；对所述物品图谱执行图嵌入处理，得到所述多种物品中每种物品的嵌入向量；利用所述嵌入向量对所述多种物品进行聚类，获得多个物品群组。
8.可选地，所述方法进一步包括：在生成所述物品图谱之后：将所述物品图谱中孤立物品的属性数据和标题数据输入预先训练完成的物品相似模型中，获得所述孤立物品的至
少一种相似物品；在所述物品图谱中增加所述孤立物品与所述相似物品的关联关系。
9.可选地，所述判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组，包括：针对所述物品集合中的任一种物品，判断预先确定的物品群组中是否包含该种物品的标识：若是，将包含该种物品的标识的物品群组确定为该种物品所属的目标群组；否则，将该种物品的属性数据和标题数据输入所述物品相似模型中，获得该种物品的相似物品；利用该相似物品所属的物品群组确定该种物品所属的目标群组；以及，在确定该种物品所属的目标群组之后，将该种物品加入该目标群组。
10.可选地，所述特征生成模型为深度神经网络模型，包括依次连接的输入层、第一隐藏层、第二隐藏层、输出层；其中，第一隐藏层包括第一感知层、第一标准化层和第一激活层；第二隐藏层包括第二感知层、第二标准化层和第二激活层；第二感知层的输入数据为第一激活层的输出数据与原始特征数据拼接之后的数据；输出层的输入数据为第二激活层的输出数据与原始特征数据拼接之后的数据。
11.可选地，任一初选用户针对相应的目标群组中任一种物品的原始特征数据包括：该初选用户的属性数据、该种物品的属性数据以及该初选用户针对该种物品的行为记录数据；以及，所述获得该初选用户在该目标群组的优化特征数据，包括：将任一初选用户针对相应的目标群组中每种物品的原始特征数据输入所述特征生成模型中，获取第二激活层输出的、该初选用户的多条多维度数据；将所述多维度数据的每一初始维度按照数值区间划分为至少一个目标维度，将所述多维度数据转换为该初选用户在目标维度的一条优化特征数据；其中，该优化特征数据在任一目标维度的取值为：所述多维度数据在该目标维度对应的初始维度的取值处在该目标维度对应的数值区间的次数。
12.可选地，所述利用每一初选用户在每一目标群组的分类结果判断该初选用户是否为对应于所述物品集合的目标用户，包括：利用每一初选用户在每一目标群组的分类结果以及预先为每一目标群组设置的权重值获取该初选用户的加权判别结果；在加权判别结果大于预设阈值时，将该初选用户确定为对应于所述物品集合的目标用户。
13.可选地，所述用户分类模型为xgboost模型；以及，对应于同一物品群组的特征生成模型和用户分类模型通过以下步骤进行训练：将该特征生成模型与该用户分类模型连接为综合模型；其中，该用户分类模型的输入数据为：由该特征生成模型中第二激活层的输出数据转换形成的优化特征数据；构建应用在所述综合模型的训练样本集合；其中，训练样本集合中的每一训练样本都包括作为特征部分的原始特征数据和作为标签部分的用户分类结果；利用所述训练样本集合对该特征生成模型和该用户分类模型进行训练。
14.为实现上述目的，根据本发明的另一方面，提供了一种确定目标用户的装置。
15.本发明实施例的确定目标用户的装置可包括：群组划分单元，用于判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组；其中，所述物品群组是依据多种物品在同一用户行为序列中的出现次数和/或出现顺序确定的；特征生成及分类单元，用于：对于每一目标群组：获取该目标群组的多个初选用户，将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中，获得该初选用户在该目标群组的优化特征数据；将所述优化特征数据输入预先训练完成、并且对应于该目标群组的用户分类模型中，获得该初选用户在该目标群组的分类结果；目标用户判断单元，用于利用每一初选用户在每一目标群组的分类结果判断该初选用户是
否为对应于所述物品集合的目标用户。
16.可选地，所述装置可进一步包括：群组预先确定单元，用于依据多种物品在同一用户行为序列中的出现次数和/或出现顺序生成用于表征所述多种物品之间关联关系的物品图谱；对所述物品图谱执行图嵌入处理，得到所述多种物品中每种物品的嵌入向量；利用所述嵌入向量对所述多种物品进行聚类，获得多个物品群组。
17.为实现上述目的，根据本发明的又一方面，提供了一种电子设备。
18.本发明的一种电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的确定目标用户的方法。
19.为实现上述目的，根据本发明的再一方面，提供了一种计算机可读存储介质。
20.本发明的一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明所提供的确定目标用户的方法。
21.根据本发明的技术方案，上述发明中的实施例具有如下优点或有益效果：预先在离线状态依据物品在用户行为序列的出现次数和/或出现顺序构建物品图谱，利用图嵌入方法(graph embedding)从物品图谱中确定物品的嵌入向量，并使用嵌入向量对物品聚类形成多个物品群组；在需要确定针对物品集合的目标用户时，可以通过查询或判断相似物品的方式确定物品集合中每一物品所属的物品群组，进而根据物品群组执行后续的目标用户判别。通过以上设置，能够精准体现不同品类物品或不同品牌物品之间的关联关系，克服基于物品品类或品牌进行目标用户判别的固有缺陷，有利于实现目标用户的精确判别。同时，物品群组可以根据用户行为数据动态更新，从而与动态变化的、物品之间基于用户行为的关联关系保持一致。另外，本发明使用深度学习方法由原始特征数据直接自动生成优化特征数据，不需执行etl处理，从而提高工作效率并节省大量人力物力。
22.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
23.附图用于更好地理解本发明，不构成对本发明的不当限定。其中：
24.图1是本发明实施例中确定目标用户的方法的主要步骤示意图；
25.图2是本发明实施例的物品图谱示意图；
26.图3是本发明实施例的特征生成模型组成示意图；
27.图4是本发明实施例中确定目标用户的方法的具体流程示意图；
28.图5是本发明实施例中确定目标用户的装置的组成部分示意图；
29.图6是根据本发明实施例可以应用于其中的示例性系统架构图；
30.图7是用来实现本发明实施例中确定目标用户的方法的电子设备结构示意图。
具体实施方式
31.以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同
样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
32.需要指出的是，在不冲突的情况下，本发明的实施例以及实施例中的技术特征可以相互结合。
33.图1是根据本发明实施例中确定目标用户的方法的主要步骤示意图。
34.如图1所示，本发明实施例的确定目标用户的方法可具体按照如下步骤执行：
35.步骤s101：判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组。
36.在本步骤中，上述物品集合指的是由业务人员指定的多种物品组成的集合，本发明需要判别的目标用户即针对物品集合而言。示例性地，目标用户可以是对于物品集合中的多种物品具有较强消费倾向的用户。可以理解，目标用户的具体含义可以根据实际场景改变，本发明并不对此进行限制。一般地，物品集合中的物品可以涉及多个品类或品牌。
37.在本发明实施例中，物品群组可以在离线状态下预先确定，确定物品群组的步骤可以如下：首先，选取一定数量的多种物品(例如服务方平台的全量物品)以及在最近一个时间段内(如3个月内)针对上述多种物品执行过预设行为(例如搜索、浏览、点击、关注、加购物车、和/或提交订单等)的多个用户。之后，依据上述多种物品在同一用户行为序列中的出现次数和/或出现顺序生成物品图谱(物品图谱是用于表征多种物品之间关联关系的知识图谱)。可以理解，一个用户行为序列由一次完整的用户行为(例如提交一个订单)或多次连续的同类型用户行为(例如多次连续搜索、浏览、点击、关注或加购物车)依次涉及的多种物品组成。
38.例如，用户行为序列1为用户a依次搜索的物品d、a、b，用户行为序列2为用户b依次浏览的物品b、e，用户行为序列3为用户b依次点击的物品d、e、f，用户行为序列4为用户c依次关注的物品e、c、b，用户行为序列5为用户c在提交一个订单时依次涉及的物品b、a。利用物品a、b、c、d、e、f在用户行为序列1-5中的出现次数和/或出现顺序即可建立物品图谱。上述出现次数指的是多种物品在同一用户行为序列中的共同出现次数，在本发明实施例中，出现次数可以是同一用户行为序列中相邻的两种物品共同出现的次数，例如，在用户行为序列1中，d、a的出现次数为1，a、b的出现次数为1，d、b的出现次数为零。
39.示例性地，在建立物品图谱时，首先确定代表各种物品的节点(节点可以用圆形表示)，之后根据每一用户行为序列中物品的出现顺序在两个节点之间增加带有箭头的有向边，箭头方向与物品出现顺序一致，两个节点的出现次数可以作为相应有向边的权重值。图2是本发明实施例中根据用户行为序列1-5建立的物品图谱示意图，可以看到，物品图谱包括代表物品的多个节点以及节点之间的有向边，在图2中，每一有向边的权重值都是1，表示5个用户行为序列中两种相邻物品的出现次数均为1。可以理解，以上为同时使用出现次数和出现顺序建立物品图谱的方式，如果只使用出现次数建立物品图谱，则物品图谱中的边均为无向边；如果只使用出现顺序建立物品图谱，则物品图谱中的边均为不具有权重值的有向边。
40.实际应用中，依据上述方式建立的物品图谱中往往具有孤立物品(即孤立节点对应的物品，孤立节点可以根据实际需要定义，例如定义为对应的边小于两条的节点)，导致物品图谱的连通性较差。作为一个优选方案，可以通过以下方式为孤立物品增加至少一条边，从而增强物品图谱的连通性。首先可以将物品图谱中孤立物品的属性数据(例如物品价
格、品类、重量等)和标题数据(例如对物品标题进行分词处理后形成的各词语)输入预先训练完成的物品相似模型中，获得孤立物品的至少一种相似物品；之后，在物品图谱中增加孤立物品与其相似物品之间的边(该边一般为无向边)，表示孤立物品之间的关联关系，孤立物品与其相似物品的相似度可以作为边的权重值。
41.较佳地，可以使用以下方法训练上述物品相似模型。首先，构建包括多个训练样本的训练样本集合，其中，每一训练样本的特征部分为物品的属性数据和标题数据，标签部分为多种相似物品的标识(如库存量单位sku)以及每种相似物品的相似度。之后，利用上述训练样本集合以及适用的机器学习算法对物品相似模型进行训练。在使用训练完成的物品相似模型获取孤立物品的相似物品时，可以将物品相似模型输出的多种相似物品按照相似度降序排列，并选取在前的预设数量的相似物品来优化物品图谱。
42.建立物品图谱之后，可以对物品图谱执行图嵌入处理(即graph embedding)，从而得到物品图谱中多种物品的嵌入向量，之后可以利用上述嵌入向量以及现有的k-means等聚类算法对上述多种物品进行聚类，从而最终确定多个物品群组。利用图嵌入处理获得嵌入向量的方法为已知方法，其具体执行细节此处不再赘述。
43.可以理解，通过上述方法得到的物品嵌入向量能够体现基于用户行为的物品关联关系，根据嵌入向量聚类形成的物品群组能够将在用户角度关联性较高的多种物品聚集在一起，将用户角度关联性较低的物品分布在不同物品群组，从而实现了优于品类或品牌的物品分类方式。基于上述物品群组的物品分类方式不会割裂不同品类物品或不同品牌物品之间的关联关系，有助于精准刻画用户针对多种物品的行为轨迹特点进而有利于目标用户的准确判别，还能够依据物品群组灵活组合物品从而开展精准营销。例如，某用户多次购买关联性较高且具有不同品类和不同品牌的多种物品，在基于品类或品牌进行目标用户判别时，该用户往往无法被判别为目标用户；在基于物品群组进行目标用户判别时，该用户购买的多种不同品类/品牌物品大概率属于同一物品群组，因此该用户大概率能够被判别为目标用户。可见，基于物品群组的目标用户判别方法的准确率高于传统的基于品类/品牌的方法。需要说明的是，物品群组也可以根据物品之间的相似度或者物品活跃度进行划分，本发明并不对此进行限制。
44.以上为离线状态确定物品群组的过程。在步骤s101所处的具体应用过程中，接收到物品集合之后，可以首先判断物品集合中每种物品所属的物品群组(以下将这些物品所属的物品群组称为目标群组)。具体地，对于物品集合中的任一种物品，判断物品群组中是否包含该种物品的标识(例如sku)：若是，将包含该种物品的标识的物品群组确定为该种物品所属的目标群组；否则，将该种物品的属性数据和标题数据输入前述物品相似模型中，获得该种物品的多种相似物品，并利用相似物品所属的物品群组确定该种物品所属的目标群组。示例性地，在得到物品相似模型输出的多种相似物品之后，首先将多种相似物品按照相似度降序排列，并选取在前的预设数量的相似物品，之后判断选取的每种相似物品所属的物品群组，最后将包含最多种相似物品的物品群组确定为该种物品所属的目标群组。实际场景中，在确定该种物品所属的目标群组之后，可以将该种物品加入该目标群组进行扩充。
45.步骤s102：对于每一目标群组：获取该目标群组的多个初选用户，将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中，获得该初选用户在该目标群组的优化特征数据；将优化特征数据输入预
先训练完成、并且对应于该目标群组的用户分类模型中，获得该初选用户在该目标群组的分类结果。
46.通过步骤s101获取多个目标群组之后，在本步骤中可以首先获取每一目标群组的初选用户。初选用户的选取规则可以根据实际需要确定，例如可以将最近时间段内(例如15天内)对任一目标群组内任一物品执行过预设行为(例如浏览、点击、关注等)的用户。需要说明的是，同一用户可以作为多个目标群组的初选用户。此后，对于任一目标群组的任一初选用户，可以构建该初选用户的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中得到优选特征数据，进而将优化特征数据输入预先训练完成、并且对应于该目标群组的用户分类模型对该初选用户进行分类，分类结果可以用于判断该初选用户是否为对应于物品集合的目标用户。
47.在本发明实施例中，上述用户分类模型可以是各种有监督分类模型，例如xgboost模型(该模型是一种集成多个弱分类器形成的提升树模型)。上述特征生成模型可以是dnn(deep neural networks，深度神经网络模型)，其结构可以如图3所示，包括依次连接的输入层、第一隐藏层、第二隐藏层、输出层。其中，第一隐藏层包括第一感知层、第一标准化层和第一激活层；第二隐藏层包括第二感知层、第二标准化层和第二激活层。第一感知层和第二感知层为隐藏层的主体部分，具有多个神经元；第一标准化层和第二标准化层都可以是batchno rmalization(批量数据标准化层)；第一激活层和第二激活层的激活函数可以采用leaky relu(leaky rectified linear unit，带泄露的修正线性单元)，输出层可以采用softmax函数。具体场景中，特征生成模型也可以采用其它适用的机器学习模型。
48.在离线状态下，对应于同一物品群组的特征生成模型和用户分类模型可以通过以下步骤进行训练。首先，将该特征生成模型与该用户分类模型连接为综合模型。一般地，可以将该特征生成模型的第二激活层与该用户分类模型的输入层连接，此时该用户分类模型的输入数据为由第二激活层的输出数据转换形成的优化特征数据。之后，构建应用在上述综合模型的训练样本集合；其中，训练样本集合中的每一训练样本可以包括作为特征部分的原始特征数据和作为标签部分的用户分类结果。上述原始特征数据可以是该物品群组的初选用户的相关数据，任一初选用户针对相应的目标群组中任一种物品的原始特征数据可以包括：该初选用户的属性数据(例如年龄、性别和/或地址等)、该种物品的属性数据以及该初选用户针对该种物品的行为记录数据(例如浏览记录、搜索记录、点击记录、关注记录、加购物车记录和/或购买记录等，这些记录可以是相关行为的执行次数、执行时长等)。实际应用中，上述行为记录数据可以是从用户行为日志中获取的交易级数据。此外，任一初选用户的原始特征数据为多条数据，其包括该初选用户针对相应的目标群组中每种物品的原始特征数据，该初选用户针对任一种物品的原始特征数据包括对应于每一预设时间间隔的原始特征数据，对应于任一预设时间间隔的原始特征数据包括该初选用户针对该种物品的行为记录数据、该初选用户的属性数据以及该种物品的属性数据。
49.最后，利用训练样本集合对该特征生成模型和该用户分类模型进行训练。在数据处理过程中，任一初选用户的原始特征数据输入到该特征生成模型的输入层之后，经过输入层、第一感知层、第一标准化层，经第一激活层输出。此后将第一激活层的输出数据与原始特征数据拼接之后作为第二感知层的输入数据，该数据经过第二感知层、第二标准化层，经第二激活层输出。之后将第二激活层的输出数据与原始特征数据拼接作为输出层的输入
数据。
50.在本发明实施例中，可以通过以下步骤对第二激活层输出的数据进行处理，从而生成该初选用户在该物品群组的优化特征数据。具体地，首先获取第二激活层输出的该初选用户的多条多维度数据(每一维度可以称为初始维度)，之后将每一初始维度按照数值区间划分为至少一个目标维度，并将上述多维度数据转换为该初选用户在目标维度的一条优化特征数据；其中，该优化特征数据在任一目标维度的取值为：上述多维度数据在该目标维度对应的初始维度的取值处在该目标维度对应的数值区间的次数。例如，如果初始维度有feature0、feature1两个，该初始用户有以下6条多维度数据：
51.序号feature0feature110.00910.223120.32560.336530.52980.498740.77890.598650.75690.889960.96850.8522
52.可以看到，由于经过了标准化层，多维度数据在每一初始维度的取值均为0到1之间的数值。此时首先按照预设的数值区间将feature0、feature1分别划分为多个目标维度，例如按照[0,0.3]、(0.3,0.6]、(0.6,1]将feature0依次划分为三个目标维度feature0-bin0、feature0-bin1、feature0-bin2，按照[0,0.4]、(0.4,0.7]、(0.7,1]将feature1依次划分为三个目标维度feature1-bin0、feature1-bin1、feature1-bin2。之后将6条多维度数据转换为一条优化特征数据，即统计多维度数据在feature0的取值处在[0,0.3]、(0.3,0.6]、(0.6,1]的次数(本例中次数分别为1、2、3)，并将三个次数分别作为优化特征数据在目标维度feature0-bin0、feature0-bin1、feature0-bin2的取值，并统计多维度数据在feature1的取值处在[0,0.4]、(0.4,0.7]、(0.7,1]的次数(本例中次数分别为2、2、2)，并将三个次数分别作为优化特征数据在目标维度feature1-bin0、feature1-bin1、feature1-bin2的取值，这样即可得到该初选用户的以下优化特征向量：
[0053][0054]
通过以上设置，能够将对应于任一用户的多条交易级数据转换为该用户的一条用户级数据，同时还能够更多地保留原始数据的信息，而且不需要对原始数据执行etl处理，从而提高工作效率并节省大量人力物力。实际应用中，也可以针对多维度数据中同一初始维度的取值计算平均值、最大值、最小值等来生成优化特征数据。
[0055]
以上为特征生成模型和用户分类模型的离线训练过程。在步骤s102涉及的具体应用过程中，对于前述物品集合中每种物品所属的目标群组，可以首先获取该目标群组的多个初选用户，并将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成并且对应于该目标群组的特征生成模型中，从而获得该初选用户在该目标群组的优化
特征数据。之后将优化特征数据输入预先训练完成并且对应于该目标群组的用户分类模型中，从而获得该初选用户在该目标群组的分类结果。一般地，分类结果与初选用户在未来预设时间段内(例如5天内)是否具有消费倾向相关，可以采用两种不同的数值表示，当初选用户具有消费倾向时，分类结果为1；当初选用户不具有消费倾向时，分类结果为零。
[0056]
步骤s103：利用每一初选用户在每一目标群组的分类结果判断该初选用户是否为对应于物品集合的目标用户。
[0057]
经过步骤s102，能够得到每一目标群组中每一初选用户的分类结果。在本步骤中，可以综合每一目标群组的分类结果来判断初选用户是否为对应于物品集合的目标用户。具体地，首先利用每一初选用户在每一目标群组的分类结果以及预先为每一目标群组设置的权重值获取该初选用户的加权判别结果(即初选用户在每一目标群组的分类结果的加权和，一般地，当某用户不是某目标群组的初选用户时，可以认为该用户在该目标群组的分类结果为零)；之后判断加权判别结果是否大于预设阈值：若是，则将该初选用户确定为对应于上述物品集合的目标用户；否则，判断该初选用户不是对应于上述物品集合的目标用户。
[0058]
图4是本发明实施例中确定目标用户的方法的具体流程示意图。如图4所示，本发明方案可以分为离线训练阶段和目标用户确定阶段。在离线训练阶段，首先根据用户行为序列中物品的共现关系(即出现次数和/或出现顺序)构建物品图谱，并利用由物品数据(包括物品的属性数据和标题数据)训练而成的物品相似模型增强物品图谱中孤立物品的连通性。之后使用图嵌入方法从物品图谱中获取物品嵌入向量，并对物品嵌入向量进行聚类形成多个物品群组。最后，利用物品群组中初选用户的原始特征数据以及优化特征数据构建训练样本集合来训练特征生成模型和用户分类模型。在目标用户确定阶段，首先在物品群组中查询物品集合中每种物品的标识，如果查询到则直接确定该种物品所属的目标群组，如果查询不到(说明物品为新物品)则利用物品相似模型获取该种物品的相似物品从而确定该种物品所属的目标群组。之后，利用训练完成的特征生成模型获取每一目标群组中每一初选用户的优化特征数据，并利用训练完成的用户分类模型计算每一初选用户的分类结果，最后对分类结果进行加权聚合来确定对应于物品集合的目标用户。
[0059]
在本发明实施例的技术方案中，预先在离线状态依据物品在用户行为序列的出现次数和/或出现顺序构建物品图谱，利用图嵌入方法从物品图谱中确定物品的嵌入向量，并使用嵌入向量对物品聚类形成多个物品群组；在需要确定针对物品集合的目标用户时，可以通过查询或判断相似物品的方式确定物品集合中每一物品所属的物品群组，进而根据物品群组执行后续的目标用户判别。通过以上设置，能够精准体现不同品类物品或不同品牌物品之间的关联关系，克服基于物品品类或品牌进行目标用户判别的固有缺陷，有利于实现目标用户的精确判别。同时，物品群组可以根据用户行为数据动态更新，从而与动态变化的、物品之间基于用户行为的关联关系保持一致。另外，本发明使用深度学习方法由原始特征数据直接自动生成优化特征数据，不需执行etl处理，从而提高工作效率并节省大量人力物力。
[0060]
需要说明的是，对于前述的各方法实施例，为了便于描述，将其表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，某些步骤事实上可以采用其它顺序进行或者同时进行。此外，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是实现本发明所必须
的。
[0061]
为便于更好的实施本发明实施例的上述方案，下面还提供用于实施上述方案的相关装置。
[0062]
请参阅图5所示，本发明实施例提供的确定目标用户的装置500可以包括群组划分单元501、特征生成及分类单元502和目标用户判断单元503。
[0063]
其中，群组划分单元501可用于判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组；其中，所述物品群组是依据多种物品在同一用户行为序列中的出现次数和/或出现顺序确定的；特征生成及分类单元502可用于：对于每一目标群组：获取该目标群组的多个初选用户，将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中，获得该初选用户在该目标群组的优化特征数据；将所述优化特征数据输入预先训练完成、并且对应于该目标群组的用户分类模型中，获得该初选用户在该目标群组的分类结果；目标用户判断单元503可用于利用每一初选用户在每一目标群组的分类结果判断该初选用户是否为对应于所述物品集合的目标用户。
[0064]
在本发明实施例中，所述装置500可进一步包括：群组预先确定单元，其用于依据多种物品在同一用户行为序列中的出现次数和/或出现顺序生成用于表征所述多种物品之间关联关系的物品图谱；对所述物品图谱执行图嵌入处理，得到所述多种物品中每种物品的嵌入向量；利用所述嵌入向量对所述多种物品进行聚类，获得多个物品群组。
[0065]
实际应用中，群组预先确定单元可进一步用于：将所述物品图谱中孤立物品的属性数据和标题数据输入预先训练完成的物品相似模型中，获得所述孤立物品的至少一种相似物品；在所述物品图谱中增加所述孤立物品与所述相似物品的关联关系。
[0066]
具体应用中，群组划分单元501可进一步用于：针对所述物品集合中的任一种物品，判断预先确定的物品群组中是否包含该种物品的标识：若是，将包含该种物品的标识的物品群组确定为该种物品所属的目标群组；否则，将该种物品的属性数据和标题数据输入所述物品相似模型中，获得该种物品的相似物品；利用该相似物品所属的物品群组确定该种物品所属的目标群组；以及，在确定该种物品所属的目标群组之后，将该种物品加入该目标群组。
[0067]
作为一个优选方案，所述特征生成模型为深度神经网络模型，包括依次连接的输入层、第一隐藏层、第二隐藏层、输出层；其中，第一隐藏层包括第一感知层、第一标准化层和第一激活层；第二隐藏层包括第二感知层、第二标准化层和第二激活层；第二感知层的输入数据为第一激活层的输出数据与原始特征数据拼接之后的数据；输出层的输入数据为第二激活层的输出数据与原始特征数据拼接之后的数据。
[0068]
较佳地，在本发明实施例中，任一初选用户针对相应的目标群组中任一种物品的原始特征数据包括：该初选用户的属性数据、该种物品的属性数据以及该初选用户针对该种物品的行为记录数据；以及，特征生成及分类单元502可进一步用于：将任一初选用户针对相应的目标群组中每种物品的原始特征数据输入所述特征生成模型中，获取第二激活层输出的、该初选用户的多条多维度数据；将所述多维度数据的每一初始维度按照数值区间划分为至少一个目标维度，将所述多维度数据转换为该初选用户在目标维度的一条优化特征数据；其中，该优化特征数据在任一目标维度的取值为：所述多维度数据在该目标维度对
应的初始维度的取值处在该目标维度对应的数值区间的次数。
[0069]
在一些实施例中，目标用户判断单元503可进一步用于：利用每一初选用户在每一目标群组的分类结果以及预先为每一目标群组设置的权重值获取该初选用户的加权判别结果；在加权判别结果大于预设阈值时，将该初选用户确定为对应于所述物品集合的目标用户。
[0070]
此外，在本发明实施例中，所述用户分类模型为xgboost模型；以及，所述装置500可进一步包括用于训练对应于同一物品群组的特征生成模型和用户分类模型的训练单元。训练单元可用于：将该特征生成模型与该用户分类模型连接为综合模型；其中，该用户分类模型的输入数据为：由该特征生成模型中第二激活层的输出数据转换形成的优化特征数据；构建应用在所述综合模型的训练样本集合；其中，训练样本集合中的每一训练样本都包括作为特征部分的原始特征数据和作为标签部分的用户分类结果；利用所述训练样本集合对该特征生成模型和该用户分类模型进行训练。
[0071]
在本发明实施例的技术方案中，预先在离线状态依据物品在用户行为序列的出现次数和/或出现顺序构建物品图谱，利用图嵌入方法从物品图谱中确定物品的嵌入向量，并使用嵌入向量对物品聚类形成多个物品群组；在需要确定针对物品集合的目标用户时，可以通过查询或判断相似物品的方式确定物品集合中每一物品所属的物品群组，进而根据物品群组执行后续的目标用户判别。通过以上设置，能够精准体现不同品类物品或不同品牌物品之间的关联关系，克服基于物品品类或品牌进行目标用户判别的固有缺陷，有利于实现目标用户的精确判别。同时，物品群组可以根据用户行为数据动态更新，从而与动态变化的、物品之间基于用户行为的关联关系保持一致。另外，本发明使用深度学习方法由原始特征数据直接自动生成优化特征数据，不需执行etl处理，从而提高工作效率并节省大量人力物力。
[0072]
图6示出了可以应用本发明实施例的确定目标用户的方法或确定目标用户的装置的示例性系统架构600。
[0073]
如图6所示，系统架构600可以包括终端设备601、602、603，网络604和服务器605(此架构仅仅是示例，具体架构中包含的组件可以根据申请具体情况调整)。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等。
[0074]
用户可以使用终端设备601、602、603通过网络604与服务器605交互，以接收或发送消息等。终端设备601、602、603上可以安装有各种客户端应用，例如确定目标用户的应用(仅为示例)。
[0075]
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0076]
服务器605可以是提供各种服务的服务器，例如对用户利用终端设备601、602、603所操作的确定目标用户的应用提供支持的运算服务器(仅为示例)。运算服务器可以对接收到的目标用户判别请求进行处理，并将处理结果(例如确定的目标用户
--
仅为示例)反馈给终端设备601、602、603。
[0077]
需要说明的是，本发明实施例所提供的确定目标用户的方法一般由服务器605执行，相应地，确定目标用户的装置一般设置于服务器605中。
[0078]
应该理解，图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
[0079]
本发明还提供了一种电子设备。本发明实施例的电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的确定目标用户的方法。
[0080]
下面参考图7，其示出了适于用来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
[0081]
如图7所示，计算机系统700包括中央处理单元(cpu)701，其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram703中，还存储有计算机系统700操作所需的各种程序和数据。cpu701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0082]
以下部件连接至i/o接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便从其上读出的计算机程序根据需要被安装入存储部分708。
[0083]
特别地，根据本发明公开的实施例，上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如，本发明实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元701执行时，执行本发明的系统中限定的上述功能。
[0084]
需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。在本发明中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、rf等等，或者上述的任意合
适的组合。
[0085]
附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这根据所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0086]
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括群组划分单元、特征生成及分类单元和目标用户判断单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，群组划分单元还可以被描述为“向特征生成及分类单元提供目标群组的单元”。
[0087]
作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该设备执行时，使得该设备执行的步骤包括：判断预设物品集合中的每种物品在预先确定的物品群组中所属的目标群组；其中，所述物品群组是依据多种物品在同一用户行为序列中的出现次数和/或出现顺序确定的；对于每一目标群组：获取该目标群组的多个初选用户，将每一初选用户针对该目标群组中每种物品的原始特征数据输入预先训练完成、并且对应于该目标群组的特征生成模型中，获得该初选用户在该目标群组的优化特征数据；将所述优化特征数据输入预先训练完成、并且对应于该目标群组的用户分类模型中，获得该初选用户在该目标群组的分类结果；利用每一初选用户在每一目标群组的分类结果判断该初选用户是否为对应于所述物品集合的目标用户。
[0088]
在本发明实施例的技术方案中，预先在离线状态依据物品在用户行为序列的出现次数和/或出现顺序构建物品图谱，利用图嵌入方法从物品图谱中确定物品的嵌入向量，并使用嵌入向量对物品聚类形成多个物品群组；在需要确定针对物品集合的目标用户时，可以通过查询或判断相似物品的方式确定物品集合中每一物品所属的物品群组，进而根据物品群组执行后续的目标用户判别。通过以上设置，能够精准体现不同品类物品或不同品牌物品之间的关联关系，克服基于物品品类或品牌进行目标用户判别的固有缺陷，有利于实现目标用户的精确判别。同时，物品群组可以根据用户行为数据动态更新，从而与动态变化的、物品之间基于用户行为的关联关系保持一致。另外，本发明使用深度学习方法由原始特征数据直接自动生成优化特征数据，不需执行etl处理，从而提高工作效率并节省大量人力物力。
[0089]
上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围
之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种电子资源分享方法、装置及计算机设备与流程

确定目标用户的方法和装置与流程

相关文献

最热文献