目标用户识别方法及装置与流程

2021-10-30 02:08:00 来源：中国专利 TAG：说明书识别目标特别实施

1.本说明书实施例涉及计算机技术领域，特别涉及一种目标用户识别方法。

背景技术：

2.在贷款的营销定价场景中，结合专家经验与实验数据分析发现，在外部有贷款行为的竞对人群自身存在很强的资金需求，那么对这一类人群进行营销能够带来较大的收益。但是判断某用户是否为竞对用户，目前只能通过用户主动授权平台查征信获得相关信息，然而这样的征信数据相对于整体人群来说量级是很少的。对于未授权查征信的人群中的竞对用户就有可能会被忽略而未被营销。因此，如何在无法获取用户的征信数据的情况下，判断用户是否为竞对人群成了目前急需要解决的技术问题。

技术实现要素：

3.有鉴于此，本说明书施例提供了一种目标用户识别方法。本说明书一个或者多个实施例同时涉及一种目标用户识别装置，一种计算设备，一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。
4.根据本说明书实施例的第一方面，提供了一种目标用户识别方法，包括：
5.获取用户的用户基础特征、所述用户的关联用户、所述用户的关联应用程序；
6.根据所述用户与所述关联用户的关联关系，以及所述用户与所述关联应用程序的关联关系，构建关系知识图谱；
7.将所述关系知识图谱输入图神经网络模型，获得所述用户的向量表征；
8.将所述用户的用户基础特征以及所述用户的目标向量表征输入识别模型，获得所述用户是否为目标用户的识别结果。
9.根据本说明书实施例的第二方面，提供了一种图神经网络模型训练方法，包括：
10.获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序；
11.根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点；
12.确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征；
13.根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
14.根据本说明书实施例的第三方面，提供了一种目标用户识别装置，包括：
15.第一获取模块，被配置为获取用户的用户基础特征、所述用户的关联用户、所述用户的关联应用程序；
16.第一图谱构建模块，被配置为根据所述用户与所述关联用户的关联关系，以及所
述用户与所述关联应用程序的关联关系，构建关系知识图谱；
17.向量表征获得模块，被配置为将所述关系知识图谱输入图神经网络模型，获得所述用户的向量表征；
18.识别模块，被配置为将所述用户的用户基础特征以及所述用户的目标向量表征输入识别模型，获得所述用户是否为目标用户的识别结果。
19.根据本说明书实施例的第四方面，提供了一种图神经网络模型训练装置，包括：
20.第四获取模块，被配置为获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序；
21.第四图谱构建模块，被配置为根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点；
22.特征获得模块，被配置为确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征；
23.第三训练模块，被配置为根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
24.根据本说明书实施例的第五方面，提供了一种计算设备，包括：
25.存储器和处理器；
26.所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述目标用户识别方法的步骤。
27.根据本说明书实施例的六方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述目标用户识别方法的步骤。
28.本说明书一个实施例实现了一种目标用户识别方法及装置，其中，所述目标对象处理方法包括获取用户的用户基础特征、所述用户的关联用户、所述用户的关联应用程序；根据所述用户与所述关联用户的关联关系，以及所述用户与所述关联应用程序的关联关系，构建关系知识图谱；将所述关系知识图谱输入图神经网络模型，获得所述用户的向量表征；将所述用户的用户基础特征以及所述用户的目标向量表征输入识别模型，获得所述用户是否为目标用户的识别结果。
29.具体的，所述目标用户识别方法为结合图谱的目标用户(即竞对人群)识别方案，充分利用关系数据构建的关系知识图谱，基于用户的从关联用户、关联应用程序的特征作为目标用户的缺失特征的补充，从而准确的识别出竞对人群。
附图说明
30.图1是本说明书一个实施例提供的一种目标用户识别方法的流程图；
31.图2是本说明书一个实施例提供的一种目标用户识别方法中关系知识图谱的结构示意图；
32.图3是本说明书一个实施例提供的一种目标用户识别方法中rcf
‑
gcn图神经网络模型的结构示意图；
33.图4是本说明书一个实施例提供的一种目标用户识别方法中识别模型的具体识别
过程示意图；
34.图5是本说明书一个实施例提供的一种目标用户识别方法应用在竞对用户识别场景中的具体处理过程示意图；
35.图6是本说明书一个实施例提供的一种图神经网络模型训练方法的流程图；
36.图7是本说明书一个实施例提供的一种目标用户识别装置的结构示意图；
37.图8是本说明书一个实施例提供的一种图神经网络模型训练装置的结构示意图；
38.图9是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
39.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。
40.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
41.应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
42.首先，对本说明书一个或多个实施例涉及的名词术语进行解释。
43.用户基础特征：用户基本属性(如姓名、年纪等)、在资金交易平台的访问、转账、支用、提现等行为特征以及在金融机构的访问、转账、支用、授信等特征。
44.异质图：指图中的节点类型或关系类型多于一种。在现实场景中，通常研究的图数据对象是多类型的，对象之间的交互关系也是多样化的。因此，异构图能够更好地贴近现实。
45.二部图：是一类特殊的异质图。我们将图g中的顶点集合v拆分成两个子集a和b，如果对于图中的任意一条边ij均有vi∈a，vj∈b或者vi∈b，vj∈a，则称图g为二部图。二部图是一种十分常见的图数据对象，描述了两类对象之间的交互关系，比如：用户与商品、作者与论文等。
46.多关系图：图中的边可以表示为(u,v,r)，代表存在一条从节点u指向节点v的类型为r的边，即在一个图中两个节点之间存在多种类型的边。如两个用户之间存在转账关系、通讯录关系、好友关系等不同类型的关系。多关系图的建模是更符合实际也具有更高的应用价值。
47.协同过滤(collaborative filtering,cf)：包括协同和过滤两个操作。协同，就是根据用户与事物交互留下的信息(如评分)分析用户或者事物之间的相似性；过滤，就是根据分析从一个所有候选事物中过滤出用户感兴趣的事物并将此事物推荐给用户。
48.图协同过滤网络：使用神经网络框架在user
‑
item交互的连接图中学习非线性的协同过滤模型，能够得到更多的协同过滤信号。
49.竞对人群：贷款的准入用户。
50.app：application，应用程序。
51.agg：聚合；
52.gcn：图卷积神经网络。
53.在贷款的营销定价场景中，结合专家经验与实验数据分析发现，在外部有贷款行为的竞对人群自身存在有很强的资金需求，竞对人群在贷款平台内的来访、支用等行为活跃，对权益的敏感度也很高，对这一类人群进行营销能够带来较大的收益。判断某用户是否为竞对用户，目前只能通过用户主动授权平台查征信获得相关信息，然而这样的征信数据相对于整体人群来说量级是很少的。但是，目前各贷款平台新客缺失严重，有近一年征信数据的新客仅占总体新客的4％左右。对于这一大批未授权查征信的人群采用通用的营销手段，其中的竞对用户很有可能就会被忽略而未被营销。其中，新客的定义是历史未在贷款平台内进行支用的用户。显然，对于贷款平台的新客，存在缺少其在贷款平台内的支用、还款等行为数据。而这些数据恰恰是竞对用户活跃的表现，对识别竞对用户起到重要作用。
54.本说明书实施例中，为了解决新客数据欠缺的问题，主要考虑从两个方面进行补充：1.用户关系数据，如转账关系、通讯录关系、好友关系等，认为存在关系的用户之间的转账、消费情况可能存在相似性，可以对新客信息作补充；2.外部数据，如app数据，用户使用不同app在一定程度上反映了用户的特性和需求，可以帮助刻画新客行为特点。
55.综上所述，目前在竞对用户的识别中的挑战有以下三点：
56.1.新客缺少贷款平台内的历史行为信息，同时新客授权查征信的人数比例非常少，是竞对识别重点关注的人群。
57.2.存在大量的关系数据，但未能被充分利用，如好友关系、转账关系、银行流水关系、app等。
58.3.仅有少量的授权查征信用户，也就是说，只有少量样本有label，大部分样本是无label的。
59.研究表明，将图谱作为辅助信息引入到信息稀疏或缺失的场景中，可以丰富对用户和物品的描述、增强算法的挖掘能力，从而有效地弥补交互信息的稀疏或缺失。通常，图谱被用来表示物体与物体之间的关系。任何一个包含关系的系统都可以用图谱来描述。在本说明书实施例的场景中，通过图谱能够很好地构建出用户之间、用户与app之间的交互关系。然而用户
‑
用户图、用户
‑
app图是两种不同的异质图。用户
‑
用户图属于节点同类型、边不同类型的多关系图，在两个用户之间会同时存在转账关系、通讯录关系、好友关系等多种不同类型的边。传统的图神经网络(gnns)如gnn、gcn、gat，在构图中边是没有具体含义的，仅作为节点之间的链接关系，不同类型的边是通过作为边的特征表示的，并没有在图学习的过程中很好地体现不同类型边的差异。对于两个节点之间的不同类型边，其影响对于节点也是不一样的，因此，本说明书实施例中，在构图时就定义了其边的类型，学习不同关系在用户交互之间发挥的作用。而用户
‑
app关系图则比较特殊，是属于节点不同类型、边同类型的二部图。二部图常用于推荐系统中构建用户与商品之间的关系图，其特点是只有用户与商品之间存在边关系，用户之间、商品之间都不存在关系。同理，本说明书实施例中，将推
荐系统中的协同过滤思想也应用到用户
‑
app的图学习中。
60.因此，本说明书实施例的方案提出了一个rcf
‑
gcn图神经网络(graph convolution network based on multi relation learning and collaborative filtering)。基于多关系学习和协同过滤构建用户之间和用户
‑
app之间的关系图谱，在图神经网络中对不同类型的边使用不同的权重，区分两节点间的不同连接，同时借助协同过滤的思想，在图学习中加入用户
‑
app的交互信息，有目的地学习用户对不同app的偏好程度。另外，本方案还对网络的损失函数进行了改进，有效地将无标签样本与有标签样本联合起来进行训练。最后将得到的用户的向量表征结合用户基础特征输入到竞对人群识别模型中，得到竞对识别结果。
61.以下在本说明书中，提供了一种目标用户识别方法。本说明书一个或者多个实施例同时涉及一种目标用户识别装置，一种计算设备，一种计算机可读存储介质，在下面的实施例中逐一对上述介绍的本方案的实现进行详细说明。
62.参见图1，图1示出了根据本说明书一个实施例提供的一种目标用户识别方法的流程图，具体包括以下步骤。
63.步骤102：获取用户的用户基础特征、所述用户的关联用户、所述用户的关联应用程序。
64.其中，用户基础特征包括但不限于用户的基本属性，例如姓名、年纪、职业、收入水平等等；用户的行为属性，例如用户在资金交易平台的访问、转账、支用、提现等行为特征以及用户在贷款平台的访问、转账、支用以及授信等行为特征。
65.关联用户为与用户存在关联关系的用户，例如用户的好友、与用户存在转账关系的用户、用户通讯录里面的用户等；关联应用程序为与用户存在关联关系的手机app，例如用户手机中的购物app、贷款app、资金交易app等等。
66.具体的，将目标用户识别方法应用在对竞对用户进行识别的场景中，可以通过第三方平台(例如一些征信平台、手机终端、以及手机终端上用户进行过信息注册或者使用过的应用程序等)获取待识别用户的用户基础特征、与用户存在关联关系的关联用户、与用户存在关联关系的关联应用程序。
67.步骤104：根据所述用户与所述关联用户的关联关系，以及所述用户与所述关联应用程序的关联关系，构建关系知识图谱。
68.具体的，在获取到用户的关联用户、关联应用程序之后，根据用户、关联用户、关联应用程序、用户与关联用户之间的关联关系、用户与关联应用程序的关联关系，构建关系知识图谱。具体实现方式如下所述：
69.将所述用户、所述用户的关联用户、所述用户的关联应用程序为节点，将所述用户与所述关联用户的关联关系、所述用户与所述关联应用程序的关联关系为边，根据所述节点和所述边构建关系知识图谱。
70.其中，关系知识图谱由节点和边组成，具体实施时，将用户、与用户存在关联关系的每个关联用户、与用户存在关联关系的每个关联应用程序作为关系知识图谱的每个节点；然后将用户与关联用户之间的每个关联关系、用户与关联应用程序之间的每个关联关系作为关系知识图谱的每个边；最终基于每个节点和每个边构建获得关系知识图谱。
71.参见图2，图2示出了根据本说明书一个实施例提供的一种目标用户识别方法中关
系知识图谱的结构示意图。
72.实际应用中，关系知识图谱由若干个三元组(h，r，t)组成，其中，h和t代表一条关系的头结点和尾结点，r代表h和t的关系。
73.以节点为用户和应用程序，关系为转账关系、通讯录关系、好友关系为例，构建图2中的关系知识图谱。
74.由图2中的关系知识图谱可知，u1、u2、u3、u4、u5、u6、a1、a2为节点，u1和u3的转账关系为一个边，u1和u2的好友关系为一个边，u1和u2的转账关系为一个边，u2和u5的通讯录关系为一个边，u2和u5的转账关系为一个边，u2和u4的好友关系为一个边，u5和u6的好友关系为一个边，u1和a1的交互关系为一个边，u2和a1的交互关系为一个边，u5和a2的交互关系为一个边。基于上述的节点和边构建出图2中的关系知识图谱；其中，u1、u2、u3、u4、u5、u6等节点为用户，a1和a2为应用程序。
75.以u1为待识别用户时，u1的关联用户为u2和u3，关联应用程序为a1。
76.通过图2中的关系知识图谱可知，该关系知识图谱包括两个特点：第一，用户和用户之间以多种类型的关系建立连接边，如u1和u2之间可以同时具有转账和好友关系；第二，用户和app之间以用户与app是否有交互建立连接边，其中，用户和app之间具有直接相连的边，但是app和app之间没有边直接相连。
77.本说明书实施例中，通过用户、关联用户、关联应用程序、用户与关联用户的关联关系、用户与关联应用程序的关联关系，构建关系知识图谱，后续可以基于该关系知识图谱对用户是否为竞对用户进行识别时，可以参考关系知识图谱丰富对待识别的用户描述、增强算法的挖掘能力，从而可以通过图神经网络模型，获得准确的用户的向量表征。
78.步骤106：将所述关系知识图谱输入图神经网络模型，获得所述用户的向量表征。
79.具体的，在构建用户的关系知识图谱之后，可以将该关系知识图谱输入图神经网络模型中，获得该用户的向量表征。其中，图神经网络模型为预先训练的图神经网络。
80.实际应用中，图神经网络模型可以通过聚合(agg)邻居信息的方式交换/获取周围节点的信息，该聚合操作做t次迭代，相当于每个节点拿自己走t跳可达的邻居节点，来做传播和交换，最后把信息汇聚到中心节点以后，下游再依据不同的任务设计对应的损失函数，并通过反向传播优化参数，进行节点分类或者链接预测任务。图卷积神经网络gcn即采用卷积的方式来对邻居节点进行agg。
81.假设一个图中有n个节点，每个节点都有自己的初始特征，所有节点的初始特征组成一个n*d维的矩阵x，各节点之间的关系也会形成一个n*n维的矩阵a，也称为邻接矩阵(adjacency matrix)。其中，x和a即图卷积神经网络模型的输入，那么图卷积神经网络gcn对第i个节点的聚合方式如公式1所述：
[0082][0083]
其中，c
i
为正则化常数，通过矩阵a计算得到；表示第(l 1)层中第i个节点的向量表征；为第l层的第i个节点的初始特征；w
l
为第l层的参数矩阵；n
i
表示与第i个节点有连接关系的邻居节点个数。
[0084]
图卷积神经网络gcn的基本的损失函数使用交叉熵计算，如公式2所述：
[0085][0086]
其中，|y
l
|表示样本个数；k表示分类个数；i(y
l
＝i)为指示函数，表示当y
l
＝i时输出为1，y
l
≠i时，输出为0；z
li
表示最后向量的softmax输出。
[0087]
最终，通过公式1获得的每个节点的向量表征以及公式2获得的损失函数对图卷积神经网络gcn进行训练。但是在当前的竞对用户识别的场景中，该图卷积神经网络gcn存在以下不足：从公式1中可以看出，w
l
是l层中所有的边共享的。也就是说，图中虽然存在有不同类型的边，但是在学习的过程中并没有对边的类型进行区分，无法学习到边的差异；对节点进行编码得到embedding，再基于节点之间关系的定义构建损失函数并进行解码，即在构建embedding的过程中没有很好地利用节点之间的交互信息，学习得到的embedding缺少了不同类型节点之间重要的协同信息；并且该有监督学习建模只能用到有label(样本标签)的少量样本，这样就会缺失大量信息，造成样本有偏差，使得训练获得的图卷积神经网络不准确。
[0088]
为了解决该技术问题，可以对该图卷积神经网络模型进行改进，采用rcf
‑
gcn图神经网络，rcf
‑
gcn图神经网络沿用gcn的计算框架，并针对本说明书实施例的竞对用户识别的应用场景对网络结构进行了相应的设计。具体实现方式如下所述：
[0089]
所述图神经网络模型的训练步骤如下：
[0090]
获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序；
[0091]
根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点；
[0092]
确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征；
[0093]
根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
[0094]
其中，由于目前仅有少量的授权查征信用户，即多个样本用户中，仅有少量的样本用户是有标签的(如可以确定是否为竞对用户)，还有一部分的样本用户是无标签的(无法确定是否为竞对用户)；因此，多个样本用户可以理解为有标签的样本用户和无标签的样本用户。
[0095]
具体的，首先获取多个有标签以及无标签的样本用户，并确定每个样本用户的关联用户、每个样本用户的关联应用程序；然后将每个样本用户、每个样本用户的关联用户、每个样本用户的关联应用程序作为节点，将每个样本用户与每个样本用户的关联用户的关联关系，以及每个样本用户与每个样本用户的关联应用程序的关联关系作为边，基于该节点和边构建样本关系知识图谱；再基于该样本关系知识图谱，确定该样本关系知识图谱中每个节点的特征矩阵、相同节点类型的每条边的关系矩阵、每个关系矩阵的权重矩阵以及不同节点类型的节点的交互特征；最后根据特征矩阵、关系矩阵、权重矩阵以及交互特征对图神经网络模型进行训练，获得该图神经网络模型(即rcf
‑
gcn图神经网络)。
[0096]
本说明书实施例中，利用每个节点的特征矩阵、不同类型的边的关系矩阵、关系矩
阵的权重矩阵以及交互特征对图神经网络模型进行训练，使得图神经网络模型对不同类型的边初始化不同的参数矩阵进行学习，区分两节点之间的不同连接类型，能够得到更多丰富的信息，并采用注意力机制赋予每个参数矩阵不同的权重，体现不同边的关系对用户的影响程度；同时通过在embedding层中加入用户与app的交互特征，学习用户对不同app的偏好信息，解决了gcn学习的向量表征中缺少用户和app之间重要的协同信息的问题，提升rcf
‑
gcn图神经网络的精确度。
[0097]
具体的，特征矩阵、关系矩阵、权重矩阵以及交互特征的具体实现方式如下所述：
[0098]
将所述每个样本用户、所述每个样本用户的关联用户作为所述样本关系知识图谱的所述用户节点，以及将所述每个样本用户的关联应用程序作为所述样本关系知识图谱的所述程序节点，并确定所述样本关系知识图谱中所述用户节点以及所述程序节点的特征矩阵；
[0099]
将所述每个样本用户与所述每个样本用户的关联用户形成的不同类型的边作为所述用户节点的边，并为所述用户节点的每条边配置不同的关系矩阵；
[0100]
通过注意力机制确定所述每个关系矩阵的权重矩阵；以及
[0101]
根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征。
[0102]
其中，特征矩阵为样本关系知识图谱中每个用户节点(样本用户、样本用户的关联用户)的特征矩阵以及每个程序节点的特征矩阵，即对每个样本用户、每个样本用户的关联用户以及每个关联应用程序进行向量化后生成的特征矩阵。关系矩阵则为针对用户节点、不同类型的边配置的关系矩阵(即上述的参数矩阵)；同时通过attention机制为每个关系矩阵赋予不同的权重矩阵；而交互特征则为不同类型的用户节点和app节点之间的交互特征。
[0103]
本说明书实施例中，在对图神经网络模型训练之前，获取每个用户节点的特征矩阵、用户节点不同类型的边的关系矩阵、每个关系矩阵的权重矩阵以及不同类型的节点之间的交互特征；通过上述特征使得对图神经网络模型训练时，图神经网络模型可以定义相同类型的节点之间不同关系的参数矩阵，利用attention机制学习不同关系间的重要程度；同时考虑用户与app之间的协同作用，学习带有用户
‑
app交互信息的向量表征。
[0104]
具体实施时，所述根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征，包括：
[0105]
根据所述用户节点的特征矩阵、所述关系矩阵以及所述权重矩阵通过第一聚合算法进行计算，获得所述用户节点的向量表征；
[0106]
根据所述程序节点的特征矩阵通过第二聚合算法进行计算，获得所述程序节点的向量表征；
[0107]
将所述用户节点的向量表征与所述程序节点的向量表征进行交互处理，获得所述用户节点与所述程序节点的交互特征。
[0108]
其中，第一聚合算法可以理解为本说明书实施例中的公式4，第二聚合算法可以理解为本说明书实施例中的公式1。
[0109]
具体的，在rcf
‑
gcn图神经网络模型中，通过对用户节点不同类型的边使用不同的参数矩阵，从而在节点聚合信息的过程中就能学习到不同关系对节点产生的作用。如存在
转账、通讯录和好友三种关系，那么在网络中就需要使用3种权重矩阵w
r
(r＝0，1，2)来学习，最后会得到3种表示向量。
[0110]
而考虑到不同关系对不同用户的影响作用是不同的，应该根据网络自身学习对关系的重要程度赋予不同的权重，因此，本说明书实施例中可以利用attention机制来计算同一用户不同关系间的重要程度，从而对关系进行整合。
[0111]
其中，attention机制使用一个神经网络来实现，如公式3所述：
[0112][0113]
其中，为不同关系的权重矩阵，是由网络学习得到的参数，表示第l层的不同关系的参数矩阵。
[0114]
在确定不同关系的权重矩阵之后，可以通过特征矩阵、关系矩阵以及权重矩阵获取每个节点(即用户节点)的向量表征，其中，每个用户节点的向量表征的聚合方式如公式4所述：
[0115][0116]
其中，c
i
为正则化常数；表示第(l 1)层中第i个节点的向量表征；为第l层的第i个节点的初始特征；表示第l层的不同关系的参数矩阵；n
r，i
表示与第i个节点具有第r种关系的邻居节点个数。
[0117]
同时，根据每个程序节点的特征矩阵通过上述公式1，计算获得每个程序节点的向量表征。
[0118]
而在获得每个用户节点的向量表征以及每个程序节点的向量表征之后，将用户节点的向量表征与程序节点的向量表征元素乘积的方式进行特征交互后输入到网络层中学习，使得embedding学习之前就带着用户和app的交互特征，通过网络可学习得到用户
‑
app之间重要的协同过滤信息。
[0119]
即在获取每个用户节点的向量表征以及每个程序节点的向量表征之后，将存在关联应用程序的每个用户节点的向量表征与程序节点的向量表征进行交互处理，获得用户节点与程序节点的交互特征，使得后续在对图神经网络模型进行训练时，可以学习得到用户
‑
app之间重要的协同过滤信息。即将用户节点的向量表征以及交互特征输入图神经网络模型中，经过多层向量聚合学习，获得每个节点最终的目标向量表征。
[0120]
具体实施时，图神经网络模型的具体训练过程如下所述：
[0121]
所述根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型，包括：
[0122]
基于所述用户节点的向量表征、以及所述用户节点与所述程序节点的交互特征，获得所述每个样本用户的目标向量表征；
[0123]
确定所述多个样本用户中的有标签的样本用户和无标签的样本用户，根据所述有标签的样本用户的向量表征、所述无标签的样本用户的向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，获得所述图神经网络模型。
[0124]
具体的，基于每个用户节点的向量表征、以及用户节点与程序节点的交互特征获得每个样本用户的向量表征。
[0125]
实际应用中，进行图神经网络模型训练时，先设计损失函数，有效地将无标签样本用户和有标签样本用户联合起来，在全量样本数据中进行训练。
[0126]
借鉴pairwise loss(成对损失)的设计思路，对于有标签的样本用户，与其相连接的无标签的样本用户在向量表征上应该是与该有标签的样本用户的向量表征相似的。因此，具体实施时，可以通过以下的损失函数对无标签样本用户进行监督训练。具体损失函数的计算方式参见如下公式5：
[0127][0128]
其中，o＝{(u，i，j)|(u，i)∈r

，(u，j)∈r
‑
，r

表示与有标签的样本用户相连接的无标签的样本用户集合，r
‑
表示与有标签的样本用户无连接的无标签的样本用户集合，z
u
表示有标签的样本用户的向量表征，z
i
表示与有标签的样本用户存在连接关系的无标签的样本用户的向量表征；z
j
表示有标签的样本用户不存在连接关系的无标签的样本用户的向量表征。
[0129]
具体的，首先基于聚合后获得的用户节点的向量表征、以及用户节点与程序节点的交互特征通过embedding层进行学习，获得每个样本用户的最终的目标向量表征。然后根据多个样本用户中有标签的样本用户的目标向量表征、无标签的样本用户的目标向量表征以及有标签的样本用户的样本标签计算获得模型训练时对无标签的样本用户进行监督训练的参考损失函数。
[0130]
本说明书实施例中，针对有监督学习建模中有标签的样本用户的数量比较少，造成模型训练有偏的问题，通过对无标签的样本用户进行监督训练的参考损失函数的设计，有效地将无标签的样本用户和有标签的样本用户联合起来，从而可以充分利用全量样本数据进行模型训练，使得训练获得的图神经网络模型的效果更好。
[0131]
具体实施时，所述根据所述有标签的样本用户的目标向量表征、所述无标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，包括：
[0132]
根据所述有标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签，获得有标签的样本的初始损失函数；
[0133]
确定与所述有标签的样本用户关联的无标签的样本用户、以及与所述有标签的样本用户无关联的无标签的样本用户；
[0134]
根据所述与所述有标签的样本用户关联的无标签的样本用户的目标向量表征、所述与所述有标签的样本用户无关联的无标签的样本用户的目标向量表征、所述有标签的样本用户的样本标签，获得无标签的样本的初始损失函数；
[0135]
根据所述有标签的样本的初始损失函数和所述无标签的样本的初始损失函数，获得图神经网络模型的目标损失函数，并基于所述每个样本用户的目标向量表征以及所述目标损失函数对所述图神经网络模型进行训练。
[0136]
具体的，首先根据有标签的样本用户的目标向量表征以及有标签的样本用户的样
本标签，通过上述的公式2，计算获得有标签的样本进行监督训练的参考损失函数；再根据与有标签的样本用户关联的无标签的样本用户的目标向量表征、与有标签的样本用户无关联的无标签的样本用户的目标向量表征、有标签的样本用户的样本标签，通过上述公式5，计算获得无标签的样本的初始损失函数，即无标签的样本进行监督训练的参考损失函数；最终根据有标签的样本的初始损失函数和无标签的样本的初始损失函数，获得图神经网络模型的目标损失函数。
[0137]
实际应用中，采用上述方式获得的图神经网络模型的目标损失函数通过如下公式6表示：
[0138][0139]
其中，loss1表示有标签的样本的初始损失函数，loss2表示无标签的样本的初始损失函数，表示可调节参数，为正则项。
[0140]
在确定图神经网络模型的目标损失函数之后，即可根据每个样本用户的目标向量表征、每个样本用户的目标向量表征的样本标签以及目标损失函数对图神经网络模型进行训练；即根据每个样本用户的目标向量表征、每个样本用户的目标向量表征的样本标签对图神经网络模型进行训练，直至图神经网络模型进行训练获得的损失函数满足目标损失函数时结束。其中，图神经网络模型输出每个样本用户的目标向量表征以及每个目标向量表征的样本标签，而样本标签可以理解为是或否，即样本标签为样本用户是竞对用户或者不是竞对用户。
[0141]
参见图3，图3示出了根据本说明书一个实施例提供的一种目标用户识别方法中rcf
‑
gcn图神经网络模型的结构示意图。
[0142]
图3中，u1、u2、u3、u4、a1为关系知识图谱中的5个节点，其中，u1、u2、u3、u4为用户节点，a1为程序节点。
[0143]
实际应用中，先获取u1、u2、u3、u4的每个节点的特征矩阵，再获取每个不同类型的边的关系矩阵，同时通过注意力机制attention为节点类型相同，边的类型不同的边的关系矩阵设置不同的权重矩阵，例如为u1的转账关系的边设置权重w1，为u1的好友关系的边设置权重w2，为u3的通讯录的边设置权重w3；并且将u2的聚合后的向量表征与a1的向量进行交互，获得交互特征，将该交互特征、每个用户节点的向量表征输入embedding层进行学习，获得每个用户节点的最终的目标向量表征。
[0144]
本说明书实施例的目标用户识别方法，提出了一个rcf
‑
gcn图神经网络，通过定义不同关系的参数矩阵来区分两节点间的边的不同类型，并利用attention机制学习不同关系间的重要程度；同时在网络中加入用户
‑
app的交互信息，有目的地学习用户对不同app的偏好程度。另外，设计网络的损失函数以有效地将无标签样本与有标签样本联合起来在全量样本中进行训练，提升训练获得的图神经网络模型的精确度。
[0145]
步骤108：将所述用户的用户基础特征以及所述用户的目标向量表征输入识别模型，获得所述用户是否为目标用户的识别结果。
[0146]
具体的，在确定用户的基础特征以及用户的目标向量表征之后，将用户的基础特征以及用户的目标向量表征输入识别模型，获得用户是否为目标用户的识别结果。
[0147]
其中，所述识别模型的训练步骤如下：
[0148]
获取多个样本用户中每个样本用户的用户基础特征、每个样本用户的关联用户、所述每个样本用户的关联应用程序；
[0149]
根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱；
[0150]
将所述样本关系知识图谱输入所述图神经网络模型，获得所述每个样本用户的目标向量表征；
[0151]
根据所述每个样本用户的用户基础特征以及所述所述每个样本用户的目标向量表征对所述识别模型进行训练。
[0152]
具体的，样本关系知识图谱的构建过程可以参见上述实施例，在此不再赘述。
[0153]
将样本关系知识图谱输入图神经网络模型，获得每个样本用户的目标向量表征，最后根据每个样本用户的用户基础特征以及每个样本用户的目标向量表征对识别模型进行训练。
[0154]
参见图4，图4示出了根据本说明书一个实施例提供的一种目标用户识别方法中识别模型的具体识别过程示意图。
[0155]
图4中包括用户的用户基础特征、通过图神经网络模型获得的用户的目标向量表征以及识别模型。
[0156]
其中，识别模型包括激活函数层(activation function)、sigmoid函数层(sigmoid function)以及全连接层(normal connection)。
[0157]
实际应用中，将用户基础特征以及用户的目标向量表征输入识别模型，通过识别模型的activation function、sigmoid function以及normal connection，获得用户是否为目标用户的识别结果，即用户是否为竞对用户。
[0158]
本说明书实施例提供的所述目标用户识别方法为结合图谱的目标用户(即竞对人群)识别方案，充分利用关系数据构建的关系知识图谱，基于用户的从关联用户、关联应用程序的特征作为目标用户的缺失特征的补充，从而准确的识别出竞对人群。
[0159]
参见图5，图5示出了根据本说明书一个实施例提供的一种目标用户识别方法应用在竞对用户识别场景中的具体处理过程示意图。
[0160]
步骤一：获取待识别用户的用户基础特征、与待识别用户存在关联关系的关联用户、与待识别用户存在关联关系的关联应用程序。
[0161]
步骤二：基于待识别用户、与待识别用户存在关联关系的关联用户、与待识别用户存在关联关系的关联应用程序、待识别用户与待识别用户存在关联关系的关联用户的关联关系、待识别用户与待识别用户存在关联关系的关联应用程序的关联关系构建关系知识图谱。
[0162]
其中，待识别用户与待识别用户存在关联关系的关联用户的关联关系包括但不限于转账关系、通讯录关系以及好友关系等。而待识别用户与待识别用户存在关联关系的关联应用程序(app)的关联关系仅为交互关系。
[0163]
步骤三：将关系知识图谱输入预先训练的rcf
‑
gcn图神经网络模型，获得待识别用户的目标向量表征。
[0164]
步骤四：将待识别用户的用户基础特征以及目标向量表征输入竞对识别模型，获得待识别用户对应的用户标签，通过该用户标签可以确定该待识别用户是否为竞对用户。
[0165]
本说明书实施例提供的目标用户识别方法，给出了一套结合图谱的竞对人群识别方案。充分利用关系数据构建图谱能够很好地从其他用户的数据中对新客特征缺失作补充；并且通过rcf
‑
gcn图神经网络，通过定义不同关系的参数矩阵来区分两节点间的边的不同类型，并利用attention机制学习不同关系间的重要程度；在网络中加入用户
‑
app的交互信息，有目的地学习用户对不同app的偏好程度，以及设计网络的损失函数以有效地将无标签样本与有标签样本联合起来在全量样本中进行训练，使得竞对人群的识别更加快速和准确。
[0166]
参见图6，图6示出了根据本说明书一个实施例提供的一种图神经网络模型训练方法的流程图，具体包括以下步骤。
[0167]
步骤602：获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序。
[0168]
步骤604：根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点。
[0169]
步骤606：确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征。
[0170]
步骤608：根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
[0171]
可选地，所述确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征，包括：
[0172]
将所述每个样本用户、所述每个样本用户的关联用户作为所述样本关系知识图谱的所述用户节点，以及将所述每个样本用户的关联应用程序作为所述样本关系知识图谱的所述程序节点，并确定所述样本关系知识图谱中所述用户节点以及所述程序节点的特征矩阵；
[0173]
将所述每个样本用户与所述每个样本用户的关联用户形成的不同类型的边作为所述用户节点的边，并为所述用户节点的每条边配置不同的关系矩阵；
[0174]
通过注意力机制确定所述每个关系矩阵的权重矩阵；以及
[0175]
根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征。
[0176]
可选地，所述根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征，包括：
[0177]
根据所述用户节点的特征矩阵、所述关系矩阵以及所述权重矩阵通过第一聚合算法进行计算，获得所述用户节点的向量表征；
[0178]
根据所述程序节点的特征矩阵通过第二聚合算法进行计算，获得所述程序节点的向量表征；
[0179]
将所述用户节点的向量表征与所述程序节点的向量表征进行交互处理，获得所述用户节点与所述程序节点的交互特征。
[0180]
可选地，所述根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型，包括：
[0181]
基于所述用户节点的向量表征、以及所述用户节点与所述程序节点的交互特征，获得所述每个样本用户的目标向量表征；
[0182]
确定所述多个样本用户中的有标签的样本用户和无标签的样本用户，根据所述有标签的样本用户的目标向量表征、所述无标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，获得所述图神经网络模型。
[0183]
可选地，所述根据所述有标签的样本用户的目标向量表征、所述无标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，包括：
[0184]
根据所述有标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签，获得有标签的样本的初始损失函数；
[0185]
确定与所述有标签的样本用户关联的无标签的样本用户、以及与所述有标签的样本用户无关联的无标签的样本用户；
[0186]
根据所述与所述有标签的样本用户关联的无标签的样本用户的目标向量表征、所述与所述有标签的样本用户无关联的无标签的样本用户的目标向量表征、所述有标签的样本用户的样本标签，获得无标签的样本的初始损失函数；
[0187]
根据所述有标签的样本的初始损失函数和所述无标签的样本的初始损失函数，获得图神经网络模型的目标损失函数，并基于所述每个样本用户的目标向量表征以及所述目标损失函数对所述图神经网络模型进行训练。
[0188]
具体的，本说明书实施例提供的图神经网络模型训练方法，与上述实施例中目标用户识别方法中的图神经网络模型训练方法一致，具体细节可参考上述实施例，在此不再赘述。
[0189]
本说明书实施例提供的图神经网络模型训练方法，通过定义不同关系的参数矩阵来区分两节点间的边的不同类型，并利用attention机制学习不同关系间的重要程度；在网络中加入用户
‑
app的交互信息，有目的地学习用户对不同app的偏好程度，以及设计网络的损失函数以有效地将无标签样本与有标签样本联合起来在全量样本中进行训练，获得更加精确的图神经网络模型。
[0190]
与上述方法实施例相对应，本说明书还提供了目标用户识别装置实施例，图7示出了本说明书一个实施例提供的一种目标用户识别装置的结构示意图。如图7所示，该装置包括：
[0191]
第一获取模块702，被配置为获取用户的用户基础特征、所述用户的关联用户、所述用户的关联应用程序；
[0192]
第一图谱构建模块704，被配置为根据所述用户与所述关联用户的关联关系，以及所述用户与所述关联应用程序的关联关系，构建关系知识图谱；
[0193]
向量表征获得模块706，被配置为将所述关系知识图谱输入图神经网络模型，获得所述用户的向量表征；
[0194]
识别模块708，被配置为将所述用户的用户基础特征以及所述用户的目标向量表征输入识别模型，获得所述用户是否为目标用户的识别结果。
[0195]
可选地，所述图神经网络模型通过如下模块进行训练：
[0196]
第二获取模块，被配置为获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序；
[0197]
第二图谱构建模块，被配置为根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点；
[0198]
第一交互特征确定模块，被配置为确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征；
[0199]
第一训练模块，被配置为根据所述特征矩阵、所述关系矩阵、所述权重矩阵以及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
[0200]
可选地，所述第一交互特征确定模块，进一步被配置为：
[0201]
将所述每个样本用户、所述每个样本用户的关联用户作为所述样本关系知识图谱的所述用户节点，以及将所述每个样本用户的关联应用程序作为所述样本关系知识图谱的所述程序节点，并确定所述样本关系知识图谱中所述用户节点以及所述程序节点的特征矩阵；
[0202]
将所述每个样本用户与所述每个样本用户的关联用户形成的不同类型的边作为所述用户节点的边，并为所述用户节点的每条边配置不同的关系矩阵；
[0203]
通过注意力机制确定所述每个关系矩阵的权重矩阵；以及
[0204]
根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征。
[0205]
可选地，所述第一交互特征确定模块，进一步被配置为，包括：
[0206]
根据所述用户节点的特征矩阵、所述关系矩阵以及所述权重矩阵通过第一聚合算法进行计算，获得所述用户节点的向量表征；
[0207]
根据所述程序节点的特征矩阵通过第二聚合算法进行计算，获得所述程序节点的向量表征；
[0208]
将所述用户节点的向量表征与所述程序节点的向量表征进行交互处理，获得所述用户节点与所述程序节点的交互特征。
[0209]
可选地，所述第一训练模块，进一步被配置为：
[0210]
基于所述用户节点的向量表征、以及所述用户节点与所述程序节点的交互特征，获得所述每个样本用户的目标向量表征；
[0211]
确定所述多个样本用户中的有标签的样本用户和无标签的样本用户，根据所述有标签的样本用户的目标向量表征、所述无标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，获得所述图神经网络模型。
[0212]
可选地，所述第一训练模块，进一步被配置为：
[0213]
根据所述有标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签，获得有标签的样本的初始损失函数；
[0214]
确定与所述有标签的样本用户关联的无标签的样本用户、以及与所述有标签的样本用户无关联的无标签的样本用户；
[0215]
根据所述与所述有标签的样本用户关联的无标签的样本用户的目标向量表征、所述与所述有标签的样本用户无关联的无标签的样本用户的目标向量表征、所述有标签的样本用户的样本标签，获得无标签的样本的初始损失函数；
[0216]
根据所述有标签的样本的初始损失函数和所述无标签的样本的初始损失函数，获得图神经网络模型的目标损失函数，并基于所述每个样本用户的目标向量表征以及所述目标损失函数对所述图神经网络模型进行训练。
[0217]
可选地，所述识别模型通过如下模块训练：
[0218]
第三获取模块，被配置为获取多个样本用户中每个样本用户的用户基础特征、每个样本用户的关联用户、所述每个样本用户的关联应用程序；
[0219]
第三图谱构建模块，被配置为根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱；
[0220]
第一向量表征获得模块，被配置为将所述样本关系知识图谱输入所述图神经网络模型，获得所述每个样本用户的目标向量表征；
[0221]
第二训练模块，被配置为根据所述每个样本用户的用户基础特征以及所述所述每个样本用户的向量表征对所述识别模型进行训练。
[0222]
可选地，所述第一图谱构建模块704，进一步被配置为：
[0223]
将所述用户、所述用户的关联用户、所述用户的关联应用程序为节点，将所述用户与所述关联用户的关联关系、所述用户与所述关联应用程序的关联关系为边，根据所述节点和所述边构建关系知识图谱。
[0224]
本说明书实施例提供的所述目标用户识别装置为结合图谱的目标用户(即竞对人群)识别方案，充分利用关系数据构建的关系知识图谱，基于用户的从关联用户、关联应用程序的特征作为目标用户的缺失特征的补充，从而准确的识别出竞对人群。
[0225]
上述为本实施例的一种目标用户识别装置的示意性方案。需要说明的是，该目标用户识别装置的技术方案与上述的目标用户识别方法的技术方案属于同一构思，目标用户识别装置的技术方案未详细描述的细节内容，均可以参见上述目标用户识别方法的技术方案的描述。
[0226]
与上述方法实施例相对应，本说明书还提供了图神经网络模型训练装置实施例，图8示出了本说明书一个实施例提供的一种图神经网络模型训练装置的结构示意图。如图8所示，该装置包括：
[0227]
第四获取模块802，被配置为获取多个样本用户中每个样本用户的关联用户、所述每个样本用户的关联应用程序；
[0228]
第四图谱构建模块804，被配置为根据所述每个样本用户与所述每个样本用户的关联用户的关联关系，以及所述每个样本用户与所述每个样本用户的关联应用程序的关联关系，构建样本关系知识图谱，其中，样本关系知识图谱包括用户节点和程序节点；
[0229]
特征获得模块806，被配置为确定所述样本关系知识图谱中所述用户节点的特征矩阵、所述用户节点的每条边的关系矩阵、每个关系矩阵的权重矩阵以及所述用户节点与所述程序节点的交互特征；
[0230]
第三训练模块808，被配置为根据所述特征矩阵、所述关系矩阵、所述权重矩阵以
及所述交互特征对图神经网络模型进行训练，获得所述图神经网络模型。
[0231]
可选地，所述特征获得模块806，进一步被配置为：
[0232]
将所述每个样本用户、所述每个样本用户的关联用户作为所述样本关系知识图谱的所述用户节点，以及将所述每个样本用户的关联应用程序作为所述样本关系知识图谱的所述程序节点，并确定所述样本关系知识图谱中所述用户节点以及所述程序节点的特征矩阵；
[0233]
将所述每个样本用户与所述每个样本用户的关联用户形成的不同类型的边作为所述用户节点的边，并为所述用户节点的每条边配置不同的关系矩阵；
[0234]
通过注意力机制确定所述每个关系矩阵的权重矩阵；以及
[0235]
根据所述用户节点的特征矩阵、所述关系矩阵、所述权重矩阵以及以及所述程序节点的特征矩阵确定所述用户节点与所述程序节点的交互特征。
[0236]
可选地，所述特征获得模块806，进一步被配置为：
[0237]
根据所述用户节点的特征矩阵、所述关系矩阵以及所述权重矩阵通过第一聚合算法进行计算，获得所述用户节点的向量表征；
[0238]
根据所述程序节点的特征矩阵通过第二聚合算法进行计算，获得所述程序节点的向量表征；
[0239]
将所述用户节点的向量表征与所述程序节点的向量表征进行交互处理，获得所述用户节点与所述程序节点的交互特征。
[0240]
可选地，所述第三训练模块808，进一步被配置为：
[0241]
基于所述用户节点的向量表征、以及所述用户节点与所述程序节点的交互特征，获得所述每个样本用户的目标向量表征；
[0242]
确定所述多个样本用户中的有标签的样本用户和无标签的样本用户，根据所述有标签的样本用户的目标向量表征、所述无标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签对图神经网络模型进行训练，获得所述图神经网络模型。
[0243]
可选地，所述第三训练模块808，进一步被配置为：
[0244]
根据所述有标签的样本用户的目标向量表征以及所述有标签的样本用户的样本标签，获得有标签的样本的初始损失函数；
[0245]
确定与所述有标签的样本用户关联的无标签的样本用户、以及与所述有标签的样本用户无关联的无标签的样本用户；
[0246]
根据所述与所述有标签的样本用户关联的无标签的样本用户的目标向量表征、所述与所述有标签的样本用户无关联的无标签的样本用户的目标向量表征、所述有标签的样本用户的样本标签，获得无标签的样本的初始损失函数；
[0247]
根据所述有标签的样本的初始损失函数和所述无标签的样本的初始损失函数，获得图神经网络模型的目标损失函数，并基于所述每个样本用户的目标向量表征以及所述目标损失函数对所述图神经网络模型进行训练。
[0248]
本说明书实施例提供的图神经网络模型训练装置，通过定义不同关系的参数矩阵来区分两节点间的边的不同类型，并利用attention机制学习不同关系间的重要程度；在网络中加入用户
‑
app的交互信息，有目的地学习用户对不同app的偏好程度，以及设计网络的损失函数以有效地将无标签样本与有标签样本联合起来在全量样本中进行训练，获得更加
精确的图神经网络模型。
[0249]
上述为本实施例的一种图神经网络模型训练装置的示意性方案。需要说明的是，该图神经网络模型训练装置的技术方案与上述的图神经网络模型训练方法的技术方案属于同一构思，图神经网络模型训练装置的技术方案未详细描述的细节内容，均可以参见上述图神经网络模型训练方法的技术方案的描述。
[0250]
图9示出了根据本说明书一个实施例提供的一种计算设备900的结构框图。该计算设备900的部件包括但不限于存储器910和处理器920。处理器920与存储器910通过总线930相连接，数据库950用于保存数据。
[0251]
计算设备900还包括接入设备940，接入设备940使得计算设备900能够经由一个或多个网络960通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备940可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(nic))中的一个或多个，诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi
‑
max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口，等等。
[0252]
在本说明书的一个实施例中，计算设备900的上述部件以及图9中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图9所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。
[0253]
计算设备900可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或pc的静止计算设备。计算设备900还可以是移动式或静止式的服务器。
[0254]
其中，处理器920用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述目标用户识别方法或者图神经网络模型训练方法的步骤。
[0255]
上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的目标用户识别方法或者图神经网络模型训练方法方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述目标用户识别方法或者图神经网络模型训练方法法的技术方案的描述。
[0256]
本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，，该计算机可执行指令被处理器执行时实现上述目标用户识别方法或者图神经网络模型训练方法方法的步骤。
[0257]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的目标用户识别方法或者图神经网络模型训练方法方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述目标用户识别方法或者图神经网络模型训练方法方法的技术方案的描述。
[0258]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺
序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0259]
所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
[0260]
需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0261]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。
[0262]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

目标用户识别方法及装置与流程

相关文献

最热文献