基于图对比学习的用户筛选方法、装置、设备和存储介质与流程

2022-11-14 00:53:51 来源：中国专利 TAG：

1.本发明涉及用户筛选技术领域，特别涉及一种基于图对比学习的用户筛选方法、装置、设备和存储介质。

背景技术：

2.银行运营时，往往需要筛选出高价值用户，从而对这些高价值用户提供针对性的服务。传统方式是通过人工筛选的方式找出高价值用户，浪费了大量的人力成本，且人工筛选主观因素太强，不利于识别出真正的高价值用户。

技术实现要素：

3.针对上述现有技术的缺点，本发明提供一种基于图对比学习的用户筛选方法、装置、设备和存储介质，以便提高用户筛选的准确度。
4.本技术第一方面提供一种基于图对比学习的用户筛选方法，包括：
5.根据用户行为记录生成多个二元组；其中，所述二元组包括用户，金融产品和用户产品权重；所述用户产品权重根据所述用户对所述金融产品的行为确定；
6.利用所述多个二元组构建二部图网络；其中所述二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接所述第一节点与所述第二节点的边；所述边具有连接的第一节点和第二节点对应的所述用户产品权重；
7.以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；
8.利用所述训练好的图网络模型处理所述二部图网络，获得每一个所述第一节点的筛选指标；所述筛选指标作为筛选每一个所述第一节点表征的用户的依据。
9.可选的，所述根据用户行为记录生成多个二元组，包括：
10.针对每一个用户-产品组合，确定所述用户-产品组合对应的用户产品权重，将所述用户-产品组合中的用户和金融产品，以及所述用户-产品组合对应的用户产品权重组成所述用户-产品组合对应的二元组；
11.其中，确定所述用户-产品组合对应的用户产品权重的过程包括：
12.确定所述用户-产品组合中用户对金融产品的历史行为的行为类型和行为强度；
13.若行为类型为点击，所述行为强度小于第一停留阈值时，确定所述用户产品权重为第一权重；点击对应的行为强度为停留时长；
14.若行为类型为点击，所述行为强度大于或等于所述第一停留阈值且小于第二停留阈值时，确定所述用户产品权重为第二权重；所述第二权重大于所述第一权重；
15.若行为类型为点击，所述行为强度大于或等于所述第二停留阈值时，确定所述用户产品权重为第三权重；所述第三权重大于所述第二权重；
16.若行为类型为购买，根据对应的行为强度确定所述用户产品权重为大于所述第三权重的第四权重；所述第四权重和购买对应的行为强度正相关。
17.可选的，所述以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型，包括：
18.分别对所述二部图网络进行两次启发式数据增强，获得所述二部图网络对应的第一视图和第二视图；
19.利用所述图网络模型编码所述第一视图和所述第二视图，获得所述第一视图中各节点的第一表示向量，以及所述第二视图中各节点的第二表示向量；
20.利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值；其中，每一个样本包括一个所述第一表示向量和所述第二表示向量，包含的第一表示向量和第二表示向量对应于相同节点的样本为正向样本，包含的第一表示向量和第二表示向量对应于不同节点的样本为负向样本；
21.利用图网络模型编码所述二部图网络中的第一节点，获得所述第一节点的第三表示向量；
22.根据所述第三表示向量和预先标注的所述第一节点表征的用户的真实标签确定所述图网络模型的交叉熵损失值；
23.根据所述对比损失值和所述交叉熵损失值确定所述图网络模型的综合损失值；
24.根据所述图网络模型的综合损失值更新所述图网络模型的参数，直至所述综合损失值符合预设的综合收敛条件为止，获得训练好的图网络模型。
25.可选的，所述利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值，包括：
26.针对每一个样本，若所述样本为正向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度的相反数确定为所述样本的样本损失，若所述样本为负向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度确定为所述样本的样本损失；
27.将每一个所述样本的样本损失相加，获得所述图网络模型的对比损失。
28.本技术第二方面提供一种基于图对比学习的用户筛选装置，包括：
29.生成单元，用于根据用户行为记录生成多个二元组；其中，所述二元组包括用户，金融产品和用户产品权重；所述用户产品权重根据所述用户对所述金融产品的行为确定；
30.构建单元，用于利用所述多个二元组构建二部图网络；其中所述二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接所述第一节点与所述第二节点的边；所述边具有连接的第一节点和第二节点对应的所述用户产品权重；
31.训练单元，用于以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；
32.处理单元，用于利用所述训练好的图网络模型处理所述二部图网络，获得每一个所述第一节点的筛选指标；所述筛选指标作为筛选每一个所述第一节点表征的用户的依据。
33.可选的，所述生成单元根据用户行为记录生成多个二元组时，具体用于：
34.针对每一个用户-产品组合，确定所述用户-产品组合对应的用户产品权重，将所述用户-产品组合中的用户和金融产品，以及所述用户-产品组合对应的用户产品权重组成所述用户-产品组合对应的二元组；
35.其中，确定所述用户-产品组合对应的用户产品权重的过程包括：
36.确定所述用户-产品组合中用户对金融产品的历史行为的行为类型和行为强度；
37.若行为类型为点击，所述行为强度小于第一停留阈值时，确定所述用户产品权重为第一权重；点击对应的行为强度为停留时长；
38.若行为类型为点击，所述行为强度大于或等于所述第一停留阈值且小于第二停留阈值时，确定所述用户产品权重为第二权重；所述第二权重大于所述第一权重；
39.若行为类型为点击，所述行为强度大于或等于所述第二停留阈值时，确定所述用户产品权重为第三权重；所述第三权重大于所述第二权重；
40.若行为类型为购买，根据对应的行为强度确定所述用户产品权重为大于所述第三权重的第四权重；所述第四权重和购买对应的行为强度正相关。
41.可选的，所述训练单元以所述二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型时，具体用于：
42.分别对所述二部图网络进行两次启发式数据增强，获得所述二部图网络对应的第一视图和第二视图；
43.利用所述图网络模型编码所述第一视图和所述第二视图，获得所述第一视图中各节点的第一表示向量，以及所述第二视图中各节点的第二表示向量；
44.利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值；其中，每一个样本包括一个所述第一表示向量和所述第二表示向量，包含的第一表示向量和第二表示向量对应于相同节点的样本为正向样本，包含的第一表示向量和第二表示向量对应于不同节点的样本为负向样本；
45.利用图网络模型编码所述二部图网络中的第一节点，获得所述第一节点的第三表示向量；
46.根据所述第三表示向量和预先标注的所述第一节点表征的用户的真实标签确定所述图网络模型的交叉熵损失值；
47.根据所述对比损失值和所述交叉熵损失值确定所述图网络模型的综合损失值；
48.根据所述图网络模型的综合损失值更新所述图网络模型的参数，直至所述综合损失值符合预设的综合收敛条件为止，获得训练好的图网络模型。
49.可选的，所述训练单元利用所述第一表示向量和所述第二表示向量组成的多个样本计算得到所述图网络模型的对比损失值时，具体用于：
50.针对每一个样本，若所述样本为正向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度的相反数确定为所述样本的样本损失，若所述样本为负向样本，将所述样本包含的所述第一表示向量和所述第二表示向量的相似度确定为所述样本的样本损失；
51.将每一个所述样本的样本损失相加，获得所述图网络模型的对比损失。
52.本技术第三方面提供一种电子设备，包括存储器和处理器；
53.其中，所述存储器用于存储计算机程序；
54.所述处理器用于执行所述计算机程序，所述计算机程序被执行时，具体用于实现本技术第一方面任意一项所提供的基于图对比学习的用户筛选方法。
55.本技术第四方面提供一种计算机存储介质，用于存储计算机程序，所述计算机程
序被执行时，具体用于实现本技术第一方面任意一项所提供的基于图对比学习的用户筛选方法。
56.本技术提供一种基于图对比学习的用户筛选方法、装置、设备和存储介质，可应用于人工智能领域或金融领域，方法包括：根据用户行为记录生成多个二元组；其中，二元组包括用户，金融产品和用户产品权重；用户产品权重根据用户对金融产品的行为确定；利用多个二元组构建二部图网络；其中二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接第一节点与第二节点的边；边具有连接的第一节点和第二节点对应的用户产品权重；以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标；筛选指标作为筛选每一个第一节点表征的用户的依据。本方案通过构建二部图网络并利用图网络模型进行分析，自动确定每一用户的筛选指标，从而能够根据筛选指标自动筛选高价值用户。
附图说明
57.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
58.图1为本技术实施例提供的基于图对比学习的用户筛选方法的流程图；
59.图2为本技术实施例提供的基于图对比学习的用户筛选装置的示意图；
60.图3为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
61.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
62.图对比学习：在图学习领域，由于图数据存在缺少标签或难以标注的问题，研究者们将对比学习技术应用于图表示学习任务上，取得了十分不错的效果，这一系列算法研究称为图对比学习。
63.银行运营时，往往需要筛选出高价值用户，从而对这些高价值用户提供针对性的服务。传统方式是通过人工筛选的方式找出高价值用户，浪费了大量的人力成本，且人工筛选主观因素太强，不利于识别出真正的高价值用户。该发明以图对比学习为手段，智能且快捷地筛选识别出高价值用户，进而能够针对高价值用户，投放更多的人力来维持与用户之间的关系，实现银行利润最大化。
64.针对上述问题，本技术建立一种基于图对比学习的高价值用户方法。该方法通过用户与金融产品的行为数据，建立二部图网络，其中网络节点包括用户节点，及金融产品节点，网络的边连接着用户节点与金融产品节点，并根据行为类型及行为强度计算边权重，用于衡量用户对不同金融产品的偏好程度；然后利用graphsage图网络模型编码得到图节点
的表示向量，并与用户真实标签做比较计算交叉熵损失函数值；基于对比学习对二部图进行两次启发式数据增强，例如随机加减边，随机删除节点等，得到图网络的两个视图，再次利用图网络模型分别编码得到两个视图中节点的表示向量，并计算对比学习infonce损失函数值；最后加权融合交叉熵损失函数值与infonce损失函数值，得到最终损失函数值，进而更新图网络模型参数，利用训练好的图网络模型预测用户的价值，智能且快捷地筛选识别出高价值用户，并针对这些高价值用户，制定相应的策略实现银行利润最大化。
65.graphsage图网络模型是一种现有的图神经网络算法(或者说图神经网络模型)，该算法的具体工作原理可以参见相关的现有技术文献，不再赘述。
66.infonce损失函数是对比学习领域现有的一种损失函数，其具体定义和表达式可以参见相关的现有技术文献，不再赘述。
67.本方案主要包括如下模块：
68.日志收集及处理模块：根据银行客户端行为日志，获取客户对金融产品的行为数据，其中金融产品包括理财、基金、保险等，并处理成二元组“用户—金融产品—权重”，其中权重是根据行为类型及行为强度计算，例如点击不购买但停留时长小于5秒时权重为0.1、点击不购买但停留时长小于1分钟时权重为1、点击不购买但停留时长大于1分钟时权重为2、点击并购买时权重为3，且可以根据用户购买金额，权重可适当上浮。
69.用户—产品二部图构建模块：根据预处理得到的用户产品二元组，建立二部图网络，其中网络节点包括用户节点，及金融产品节点，网络的边连接着用户节点与金融产品节点，边权重即是二元组中的权重值，用于衡量用户对不同金融产品的偏好程度。
70.图节点表示模块：利用graphsage图网络模型编码得到图节点的表示向量，模型聚合函数采用的是平均池化聚合函数，聚合层数采用两层，并与用户真实标签做比较计算交叉熵损失函数值。
71.图节点无监督对比模块：基于对比学习对二部图进行两次启发式数据增强，例如随机加减边，随机删除节点等，得到图网络的两个视图，再次利用graphsage图网络模型分别编码得到两个视图中节点的表示向量，每一个训练批次内共有2n个视图节点表示向量，定义来源于同一个图节点的互为正样本，否则互为负样本，根据正负样本计算infonce损失函数值。
72.高价值用户识别模块：加权融合交叉熵损失函数值与infonce损失函数值，得到最终损失函数值，进而更新图网络模型参数，利用训练好的图网络模型预测用户的价值，智能且快捷地筛选识别出高价值用户，并针对这些高价值用户，制定相应的策略实现银行利润最大化。
73.下面结合附图对本发明的技术方案进行进一步说明。
74.请参见图1，为本技术实施例提供的一种基于图对比学习的用户筛选方法的示意图，该方法可以包括以下步骤。
75.s101，根据用户行为记录生成多个二元组。
76.其中，二元组包括用户，金融产品和用户产品权重；用户产品权重根据用户对金融产品的行为确定。
77.在步骤s101中，可以先收集在银行系统中注册的多个用户，然后针对每一个用户，如果一款金融产品对应的产品链接曾经被推送给该用户，就将该用户和该金融产品确定为
一个用户-产品组合。
78.示例性的，对于银行系统注册的用户甲，过去一周内曾向用户甲的客户端推送过金融产品a和金融产品b的产品链接，那么可以确定出一个(用户甲，金融产品a)的用户-产品组合，以及一个(用户甲，金融产品b)的用户-产品组合。
79.在确定了上述用户-产品组合的基础上，根据用户行为记录生成多个二元组，可以包括：
80.针对每一个用户-产品组合，确定用户-产品组合对应的用户产品权重，将用户-产品组合中的用户和金融产品，以及用户-产品组合对应的用户产品权重组成用户-产品组合对应的二元组；
81.其中，确定用户-产品组合对应的用户产品权重的过程包括：
82.确定用户-产品组合中用户对金融产品的历史行为的行为类型和行为强度；
83.对于一个用户-产品组合，用户可能不对其中的金融产品的产品链接采取任何交互行为，这种情况则删除该组合，不生成该组合对应的二元组，如果用户对其中的金融产品的产品链接采取交互行为，则该交互行为的行为类型可能是点击和交易两种。
84.若行为类型为点击，行为强度小于第一停留阈值时，确定用户产品权重为第一权重；点击对应的行为强度为停留时长；
85.对于一个用户-产品组合，若行为类型是点击，说明该用户点击了该金融产品的产品链接，这种情况下客户端会显示该金融产品的详情页面，上述停留时长，相当于该金融产品的详情页面在客户端显示的时长。
86.停留时长可以在用户点击产品链接后开始计时，在用户主动退出详情页面时停止计时。
87.若行为类型为点击，行为强度大于或等于第一停留阈值且小于第二停留阈值时，确定用户产品权重为第二权重；第二权重大于第一权重；
88.若行为类型为点击，行为强度大于或等于第二停留阈值时，确定用户产品权重为第三权重；第三权重大于第二权重；
89.若行为类型为购买，根据对应的行为强度确定用户产品权重为大于第三权重的第四权重；第四权重和购买对应的行为强度正相关。
90.需要说明，购买是指点击产品链接并购买，也就是说在用户点击产品链接后，不论经过多长时间，只要最后该用户购买了该款金融产品，就将本次的交互行为的行为类型确定为购买。
91.购买对应的行为强度可以定义为用户购买金融产品的额度，例如用户购买了多少元的金融产品。
92.以上阈值和权重均可以根据需要预先设定。示例性的，第一停留阈值可以是5秒，第一权重可以是0.1；第二停留时长可以是1分钟，第二权重可以为1；第三权重可以为2；第四权重则根据购买的额度确定，作为例子，初始的第四权重可以是3，若购买的额度大于1万，则第四权重可以为4，若购买的额度大于10万，则第四权重可以为5，以此类推。
93.s102，利用多个二元组构建二部图网络。
94.其中，二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接第一节点与第二节点的边；边具有连接的第一节点和第二节点对应的用户产品权重。
95.具体的，在步骤s102中可以先生成多个二元组中包含的每一个用户对应的第一节点，然后生成其中每一个金融产品对应的第二节点，最后，遍历每一个二元组，每遍历到一个二元组，就在该二元组包含的用户对应的第一节点，以及该二元组包含的金融产品对应的第二节点之间增加一条边，在将该二元组包含的用户产品权重配置给这条边，在遍历完全部二元组后，就完成了上述二部图网络的构建。
96.s103，以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型。
97.可选的，以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型的具体过程可以包括：
98.b1，分别对二部图网络进行两次启发式数据增强，获得二部图网络对应的第一视图和第二视图。
99.启发式数据增强，具体可以是对二部图网络中的节点和边进行随机加减，即随机新增边或者节点，以及随机删除原有的边或者节点。其中新增的边的权重可以是前述最低的第一权重。
100.b2，利用图网络模型编码第一视图和第二视图，获得第一视图中各节点的第一表示向量，以及第二视图中各节点的第二表示向量。
101.这里的图网络模型具体可以是前述graphsage图网络模型，graphsage图网络模型的具体架构，以及利用graphsage图网络模型编码二部图网络的第一视图和第二视图的具体方法可以参见相关的现有技术文献，此处不再赘述。
102.可选的，该图网络模型的模型聚合函数采用的可以是平均池化聚合函数，模型中的聚合层数采用两层，
103.需要说明，步骤b2中，第一节点和第二节点都会编码得到对应的第一表示向量和第二表示向量。
104.b3，利用第一表示向量和第二表示向量组成的多个样本计算得到图网络模型的对比损失值。
105.其中，每一个样本包括一个第一表示向量和第二表示向量，包含的第一表示向量和第二表示向量对应于相同节点的样本为正向样本，包含的第一表示向量和第二表示向量对应于不同节点的样本为负向样本。
106.上述对比损失值，具体可以是利用前述infonce损失函数计算得到的函数值。
107.可选的，利用第一表示向量和第二表示向量组成的多个样本计算得到图网络模型的对比损失值，可以包括：
108.针对每一个样本，若样本为正向样本，将样本包含的第一表示向量和第二表示向量的相似度的相反数确定为样本的样本损失，若样本为负向样本，将样本包含的第一表示向量和第二表示向量的相似度确定为样本的样本损失；
109.将每一个样本的样本损失相加，获得图网络模型的对比损失。
110.相似度的相反数，也就是在相似度前面加上负号得到的数值，相当于负相似度。比如相似度为20％，则相似度的相反数就是-20％。
111.也就是说，对于正向样本，其中包含的第一表示向量和第二表示向量越相近，则该正向样本的样本损失越小，对于负向样本，其中包含的第一表示向量和第二表示向量越不
相似，则该负向样本的样本损失越小。
112.b4，利用图网络模型编码二部图网络中的第一节点，获得第一节点的第三表示向量。
113.如前所述，这里的图网络模型具体可以是前述graphsage图网络模型，graphsage图网络模型的具体架构，以及利用graphsage图网络模型编码二部图网络的第一视图和第二视图的具体方法可以参见相关的现有技术文献，此处不再赘述。
114.b5，根据第三表示向量和预先标注的第一节点表征的用户的真实标签确定图网络模型的交叉熵损失值。
115.用户的真实标签，可以是预先对每个用户的用户信息，包括最近一段时间，例如最近1年的收入流水，用户的资产信息，用户当前持有的金融产品的数量、种类，持有时长，以及用户的个人信息(如年龄，工作)等进行分析而确定。
116.在步骤b5中，交叉熵损失值可以根据每一个用户的第三表示向量和真实标签之间的差异确定，第三表示向量和真实标签之间的差异越大，则交叉熵损失值越大，反之则越小。交叉熵损失值的具体计算方法可以参见有关的现有技术文献，不再赘述。
117.b6，根据对比损失值和交叉熵损失值确定图网络模型的综合损失值。
118.可选的，可以将对比损失值和交叉熵损失值相加得到综合损失值，或者可以将两者按一定权重相加得到综合损失值。
119.b7，根据图网络模型的综合损失值更新图网络模型的参数，直至综合损失值符合预设的综合收敛条件为止，获得训练好的图网络模型。
120.在步骤b7中，综合收敛条件可以是综合损失值小于或等于预设的收敛阈值。若不满足综合收敛条件，可以根据综合损失值更新图网络模型的参数，然后返回步骤b1，重复步骤b1至b7的过程，直至综合损失值满足综合收敛条件为止。
121.s104，利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标。
122.筛选指标作为筛选每一个第一节点表征的用户的依据。筛选指标具体可以是每一个用户的用户价值。
123.在获得每个用户的筛选指标后，在s104中，可以将筛选指标高于一定指标阈值的用户确定为高价值用户，也可以按筛选指标从高到低选取n个用户作为高价值用户，本实施例对具体的筛选方式不做限定。
124.本技术提供一种基于图对比学习的用户筛选方法，可应用于人工智能领域或金融领域，方法包括：根据用户行为记录生成多个二元组；其中，二元组包括用户，金融产品和用户产品权重；用户产品权重根据用户对金融产品的行为确定；利用多个二元组构建二部图网络；其中二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接第一节点与第二节点的边；边具有连接的第一节点和第二节点对应的用户产品权重；以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标；筛选指标作为筛选每一个第一节点表征的用户的依据。本方案通过构建二部图网络并利用图网络模型进行分析，自动确定每一用户的筛选指标，从而能够根据筛选指标自动筛选高价值用户。
125.根据本技术实施例提供的基于图对比学习的用户筛选方法，本技术实施例还提供一种基于图对比学习的用户筛选装置，请参见图2，该装置可以包括以下单元。
126.生成单元201，用于根据用户行为记录生成多个二元组。其中，二元组包括用户，金融产品和用户产品权重；用户产品权重根据用户对金融产品的行为确定。
127.构建单元202，用于利用多个二元组构建二部图网络。
128.其中二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接第一节点与第二节点的边；边具有连接的第一节点和第二节点对应的用户产品权重。
129.训练单元203，用于以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型。
130.处理单元204，用于利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标；筛选指标作为筛选每一个第一节点表征的用户的依据。
131.可选的，生成单元201根据用户行为记录生成多个二元组时，具体用于：
132.针对每一个用户-产品组合，确定用户-产品组合对应的用户产品权重，将用户-产品组合中的用户和金融产品，以及用户-产品组合对应的用户产品权重组成用户-产品组合对应的二元组；
133.其中，确定用户-产品组合对应的用户产品权重的过程包括：
134.确定用户-产品组合中用户对金融产品的历史行为的行为类型和行为强度；
135.若行为类型为点击，行为强度小于第一停留阈值时，确定用户产品权重为第一权重；点击对应的行为强度为停留时长；
136.若行为类型为点击，行为强度大于或等于第一停留阈值且小于第二停留阈值时，确定用户产品权重为第二权重；第二权重大于第一权重；
137.若行为类型为点击，行为强度大于或等于第二停留阈值时，确定用户产品权重为第三权重；第三权重大于第二权重；
138.若行为类型为购买，根据对应的行为强度确定用户产品权重为大于第三权重的第四权重；第四权重和购买对应的行为强度正相关。
139.可选的，训练单元203以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型时，具体用于：
140.分别对二部图网络进行两次启发式数据增强，获得二部图网络对应的第一视图和第二视图；
141.利用图网络模型编码第一视图和第二视图，获得第一视图中各节点的第一表示向量，以及第二视图中各节点的第二表示向量；
142.利用第一表示向量和第二表示向量组成的多个样本计算得到图网络模型的对比损失值；其中，每一个样本包括一个第一表示向量和第二表示向量，包含的第一表示向量和第二表示向量对应于相同节点的样本为正向样本，包含的第一表示向量和第二表示向量对应于不同节点的样本为负向样本；
143.利用图网络模型编码二部图网络中的第一节点，获得第一节点的第三表示向量；
144.根据第三表示向量和预先标注的第一节点表征的用户的真实标签确定图网络模型的交叉熵损失值；
145.根据对比损失值和交叉熵损失值确定图网络模型的综合损失值；
146.根据图网络模型的综合损失值更新图网络模型的参数，直至综合损失值符合预设的综合收敛条件为止，获得训练好的图网络模型。
147.可选的，训练单元203利用第一表示向量和第二表示向量组成的多个样本计算得到图网络模型的对比损失值时，具体用于：
148.针对每一个样本，若样本为正向样本，将样本包含的第一表示向量和第二表示向量的相似度的相反数确定为样本的样本损失，若样本为负向样本，将样本包含的第一表示向量和第二表示向量的相似度确定为样本的样本损失；
149.将每一个样本的样本损失相加，获得图网络模型的对比损失。
150.本实施例提供的基于图对比学习的用户筛选装置，其具体工作原理可以参见本技术任一实施例提供的基于图对比学习的用户筛选方法中的相关步骤，此处不再赘述。
151.本技术提供一种基于图对比学习的用户筛选装置，可应用于人工智能领域或金融领域，装置包括：生成单元201根据用户行为记录生成多个二元组；其中，二元组包括用户，金融产品和用户产品权重；用户产品权重根据用户对金融产品的行为确定；构建单元202利用多个二元组构建二部图网络；其中二部图网络包括表征用户的第一节点，表征金融产品的第二节点和连接第一节点与第二节点的边；边具有连接的第一节点和第二节点对应的用户产品权重；训练单元203以二部图网络作为输入，基于有监督学习方法和无监督对比学习方法训练图网络模型，获得训练好的图网络模型；处理单元204利用训练好的图网络模型处理二部图网络，获得每一个第一节点的筛选指标；筛选指标作为筛选每一个第一节点表征的用户的依据。本方案通过构建二部图网络并利用图网络模型进行分析，自动确定每一用户的筛选指标，从而能够根据筛选指标自动筛选高价值用户。
152.本技术实施例还提供一种电子设备，请参见图3，包括存储器301和处理器302。
153.其中，存储器301用于存储计算机程序。
154.处理器302用于执行计算机程序，计算机程序被执行时，具体用于实现本技术任一实施例所提供的基于图对比学习的用户筛选方法。
155.本技术实施例还提供一种计算机存储介质，用于存储计算机程序，计算机程序被执行时，具体用于实现本技术任一实施例所提供的基于图对比学习的用户筛选方法。
156.需要说明的是，本发明提供的基于图对比学习的用户筛选方法、装置、设备和存储介质可用于人工智能领域或金融领域。上述仅为示例，并不对本发明提供的基于图对比学习的用户筛选方法、装置、设备和存储介质的应用领域进行限定。
157.最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
158.需要注意，本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
159.专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业
技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种机器学习中的针对属性推理攻击的防御方法与流程

基于图对比学习的用户筛选方法、装置、设备和存储介质与流程

相关文献

最热文献