信息推送方法、装置、计算机设备和存储介质与流程

2021-11-20 02:43:00 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，特别是涉及一种信息推送方法、装置、计算机设备和存储介质。

背景技术：

2.在传统的互联网技术中，网站或者应用程序会向用户推荐一些用户可能感兴趣的信息，以使用户能够快速从推荐信息中找到自身需要的信息，比如，购物网站会推荐商品给用户，资讯网站会推荐资讯给用户，视频、音乐、书籍等资源网站会推送资源给用户，社交网站会推送社交账号、feed流信息给用户。
3.但是，在传统的互联网技术中，一般是根据用户搜索或者浏览的信息，确定与用户搜索或者浏览的信息相似的信息，并将相似的信息推荐给用户，导致推荐信息不准确。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种能够提高推荐信息的准确性的信息推送方法、装置、计算机设备和存储介质。
5.一种信息推送方法，方法包括：
6.获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；
7.根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；
8.根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
9.一种信息推送装置，装置包括：
10.获取模块，用于获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；
11.生成模块，用于根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；
12.确定模块，用于根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
13.一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现以下步骤：
14.获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；
15.根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；
16.根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
17.一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：
18.获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；
19.根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；
20.根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
21.上述信息推送方法、装置、计算机设备和存储介质，获取目标用户标识的资源转移序列信息，根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识，其中，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的，这样，将目标用户标识的历史资源转移记录形成资源转移序列信息，进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量，使得资源转移标签向量可准确表达目标用户标识的资源转移行为，并根据资源转移标签向量确定目标用户标识的推荐信息，从而提高了推荐信息的准确性。
附图说明
22.图1为一个实施例中信息推送方法的应用环境图；
23.图2为一个实施例中信息推送方法的流程示意图；
24.图3为一个实施例中获取带权有向图的示意图；
25.图4为一个实施例中获取第一样本资源转移序列信息的示意图；
26.图5为一个实施例中随机游走的示意图；
27.图6为一个实施例中词向量计算模型的训练结果的示意图；
28.图7为一个实施例中词向量计算模型的训练效果的示意图；
29.图8为一个实施例中获取目标推荐信息的流程示意图
30.图9为另一个实施例中信息推送方法的流程示意图；
31.图10为一个实施例中信息推送装置的结构框图；
32.图11为一个实施例中计算机设备的内部结构图。
具体实施方式
33.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
34.本技术提供的信息推送方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。服务器104获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；接着，服务器104根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；接着，服务器104根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识对应的终端102。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
35.在一个实施例中，如图2所示，提供了一种信息推送方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：
36.步骤202，获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的。
37.其中，目标用户标识是指待进行信息推荐的用户标识。目标用户标识用于唯一表示目标用户身份。目标用户标识可为目标用户的身份证号码、护照号码、驾驶证号码、手机号码、应用程序账号等。
38.资源转移序列信息用于描述目标用户标识的历史资源转移记录。资源转移是指以预定数值的资源作为输入，通过交换模型处理，输出对应的资源的过程。资源可为目标用户标识所对应的资产等。序列信息是指按照预设规则排列目标信息，该目标信息可从历史资源转移记录中获取得到，该预设规则可为时间顺序，比如按照时间由远至近排列目标信息，或者按照时间由近至远排列目标信息。
39.在一个实施例中，获取目标用户标识在预设时间段内的历史资源转移记录，根据目标用户标识在预设时间段内的历史资源转移记录，生成目标用户标识的资源转移序列信息。预设时间段可为7天、1个月、6个月、12个月等。
40.在一个实施例中，服务器获取目标用户标识的资源转移序列信息。
41.步骤204，根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
42.其中，词向量计算模型是用于产生词向量的相关模型，词向量是词语被映射到实数的向量。词向量计算模型通过语料库中的句子序列来描述词与词的共现关系，进而学习到词语的向量表示。可选地，若至少两个词语的上下文意思相近，通过词向量计算模型产生的词向量，其向量距离也是相近的。在一个实施例中，词向量计算模型可为word2vec模型。
43.资源转移标签向量用于表征目标用户标识的资源转移行为，资源转移行为可体现目标用户标识的资源转移偏好、资源转移能力等特征。可选地，若至少两个用户标识的资源
转移行为相似，通过词向量计算模型产生的资源转移标签向量，其向量距离也是相近的。
44.第一样本资源转移序列信息用于对词向量计算模型进行训练，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
45.在一个实施例中，获取各个样本用户标识在预定时间段内的历史资源转移记录，根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息，根据各个样本用户标识的第二样本资源转移序列信息，确定第一样本资源转移序列信息。其中，第二样本资源转移序列信息用于描述样本用户标识的历史资源转移记录，预定时间段可为7天、1个月等。
46.在一个实施例中，服务器根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量。
47.步骤206，根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
48.其中，目标推荐信息可以是金融网站的产品、购物网站的商品，资讯网站的资讯，视频、音乐、书籍等资源网站的资源，社交网站的社交账号、feed流信息等。
49.在一个实施例中，可预先设置多个用户类别，并预先设置各个用户类别对应的预设资源转移标签向量以及推荐信息。当获取到目标用户标识的资源转移标签向量时，获取目标用户标识的资源转移标签向量与各个预设资源转移标签向量之间的向量距离，并将向量距离满足预设条件的预设资源转移标签向量所对应的推荐信息，作为目标推荐信息推送给目标用户标识。其中，预设条件可以是向量距离最短。
50.在一个实施例中，根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
51.上述信息推送方法中，获取目标用户标识的资源转移序列信息，根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识，其中，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的，这样，将目标用户标识的历史资源转移记录形成资源转移序列信息，进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量，使得资源转移标签向量可准确表达目标用户标识的资源转移行为，并根据资源转移标签向量确定目标用户标识的推荐信息，从而提高了推荐信息的准确性。
52.在一个实施例中，获取目标用户标识的资源转移序列信息，包括：获取目标用户标识在预设时间段内的历史资源转移记录；从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的资源转移序列信息。
53.其中，预设时间段可为7天、1个月、6个月、12个月等。第一关键词可为目标用户标识在预设时间段内的历史资源转移记录中的接收方标识，比如，一条历史资源转移记录为“某某便利店-消费5元”，第一关键词可为“某某便利店”。
54.在一个实施例中，从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词的方式可以是：从目标用户标识在预设时间段内的历史资源转移记录中获取接收
方标识。
55.在一个实施例中，由于历史资源转移记录中携带有资源转移时间，可按照资源转移时间对第一关键词进行排列，得到目标用户标识的资源转移序列信息。具体地，按照资源转移时间由远至近，或者资源转移时间由近至远，对第一关键词进行排列，得到目标用户标识的资源转移序列信息。
56.比如，目标用户标识在预设时间段内的历史资源转移记录为：第一时间点在m资源转移第一数值，第二时间点在n资源转移第二数值，第三时间点在j资源转移第三数值，第四时间点在k资源转移第四数值。第一时间点、第二时间点、第三时间点以及第四时间点的顺序为由远至近，目标用户标识的资源转移序列信息可为：m
→
n
→
j
→
k。
57.本实施例中，获取目标用户标识在预设时间段内的历史资源转移记录，从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的资源转移序列信息，这样，将目标用户标识的历史资源转移记录形成资源转移序列信息，不仅剔除了无效信息，并且保留了历史资源转移记录的关联性。
58.在一个实施例中，第一样本资源转移序列信息的生成方式，包括：获取各个样本用户标识在预定时间段内的历史资源转移记录；根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息；根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息。
59.其中，预定时间段可为7天、1个月等。第二样本资源转移序列信息用于描述样本用户标识的历史资源转移记录。
60.在一个实施例中，根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息，包括：对各个样本用户标识的第二样本资源转移序列信息进行随机抽样，得到第一样本资源转移序列信息。
61.本实施例中，获取各个样本用户标识在预定时间段内的历史资源转移记录，根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息，根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息，这样，使得第一样本资源转移序列信息可充分表达样本用户标识的历史资源转移记录的关联性，进而提升对词向量计算模型训练的准确性。
62.在一个实施例中，根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息，包括：从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息。
63.其中，预定时间段可根据实际应用进行设定，比如7天、14天等。第二关键词可为样本用户标识在预定时间段内的历史资源转移记录中的接收方标识，比如，一条历史资源转移记录为“某某餐厅-消费200元”，第二关键词可为“某某餐厅”。
64.在一个实施例中，从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词的方式可以是：从样本用户标识在预定时间段内的历史资源转移记录中获取接收方标识。
65.在一个实施例中，由于历史资源转移记录中携带有资源转移时间，可按照资源转
移时间对第二关键词进行排列，得到样本用户标识的第二样本资源转移序列信息。具体地，按照资源转移时间由远至近，或者资源转移时间由近至远，对第二关键词进行排列，得到样本用户标识的第二样本资源转移序列信息。
66.比如，样本用户标识在预定时间段内的历史资源转移记录为：第一时间点在p资源转移第一数值；第二时间点在o资源转移第二数值；第三时间点在y资源转移第三数值；第四时间点在u资源转移第四数值。第一时间点、第二时间点、第三时间点以及第四时间点的顺序为由远至近，样本用户标识的第二样本资源转移序列信息为：p
→
o
→
y
→
u。
67.本实施例中，从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息，这样，将样本用户标识的历史资源转移记录形成资源转移序列信息，不仅剔除了无效信息，并且保留了历史资源转移记录的关联性。
68.在一个实施例中，根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息，包括：根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图；对带权有向图进行随机游走，得到第一样本资源转移序列信息。
69.其中，带权有向图包括至少两个节点，且至少两个节点之间具有指向以及连接权重。随机游走是从当前访问节点出发，从其邻居中随机采样节点作为下一访问节点。
70.在一个实施例中，根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图，包括：将各个样本用户标识的第二样本资源转移序列信息中的第二关键词作为节点，根据各个样本用户标识的第二样本资源转移序列信息中的第二关键词之间的指向，将各个样本用户标识的第二关键词进行连接，生成带权有向图，其中，带权有向图中的各个节点之间的指向，为各个样本用户标识的第二关键词之间的指向的并集，带权有向图中的各个节点之间的连接权重，可根据各个样本用户标识的第二关键词之间的指向次数确定，比如各个样本用户标识的第二关键词之间的指向次数之和。
71.比如，如图3所示，以样本用户标识包括样本用户标识1、样本用户标识2、样本用户标识3为例，样本用户标识1的第二样本资源转移序列信息是由第二关键词e、d、c、b构成，且e、d、c、b的指向为：e
→
d
→
c
→
b；样本用户标识2的第二样本资源转移序列是由第二关键词e、b、c构成，且e、b、c的指向为：e
→
b
→
c；样本用户标识3的第二样本资源转移序列是由c、f、e、a、f构成，且c、f、e、a、f的指向为：c
→
f
→
e
→
a
→
f。将e、d、c、b、f、a作为节点，根据样本用户标识1、样本用户标识2、样本用户标识3的第二样本资源转移序列信息中的第二关键词之间的指向，将e、d、c、b、f、a进行连接，生成带权有向图。其中，在样本用户标识1的第二样本资源转移序列中存在c
→
b，在样本用户标识2的第二样本资源转移序列中存在b
→
c，因此带权有向图中b、c之间的指向为b
←→
c；在样本用户标识2的第二样本资源转移序列中存在e
→
b，且样本用户标识1、样本用户标识3的第二样本资源转移序列信息中，均不存在e
→
b，因此带权有向图中e、b之间的指向为e
→
b；在样本用户标识1的第二样本资源转移序列中存在c
→
b，在样本用户标识2的第二样本资源转移序列中存在b
→
c，因此带权有向图中b
←→
c的连接权重为2；在样本用户标识1的第二样本资源转移序列中存在f
→
d，且样本用户标识2、样本用户标识3的第二样本资源转移序列信息中，均不存在f
→
d，因此带权有向图中f
→
d的连接权重为1。
72.在一个实施例中，对带权有向图进行随机游走，得到第一样本资源转移序列信息，
包括：根据deepwalk算法进行随机游走，在带权有向图中对节点进行采样，根据采样得到的节点生成第一样本资源转移序列信息。具体地，给定当前访问起始节点，从其邻居中随机采样节点作为下一个访问节点，重复此过程，直到访问序列长度满足预定条件，得到第一样本资源转移序列信息。可以理解，随机游走的流向与带权有向图中的节点之间的指向一致。
73.比如，如图4所示，以设定访问序列长度为5个节点为例，第一轮随机游走结果为：e
→
b
→
c
→
f
→
d，第二轮随机游走结果为：a
→
f
→
d
→
c
→
b，第三轮随机游走结果为：f
→
e
→
b
→
c
→
f，以上随机游走结果均为第一样本资源转移序列信息。
74.本实施例中，根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图，对带权有向图进行随机游走，得到第一样本资源转移序列信息，这样，对各个样本用户标识的第二样本资源转移序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本资源转移序列信息，从而完成对样本序列的随机抽样，避免了资源转移标签的头部效应问题以及重复信息问题。
75.在一个实施例中，对带权有向图进行随机游走，得到第一样本资源转移序列信息，包括：获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定；根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息。
76.其中，游走概率用于描述由当前访问节点游走至下一访问节点的概率。
77.在一个实施例中，可通过node2vec算法进行随机游走。比如，如图5所示，带权有向图包括t、v、x1、x2、x3五个节点，若已采样了t、v两个节点，即当前访问节点为v，那么下一访问节点是x1、x2或者x3，由v与x1、x2、x3之间的游走概率确定。节点之间的游走概率可由如下公式进行计算：
[0078][0079][0080]
其中，π
vx
为两个节点之间的游走概率；为两个节点之间的基础游走概率，如果d
tx
＝0，即t与x相等，那么采样x的概率为1/p，如果d
tx
＝1，即t与x相连，那么采样x的概率1，如果d
tx
＝2，即t与x不相连，那么采样x概率为1/q；ln(t
vx
)为边权重，t
vx
为节点v与节点x1、x2、x3之间的连接权重；p为返回概率，q为出入参数。
[0081]
对于返回概率p，若p＞max(q,1)，那么采样倾向于往前走，即下一个访问节点可能不会是节点t，若p＜min(q,1)，那么采样倾向于往回走，即下一个访问节点可能会是节点t。对于出入参数，若q＞1，那么采样倾向于在节点周围进行，若q＜1，那么采样倾向于远离节点进行。
[0082]
本实施例中，获取带权有向图中的节点之间的游走概率，根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息，这样，提高了对样本序列进行随机抽样的准确性。
[0083]
在一个实施例中，第一样本资源转移序列信息的生成方式，包括：获取各个样本用
户标识在预定时间段内的历史资源转移记录；从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息；根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图，获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定，根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息。
[0084]
具体地，由于资源转移行为频发，样本用户标识的历史资源转移记录数量庞大；并且，在样本用户标识的历史资源转移记录中，资源转移标签的头部效应明显；另外，在样本用户标识的历史资源转移记录中，有大量的重复信息。
[0085]
本实施例中，根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息，剔除了无效信息，并且保留了历史资源转移记录的关联性，提高了词向量计算模型的训练效率以及准确性；接着，对各个样本用户标识的第二样本资源转移序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本资源转移序列信息，从而完成对样本序列的随机抽样，避免了资源转移标签的头部效应问题以及重复信息问题。
[0086]
在一个实施例中，词向量计算模型的训练方式，包括：获取第一样本资源转移序列信息以及预设文本信息；根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型。
[0087]
其中，预设文本信息可为新闻文本信息、资讯文本信息、文学文本信息等。在一个实施例中，预设文本信息可从多个渠道获取得到，比如网站、应用程序等。可选地，预设文本信息可从视频中获取得到，将视频的语音信息转化为文本信息，得到预设文本信息。
[0088]
具体地，由于资源转移存在地域限制，第一样本资源转移序列信息缺乏常识信息，比如北京、上海的共线序列概率较低，而在预设文本信息中，可得到“北京、上海、深圳、广州作为一线城市”这样的信息，从而可消除第一样本资源转移序列信息存在的信息缺陷问题。
[0089]
如图6所示，当根据第一样本资源转移序列信息以及预设文本信息，对词向量计算模型进行训练后，可通过词向量计算模型确定词语的向量表示。如图7所示，根据“医院”、“酒店”、“汽车”这3类相关的2000多个标签进行t-sne(t-distributed stochastic neighbor embedding)算法降维，可以看出，结合预设文本信息进行训练，所得到的标签的类间距离更大，类内距离更小，训练效果更好。
[0090]
本实施例中，获取第一样本资源转移序列信息以及预设文本信息，根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型，这样，引入预设文本信息，消除了第一样本资源转移序列信息存在的信息缺陷问题。
[0091]
在一个实施例中，根据目标用户标识的资源转移标签向量确定目标推荐信息的方式，包括：根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息，第一推荐模型是根据样本资源转移标签向量训练得到的。
[0092]
其中，第一推荐模型用于根据输入的资源转移标签向量，输出目标推荐信息。样本资源转移标签向量用于对第一推荐模型进行训练。
[0093]
在一个实施例中，第一推荐模型可为逻辑回归模型、树模型、深度学习模型等。可选地，第一推荐模型的训练方式为：根据标记信息对样本资源转移标签向量进行标记，将标记后的样本资源转移标签向量输入第一推荐模型，得到第一推荐模型输出的预测信息，根
据标记信息与预测信息之间的差异，更新第一推荐模型的参数，直至满足训练停止条件时，结束训练。
[0094]
本实施例中，根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息，这样，实现对目标用户标识的精准推荐。
[0095]
在一个实施例中，如图8所示，根据目标用户标识的资源转移标签向量确定目标推荐信息的方式，包括：
[0096]
步骤802，获取目标用户标识的属性信息。
[0097]
其中，属性信息可包括资产信息、身份信息等。资产信息可以包括：收入、固定资产等；身份信息可以包括：年龄、性别、地域、学历等。
[0098]
步骤804，根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型，确定目标推荐信息，第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
[0099]
其中，第二推荐模型用于根据输入的属性信息以及资源转移标签向量，输出目标推荐信息。
[0100]
在一个实施例中，第二推荐模型可为逻辑回归模型、树模型、深度学习模型等。可选地，第二推荐模型的训练方式为：根据标记信息对样本属性信息以及样本资源转移标签向量进行标记，将标记后的样本属性信息以及样本资源转移标签向量输入第二推荐模型，得到第二推荐模型输出的预测信息，根据标记信息与预测信息之间的差异，更新第二推荐模型的参数，直至满足训练停止条件时，结束训练。
[0101]
本实施例中，获取目标用户标识的属性信息；根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型，确定目标推荐信息，这样，提高了对目标用户标识推荐的精准度。
[0102]
本技术还提供一种应用场景，该应用场景应用上述的信息推送方法。具体地，该信息推送方法在该应用场景的应用如下：对目标用户标识推送目标推荐信息，该目标推荐信息可以是金融网站的产品、购物网站的商品，资讯网站的资讯，视频、音乐、书籍等资源网站的资源，社交网站的社交账号、feed流信息等。该方法包括：
[0103]
获取目标用户标识在预设时间段内的历史资源转移记录，从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的资源转移序列信息。
[0104]
接着，根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的。
[0105]
进一步地，获取目标用户标识的属性信息，根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型，确定目标推荐信息，第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
[0106]
接着，将目标推荐信息推送给目标用户标识。
[0107]
其中，第一样本资源转移序列信息的生成方式，包括：获取各个样本用户标识在预定时间段内的历史资源转移记录；从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的
第二样本资源转移序列信息；根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图；获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定；根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息。
[0108]
其中，词向量计算模型的训练方式，包括：获取第一样本资源转移序列信息以及预设文本信息；根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型，预设文本信息为新闻文本信息。
[0109]
具体地，本实施例提供的方法，在模型训练方面，训练效率提升了12倍，由36h降低至3h；在模型应用方面，推荐模型的auc(area under curve)提升了1.2％，风控模型的区分度评估指标提升了4.5％。上述信息推送方法中，根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息，剔除了无效信息，并且保留了历史资源转移记录的关联性，提高了词向量计算模型的训练效率以及准确性；接着，对各个样本用户标识的第二样本资源转移序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本资源转移序列信息，从而完成对样本序列的随机抽样，避免了资源转移标签的头部效应问题以及重复信息问题；并且，资源转移标签向量可准确表达目标用户标识的资源转移行为，根据资源转移标签向量确定目标用户标识的推荐信息，从而提高了推荐信息的准确性。
[0110]
本技术还另外提供一种应用场景，该应用场景应用上述的信息推送方法。具体地，该信息推送方法在该应用场景的应用如下：对词向量计算模型进行训练，该词向量计算模型用于确定资源转移标签向量，该资源转移标签向量可用于对目标用户标识推送目标推荐信息，该目标推荐信息可以是金融网站的产品、购物网站的商品，资讯网站的资讯，视频、音乐、书籍等资源网站的资源，社交网站的社交账号、feed流信息等。该方法包括：
[0111]
获取各个样本用户标识在预定时间段内的历史资源转移记录。
[0112]
接着，从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息。
[0113]
进一步地，根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图。
[0114]
接着，获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定，根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息。
[0115]
进一步地，根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型，预设文本信息为新闻文本信息。
[0116]
上述信息推送方法中，根据目标用户标识的历史资源转移记录确定第二样本资源转移序列信息，剔除了无效信息，并且保留了历史资源转移记录的关联性；接着，对各个样本用户标识的第二样本资源转移序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本资源转移序列信息，从而完成对样本序列的随机抽样，避免了资源转移标签的头部效应问题以及重复信息问题，提高了词向量计算模型的训练效率以及准确性。
[0117]
本技术还另外提供一种应用场景，该应用场景应用上述的信息推送方法。具体地，
该信息推送方法在该应用场景的应用如下：对目标用户标识推送目标推荐信息，该目标推荐信息可以是金融网站的产品、购物网站的商品，资讯网站的资讯，视频、音乐、书籍等资源网站的资源，社交网站的社交账号、feed流信息等。该方法包括：
[0118]
获取目标用户标识在预设时间段内的历史支付记录，从目标用户标识在预设时间段内的历史支付记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的支付序列信息。
[0119]
接着，根据目标用户标识的支付序列信息以及词向量计算模型，生成目标用户标识的支付标签向量，词向量计算模型是根据第一样本支付序列信息训练得到的，第一样本支付序列信息是根据各个样本用户标识的历史支付记录确定的。
[0120]
进一步地，获取目标用户标识的属性信息，根据目标用户标识的属性信息、目标用户标识的支付标签向量以及第二推荐模型，确定目标推荐信息，第二推荐模型是根据样本属性信息以及样本支付标签向量训练得到的。
[0121]
接着，将目标推荐信息推送给目标用户标识。
[0122]
其中，如图9所示，第一样本支付序列信息的生成方式，包括：获取各个样本用户标识在预定时间段内的历史支付记录；从各个样本用户标识在预定时间段内的历史支付记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本支付序列信息；根据各个样本用户标识的第二样本支付序列信息，生成带权有向图；获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定；根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本支付序列信息。词向量计算模型的训练方式，包括：获取第一样本支付序列信息以及新闻文本信息；根据第一样本支付序列信息以及新闻文本信息，训练词向量计算模型。
[0123]
其中，目标用户标识的支付序列信息用于描述目标用户标识的历史支付记录。支付标签向量用于表征目标用户标识的支付行为，支付行为可体现目标用户标识的支付偏好、支付能力等特征。可选地，若至少两个用户标识的支付行为相似，通过词向量计算模型产生的支付标签向量，其向量距离也是相近的。
[0124]
第一样本支付序列信息用于对词向量计算模型进行训练，第一样本支付序列信息是根据各个样本用户标识的历史支付记录确定的。第二样本支付序列信息用于描述样本用户标识的历史支付记录。
[0125]
第一关键词可为目标用户标识在预设时间段内的历史支付记录中的接收方标识。第二关键词可为样本用户标识在预定时间段内的历史支付记录中的接收方标识。
[0126]
在一个实施例中，可通过node2vec算法进行随机游走。还是以图5为例，节点之间的游走概率可由如下公式进行计算：
[0127][0128]
其中，π
vx
为两个节点之间的游走概率；为两个节点之间的基础游走概率；ln(t
vx
)为边权重，t
vx
为节点v与节点x1、x2、x3之间的连接权重，t
vx
可以是样本用户标识对应的支付次数。
[0129]
上述信息推送方法中，根据目标用户标识的历史支付记录确定第二样本支付序列信息，剔除了无效信息，并且保留了历史支付记录的关联性，提高了词向量计算模型的训练
效率以及准确性；接着，对各个样本用户标识的第二样本支付序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本支付序列信息，从而完成对样本序列的随机抽样，避免了支付标签的头部效应问题以及重复信息问题；并且，支付标签向量可准确表达目标用户标识的支付行为，根据支付标签向量确定目标用户标识的推荐信息，从而提高了推荐信息的准确性。
[0130]
应该理解的是，虽然图2、图8-9的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2、图8-9中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0131]
在一个实施例中，如图10所示，提供了一种信息推送装置，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：获取模块1002、生成模块1004和确定模块1006，其中：
[0132]
获取模块1002，用于获取目标用户标识的资源转移序列信息，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的；
[0133]
生成模块1004，用于根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的；
[0134]
确定模块1006，用于根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识。
[0135]
上述信息推送装置中，获取目标用户标识的资源转移序列信息，根据目标用户标识的资源转移序列信息以及词向量计算模型，生成目标用户标识的资源转移标签向量，根据目标用户标识的资源转移标签向量确定目标推荐信息，并将目标推荐信息推送给目标用户标识，其中，资源转移序列信息是根据目标用户标识的历史资源转移记录确定的，词向量计算模型是根据第一样本资源转移序列信息训练得到的，第一样本资源转移序列信息是根据各个样本用户标识的历史资源转移记录确定的，这样，将目标用户标识的历史资源转移记录形成资源转移序列信息，进而采用词向量计算模型得到资源转移序列信息对应的资源转移标签向量，使得资源转移标签向量可准确表达目标用户标识的资源转移行为，并根据资源转移标签向量确定目标用户标识的推荐信息，从而提高了推荐信息的准确性。
[0136]
在一个实施例中，获取模块1002，还用于：获取目标用户标识在预设时间段内的历史资源转移记录；从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的资源转移序列信息。
[0137]
本实施例中，获取目标用户标识在预设时间段内的历史资源转移记录，从目标用户标识在预设时间段内的历史资源转移记录中获取第一关键词，并按照时间顺序对第一关键词进行排列，得到目标用户标识的资源转移序列信息，这样，将目标用户标识的历史资源转移记录形成资源转移序列信息，不仅剔除了无效信息，并且保留了历史资源转移记录的
关联性。
[0138]
在一个实施例中，生成模块1004，还用于：获取各个样本用户标识在预定时间段内的历史资源转移记录；根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息；根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息。
[0139]
本实施例中，获取各个样本用户标识在预定时间段内的历史资源转移记录，根据各个样本用户标识在预定时间段内的历史资源转移记录，生成各个样本用户标识的第二样本资源转移序列信息，根据各个样本用户标识的第二样本资源转移序列信息，生成第一样本资源转移序列信息，这样，使得第一样本资源转移序列信息可充分表达样本用户标识的历史资源转移记录的关联性，进而提升对词向量计算模型训练的准确性。
[0140]
在一个实施例中，生成模块1004，还用于：从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息。
[0141]
本实施例中，从各个样本用户标识在预定时间段内的历史资源转移记录中获取第二关键词，并按照时间顺序对第二关键词进行排列，得到各个样本用户标识的第二样本资源转移序列信息，这样，将样本用户标识的历史资源转移记录形成资源转移序列信息，不仅剔除了无效信息，并且保留了历史资源转移记录的关联性。
[0142]
在一个实施例中，生成模块1004，还用于：根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图；对带权有向图进行随机游走，得到第一样本资源转移序列信息。
[0143]
本实施例中，根据各个样本用户标识的第二样本资源转移序列信息，生成带权有向图，对带权有向图进行随机游走，得到第一样本资源转移序列信息，这样，对各个样本用户标识的第二样本资源转移序列信息进行重构，形成带权有向图，并对带权有向图进行随机游走，得到第一样本资源转移序列信息，从而完成对样本序列的随机抽样，避免了资源转移标签的头部效应问题以及重复信息问题。
[0144]
在一个实施例中，生成模块1004，还用于：获取带权有向图中的节点之间的游走概率，游走概率根据带权有向图中的节点之间的连接权重确定；根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息。
[0145]
本实施例中，获取带权有向图中的节点之间的游走概率，根据带权有向图中的节点之间的游走概率，对带权有向图进行随机游走，得到第一样本资源转移序列信息，这样，提高了对样本序列进行随机抽样的准确性。
[0146]
在一个实施例中，信息推送装置还包括训练模块，训练模块，用于：获取第一样本资源转移序列信息以及预设文本信息；根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型，预设文本信息为新闻文本信息。
[0147]
本实施例中，获取第一样本资源转移序列信息以及预设文本信息，根据第一样本资源转移序列信息以及预设文本信息，训练词向量计算模型，这样，引入预设文本信息，消除了第一样本资源转移序列信息存在的信息缺陷问题。
[0148]
在一个实施例中，确定模块1006，还用于：根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息，第一推荐模型是根据样本资源转移标签向量训练得
到的。
[0149]
本实施例中，根据目标用户标识的资源转移标签向量以及第一推荐模型确定目标推荐信息，这样，实现对目标用户标识的精准推荐。
[0150]
在一个实施例中，确定模块1006，还用于：获取目标用户标识的属性信息；根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型，确定目标推荐信息，第二推荐模型是根据样本属性信息以及样本资源转移标签向量训练得到的。
[0151]
本实施例中，获取目标用户标识的属性信息；根据目标用户标识的属性信息、目标用户标识的资源转移标签向量以及第二推荐模型，确定目标推荐信息，这样，提高了对目标用户标识推荐的精准度。
[0152]
关于信息推送装置的具体限定可以参见上文中对于信息推送方法的限定，在此不再赘述。上述信息推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
[0153]
在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息推送数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送方法。
[0154]
本领域技术人员可以理解，图11中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0155]
在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0156]
在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0157]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory，rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。
[0158]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0159]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种数据传输方法、装置和系统与流程

信息推送方法、装置、计算机设备和存储介质与流程

相关文献

最热文献