一种会话推荐方法、系统、装置及存储介质

2022-07-02 13:29:29 来源：中国专利 TAG：

1.本发明涉及人工智能、深度学习及推荐系统技术领域，尤其涉及一种会话推荐方法、系统、装置及存储介质。

背景技术：

2.随着互联网上信息量的快速增长，对于广大用户来说，从庞大的信息海洋中查找到自己需要的信息是非常困难的；对于提供服务的网络平台来说，最终目的是提供用户感兴趣的内容，最大限度地留存用户，从而提升平台收益。而推荐系统成为帮助用户缓解信息过载问题和在许多web应用程序(例如搜索、电子商务和流媒体站点)中选择感兴趣的信息的基础。会话推荐是推荐系统中一个专门的领域，大多数现有的推荐系统都假设不断记录用户个人资料和过去的活动。然而，在许多服务中，用户身份可能是未知的，并且只有正在进行的会话期间的用户行为历史是可用的。因此，在一个会话中对有限行为进行建模并相应地生成推荐非常重要。相反，在这种情况下，依赖于足够的用户-项目交互的传统推荐方法在产生准确的会话推荐结果方面存在问题。但是通过引入深度学习技术，对大量的用户行为进行分析和建模，可以在用户信息匿名的情况下，仅根据用户的若干次交互给出符合用户和平台需求的推荐结果。
3.现有的一种会话推荐技术中，通过将序列化的问题转换为图的问题，对所有的会话序列通过有向图进行建模，然后通过图神经网络来学习每个商品的隐向量表示，进而通过一个注意力网络架构模型来捕捉用户的短期兴趣，以达到捕获长期与短期兴趣共存的向量表示。该技术特点包括：(1)对会话数据进行预处理，将会话数据建模为图结构的数据；(2)利用gnn模型对会话数据进行建模，得到会话向量表示；(3)使用最后的会话表示向量和商品的向量进行相似度计算，得到推荐结果。该技术的缺点是：(1)由于将会话数据建成图，在一定程度上损失了序列的时序信息；(2)没有考虑到数据中噪声的存在，直接把各个商品通过各种联系连接在一张图上，商品之间可能并不存在必然的相关性。
4.现有的另一种会话推荐技术中，通过循环神经网络网络对会话数据进行时序性建模，再分别利用两个记忆化网络对会话内部和会话领域的信息进行整合，得到会话的向量表示。该技术特点包括：(1)使用两个网络，同时建模两个层级的会话信息——会话内部和会话邻域，可以得到更完整的会话向量表示。(2)通过特别设计的门控融合机制，来融合两个层级的会话向量表示。该技术的缺点是：(1)考虑会话邻域的方式过于简单，无法融合有效的邻域信息；(2)循环神经网络存在梯度消失的问题，无法完整地建模会话信息。

技术实现要素：

5.为至少一定程度上解决现有技术中存在的技术问题之一，本发明的目的在于提供一种会话推荐方法、系统、装置及存储介质。
6.本发明所采用的技术方案是：
7.一种会话推荐方法，包括以下步骤：
8.获取用户在电商平台的会话数据集，所述会话数据集包括物品信息、用户购买时间戳以及用户购买行为；
9.对所述会话数据集进行数据增强；
10.将数据增强后的会话数据集建模为序列结构，并输入到transformer网络中，获得初步会话向量化表示数据集；
11.将所述初步会话向量化表示数据集中的会话存储在历史会话向量化表示内存中；
12.使用transformer网络进行全局信息建模，使用convolution网络进行局部信息提取，最后得到当前会话的向量化表示h
current
；
13.在所述历史会话向量化表示内存中查找相似度最高的k个邻域会话的向量化表示，再设置一个相似度阈值a，以相似度阈值为界，生成两种表示位置的向量化表示，与k个邻域会话的向量化表示通过transformer网络进行融合，得到邻域会话向量化表示h
neighbor
；
14.将当前会话向量表示h
current
和邻域会话向量表示h
neighbor
通过一个融合层连接到一起，得到最终会话向量化表示；
15.计算所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。
16.进一步地，还包括对所述会话数据集进行预处理的步骤，包括：
17.根据时间戳对会话数据进行排序，得到按时间排序的会话序列，去除只有一次点击的会话，以及删除出现频率过低的点击项；
18.其中，会话数据的每一项包括了商品的序号item_id和商品被点击的时间戳time_stamp。
19.进一步地，所述根据时间戳对会话数据进行排序，得到按时间排序的会话序列，包括：
20.从会话数据集中获取共n个会话数据，用s表示会话，v表示被点击的商品项，将该会话中的所有商品项v按商品被点击的时间戳time_stamp进行排序，则一个会话序列可以表示为s＝《v1,v2,v3…
vc》，其中v的下标c用来区分商品点击的先后顺序。
21.进一步地，所述将数据增强后的会话数据集建模为序列结构，并输入到transformer网络中，获得初步会话向量化表示数据集，包括：
22.把数据增强后的点击数据集建模为序列结构，输入到transformer模型中，经过训练后，得到会话序列中每一个商品的向量化表示；所述会话序列中每一个节点的向量化表示，代表一个商品在综合了序列中其他商品特征后的向量表示x＝《x1,x2,x3
…
xn》；
23.将所述会话序列中所有商品节点的向量化表示，取平均得到每一个会话的向量化表示，对于会话s＝《v1,v2,v3…
vn》，其中n为会话s包含的商品个数，其初步会话向量化表示为：x＝{x1,x2,
…
,xn}。
24.进一步地，所述将所述初步会话向量化表示数据集中的会话存储在历史会话向量化表示内存中，包括：
25.将所述初步会话向量化表示数据集中的用户消费行为的会话向量化表示存储起来，该集合记为m，用作后续的领域信息查找，
26.其中p表示用户购买会话数据集中的会话个数，t表示会话长度，表示在第i会
话在进行了上述数据增强后长度为j的会话向量化表示。
27.进一步地，所述最终会话向量化表示z的表达式如下：
28.z＝αh
current
(1-a)h
neighbor
29.其中，参数α＝σ(w1h
current
w2h
neighbor
)，σ代表sigmoid函数，w1,w2是可以训练的模型参数。
30.进一步地，所述余弦相似度的计算公式如下：
31.value＝softmax(z
t
x)
32.其中，z为最终会话向量化表示，x为物品向量化表示，t表示向量转置；得分最高的k个物品形成最终的推荐物品列表。
33.本发明所采用的另一技术方案是：
34.一种会话推荐系统，包括：
35.数据采集模块，用于获取用户在电商平台的会话数据集，所述会话数据集包括物品信息、用户购买时间戳以及用户购买行为；
36.数据增强模块，用于对所述会话数据集进行数据增强；
37.向量提取模块，用于将数据增强后的会话数据集建模为序列结构，并输入到transformer网络中，获得初步会话向量化表示数据集；
38.数据存储模块，用于将所述初步会话向量化表示数据集中的会话存储在历史会话向量化表示内存中；
39.会话内部建模模块，用于使用transformer网络进行全局信息建模，使用convolution网络进行局部信息提取，最后得到当前会话的向量化表示h
current
；
40.会话邻域建模模块，用于在所述历史会话向量化表示内存中查找相似度最高的k个邻域会话的向量化表示，再设置一个相似度阈值a，以相似度阈值为界，生成两种表示位置的向量化表示，与k个邻域会话的向量化表示通过transformer网络进行融合，得到邻域会话向量化表示h
neighbor
；
41.向量融合模块，用于将当前会话向量表示h
current
和邻域会话向量表示h
neighbor
通过一个融合层连接到一起，得到最终会话向量化表示；
42.推荐计算模块，用于计算所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。
43.本发明所采用的另一技术方案是：
44.一种会话推荐装置，包括：
45.至少一个处理器；
46.至少一个存储器，用于存储至少一个程序；
47.当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现上所述方法。
48.本发明所采用的另一技术方案是：
49.一种计算机可读存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
50.本发明的有益效果是：本发明通过对用户历史购买行为的历史会话进行表示和存储，利用历史购买会话作为协同信息，可以有效捕捉相似用户的消费模式，同时在给当前用
户进行推荐时，考虑历史会话中和当前用户存在相同偏好的用户行为，提取邻域会话信息；把邻域会话信息和当前会话信息进行聚合，给出推荐结果，使得新的推荐算法可以更有效地预测用户的真实需求，从而给出更加准确的推荐结果。
附图说明
51.为了更清楚地说明本发明实施例或者现有技术中的技术方案，下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例，对于本领域的技术人员而言，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。
52.图1是本发明实施例中一种会话推荐方法的步骤流程图；
53.图2是本发明实施例中一种会话推荐方法的总体流程图。
具体实施方式
54.下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
55.在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
56.在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
57.本发明的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
58.如图1和图2所示，本实施例提供一种会话推荐方法，利用历史购买信息作为协同信息，可以有效建模用户的消费行为，并且在给用户进行推荐时，考虑历史会话中和用户存在相同偏好的用户行为，使得推荐算法可以更有效地预测用户的真实消费意图，从而给出更加准确的推荐结果。该方法具体包括以下步骤：
59.s1、从公开的数据集中收集包含物品信息、用户购买时间戳、用户购买行为在内的用户在电商平台的会话数据集。
60.具体地，步骤s1具体如下：从公开数据平台上得到包含物品类别信息、用户购买时间、用户购买行为的会话数据集，会话数据中的每一项还包含了商品的序号item_id和商品被点击的时间戳time_stamp。
61.s2，对所述会话数据集进行预处理。步骤包括：对会话数据进行时间戳上的排序得
到按时间排序的会话序列，去除只有一次点击的会话、删除出现频率过低的点击项。
62.其中，步骤s2具体包括步骤s21-s22：
63.s21、从会话数据集中获取共n个会话数据，用s表示会话，v表示被购买的商品项，将会话中的所有商品项v按所述商品被购买的时间戳time_stamp进行排序，则一个会话序列表示为s＝《v1,v2,v3…
vc》，其中v的下标c用来区分商品点击的先后顺序；
64.s22、对步骤s21中预处理后得到的会话执行更进一步的预处理，本实施例中，去掉整个会话数据库中出现次数少于5次的会话，然后去掉会话长度少于2的会话。
65.s3、将所述经过预处理后的会话数据集根据时间戳划分为训练数据集和测试数据集，分别用作模型训练和测试。
66.作为可选的所述方式，步骤s3具体如下：在所述预处理后的会话数据集中，根据时间戳划分为训练集和测试集，比如对于会话s＝《v1,v2,v3,v4,v5》，经过划分，训练集为《v1,v2,v3》，标签为《v2,v3,v4》；测试集为《v1,v2,v3,v4》，标签为《v5》。
67.s4、对所述会话数据集进行数据增强，方式是对每一个数据进行片段式截取。
68.作为可选的所述方式，步骤s4具体如下：对步骤s3得到的训练集进行数据增强，目的是扩充数据集，采用的方式是截取序列前缀，比如对于会话s1＝《v1,v2,v3,v4,v5》，经数据增强后得到4个会话序列即《v1,v2》、《v1,v2,v3》、《v1,v2,v3,v4》、《v1,v2,v3,v4,v5》。
69.s5、把所述数据增强后的购买数据集建模为序列结构，之后输入到transformer网络中，得到初步会话向量化表示数据集。
70.其中，步骤s5具体包括步骤s51-s52：
71.s51、把步骤s4中数据增强后的用户购买数据集建模为序列结构，输入到transformer模型中，经过训练后得到序列中每一个商品节点的向量化表示；所述会话序列结构中每一个商品项的向量化表示，代表了一个物品经过embedding层随机初始化的向量表示。
72.s52、将所述会话序列中每一个商品节点的向量化表示经过transformer网络，聚合序列中相邻节点的信息，得到初步会话向量化表示x＝{x1,x2,
…
,xn}。
73.s6、将所述初步会话向量化表示数据集中的会话存储在历史会话向量化表示内存中。
74.作为可选的所述方式，步骤s6具体如下：将所述初步会话向量化表示存储起来，该集合记为m，用作后续的邻域信息查找，其中p代表会话数据集中的会话个数，表示第i会话在进行了上述数据增强后长度为j的会话向量化表示。
75.比如对于会话s1＝《v1,v2,v3,v4,v5》，进行数据增强后的结果是》，进行数据增强后的结果是对应到m就是
76.s7、对于待推荐的会话，使用transformer网络进行全局信息建模，使用convolution网络进行局部信息提取，最后得到当前会话的向量化表示h
current
。
77.对于每一个待推荐的当前会话，先使用transformer网络进行全局信息建模，再用convolution网络进行局部信息提取，最后得到当前会话的向量化表示h
current
。
78.s8、对于待推荐的会话，在所述历史会话向量化表示内存中查找相似度最高的k个
邻域会话向量化表示，再设置一个相似度阈值a，以相似度阈值为界，生成两种表示位置的向量化表示，与k个邻域的会话向量化表示通过transformer网络进行融合，得到邻域会话的向量化表示h
neighbor
。
79.对于每个待推荐的当前会话,在所述集合m的购买会话中查找相似度最高的k个会话，将它们的向量化表示依据相似度从高到低进行排序。
80.设置一个相似度阈值α，以α为界，将k个邻域会话分成两类。对于两类邻域会话的向量表示，分别加上不同的位置编码向量表示，再将它们送入transformer网络，进行向量化表示建模，生成最终邻域向量化表示h
neighbor
。
81.比如，对于邻域会话向量《v1,v2,v3,v4,v5》，它们的相似度为《0.9,0.8,0.6,0.3,0.1》，假设相似度阈值为0.5，相似度高于阈值的位置编码向量为k，相似度低于阈值的位置编码向量为p，则更新后的邻域会话向量为《1 k,v2 k,v3 k,v4 p,v5 p》，再将更新后的邻域会话向量送入transformer网络，生成最终邻域向量化表示。
82.s9，将当前会话向量表示h
current
和邻域会话向量表示h
neighbor
通过一个融合层连接到一起，得到最终会话向量化表示。
83.具体地，将当前会话向量化表示和所述邻域会话向量化表示连接起来得到最终会话向量化表示z：
84.z＝αh
current
(1-a)h
neighbor
85.其中参数α＝σ(w1h
current
w2h
neighbor
)，σ代表sigmoid函数，w1,w2是可以训练的模型参数。
86.s10，用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。
87.得到所述最终会话向量化表示后，计算所述最终会话向量化表示和所述物品向量化表示x的相似度得分value作为推荐依据，相似度得分value计算如下：
88.value＝softmax(z
t
x)
89.其中t表示向量转置；得分最高的k个物品形成最终的推荐物品列表。
90.综上所述，本实施例方法相对于现有技术，具有如下的优点及有益效果：
91.本实施例方法通过对用户历史购买行为的历史会话进行表示和存储，利用历史购买会话作为协同信息，可以有效捕捉相似用户的消费模式，同时在给当前用户进行推荐时，考虑历史会话中和当前用户存在相同偏好的用户行为，提取邻域会话信息；把邻域会话信息和当前会话信息进行聚合，给出推荐结果，使得新的推荐算法可以更有效地预测用户的真实需求，从而给出更加准确的推荐结果。
92.本实施例还提供一种会话推荐系统，包括：
93.数据采集模块，用于获取用户在电商平台的会话数据集，所述会话数据集包括物品信息、用户购买时间戳以及用户购买行为；
94.数据增强模块，用于对所述会话数据集进行数据增强；
95.向量提取模块，用于将数据增强后的会话数据集建模为序列结构，并输入到transformer网络中，获得初步会话向量化表示数据集；
96.数据存储模块，用于将所述初步会话向量化表示数据集中的会话存储在历史会话向量化表示内存中；
97.会话内部建模模块，用于使用transformer网络进行全局信息建模，使用convolution网络进行局部信息提取，最后得到当前会话的向量化表示h
current
；
98.会话邻域建模模块，用于在所述历史会话向量化表示内存中查找相似度最高的k个邻域会话的向量化表示，再设置一个相似度阈值a，以相似度阈值为界，生成两种表示位置的向量化表示，与k个邻域会话的向量化表示通过transformer网络进行融合，得到邻域会话向量化表示h
neighbor
；
99.向量融合模块，用于将当前会话向量表示h
current
和邻域会话向量表示h
neighbor
通过一个融合层连接到一起，得到最终会话向量化表示；
100.推荐计算模块，用于计算所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。
101.本实施例的一种会话推荐系统，可执行本发明方法实施例所提供的一种会话推荐方法，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。
102.本实施例还提供一种会话推荐装置，包括：
103.至少一个处理器；
104.至少一个存储器，用于存储至少一个程序；
105.当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如图1所示方法。
106.本实施例的一种会话推荐装置，可执行本发明方法实施例所提供的一种会话推荐方法，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。
107.本技术实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。
108.本实施例还提供了一种存储介质，存储有可执行本发明方法实施例所提供的一种会话推荐方法的指令或程序，当运行该指令或程序时，可执行方法实施例的任意组合实施步骤，具备该方法相应的功能和有益效果。
109.在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
110.此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特
定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
111.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
112.在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
113.计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
114.应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
115.在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
116.尽管已经示出和描述了本发明的实施方式，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。
117.以上是对本发明的较佳实施进行了具体说明，但本发明并不限于上述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本技术权利要求所限定的范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：使用指纹的高速缓冲存储器管理的制作方法

一种会话推荐方法、系统、装置及存储介质

相关文献

最热文献