一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图卷积神经网络群组发现的群组推荐方法

2022-07-13 23:15:15 来源:中国专利 TAG:


1.本发明涉及群组推荐技术领域,具体涉及一种基于图卷积神经网络群组发现的群组推荐方法。


背景技术:

2.推荐系统的提出缓解了信息过载问题,目前推荐系统相关研究主要集中在个性化推荐,然而随着群体活动逐渐增加,例如在影视行业,组团观影的频率不断提高,针对群组进行影视推荐的需求不断增加。
3.群组发现是群组推荐算法的前提步骤,在很多情况下群组并不是自然存在的,在群组发现阶段对用户进行群组划分,其准确定性对推荐结果具有决定性影响。目前群组发现的相关研究少之又少,已有的群组发现方法主要是根据人口统计学信息等对用户进行聚类,但这些方法效果不佳,对群组推荐算法的性能增益较少。


技术实现要素:

4.本发明为了克服以上技术的不足,提供了一种从群组发现对群组推荐算法的增益出发,以用户的嵌入表示作为基础,将用户—电影交互考虑在内,利用kmeans算法实现用户群组发现,通过相应的群组融合策略融合群组成员偏好,并根据群组整体偏好进行群组推荐的方法。
5.本发明克服其技术问题所采用的技术方案是:
6.一种基于图卷积神经网络群组发现的群组推荐方法,包括如下步骤:
7.a)建立电影总数据集set,总数据集set中包含的电影类型数为l,按电影类型为划分依据,将movielens数据集划分为l个数据子集,set={set1,

,set
l
,

,set
l
},set
l
为第l类电影的数据子集,l∈{1,2,

,l};
8.b)数据子集set
l
中存在m个用户和n部电影,根据用户和电影的交互数据构建用户-电影交互图,对用户-电影交互图中的节点的嵌入表示进行初始化,得到用户节点的初始嵌入表示eu及电影节点的初始嵌入表示ei,为第m个用户节点um的初始嵌入表示,m∈{1,2,

,m},为第n个电影节点in的初始嵌入表示,n∈{1,2,

,n};
9.c)在图卷积神经网络模型内计算得到第m个用户节点um经过o层嵌入信息传播后嵌入表示计算得到第n个电影节点in经过o层嵌入信息传播后嵌入表示0≤o≤o,o为图卷积神经网络模型的层数;
10.d)第m个用户节点um及第n个电影节点in分别经过图卷积神经网络模型的o层传播后,分别将每一层的嵌入表示进行拼接,分别得到第m个用户节点um的嵌入表示及及第n
个电影节点in的嵌入表示的嵌入表示
11.e)通过公式建立更新后的所有用户节点的嵌入表示e
′u,通过公式建立更新后的所有电影节点的嵌入表示e
′i,完成更新用户节点和电影节点嵌入表示的图卷积神经网络的构建;
12.f)利用二元交叉熵损失函数对步骤e)完成的更新用户节点和电影节点嵌入表示的图卷积神经网络进行训练;
13.g)将更新后的所有用户节点的嵌入表示e
′u输入到kmeans聚类算法进行群组发现,数据子集set
l
中的m个每个用户划分为m/s个群组,s为各个群组中用户的个数的平均数,set
l
={g1,

,gj,

,gm},gj为第j个群组,j∈{1,2,

,m/s};
14.h)第j个群组gj中用户个数为p,1≤p≤m,为群组gj中第p个用户,p∈{1,2,

,p},通过公式计算得到群组gj的嵌入表示式中为第p个用户的嵌入表示;
15.i)将群组gj的嵌入表示与第n个电影节点in的嵌入表示通过公式进行内积计算得到群组gj对电影节点in的预测偏好得分
16.j)群组gj对数据子集set
l
中n部电影的偏好得分为中n部电影的偏好得分为
17.k)将中的各个预测偏好得分进行排序,选择最高的k个电影进行推荐。优选的,步骤a)中选择movielens数据集作为电影总数据集set。
18.进一步的,步骤b)中eu∈rm×d,ei∈rn×d,r为实数空间,d为嵌入表示的维度。
19.进一步的步骤c)中通过公式计算得到第m个用户节点um经过o层嵌入信息传播后嵌入表示通过公式计算得到第n个电影节点in经过o层嵌入信息传播后嵌入表示式中relu(
·
)为relu激活函数,为第m个用
户节点um的度,为第n个电影节点in的度,为第n个电影节点in的第o-1层的嵌入表示,为第m个用户节点um的第o-1层的嵌入表示,层的嵌入表示,
20.优选的,步骤c)中0<o≤5。
21.进一步的,步骤f)中通过公式计算得到二元交叉熵损失函数l,式中为交互正样本,为无交互负样本,σ(
·
)为sigmoid激活函数,t为转置。
22.优选的,步骤k)中k的取值为10。
23.本发明的有益效果是:根据电影主题类别将用户—电影交互数据划分为数据子集,使用各数据子集构建用户—电影交互图,通过图卷积网络从交互图中学习用户/电影嵌入表示,然后利用kmeans算法进行群组发现,通过均值融合策略,将群组成员嵌入表示融合为群组嵌入表示,最后将群组嵌入表示与电影嵌入表示进行内积得到群组对电影的预测偏好得分,根据偏好得分向群组推荐电影。侧重于群组发现阶段的用户嵌入获取方法,考虑了群组的内部一致性对群组推荐算法性能的影响,将用户—电影的交互信息融入用户/电影的特征信息之中,提高了群组发现中的用户嵌入表示的准确度,进而增强了群组推荐算法的性能。
附图说明
24.图1为本发明的方法流程图。
具体实施方式
25.下面结合附图1对本发明做进一步说明。
26.一种基于图卷积神经网络群组发现的群组推荐方法,包括如下步骤:
27.a)建立电影总数据集set,总数据集set中包含的电影类型数为l,按电影类型为划分依据,将movielens数据集划分为l个数据子集,set={set1,

,set
l
,

,set
l
},set
l
为第l类电影的数据子集,l∈{1,2,

,l}。
28.b)数据子集set
l
中存在m个用户和n部电影,根据用户和电影的交互数据构建用户-电影交互图,对用户-电影交互图中的节点的嵌入表示进行初始化,得到用户节点的初始嵌入表示eu及电影节点的初始嵌入表示ei,
为第m个用户节点um的初始嵌入表示,m∈{1,2,

,m},为第n个电影节点in的初始嵌入表示,n∈{1,2,

,n}。
29.c)在图卷积神经网络模型内计算得到第m个用户节点um经过o层嵌入信息传播后嵌入表示计算得到第n个电影节点in经过o层嵌入信息传播后嵌入表示0≤o≤o,o为图卷积神经网络模型的层数。
30.d)第m个用户节点um及第n个电影节点in分别经过图卷积神经网络模型的o层传播后,分别将每一层的嵌入表示进行拼接,分别得到第m个用户节点um的嵌入表示及及第n个电影节点in的嵌入表示的嵌入表示
31.e)通过公式建立更新后的所有用户节点的嵌入表示e
′u,通过公式建立更新后的所有电影节点的嵌入表示e
′i,完成更新用户节点和电影节点嵌入表示的图卷积神经网络的构建。
32.f)用户节点和电影节点嵌入表示通过用户—电影交互数据学习逐步进行优化更新,而数据中用户节点和电影节点的关系只有两种类型:交互、无交互,因此本发明利用二元交叉熵损失函数(bce)对步骤e)完成更新的用户节点和电影节点嵌入表示的图卷积神经网络进行训练。
33.g)将更新后的所有用户节点的嵌入表示e
′u输入到kmeans聚类算法进行群组发现,数据子集set
l
中的m个每个用户划分为m/s个群组,s为各个群组中用户的个数的平均数,set
l
={g1,

,gj,

,gm},gj为第j个群组,j∈{1,2,

,m/s}。
34.h)第j个群组gj中用户个数为p,1≤p≤m,为群组gj中第p个用户,p∈{1,2,

,p},此时,群组成员的兴趣偏好具有基本一致性,所以本发明仅需利用均值策略就可以很好的将群组成员的嵌入表示融合为群组的嵌入表示,具体的通过公式计算得到群组gj的嵌入表示式中为第p个用户的嵌入表示。
35.i)将群组gj的嵌入表示与第n个电影节点in的嵌入表示通过公式进行内积计算得到群组gj对电影节点in的预测偏好得分
36.j)群组gj对数据子集set
l
中n部电影的偏好得分为中n部电影的偏好得分为
37.k)将中的各个预测偏好得分进行排序,选择最高的k个电影进行推荐。根据电影主题类别将用户—电影交互数据划分为数据子集,使用各数据子集构建用户—电影交互图,通过图卷积网络从交互图中学习用户/电影嵌入表示,然后利用kmeans算法进行群组发现,通过均值融合策略,将群组成员嵌入表示融合为群组嵌入表示,最后将群组嵌入表示与电影嵌入表示进行内积得到群组对电影的预测偏好得分,根据偏好得分向群组推荐电影。侧重于群组发现阶段的用户嵌入获取方法,考虑了群组的内部一致性对群组推荐算法性能的影响,将用户—电影的交互信息融入用户/电影的特征信息之中,提高了群组发现中的用户嵌入表示的准确度,进而增强了群组推荐算法的性能。
38.实施例1:
39.步骤a)中选择movielens数据集作为电影总数据集set。
40.实施例2:
41.步骤b)中eu∈rm×d,ei∈rn×d,r为实数空间,d为嵌入表示的维度。
42.实施例3:
43.步骤c)中通过公式计算得到第m个用户节点um经过o层嵌入信息传播后嵌入表示通过公式计算得到第n个电影节点in经过o层嵌入信息传播后嵌入表示式中relu(
·
)为relu激活函数,为第m个用户节点um的度,为第n个电影节点in的度,为第n个电影节点in的第o-1层的嵌入表示,为第m个用户节点um的第o-1层的嵌入表示,示,
44.实施例4:
45.步骤c)中0<o≤5。
46.实施例5:
47.步骤f)中通过公式计算得到二元交叉熵损失函数l,式中为交互正样本,为无交互负样本,σ(
·
)为sigmoid激活函数,t为转置。
48.实施例6:
49.步骤k)中k的取值为10。
50.最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献