一种基于知识图谱嵌入的协同过滤推荐方法

2022-06-30 01:59:25 来源：中国专利 TAG：

1.本发明属于计算机应用领域，具体涉及一种基于知识图谱嵌入的协同过滤推荐方法。

背景技术：

2.近年来，随着购物、新闻、阅读、音乐、视频平台和社交媒体网站等网络应用的快速发展，用户不得不从铺天盖地的信息中选择自己喜欢的内容。在这种情况下，推荐系统作为一种缓解信息过载的工具，需要帮助用户从不断增长的海量数据中发掘个性化的兴趣。
3.为了实现个性化推荐，传统的协同过滤方法利用各种用户在线的非结构化数据，如点击、评分等，并根据这些历史信息，预测用户对项目的偏好。一般而言，可学习的协同过滤模型由嵌入和交互数据建模两个部分组成。其中，嵌入是将用户和项目转换为向量形式,而交互数据建模则是基于嵌入的向量来重构用户、项目的历史交互信息。
4.例如，矩阵分解模型直接将用户和项目的id表示为向量形式，并通过内积的方式对他们的交互进行建模；神经协同过滤模型使用非线性神经网络代替矩阵分解模型中的内积交互函数；基于翻译的协同过滤模型使用欧几里德距离度量作为预测推荐结果的交互函数。然而这些方法因为仅考虑了用户、项目的id或属性这类描述性特征来构建嵌入函数，可能会导致协同过滤算法难以产生令人满意的嵌入向量，并且当交互函数更深入地挖掘复杂的用户-项目关系时，这些方法还会趋于过度拟合，使稀疏性问题更加严重。因此，研究者提出在推荐系统中使用辅助信息来丰富项目的语义表示，如社交网络、属性和多媒体。
5.知识图谱作为一种含有丰富结构化语义知识的辅助信息，在提高推荐的准确性和可解释性方面表现出了巨大的潜力。知识图谱是一种机器可理解的并以图的形式存储现实世界中客观事实的异构信息网络，图中的节点表示实体，即现实世界中的相关概念、属性等，与之相连的边表示不同实体之间的关系。知识图谱通过不同类型的关系构建了项目之间的链接，从而捕获项目之间的语义相关性，扩充了项目的内在特征。与没有知识图谱辅助的推荐模型相比，使用知识图谱辅助的推荐模型可以让推荐结果更加准确和多样。
6.虽然知识图谱有着上述优点，但是开发基于知识图谱的推荐系统存在两个关键问题，第一是如何为推荐项目获取丰富的结构化知识信息，第二是如何发掘知识图谱定义的用户特定项目和图中实体之间的语义关联性。对于第一个问题，现有的研究一般有两种处理方法：a)通过搜集各种辅助信息来制作结构化的项目知识。该方法一般先从推荐系统平台上收集辅助信息作为上下文特征，然后再将其构建为少量而简单的类似于知识库的结构化信息。但这种知识库拥有的与项目相关的属性和关系数量通常很少，并且大部分有用的项目信息也可能会丢失。b)使用外部构建好的知识图谱来丰富项目的语义特征。

技术实现要素：

7.本发明是为了解决上述问题而进行的，目的在于提供一种基于知识图谱嵌入的协同过滤推荐方法。
8.本发明提供了一种基于知识图谱嵌入的协同过滤推荐方法，具有这样的特征，包括以下步骤：步骤1，在结构化知识特征提取阶段，基于用户-项目历史交互和satori知识图谱构建子知识图谱，然后通过改进的知识图嵌入方法从子知识图谱中寻找结构化知识的潜在向量表示，得到结构化嵌入向量，以此获得具有知识感知的项目表征；步骤2，在联合学习阶段，基于结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征，并采用协同过滤的推荐方法，将结构化嵌入向量与非结构化项目特征向量的信息嵌入到统一的向量空间中；步骤3，在推荐列表生成阶段，使用用户向量表征和最终的项目潜在向量表征的内积作为用户的偏好概率值，并以用户的偏好概率值为目标生成个性化的推荐列表。
9.在本发明提供的基于知识图谱嵌入的协同过滤推荐方法中，还可以具有这样的特征：其中，步骤1中，以推荐系统中用户-项目历史交互和satori知识图谱作为输入，提取与项目相关的实体来构建子知识图谱。
10.在本发明提供的基于知识图谱嵌入的协同过滤推荐方法中，还可以具有这样的特征：其中，步骤2中，将知识图谱中的结构化嵌入向量和非结构化项目特征向量以按元素位置相加的方式集成在一起，构建最终的项目潜在向量表征。
11.在本发明提供的基于知识图谱嵌入的协同过滤推荐方法中，还可以具有这样的特征：其中，步骤2中，协同过滤的推荐方法通过优化项目之间的成对排序函数，将结构化与非结构的信息嵌入到统一的向量空间中。
12.在本发明提供的基于知识图谱嵌入的协同过滤推荐方法中，还可以具有这样的特征，还包括：步骤4，检测阶段，在检测阶段，采集不同领域的数据，带入模型，进行个性化推荐，获得最优检测结果。
13.发明的作用与效果
14.根据本发明所涉及的基于知识图谱嵌入的协同过滤推荐方法，因为具体步骤为：步骤1，在结构化知识特征提取阶段，基于用户-项目历史交互和satori知识图谱构建子知识图谱，然后通过改进的知识图嵌入方法从子知识图谱中寻找结构化知识的潜在向量表示，得到结构化嵌入向量，以此获得具有知识感知的项目表征；步骤2，在联合学习阶段，基于结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征，并采用协同过滤的推荐方法，将结构化嵌入向量与非结构化项目特征向量的信息嵌入到统一的向量空间中；步骤3，在推荐列表生成阶段，使用用户向量表征和最终的项目潜在向量表征的内积作为用户的偏好概率值，并以用户的偏好概率值为目标生成个性化的推荐列表。
15.因此，本发明的基于知识图谱嵌入的协同过滤推荐方法将知识图谱的结构化信息整合到协同过滤框架中，使用改进的知识图嵌入算法从结构化数据中提取项目的语义特征，并在端到端的模型中联合学习用户、项目表征，有效缓解了稀疏性问题，提高了推荐的准确性。
16.此外，本发明的检测阶段中在两个真实数据集movielens-1m与last.fm上进行了实验，使用precision、recall、f1值和ndcg作为模型的评估指标，将kgecf与bpr、line、cfkg和ktup进行对比，实验表明kgecf在两个数据集上的推荐准确率、召回率、f1值和ndcg四个指标上均优于对比算法，能够集成大规模的结构化和非结构化数据，同时获得高精度的推荐结果，能为用户提供更准确的推荐结果，在融合异构数据方面也具有较强的灵活性。
附图说明
17.图1是本发明实施例中基于知识图谱嵌入的协同过滤推荐方法的模型图；
18.图2是本发明实施例中基于知识图谱嵌入的协同过滤推荐方法的代码运行过程图。
具体实施方式
19.为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，以下实施例结合附图对本发明一种基于知识图谱嵌入的协同过滤推荐方法作具体阐述。
20.在本实施例中，提供了一种基于知识图谱嵌入的协同过滤推荐方法。
21.图1是本发明实施例中基于知识图谱嵌入的协同过滤推荐方法的模型图。
22.图2是本发明实施例中基于知识图谱嵌入的协同过滤推荐方法的代码运行过程图。
23.如图1～图2所示，本实施例所涉及的基于知识图谱嵌入的协同过滤推荐方法包括以下步骤：
24.步骤1，结构化知识特征提取：在结构化知识特征提取阶段，以推荐系统中用户-项目历史交互和satori知识图谱作为输入，提取与项目相关的实体来构建子知识图谱(sub-graph)，并使用改进的知识图嵌入方法(xavier-transr)从子图中寻找结构化知识的潜在向量表示，以此获得具有知识感知的项目表征。
25.步骤2，联合学习：在联合学习阶段，将知识图谱中的结构化嵌入向量和非结构化项目特征向量以按元素位置相加的方式集成在一起，构建项目最终的潜在向量表征。采用协同过滤的推荐方法，通过优化项目之间的成对排序函数，将结构化与非结构的信息嵌入到统一的向量空间中。
26.步骤3，推荐列表生成：在推荐列表生成阶段，使用最终得到的用户、项目潜在向量表征的内积作为用户的偏好概率值，并以此为目标用户生成个性化的推荐列表。
27.步骤4，检测阶段：主要为采集数据，带入模型，获得最优检测结果。本实施例选用了来自电影和音乐两个不同领域的真实数据集进行个性化推荐。实验将数据集过滤后，按照8：1：1的比例在用户维度上随机划分数据集来构建训练集、测试集和验证集。在验证集上实现模型参数的选取，并使用precision@n、recall@n、f1@n、ndcg@n四个指标来衡量各模型的优劣。
28.本实施例中，将kghr模型与bpr、line、cfkg和ktup四个基准算法进行对比分析，结果表明本实施例中提供的方法在推荐准确率、召回率、f1值和ndcg四个指标上均优于基线方法，能够集成大规模的结构化和非结构化数据，同时获得高精度的推荐结果。
29.实施例的作用与效果
30.根据本实施例所涉及的基于知识图谱嵌入的协同过滤推荐方法，因为具体步骤为：步骤1，在结构化知识特征提取阶段，基于用户-项目历史交互和satori知识图谱构建子知识图谱，然后通过改进的知识图嵌入方法从子知识图谱中寻找结构化知识的潜在向量表示，得到结构化嵌入向量，以此获得具有知识感知的项目表征；步骤2，在联合学习阶段，基于结构化嵌入向量和非结构化项目特征向量构建最终的项目潜在向量表征，并采用协同过滤的推荐方法，将结构化嵌入向量与非结构化项目特征向量的信息嵌入到统一的向量空间
中；步骤3，在推荐列表生成阶段，使用用户向量表征和最终的项目潜在向量表征的内积作为用户的偏好概率值，并以用户的偏好概率值为目标生成个性化的推荐列表。
31.因此，本实施例的基于知识图谱嵌入的协同过滤推荐方法将知识图谱的结构化信息整合到协同过滤框架中，使用改进的知识图嵌入算法从结构化数据中提取项目的语义特征，并在端到端的模型中联合学习用户、项目表征，有效缓解了稀疏性问题，提高了推荐的准确性。
32.此外，本实施例的检测阶段中在两个真实数据集movielens-1m与last.fm上进行了实验，使用precision、recall、f1值和ndcg作为模型的评估指标，将kgecf与bpr、line、cfkg和ktup进行对比，实验表明kgecf在两个数据集上的推荐准确率、召回率、f1值和ndcg四个指标上均优于对比算法，能够集成大规模的结构化和非结构化数据，同时获得高精度的推荐结果，能为用户提供更准确的推荐结果，在融合异构数据方面也具有较强的灵活性。
33.上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：风电场内风机分布确定方法及装置与流程

一种基于知识图谱嵌入的协同过滤推荐方法

相关文献

最热文献