一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于关联图谱和机器学习的文档混合推荐方法及其应用与流程

2021-11-15 18:00:00 来源:中国专利 TAG:

技术特征:
1.一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,包括步骤:构建文档关联图谱,所述文档关联图谱用于表示文档库中每个文档与文档中命名实体的关系;从待推荐文档中提取命名实体和关键词;根据所述文档关联图谱计算所述待推荐文档与所述文档库中文档的文档节点相似度;计算所述待推荐文档与所述文档库中文档的关键词相似度;根据所述文档节点相似度和所述关键词相似度从所述文档库中获取推荐文档。2.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,所述文档关联图谱的节点包括文档节点和命名实体节点,所述文档节点和所述命名实体节点的边根据文档与命名实体的包含关系确定。3.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,所述构建文档关联图谱包括步骤:对所述文档库中每个文档进行预处理,提取每个文档的命名实体;定义文档类、命名实体类和关系类,并定义文档类的属性和属性限制、命名实体类的属性和属性限制、以及关系类的属性和属性限制;为所述文档库中每个文档提取的命名实体创建文档类、命名实体类和关系类的实例,生成所述文档关联图谱。4.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,采用线性链条件随机场模型提取命名实体,线性链条件随机场的定义如下:其中,x表示观测序列,y表示对应的命名实体标注序列,p(y|x)表示为命名实体y的概率,ω是对应的权重,f是特征函数,t是观测序列x的长度,k是定义在该观测序列x的局部特征函数的总个数,t是当前字符在观测序列x中的位置,特征函数f仅依赖当前和前一个位置,z(x)为归一化函数。5.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,所述计算所述待推荐文档与所述文档库中文档的文档节点相似度的计算公式为:其中,s(a,b)为所述文档节点相似度,a为所述待推荐文档的文档节点,b为所述文档库中待比较文档的文档节点,o(a)表示节点a的出度,oi(a)表示文档a指向的第i个节点的出度,o(b)表示节点b的出度,oj(b)表示文档b指向的第j个节点的出度,s(oi(a),oj(b))表示节点a指向的第i个节点与节点b指向的第j个节点的相似度,c是阻尼系数,c∈(0,1)。6.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,所述计算所述待推荐文档与所述文档库中文档的关键词相似度的计算公式为:
其中,s(a,b)表示所述关键词相似度,a为所述待推荐文档的关键词tf

idf值向量,b为所述文档库中待比较文档的关键词tf

idf值向量,向量a和向量b都是n维向量,向量a为[a1,a2,

,a
n
],a
i
为向量a的第i个标量,向量b为[b1,b2,

,b
n
],b
i
为向量b的第i个标量。7.如权利要求1所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,所述根据所述文档节点相似度和所述关键词相似度从所述文档库中获取推荐文档包括步骤:预先设置所述文档节点相似度和所述关键词相似度的权重系数,根据所述权重系数对所述文档节点相似度和所述关键词进行加权,计算文档综合相似度;根据所述文档综合相似度获取推荐文档。8.如权利要求7所述的一种基于关联图谱和机器学习的文档混合推荐方法,其特征在于,根据文档综合相似度获取推荐文档包括步骤:从所述文档库库中的所有文档组成的数列中随机挑出一个文档元素,该文档称为“基准”,该文档对应的文档综合相似度称为“基准值”;重新排序数列,文档综合相似度小于基准值的所有元素放置在基准前面,文档综合相似度大于基准值的所有元素比放置在基准后面;递归地对小于基准值的所有元素组成的子数列和大于基准值的所有元素组成的子数列排序;通过排序算法获得相似度在预设阈值以上的文档作为推荐文档。9.一种基于关联图谱和机器学习的文档混合推荐系统,其特征在于,包括:知识图谱构建模块,用于构建文档关联图谱,所述文档关联图谱用于表示文档库中每个文档与文档中命名实体的关系;识别模块,用于从待推荐文档中提取命名实体和关键词;节点相似度计算模块,用于根据所述文档关联图谱计算所述待推荐文档与所述文档库中文档的文档节点相似度;关键词相似度计算模块,用于计算所述待推荐文档与所述文档库中文档的关键词相似度;推荐模块,用于根据所述文档节点相似度和所述关键词相似度从所述文档库中获取推荐文档。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的方法。

技术总结
本发明公开了一种基于关联图谱和机器学习的文档混合推荐方法及其应用。该方法包括步骤:构建文档关联图谱,所述文档关联图谱用于表示文档库中每个文档与文档中命名实体的关系;从待推荐文档中提取命名实体和关键词;根据所述文档关联图谱计算所述待推荐文档与所述文档库中文档的文档节点相似度;计算所述待推荐文档与所述文档库中文档的关键词相似度;根据所述文档节点相似度和所述关键词相似度从所述文档库中获取推荐文档。本发明可以实现更智能、精确度更高的文档推荐,并适用各种主题的文档。题的文档。题的文档。


技术研发人员:王龙 张海粟 王旭 朱明东 祁超 丁麒麟
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:2021.07.16
技术公布日:2021/11/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献