一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多相似度融合的科研合作者推荐方法

2022-04-25 00:24:51 来源:中国专利 TAG:

技术特征:
1.一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤如下:步骤1:对dblp引文网络数据集进行预处理,构建学术合作网络,节点代表学者,有合作关系的学者之间用边相连;步骤2:计算学者间的合作关系相似度,计算公式如下:其中,和分别代表学者a
m
和a
n
发表论文的总数量,是论文p
i
的发表年份,是两名学者第一篇合著论文的发表年份,t
c
是当前的年份;是两名学者合著论文的总数量;步骤3:使用doc2vec模型计算学者之间论文摘要的内容相似度,从而得到学者间的研究领域相似度;步骤4:计算学者间的学术水平相似度;利用余弦相似度来计算两个学者学术水平特征向量之间的相似性,计算公式如下:其中,l
m
和l
n
分别为学者a
m
和a
n
的学术水平特征向量;步骤5:将合作关系相似度、研究领域相似度以及学术水平相似度三个维度进行线性组合,作为学术合作网络中边的权重,其公式如下:w(a
m
,a
n
)=α
×
c(a
m
,a
n
) β
×
r(a
m
,a
n
) γ
×
a(a
m
,a
n
)其中,c(a
m
,a
n
)表示两个科研工作者和之间的合作关系相似度,r(a
m
,a
n
)表示两个科研工作者之间的研究领域相似度,a(a
m
,a
n
)表示科研工作者之间的学术水平相似度,α、β、γ为权重参数,且α β γ=1;步骤6:将待推荐的学者作为目标节点,在学术网络上进行随机游走,直至各个节点的分数趋于稳定状态,将所有的分值进行降序排序,然后取topn的学者推荐给目标学者。2.根据权利要求1所述的一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤3具体包括以下步骤:3.1)对论文摘要构成的语料库进行数据预处理,包括大小写转换、拼写错误检查、去停用词,最后保存在文本文件之中,之后将处理后的所有文档数据带入doc2vec模型进行训练,最后利用训练好的doc2vec模型,把每篇摘要转换成向量形式;3.2)计算论文摘要的内容相似度,计算公式如下:其中,p
i
和p
j
为两篇论文摘要所对应的向量表示形式;3.3)计算学者间的研究领域相似度,计算公式如下:其中,和分别表示学者a
m
和a
n
发表论文的总数,similarity(p
i
,p
j
)为论文p
i
和p
j
摘要之间的内容相似度。
3.根据权利要求1或2所述的一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤4中将学者的学术年龄、h-index、发表论文的数量、总被引次数和合作者数量五个指标组合作为学者的学术水平特征向量。4.根据权利要求1或2所述的一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤6中根据改进的重启型随机游走模型为目标学者推荐合作者,具体包括以下步骤:6.1)计算节点之间的转移概率,从节点e到节点f的转移概率计算公式如下:其中,w
e,f
为节点e和节点f之间边的权重,n(p
e
)为节点e的邻居节点集合;6.2)计算网络中各节点的分数,计算公式如下:其中,ar(p
e
)是节点p
e
对应的分数,n是网络中所有节点的个数,α为阻尼因子,m(p
e
)表示节点p
e
的所有邻居节点的集合,s
e,f
是从节点e到节点f的转移概率;6.3)对节点的分值进行迭代更新,直至各节点的分值趋于稳定状态,迭代公式如下:ar
(t 1)
=αs
·
ar
(t)
(1-α)q其中,ar
(t)
表示迭代到第t步时图中各节点的分数向量,表示在第t步时节点e的分数值,q代表重启向量,目标节点的值为1,其他节点设为0,初始状态下,ar
(0)
=q,s为转移概率矩阵。

技术总结
本发明公开一种基于多相似度融合的科研合作者推荐方法,融合了学者间的合作关系相似度、研究领域相似度以及学术水平相似度三个学术特征,其中合作关系相似度考虑了两个学者之间最近的合作时间、合著论文的次数两个因素,研究领域相似度通过学者论文摘要的内容相似度来衡量,学术水平相似度综合了学者的学术年龄、h-index、发表论文的数量、总被引次数和合作者数量五个学术指标进行衡量。之后通过学术大数据建立学术合作网络,将三个学术特征进行组合作为网络中边的权重,以此构建学者间的转移概率矩阵,最后通过改进的重启型随机游走算法来计算网络中各节点间的相似性,最后推荐的结果更加准确,从而为目标学者推荐最匹配的科研合作者。研合作者。研合作者。


技术研发人员:万良田 吴海南 孙璐 孔祥杰
受保护的技术使用者:大连理工大学
技术研发日:2022.01.04
技术公布日:2022/4/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献