一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

论文推荐的方法及装置、电子设备、存储介质

2022-09-01 10:35:51 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,尤其涉及一种论文推荐的方法及装置、电子设备、存储介质。


背景技术:

2.伴随着信息时代的发展,涌现出大量不同领域的学士论文,当用户想要快速地从大量的学士论文中,查找自己想要了解一个领域的学士论文时,系统会向用户推荐有关该领域的大量的学士论文。
3.现有的论文推荐的方式,在推荐论文的过程中,通过计算每两篇论文之间的相似度实现向用户推荐论文。当用户查看其中一篇论文时,系统会向用户推荐与该论文相似度较高的目标论文。
4.但是,由于从论文的相似度方面向用户推荐,而没有考虑到用户的需求方面,因此用户得到的推荐论文并不是用户本身想要了解的论文,从而导致无法准确地向用户推荐论文。


技术实现要素:

5.基于上述现有技术的不足,本技术提供了一种论文推荐的方法及装置、电子设备、存储介质,以解决现有技术推荐论文不准确的问题。
6.为了实现上述目的,本技术提供了以下技术方案:
7.本技术第一方面提供了一种论文推荐的方法,包括:
8.获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据;其中,所述论文关系图谱包括多篇论文之间的关系;
9.将所述论文关系图谱以及所述当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,得到所述论文关系图谱中的每篇所述论文的推荐值;其中,所述推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及所述论文关系图谱训练得到;
10.基于每篇所述论文的推荐值,向所述目标用户推荐所述论文。
11.可选地,在上述的论文推荐的方法中,其特征在于,所述推荐模型的训练方法,包括:
12.获取所述论文关系图谱以及多个样本用户的历史阅读行为数据;
13.针对多个所述样本用户,分别将所述论文关系图谱以及所述样本用户的历史阅读行为数据输入预先训练好的所述推荐模型中,通过所述推荐模型得到所述论文关系图谱中的每篇所述论文的推荐值;
14.判断各篇所述论文的推荐值是否均满足预设预期值;
15.若各篇所述论文的推荐值均满足所述预设预期值,则将所述推荐模型确定为训练好的推荐模型;
16.若各篇所述论文的推荐值均不满足所述预设预期值,则调整所述推荐模型的参数,返回执行所述将所述论文关系图谱以及所述样本用户的历史阅读行为数据输入预先训练好的所述推荐模型中,通过所述推荐模型得到所述论文关系图谱中的每篇所述论文的推荐值。
17.可选地,在上述的论文推荐的方法中,所述论文关系图谱的预先构建的方法,包括:
18.获取所述目标论文的完整背景信息;
19.从所述目标论文的完整背景信息中提取所述目标论文的关键信息;其中,所述关键信息包括实体信息以及各个所述实体之间的关系;
20.对所述关键信息进行图谱构建,得到所述论文关系图谱;
21.将目标论文确定为当前待处理论文;
22.针对所述当前待处理论文的每篇引用论文,判断所述引用论文是否满足传播条件;
23.若判断所述引用论文是否满足传播条件,则获取所述引用论文的关键信息;
24.利用所述引用论文的关键信息对所述论文关系图谱进行扩展;
25.将所述引用论文确定为当前待处理论文,并返回执行所述针对所述当前待处理论文的每篇引用论文,判断所述引用论文是否满足传播条件,直至不存在满足所述传播条件的引用论文,得到最终的所述论文关系图谱数据。
26.可选地,在上述的论文推荐的方法中,所述获取所述目标论文的完整背景信息,包括:
27.获取用户上传的待查找论文的部分信息;其中,所述部分信息至少包括论文标题和部分背景信息;
28.从所有论文对应的标题中查找与所述论文标题接近的各篇相似论文;
29.基于所述部分背景信息,从各篇所述相似论文中查找满足预设条件的目标论文;其中,所述预设条件指代包含与所述部分背景信息完全一致的背景信息;
30.从所述目标论文中提取所述目标论文对应的完整背景信息。
31.可选地,在上述的论文推荐的方法中,所述推荐模型包括输入层、序列提取层、交叉聚合层以及输出层,所述将所述论文关系图谱以及所述样本用户的历史阅读行为数据输入预先训练好的所述推荐模型中,通过所述推荐模型得到所述论文关系图谱中的每篇所述论文的推荐值,包括:
32.通过所述输入层对所述论文关系图谱以及所述样本用户的历史阅读行为数据进行特征处理,得到所述论文关系图谱对应的第一特征向量以及所述历史阅读行为数据对应的第二特征向量;
33.通过所述序列提取层对所述第二特征向量进行特征处理,得到特征序列矩阵;
34.通过序列提取层将所述特征序列矩阵与所述论文关系图谱对应的第一特征向量进行拼接,得到拼接特征向量;
35.通过交叉聚合层对所述拼接特征向量进行多阶交叉,得到交叉序列特征;
36.通过输出层对所述交叉序列特征进行处理,得到所述论文关系图谱中的每篇所述论文的推荐值。
37.本技术第二方面提供了一种论文推荐的装置,包括:
38.第一获取单元,用于获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据;其中,所述论文关系图谱包括多篇论文之间的关系;
39.第一输入单元,用于将所述论文关系图谱以及所述当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,得到所述论文关系图谱中的每篇所述论文的推荐值;其中,所述推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及所述论文关系图谱训练得到;
40.推荐单元,用于基于每篇所述论文的推荐值,向所述目标用户推荐所述论文。
41.可选地,在上述的论文推荐的装置中,还包括:
42.第二获取单元,用于获取所述论文关系图谱以及多个样本用户的历史阅读行为数据;
43.第二输入单元,用于针对多个所述样本用户,分别将所述论文关系图谱以及所述样本用户的历史阅读行为数据输入预先训练好的所述推荐模型中,通过所述推荐模型得到所述论文关系图谱中的每篇所述论文的推荐值;
44.第一判断单元,用于判断各篇所述论文的推荐值是否均满足预设预期值;
45.第一确定单元,用于若各篇所述论文的推荐值均满足所述预设预期值,则将所述推荐模型确定为训练好的推荐模型;
46.调整单元,用于若各篇所述论文的推荐值均不满足所述预设预期值,则调整所述推荐模型的参数,返回所述第二输入单元执行所述将所述论文关系图谱以及所述样本用户的历史阅读行为数据输入预先训练好的所述推荐模型中,通过所述推荐模型得到所述论文关系图谱中的每篇所述论文的推荐值。
47.可选地,在上述的论文推荐的装置中,还包括:
48.第三获取单元,用于获取所述目标论文的完整背景信息;
49.第一提取单元,用于从所述目标论文的完整背景信息中提取所述目标论文的关键信息;其中,所述关键信息包括实体信息以及各个所述实体之间的关系;
50.图谱构建单元,用于对所述关键信息进行图谱构建,得到所述论文关系图谱;
51.第二确定单元,用于将目标论文确定为当前待处理论文;
52.第二判断单元,用于针对所述当前待处理论文的每篇引用论文,判断所述引用论文是否满足传播条件;
53.第四获取单元,用于若判断所述引用论文是否满足传播条件,则获取所述引用论文的关键信息;
54.扩展单元,用于利用所述引用论文的关键信息对所述论文关系图谱进行扩展;
55.第三确定单元,用于将所述引用论文确定为当前待处理论文,并返回所述第二判断单元执行所述针对所述当前待处理论文的每篇引用论文,判断所述引用论文是否满足传播条件,直至不存在满足所述传播条件的引用论文,得到最终的所述论文关系图谱数据。
56.可选地,在上述的论文推荐的装置中,所述第三获取单元,包括:
57.第五获取单元,用于获取用户上传的待查找论文的部分信息;其中,所述部分信息至少包括论文标题和部分背景信息;
58.第一查找单元,用于从所有论文对应的标题中查找与所述论文标题接近的各篇相
似论文;
59.第二查找单元,用于基于所述部分背景信息,从各篇所述相似论文中查找满足预设条件的目标论文;其中,所述预设条件指代包含与所述部分背景信息完全一致的背景信息;
60.第二提取单元,用于从所述目标论文中提取所述目标论文对应的完整背景信息。
61.可选地,在上述的论文推荐的装置中,所述推荐模型包括输入层、序列提取层、交叉聚合层以及输出层,所述第二输入单元,包括:
62.第一处理单元,用于通过所述输入层对所述论文关系图谱以及所述样本用户的历史阅读行为数据进行特征处理,得到所述论文关系图谱对应的第一特征向量以及所述历史阅读行为数据对应的第二特征向量;
63.第二处理单元,用于通过所述序列提取层对所述第二特征向量进行特征处理,得到特征序列矩阵;
64.拼接单元,用于通过序列提取层将所述特征序列矩阵与所述论文关系图谱对应的第一特征向量进行拼接,得到拼接特征向量;
65.多阶交叉单元,用于通过交叉聚合层对所述拼接特征向量进行多阶交叉,得到交叉序列特征;
66.第三处理单元,用于通过输出层对所述交叉序列特征进行处理,得到所述论文关系图谱中的每篇所述论文的推荐值。
67.本技术第三方面提供了一种电子设备,包括:
68.存储器和处理器;
69.其中,所述存储器用于存储程序;
70.所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上述任意一项所述的论文推荐的方法。
71.本技术第四方面提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,用于实现如上述任意一项所述的论文推荐的方法。
72.本技术提供的一种论文推荐的方法,通过获取用户的阅读行为数据以及论文关系的图谱数据,以实现向用户推荐准确的各篇论文。通过获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据,其中,论文关系图谱包括多篇论文之间的关系,然后将论文关系图谱以及当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,最后得到论文关系图谱中的每篇论文的推荐值。由于推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及论文关系图谱训练得到。因此基于每篇论文的推荐值,向目标用户推荐论文。从而不再通过计算每两篇论文之间的相似度的方式来实现向用户推荐论文,而是根据用户的阅读行为数据以及论文关系的图谱数据,准确地向用户推荐各篇论文。
附图说明
73.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据
提供的附图获得其他的附图。
74.图1为本技术实施例提供的一种论文推荐的方法的流程图;
75.图2为本技术实施例提供的一种论文关系图谱的预先构建的方法的流程图;
76.图3为本技术实施例提供的一种获取论文的完整背景信息的方法的流程图;
77.图4为本技术实施例提供的一种推荐模型的训练方法的流程图;
78.图5为本技术实施例提供的一种推荐模型的网络结构示意图;
79.图6为本技术另一实施例提供的一种获得论文的推荐值的方法的流程图;
80.图7为本技术另一实施例提供的一种论文推荐的装置的结构示意图;
81.图8为本技术另一实施例提供的一种电子设备的结构示意图。
具体实施方式
82.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
83.在本技术中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
84.本技术实施例提供了一种论文推荐的方法,如图1所示,具体包括以下步骤:
85.s101、获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据。
86.其中,论文关系图谱包括多篇论文之间的关系,比如:多篇论文之间的引用关系,即“基于视频的人脸识别研究进展”可能引用了12篇论文,其中这12篇引用论文可能还存在引用其他的论文,然后可以将这些论文之间的引用关系进行构建,得到论文引用关系的知识图谱。并且论文关系图谱还可以包括论文本身的信息,比如:论文作者,撰写时间等等。
87.需要说明的是,预设时间段指代时间长度为预设阈值的时间段。可选地,预设阈值可以为12小时,当然,也可以是其他阈值,具体可以根据需求设置。
88.当前预设时间段内的阅读行为数据可以包括在对应时间段内阅读论文的点击数据以及过程数据,其中,点击数据可以包括用户在预设时间段内对某一篇论文所阅读的时间以及阅读的次数,比如:用户在3月18日这一天中,对“基于视频的人脸识别研究进展”在阅读时间上花费了2个小时,阅读的次数达到3次。过程数据可以包括用户在预设时间段内阅读一篇论文时,在单页停留的时间以及停留的阅读页码,比如:用户在3月17日这一天中,在阅读“基于视频的人脸识别研究进展”的过程中,在论文的第15页所停留了两个小时。
89.可选地,可以采用埋点的方式记录用户阅读的行为数据,即在系统中可以预留记录用户阅读行为数据的接口,当用户在阅读某一篇论文的阅读时间和阅读次数均达到预设
期望时,前端会通过系统提供的接口向后端发送满足要求的报告,然后基于用户的登录信息,将用户阅读该论文的行为数据以时间戳的方式作为关键信息存储至该用户对应的记录文件中。所以步骤s101相应的实施方式可以从目标用户对应的记录文件中获取目标用户的阅读行为数据。
90.可选地,本技术实施例提供了一种论文关系图谱的预先构建的方法,如图2所示,包括以下步骤:
91.s201、获取目标论文的完整背景信息。
92.需要说明的是,目标论文指代预先构建论文关系图谱的起始论文。
93.可选地,系统可以预先将用户曾阅读过的各篇论文缓存至本地,其次可以通过目标论文的doi,检测本地缓存的文件中是否存在以目标论文的doi作为文件名的目标文件,若检测出本地缓存的文件中存在以目标论文的doi作为文件名的目标文件,则从目标文件中获取目标论文的完整背景信息。若检测出本地缓存的文件中不存在以目标论文的doi作为文件名的目标文件,则可以根据目标论文的doi向论文数据库发送检索请求,相应地论文数据库会以xml文件的形式进行检索论文的反馈,然后需要对xml文件进行解析,得到目标论文的检索的结果,从而可以获取目标论文的完整背景信息。还需要说明的是,目标论文的doi指的是目标论文的论文标识。
94.可选地,在本技术另一实施例中,目标论文指代用户上传的待查找论文,所以步骤s201的另一种具体实施方式,如图3所示,包括以下步骤:
95.s301、获取用户上传的待查找论文的部分信息。
96.需要说明的是,由于各大论文平台提供的大多数论文信息均是不完整的信息,导致用户上传的待查证论文的信息也是十分有限,所以在本技术实施例中,只能获取到用户上传的待查找论文的部分信息。
97.其中,部分信息至少包括论文标题和部分背景信息。还需要说明的是,部分背景信息可以包括论文作者,出版社以及出版时间等等。
98.s302、从所有论文对应的标题中查找与论文标题接近的各篇相似论文。
99.s303、基于部分背景信息,从各篇相似论文中查找满足预设条件的目标论文。
100.其中,预设条件指代包含与部分背景信息完全一致的背景信息。
101.需要说明的是,用户上传的论文标题中,可能存在论文标题不完整或者部分标题存在错误的情况,所以还需要基于待查找论文的部分背景信息,从各篇标题相似的论文中,筛选出与部分背景信息完全一致的目标论文,所以目标论文才是用户真正所待查找的论文。
102.s304、从目标论文中提取目标论文对应的完整背景信息。
103.具体的,目标论文对应的完整背景信息为撰写目标论文的相关信息,比如:完整背景信息中包括该目标论文的标题、撰写作者以及论文标识等相关信息。
104.s202、从目标论文的完整背景信息中提取目标论文的关键信息。
105.其中,关键信息包括实体信息以及各个实体之间的关系。
106.需要说明的是,完整背景信息中包含了目标论文的大量信息,但并不是所有的信息都可以用来构建知识图谱的,所以需要从目标论文的完整背景信息中提取出可以用于构建知识图谱的数据。比如:目标论文的完整背景信息中涉及了“论文标题”、“作者”、“论文标
识”这三个重要信息,其中,这三个重要信息均为构建知识图谱的关键信息。
107.s203、对关键信息进行图谱构建,得到论文关系图谱。
108.需要说明的是,利用关键信息进行图谱构建,例如,可以采用三元组的方式,其中,三元组由两个实体和一个关系构成,实体可以是论文或者作者,关系为两个实体之间的联系,例如《论文a,引用,论文b》或者《论文a,作者,作者名》等形式,从而得到论文关系图谱。
109.s204、将目标论文确定为当前待处理论文。
110.s205、针对当前待处理论文的每篇引用论文,判断引用论文是否满足传播条件。
111.可选地,传播条件可以根据用户的需求进行设定,当然,也可以是其他设定条件,具体可以根据需求设置。所以当用户的需求为传播引用论文时,判定引用论文满足传播条件,则执行步骤s206。当用户的需求为不需要传播引用论文时,判定引用论文未满足传播条件,则可以直接获取步骤s203中的论文关系图谱。
112.s206、获取引用论文的关键信息。
113.s207、利用引用论文的关键信息对论文关系图谱进行扩展。
114.需要说明的是,扩展指的是将引用论文的关键信息添加到论文关系图谱中,即将具有引用关系的各篇论文进行连接。
115.s208、将引用论文确定为当前待处理论文。
116.需要说明的是,当引用论文的关键信息扩展完论文关系图谱之后,需要将引用论文确定为当前待处理论文,避免后续重复地对引用论文的关键信息进行图谱的扩展,影响下一篇引用论文的图谱扩展。并且还需要返回执行步骤s205,直至不存在满足传播条件的引用论文,得到最终的论文关系图谱数据。
117.s102、将论文关系图谱以及当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,得到论文关系图谱中的每篇论文的推荐值。
118.其中,推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及论文关系图谱训练得到。
119.需要说明的是,历史预设时间段指代过去的时间长度为历史预设阈值的时间段。
120.可选地,历史预设阈值可以为8个小时,当然,也可以是其他阈值时间,具体可以根据需求设置。
121.可选地,本技术实施例提供了一种推荐模型的训练方法,如图4所示,包括以下步骤:
122.s401、获取论文关系图谱以及多个样本用户的历史阅读行为数据。
123.需要说明的是,步骤s401的具体实施方式可相应地参考步骤s101,此处不再赘述。
124.s402、针对多个样本用户,分别将论文关系图谱以及样本用户的历史阅读行为数据输入预先训练好的推荐模型中,通过推荐模型得到论文关系图谱中的每篇论文的推荐值。
125.可选地,推荐模型可以基于循环神经网络(rerrent neural network,rnn)、长短期记忆网络(long short-term memory,lstm)以及门循环单元(gate recurrent unit,gru)的神经网络机制进行构建,所以在本技术实施例中,基于神经网络机制对推荐模型进行训练,得到训练结果。
126.可选地,在本技术另一实施例中,如图5所示推荐模型可以包括输入层、序列提取
层、交叉聚合层以及输出层,相应地在本技术实施例中,步骤s402的一种具体实施方式,如图6所示,包括以下步骤:
127.s601、通过输入层对论文关系图谱以及样本用户的历史阅读行为数据进行特征处理,得到论文关系图谱对应的第一特征向量以及历史阅读行为数据对应的第二特征向量。
128.具体的,通过输入层将论文关系图谱以及样本用户的历史阅读行为数据处理为向量的形式,即将各项数据用相应的数值进行表示。
129.s602、通过序列提取层对第二特征向量进行特征处理,得到特征序列矩阵。
130.需要说明的是,样本用户的历史阅读行为数据中还包括了论文之间的序列关系,所以可以通过序列提取层对第二特征向量进行特征提取,从第二特征向量中提取出论文之间的序列关系,从而得到特征序列矩阵。比如:用户首先阅读了论文a、其次阅读论文b、最后阅读论文c,根据阅读的时间顺序,可以得到论文a

论文b

论文c的时间序列关系。
131.s603、通过序列提取层将特征序列矩阵与论文关系图谱对应的第一特征向量进行拼接,得到拼接特征向量。
132.需要说明的是,通过序列提取层将论文关系图谱之间的相关性乘积拼接到特征序列矩阵上,可以有效地提高论文之间的序列关系,减弱噪声对序列化提取的影响。
133.s604、通过交叉聚合层对拼接特征向量进行多阶交叉,得到交叉序列特征。
134.具体的,通过交叉聚合层对拼接特征向量进行处理是为了获取论文序列中的子序列关系,比如:存在序列关系的5篇论文:论文a

论文b

论文c

论文d

论文e,其中,论文a与论文c属于同一领域,论文b、论文d以及论文e是属于另一领域,因此可通过交叉聚合层将该序列关系拆分为论文a

论文c以及论文b

论文d

论文e,得到两个子序列关系。还需要说明的是,可通过计算公式的方式对拼接向量进行多阶交叉,比如:
135.计算公式为(a b c)2=a2 b2 c2 2ab 2ac 2bc
136.移项后可得到其中,a、b、c均代表用户阅读的论文,以及一个字母对应一篇论文。从而可以实现模型的线性计算的复杂度。
137.s605、通过输出层对交叉序列特征进行处理,得到论文关系图谱中的每篇论文的推荐值。
138.s403、判断各篇论文的推荐值是否均满足预设预期值。
139.可选地,步骤s403中的通过推荐模型得到论文关系图谱中的每篇论文的推荐值可能不满足用户阅读这些论文的需求,所以还需要对每篇论文的推荐值进一步的判断,所以再得到论文关系图谱中的每篇论文的推荐值之后,会判断各篇论文的推荐值是否均满足预设预期值,若各篇论文的推荐值均满足预设预期值,说明各篇论文的推荐值均满足用户阅读论文的需求,则执行步骤s404。若各篇论文的推荐值均不满足预设预期值,说明需要对推荐模型进行迭代训练,则执行步骤s405。
140.s404、将推荐模型确定为训练好的推荐模型。
141.s405、调整推荐模型的参数。
142.需要说明的是,当各篇论文的推荐值均不满足预设预期值时,需要返回执行步骤s402,直至各篇论文的推荐值均满足预设预期值。
143.s103、基于每篇论文的推荐值,向目标用户推荐论文。
144.可选地,可以将每篇论文按照推荐值高到低的顺序进行排序,依次向用户推荐论文。也可以按照推荐值的高低情况,仅将排名靠前n位的论文,依次向用户推荐。当然,也可以是基于推荐值采用其他的推荐策略,具体的可以根据需求设定。
145.本技术提供的一种论文推荐的方法,通过获取用户的阅读行为数据以及论文关系的图谱数据,以实现向用户推荐准确的各篇论文。通过获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据,其中,论文关系图谱包括多篇论文之间的关系,然后将论文关系图谱以及当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,最后得到论文关系图谱中的每篇论文的推荐值。由于推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及论文关系图谱训练得到。因此基于每篇论文的推荐值,向目标用户推荐论文。从而不再通过计算每两篇论文之间的相似度的方式来实现向用户推荐论文,而是根据用户的阅读行为数据以及论文关系的图谱数据,准确地向用户推荐各篇论文。
146.本技术另一实施例提供了一种论文推荐的装置,如图7所示,包括:
147.第一获取单元701,用于获取预先构建的论文关系图谱以及目标用户在当前预设时间段内的阅读行为数据。
148.其中,论文关系图谱包括多篇论文之间的关系。
149.第一输入单元702,用于将论文关系图谱以及当前预设时间段内的阅读行为数据输入预先训练好的推荐模型中,得到论文关系图谱中的每篇论文的推荐值。
150.其中,推荐模型预先利用多个用户在历史预设时间段内的历史阅读行为数据以及论文关系图谱训练得到。
151.推荐单元703,用于基于每篇论文的推荐值,向目标用户推荐论文。
152.需要说明的是,本技术实施例中的上述单元的具体工作过程可相应地参考上述方法实施例中的步骤s101~步骤s103,此处不再赘述。
153.可选地,本技术另一实施例中,还包括以下单元:
154.第二获取单元,用于获取论文关系图谱以及多个样本用户的历史阅读行为数据。
155.第二输入单元,用于针对多个样本用户,分别将论文关系图谱以及样本用户的历史阅读行为数据输入预先训练好的推荐模型中,通过推荐模型得到论文关系图谱中的每篇论文的推荐值。
156.第一判断单元,用于判断各篇论文的推荐值是否均满足预设预期值。
157.第一确定单元,用于若各篇论文的推荐值均满足预设预期值,则将推荐模型确定为训练好的推荐模型。
158.调整单元,用于若各篇论文的推荐值均不满足预设预期值,则调整推荐模型的参数,返回第二输入单元执行将论文关系图谱以及样本用户的历史阅读行为数据输入预先训练好的推荐模型中,通过推荐模型得到论文关系图谱中的每篇论文的推荐值。
159.需要说明的是,本技术上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
160.可选地,本技术另一实施例中,还包括以下单元:
161.第三获取单元,用于获取目标论文的完整背景信息。
162.第一提取单元,用于从目标论文的完整背景信息中提取目标论文的关键信息。
163.其中,关键信息包括实体信息以及各个实体之间的关系。
164.图谱构建单元,用于对关键信息进行图谱构建,得到论文关系图谱。
165.第二确定单元,用于将目标论文确定为当前待处理论文。
166.第二判断单元,用于针对当前待处理论文的每篇引用论文,判断引用论文是否满足传播条件。
167.第四获取单元,用于若判断引用论文是否满足传播条件,则获取引用论文的关键信息。
168.扩展单元,用于利用引用论文的关键信息对论文关系图谱进行扩展。
169.第三确定单元,用于将引用论文确定为当前待处理论文,并返回第二判断单元执行针对当前待处理论文的每篇引用论文,判断引用论文是否满足传播条件,直至不存在满足传播条件的引用论文,得到最终的论文关系图谱数据。
170.需要说明的是,本技术上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
171.可选地,本技术另一实施例中,第三获取单元,包括:
172.第五获取单元,用于获取用户上传的待查找论文的部分信息。
173.其中,部分信息至少包括论文标题和部分背景信息。
174.第一查找单元,用于从所有论文对应的标题中查找与论文标题接近的各篇相似论文。
175.第二查找单元,用于基于部分背景信息,从各篇相似论文中查找满足预设条件的目标论文。
176.其中,预设条件指代包含与部分背景信息完全一致的背景信息。
177.第二提取单元,用于从目标论文中提取目标论文对应的完整背景信息。
178.需要说明的是,本技术上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
179.可选地,本技术另一实施例中,推荐模型包括输入层、序列提取层、交叉聚合层以及输出层,第二输入单元,包括:
180.第一处理单元,用于通过输入层对论文关系图谱以及样本用户的历史阅读行为数据进行特征处理,得到论文关系图谱对应的第一特征向量以及历史阅读行为数据对应的第二特征向量。
181.第二处理单元,用于通过序列提取层对第二特征向量进行特征处理,得到特征序列矩阵。
182.拼接单元,用于通过序列提取层将特征序列矩阵与论文关系图谱对应的第一特征向量进行拼接,得到拼接特征向量。
183.多阶交叉单元,用于通过交叉聚合层对拼接特征向量进行多阶交叉,得到交叉序列特征。
184.第三处理单元,用于通过输出层对交叉序列特征进行处理,得到论文关系图谱中的每篇论文的推荐值。
185.需要说明的是,本技术上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤,此处不再赘述。
186.本技术另一实施例提供了一种电子设备,如图8所示,包括:
187.存储器801和处理器802。
188.其中,存储器801用于存储程序。
189.处理器802用于执行程序,程序被执行时,具体用于实现如上述任意一个实施例提供的论文推荐的方法。
190.本技术另一实施例提供了一种计算机存储介质,用于存储计算机程序,计算机程序被执行时,用于实现如上述任意一个实施例提供的论文推荐的方法。
191.计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
192.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
193.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献