一种基于知识图谱的数据推送方法、系统和存储介质

2022-05-11 15:34:08 来源：中国专利 TAG：

1.本发明涉及知识图谱领域，尤其是涉及一种基于知识图谱的数据推送方法、系统和存储介质。

背景技术：

2.知识爆炸时代，高等教育已进入知识量大、学科交叉强、知识更新速度快的阶段，也对专业知识交叉融合提出了更高的要求。为成长为高校复合型人才，高校学生需要具备构建全面综合知识体系的能力。而面对当今大数据时代爆发式增长的教育知识资源，高校学生存在难以准确获取专业交叉知识的窘境，这也成为高校交叉学科人才培养所必须迎接的挑战。然而，许多传统高校学科专业设置的壁垒仍然存在，教学实践处于独立开展、跨学科综合课程少等状态。学生缺少对本专业或跨专业课程知识点的系统性了解，知识点之间缺乏系统性衔接；不同课程授课内容差异大，缺乏知识连贯性；理论课程安排与技能实践教学之间无法快速对接，这些原因导致教学的不连贯，进而造成学生所学知识点在宏观角度呈零散独立状态。
3.由于学生自身知识积累的限制，缺乏精准度和专业性，且难以发现知识点间的隐性关联和长路径关联。现有针对知识的推送方法主要是提取知识数据的特征，基于特征对知识数据进行融合，将融合后的结果推送给用户。但是由于需要对所有知识数据进行实时更新和处理，该方法无法及时地进行动态调整，且在学生进行检索时，由于处理的数据量较大，获取推送的时间也较长，效率低，无法应对当下庞大大学生群体即时获取知识的需求。

技术实现要素：

4.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识图谱的数据推送方法、系统和存储介质。
5.本发明的目的可以通过以下技术方案来实现：
6.一种基于知识图谱的数据推送方法，包括以下步骤：
7.s1、获取用户检索的问题，问题中包含至少两个知识关键词，提取问题中的知识关键词，根据知识关键词，在知识图谱中获取对应的最小知识子树；
8.s2、根据最小知识子树中所有与知识关键词相关的节点信息和边信息，建立候选知识子树，根据评分规则对所有候选知识子树进行分数排序，对候选知识子树进行筛选；
9.s3、根据用户的历史检索中每一次获取的候选知识子树建立个性化模型，将个性化模型函数值最高的知识节点进行推送。
10.进一步地，所述的评分规则具体包括：
11.根据以下表达式对候选知识子树进行评分：
[0012][0013]
其中，score(target)表示评分，t表示候选知识子树的根节点，α表示紧密度，β表
示精准度，num(ek)和n均表示候选知识子树节点的数量，num(rk)表示候选知识子树边的数量，表示每个节点到根节点的最短距离。
[0014]
进一步地，所述个性化模型的建立方法如下：
[0015]
a1、获取候选知识子树中每个节点到其它节点的距离并求和，根据中心度确定中心知识节点；
[0016]
a2、根据用户的历史检索记录，获取每一次检索的候选知识子树的中心知识节点，建立中心知识点集；
[0017]
a3、计算中心知识点集中心知识点与后一次检索的中心知识点的相关性；
[0018]
a4、根据相关性和中心知识节点的中心度，建立个性化模型t(o
i 1
)，表达式如下：
[0019]
t(o
i 1
)＝αsim(oi,o
i 1
) βcore(o
i 1
)
[0020]
其中，α表示紧密度，β表示精准度，sim(oi,o
i 1
)表示相关性，core(o
i 1
)表示中心度。
[0021]
进一步地，所述中心度的计算表达式如下：
[0022][0023]
其中，e
x
表示当前节点，n(e
x
)表示e
x
的邻节点，l(ej,ek)＝0表示节点ej和节点ek之间不存在连边，l(ej,ek)＝1表示节点ej和节点ek之间存在连边。
[0024]
进一步地，所述相关性sim(ok,o
k 1
)的计算表达式如下：
[0025][0026][0027][0028]
其中，dist表示平均路径长度，ok表示中心知识点集中第k次检索时的中心知识点，p(ei,e
i 1
)表示关系权重，sp.len(oi,o
i 1
)表示oi到o
i 1
之间的最短路径长度，num(r)代表关系r在路径中出现的次数，e代表两个中心知识点之间最短路径上的知识点，w表示支持度。
[0029]
进一步地，在获取中心知识节点后，将中心知识节点反馈给用户。
[0030]
进一步地，当用户没有历史检索记录时，从最小知识子树中随机推送知识节点。
[0031]
进一步地，在执行步骤s2后，将筛选出的评分前k的候选知识子树对应的知识信息输送给用户端。
[0032]
一种基于知识图谱的数据推送系统，包括存储器和处理器；所述存储器，用于存储计算机程序；所述处理器，用于当执行所述计算机程序时，实现上述基于知识图谱的数据推送方法。
[0033]
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的一种基于知识图谱的数据推送方法的步骤。
[0034]
与现有技术相比，本发明具有以下优点：
[0035]
1、本发明基于知识图谱，建立了最小知识子树并根据子树的边信息，即知识点之间的关系，建立了候选知识子树，同时结合了用户的历史检索记录建立个性化模型对用户进行了推送，相比起现有技术依赖于数据特征计算的推送方法，本方法无需对数据特征进行繁琐的计算，只需通过现有的知识点与知识点之间的关系即可完成推送，在用户对知识点进行检索时可以快速将知识反馈给用户，推送效率高。且知识图谱具有实时更新的特点，可以保证用户能获取实时的知识信息。
[0036]
2、本发明中个性化模型结合了历史检索中心知识节点的相关性以及中心度，使得个性化模型更能反映真实用户检索的需求，保证了推送内容的合理性。
附图说明
[0037]
图1为本发明的流程示意图。
[0038]
图2为本发明检索和推荐完整流程示意图。
具体实施方式
[0039]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。
[0040]
本实施例提供了一种基于知识图谱的数据推送方法，如图1所示，具体包括以下步骤：
[0041]
步骤s1、获取用户检索的问题，问题中包含至少两个知识关键词，提取问题中的知识关键词，根据知识关键词，在知识图谱中获取对应的最小知识子树。
[0042]
其中，知识图谱来源于专家系统、领域数据库、知网、选课系统及文献等教学相关内容，具体包括节点和边，其中节点中存储的是关于知识点的信息，比如匹配分析法、条件概率等就是一个节点，边存储的是不同知识点之间的关联信息，比如混杂因素是匹配分析法的评价，评价即为边信息。根据检索问题中的知识关键词，提取出知识图谱中存在知识关键词的部分作为最小知识子树。
[0043]
步骤s2、根据最小知识子树中所有与知识关键词相关的节点信息和边信息，建立候选知识子树，根据评分规则对所有候选知识子树进行分数排序，对候选知识子树进行筛选。
[0044]
其中，建立候选知识子树的过程为将知识节点与边相联系的过程，比如检索知识点“匹配分析法”时，可能获取的候选知识子树转化后即是包含节点信息和边信息的完整知识点信息，如“条件概率是匹配分析法的前驱知识点”。
[0045]
在获取了所有候选知识子树后，根据以下表达式对候选知识子树进行评分：
[0046][0047]
其中，score(target)表示评分，t表示候选知识子树的根节点，α表示紧密度，β表示精准度，num(ek)和n均表示候选知识子树节点的数量，num(rk)表示候选知识子树边的数
量，表示每个节点到根节点的最短距离。
[0048]
最终保留评分最高的候选知识子树。
[0049]
步骤s3、根据用户的历史检索中每一次获取的候选知识子树建立个性化模型，将个性化模型函数值最高的知识节点进行推送。
[0050]
推送方法时基于用户历史检索记录完成的，基于大数据的思想对用户推送最具符合用户兴趣的内容，如果用户从来没有检索过内容，即没有历史检索内容，则在步骤s1中获取的最小知识子树中随机推送知识节点作为推送的内容。
[0051]
每一次历史检索记录均会对应一个经过筛选的候选知识子树，根据这些候选知识子树建立个性化模型，建立过程如下：
[0052]
步骤a1、获取候选知识子树中每个节点到其它节点的距离并求和，根据中心度确定中心知识节点，并反馈给用户。
[0053]
其中，中心度的计算表达式如下：
[0054][0055]
其中，e
x
表示当前节点，n(e
x
)表示e
x
的邻节点，l(ej,ek)＝0表示节点ej和节点ek之间不存在连边，l(ej,ek)＝1表示节点ej和节点ek之间存在连边。
[0056]
步骤a2、根据用户的历史检索记录，获取每一次检索的候选知识子树的中心知识节点，建立中心知识点集o＝{o1,o2,...,ok}。
[0057]
步骤a3、计算中心知识点集中心知识点与后一次检索的中心知识点的相关性。
[0058]
其中相关性sim(ok,o
k 1
)的计算表达式如下：
[0059][0060][0061][0062]
其中，ok表示中心知识点集中第k次检索时的中心知识点，p(ei,e
i 1
)表示关系权重，sp.len(oi,o
i 1
)表示oi到o
i 1
之间的最短路径长度，num(r)代表关系r在路径中出现的次数，e代表两个中心知识点之间最短路径上的知识点，w表示支持度，dist表示平均路径长度，采用oi到o
i 1
之间最短路径长度sp.len(oi,o
i 1
)的平均值，其中决定最短路径的边信息评分通过人为进行定义，比如“前驱”和“评价”的评分均为0.5，其它关系皆为0，平均路径长度具体表示为：
[0063][0064]
步骤a4、根据相关性和中心知识节点的中心度，建立个性化模型t(o
i 1
)，表达式如下：
[0065]
t(o
i 1
)＝αsim(oi,o
i 1
) βcore(o
i 1
)
[0066]
通过表达式可看出，个性化模型反映了每一次包括本次在内的历史检索记录的中
心知识点的相关性和中心度，选取个性化模型函数值最高的中心知识点，将其推送给用户。
[0067]
用户端的使用流程如图2所示，具体如下：
[0068]
首先用户提出问题，例如“匹配分析法”和“朴素贝叶斯分类器”间有何关联。
[0069]
然后通过知识关键词“匹配分析法”和“朴素贝叶斯分类器”的提取，在知识图谱中对关键词进行定位，并根据边信息建立候选知识子树，有三棵知识树可以定位到知识关键词。
[0070]
根据上述步骤s2中的方法计算候选知识子树的评分，三个候选知识子树的评分排名为a《b《c。
[0071]
假设选取评分前2的候选知识子树作为后续的推送内容，此时用户将同时会收到这两个候选知识子树对应的知识信息和知识节点信息。
[0072]
选取候选知识子树b作为建立个性化模型的内容，先根据中心度确定中心知识点，并结合相关性建立个性化模型，最终在个性化模型中选取函数值最高的知识点进行推送，即最后推送“伯努利模型”。
[0073]
本实施例还提供了一种基于知识图谱的数据推送系统，包括存储器和处理器；存储器，用于存储计算机程序；处理器执行上述基于知识图谱的数据推送方法。
[0074]
本实施例又提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中提到的基于知识图谱的数据推送方法，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0075]
以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于进化框架的模糊对抗生成网络风功率预测方法及装置

一种基于知识图谱的数据推送方法、系统和存储介质

相关文献

最热文献