一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种知识本体信息的搜索方法与流程

2022-08-13 12:10:37 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种知识本体信息的搜索方法。


背景技术:

2.随着公安行业信息化手段的飞速发展,公安行业存在大量的数据库和信息系统的应用。
3.但是由于公安行业处理信息的形式多样,其中存在大量重复和关联数据,现有系统在搜索数据时,只能找到与搜索目标完全匹配的词汇及其相关文本。搜索结果的范围较窄,获取的信息量较少。


技术实现要素:

4.本发明的目的在于提供一种知识本体信息的搜索方法,旨在解决现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
5.为实现上述目的,本发明提供了一种知识本体信息的搜索方法,包括以下步骤:
6.建立分析数据集,并基于所述分析数据集建立树状检索模型;
7.提取查询请求中的索引号;
8.将所述索引号输入所述树状检索模型进行检索,得到受控词;
9.基于所述分析数据集建立相似度模型;
10.将所述受控词输入所述相似度模型,得到多个拓展词;
11.将所述受控词和多个所述拓展词整合,得到搜索结果。
12.其中,所述建立分析数据集,并基于所述分析数据集建立树状检索模型的具体方式为:
13.建立分析数据集;
14.对所述分析数据集进行聚类分析,得到聚类结果;
15.基于所述聚类结果从所述分析数据集中提取底层数据;
16.基于所述底层数据构建树状检索模型。
17.其中,所述基于所述底层数据构建树状检索模型的具体方式为:
18.基于所述底层数据对所述分析数据集进行树状排布,得到树状结构数据架;
19.基于所述树状架构数据加生成索引表;
20.将所述索引表对应至所述树状结构数据架上,得到树状检索模型。
21.其中,所述将所述索引号输入所述树状检索模型进行检索,得到受控词的具体方式为:
22.基于所述索引号在所述树状检索模型的所述索引表中确定出索引字段;
23.基于所述索引字段从所述树状结构数据架中检索出对应的受控词。
24.其中,所述基于所述分析数据集建立相似度模型的具体方式为:
25.利用语法解析对所述分析数据集进行解析,得到解析文本;
26.通过文本概念拓展机制对所述解析文本进行拓展,得到拓展文本;
27.对所述拓展文本和所述分析数据集的相似度进行加权计算,得到相似度模型。
28.本发明的一种知识本体信息的搜索方法,通过建立分析数据集,并基于所述分析数据集建立树状检索模型;提取查询请求中的索引号;将所述索引号输入所述树状检索模型进行检索,得到受控词;基于所述分析数据集建立相似度模型;将所述受控词输入所述相似度模型,得到多个拓展词;将所述受控词和多个所述拓展词整合,得到搜索结果,本发明通过对所述树状检索模型检索出的受控词进行概念拓展,得到了与所述受控词相关了所述拓展词,增加了搜索结果的范围,解决了现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
附图说明
29.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
30.图1是本发明提供的一种知识本体信息的搜索方法的流程图。
31.图2是建立分析数据集,并基于所述分析数据集建立树状检索模型的流程图。
32.图3是基于所述底层数据构建树状检索模型的流程图。
33.图4是将所述索引号输入所述树状检索模型进行检索,得到受控词的流程图。
34.图5是基于所述分析数据集建立相似度模型的流程图。
具体实施方式
35.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
36.请参阅图1至图5,本发明提供一种知识本体信息的搜索方法,包括以下步骤:
37.s1建立分析数据集,并基于所述分析数据集建立树状检索模型;
38.具体方式为:
39.s11建立分析数据集;
40.具体的,获取公安领域的基础数据集合,并基于所述基础数据集合建立一个分析数据集。所述基础数据集合包含大量实际案件数据、办公文档和公安标。
41.s12对所述分析数据集进行聚类分析,得到聚类结果;
42.具体的,聚类分析是数据库中的一种数据挖掘技术,首先进行自由聚类,然后计算每个分类的特征值及其比例,并根据特征值在分类中的比例设置阈值,根据特征值是否达到阈值对分类进行合并,对于特征值达到阈值,并且特征一致的分类进行合并。根据计算得出的结果设置聚类分析中的分类数等聚类参数和规则,对全部数据重新进行聚类分析,然后重复上述步骤,最后可以得到一个合乎公安业务需要,并且不可拆分也不可合并的分类,这样就可以将案件信息拆分成人、物、时空、警务管理、组织机构和行为六个基本要素,即所述聚类结果。
43.s13基于所述聚类结果从所述分析数据集中提取底层数据;
44.s14基于所述底层数据构建树状检索模型。
45.具体方式为:
46.s141基于所述底层数据对所述分析数据集进行树状排布,得到树状结构数据架;
47.具体的,以六个基本要素作为分支节点,基于所述底层数据对所述分析数据集进行树状排布,得到树状结构数据架,可便于后续通过基本要素进行相关检索。
48.s142基于所述树状架构数据加生成索引表;
49.s143将所述索引表对应至所述树状结构数据架上,得到树状检索模型。
50.s2提取查询请求中的索引号;
51.具体的,对所述查询请求进行特征提取,得到索引号。
52.s3将所述索引号输入所述树状检索模型进行检索,得到受控词;
53.具体方式为:
54.s31基于所述索引号在所述树状检索模型的所述索引表中确定出索引字段;
55.s32基于所述索引字段从所述树状结构数据架中检索出对应的受控词。
56.具体的,通过所述索引字段准确有效的从所述树状结构数据架检索出受控词,减少查找时间,从而提高检索效率。
57.s4基于所述分析数据集建立相似度模型;
58.具体方式为:
59.s41利用语法解析对所述分析数据集进行解析,得到解析文本;
60.具体的,在文本的初始概念表征中,所述分析数据集的文本所包含的概念对应维度的值为1,文本中没有的概念对应维度的值则为0。
61.s42通过文本概念拓展机制对所述解析文本进行拓展,得到拓展文本;
62.具体的,其目的在于根据文本中现有的概念,结合外部知识以及数据内的关联关系,扩展得到与文本语义相关但是文本中不包含的概念,从而减少模态间的信息差,达到更好的对齐效果。
63.具体方式为:
64.s421利用外部知识库找到不同概念间的联系,得到常识知识图谱;
65.具体的,利用外部知识库conceptnet,找到不同概念间的联系,构建出以概念为节点,连边表示概念间的联系的常识知识图谱。
66.s422利用所述解析文本中包含概念的共现频率构建关联知识图谱;
67.具体的,利用一条文本中包含的概念的共现的频率,构建出以概念为节点,连边表示概念的共现概率的关联知识图谱。所述解析文本中包含的初始概念的节点值初始化为1,其他的节点则初始化为0。
68.s423利用图注意力网络分别在所述常识知识图谱和关联知识图谱传播概念的响应值,分别得到补全常识知识图谱和补全关联知识图谱;
69.具体的,所述图注意力网络为图注意力卷积网络,利用图注意力卷积网络分别在两张图中分别传播概念的响应值。根据图中的连接关系,经过若干次传播后,部分原先初始化为0的节点,即句子中不包含但是与句子有相关性的概念会被激活,从而实现文本语义补全的目的,分别得到补全常识知识图谱和补全关联知识图谱。
70.s424将所述补全常识知识图谱和所述补全关联知识图谱加和,得到拓展文本。
71.将所述补全常识知识图谱和所述补全关联知识图谱加和,即得到了综合外部知识和内部关联的概念扩展结果。
72.s43对所述拓展文本和所述分析数据集的相似度进行加权计算,得到相似度模型。
73.s5将所述受控词输入所述相似度模型,得到多个拓展词;
74.具体的,每一所述拓展词均具有与所述受控词的相似度。
75.s6将所述受控词和多个所述拓展词整合,得到搜索结果。
76.具体方式为:
77.s61分别根据每一所述拓展词与所述受控词的相似度对按照相似度由高至低对多个所述拓展词进行排序,得到拓展词组;
78.具体的,通过对多个所述拓展词进行排序后,可根据相似度对所述拓展词进行依次选择。
79.s62对所述受控词进行标注后与所述拓展词组合并,得到搜索结果。
80.具体的,通过对所述受控词进行标注,可便于所述受控词与所述拓展词组合并后对所述受控词的区分。
81.本发明的一种知识本体信息的搜索方法,通过建立分析数据集;对所述分析数据集进行聚类分析,得到聚类结果;基于所述聚类结果从所述分析数据集中提取底层数据;基于所述聚类结果从所述分析数据集中提取底层数据;基于所述聚类结果从所述分析数据集中提取底层数据;基于所述聚类结果从所述分析数据集中提取底层数据;提取查询请求中的索引号;基于所述索引号在所述树状检索模型的所述索引表中确定出索引字段;基于所述索引字段从所述树状结构数据架中检索出对应的受控词;利用语法解析对所述分析数据集进行解析,得到解析文本;利用外部知识库找到不同概念间的联系,得到常识知识图谱;利用所述解析文本中包含概念的共现频率构建关联知识图谱;利用图注意力网络分别在所述常识知识图谱和关联知识图谱传播概念的响应值,分别得到补全常识知识图谱和补全关联知识图谱;将所述补全常识知识图谱和所述补全关联知识图谱加和,得到拓展文本;对所述拓展文本和所述分析数据集的相似度进行加权计算,得到相似度模型;对所述拓展文本和所述分析数据集的相似度进行加权计算,得到相似度模型;分别根据每一所述拓展词与所述受控词的相似度对按照相似度由高至低对多个所述拓展词进行排序,得到拓展词组;对所述受控词进行标注后与所述拓展词组合并,得到搜索结果。解决了现有的知识本体信息的搜索方法搜索结果的范围较窄,获取的信息量较少的问题。
82.以上所揭露的仅为本发明一种知识本体信息的搜索方法较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献