一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种城市体检知识的知识管理方法、装置以及系统与流程

2022-09-14 18:56:28 来源:中国专利 TAG:


1.本发明涉及城市体检知识的知识管理技术领域,尤其涉及一种城市体检知识的知识管理方法、装置、计算机可读存储介质及系统。


背景技术:

2.知识图谱是揭示实体间关系的语义网络,可以对现实事物及其关联关系进行形式化描述。知识图谱已经在学术界和工业界都普及开来,在智能搜索、智能问答、智能推荐等应用中发挥重要的作用。城市信息来源广泛、种类多、格式不统一,给数据收集、关联、融合和分析带来巨大挑战。同时,海量数据中对城市体检评估有用的数据较少,重要的知识容易被垃圾信息淹没。采用知识图谱和处理分析和关联展示多源异构数据和知识,有助于对城市发展特征及规划实施效果定期评价,有助于及时揭示国土空间治理、城市功能布局中存在的问题和短板,提高城市发展质量。具体地,城市体检知识图谱涉及人文、经济、环境等多个领域知识。
3.在现有技术中,采用知识图谱的形式,处理分析和关联展示多源异构数据和知识,其中图谱构建包括多级实体抽取、多级关系抽取和知识图谱存储等。
4.但是,现有技术仍存在如下缺陷:鉴于对城市体检的分析评价指标不一致,数据处理方法各异,主题各有特点,缺乏基于语义的统一框架,城市体检知识图谱构建和知识服务应用的通用性和兼容性不强,导致知识管理效率较低。
5.因此,当前需要一种城市体检知识的知识管理方法、装置、计算机可读存储介质以及系统,从而克服现有技术中存在的上述缺陷。


技术实现要素:

6.本发明实施例提供一种城市体检知识的知识管理方法、装置、计算机可读存储介质以及系统,从而提升城市体检知识的知识管理效率。
7.本发明一实施例提供一种城市体检知识的知识管理方法,所述知识管理方法包括:通过主体爬虫数据采集工具,采集城市体检数据,并对所述城市体检数据进行清洗以获取城市体检知识;根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库;根据预设的第一外部知识库以及所述城市体检本体库,构建城市体检知识实例资源;从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库。
8.作为上述方案的改进,从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,建立城市体检知识库,具体包括:获取预设的多部门分析评价指标组;所述多部门分析评价指标组包括分析评价指标以及对应的分析评价指标内涵;采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库;对所述分析评价指标内涵进行特征挖掘以建立方法库;根据关联聚类方法对
所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库;根据所述指标库、所述方法库以及所述主题库,建立城市体检知识库。
9.作为上述方案的改进,根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库,具体包括:获取预设的领域类别以及预设的专家经验库;根据所述专家经验库以及所述领域类别,从所述城市体检知识中确定各个领域类别对应的城市体检本体范围;通过预设的第一高频计算方法以及预设的第二高频计算方法,分别从所述城市体检知识范围中提取以对应获得第一关键词组和第二关键词组,并对所述第一关键词组和第二关键词组进行融合去重,对应获得各个领域类别对应的领域概念;根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系;根据所述领域概念和所述领域关系,构建城市体检本体库。
10.作为上述方案的改进,所述计分评估公式具体为:
[0011][0012]
其中,n是候选词表p所挖掘的候选关系的总数,f是候选词表p所挖掘的已经在实体词典中的关系实体数;表示候选词表p的精准度,log2(f 1)表示候选词表p的召回能力。
[0013]
作为上述方案的改进,采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库,具体包括:根据分析评价指标对应建立分析评价指标集;对所述分析评价指标集进行数据预处理以获取部门分析评价指标集;所述部门分析评价指标集包括多个部门分析评价指标;根据隐含狄利克雷分布模型以及预设的关键词对应目标函数,计算并确认所述部门分析评价指标对应的指标关键词,并根据纠缠度、所述部门分析评价指标以及所述指标关键词,建立指标库。
[0014]
作为上述方案的改进,预设的关键词对应目标函数具体为:
[0015][0016]
其中,α和β是可迭代超参数。
[0017]
作为上述方案的改进,根据关联聚类方法对所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库,具体包括:在不同的预设的主题内涵下,通过js散度,根据所述分析评价指标分别计算主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度;根据预设的主题内涵关联度公式、主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度,计算各个主题内涵之间的主题内涵关联度;根据关联聚类算法,对所述主题内涵进行聚类,获得主题组;所述主题组包括多个主题词汇;根据预设的相似度计算公式,计算所述主题词汇和所述主题内涵之间的相似度,并根据预设的分类阈值以及所述相似度,对所述主题词汇以及所述主题内涵进行聚类以获得主题库。
[0018]
作为上述方案的改进,预设的主题内涵关联度公式具体为:
[0019]
sc=a*主题语义相似度 b*指标语义相似度 c*指标单位相似度 d*
[0020]
计算方法相似度;
[0021]
其中,sc为主题内涵关联度;a,b,c,d分别为权重因子,且a,b,c,d∈(0,1)。
[0022]
作为上述方案的改进,预设的相似度计算公式具体为:
[0023][0024]
其中,s为主题词汇;c为主题内涵。
[0025]
作为上述方案的改进,根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系,具体包括:参考预设的第二外部知识库,归纳获取各个实体之间的关系类型,并将所述关系类型以及城市体检知识存储入实体词典中;通过拔靴法,将所述城市体检知识与所述关系类型进行匹配,并将匹配结果存储入候选词表中;根据预设的计分评估公式,对所述候选词表中的匹配结果进行评估计分,并根据预设的迭代次数和预设的收敛精度,判断评估计分结果是否收敛;如果收敛,则将所述评估计分结果对应的关系类型输出为对应领域之间的领域关系。
[0026]
作为上述方案的改进,所述知识管理方法还包括:根据所述城市体检知识库,对所述城市体检本体库进行反向补充和完善。
[0027]
本发明另一实施例对应提供了一种城市体检知识的知识管理装置,所述知识管理装置包括数据采集单元、分类归纳单元、实例构建单元以及知识库建立单元,其中,所述数据采集单元用于通过主体爬虫数据采集工具,采集城市体检数据,并对所述城市体检数据进行清洗以获取城市体检知识;所述分类归纳单元用于根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库;所述实例构建单元用于根据预设的第一外部知识库以及所述城市体检本体库,构建城市体检知识实例资源;所述知识库建立单元用于从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库。
[0028]
作为上述方案的改进,所述知识库建立单元还用于:获取预设的多部门分析评价指标组;所述多部门分析评价指标组包括分析评价指标以及对应的分析评价指标内涵;采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库;对所述分析评价指标内涵进行特征挖掘以建立方法库;根据关联聚类方法对所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库;根据所述指标库、所述方法库以及所述主题库,建立城市体检知识库。
[0029]
作为上述方案的改进,所述知识库建立单元还用于:根据分析评价指标对应建立分析评价指标集;对所述分析评价指标集进行数据预处理以获取部门分析评价指标集;所述部门分析评价指标集包括多个部门分析评价指标;根据隐含狄利克雷分布模型以及预设的关键词对应目标函数,计算并确认所述部门分析评价指标对应的指标关键词,并根据纠缠度、所述部门分析评价指标以及所述指标关键词,建立指标库。
[0030]
作为上述方案的改进,所述知识库建立单元还用于:在不同的预设的主题内涵下,通过js散度,根据所述分析评价指标分别计算主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度;根据预设的主题内涵关联度公式、主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度,计算各个主题内涵之间的主题内涵关联度;根据关联聚类算法,对所述主题内涵进行聚类,获得主题组;所述主题组包括多个主题词汇;根据预设的相似度计算公式,计算所述主题词汇和所述主题内涵之间的相似度,并根据
预设的分类阈值以及所述相似度,对所述主题词汇以及所述主题内涵进行聚类以获得主题库。
[0031]
作为上述方案的改进,所述分类归纳单元还用于:获取预设的领域类别以及预设的专家经验库;根据所述专家经验库以及所述领域类别,从所述城市体检知识中确定各个领域类别对应的城市体检本体范围;通过预设的第一高频计算方法以及预设的第二高频计算方法,分别从所述城市体检知识范围中提取以对应获得第一关键词组和第二关键词组,并对所述第一关键词组和第二关键词组进行融合去重,对应获得各个领域类别对应的领域概念;根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系;根据所述领域概念和所述领域关系,构建城市体检本体库。
[0032]
作为上述方案的改进,所述分类归纳单元还用于:参考预设的第二外部知识库,归纳获取各个实体之间的关系类型,并将所述关系类型以及城市体检知识存储入实体词典中;通过拔靴法,将所述城市体检知识与所述关系类型进行匹配,并将匹配结果存储入候选词表中;根据预设的计分评估公式,对所述候选词表中的匹配结果进行评估计分,并根据预设的迭代次数和预设的收敛精度,判断评估计分结果是否收敛;如果收敛,则将所述评估计分结果对应的关系类型输出为对应领域之间的领域关系。
[0033]
作为上述方案的改进,所述知识管理装置还包括补充反馈单元,所述补充反馈单元用于:根据所述城市体检知识库,对所述城市体检本体库进行反向补充和完善。
[0034]
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如前所述的城市体检知识的知识管理方法。
[0035]
本发明另一实施例提供了一种城市体检知识的知识管理系统,所述知识管理系统包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的城市体检知识的知识管理方法。
[0036]
与现有技术相比,本技术方案存在如下有益效果:
[0037]
本发明提供了一种城市体检知识的知识管理方法、装置、计算机可读存储介质以及系统,通过从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库,从而基于不同的分析评价指标建立了标准化的框架,进而实现知识管理的通用性和兼容性,该知识管理方法、装置、计算机可读存储介质以及系统提升了城市体检知识的知识管理效率。
[0038]
进一步地,本发明提供的一种城市体检知识的知识管理方法、装置、计算机可读存储介质以及系统还通过根据所述城市体检知识库,及时对所述城市体检本体库进行反向补充和完善,从而提升城市体检知识的知识管理的准确性。
附图说明
[0039]
图1是本发明一实施例提供的一种城市体检知识的知识管理方法的流程示意图;
[0040]
图2是本发明一实施例提供的一种城市体检知识的知识管理装置的结构示意图。
具体实施方式
[0041]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0042]
具体实施例一
[0043]
本发明实施例首先描述了一种城市体检知识的知识管理方法。图1是本发明一实施例提供的一种城市体检知识的知识管理方法的流程示意图。
[0044]
如图1所示,所述知识管理方法包括:
[0045]
s1:通过主体爬虫数据采集工具,采集城市体检数据,并对所述城市体检数据进行清洗以获取城市体检知识。
[0046]
具体地,采用主题爬虫数据采集工具,进行网页的结构化特征抽取,经过数据清洗操作,实现从城市体检领域网站中抽取城市体检知识。城市体检数据包括城市体检历史报告、城市规划相关数据化资料、城市体检行政沿革资料、行业数据资料、外部城市知识库。
[0047]
s2:根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库。
[0048]
其中,所述领域类别包括人文、生态环境和经济等。具体地,首先根据人文、生态环境、经济这三类领域知识确定城市体检本体范围;然后对这三类领域知识确定基于语义的概念及关系分类体系。
[0049]
在一个实施例中,根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库,具体包括:获取预设的领域类别以及预设的专家经验库;根据所述专家经验库以及所述领域类别,从所述城市体检知识中确定各个领域类别对应的城市体检本体范围;通过预设的第一高频计算方法以及预设的第二高频计算方法,分别从所述城市体检知识范围中提取以对应获得第一关键词组和第二关键词组,并对所述第一关键词组和第二关键词组进行融合去重,对应获得各个领域类别对应的领域概念;根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系;根据所述领域概念和所述领域关系,构建城市体检本体库。
[0050]
在一个实施例中,预设的第二外部知识库为schema.org和dbpedia等外部知识库;预设的第一高频计算方法为tf-idf算法;预设的第二高频计算方法为textrank算法。
[0051]
在一个实施例中,所述计分评估公式具体为:
[0052][0053]
其中,n是候选词表p所挖掘的候选关系的总数,f是候选词表p所挖掘的已经在实体词典中的关系实体数;表示候选词表p的精准度,log2(f 1)表示候选词表p的召回能力。
[0054]
s3:根据预设的第一外部知识库以及所述城市体检本体库,构建城市体检知识实例资源。
[0055]
具体地,对所述城市体检本体库中的城市体检知识进行分词及去停用词,借鉴预
设的第一外部知识库以及城市体检本体库中的实体、属性和关系,对城市体检领域知识进行词性标注,采用基于字符级注意和句子级注意的bi-gru模型训练提取中文实体和关系。对提取的知识实例与外部知识库链接,如百度百科、维基百科等知识库,形成知识实例的网页版结构化链接,丰富知识实例资源。
[0056]
s4:从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库。
[0057]
通过调研城市体检相关部门对知识的需求,以城市体检评估为核心,提出构建面向多个主题评价、具有多类指标分析、多种方法计算的城市体检知识库构建方法,形成对主题、指标、方法的层级表达与信息描述。主题库、指标库和方法库之间形成多级联动的运行闭环。
[0058]
在一个实施例中,从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,建立城市体检知识库,具体包括:获取预设的多部门分析评价指标组;采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库;对所述分析评价指标内涵进行特征挖掘以建立方法库;根据关联聚类方法对所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库;根据所述指标库、所述方法库以及所述主题库,建立城市体检知识库。其中,所述多部门分析评价指标组包括不同部门的分析评价指标以及对应的分析评价指标内涵。
[0059]
在一个实施例中,采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库,具体包括:根据分析评价指标对应建立分析评价指标集;对所述分析评价指标集进行数据预处理以获取部门分析评价指标集;所述部门分析评价指标集包括多个部门分析评价指标;根据隐含狄利克雷分布模型以及预设的关键词对应目标函数,计算并确认所述部门分析评价指标对应的指标关键词,并根据纠缠度、所述部门分析评价指标以及所述指标关键词,建立指标库。其中,所述预处理过程包括分词及去停用词等。
[0060]
在一个实施例中,预设的关键词对应目标函数具体为:
[0061][0062]
其中,α和β是可迭代超参数。根据θ和k则可得到指标中每个指标关键词的概率分布及主题中每个指标关键词的概率分布。通过迭代计算使得数值收敛,通过概率计算得到指标对应的指标关键词。
[0063]
指标内涵是对指标含义和如何计算的具体表示。指标内涵一般具有特征词“占”、“比例”、“百分比”、“平均”、“每”、“总量”、“数量”、“率”等。在一个实施例中,对所述分析评价指标内涵进行特征挖掘以建立方法库,具体包括:将这些特征词加入分词词库保证专业词汇分词质量;应用textrank算法挖掘指标内涵词汇与特征词的共现关系,选定2-8个特征词作为变量参数;通过变量参数和特征词的位置关系r-position,设定规则约束确定逻辑运算关系r-operation,将变量参数v和逻辑运算o组合成计算方法me。
[0064]
例如,“市县区内近5年开展保护修缮项目的历史文化街区数量,占历史文化街区总量的百分比”,利用textrank算法提取“市县区”、“近5年”、“保护修缮项目”、“历史文化街区数量”、“占”、“历史文化街区总量”、“百分比”组成变量参数。由“百分比”可判断运算为除法,在“占”之前的变量参数为分子,“占”之后的变量参数为分母。其中,为满足变量参数从知识实例中调取数据的需求,进一步根据知识实例组合变量参数,实现变量适配;然后,将
多种计算方法实体me建立关联指标的计算方法词表mme={mme1,mme2,...,mmei},i《170,同时,根据指标评估意向设定正向负向评估策略s实体,并建立评估策略区间表ms={ms1,ms2,...,ms
10
};最后,指标库li可根据指标关键词和特征词匹配从方法库lm中调用计算方法和评估策略。
[0065]
在一个实施例中,根据关联聚类方法对所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库,具体包括:在不同的预设的主题内涵下,通过js散度,根据所述分析评价指标分别计算主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度;根据预设的主题内涵关联度公式、主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度,计算各个主题内涵之间的主题内涵关联度;根据关联聚类算法,对所述主题内涵进行聚类,获得主题组;所述主题组包括多个主题词汇;根据预设的相似度计算公式,计算所述主题词汇和所述主题内涵之间的相似度,并根据预设的分类阈值以及所述相似度,对所述主题词汇以及所述主题内涵进行聚类以获得主题库。
[0066]
在不同的预设的主题内涵下,通过js散度,根据所述分析评价指标分别计算主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度,具体是指从指标实体和方法实体两个角度利用js散度计算主题内涵下指标和计算方法的相似度。实体e1和实体e2的概率分布分别为p1和p2,那么实体之间的相似性可表达为js(p1||p2):
[0067][0068]
其中,d
kl
(p1||p2)表示p1和p2的kl散度,其表达式为:
[0069][0070]
在一个实施例中,预设的主题内涵关联度公式具体为:
[0071]
sc=a*主题语义相似度 b*指标语义相似度 c*指标单位相似度 d*
[0072]
计算方法相似度;
[0073]
其中,sc为主题内涵关联度;a,b,c,d分别为权重因子,且a,b,c,d∈(0,1)。
[0074]
根据预设的分类阈值以及所述相似度,对所述主题词汇以及所述主题内涵进行聚类以获得主题库具体是指:通过自底向上层次聚类,将指标/方法-主题内涵-主题的三级知识组织起来,基于主题库内容,进行指标的关联抽取,形成指标库,实现对主题的响应。指标库的计算方法从方法库中获取,实现指标的动态计算与更新。在一个实施例中,预设的相似度计算公式具体为:
[0075][0076]
其中,s为主题词汇;c为主题内涵。
[0077]
在一个实施例中,根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系,具体包括:参考预设的第二外部知识库,归纳获取各个实体之间的关系类型,并将所述关系类型以及城市体检知识存储入实体词典中;通过拔靴法,将所述城市体检知识与所述关系类型进行匹配,并将匹配结果存储入候选词表中;根据预设的计分评估公式,对所述候选词表中的匹配结果进行评估计分,
并根据预设的迭代次数和预设的收敛精度,判断评估计分结果是否收敛;如果收敛,则将所述评估计分结果对应的关系类型输出为对应领域之间的领域关系。
[0078]
在一个实施例中,所述知识管理方法还包括:根据所述城市体检知识库,对所述城市体检本体库进行反向补充和完善。
[0079]
本发明实施例描述了一种城市体检知识的知识管理方法,通过从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库,从而基于不同的分析评价指标建立了标准化的框架,进而实现知识管理的通用性和兼容性,该知识管理方法提升了城市体检知识的知识管理效率;进一步地,本发明实施例描述的一种城市体检知识的知识管理方法还通过根据所述城市体检知识库,及时对所述城市体检本体库进行反向补充和完善,从而提升城市体检知识的知识管理的准确性。
[0080]
具体实施例二
[0081]
除上述方法外,本发明实施例还公开了一种城市体检知识的知识管理装置。图2是本发明一实施例提供的一种城市体检知识的知识管理装置的结构示意图。
[0082]
如图2所示,所述知识管理装置包括数据采集单元、分类归纳单元、实例构建单元以及知识库建立单元,其中,所述数据采集单元用于通过主体爬虫数据采集工具,采集城市体检数据,并对所述城市体检数据进行清洗以获取城市体检知识;所述分类归纳单元用于根据预设的领域类别以及预设的专家经验库,对所述城市体检知识进行分类归纳处理,获得城市体检本体库;所述实例构建单元用于根据预设的第一外部知识库以及所述城市体检本体库,构建城市体检知识实例资源;所述知识库建立单元用于从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库。
[0083]
在一个实施例中,所述知识库建立单元还用于:获取预设的多部门分析评价指标组;所述多部门分析评价指标组包括分析评价指标以及对应的分析评价指标内涵;采用隐含狄利克雷分布模型对所述分析评价指标进行计算以建立指标库;对所述分析评价指标内涵进行特征挖掘以建立方法库;根据关联聚类方法对所述分析评价指标进行提炼以获取主题组,并对所述主题组进行聚类分析以获取主题库;根据所述指标库、所述方法库以及所述主题库,建立城市体检知识库。
[0084]
在一个实施例中,所述知识库建立单元还用于:根据分析评价指标对应建立分析评价指标集;对所述分析评价指标集进行数据预处理以获取部门分析评价指标集;所述部门分析评价指标集包括多个部门分析评价指标;根据隐含狄利克雷分布模型以及预设的关键词对应目标函数,计算并确认所述部门分析评价指标对应的指标关键词,并根据纠缠度、所述部门分析评价指标以及所述指标关键词,建立指标库。
[0085]
在一个实施例中,所述知识库建立单元还用于:在不同的预设的主题内涵下,通过js散度,根据所述分析评价指标分别计算主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度;根据预设的主题内涵关联度公式、主题语义相似度、指标语义相似度、指标单位相似度以及计算方法相似度,计算各个主题内涵之间的主题内涵关联度;根据关联聚类算法,对所述主题内涵进行聚类,获得主题组;所述主题组包括多个主题词汇;根据预设的相似度计算公式,计算所述主题词汇和所述主题内涵之间的相似度,并根据预设
的分类阈值以及所述相似度,对所述主题词汇以及所述主题内涵进行聚类以获得主题库。
[0086]
在一个实施例中,所述分类归纳单元还用于:获取预设的领域类别以及预设的专家经验库;根据所述专家经验库以及所述领域类别,从所述城市体检知识中确定各个领域类别对应的城市体检本体范围;通过预设的第一高频计算方法以及预设的第二高频计算方法,分别从所述城市体检知识范围中提取以对应获得第一关键词组和第二关键词组,并对所述第一关键词组和第二关键词组进行融合去重,对应获得各个领域类别对应的领域概念;根据预设的第二外部知识库、预设的匹配方法以及预设的计分评估公式,迭代抽取以获得各个领域类别之间的领域关系;根据所述领域概念和所述领域关系,构建城市体检本体库。
[0087]
在一个实施例中,所述分类归纳单元还用于:参考预设的第二外部知识库,归纳获取各个实体之间的关系类型,并将所述关系类型以及城市体检知识存储入实体词典中;通过拔靴法,将所述城市体检知识与所述关系类型进行匹配,并将匹配结果存储入候选词表中;根据预设的计分评估公式,对所述候选词表中的匹配结果进行评估计分,并根据预设的迭代次数和预设的收敛精度,判断评估计分结果是否收敛;如果收敛,则将所述评估计分结果对应的关系类型输出为对应领域之间的领域关系。
[0088]
在一个实施例中,所述知识管理装置还包括补充反馈单元,所述补充反馈单元用于:根据所述城市体检知识库,对所述城市体检本体库进行反向补充和完善。
[0089]
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如前所述的城市体检知识的知识管理方法。
[0090]
其中,所述知识管理装置集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0091]
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,单元之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0092]
本发明实施例描述了一种城市体检知识的知识管理装置及计算机可读存储介质,通过从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库,从而基于不同的分析评价指标建立了标准化的框架,进而实现知识管理的通用性和兼容性,该知识管理装置及计算机可读存储介质提升了城市体检知识的知识管理效率;进一步地,本发明实施例描述的一种城市体检知识的知识管理装置及计算机可读存储介质还通过根据所述城市体检知识库,及时对所述城市体检本体库进行反向补充和完善,从而提升城市体检知识的知识管理的准确性。
[0093]
具体实施例三
[0094]
除上述方法和装置外,本发明实施例还描述了一种城市体检知识的知识管理系统。
[0095]
具体地,所述知识管理系统包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的城市体检知识的知识管理方法。
[0096]
所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述装置的控制中心,利用各种接口和线路连接整个装置的各个部分。
[0097]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0098]
本发明实施例描述了一种城市体检知识的知识管理系统,通过从主题、指标以及方法三个方面,根据预设的多部门分析评价指标组、所述城市体检知识实例资源以及关联聚类方法,以知识图谱形式建立城市体检知识库,从而基于不同的分析评价指标建立了标准化的框架,进而实现知识管理的通用性和兼容性,该知识管理系统提升了城市体检知识的知识管理效率;进一步地,本发明实施例描述的一种城市体检知识的知识管理系统还通过根据所述城市体检知识库,及时对所述城市体检本体库进行反向补充和完善,从而提升城市体检知识的知识管理的准确性。
[0099]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献