一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的医院科技画像方法和系统与流程

2021-10-19 23:40:00 来源:中国专利 TAG: 图谱 画像 计算机 医院 方法


1.本发明涉及计算机技术领域,具体地,涉及一种基于知识图谱的医院科技画像方法和系统。


背景技术:

2.科技评价是科技管理工作的重要组成部分,其目的都是通过科技评价促进科技产出质科质量的提升,国内外已开展了多种不同形式的科技评价实践活动。目前科技评价主要以大学和科研机构为对象,针对医学类科研机构的评价开展较少。医院的科技评价尤其独有的特点,医院是典型的知识密集性组织,集医疗、教学、科研于一体,由于医院类型多样,数量庞大,评价标准复杂,对医院的评价一直是科技管理和学科建设中的难题。如何对一个医院的科技影响力做出科学、客观、合理的评价是一个需要解决的问题。
3.目前针对医院的评价存在的指标单一、评价方式简单、医院的科技能力挖掘不够深入的问题。


技术实现要素:

4.鉴于现有技术中的上述缺陷或不足,本发明的目的是提供一种基于知识图谱的医院科技画像方法和系统。该方法和系统建立了针对医院的多层科技评价体系,采用优化的画像技术客观的描绘出医院的科技含量,并进一步挖掘出医院的科技优势和潜力,提高了科技评价的精确度和可用性。
5.为了解决上述问题,第一方面,本发明提供了一种基于知识图谱的医院科技画像方法,所述方法包括:
6.建立医院科技的评价指标体系和各个评价指标的权重;
7.获取医院科技相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中;
8.从医院全息数据中采集构建科技知识图谱构所需要的数据集合;
9.将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共303种概念和21种语义关系,然后将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体
y
)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;
10.将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;
11.对所有节点进行聚类分组以得到各个标签组,并在所述图数据库中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添
加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系。
12.第二方面,本发明提供了一种基于知识图谱的医院科技画像系统,所述系统包括:
13.指标单元,用于建立医院科技的评价指标体系和各个评价指标的权重;
14.数据采集单元,用于获取医院科技相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中,从医院全息数据中采集构建科技知识图谱构所需要的数据集合;
15.知识图谱单元,用于将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共303种概念和21种语义关系。然后将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体y)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;
16.画像单元,用于对所有节点进行聚类分组以得到各个标签组,并在所述图数据库中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系。
17.第三方面,本技术实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现本技术实施例描述的方法。
18.第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于:
19.所述计算机程序被处理器执行时实现如本技术实施例描述的方法。
附图说明
20.以下将结合附图对本发明的实施方案进行描述,其中
21.图1示出了本技术的基于知识图谱的医院科技画像流程示意图。
具体实施方式
22.为了能够使得本发明的发明目的、技术流程及技术创新点进行更加清晰的阐述,以下结合附图及实例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
23.为达到以上目的,本发明提供了一种基于知识图谱的医院科技画像方法,主流程如图1所示,该方法包括:
24.建立医院科技的评价指标体系和各个评价指标的权重;
25.获取医院科技相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中;为确保学科分类效率与准确性,本技术采用深度学习方法开展海量数据学科分类研究。整合mesh、cmesh等知识组织体系,结合领域专家意见,形成临床医学知识库。由于数据获取和数据处理的复杂性,现有医院评价中多以定性数据为基础。本技术创新性构建了以临床指南、临床试验项目、成果转化等反映临床医学特点的客观数据为基础的特色数据库群,包括全国1660余家医院的1050万条深度加工的高质量数据。
26.从医院全息数据中采集构建科技知识图谱构所需要的数据集合;
27.将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共303种概念和21种语义关系。然后将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体y)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;
28.将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;
29.对所有节点进行聚类分组以得到各个标签组,并在所述图数据库中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系。本技术的画像将数据处理各阶段进行关联,建成高效运行的评价流程,可以全景化、精准描绘医院科研发展动态,诊断医院学科优劣势,为卫生管理与决策提供主动式智慧化的应用场景。
30.特别的,建立的医院科技的评价指标体系包括3个一级指标、8个二级指标和19个三级指标,一级指标包括科技产出、学术影响、科技条件,二级指标包括期刊论文、专利和标准、论文引用、科技奖励、杰出人才和团队、学术任职、科研项目、科研平台,三级指标包括scie论文、中文核心期刊论文、授权发明专利、发明专利转化、标准和指南、scie收录论文引用、中文核心期刊论文引用、国际权威指南论文引用、国家科技奖、中华医学科技奖、杰出人才、杰出团队、重要学会任职、重要期刊任职、国家级科研项目、临床试验项目、科学与工程研究类平台、技术创新与成果转化类平台、基础支撑与条件保障类平台。
31.特别的,建立医院科技的评价指标的权重具体包括:
32.利用层次分析法,将评价指标体系分为三个层次,建立递阶层次结构;按照预设规则请专家用1~9标度法对三级指标的重要性进行打分,构造比较判断矩阵;由比较判断矩阵计算二级指标的相对权重,按照计算二级指标权重相同的方式计算一级指标的相对权重;计算每级指标的归一化权重系数,并计算各级指标的组合权重系数,再将权重向量进行平均,即得层次分析法权重系数;
33.利用主成分分析法,将三级指标进行主成分分析,提取特征根值大于1或累积贡献率达到80%以上的主成分,以每个主成分所能解释的方差比例作为权重;
34.利用熵权法,依据不同评价对象指标信息的差异程度来确定各项指标的权重;
35.利用组合评价法,采用平均值法、borda法、copeland法、模糊borda法四种方法对三种方法获得权重的单一综合评价的结果进行组合评价。
36.对画像进一步挖掘,具体包括:
37.将稳定数据对应的标签定义为稳定标签,将动态数据对应的标签定义为动态标签;
38.按照预设规则计算得到稳定标签对应的科技含量值和动态标签对应的科技含量值;
39.通过以下公式计算每个稳定标签和每个动态标签之间的相关度,公式为:
40.其中ri,j表示第i类稳定标签与第j个动态标签之间的相关度,wi为第i个稳定标签值,dj为第j个动态标签值,m为稳定标签的个数,n为动态标签的个数;
41.计算得到相关度大于预设值的动态标签,作为医院实体的科技优势标签。通过科技优势标签可以看出某一个医院相对其他医院的科技优势领域。
42.特别的,还包括对医院的科研方向进行预测分析,具体包括:
43.从医院全息数据库中获取科技论文和专利文档;
44.基于已有论文和专利文档的分类信息,构建学科分类训练数据集;
45.利用训练数据集,构建lstm

cnn分类模型;
46.利用lstm

cnn模型对未分类的科技论文和专利文档进行分类,得到医院技术分类;
47.统计目标医院的技术分类,构建目标医院最近一段时期内新增量最多的技术分类作为该医院的科研方向。
48.作为另一方面,本技术还提供了一种基于知识图谱的医院科技画像系统,所述系统包括:
49.指标单元,用于建立医院科技的评价指标体系和各个评价指标的权重;
50.数据采集单元,用于获取医院科技相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中,从医院全息数据中采集构建科技知识图谱构所需要的数据集合;
51.知识图谱单元,用于将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共包含303种概念及21种语义关系。然后将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体y)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;
52.画像单元,用于对所有节点进行聚类分组以得到各个标签组,并在所述图数据库
中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系。科技画像数据特征覆盖五个层面,通过分层画像进行数据挖掘,融合构建医院科技服务智慧化知识图谱应用模型:
53.机构属性层:机构名称、机构性质、地理位置;
54.人员属性层:姓名、年龄、单位、科室、职务、职称;
55.科技条件层:支持科研活动开展的基础条件和设施;
56.学术影响层:科研活动产生的影响及结果;
57.科技产出层:科学研究过程中产出的具有学术意义的成果。
58.特别的,建立的医院科技的评价指标体系包括3个一级指标、8个二级指标和19个三级指标,一级指标包括科技产出、学术影响、科技条件,二级指标包括期刊论文、专利和标准、论文引用、科技奖励、杰出人才和团队、学术任职、科研项目、科研平台,三级指标包括scie论文、中文核心期刊论文、授权发明专利、发明专利转化、标准和指南、scie收录论文引用、中文核心期刊论文引用、国际权威指南论文引用、国家科技奖、中华医学科技奖、杰出人才、杰出团队、重要学会任职、重要期刊任职、国家级科研项目、临床试验项目、科学与工程研究类平台、技术创新与成果转化类平台、基础支撑与条件保障类平台。
59.特别的,指标单元还用于:
60.利用层次分析法,将评价指标体系分为三个层次,建立递阶层次结构;按照预设规则请专家用1~9标度法对三级指标的重要性进行打分,构造比较判断矩阵;由比较判断矩阵计算二级指标的相对权重,按照计算二级指标权重相同的方式计算一级指标的相对权重;计算每级指标的归一化权重系数,并计算各级指标的组合权重系数,再将权重向量进行平均,即得层次分析法权重系数;
61.利用主成分分析法,将三级指标进行主成分分析,提取特征根值大于1或累积贡献率达到80%以上的主成分,以每个主成分所能解释的方差比例作为权重;
62.利用熵权法,依据不同评价对象指标信息的差异程度来确定各项指标的权重;
63.利用组合评价法,采用平均值法、borda法、copeland法、模糊borda法四种方法对三种方法获得权重的单一综合评价的结果进行组合评价。
64.特别的,画像单元还用于:
65.将稳定数据对应的标签定义为稳定标签,将动态数据对应的标签定义为动态标签;
66.按照预设规则计算得到稳定标签对应的科技含量值和动态标签对应的科技含量值;
67.通过以下公式计算每个稳定标签和每个动态标签之间的相关度,公式为:
68.其中ri,j表示第i类稳定标签与第j个动态标签之间的相关度,wi为第i个稳定标签值,dj为第j个动态标签值,m为稳定标签的个数,n为动态标签的个数;
69.计算得到相关度大于预设值的动态标签,作为医院实体的科技优势标签。
70.本技术的针对医院的科技画像医院科技画像为知识化智慧化决策服务提供主动式的应用场景,实现中国医院科技量值在高层次人才、团队、学科领域、医院、医学院校科技创新评价中的拓展应用,受到业界的广泛好评。
71.为了更好地理解本发明,以上结合发明的具体实例做了详细描述,但并非是本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。
72.作为另一方面,本技术还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如描述于本技术实施例描述的方法。
73.作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中前述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,前述程序被一个或者一个以上的处理器用来执行描述于本技术实施例描述的方法。
74.本技术实施例所使用的存储介质的任何引用可包括非易失性、易失性存储器。合适的非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)、光盘(包含光盘只读存储器(cd

rom)和数字通用盘(dvd))、或闪存。易失性存储器可包括随机存取存储器(ram),它用作外部高速缓冲存储器。作为说明而并非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddr sdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)。
75.应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(programmablegate array;以下简称:pga),现场可编程门阵列(field programmable gate array;以下简称:fpga)等。
76.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
77.此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件和固件的形式实现。所述集成的模块如果以软件和固件的形式实现并作为独立的产品销售或使用时,可以从存储介质或网络中传入具有专用硬件结构的计算机进行功能实现。
78.还要指出的是,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
79.虽然上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制。任何本领域技术人员,在不脱离本发明的精神和范围内,均可以对上述实施例进行变化、修改、替换和变型,因此本发明的保护范围并不局限于此,应当以权利要求所限定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献