一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的医院科技画像方法和系统与流程

2021-10-19 23:40:00 来源:中国专利 TAG: 图谱 画像 计算机 医院 方法

技术特征:
1.一种基于知识图谱的医院科技画像方法,所述方法包括:建立医院科技的评价指标体系和各个评价指标的权重;获取医院科技活动相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中;从医院全息数据中采集构建科技知识图谱构所需要的数据集合;将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共303种概念和21种语义关系,将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体y)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;对所有节点进行聚类分组以得到各个标签组,并在所述图数据库中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系。2.根据权利要求1所述的方法,其特征在于,建立的医院科技的评价指标体系包括3个一级指标、8个二级指标和19个三级指标,一级指标包括科技产出、学术影响、科技条件,二级指标包括期刊论文、专利和标准、论文引用、科技奖励、杰出人才和团队、学术任职、科研项目、科研平台,三级指标包括scie论文、中文核心期刊论文、授权发明专利、发明专利转化、标准和指南、scie收录论文引用、中文核心期刊论文引用、国际权威指南论文引用、国家科技奖、中华医学科技奖、杰出人才、杰出团队、重要学会任职、重要期刊任职、国家级科研项目、临床试验项目、科学与工程研究类平台、技术创新与成果转化类平台、基础支撑与条件保障类平台。3.根据权利要求2所述的方法,其特征在于,建立医院科技的评价指标的权重具体包括:利用层次分析法,将评价指标体系分为三个层次,建立递阶层次结构;按照预设规则请专家用1~9标度法对三级指标的重要性进行打分,构造比较判断矩阵;由比较判断矩阵计算二级指标的相对权重,按照计算二级指标权重相同的方式计算一级指标的相对权重;计算每级指标的归一化权重系数,并计算各级指标的组合权重系数,再将权重向量进行平均,即得层次分析法权重系数;利用主成分分析法,将三级指标进行主成分分析,提取特征根值大于1或累积贡献率达到80%以上的主成分,以每个主成分所能解释的方差比例作为权重;利用熵权法,依据不同评价对象指标信息的差异程度来确定各项指标的权重;利用组合评价法,采用平均值法、borda法、copeland法、模糊borda法四种方法对三种方法获得权重的单一综合评价的结果进行组合评价。4.根据权利要求1所述的方法,其特征在于,对画像进一步挖掘,具体包括:
将稳定数据对应的标签定义为稳定标签,将动态数据对应的标签定义为动态标签;按照预设规则计算得到稳定标签对应的科技含量值和动态标签对应的科技含量值;通过以下公式计算每个稳定标签和每个动态标签之间的相关度,公式为:其中r
i,j
表示第i类稳定标签与第j个动态标签之间的相关度,w
i
为第i个稳定标签值,d
j
为第j个动态标签值,m为稳定标签的个数,n为动态标签的个数;计算得到相关度大于预设值的动态标签,作为医院实体的科技优势标签。5.根据权利要求1所述的方法,其特征在于,对医院的研究方向进行预测,具体包括:从医院全息数据库中获取科技论文和专利文档;基于已有论文和专利文档的分类信息,构建学科分类训练数据集;利用训练数据集,构建lstm

cnn分类模型;利用lstm

cnn模型对未分类的科技论文和专利文档进行分类,得到医院技术分类;统计目标医院的技术分类,构建目标医院最近一段时期内新增量最多的技术分类作为该医院的科研方向。6.一种基于知识图谱的医院科技画像系统,所述系统包括:指标单元,用于建立医院科技的评价指标体系和各个评价指标的权重;数据采集单元,用于获取医院科技相关的多源高维数据,将获取的科技数据进行标准化处理,将科技数据处理为标准格式,存储于医院全息数据库中,从医院全息数据中采集构建科技知识图谱构所需要的数据集合;知识图谱单元,用于将构建科技知识图谱构所需要的数据分成稳定数据和动态数据两大类别,针对稳定数据构建医院科技知识图谱的模式图,包含稳定数据概念本体以及它们之间的关系,共包含303种概念及21种语义关系,然后将数据库中的医院信息转换为医院实体,存储到图数据库构成图节点,抽取和分类实体之间的关系并存入图数据库构成关系边;针对动态数据构造知识三元组,三元组元关系包含(实体x,关系,实体y)、(实体,属性,属性值)和(关系,属性,属性值),以图的模型将三元组组织起来,并构建关系图谱;将医院知识图谱中文本进行预处理,生成候选关键词,构建候选关键词图g=(n,e),其中n为节点集,e为边,n是由候选关键词组成,使用窗口依次滑过关键词,当窗口同时包含两个节点时,在这两点间连接一条边e;画像单元,用于对所有节点进行聚类分组以得到各个标签组,并在所述图数据库中分别生成代表各个标签组的标签组节点,将图数据库中的每个标签组节点和对应的各个标签节点之间添加标签组关联关系,形成医院的科技画像,用户画像包括:指标节点、指标关联关系、标签节点、标签关联关系、标签组节点和标签组关联关系,科技画像数据特征覆盖五个层面,通过分层画像进行数据挖掘,融合构建医院科技服务智慧化知识图谱应用模型:机构属性层:机构名称、机构性质、地理位置;人员属性层:姓名、年龄、单位、科室、职务、职称;科技条件层:支持科研活动开展的基础条件和设施;学术影响层:科研活动产生的影响及结果;科技产出层:科学研究过程中产出的具有学术意义的成果。
7.根据权利要求6所述的系统,其特征在于,建立的医院科技的评价指标体系包括3个一级指标、8个二级指标和19个三级指标,一级指标包括科技产出、学术影响、科技条件,二级指标包括期刊论文、专利和标准、论文引用、科技奖励、杰出人才和团队、学术任职、科研项目、科研平台,三级指标包括scie论文、中文核心期刊论文、授权发明专利、发明专利转化、标准和指南、scie收录论文引用、中文核心期刊论文引用、国际权威指南论文引用、国家科技奖、中华医学科技奖、杰出人才、杰出团队、重要学会任职、重要期刊任职、国家级科研项目、临床试验项目、科学与工程研究类平台、技术创新与成果转化类平台、基础支撑与条件保障类平台;指标单元还用于:利用层次分析法,将评价指标体系分为三个层次,建立递阶层次结构;按照预设规则请专家用1~9标度法对三级指标的重要性进行打分,构造比较判断矩阵;由比较判断矩阵计算二级指标的相对权重,按照计算二级指标权重相同的方式计算一级指标的相对权重;计算每级指标的归一化权重系数,并计算各级指标的组合权重系数,再将权重向量进行平均,即得层次分析法权重系数;利用主成分分析法,将三级指标进行主成分分析,提取特征根值大于1或累积贡献率达到80%以上的主成分,以每个主成分所能解释的方差比例作为权重;利用熵权法,依据不同评价对象指标信息的差异程度来确定各项指标的权重;利用组合评价法,采用平均值法、borda法、copeland法、模糊borda法四种方法对三种方法获得权重的单一综合评价的结果进行组合评价。8.根据权利要求6所述的系统,其特征在于,画像单元还用于:将稳定数据对应的标签定义为稳定标签,将动态数据对应的标签定义为动态标签;按照预设规则计算得到稳定标签对应的科技含量值和动态标签对应的科技含量值;通过以下公式计算每个稳定标签和每个动态标签之间的相关度,公式为:其中r
i,j
表示第i类稳定标签与第j个动态标签之间的相关度,w
i
为第i个稳定标签值,d
j
为第j个动态标签值,m为稳定标签的个数,n为动态标签的个数;计算得到相关度大于预设值的动态标签,作为医院实体的科技优势标签;医院科技优势标签的更新,包括稳定标签的更新是基于机构属性层和人员属性层中基本信息的更新;动态标签的更新是基于医院科技产出、条件及学术影响信息发生变化且随着每年度数据计算,标签值进行动态更新,并留存历史记录。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于:所述计算机程序被处理器执行时实现如权利要求1

4任一项所述的方法。

技术总结
一种基于知识图谱的医院科技画像方法和系统,所述方法包括:建立医院科技的评价指标体系和各个评价指标的权重;采集获取医院科技活动相关的多源高维数据;构建医院科技知识图谱;进行基于知识图谱的医院科技画像。本发明通过对医院科技画像,客观地描绘出医院科技水平,进一步挖掘出医院的科技优势和潜力,提高了科技评价的精确度和可用性。了科技评价的精确度和可用性。了科技评价的精确度和可用性。


技术研发人员:王辰 池慧 安新颖 单连慧 钟华 胥美美 范少萍
受保护的技术使用者:中国医学科学院
技术研发日:2021.05.26
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献