一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于医疗知识图谱融合的病症实体对齐方法及其装置

2023-03-18 01:10:22 来源:中国专利 TAG:

技术特征:
1.基于医疗知识图谱融合的病症实体对齐方法,其特征在于,包括以下步骤:构建并形成大规模的标准疾病知识图谱;获取自描述症状语言数据,利用最优切分算法使自描述症状数据进行最优化切词,并形成自描述症状图谱;构建word2vec词向量模型,利用大规模医疗文本训练word2vec词向量模型,对自描述症状图谱和标准疾病知识图谱的实体进行特征扩展,以获得自描述症状图谱和标准疾病知识图谱的实体内容在同一特征向量空间下的语义建模;基于最优子图匹配算法对标准疾病知识图谱的任一子图结构进行遍历,计算子图结构的子图特征表示和自描述图谱特征表示的相似度,获取最优匹配子图,实现自描述症状实体到标准疾病实体的对齐。2.根据权利要求1所述的基于医疗知识图谱融合的病症实体对齐方法,其特征在于,所述自描述症状语言数据的症状实体库包括身体部位、方向位置、状态、特征、专有名词、标准疾病名称。3.根据权利要求2所述的基于医疗知识图谱融合的病症实体对齐方法,其特征在于,利用最优切分算法对身体部位、方向位置、状态、特征、专有名词、标准疾病名称六类实体映射,并形成自描述症状图谱。4.根据权利要求2或3所述的基于医疗知识图谱融合的病症实体对齐方法,其特征在于,所述最优切分算法包括以下步骤:步骤s11,加载症状实体库数据;步骤s12,采用自描述症状全模式分词;步骤s13,获取其中之一的分词方式;步骤s14,采用多类型实体匹配,并获得实体匹配方式;步骤s15,求得该匹配方式下的实体相似度之积;步骤s16,遍历任一实体匹配方式;若未完成遍历匹配方式,则返回步骤s14;否则,遍历任一分词方式;若未完成遍历分词方式,则进入步骤s13,否则,进入步骤s17;步骤s17,获取最大相似度之积对应的自描述症状图谱。5.根据权利要求2或3所述的基于医疗知识图谱融合的病症实体对齐方法,其特征在于,所述最优子图匹配算法包括以下步骤:步骤s21,获取标准疾病知识图谱的一个子图,并获取该子图对应的向量表示;步骤s22,利用word2vec词向量模型对子图进行特征扩展;步骤s23,求得自描述症状图谱与子图的相似度;步骤s24,遍历任一子图,并求得相似度最大值对应的子图;步骤s25,利用相似度最大值对应的子图输出标准疾病症状实体。6.一种基于医疗知识图谱融合的病症实体对齐装置,其特征在于,包括:标准疾病知识图谱模块;自描述症状图谱模块,获取自描述症状语言数据后,并利用最优切分算法使自描述症状数据进行最优化切词,形成自描述症状图谱;word2vec词向量模型,利用大规模医疗文本训练word2vec词向量模型,对自描述症状
图谱和标准疾病知识图谱的实体进行特征扩展,以获得自描述症状图谱和标准疾病知识图谱的实体内容在同一特征向量空间下的语义建模;最优子图匹配模块,利用最优子图匹配算法对标准疾病知识图谱的任一子图结构进行遍历,计算子图结构的子图特征表示和自描述图谱特征表示的相似度,获取最优匹配子图,实现自描述症状实体到标准疾病实体的对齐。7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权要求1至5任一项项所述的基于医疗知识图谱融合的病症实体对齐方法。

技术总结
本发明公开了基于医疗知识图谱融合的病症实体对齐方法,包括:构建并形成大规模的标准疾病知识图谱;获取自描述症状语言数据,利用最优切分算法使自描述症状数据进行最优化切词,并形成自描述症状图谱;构建word2vec词向量模型,利用大规模医疗文本训练word2vec词向量模型,对自描述症状图谱和标准疾病知识图谱的实体进行特征扩展,以获得自描述症状图谱和标准疾病知识图谱的实体内容在同一特征向量空间下的语义建模;基于最优子图匹配算法对标准疾病知识图谱的任一子图结构进行遍历,计算子图结构的子图特征表示和自描述图谱特征表示的相似度,获取最优匹配子图,实现自描述症状实体到标准疾病实体的对齐。症状实体到标准疾病实体的对齐。症状实体到标准疾病实体的对齐。


技术研发人员:刘忠禹 姚佳 殷晋
受保护的技术使用者:四川大学华西医院
技术研发日:2022.11.21
技术公布日:2023/3/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献