一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱和自适应机制的辅助疾病推理系统的制作方法

2022-02-21 09:11:07 来源:中国专利 TAG:

技术特征:
1.一种基于知识图谱和自适应机制的疾病推理系统,其特征在于,所述系统包括:数据获取模块,用于构建以三元组<症状,发生部位,疾病>为结构的知识图谱,确定由若干个三元组<症状,发生部位,疾病>组成的训练数据集;确定<症状,发生部位>组成的测试数据集;疾病推理模型构建模块,基于transe翻译模型和朴素贝叶斯分类器,构建疾病推理模型;数据分割模块,用于将训练数据集划分,将测试数据集划分;疾病推理模型训练模块,利用训练数据集训练疾病推理模型,确定训练数据集划分下,疾病推理模型中transe翻译模型的个数n、朴素贝叶斯分类器的个数m及边界值m;测试模块,以划分下的测试数据集<症状,发生部位>作为输入数据组,将输入数据组的数目与边界值m进行比较,输入至具有不同transe翻译模型个数及朴素贝叶斯分类器个数的疾病推理模型中,输出疾病预测值。2.根据权利要求1所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,数据获取模块构建以三元组<症状,发生部位,疾病>为结构的知识图谱的过程为:获取知识图谱所需医学字段,对医学字段进行分词操作,将“疾病”、“发生部位”、“症状”信息与除三者之外的无用信息进行分离;对分离后的“疾病”、“发生部位”、“症状”信息做关键词提取,得到以三元组<症状,发生部位,疾病>为结构的知识图谱;所述由若干个三元组<症状,发生部位,疾病>组成的训练数据集为若干个“疾病”病种分别对应下的<症状,发生部位>数据组成的三元组<症状,发生部位,疾病>集合;所述测试数据集为<症状,发生部位>数据组成的集合。3.根据权利要求2所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,所需医学字段通过python的urllib库从网页获取,基于pkuseg分词包对医学字段进行分词操作,基于thuocl_medical词库对分离后的“疾病”、“发生部位”、“症状”信息做关键词提取。4.根据权利要求2所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,三元组<症状,发生部位,疾病>中的“症状”和“疾病”分别为头部实体和尾部实体,“发生部位”为关系,疾病推理模型构建模块基于transe翻译模型将知识图谱中的三元组实体和关系均表示为同一空间中的向量,并将关系看作实体间的平移向量。5.根据权利要求4所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,设头部“症状”实体表示为头向量h,“发生部位”关系表示成为向量r,尾部“疾病”实体表示为尾向量t,l类疾病分别为{b1,b2,

,b
l
},b
j
表示第j类疾病;设存在k组<症状,发生部位>数据待推理疾病,疾病推理模型构建模块基于transe翻译模型和朴素贝叶斯分类器,构建的疾病推理模型为:其中,疾病推理模型由n个transe翻译模型的距离值和m个朴素贝叶斯分类器的概率值组成,表示transe翻译模型在k组<症状,发生部位>数据输入时的距离值,通过累乘得到transe翻译模型的最终距离值d(b
j
):
其中,l1为曼哈顿距离,l2为欧氏距离;表示朴素贝叶斯分类器在k组<症状,发生部位>数据输入时的距离值,通过累乘获得朴素贝叶斯分类器的最大概率值d
max
,表示为:其中,p(t
bj
)指先验概率,是指一种“症状”特征在未进入朴素贝叶斯分类器前,这种症状属于疾病b
j
的概率;d
max
为朴素贝叶斯分类器的最大概率值,在求取后添加负号,与n个transe翻译模型的距离值相乘之后求取最小值,得到疾病推理模型,f表示疾病推理模型的预测结果。6.根据权利要求5所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,所述疾病推理模型训练模块利用训练数据集训练疾病推理模型时,训练数据集首先输入至transe翻译模型,在transe翻译模型中训练后得到“症状”头向量h、“发生部位”关系向量r、“疾病”实体尾向量t和先验概率p(t
bj
),其中,h r与关系向量t的距离越近,三元组<症状,发生部位,疾病>的疾病与症状、发生部位之间的匹配越准确;否则,三元组<症状,发生部位,疾病>的疾病与症状、发生部位之间的匹配越偏离。7.根据权利要求5所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,数据分割模块将训练数据集划分为两份,统计训练数据集三元组<症状,发生部位,疾病>中每一种疾病对应的所有<症状,发生部位>的数目,确定所有疾病中对应<症状,发生部位>数目中的最大值max1,max1为正整数;边界值m从取1开始,以1/2max1为止,逐次加1遍历,在从取1开始的每一个边界值m下,逐一将训练数据集中每个疾病对应的<症状,发生部位>的数目作为输入数目与边界值m对比,若输入数目小于边界值m时,训练数据集进入第一推理模型,所述第一推理模型为:其中,n1表示第一推理模型中transe翻译模型的个数,m1表示第一推理模型中朴素贝叶斯分类器的个数;若输入数目大于等于边界值m时,训练数据集进入第二推理模型,所述第二推理模型为:其中,n2表示第二推理模型中transe翻译模型的个数,m2表示第二推理模型中朴素贝叶斯分类器的个数;统计边界值m在依次取值下,经第一推理模型与第二推理模型分别推理疾病病种的准确率,在第一推理模型与第二推理模型推理疾病病种准确率相加的总准确率最高时,选定总准确率最高时对应的边界值ma作为训练数据集划分为两份时疾病推理模型的边界值,以及确定总准确率最高时对应的第一推理模型中transe翻译模型的个数n1、朴素贝叶斯分类器的个数m1、第二推理模型中transe翻译模型的个数n2、朴素贝叶斯分类器的个数m2。
8.根据权利要求7所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,数据分割模块将测试数据集<症状,发生部位>划分为两份,所述测试模块以划分下的测试数据集<症状,发生部位>作为输入数据组,首先逐一将测试数据集中同样的<症状,发生部位>测试数据组的数目作为输入数目,将输入数目与边界值ma进行比较,当输入数目小于边界值ma时,同样的<症状,发生部位>测试数据组进入第一推理模型,否则,同样的<症状,发生部位>测试数据组进入第二推理模型。9.根据权利要求8所述的基于知识图谱和自适应机制的疾病推理系统,其特征在于,测试数据集输入至具有不同transe翻译模型个数及朴素贝叶斯分类器个数的疾病推理模型后,输出的疾病预测值为疾病推理模型的预测结果f最小时,对应的疾病b
j
。10.一种基于知识图谱和自适应机制的疾病推理设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时,实现:构建以三元组<症状,发生部位,疾病>为结构的知识图谱,确定由若干个三元组<症状,发生部位,疾病>组成的训练数据集;确定<症状,发生部位>组成的测试数据集;基于transe翻译模型和朴素贝叶斯分类器,构建疾病推理模型;将训练数据集划分,将测试数据集划分;利用训练数据集训练疾病推理模型,确定训练数据集划分下,疾病推理模型中transe翻译模型的个数n、朴素贝叶斯分类器的个数m及边界值m;以划分下的测试数据集<症状,发生部位>作为输入数据组,将输入数据组的数目与边界值m进行比较,输入至具有不同transe翻译模型个数及朴素贝叶斯分类器个数的疾病推理模型中,输出疾病预测值。

技术总结
本发明提出一种基于知识图谱和自适应机制的疾病推理系统,涉及计算机技术、辅助医疗机械的技术领域,以三元组<症状,发生部位,疾病>的知识图谱为数据结构,以TransE翻译模型和朴素贝叶斯分类器为基础构建疾病推理模型,首先将数据集划分的,为每一部分的数据集寻找合适个数的TransE翻译模型和朴素贝叶斯分类器搭配,实现自适应匹配,既能减少输入不平衡性对模型的影响,还能利用朴素贝叶斯分类器提升可解释性,提高系统对疾病推理的准确率,进一步辅助提高医疗工作人员的工作效率。一步辅助提高医疗工作人员的工作效率。一步辅助提高医疗工作人员的工作效率。


技术研发人员:罗柏涛 王勇
受保护的技术使用者:广东工业大学
技术研发日:2021.10.27
技术公布日:2022/1/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献