一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于骨骼肌知识图谱的医疗自动问答方法与流程

2022-06-30 02:32:58 来源:中国专利 TAG:

技术特征:
1.一种基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,包括如下步骤:s1、构建人体骨骼运动知识图谱;s2、将构建的人体骨骼运动知识图谱作为一个知识库进行实体链接;s3、通过用户输入问题,将语义问题与人体骨骼肌知识图谱中的实体、关系进行匹配,推理得出答案。2.如权利要求1所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s1包括:s11、获取人体骨骼运动相关的结构化、半结构化和非结构化数据;s12、利用预训练模型对获取数据中的词语进行分布式表示;s13、通过实体关系联合抽取模型对数据进行实体、关系和属性抽取,完成人体骨骼运动知识图谱的搭建。3.如权利要求2所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s11利用scrapy对网页进行爬取获取人体骨骼运动相关的数据,或者通过书籍和医生康复师人工获取结构化数据;所述步骤s12在对数据进行文本表示之前先进行如下数据预处理和数据增强处理:对于得到的非结构化数据中的文本信息,按照信息抽取模型的标注模式进行标注,并将标注的文本作为训练集、验证集和测试集;通过人工构造的方式扩充数据量进行数据增强,扩充方式包括:原文扩充、随机截断、字符替换、随机翻转、同性词替换以及预训练模型输出替换;所述步骤s13利用基于深度学习的端到端的joint模型对数据进行实体、关系和属性抽取,并在tplinker模型的基础上增加了属性识别,然后利用tplinker模型将joint实体关系提取任务转换为token对的连接关系。4.如权利要求3所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s13通过token链接矩阵的标记方案来提取所有实体和重叠关系,具体包括:设置实体头部-实体尾部链接eh-et:用于表示一个实体的开始和终止token;设置主体头部-目标头部链接sh-oh:用于表示同一关系的两个实体的开始token;设置主体尾部-目标尾部链接st-ot:用于表示同一关系的两个实体的结束token;对每个关系进行一次标记,如果有n个关系则解析成2n 1的序列标记子任务了,每一个子任务的长度为n为输入的句子长度;从实体头部-实体尾部链接eh-et中提取所有实体,并通过字典将每个头部位置映射到相应到实体;然后开始进行解码,对于每个关系st-ot确定头实体的尾部和尾实体的尾部,将其添加到集合e中;接着以sh-oh序列查找字典d中头部位置开始的所有可能实体;最后开始迭代检查所有候选实体是否在集合e中,如果在则直接提取三元组放入集合t中。5.如权利要求4所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s13中人体骨骼运动知识图谱以人体关节为节点建立对应的关节肌群以及关节肌肉功能;所述人体关节的节点类型包括身体部位、关节肌群、肌肉、骨骼、筋膜、韧带、神经、关节、软骨、肌肉功能、肌肉功能测试、肌肉群、肌肉伸展测试、肌腱、器官、皮肤、关节囊、部位和动作;所述人体关节的节点属性包括:临床意义、名字、特别属性、状态、神经延展性测试说明、
等级、简介、肌肉延展测试说明、英文和说明,所述人体关节的关系属性包括:位置、动作指令、备注、测试方法、状态、短头位置、结论、说明、起始姿势和长头位置。6.如权利要求1所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s2中知识库包含一个实体集合e;每一个从互联网上获取的数据中抽取出来的实体,均为实体集合e的潜在提及对象;所述步骤s2将每个实体提及对象m∈m匹配对应到目标实体e∈e;如果在实际计算中集合e不包含m的目标实体,则将m链接到一个候选实体,并将候选实体作为新的目标实体补充到原有实体库。7.如权利要求6所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s2采取基于图卷积网络的模型,利用图卷积网络来对局部上下文和全局一致性信息进行建模实现知识图谱中的实体对齐,具体通过如下函数计算为候选实体寻找一个最优分配:为候选实体寻找一个最优分配:为输出候选实体的变量;p()为概率函数,为拓扑图的归一化邻接矩阵,f为候选实体的特征表示;f()是在参数ω下的一个映射函数,其利用编码器、子图卷积网络和解码器来获得该映射函数。8.如权利要求1所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s3通过识别问题语句的语义确定查询关系,将问题和实体进行嵌入获得其稠密向量表示,并在候选知识图谱中进行相关匹配,获得匹配知识后将相应节点关系嵌入后获得其稠密向量表示,并计算问题和候选答案的匹配度。9.如权利要求8所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,所述步骤s3包括:采用预训练模型提取问题特征,将获取的单个词向量进行相加得到对应句子的向量表示;使用transe系列模型将答案实体向量化;使用多列卷积网络,提取三个特征向量作为答案的三个维度,分别为答案的路径、答案的上下文信息和答案的类型。10.如权利要求9所述的基于骨骼肌知识图谱的医疗自动问答方法,其特征在于,针对不同的答案特征(实体,关系,类型,上下文),所述步骤s3采用得分函数s(q,a)度量问题和候选答案之间的关联程度;对于答案i的分布式表达为:g
i
(a)∈{g
e
(a),g
r
(a),g
t
(a),g
c
(a)}g
e
(a),g
r
(a),g
t
(a),g
c
(a)分别表示实体向量,关系向量,类型向量和上下文向量;对于问题i中的第j个词的词向量,对应问题的分布式表达记为:a
ij
为句子i对于词j的注意力权重;将最终的得分函数设为问题与答案的点积和:
采用hinge-loss作为其损失函数。

技术总结
本发明公开了一种基于骨骼肌知识图谱的医疗自动问答方法,包括如下步骤:S1、构建人体骨骼运动知识图谱;S2、将构建的人体骨骼运动知识图谱作为一个知识库进行实体链接;S3、通过用户输入问题,将语义问题与人体骨骼肌知识图谱中的实体、关系进行匹配,推理得出答案。本发明提供的基于骨骼肌知识图谱的医疗自动问答方法,能够针对用户输入问题精准选出最为匹配的答案,有效降低人工判断工作量,方便专业人士实现快速查询某块骨骼肌基本信息和相应的测试或康复方案,实现不用去医院也能够获得良好的预诊断。良好的预诊断。良好的预诊断。


技术研发人员:杨然 李峻 张萌 曾贵刚 胡凯翔 张涛 陈华江 徐辰
受保护的技术使用者:上海博灵机器人科技有限责任公司 上海长征医院
技术研发日:2021.12.15
技术公布日:2022/6/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献