一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于医学知识图谱构建问答对的问答方法及装置与流程

2022-08-23 21:58:35 来源:中国专利 TAG:


1.本发明实施例涉及计算机程序领域,尤其涉及一种基于医学知识图谱构建问答对的问答方法及装置。


背景技术:

2.随着医学人工客服的紧缺,医学智能问答变得越来越重要。医学智能问答不仅可以免去用户等待人工客服的时间,还能大大降低医院的运营成本。
3.虽然现有医学智能问答可以解决大部分的用户问题,以使宝贵的人工客户资源解决剩余部分的复杂问题。但不可否认的是,该剩余部分的复杂问题仍使很多医院的人工客服不堪重负。究其原因在于现有医学智能问答仅能解决的问题都是简单的医疗问题,比如甲状腺由什么组织组成,体温多少度为高烧;但不能解决复杂的医疗问题,比如多跳型问题。多跳型问题是有条件的约束问题,比如甲状腺激素升高,是得了甲亢了么?
4.综上,本技术人在实现本发明实施例的过程中发现,现有医学智能问答方法无法确定复杂医疗问题的答案。


技术实现要素:

5.本发明实施例提供了一种基于医学知识图谱构建问答对的问答方法及装置,解决了现有医学智能问答方法无法确定复杂医疗问题的答案。
6.第一方面,本发明实施例提供了一种问答方法,包括:
7.获取当前待解答的医学问题;
8.将所述医学问题输入已训练的问答模型以得到所述医学问题对应的答案,并输出所述答案;
9.其中,所述已训练的问答模型用于在检测到所述医学问题为非直接型问题时,将所述医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案作为所述医学问题的答案;其中,所述至少两个级联医学子问题中,在前的医学子问题的答案是在后的医学子问题对应三元组中的一个目标实体。
10.进一步,所述非直接型问题为多跳型问题或推理型问题。
11.进一步,所述推理型问题具体为比较级问题、区别型问题、并列型问题或是否型问题。
12.进一步,所述已训练的问答模型基于预设类型的问答对训练而成,所述预设类型的问答对包括基于第一预设类型问题模板从医学知识图谱中获取的问答对,和基于第二预设类型问题模板从医学知识库中获取的问答对。
13.进一步,第一预设类型问题模板与第二预设类型问题模板均包含解决方案型问题模板,枚举型问题模板,数值型问题模板,事实型模板、定义型问题模板、原因型问题模板的一种或多种,
14.所述第一预设类型问题模板还包括是否型问题模板、推理型问题模板中的一种或
多种。
15.进一步,所述至少两个级联医学子问题的语法结构符合第一预设类型问题模板或第二预设类型问题模板的语法结构。
16.进一步,所述问答对还包括通过已训练的问答对提取模型从待提取对象中提取的问答对结果;所述待提取对象为医学书本和/或医学网站。
17.进一步,所述问答对包括一个或多个医学问题以及该一个或多个医学问题对应的同一答案;所述一个和多个医学问题包括将标准问题通过外语泛化后的泛化问题,其中,所述标准问题为与已有问题模板的语法结构相同的问题。
18.进一步,所述在前的医学子问题至少包括与所述在后医学子问题相邻且位于所述在后医学子问题前的医学子问题。
19.第二方面,本发明实施例还提供了一种问答装置,包括:
20.问题获取模块,用于获取当前待解答的医学问题;
21.答案确定与输出模块,用于将所述医学问题输入已训练的问答模型以得到所述问题对应的答案,并输出所述答案,其中,所述已训练的问答模型用于在检测到所述医学问题为非直接型问题时,将所述医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案作为所述医学问题的答案;其中,所述至少两个级联医学子问题中,在前的医学子问题的答案是在后的医学子问题对应三元组中的一个目标实体。
22.相较于现有技术的智能医疗问答方法仅能回答简单的问题,本发明实施例提供的问答方法的技术方案,已训练的问答模型在遇到非直接型问题时,通过确定该医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案,来确定该医学问题的答案;级联医学子问题的设置使得在前的医学子问题的答案可作为在后的医学子问题对应三元组中的一个目标实体,从而使得已训练的问答模型通过顺序确定该至少两个级联医学子问题的答案来确定获取的医学问题的答案,提高了智能医疗问答可准确回答问题的复杂度,以及智能医疗问答的用户体验。
附图说明
23.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1是本发明实施例一提供的问答方法的流程图;
25.图2是本发明实施例二提供的问答装置的结构框图。
具体实施方式
26.为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.实施例一
28.图1是本发明实施例一提供的问答方法的流程图。本实施例的技术方案适用于通过智能问答提供医学知识服务的情况。该方法可以由本发明实施例提供的问答装置来执行,该装置可以采用软件和/或硬件的方式实现,并配置在处理器中应用。该方法具体包括如下步骤:
29.s110、获取当前待解答的医学问题。
30.其中,当前待解答的医学问题为用户以语音形式输入的医学问题,或用户在输入框中以文字形式输入的医学问题。比如,“甲状腺由什么组成?”、“甲状腺炎是什么?”、“哪个医院治疗甲状腺炎最好?”、“甲状腺炎的症状有哪些?”。
31.s120、将医学问题输入已训练的问答模型以得到医学问题对应的答案,并输出该答案;其中,该已训练的问答模型用于在检测到医学问题为非直接型问题时,将医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案作为医学问题的答案;其中,该至少两个级联医学子问题中,在前的医学子问题的答案是在后的医学子问题对应三元组中的一个目标实体。
32.其中,三元组为医学知识图谱中的事实。医学知识图谱是一种揭示医学实体之间关系的语义网络,可被定义为g={ε,r,f},其中,ε、r、f分别表示医学实体、关系和事实的集合。
33.其中,非直接型问题是包含至少两个级联的直接型问题的问题。
34.其中,该已训练的问答模型基于预设类型的问答对训练而成。
35.其中,问答对包括一个或多个医学问题以及该一个或多个医学问题对应的同一答案。在一个实施例中,该一个和多个医学问题包括将标准问题通过外语泛化后的泛化问题,其中,标准问题为与已有问题模板的语法结构相同的问题。示例性的,将“甲状腺的治疗方案”在线翻译成第一小语种以得到第一翻译结果,然后将该第一翻译结果在线翻译成第二小语种以得到第二翻译结果,再将该第二翻译结果在线翻译成英文,最后再将英文翻译结果翻译成中文,得到中文结果“甲状腺的治疗选择”,即为泛化后问题,确定该泛化后问题是否在相应的问答对中,若不存在,则将该问题添加至相应问答对。
36.在一个实施例中,该预设类型的问答对包括基于第一预设类型问题模板从医学知识图谱中获取的问答对,第一预设类型问题模板包括但不限于枚举型问题模板、是否型问题模板、推理型问题模板、解决方案型问题模板、数值型问题模板中的一种或多种。其中,医学知识图谱为现有医学知识图谱或预先构建的医学知识图谱。该实施例中预先构建的医学知识图谱是基于人卫医学书本、医学网站、百度百科等权威医学书本内容和网站内容构建的。
37.在一个实施例中,预设类型的问答对包括基于第二预设类型问题模板从医学知识库中获取的问答对;第二预设类型问题模板包括事实型问题模板、定义型问题模板、原因型问题模板和解决方案型问题模板中的一种或多种。其中,医学知识库为现有医学知识库或预先构建的医学知识库。该实施例中预先构建的医学知识库包括人为医学课本、百度百科、医学网站和医学百科中关于每个实体的解释。
38.可选地,第一预设类型问题模板与第二预设类型问题模板存在交集。交集范围而言,比如第一预设类型问题模板与第二预设类型问题模板均包含解决方案型问题模板,枚举型问题模板,数值型问题模板,事实型模板、定义型问题模板、原因型问题模板中一个或
多个。
39.在一个实施例中,枚举型问题模板为:“实体|的|关系|有哪些/是什么”。示例性的,“甲状腺炎的症状有哪些?”;第一是否型问题模板为:“实体1是实体2的组成部分吗/病因?”;示例性的,“甲状腺炎是不是桥本氏甲状腺炎?”。推理型问题模板或第二是否型问题模板为:“实体1|包含/是|实体2?”;示例性的,“妊娠期发生急性胰腺炎的概率是多少?”;第一解决方案型问题模板为:“我得了|实体|我应该怎么办?”,示例性的,“我得了甲状腺炎,我该怎么办?”;第二解决方案型问题模板为:“实体如何治疗?”;示例性的,“甲状腺炎的治疗方案?”;数值型问题模板为:“实体|的|关系|是多少?”;示例性的,“甲状腺炎的人群发病率是多少?”。事实型问题模板/定义型问题模板为“实体|关系|是什么?”;示例性的,“甲状腺由什么组织组成?”,或者“甲状腺炎是什么?”;原因型问题模板为:“为什么|我会有/得了/得/患有/有|实体?”;示例性的,“为什么得甲状腺炎?”。
40.在一个实施例中,问答对还包括通过已训练的问答对提取模型从待提取对象中提取的问答对结果;待提取对象为医学书本或医学网站。该已训练的问答对提取模型包括已训练的关系抽取模型和/或已训练的什么模型。其中,关系抽取模型和什么模型采用现有模型架构即可。
41.在一个实施例中,已训练的关系抽取模型用于对百度百科与书本中的半结构化内容进行处理以得到结构化的三元组。该三元组可用于生成推理型的问答对以及预选构建的医学知识图谱。该已训练的关系抽取模型可提高三元组的生成速度和准确度,从而提高推理型问答对的生成速度和准确度,以及医学知识图谱的生成速度和准确度。
42.在一个实施例中,将书本中的大段内容输入已训练的什么模型,该已训练的什么模型可直接生成问答对。通过已训练的什么模型可以大大提高问答对的生成速度和准确性。
43.示例性的,以书本中关于妊娠期急性胰腺炎的描述说明三元组的结构和提取方式。具体为:急性胰腺炎是指多种病因导致的胰腺消化酶被激活后引起其自身以及周围脏器的消化、水肿、出血、甚至坏死的化学炎症性疾病。急性胰腺炎是妊娠期非常罕见和严重的并发症,其发生率很难估计,占妊娠者的1/3000-1/5000。病因:胆管疾病,包括胆结石、胆管感染、胆管蛔虫病,是我国最常见的致病原因;酗酒和暴饮暴食;内分泌与代谢障碍:高脂血症、高钙血症。该段落通过实体识别、关系抽取与结构化被解析成以下五个三元组:1)急性胰腺炎|是|xx,急性胰腺炎定义内容;2)急性胰腺炎|发生率(妊娠期),1/3000-1/5000;3)急性胰腺炎|病因,1,胆管疾病,包括胆结石、胆管感染、胆管蛔虫病,是我国最常见的致病原因;2,酗酒和暴饮暴食;3,内分泌与代谢障碍:高脂血症、高钙血症;4)胆管疾病|组成,胆结石、胆管感染、胆管蛔虫病;5)内分泌与代谢障碍|组成,高脂血症、高钙血症。该实施例中,将第一个三元组添加到医学知识库中。
44.在一个实施例中,根据医学知识图谱可以自动生成枚举型、推理型、数值型以及是否型等问答对;根据医学知识库可以自动生成事实型、定义型和解决方案型等问答对。示例性的,对于上述实施例得到的关于急性胰腺炎的三元组,可以生成以下几种问题模板对应的问答对。1)枚举型问题模板为:“实体|的|关系|有哪些/是什么”;2)第一是否型问题模板为:“实体1是实体2的组成部分吗/病因?”;3)推理型问题模板或第二是否型问题模板为:“实体1|包含/是|实体2?”;4-1)第一解决方案型问题模板为:“我得了|实体|我应该怎么
办?”;4-2)第二解决方案型问题模板为:“实体如何治疗?”;5)数值型问题模板为:“实体|的|关系|是多少?”;6)事实型问题模板/定义型问题模板为“实体|关系|是什么?”;7)原因型问题模板为:“为什么|我会有/得了/得/患有/有|实体?”。
45.本实施例中,非直接型问题可被拆分为至少两个级联医学子问题,且在前的医学子问题的答案是在后的医学子问题所在三元组的一个目标实体。比如,非直接型问题:“糖尿病并发症的症状有哪些?”,其可被拆分为第一个医学子问题:“糖尿病的并发症有哪些?”以及第二个医学子问题:“并发症的症状有哪些?”。
46.可选地,在前医学子问题包括与在后医学子问题相邻且位于该在后医学子问题前的医学子问题,比如一非直接型问题被拆分成三个级联医学子问题,该三个级联医学子问题分别为问题a、问题b和问题c。对于问题b,其对应的在前医学子问题为问题a;对于问题c,其对应的医学子问题为问题b,或者为问题a和问题b。在一个实施例中,当在后医学子问题对应两个在前医学子问题时,该两个在前医学子问题的答案作为该在后医学子问题的两个实体,该在后医学子问题的目的是确定这两个实体之间的关系,比如大小关系,包含关系等。
47.在一个实施例中,非直接型问题为多跳型问题或推理型问题。可选地,多跳型问题是有条件的约束问题,比如,“甲状腺激素升高,是得了甲亢么?”、“我今年23岁,会得糖尿病么?”。可选地,推理型问题可以是比较级问题、并列型问题、是否型问题或区别型问题。
48.在一个实施例中,非直接型问题对应的至少两个级联医学子问题的语法结构符合第一预设类型问题模板或第二预设类型问题模板的语法结构。该实施例可使已训练的问答模型顺序执行该至少两个级联医学子问题,即可得到最后一个医学子问题的答案,该答案即为医学问题的答案。
49.在一个实施例中,输入的医学问题为“糖尿病并发症的症状有哪些?”。该医学问题对应的至少两个级联医学子问题包括:“糖尿病的并发症有哪些?”、“x的并发症的症状有哪些?”。将第一个医学子问题的答案,替换第二个医学子问题中的x。示例性的,第一个医学子问题的答案为糖尿病酮症酸中毒、高血糖高渗状态、乳酸性酸中毒、大血管并发症、微血管并发症。第二个医学子问题为“糖尿病酮症酸中毒、高血糖高渗状态、乳酸性酸中毒、大血管并发症、微血管并发症的症状有哪些?”。输出该第二个医学子问题的答案,以作为糖尿病并发症的症状的答案。
50.相较于现有技术的智能医疗问答方法仅能回答简单的问题,本发明实施例提供的问答方法的技术方案,已训练的问答模型在遇到非直接型问题时,通过确定该医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案,来确定该医学问题的答案;级联医学子问题的设置使得在前的医学子问题的答案可作为在后的医学子问题对应三元组中的一个目标实体,从而使得已训练的问答模型通过顺序确定该至少两个级联医学子问题的答案来确定获取的医学问题的答案,提高了智能医疗问答可准确回答问题的复杂度,以及智能医疗问答的用户体验。
51.实施例二
52.图2是本发明实施例提供的问答装置的结构框图。该装置用于执行上述任意实施例所提供的问答方法,该装置可选为软件或硬件实现。该装置包括:
53.问题获取模块21,用于获取当前待解答的医学问题;
54.答案确定与输出模块22,用于将所述医学问题输入已训练的问答模型以得到所述问题对应的答案,并输出所述答案,其中,所述已训练的问答模型用于在检测到所述医学问题为非直接型问题时,将所述医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案作为所述医学问题的答案;其中,所述至少两个级联医学子问题中,在前的医学子问题的答案是在后的医学子问题对应三元组中的一个目标实体。
55.可选地,所述非直接型问题为多跳型问题或推理型问题。
56.可选地,所述推理型问题具体为比较级问题、区别型问题、并列型问题或是否型问题。
57.可选地,所述已训练的问答模型基于预设类型的问答对训练而成,所述预设类型的问答对包括基于第一预设类型问题模板从医学知识图谱中获取的问答对,和基于第二预设类型问题模板从医学知识库中获取的问答对。
58.可选地,第一预设类型问题模板与第二预设类型问题模板均包含解决方案型问题模板,枚举型问题模板,数值型问题模板,事实型模板、定义型问题模板、原因型问题模板的一种或多种,
59.所述第一预设类型问题模板还包括是否型问题模板、推理型问题模板中的一种或多种。
60.可选地,所述至少两个级联医学子问题的语法结构符合第一预设类型问题模板或第二预设类型问题模板的语法结构。
61.可选地,所述问答对还包括通过已训练的问答对提取模型从待提取对象中提取的问答对结果;
62.所述待提取对象为医学书本和/或医学网站。
63.可选地,所述已训练的问答对提取模型包括已训练的关系抽取模型和/或已训练的什么模型。
64.可选地,所述问答对包括一个或多个医学问题以及该一个或多个医学问题对应的同一答案;
65.所述一个和多个医学问题包括将标准问题通过外语泛化后的泛化问题,其中,所述标准问题为与已有问题模板的语法结构相同的问题。
66.可选地,所述在前的医学子问题至少包括与所述在后医学子问题相邻且位于所述在后医学子问题前的医学子问题。
67.相较于现有技术的智能医疗问答仅能回答简单的问题,本发明实施例提供的问答装置的技术方案,已训练的问答模型在遇到非直接型问题时,通过确定该医学问题对应的至少两个级联医学子问题中的最后一个医学子问题的答案,来确定该医学问题的答案;级联医学子问题的设置使得在前的医学子问题的答案可作为在后的医学子问题对应三元组中的一个目标实体,从而使得已训练的问答模型通过顺序确定该至少两个级联医学子问题的答案来确定获取的医学问题的答案,提高了智能医疗问答可准确回答问题的复杂度,以及智能医疗问答的用户体验。
68.本发明实施例所提供的问答装置可执行本发明任意实施例所提供的问答方法,具备执行方法相应的功能模块和有益效果。
69.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,
本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献