一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定单病种上报问题答案的方法、装置、设备和存储介质与流程

2022-03-23 03:38:33 来源:中国专利 TAG:


1.本技术涉及医疗领域的阅读理解技术领域,特别是涉及一种确定单病种上报问题答案的方法、装置、设备和存储介质。


背景技术:

2.在医疗领域的阅读理解问题中,常出现因为标注数据难度较大而导致的数据量不足的问题,如单病种上报中术前患者内科疾患的多选题:单病种上报即根据国家要求,医生需要根据患者的病历及各种诊疗记录,对因某类病入院的患者进行一系列的问题填写然后上报给相关机构,医疗自然语言处理领域会使用阅读理解等模型帮助医生进行自动填报选择。而其中常出现一种类型的多选问题,医生需要根据患者的病历填报“内科疾患”“手术史”“用药史”等多选题;
3.例子:病历内容:“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”问题:“患者入院前内科疾患”选项:“a.血液病b.消化科疾病c.内分泌疾病d.oth”应该输出的答案:a,b那么在数量较少的标注训练数据下,模型可能都没有接触过红斑狼疮等疾病,更不能推知一段文本中出现了“红斑狼疮”就应该选择a.血液病的选项;对于手术史、用药史等问题也是一样。数量较少的标注训练数据下,端到端的阅读理解模型无法理解和处理很多医疗领域下的多选问题。


技术实现要素:

4.基于数量较少的标注训练数据下,端到端的阅读理解模型无法理解和处理很多医疗领域下的多选问题,本技术提供一种确定单病种上报问题答案的方法、电子设备和存储介质。
5.第一方面,本技术实施例提供一种确定单病种上报问题答案的方法,包括:
6.获取待确定答案的病历文本;
7.识别病历文本中的实体;
8.映射病历文本中的实体到对应的标准编码;
9.根据标准编码对应的先验医学知识确定答案。
10.进一步地,上述确定单病种上报问题答案的方法中,根据标准编码对应的先验医学知识确定答案,包括:
11.根据标准编码的首字母对应的先验医学知识确定答案;
12.其中,选项包括至少一个选项。
13.进一步地,上述确定单病种上报问题答案的方法中,识别病历文本中的实体采用命名实体识别技术识别。
14.进一步地,上述确定单病种上报问题答案的方法中,映射病历文本中的实体到对应的标准编码采用实体链接技术映射。
15.第二方面,本技术实施例还提供一种确定单病种上报问题答案的装置,包括:
16.获取模块:用于获取待确定答案的病历文本;
17.识别模块:用于识别病历文本中的实体;
18.映射模块:用于映射病历文本中的实体到对应的标准编码;
19.确定模块:用于根据标准编码对应的先验医学知识确定答案。
20.进一步地,上述确定单病种上报问题答案的装置中,确定模块根据标准编码对应的先验医学知识确定答案,包括:
21.根据标准编码的首字母对应的先验医学知识确定答案,
22.其中,选项包括至少一个选项。
23.进一步地,上述确定单病种上报问题答案的装置中,识别模块识别病历文本中的实体采用命名实体识别技术识别。
24.进一步地,上述确定单病种上报问题答案的装置中,映射模块映射病历文本中的实体到对应的标准编码采用实体链接技术映射。
25.第三方面,本技术实施例还提供一种电子设备,其特征在于,包括:处理器和存储器;
26.所述处理器通过调用所述存储器存储的程序或指令,用于执行上述一种确定单病种上报问题答案的方法。
27.第四方面,本技术实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机上述一种确定单病种上报问题答案的方法。
28.本技术实施例的优点在于:本技术涉及一种确定单病种上报问题答案的方法、装置、电子设备和存储介质,该方法包括:获取待确定答案的病历文本;识别病历文本中的实体;映射病历文本中的实体到对应的标准编码;根据标准编码对应的先验医学知识确定答案。本技术将一个阅读理解问题拆分成:识别病历文本中的实体;映射病历文本中的实体到对应的标准编码;根据标准编码对应的先验医学知识确定答案三步,完全模拟了医生处理该类问题的思路:即找到关心的病名或实体,使用的先验知识判断该病属于那个种类,最终进行选择判断,不仅准确率高而且简单、快捷。
附图说明
29.为了更清楚地说明本技术实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
30.图1为本技术实施例提供的一种确定单病种上报问题答案的方法示意图;
31.图2为本技术实施例提供的一种确定单病种上报问题答案的装置示意图;
32.图3是本技术实施例提供的一种电子设备的示意性框图。
具体实施方式
33.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申
请。但是本技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本技术内涵时做类似改进,因此本技术不受下面公开的具体实施的限制。
34.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
35.图1为本技术实施例提供的一种确定单病种上报问题答案的方法示意图。
36.第一方面,本技术实施例提供一种确定单病种上报问题答案的方法,结合图1,包括s101至s104四个步骤:
37.s101:获取待确定答案的病历文本。
38.具体的,本技术实施例中,获取待确定答案的病历文本的病历内容:“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”39.s102:识别病历文本中的实体。
40.具体的,本技术实施例中,用命名实体识别技术识别出病历中现问题关心的实体,如内科疾患需要“疾病”实体、用药史需要“药名”实体等,以“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”为例识别到“疾病”实体为“红斑狼疮、急性阑尾炎”。
41.s103:映射病历文本中的实体到对应的标准编码。
42.具体的,本技术实施例中,以上述疾病实体“红斑狼疮、急性阑尾炎”为例,映射病历文本中的实体红斑狼疮到对应的标准编码l93001上,映射病历文本中的实体急性阑尾炎到对应的标准编码k35.900上。
43.s104:根据标准编码对应的先验医学知识确定答案。
44.具体的,本技术实施例中,根据标准编码对应的先验医学知识确定答案l93001是血液病,k35.900是消化科疾病。
45.示例性的,病历内容:“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”问题:“患者入院前内科疾患”选项:“a.血液病b.消化科疾病c.内分泌疾病d.oth”应该输出的答案:a,b。
46.现有问题之一是因为标注难度较大耗时较长,质量好的标注数据量十分小导致模型无法学习到足够理解问题的程度。本技术将一个模型拆成几个子问题分别处理,子问题的标注简单耗时短且可以迭代自动学习,解决了数据量不足的问题。
47.数据量小不止会导致模型难以学习理解,也会使样本范围小,如例子中所写,只见过“高血脂”的模型很难理解“红斑狼疮”也是一种血液病,这样的数据分布偏差也会导致泛化效果差,而将其拆分成更基础的子问题,就可以使用在更广泛问题和样本上训练的子模块,不仅提升了准确性,也增强了泛化能力。
48.进一步地,上述确定单病种上报问题答案的方法中,根据标准编码对应的先验医学知识确定答案,包括:
49.根据标准编码的首字母对应的先验医学知识确定答案;
50.其中,选项包括至少一个选项。
51.具体的,本技术实施例中,通过首字母对应的先验医学知识确定答案,如标准编码
为n15.000,“n15.000”等n开头的编码都是泌尿系统疾病,应理解,本技术实施例中的选项可以是一个也可以是多个选项。
52.进一步地,上述确定单病种上报问题答案的方法中,识别病历文本中的实体采用命名实体识别技术识别。
53.具体的,本技术实施例中,识别病历文本中的实体采用命名实体识别技术识别。
54.进一步地,上述确定单病种上报问题答案的方法中,映射病历文本中的实体到对应的标准编码采用实体链接技术映射。
55.具体的,本技术实施例中,用实体链接技术将识别出的实体分别映射到对应的标准编码,如“巴尔干肾病”对应icd10编码为“n15.000”。
56.图2为本技术实施例提供的一种确定单病种上报问题答案的装置示意图。
57.第二方面,本技术实施例还提供一种确定单病种上报问题答案的装置,结合图2,包括:
58.获取模块201:用于获取待确定答案的病历文本。
59.具体的,本技术实施例中,获取模块201获取待确定答案的病历文本的病历内容:“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”60.识别模块202:用于识别病历文本中的实体。
61.具体的,本技术实施例中,识别模块202通过命名实体识别技术识别出病历中现问题关心的实体,如内科疾患需要“疾病”实体、用药史需要“药名”实体等,以“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”为例识别到实体为“红斑狼疮、急性阑尾炎”。
62.映射模块203:用于映射病历文本中的实体到对应的标准编码。
63.具体的,本技术实施例中,以上述实体“红斑狼疮、急性阑尾炎”为例,映射模块203映射病历文本中的实体红斑狼疮到对应的标准编码l93001上,映射病历文本中的实体急性阑尾炎到对应的标准编码k35.900上。
64.确定模块204:用于根据标准编码对应的先验医学知识确定答案。
65.具体的,本技术实施例中,确定模块204根据标准编码对应的先验医学知识确定答案l93001是血液病,k35.900是消化科疾病。
66.示例性的,病历内容:“既往史:患者既往因红斑狼疮入院,曾因急性阑尾炎发作行阑尾炎切除手术。”问题:“患者入院前内科疾患”选项:“a.血液病b.消化科疾病c.内分泌疾病d.oth”应该输出的答案:a,b。
67.进一步地,上述确定单病种上报问题答案的装置中,确定模块根据标准编码对应的先验医学知识确定答案,包括:
68.根据标准编码的首字母对应的先验医学知识确定答案,
69.其中,选项包括至少一个选项。
70.具体的,本技术实施例中,上述确定单病种上报问题答案的装置中,通过首字母对应的先验医学知识确定答案,如标准编码为n15.000,“n15.000”等n开头的编码都是泌尿系统疾病,应理解,本技术实施例中的选项可以是一个也可以是多个选项。
71.进一步地,上述确定单病种上报问题答案的装置中,识别模块识别病历文本中的实体采用命名实体识别技术识别。
72.具体的,本技术实施例中,识别病历文本中的实体采用命名实体识别技术识别。
73.进一步地,上述确定单病种上报问题答案的装置中,映射模块映射病历文本中的实体到对应的标准编码采用实体链接技术映射。
74.具体的,本技术实施例中,用实体链接技术将识别出的实体分别映射到对应的标准编码,如“巴尔干肾病”对应icd10编码为“n15.000”。
75.第三方面,本技术实施例还提供一种电子设备,其特征在于,包括:处理器和存储器;
76.所述处理器通过调用所述存储器存储的程序或指令,用于执行上述一种确定单病种上报问题答案的方法。
77.第四方面,本技术实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机上述一种确定单病种上报问题答案的方法。
78.图3是本公开实施例提供的一种电子设备的示意性框图。
79.如图3所示,电子设备包括:至少一个处理器301、至少一个存储器302和至少一个通信接口303。电子设备中的各个组件通过总线系统304耦合在一起。通信接口303,用于与外部设备之间的信息传输。可理解,总线系统304用于实现这些组件之间的连接通信。总线系统304除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但为了清楚说明起见,在图3中将各种总线都标为总线系统304。
80.可以理解,本实施例中的存储器302可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
81.在一些实施方式中,存储器302存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
82.其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本技术实施例提供的一种确定单病种上报问题答案的方法中任一方法的程序可以包含在应用程序中。
83.在本技术实施例中,处理器301通过调用存储器302存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器301用于执行本技术实施例提供的一种确定单病种上报问题答案的方法各实施例的步骤。
84.获取待确定答案的病历文本;
85.识别病历文本中的实体;
86.映射病历文本中的实体到对应的标准编码;
87.根据标准编码对应的先验医学知识确定答案。
88.本技术实施例提供的一种确定单病种上报问题答案的方法中任一方法可以应用于处理器301中,或者由处理器301实现。处理器301可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器301可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑
器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
89.本技术实施例提供的一种确定单病种上报问题答案的方法中任一方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器302,处理器301读取存储器302中的信息,结合其硬件完成一种确定单病种上报问题答案的方法的步骤。
90.本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本技术的范围之内并且形成不同的实施例。
91.本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
92.以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献