一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

单病种上报多选问题的处理方法、装置、电子设备和介质与流程

2022-03-23 03:35:54 来源:中国专利 TAG:


1.本技术涉及单病种上报技术领域,特别是涉及单病种上报多选问题的处理方法、电子设备和存储介质。


背景技术:

2.单病种上报即根据国家要求,医生需要根据患者的病历及各种诊疗记录,对因某类病入院的患者进行一系列的问题填写选择然后上报给相关机构,医疗自然语言处理领域会使用阅读理解等模型帮助医生进行自动填报选择,其中除了答案唯一的单选,还常出现多选问题,有技术在处理单病种上报问题的选择题时,使用bertformultiplechoice方法并行式地输入数据,即对于一条数据,将文本 问题与每个选项拼接,再将这一组内容输入bert模型进行编码,将bert输出的编码输入一层全连接网络转化为对于每个选项的评分,最终得到一个分值最高的选项:在单病种上报的项目中,多选题十分常见,现有模型只能输出一个答案,无法处理多选问题。


技术实现要素:

3.基于在单病种上报的项目中,多选题十分常见,现有模型只能输出一个答案,无法处理多选问题,本技术提供单病种上报多选问题的处理方法、电子设备和存储介质。
4.第一方面,本技术实施例提供单病种上报多选问题的处理方法,包括:
5.确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本;
6.拼接所述第一文本以及多个第二文本后输入模型中得到多组句子向量;
7.判断所述多组句子向量中每组向量对应的第二文本的内容是否属于第一文本;
8.若判断结果为第二文本的内容属于所述第一文本,确定第二文本的内容对应的答案选项是单病种病历以及问题对应的答案选项之一。
9.进一步地,上述一种单病种上报多选问题的处理方法还包括:
10.若判断结果为第二文本的内容不属于所述第一文本;
11.则确定第二文本的内容对应的答案选项不是单病种病历以及问题对应的答案选项。
12.进一步地,上述一种单病种上报多选问题的处理方法中,拼接第一文本以及多个第二文本后输入模型中得到多组句子向量,包括:
13.拼接第一文本以及多个第二文本后得到多个文本,将多个文本输入模型中得到多组句子向量。
14.进一步地,上述一种单病种上报多选问题的处理方法中,模型是bert模型。
15.进一步地,上述一种单病种上报多选问题的处理方法中,确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本之前,包括:
16.为单病种病历以及问题添加标记;
17.为单病种病历以及问题对应的多个答案选项添加标记。
18.进一步地,上述一种单病种上报多选问题的处理方法中,判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本,包括:
19.若判断结果为1,则确定第二文本的内容属于第一文本;
20.若判断结果为0,则确定第二文本的内容不属于第一文本。
21.进一步地,上述一种单病种上报多选问题的处理方法中,判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本,是通过softmax函数判断的。
22.第二方面,本技术实施例还提供一种单病种上报多选的处理装置,包括:
23.第一确定模块:用于确定单病种病历以及问题为第一文本,确定所述单病种病历以及问题对应的多个答案选项为多个第二文本;
24.拼接模块:用于拼接所述第一文本以及多个第二文本后输入模型中得到多组句子向量;
25.判断模块:用于判断所述多组句子向量中每组向量对应的第二文本的内容是否属于第一文本;
26.第二确定模块:用于若判断结果为第二文本的内容属于第一文本,则确定第二文本的内容对应的答案选项是单病种病历以及问题对应的选项之一。
27.第三方面,本技术实施例还提供一种电子设备,其特征在于,包括:处理器和存储器;
28.所述处理器通过调用所述存储器存储的程序或指令,用于执行上述单病种上报多选问题的处理方法。
29.第四方面,本技术实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机上述单病种上报多选问题的处理方法。
30.本技术实施例的优点在于:本技术涉及单病种上报多选问题的处理方法、装置、电子设备和存储介质,该方法包括:确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本;拼接第一文本以及多个第二文本后输入模型中得到多组句子向量;判断每组句子向量对应的第二文本的内容是否属于第一文本;若判断结果为第二文本的内容属于所述第一文本,确定第二文本的内容对应的答案选项是单病种病历以及问题对应的答案选项之一。本技术通过更关注每一个选项与单病种病历以及问题间的关系,将多选问题理解为问题和文本对于每一个选项的蕴含问题,将原有的并行的bertformultiplechoice方法改为串行的pair-wise二分类,不仅实现了多选的目的,而且针对单病种上报问题由于问题与问题间的依赖关系,导致选项之间并没有依赖,所以更关注选项与文本间蕴含关系的本技术可以更好的解决这类问题,提高了多选的准确率。
附图说明
31.为了更清楚地说明本技术实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1为本技术实施例提供的单病种上报多选问题的处理方法示意图一;
33.图2为本技术实施例提供的单病种上报多选问题的处理方法示意图二;
34.图3为本技术实施例提供的单病种上报多选问题的处理装置示意图;
35.图4是本技术实施例提供的一种电子设备的示意性框图。
具体实施方式
36.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本技术。但是本技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本技术内涵时做类似改进,因此本技术不受下面公开的具体实施的限制。
37.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
38.图1为本技术实施例提供的单病种上报多选问题的处理方法示意图一。
39.第一方面,本技术实施例提供单病种上报多选问题的处理方法,结合图1,包括s101至s104四个步骤:
40.s101:确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本;
41.具体的,本技术实施例中,将单病种病历以及问题确定为第一文本texta,将单病种病历以及问题对应的一个选项选项确定为第二文本textb。
42.s102:拼接第一文本以及多个第二文本后输入模型中得到多组句子向量。
43.具体的,本技术实施例中,是将第一文本texta复制多份,和多个不同的第二文本textb分别拼接后输入模型中生成多组句子向量。
44.s103:判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本。
45.具体的,本技术实施例中,判断每一个第二文本textb的内容是否被第一文本texta蕴含,最终输出为1/0。
46.s104:若判断结果为第二文本的内容属于所述第一文本,确定第二文本的内容对应的答案选项是单病种病历以及问题对应的答案选项之一。
47.具体的,本技术实施例中,如果判断结果为第二文本的内容蕴含所述第一文本,则确定该选项符合这段单病种病历以及问题的要求,在答案中就会选择该选项。
48.进一步地,上述一种单病种上报多选问题的处理方法还包括:
49.若判断结果为第二文本的内容不属于所述第一文本,则确定第二文本的内容对应的答案选项不是单病种病历以及问题对应的答案选项。
50.具体的,本技术实施例中,如果判断结果为第二文本的内容不蕴含所述第一文本,则确定该选项不符合这段单病种病历以及问题的要求,在答案中就不会选择该选项。
51.图2为本技术实施例提供的单病种上报多选问题的处理方法示意图二。
52.进一步地,上述一种单病种上报多选问题的处理方法中,拼接第一文本以及多个第二文本后输入模型中得到多组句子向量,结合图2,包括s201至s202两个步骤:
53.s201:拼接第一文本以及多个第二文本后得到多个文本;
54.s202:将多个文本输入模型中得到多组句子向量。
55.具体的,本技术实施例中,多个文本的数量与多个第二文本的数量相同,即有多少个第二文本就有多少个多个文本,然后将多个文本输入模型中得到多组句子向量,进一步根据句子向量判断句子向量中每一个第二文本的内容是否属于第一文本。
56.进一步地,上述一种单病种上报多选问题的处理方法中,模型是bert模型。
57.进一步地,上述一种单病种上报多选问题的处理方法中,确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本之前,包括:
58.为单病种病历以及问题添加标记;
59.为单病种病历以及问题对应的多个答案选项添加标记。
60.具体的,本技术实施例中,示例性的,为单病种病历以及问题text question的首尾分别添加开始标记[cls]和结束标记[sep],为单病种病历以及问题对应的多个答案选项answer1添加结束标记[sep];示例性的:[cls]text question[sep]answer1[sep]。从而能够更清晰的区分单病种病历以及问题以及单病种病历以及问题对应的多个答案选项,进一步能够更清晰的区分第一文本和第二文本。
[0061]
进一步地,上述一种单病种上报多选问题的处理方法中,判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本,包括:
[0062]
若判断结果为1,则确定第二文本的内容属于第一文本;
[0063]
若判断结果为0,则确定第二文本的内容不属于第一文本。
[0064]
具体的,本技术实施例中,判断每一个第二文本textb的内容是否被第一文本texta蕴含,最终输出判断结果为1/0,如果判断结果为1,则确定该选项符合这段单病种病历以及问题的要求,在答案中就会选择该选项,如果判断结果为0,则确定该选项不符合这段单病种病历以及问题的要求,在答案中就不会选择该选项。
[0065]
进一步地,上述一种单病种上报多选问题的处理方法中,判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本,是通过softmax函数判断的。
[0066]
具体的,本技术实施例中,判断每一个第二文本textb的内容是否被第一文本texta蕴含,最终输出为1/0,是通过softmax函数判断的。
[0067]
图3为本技术实施例提供的单病种上报多选问题的处理装置示意图。
[0068]
第二方面,本技术实施例还提供一种单病种上报多选的处理装置,结合图3,包括:
[0069]
第一确定模块301:用于确定单病种病历以及问题为第一文本,确定所述单病种病历以及问题对应的多个答案选项为多个第二文本。
[0070]
具体的,本技术实施例中,第一确定模块301将单病种病历以及问题确定为第一文本texta,将单病种病历以及问题对应的一个选项选项确定为第二文本textb。
[0071]
拼接模块302:用于拼接第一文本以及多个第二文本后输入模型中得到多组对应的句子向量。
[0072]
具体的,本技术实施例中,拼接模块302将第一文本texta和多个不同的第二文本textb分别拼接后输入模型中生成多组对应的句子向量。
[0073]
判断模块303:用于判断多组句子向量中每组向量对应的第二文本的内容是否属于第一文本。
[0074]
具体的,本技术实施例中,判断模块303判断每一个第二文本textb的内容是否被第一文本texta蕴含,最终输出为1/0。
[0075]
第二确定模块304:用于若判断结果为第二文本的内容属于第一文本,则确定第二文本的内容对应的答案选项是单病种病历以及问题对应的选项。
[0076]
具体的,本技术实施例中,如果判断为蕴含,则第二确定模块304确定该选项符合这段单病种病历以及问题的要求,在答案中就会选择该选项。
[0077]
第三方面,本技术实施例还提供一种电子设备,其特征在于,包括:处理器和存储器;
[0078]
所述处理器通过调用所述存储器存储的程序或指令,用于执行上述单病种上报多选问题的处理方法。
[0079]
第四方面,本技术实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机上述单病种上报多选问题的处理方法。
[0080]
图4是本公开实施例提供的一种电子设备的示意性框图。
[0081]
如图4所示,电子设备包括:至少一个处理器401、至少一个存储器402和至少一个通信接口403。电子设备中的各个组件通过总线系统404耦合在一起。通信接口403,用于与外部设备之间的信息传输。可理解,总线系统404用于实现这些组件之间的连接通信。总线系统404除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但为了清楚说明起见,在图4中将各种总线都标为总线系统404。
[0082]
可以理解,本实施例中的存储器402可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
[0083]
在一些实施方式中,存储器402存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
[0084]
其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本技术实施例提供的单病种上报多选问题的处理方法中任一方法的程序可以包含在应用程序中。
[0085]
在本技术实施例中,处理器401通过调用存储器402存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器401用于执行本技术实施例提供的单病种上报多选问题的处理方法各实施例的步骤。
[0086]
确定单病种病历以及问题为第一文本,确定单病种病历以及问题对应的多个答案选项为多个第二文本;
[0087]
拼接所述第一文本以及多个第二文本后输入模型中得到多组句子向量;
[0088]
判断所述多组句子向量中每组向量对应的第二文本的内容是否属于第一文本;
[0089]
若判断结果为第二文本的内容属于所述第一文本,确定第二文本的内容对应的答案选项是单病种病历以及问题对应的答案选项之一。
[0090]
本技术实施例提供的单病种上报多选问题的处理方法中任一方法可以应用于处理器401中,或者由处理器401实现。处理器401可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者
软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0091]
本技术实施例提供的单病种上报多选问题的处理方法中任一方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402,处理器401读取存储器402中的信息,结合其硬件完成单病种上报多选问题的处理方法的步骤。
[0092]
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本技术的范围之内并且形成不同的实施例。
[0093]
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0094]
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献