一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

病历处理方法、计算机可读存储介质及计算机设备与流程

2022-04-14 03:31:27 来源:中国专利 TAG:


1.本发明涉及数据处理领域,具体而言,涉及一种病历处理方法、计算机可读存储介质及计算机设备。


背景技术:

2.在相关技术中,通常采取利用单一症状和疾病共现频率计算两者之间关系权重、人工确定症状和疾病关系权重并依据权重预测疾病或人工确定初始权重后通过反事实推理的方式预测疾病。但是,上述方案存在需要人工确定权重或疾病预测结果不准确的缺点。
3.因此,在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
4.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本发明实施例提供了一种病历处理方法、计算机可读存储介质及计算机设备,以至少解决在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
6.根据本发明实施例的一个方面,提供了一种病历处理方法,包括:获取目标病历;从目标病历中提取目标症状词集合;基于目标症状词集合,从目标病历中提取目标症状特征词集合;获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
7.可选地,从目标病历中提取目标症状词集合包括:将目标病历划分为多个短句;从短句中提取候选症状词;在候选症状词能够匹配到预定症状词表中的情况下,将候选症状词确定为目标症状词,并收集到目标症状词集合中。
8.可选地,基于目标症状词集合,从目标病历中提取目标症状特征词集合包括:从目标病历中删除目标症状词集合所包括的目标症状词,得到剩余短句;对剩余短句进行分词,得到多个分词;对多个分词分别进行组合,得到目标症状特征词,并收集到目标症状特征词集合中。
9.可选地,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:获取样本病历集合,其中,样本病历集合包括样本病历描述信息和样本病历结果;从样本病历描述信息中获取样本病历集合的样本病历的样本症状词集合,样本特征词集合;基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
10.可选地,基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括
目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:针对样本病历集合中样本病历结果所对应的样本疾病,获取样本症状词集合中的样本症状词在样本病历集合中出现的次数,以及样本特征词集合中的样本特征词在样本病历集合中出现的次数;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重;在目标症状词为样本症状词,预定疾病为样本疾病的情况下,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重为样本症状词集合中的样本症状词在样本疾病中的第一权重,以及确定目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重为样本特征词集合中的样本特征词在样本疾病中的第二权重。
11.可选地,基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重包括:基于样本症状词集合中的样本病历的样本症状词集合,样本特征词集合,确定样本病历的质量得分;基于样本病历的质量得分,确定样本病历的第三权重;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数以及第三权重,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数以及第三权重,获取样本特征词集合中的样本特征词在样本疾病中的第二权重。
12.可选地,基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病包括:基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的疾病与多个候选疾病的相似性;基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病。
13.可选地,基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病包括:将目标病历对应的疾病与多个候选疾病的相似性进行排序,确定相似性最高的前n个候选疾病为目标病历对应的目标疾病,n为正整数;或者,确定相似性高于相似度阈值的候选疾病为目标病历对应的目标疾病。
14.可选地,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分;在质量得分高于质量得分阈值的情况下,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
15.可选地,基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分包括:基于目标症状词集合和目标症状特征词集合,确定目标病历中正常信息的数量和异常信息的数量;基于目标病历中正常信息的数量和异常信息的数量,确定目标病历的质量得分。
16.根据本发明实施例的另一方面,还提供了一种病历处理方法,包括:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,接收目标病历;响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
17.根据本发明实施例的另一方面,还提供了一种病历处理方法,包括:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,在交互界面上显示目标病历;在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;响应于对目标病历的操作,在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
18.根据本发明实施例的另一方面,还提供了一种病历处理装置,包括:第一获取模块,用于获取目标病历;第一提取模块,用于从目标病历中提取目标症状词集合;第二提取模块,用于基于目标症状词集合,从目标病历中提取目标症状特征词集合;第二获取模块,用于获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;第一确定模块,用于基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
19.根据本发明实施例的另一方面,还提供了一种病历处理装置,包括:第一显示模块,用于在交互界面上显示病历输入控件;第一接收模块,用于响应于对病历输入控件的操作,接收目标病历;第三提取模块,用于响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;第二显示模块,用于在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
20.根据本发明实施例的另一方面,还提供了一种病历处理装置,包括:第三显示模块,用于在交互界面上显示病历输入控件;第二接收模块,用于响应于对病历输入控件的操作,在交互界面上显示目标病历;第四显示模块,用于响应于对目标病历的操作,在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;第五显示模块,用于在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
21.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一项的病历处理方法。
22.根据本发明实施例的另一方面,还提供了一种计算机设备,包括:存储器和处理器,存储器存储有计算机程序;处理器,用于执行存储器中存储的计算机程序,计算机程序运行时使得处理器执行上述任意一项的病历处理方法。
23.在本发明实施例中,通过从目标病历中提取目标症状词集合和目标症状特征词集合,再获取预定疾病中目标症状词和目标症状特征词的权重,最后基于上述权重确定目标病历对应的目标疾病,达到了免去人为确定权重,增加疾病对应的症状表证词,考虑症状表证词之间的关系的目的,从而实现了根据患者病历直接、高效、准确地确定出患者所患疾病的技术效果,进而解决了在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
附图说明
24.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1示出了一种用于实现病历处理方法的计算机终端的硬件结构框图;图2是根据本发明实施例1的病历处理方法一的流程图;图3是根据本发明实施例1的病历处理方法二的流程图;图4是根据本发明实施例1的病历处理方法三的流程图;图5是根据本发明实施例2提供的病历处理装置一的结构框图;图6是根据本发明实施例2提供的病历处理装置二的结构框图;图7是根据本发明实施例2提供的病历处理装置三的结构框图;图8是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
25.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
26.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
27.首先,在对本技术实施例进行描述的过程中出现的部分名词或术语适用于如下解释:关联规则挖掘,一种基于规则的机器学习算法,该算法可以在大数据中发现感兴趣的关系。它的目的是利用一些度量指标来分辨数据库中存在的强规则。对应比较成熟的算法有aproir,fp-growth等。
28.文档相似度,常见的方法有tf-idf,一种用于资讯检索与文本挖掘的常用加权技术,可以用来评估一个词对于一个文档集或语料库中某个文档的重要程度。字词的重要性
随着它在语料库中出现次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。比较成熟的算法有bim、bm25、bm25f、pln等。
29.主诉,医学和心理学用语。是病人(来访者)自述自己的症状或(和)体征、性质,以及持续时间等内容。
30.自然语言处理(natural language processing,简称nlp),研究人与计算机交互的语言问题的一门学科。按照技术实现难度的不同,这类系统可以分成简单匹配式、模糊匹配式和段落理解式三种类型。
31.知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
32.实施例1根据本发明实施例,还提供了一种病历处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
33.本技术实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现病历处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备)可以包括一个或多个处理器(图中采用102a、102b,
……
,102n来示出,处理器可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(i/o接口)、通用串行总线(usb)端口(可以作为bus总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
34.应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本技术实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
35.存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的病历处理方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
36.传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
37.显示器可以例如触摸屏式的液晶显示器(lcd),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
38.在上述运行环境下,本技术提供了如图2所示的病历处理方法一。图2是根据本发明实施例1的病历处理方法一的流程图,如图2所示,该方法包括如下步骤:步骤s202,获取目标病历;步骤s204,从目标病历中提取目标症状词集合;步骤s206,基于目标症状词集合,从目标病历中提取目标症状词集合;步骤s208,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;步骤s210,基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
39.通过上述步骤,从目标病历中提取目标症状词和目标症状特征词,可以快速地获取预测目标疾病所需的症状依据,尤其是目标症状特征词的获取,可以在原本症状词的基础上进一步确认目标疾病和症状的对应关系,以此提高后续预测目标疾病结果的准确性,再根据所提取的目标症状词和目标症状特征词在预定疾病中对应的权重,确定出最终的目标疾病,就可以实现根据患者病历直接、高效、准确地确定出患者所患疾病的技术效果,进而解决了在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
40.作为一种可选的实施例,从目标病历中提取目标症状词集合可以包括:将目标病历划分为多个短句;从短句中提取候选症状词;在候选症状词能够匹配到预定症状词表中的情况下,将候选症状词确定为目标症状词,并收集到目标症状词集合中。通过先划分短句再提取症状词的操作,可以从病历中快速地找到能表征病症的描述词,以作为后续预测目标疾病的可靠依据。
41.作为一种可选的实施例,基于目标症状词集合,从目标病历中提取目标症状特征词集合包括:从目标病历中删除目标症状词集合所包括的目标症状词,得到剩余短句;对剩余短句进行分词,得到多个分词;对多个分词分别进行组合,得到目标症状特征词,并收集到目标症状特征词集合中。通过从删除目标症状词后的剩余短句中进一步地分词并组合,得到目标症状特征词,可以在确定了目标症状词之后,对预定疾病可对应的症状描述做出扩充,同时还可以考虑各症状之间的关联,使得最终确定的目标症状词集合和目标症状特征词集合可以更加全面地表征当前患者所患疾病的症状,提高目标症状词和目标症状特征词作为预测依据的可靠性。采用上述处理,相对于相关技术中仅依据预定的症状词集确定症状特征而言,由于加入了从短句中划分出来的包括更多细节的分词,因此,对于病历的表征也能够更为准确和全面。
42.作为一种可选的实施例,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:获取样本病历集合,其中,样本病历集合包括样本病历描述信息和样本病历结果;从样本病历描述信息中获取样本病历集合的样本病历的样本症状词集合,样本特征词集合;基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。由于预定疾病对应的症状词和症状特征词是经过大量样本病历进行提取处理后得到的结果,而通过确定所获取的全部目标症状词和目标症状特征词在预定疾病中对应的权重,就可以确定出患者病历对应的目标疾病。
43.作为一种可选的实施例,基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:针对样本病历集合中样本病历结果所对应的样本疾病,获取样本症状词集合中的样本症状词在样本病历集合中出现的次数,以及样本特征词集合中的样本特征词在样本病历集合中出现的次数;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重;在目标症状词为样本症状词,预定疾病为样本疾病的情况下,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重为样本症状词集合中的样本症状词在样本疾病中的第一权重,以及确定目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重为样本特征词集合中的样本特征词在样本疾病中的第二权重。针对样本病历结果,基于样本症状词和样本症状特征词在样本病历中对应出现的次数分别进行统计并计算出样本病历中的第一权重和第二权重,可以真实地、准确地确定样本病历结果对应的样本症状词和样本症状特征词,以及上述两者在病例中出现时样本病历对应该样本病历结果的可能性,即,可以确定病例中存在某些症状描述时对应得出某些疾病诊断结果的可能性。在此基础之上,进一步地确定获得的目标症状词和目标症状特征词在预定疾病中对应的权重,就可以极大程度地准确缩小预定疾病的范围,以便于提高后续目标疾病的预测结果的准确性。
44.作为一种可选的实施例,基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重包括:基于样本症状词集合中的样本病历的样本症状词集合,样本特征词集合,确定样本病历的质量得分;基于样本病历的质量得分,确定样本病历的第三权重;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数以及第三权重,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数以及第三权重,获取样本特征词集合中的样本特征词在样本疾病中的第二权重。由于在样本病历中关于疾病症状的描述信息量不一定足够大,信息量较小的样本病历在训练过程中的可参考性就会对应下降。通过先基于上述集合对样本病历质量进行评分,就可以根据样本病历的质量得分确定该样本病历在后续训练过程中的权重,使得信息量大的样本病例影响力也更大,进而保证后续的训练过程可
以高效、高质量地完成。
45.作为一种可选的实施例,基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病包括:基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的疾病与多个候选疾病的相似性;基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病。基于第一权重和第二权重确定目标病历对应的疾病与多个候选疾病的相似性,可以根据上述的相似性确定出与目标病历中症状词和症状特征词最相符的目标疾病。
46.作为一种可选的实施例,基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病包括:将目标病历对应的疾病与多个候选疾病的相似性进行排序,确定相似性最高的前n个候选疾病为目标病历对应的目标疾病,n为正整数;或者,确定相似性高于相似度阈值的候选疾病为目标病历对应的目标疾病。通过将相似性高于相似度阈值的候选疾病全部召回作为目标疾病,可以进一步地减少错误诊断的可能。
47.作为一种可选的实施例,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重包括:基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分;在质量得分高于质量得分阈值的情况下,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。通过对目标病历的质量同样进行评分,就可以根据目标病历的质量得分情况判断出目标病历的信息量是否足够用来支撑目标疾病的判断,从而可以进一步地减少疾病错误诊断的可能。
48.作为一种可选的实施例,基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分包括:基于目标症状词集合和目标症状特征词集合,确定目标病历中正常信息的数量和异常信息的数量;基于目标病历中正常信息的数量和异常信息的数量,确定目标病历的质量得分。由于在目标病历中只有异常信息涉及到了疾病的症状描述,而正常信息并不能帮助确定目标疾病,例如,“患者出现咳嗽流涕,没有发热”中,咳嗽流涕就属于异常信息,而发热则是正常信息。通过确定目标病历中正常信息和异常信息的数量,并基于统计结果计算目标病历的质量得分,就可以详细准确地评估出根据目标病历进行诊断的可靠性。同时,也可以针对目标病历的质量得分结果进行其它操作,例如,可以在目标病历的质量得分低于预定阈值时,不继续诊断,而是给出病历信息不足,无法诊断的结果,以减少由目标病历信息量不足导致的错误诊断。
49.图3是根据本发明实施例1的病历处理方法二的流程图,如图3所示,该方法包括如下步骤:步骤s302,在交互界面上显示病历输入控件;步骤s304,响应于对病历输入控件的操作,接收目标病历;步骤s306,响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;步骤s308,在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标
症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
50.通过上述步骤,可以通过对病历输入控件进行操作,在交互界面上直观,明显地获得目标病历对应的目标疾病,实现根据患者病历直接、高效、准确地确定出患者所患疾病的技术效果,进而解决了在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
51.图4是根据本发明实施例1的病历处理方法三的流程图,如图4所示,该方法包括如下步骤:步骤s402,在交互界面上显示病历输入控件;步骤s404,响应于对病历输入控件的操作,在交互界面上显示接收目标病历;步骤s406,在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;步骤s408,响应于对目标病历的操作,在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
52.通过上述步骤,在交互界面上对输入目标病历,就可以在交互界面上显示出目标病历对应的目标症状词集合,目标症状特征词以及目标病历对应的疾病,进而解决了在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
53.基于上述实施例及可选实施例,提供一种可选实施方式,下面具体说明。
54.本发明可选实施方式主要诊断医疗场景的临床辅助诊断系统,该系统需要在医生输入患者的基本病情的描述信息后,给出患者可能患有疾病的列表和每个疾病的患病概率。医生借助该推荐列表做出最终诊断以减少误诊、提高诊断效率、改善病案输入质量。该系统包括患者信息提取模块、推理规则挖掘模块、疾病推理模块组成。
55.在相关技术中,通常有如下几种实现方案:(1)一种知识图谱的构建方法,应用于临床辅助诊断,其中症状和疾病的关系权重根据单一症状出现的频率和该症状和疾病共现的频率来进行计算,属于比较传统的贝叶斯推理推荐方法;(2)一种疾病推理算法,其中症状和疾病的关系权重包含两部分,症状的普遍程度和症状与疾病的影响因子,两者均通过人工确定;(3)一种反事实推理方法,基于“正确的诊断总是尽可能多的覆盖患者的症状特征”以及“正确的诊断所否定的症状总是最少的”两个原则进行推理。
56.但是,上述几种方案均存在缺点,各自缺点如下:(1)该算法没有考虑多个症状组合情况先对疾病的影响计算权重,假设各症状对疾病的贡献是相互独立的,实际上症状之间是有关联的,如“咳嗽”和“有痰”这两个症状就存在关联关系;症状和疾病的影像关系以频次为依据,当某个症状本身比较多见如“发热”、或某个疾病本身比较常见如“上呼吸道感染”时,会造成推荐的结果存在偏见;(2)需要医生专家人工确定权重;(3)需要医生专家人工确定初始权重。
57.而本发明可选实施方式包括患者信息提取模块、推理规则挖掘模块、疾病推理模
块。
58.其中,患者信息提取模块:患者信息的提取不仅包含症状词典的特征,也考虑短句分词组合的特征,最大限度的降低了症状漏检的概率。推理规则挖掘模块:将每个疾病看作是一个文档,将症状特征和疾病的关系看作是关键词和文档的关系,患者个数看作词频,同时考虑病历的质量权重系数,采用文档相似度方法计算症状和疾病的关系权重。疾病推理模块:按患者信息提取模块中的方法对患者的病情描述进行特征提取,采用基于文档相似度的算法来计算患者病情和每个疾病的相似度,并按照相似度给出疾病推荐排序。
59.在实验中,按照以上流程所设计的临床辅助诊断系统相比传统基于贝叶斯统计规则的推理方法的推荐结果,top5推荐召回率可由72%提高到83%。
60.下面具体介绍本发明可选实施方式。
61.(1)患者信息提取模块1.1构建一个包含疾病的术语词表d_i (i=1,2....m),一个症状的词表s_i(i=1,2,....k), m为疾病病种总数,k为症状总数;1.2 将电子病历p_i(i=1,2,....n;n为病历总数)中的主诉、现病史、体格检查等文本按标点符号划分为短句;1.3 依据nlp算法判断短句的所描述的病情为健康状况还是异常状况。对异常状况的陈述短句进行nlp提取并对齐到1.1所构建的症状词表s上;1.4 为了更好的获得本发明可选实施方式的效果,在1.3的基础上,对异常状况的陈述短句进行分词,分词后去除停用词后进行两两组合,形成扩充的症状特征词 w_x;1.5 提取电子病历中的医生诊断信息,合并1.3、1.4的结果。获得结构化后的电子病历数据集。q_i(i=1,2...n) 对于每一个病历,均包括若干个诊断、症状词、特征词;1.6 为了更好的获得本发明可选实施方式的效果,对电子病历的内涵质量进行评分,按照电子病历所描述的异常信息的数量对电子病历进行打分,分值由0到1,信息量越多分值越高。如果一个电子病历提取的异常信息或症状的个数是nb = 3个,正常信息或症状的个数是nn = 4个,则该电子病历的质量得分可采用如下经验公式:该经验公式旨在保证:时,时,时,时,时,不是一般性,也可以用其它类似的经验公式。
62.(2)疾病推理规则挖掘2.1将病历数据按提取出的疾病诊断进行合并,形成疾病的文档表示,对于疾病列表d
i (i=1,2....m)中第k个疾病d
k ,其计算所有跟该疾病在各病历中共现过的症状s_
x
,以及特征词wy,同时计算症状s
x
和特征wy的共现的频率,分别记为 tf
kx 和 tf
ky
;该词频的计算可以按照每1个病历计算1次频率,作为优化,也可以按照没出现1个病例则累积增加该病历的内涵质量评分ci;2.2 依据2.1的疾病文档表示分别计算每个疾病dk的文档中的所有特征的个数 lk,以及所有疾病的平均特征个数l
avg
,用于表征疾病的复杂程度;
2.3 依据2.1 的疾病文档表示分别计算每一个症状s
x
和症状词w
x
的逆文档频率idf
x
和 idfy,用于表征症状或特征词的普遍程度。
63.(3)疾病推理模块3.1对于给定待诊断病历p',首先按1.3提取对应的特征,获得该病历的症状集合 s'{};3.2 作为补充,对于给定待诊断病历,按1.4提取症状特征词集合w'{};3.3按照1.6,计算给定待诊断病历的内涵质量分数,如果分数小于某个阈值,则不进行疾病推理判断,仅给出病历信息量不足的提示;3.4遍历症状集合s'和特征词集合w'里的每一项特征s
x'
和w
y'
,查询2.3 的结果获得对应特征的逆文档频率idf
x'
和idf
y'
,如果没有查到则使用默认值0;3.5 该患者所患疾病与某个疾病dk的相似度可根据下述公式计算:其中,c1,c2为常数, c
1 取值在0-1之间包括0和1,c
2 取值在0-10之间包括0。
64.3.6 将所有疾病按相似度进行排序,并输出最高得分的3个或10个疾病推荐给用户。
65.基于本发明可选实施方式,在实验中有如下数据:训练集病历数据:40000份,每份病历包含某个患者门诊就诊的主诉、既往史、现病史、体格检查,以及医生做出的初步诊断。
66.疾病病种:0~800个疾病名称,如:糖尿病、心肌炎、高血压、上呼吸道感染、位置性眩晕,等等。
67.症状词库: 0~1700个, 如:胸闷、气喘、呕吐、头痛、咳嗽、发热,等等。
68.测试集病历数据:2800份,格式同训练集,与训练集不重合。
69.评价:所给结果前五个疾病是否与医生诊断相同,如果相同得1分,该分值与该病历信息质量分加权后计入统计总分。
70.基于相关技术中的方案得到的测试结果:top5命中率为71%。
71.按照本发明可选实施方式中的相似度计算方法,特征提取时不考虑词的组合(即跳过1.4步),使用bm25算法进行计算并排序。其中c1=1.2, c2=0.25。测试结果:top5命中率为79.9%。
72.按照本发明可选实施方式中的方法,且特征提取时考虑词的组合。测试结果:top5命中率为87.8%。
73.可见,本发明可选实施方式有如下优点:(1)患者信息的提取不仅包含症状词典的特征,也考虑短句分词组合的特征,最大限度的降低了症状漏检的概率;(2)将每个疾病看作是一个文档,将症状特征和疾病的关系看作是关键词和文档的关系,患者个数看作词频,同时考虑病历的质量权重系数,采用文档相似度方法计算症状和疾病的关系权重。降低了疾病病种数据分布不平衡引起的推理结果的偏见;(3)对每个疾病的信息量进行评分,评分高的病历在训练时给以较高的权重。避免
了病历质量参差不齐造成的影响。
74.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
75.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的病历处理方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
76.实施例2根据本发明实施例,还提供了一种用于实施上述病历处理方法一的装置,图5是根据本发明实施例2提供的病历处理装置一的结构框图,如图5所示,该装置包括:第一获取模块51,第一提取模块52,第二提取模块53,第二获取模块54和第一确定模块55,下面对该装置进行说明。
77.第一获取模块51,用于获取目标病历;第一提取模块52,连接至上述第一获取模块51,用于从目标病历中提取目标症状词集合;第二提取模块53,连接至上述第一提取模块52,用于基于目标症状词集合,从目标病历中提取目标症状特征词集合;第二获取模块54,连接至上述第二提取模块53,用于获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;第一确定模块55,连接至上述第二获取模块54,用于基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
78.此处需要说明的是,上述第一获取模块51,第一提取模块52,第二提取模块53,第二获取模块54和第一确定模块55对应于实施例1中的步骤s202至步骤s210,五个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
79.根据本发明实施例,还提供了一种用于实施上述病历处理方法二的装置,图6是根据本发明实施例2提供的病历处理装置二的结构框图,如图6所示,该装置包括:第一显示模块61,第一接收模块62,第三提取模块63和第二显示模块64,下面对该装置进行说明。
80.第一显示模块61,用于在交互界面上显示病历输入控件;第一接收模块62,连接至上述第一显示模块61,用于响应于对病历输入控件的操作,接收目标病历;第三提取模块63,连接至上述第一接收模块62,用于响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;第二显示模块64,连接至上述第三提取模块63,用于在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权
重确定。
81.此处需要说明的是,上述第一显示模块61,第一接收模块62,第三提取模块63和第二显示模块64对应于实施例1中的步骤s302至步骤s308,四个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
82.根据本发明实施例,还提供了一种用于实施上述病历处理方法三的装置,图7是根据本发明实施例2提供的病历处理装置三的结构框图,如图7所示,该装置包括:第三显示模块71,第二接收模块72,第四显示模块73和第五显示模块74,下面对该装置进行说明。
83.第三显示模块71,用于在交互界面上显示病历输入控件;第二接收模块72,用于响应于对病历输入控件的操作,在交互界面上显示目标病历;第四显示模块73,用于在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;第五显示模块74,用于响应于对目标病历的操作,在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
84.此处需要说明的是,上述第三显示模块71,第二接收模块72,第四显示模块73和第五显示模块74对应于实施例1中的步骤s402至步骤s408,四个模块与对应的步骤所实现的实例与应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
85.实施例3本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
86.可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
87.在本实施例中,上述计算机终端可以执行应用程序的病历处理方法中以下步骤的程序代码:获取目标病历;从目标病历中提取目标症状词集合;基于目标症状词集合,从目标病历中提取目标症状特征词集合;获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
88.可选地,图8是根据本发明实施例的一种计算机终端的结构框图。如8所示,该计算机终端可以包括:一个或多个(图中仅示出一个)处理器802、存储器804等。
89.其中,存储器可用于存储软件程序以及模块,如本发明实施例中的病历处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的病历处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业
内部网、局域网、移动通信网及其组合。
90.处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取目标病历;从目标病历中提取目标症状词集合;基于目标症状词集合,从目标病历中提取目标症状特征词集合;获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
91.可选的,上述处理器还可以执行如下步骤的程序代码:将目标病历划分为多个短句;从短句中提取候选症状词;在候选症状词能够匹配到预定症状词表中的情况下,将候选症状词确定为目标症状词,并收集到目标症状词集合中。
92.可选的,上述处理器还可以执行如下步骤的程序代码:从目标病历中删除目标症状词集合所包括的目标症状词,得到剩余短句;对剩余短句进行分词,得到多个分词;对多个分词分别进行组合,得到目标症状特征词,并收集到目标症状特征词集合中。
93.可选的,上述处理器还可以执行如下步骤的程序代码:获取样本病历集合,其中,样本病历集合包括样本病历描述信息和样本病历结果;从样本病历描述信息中获取样本病历集合的样本病历的样本症状词集合,样本特征词集合;基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
94.可选的,上述处理器还可以执行如下步骤的程序代码:针对样本病历集合中样本病历结果所对应的样本疾病,获取样本症状词集合中的样本症状词在样本病历集合中出现的次数,以及样本特征词集合中的样本特征词在样本病历集合中出现的次数;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重;在目标症状词为样本症状词,预定疾病为样本疾病的情况下,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重为样本症状词集合中的样本症状词在样本疾病中的第一权重,以及确定目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重为样本特征词集合中的样本特征词在样本疾病中的第二权重。
95.可选的,上述处理器还可以执行如下步骤的程序代码:基于样本症状词集合中的样本病历的样本症状词集合,样本特征词集合,确定样本病历的质量得分;基于样本病历的质量得分,确定样本病历的第三权重;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数以及第三权重,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数以及第三权重,获取样本特征词集合中的样本特征词在样本疾病中的第二权重。
96.可选的,上述处理器还可以执行如下步骤的程序代码:基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的疾病与多个候选疾病的相似性;基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病。
97.可选的,上述处理器还可以执行如下步骤的程序代码:将目标病历对应的疾病与
多个候选疾病的相似性进行排序,确定相似性最高的前n个候选疾病为目标病历对应的目标疾病,n为正整数;或者,确定相似性高于相似度阈值的候选疾病为目标病历对应的目标疾病。
98.可选的,上述处理器还可以执行如下步骤的程序代码:基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分;在质量得分高于质量得分阈值的情况下,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
99.可选的,上述处理器还可以执行如下步骤的程序代码:基于目标症状词集合和目标症状特征词集合,确定目标病历中正常信息的数量和异常信息的数量;基于目标病历中正常信息的数量和异常信息的数量,确定目标病历的质量得分。
100.处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,接收目标病历;响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
101.处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,在交互界面上显示目标病历;响应于对目标病历的操作,在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
102.采用本发明实施例,提供了一种病历处理的方案。通过从目标病历中提取目标症状词集合和目标症状特征词集合,再获取预定疾病中目标症状词和目标症状特征词的权重,最后基于上述权重确定目标病历对应的目标疾病,达到了免去人为确定权重,增加疾病对应的症状表证词,考虑症状表证词之间的关系的目的,从而实现了根据患者病历直接、高效、准确地确定出患者所患疾病的技术效果,进而解决了在相关技术中,存在根据患者病历确定对应的疾病时,效率低,错误率高的技术问题。
103.本领域普通技术人员可以理解,图8所示的结构仅为示意,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图8其并不对上述电子装置的结构造成限定。例如,还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。
104.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,计算机可读存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
105.实施例4
本发明的实施例还提供了一种计算机可读存储介质。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例1所提供的病历处理方法所执行的程序代码。
106.可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
107.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取目标病历;从目标病历中提取目标症状词集合;基于目标症状词集合,从目标病历中提取目标症状特征词集合;获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重;基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的目标疾病。
108.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将目标病历划分为多个短句;从短句中提取候选症状词;在候选症状词能够匹配到预定症状词表中的情况下,将候选症状词确定为目标症状词,并收集到目标症状词集合中。
109.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:从目标病历中删除目标症状词集合所包括的目标症状词,得到剩余短句;对剩余短句进行分词,得到多个分词;对多个分词分别进行组合,得到目标症状特征词,并收集到目标症状特征词集合中。
110.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取样本病历集合,其中,样本病历集合包括样本病历描述信息和样本病历结果;从样本病历描述信息中获取样本病历集合的样本病历的样本症状词集合,样本特征词集合;基于样本症状词集合和样本特征词集合,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
111.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:针对样本病历集合中样本病历结果所对应的样本疾病,获取样本症状词集合中的样本症状词在样本病历集合中出现的次数,以及样本特征词集合中的样本特征词在样本病历集合中出现的次数;基于样本症状词集合中的样本症状词在样本病历集合中出现的次数,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数,获取样本特征词集合中的样本特征词在样本疾病中的第二权重;在目标症状词为样本症状词,预定疾病为样本疾病的情况下,确定目标症状词集合中所包括目标症状词在预定疾病中的第一权重为样本症状词集合中的样本症状词在样本疾病中的第一权重,以及确定目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重为样本特征词集合中的样本特征词在样本疾病中的第二权重。
112.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于样本症状词集合中的样本病历的样本症状词集合,样本特征词集合,确定样本病历的质量得分;基于样本病历的质量得分,确定样本病历的第三权重;基于样本症状词
集合中的样本症状词在样本病历集合中出现的次数以及第三权重,获取样本症状词集合中的样本症状词在样本疾病中的第一权重,以及基于样本特征词集合中的特征词在样本病历集合中出现的次数以及第三权重,获取样本特征词集合中的样本特征词在样本疾病中的第二权重。
113.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重,确定目标病历对应的疾病与多个候选疾病的相似性;基于目标病历对应的疾病与多个候选疾病的相似性,确定目标病历对应的目标疾病。
114.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将目标病历对应的疾病与多个候选疾病的相似性进行排序,确定相似性最高的前n个候选疾病为目标病历对应的目标疾病,n为正整数;或者,确定相似性高于相似度阈值的候选疾病为目标病历对应的目标疾病。
115.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于目标症状词集合和目标症状特征词集合,确定目标病历的质量得分;在质量得分高于质量得分阈值的情况下,获取目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重。
116.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于目标症状词集合和目标症状特征词集合,确定目标病历中正常信息的数量和异常信息的数量;基于目标病历中正常信息的数量和异常信息的数量,确定目标病历的质量得分。
117.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,接收目标病历;响应于对目标病历进行处理的处理控件的操作,从目标病历中提取目标症状词集合,以及基于目标症状词集合,从目标病历中提取目标症状特征词集合;在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
118.可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在交互界面上显示病历输入控件;响应于对病历输入控件的操作,在交互界面上显示目标病历;在交互界面上显示目标病历的目标症状词集合以及目标症状特征词集合;响应于对目标病历的操作,在交互界面上显示目标病历对应的目标疾病,其中,目标疾病基于目标症状词集合中所包括目标症状词在预定疾病中的第一权重,以及目标症状特征词集合中所包括的目标症状特征词在预定疾病中的第二权重确定。
119.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
120.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
121.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的
方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
122.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
123.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
124.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
125.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献