一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

治疗线程挖掘和检索方法及装置与流程

2022-07-31 03:43:26 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,尤其涉及一种治疗线程挖掘和检索方法及装置。


背景技术:

2.治疗线程就是对疾病治疗过程中治疗顺序的描述。确定治疗线程关系到最优治疗方案选择、耐药情况管理和对获益-风险的把握。在精准治疗时代,临床上对于患者诊疗的定位愈来愈细致,对治疗线程的管理要求越来越高。
3.目前治疗线程在临床上应用很普遍,但在医学知识或产品中并没有体现。治疗线程的确定需要人工审阅各种医学文本、进行分析和判断,效率较低且存在一定的主观判断,而且容易遗漏关键信息。


技术实现要素:

4.本发明提供一种治疗线程挖掘和检索方法及装置,用以解决现有技术中人工进行分析和判断,效率低下且容易遗漏关键信息的缺陷。
5.本发明提供一种治疗线程挖掘方法,包括:
6.确定与治疗线程相关的文本;
7.对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;
8.基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
9.根据本发明提供的治疗线程挖掘方法,所述基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,包括:
10.对所述治疗线程字段进行语义编码,得到所述治疗线程字段的语义特征,并计算所述治疗线程字段的语义特征和所述标准治疗线程字段的语义特征之间的语义相似度;
11.和/或,将所述治疗线程字段和所述标准治疗线程字段输入至语义排序模型,得到所述语义排序模型输出的所述治疗线程字段和所述标准治疗线程字段之间的匹配分值;
12.基于所述语义相似度和/或所述匹配分值,确定与所述治疗线程字段匹配的标准治疗线程。
13.根据本发明提供的治疗线程挖掘方法,所述将所述治疗线程字段和所述标准治疗线程字段输入至语义排序模型,得到所述语义排序模型输出的所述治疗线程字段和所述标准治疗线程字段之间的匹配分值,包括:
14.基于所述语义相似度,确定与所述治疗线程字段相关的多个标准治疗线程;
15.分别将所述多个标准治疗线程字段和所述治疗线程字段输入至所述语义排序模型,得到所述语义排序模型输出的多个匹配分值;
16.所述基于所述语义相似度和/或所述匹配分值,确定与所述治疗线程字段匹配的
标准治疗线程,包括:
17.对所述多个匹配分值按照从高到低的顺序进行排序,将排序第一且大于等于预设阈值的匹配分值所对应的标准治疗线程,确定为与所述治疗线程字段匹配的标准治疗线程。
18.根据本发明提供的治疗线程挖掘方法,所述确定与治疗线程相关的文本,包括:
19.确定目标医学文本,所述目标医学文本包括临床试验结果类文本、治疗类指南文本和治疗类临床试验文本中的至少一种;
20.对所述目标医学文本进行治疗线程相关性分类,得到与治疗线程相关的文本。
21.本发明提供一种检索方法,包括:
22.接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;
23.从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;
24.所述医学数据所对应的各治疗线程基于如上述任一项所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
25.根据本发明提供的检索方法,在所述目标检索关键词包括所述目标药品的情况下,所述从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据,包括:
26.从预先确定的各药品在各治疗线程下的医学数据中,确定出所述目标药品对应的适应症在各治疗线程下的临床试验数据,所述临床试验数据包括药品研发阶段、所述目标药品对应的适应症的最高研发阶段和药品上市的获批机构中的至少一项。
27.根据本发明提供的检索方法,在所述目标检索关键词包括所述目标治疗线程的情况下,所述从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据,之后还包括:
28.获取患者病历数据;
29.对所述患者病历数据进行结构化,得到结构化的病历数据;
30.基于所述结构化的病历数据和所述目标治疗线程下的病历医学质控指标阈值,对所述患者病历数据进行监控。
31.根据本发明提供的检索方法,所述基于所述结构化的病历数据和所述目标治疗线程下的病历医学质控指标阈值,对所述患者病历数据进行监控,包括:
32.基于所述结构化的病历数据中包含的各风险因素的结构化数据,以及预先确定的不同药物治疗的不良反应与产生所述不良反应的各风险因素之间的关系,对所述目标治疗线程下所述患者病历数据对应的不良反应数据进行预估。
33.本发明还提供一种治疗线程挖掘装置,包括:
34.文本确定单元,用于确定与治疗线程相关的文本;
35.实体识别单元,用于对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;
36.治疗线程确定单元,用于基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程
字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
37.本发明还提供一种检索装置,包括:
38.关键词接收单元,用于接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;
39.医学数据确定单元,用于从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;所述医学数据中的各治疗线程基于如上述任一种所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
40.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述治疗线程挖掘方法或者检索方法。
41.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述治疗线程挖掘方法或者检索方法。
42.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述治疗线程挖掘方法或者检索方法。
43.本发明提供的治疗线程挖掘和检索方法及装置,对与治疗线程相关的文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;根据治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。在实现全面、可靠的治疗线程挖掘的同时,有效提高了治疗线程挖掘的实现效率,降低了治疗线程挖掘的成本。
附图说明
44.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
45.图1是本发明提供的治疗线程挖掘方法的流程示意图;
46.图2是本发明提供的治疗线程匹配方法的流程示意图之一;
47.图3是本发明提供的治疗线程匹配方法的流程示意图之二;
48.图4是本发明提供的与治疗线程相关的文本获取方法的流程示意图;
49.图5是本发明提供的检索方法的流程示意图;
50.图6是本发明提供的患者病历数据监控方法的流程示意图;
51.图7是本发明提供的治疗线程挖掘装置的结构示意图;
52.图8是本发明提供的检索装置的结构示意图;
53.图9是本发明提供的电子设备的结构示意图。
具体实施方式
54.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,
而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
55.各类慢性疾病,尤其是肿瘤疾病的治疗往往漫长且复杂,需要根据患者的病理、分期、身体状况以及既往用药情况,分阶段给予针对性的治疗,比如一级治疗的治疗方案,二级治疗的治疗方案,以及辅助治疗、末线治疗等。
56.确定治疗线程关系到最优治疗方案选择、耐药情况管理和对获益-风险的把握。在精准治疗时代,临床上对于患者诊疗的定位愈来愈细致,对治疗线程的管理要求越来越高。
57.但目前治疗线程在临床应用和医学文本中存在脱节的现象,一方面治疗线程在临床上应用很普遍,另一方面却在医学知识或产品中没有体现,甚至在医学高校教材中都没有提到治疗线程的概念。
58.药学领域同样存在与临床应用明显脱节的现象,比如药品在登记临床试验时,其适应症或入排标准中会限定各种条件,但不会提及治疗线程,这已经是药学知识和数据库中普遍存在的现实问题。行业用户在阅读这些药学信息时,需要人工进行分析和判断,才能对应上临床的治疗方案。
59.人工审阅的方式效率较低且存在一定的主观判断,而且容易遗漏关键信息,如何实现治疗线程的快速查找定位,成为了目前亟待解决的问题。针对上述问题,本发明实施例提供了一种治疗线程挖掘方法,通过对医学文本中治疗线程的挖掘,实现治疗线程的快速查找定位。
60.图1是本发明提供的治疗线程挖掘方法的流程示意图,如图1所示,该方法包括:
61.步骤110,确定与治疗线程相关的文本。
62.此处,与治疗线程相关的文本即需要进行治疗线程挖掘的医学文本中的部分段落或者全部段落,与治疗线程相关的文本可以是应用网络爬虫从相关网站上爬取得到的,也可以是对纸质版本的医学文本进行图像拍摄或者扫描等得到的,本发明实施例对此不作具体限定。
63.与治疗线程相关的文本的获取可以是定时获取,也可以是实时监控相应的文本发布网站,例如实时监控临床指南的更新或者版本更迭,并在出现新版本的临床指南后获取新版本的临床指南的临床指南数据。与治疗线程相关的文本的来源包括但不限于:期刊文献、临床指南数据、患者病历和临床试验登记信息等。
64.步骤120,对文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段。
65.具体地,此处的治疗线程字段即能够表示治疗线程的字段,比如一线治疗、二级治疗或者辅助治疗等。对于步骤110中获取的与治疗线程相关的文本,其中只有部分字段是表示治疗线程,为了更准确的得到表示治疗线程的字段,有必要对文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段。
66.为了实现针对文本的治疗线程实体识别,可以预先训练实体识别模型。此次所指的实体,包括针对于与治疗线程相关的文本而言的治疗线程字段,可以将文本输入到预先训练好的实体识别模型中,由实体识别模型对文本进行治疗线程实体识别,并输出实体文本中每个字的实体标注,此处实体识别的标注体系可以是bio、bioes等,b表示实体开头,e表示实体结尾,i表示实体中间词,o表示非实体,s表示单个实体。
67.在步骤120执行之前,可以训练实体识别模型。实体识别模型的训练方法可以包括
如下步骤:首先采集大量与治疗线程相关的样本文本,并人工标注样本文本中的实体和实体类型。随即,基于样本文本以及其中标注的实体和实体类型,对初始实体识别模型进行训练,从而得到实体识别模型。
68.步骤130,基于治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。
69.具体地,将识别所得的实体作为治疗线程字段,在此基础上,即可根据治疗线程字段的语义,选取出与治疗线程字段匹配的标准治疗线程字段,作为文本对应的治疗线程。其中,与治疗线程字段匹配的标准治疗线程字段,可以理解为实体识别得到的治疗线程字段与标准治疗线程字段本身存在较大重合,或者治疗线程字段的语义与标准治疗线程字段的语义存在较大重合。
70.此处,治疗线程字典包含了临床上应用较多的标准治疗线程字段,针对不同领域的疾病,标准治疗线程字段可能会不同。治疗线程字典的构建可以是通过检索大量医学文献,进行汇总和分析,确定了主要疾病领域中治疗线程分类标准和定义,具体可以通过自然语言处理(natural language processing,nlp)或者人工,再或者nlp与人工相结合的形式实现的。
71.进一步地,治疗线程字典中的标准治疗线程字段包括但不局限于:新辅助治疗、辅助治疗、初始治疗、诱导治疗、巩固治疗、维持治疗、一线治疗、二线治疗、三线治疗、末线治疗、挽救治疗、姑息治疗及其他疗法类型。
72.以肿瘤领域举例而言,一线治疗指的是诊断以后的首轮治疗,这时的治疗方案效果最好、副作用最小,也称为基本治疗或疗法。一线治疗的目的是在可能的情况下治愈癌症。比如:治疗小细胞肺癌的ep方案就是经典的一线治疗方案,这组治疗可以使大部分的小细胞肺癌得到控制,甚至是使肿瘤病灶完全消失。
73.二线治疗指的是在一线治疗后,患者再次出现肿瘤进展,且对一线治疗方案耐药,需要更换抗癌机理不同的方案。和一线治疗相比,二线治疗方案或疗效劣于一线,或副作用偏大,或价格偏高。还以小细胞肺癌为例:一线ep方案治疗失败后,二线推荐的治疗方案是拓扑替康,这也是经典的二线推荐。
74.辅助治疗也称为附加治疗。通常是手术后给予的治疗,以消灭体内任何仍然残余的癌细胞,给予辅助治疗以降低肿瘤复发或向其他部位播散的可能性。辅助治疗可能包括放疗、化疗、激素治疗或进一步手术治疗。
75.考虑到实体识别得到的治疗线程字段可能是标准治疗线程字段,也可能不是标准治疗线程字段,可以进一步根据治疗线程字段的语义与标准治疗线程字段语义的匹配程度,确定与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。
76.本发明实施例提供的治疗线程挖掘方法,对与治疗线程相关的文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;根据治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。在实现全面、可靠的治疗线程挖掘的同时,有效提高了治疗线程挖掘的实现效率,降低了治疗线程挖掘的成本。
77.基于上述任一实施例,图2是本发明提供的治疗线程匹配方法的流程示意图之一,如图2所示,步骤130中基于治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与治疗线程字段匹配的标准治疗线程,包括:
78.步骤131,对治疗线程字段进行语义编码,得到治疗线程字段的语义特征,并计算治疗线程字段的语义特征和标准治疗线程字段的语义特征之间的语义相似度;
79.步骤132,和/或,将治疗线程字段和标准治疗线程字段输入至语义排序模型,得到语义排序模型输出的治疗线程字段和标准治疗线程字段之间的匹配分值;
80.步骤133,基于语义相似度和/或匹配分值,确定与治疗线程字段匹配的标准治疗线程。
81.具体地,对治疗线程字段进行语义编码可以把治疗线程字段映射到一个向量空间,将其转变成数字表示的词嵌入表示向量,从而得到能够表征该治疗线程字段的语义表征向量,即语义特征。语义特征可以以向量表示作为结果输出。
82.得到治疗线程字段的语义特征之后,计算治疗线程字段的语义特征和标准治疗线程字段的语义特征之间的语义相似度。具体可通过相似度算法实现,比如余弦相似度、欧几里得距离或者明可夫斯基距离等,本发明实施例对此不做具体限定。
83.计算得到的语义相似度数值越大,表示治疗线程字段与该标准治疗线段字段的匹配程度越高;计算得到的语义相似度数值越小,表示治疗线程字段与该标准治疗线段字段的匹配程度越低。
84.步骤132中,语义排序模型用来计算治疗线程字段和标准治疗线程字段之间的匹配度,即治疗线程字段能体现该标准治疗线程的程度。将治疗线程字段和标准治疗线程字段输入至语义排序模型,得到语义排序模型输出的治疗线程字段和标准治疗线程字段之间的匹配分值。输出的匹配分值越高,表示治疗线程字段与该标准治疗线段字段的匹配程度越高;输出的匹配分值越低,表示治疗线程字段与该标准治疗线段字段的匹配程度越低。
85.随即,可以仅根据计算得到的语义相似度,例如将语义相似度最高的所对应的标准治疗线程确定为与治疗线程字段匹配的标准治疗线程;也可以仅根据语义排序模型输出的匹配分值,例如,将匹配分值最高的所对应的标准治疗线程确定为与治疗线程字段匹配的标准治疗线程;还可以综合考虑语义相似度和匹配分值,例如首先根据语义相似度确定出多个候选标准治疗线程,再根据匹配分值从多个候选标准治疗线程中确定与治疗线程字段匹配的标准治疗线程。与治疗线程字段匹配的标准治疗线程确定方法可根据实际情况灵活选择,本发明实施例对此不作具体限定。
86.本发明实施例提供的治疗线程挖掘方法,通过基于语义相似度和/或匹配分值,确定与治疗线程字段匹配的标准治疗线程,能够进一步实现全面可靠的治疗线程挖掘。
87.基于上述任一实施例,图3是本发明提供的治疗线程匹配方法的流程示意图之二,如图3所示,步骤132具体包括:
88.步骤132-1,基于语义相似度,确定与治疗线程字段相关的多个标准治疗线程;
89.步骤132-2,分别将多个标准治疗线程字段和治疗线程字段输入至语义排序模型,得到语义排序模型输出的多个匹配分值;
90.相应地,步骤133具体包括:
91.步骤133-1,对多个匹配分值按照从高到低的顺序进行排序,将排序第一且大于等
于预设阈值的匹配分值所对应的标准治疗线程,确定为与治疗线程字段匹配的标准治疗线程。
92.具体地,计算治疗线程字段的语义特征和标准治疗线程字段的语义特征之间的语义相似度之后,在此基础上,根据语义相似度,确定与治疗线程字段相关的多个标准治疗线程。此处的多个标准治疗线程可以是与治疗线程字段的语义相似度大于等于预设阈值的多个标准治疗线程;也可以是语义相似度排序靠前的预设阈值个标准治疗线程,比如10个标准治疗线程。
93.通过语义相似度筛选得到多个标准治疗线程,再分别将多个标准治疗线程字段和治疗线程字段输入至语义排序模型,得到语义排序模型输出的多个匹配分值。
94.对多个标准治疗线程,按照匹配分值从高到低的顺序进行排序,将排序第一,且匹配分值大于等于预设阈值的标准治疗线程,确定为与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。
95.需要说明的,如果排序第一的匹配分值未达到预设阈值,则表明该文本可能没有对应的治疗线程,但是仍然可以将排序第一的匹配分值对应的治疗线程作为文本最可能的治疗线程。
96.基于上述任一实施例,图4是本发明提供的与治疗线程相关的文本获取方法的流程示意图,如图4所示,步骤110具体包括:
97.步骤111,确定目标医学文本,目标医学文本包括临床试验结果类文本、治疗类指南文本和治疗类临床试验文本中的至少一种;
98.步骤112,对目标医学文本进行治疗线程相关性分类,得到与治疗线程相关的文本。
99.具体地,考虑到医学文本的来源较多,为了进一步提高治疗线程挖掘的效率,可以首先通过文本分类器对医学文本进行分类,筛选得到目标医学文本,目标医学文本包括临床试验结果类文本、治疗类指南文本和治疗类临床试验文本中的至少一种。
100.临床试验结果类文本是指该临床试验文本不仅公开了临床试验的候选药物、试验终点和具体实施方案,同时披露了已经获得的临床试验数据,其与临床试验的终点相关,能够用以评价药物在人体内代谢特征、安全性和有效性。
101.治疗类指南文本是指记载有与临床治疗方案相关的指南文本,例如临床实践指南、标准治疗方案(standard of care,soc)以及相关文献等。
102.治疗类临床试验文本是指记载有与治疗类临床试验相关的文本,例如各国临床试验登记平台登记的干预性临床试验信息相关的文本。
103.目标医学文本的来源格式可以是纯文本格式,也可以是富文本格式。针对纯文本格式,可以采用文本直接读取的方式获取;针对富文本格式,可以进一步加工处理得到文本,比如采用光学字符识别(optical character recognition,ocr)对图片进行文本识别,或者采用pdftotext进行文本抽取。
104.考虑到目标医学文本的数据分布不同,所属来源不同,文本通常较长且烦杂,而且有很多不包含“治疗线程”内容的文本,因此需要对目标医学文本进行进一步分类,分类依据可包括是否与治疗线程相关。进一步地,还可以对目标医学文本中的各段落进行治疗线程相关性分类,得到与治疗线程相关的段落。
105.为了实现针对文本的治疗线程相关性分类,可采用预先训练的二分类模型对文本进行判别,从而识别出包含“治疗线程”的文本,即与治疗线程相关的文本。
106.本发明实施例提供的方法,通过对目标医学文本进行治疗线程相关性分类,便于快速获取与治疗线程相关的文本。
107.基于上述任一实施例,图5是本发明提供的检索方法的流程示意图,如图5所示,该方法包括:
108.步骤510,接收用户终端发送的目标检索关键词,目标检索关键词包括目标治疗线程和/或目标药品。
109.具体地,各种来源的医学文本可以通过上述实施例描述的方法进行治疗线程挖掘,得到各药品在各治疗线程下的医学数据,进而为进行信息查找定位提供了便利。并且,在此基础上,可以构建检索系统,以便于目标信息的快速查找和定位。
110.用户可以通过智能手机、电脑、平板电脑等形式的用户终端输入目标检索关键词,并且将目标检索关键词发送到用于检索的服务端。此处的目标检索关键词即期望从医学数据中查找到相关信息的关键词,例如可以包括目标治疗线程和/或目标药品。
111.步骤520,从预先确定的各药品在各治疗线程下的医学数据中,确定出与目标检索关键词相关联的医学数据;
112.医学数据所对应的各治疗线程基于如上述治疗线程挖掘方法确定的,医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
113.具体地,在接收到目标检索关键词后,即可在预先确定的各药品在各治疗线程下的医学数据中,查找定位出与目标检索关键词相关联的医学数据,其中医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
114.其中,指南数据可以是,基于指南获取的适应症名称、适应症对应的推荐治疗药品、临床分期、推荐级别、特殊用药人群等信息。
115.临床试验数据可以是,基于各国临床试验登记平台及临床试验文献获取的试验组药品名称、对照组药品名称、适应症名称、试验结果等信息。
116.流行病学数据可以是,基于流行病学相关文献获取的适应症名称、适应症对应的历年的新发病历人数、死亡病历人数、发病患者总数等信息。
117.其中,适应症名称和药品名称可以是标准化处理后的适应症名称和药品名称,具体处理方式可以是在预先构建的药品字典中或适应症字典中进行匹配得到。
118.本发明实施例提供的检索方法,通过各药品在各治疗线程下的医学数据,实现与目标药品和/或目标治疗线程相关联的医学数据的快速检索,有助于提高信息查询效率,能够将各医学数据实现基于治疗线程维度的统一对比分析。
119.基于上述任一实施例,在目标检索关键词包括目标药品的情况下,步骤520具体包括:
120.从预先确定的各药品在各治疗线程下的医学数据中,确定出目标药品对应的适应症在各治疗线程下的临床试验数据,临床试验数据包括药品研发阶段、目标药品对应的适应症的最高研发阶段和药品上市的获批机构中的至少一项。
121.具体地,在目标检索关键词包括目标药品的情况下,可从预先确定的各药品在各治疗线程下的医学数据中,根据药品、适应症、治疗线程和研发阶段的关联关系,获取目标
药品对应的治疗线程信息集以及适应症信息集。
122.进一步地,获取目标治疗线程下对应的所有药品适应症对应的研发阶段信息集;获取目标适应症下所有药品对应的治疗线程的研发阶段信息集;获取目标治疗线程及目标适应症下对应的药品研发阶段信息集。
123.在一个实施例中,药品研发阶段信息集可以表示为m*n的基础表格,表格中每个元素为研发阶段。
124.对各个研发阶段逐个赋予权重,随着研发阶段的推进,各研发阶段对应的权重值逐渐增加,预设每个研发阶段转换升级成功或者失败的概率均为50%,因此设置两个相邻研发阶段的权重差为0.5。生成m*n的次级表格。
125.例如:研发阶段包括“临床前”、“申报临床”、“i期临床”、“i/ii期临床”、“ii期临床”、“ii/iii期临床”、“iii期临床”、“iii/iv期临床”、“iv期临床”、“申请上市”和“批准上市”,每个研发阶段对应的权重分别为0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0和5.5。
126.对生成的次级表格进行行排序及列排序,排序的方式为:每一行或每一列权重之和的降序排列,生成最终m*n的表格。
127.更进一步地,还可以获取目标药品对应的适应症的最高研发阶段,若所述最高研发阶段为已上市,进一步获取药品上市的获批机构,提供给用户进行更进一步的筛选。
128.基于上述任一实施例,图6是本发明提供的患者病历数据监控方法的流程示意图,如图6所示,在目标检索关键词包括目标治疗线程的情况下,步骤520之后还包括:
129.步骤610,获取患者病历数据;
130.步骤620,对患者病历数据进行结构化,得到结构化的病历数据;
131.步骤630,基于结构化的病历数据和目标治疗线程下的病历医学质控指标阈值,对患者病历数据进行监控。
132.具体地,在上述检索系统的基础上,还可以从治疗线程维度,实现基于患者真实病历数据的医学质控、风险评估、临床科研和数据洞察。
133.此处的患者病历数据主要是文本形式,还可以是图片形式,也可以是视频形式,在此不做具体限定。
134.随即,对患者病历数据进行结构化,结构化的方法包括自然语言处理(natural language processing,nlp)和结构化数据输入(structured data entry)。由此可得到结构化的病历数据,包括但不限于患者的症状、体征、病史、诊断结果、治疗线程、检验检查、用药医嘱等。
135.依据疾病的诊疗指南或者国家诊疗规范,拆分出标准的疾病诊疗路径。依据疾病诊疗路径,确定病历医学质控指标。例如晚期肺癌患者一线化学治疗的指标包括:入院24小时心电图完成率、入院24小时检验完成率、化疗前是否贫血、化疗前白细胞是否减少、一线治疗药物剂量调整比率、化疗后肺部感染率等。然后确定医学质控指标的计算方法,使用结构化的病历数据进行自动计算,对患者病历数据进行监控。
136.还可依据历史数据和临床质控经验确定预警阈值,当病历数据中相关医学质控指标的数据达到或超过阈值时,进行自动预警。
137.本发明实施例提供的检索方法,从治疗线程的维度,实现患者病历数据的医学指标质控,提高了病历管理效率。
138.基于上述任一实施例,步骤630具体包括:
139.基于结构化的病历数据中包含的各风险因素的结构化数据,以及预先确定的不同药物治疗的不良反应与产生不良反应的各风险因素之间的关系,对目标治疗线程下患者病历数据对应的不良反应数据进行预估。
140.具体地,在进行病历质控的基础上,还可以对目标线程下患者病历数据对应的不良反应数据进行预估。
141.首先依据疾病的文献报道、诊疗指南,确定不同药物治疗的主要并发症或不良反应,以及这些并发症或不良反应的潜在风险因素。例如细胞因子风暴是cart-t细胞末线治疗晚期b细胞淋巴瘤的常见不良反应,严重的细胞因子风暴十分危险,可能的风险因素包括年龄、性别、治疗线程、既往用药史、血液中il-1/il-6/tnf-α/ifn-γ浓度、心钠肽浓度等。
142.然后提取到发生严重细胞因子风暴患者病历数据中的各风险因素的结构化数据,通过多变量相关性分析的统计学方法,计算出严重细胞因子风暴和不同风险因素之间的关系。
143.由此可根据b细胞淋巴瘤患者的病历数据中包含的各风险因素的结构化数据,以及严重细胞因子风暴和不同风险因素之间的关系,针对患者使用car-t治疗的病历数据中,发生严重细胞因子风暴这种不良反应的数据进行评估。
144.本发明实施例提供的方法,从治疗线程的维度实现患者病历数据对应的不良反应的风险评估,从而实现了精细化治疗。
145.基于上述任一实施例,提供一种基于治疗线程维度的检索方法,包括:
146.s1,获取目标医学文本,所述目标医学文本包括临床试验结果类文本、治疗类指南文本和治疗类临床试验文本中的至少一种。
147.s2,采用二分类模型,对所述目标医学文本进行治疗线程相关性分类,得到与治疗线程相关的文本。
148.s3,对所述与治疗线程相关的文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;
149.s4,对所述治疗线程字段进行语义编码,得到所述治疗线程字段的语义特征,并计算所述治疗线程字段的语义特征和所述标准治疗线程字段的语义特征之间的语义相似度;
150.s5,基于所述语义相似度,确定与所述治疗线程字段相关的多个标准治疗线程;分别将所述多个标准治疗线程字段和所述治疗线程字段输入至所述语义排序模型,得到所述语义排序模型输出的多个匹配分值。
151.s6,对所述多个匹配分值按照从高到低的顺序进行排序,将排序第一且大于等于预设阈值的匹配分值所对应的标准治疗线程,确定为与所述治疗线程字段匹配的标准治疗线程。并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
152.s7,根据s1-s6步骤获取各医学文本对应的治疗线程,同时获取各药品在各治疗线程下的医学数据,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
153.s8,接收用户终端发送的目标治疗线程和/或目标药品;从s7中确定的各药品在各治疗线程下的医学数据中,确定出与所述目标治疗线程和/或目标药品相关联的医学数据;并将所述医学数据返回至用户终端。
154.此外,还可从治疗线程的维度,实现患者病历数据的医学指标质控,以及实现患者病历数据对应的不良反应数据评估。
155.下面对本发明提供的治疗线程挖掘装置进行描述,下文描述的治疗线程挖掘装置与上文描述的治疗线程挖掘方法可相互对应参照。
156.基于上述任一实施例,图7是本发明提供的治疗线程挖掘装置的结构示意图,如图7所示,该装置包括:
157.文本确定单元710,用于确定与治疗线程相关的文本;
158.实体识别单元720,用于对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;
159.治疗线程确定单元730,用于基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
160.本发明实施例提供的治疗线程挖掘装置,对与治疗线程相关的文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;根据治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与治疗线程字段匹配的标准治疗线程,并将与治疗线程字段匹配的标准治疗线程确定为文本对应的治疗线程。在实现全面、可靠的治疗线程挖掘的同时,有效提高了治疗线程挖掘的实现效率,降低了治疗线程挖掘的成本。
161.基于上述任一实施例,治疗线程确定单元730进一步用于:
162.对所述治疗线程字段进行语义编码,得到所述治疗线程字段的语义特征,并计算所述治疗线程字段的语义特征和所述标准治疗线程字段的语义特征之间的语义相似度;
163.和/或,将所述治疗线程字段和所述标准治疗线程字段输入至语义排序模型,得到所述语义排序模型输出的所述治疗线程字段和所述标准治疗线程字段之间的匹配分值;
164.基于所述语义相似度和/或所述匹配分值,确定与所述治疗线程字段匹配的标准治疗线程。
165.基于上述任一实施例,治疗线程确定单元730进一步用于:
166.基于所述语义相似度,确定与所述治疗线程字段相关的多个标准治疗线程;
167.分别将所述多个标准治疗线程字段和所述治疗线程字段输入至所述语义排序模型,得到所述语义排序模型输出的多个匹配分值;
168.对所述多个匹配分值按照从高到低的顺序进行排序,将排序第一且大于等于预设阈值的匹配分值所对应的标准治疗线程,确定为与所述治疗线程字段匹配的标准治疗线程。
169.基于上述任一实施例,文本确定单元710进一步用于:
170.确定目标医学文本,所述目标医学文本包括临床试验结果类文本、治疗类指南文本和治疗类临床试验文本中的至少一种;
171.对所述目标医学文本进行治疗线程相关性分类,得到与治疗线程相关的文本。
172.基于上述任一实施例,图8是本发明提供的检索装置的结构示意图,如图8所示,该装置包括:
173.关键词接收单元810,用于接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;
174.医学数据确定单元820,用于从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;所述医学数据所对应的各治疗线程基于如上述任一项所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
175.本发明实施例提供的检索装置,通过各药品在各治疗线程下的医学数据,实现与目标药品和/或目标治疗线程相关联的医学数据的快速检索,有助于提高信息查询效率,能够将各医学数据实现基于治疗线程维度的统一对比分析。
176.基于上述任一实施例,在所述目标检索关键词包括所述目标药品的情况下,所述医学数据确定单元820进一步用于:
177.从预先确定的各药品在各治疗线程下的医学数据中,确定出所述目标药品对应的适应症在各治疗线程下的临床试验数据,所述临床试验数据包括药品研发阶段、所述目标药品对应的适应症的最高研发阶段和药品上市的获批机构中的至少一项。
178.基于上述任一实施例,在所述目标检索关键词包括所述目标治疗线程的情况下,所述检索装置还包括数据监控单元,用于:
179.获取患者病历数据;
180.对所述患者病历数据进行结构化,得到结构化的病历数据;
181.基于所述结构化的病历数据和所述目标治疗线程下的病历医学质控指标阈值,对所述患者病历数据进行监控。
182.基于上述任一实施例,所述数据监控单元进一步用于:
183.基于所述结构化的病历数据中包含的各风险因素的结构化数据,以及预先确定的不同药物治疗的不良反应与产生所述不良反应的各风险因素之间的关系,对所述目标治疗线程下所述患者病历数据对应的不良反应数据进行预估。
184.图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)910、通信接口(communications interface)920、存储器(memory)930和通信总线940,其中,处理器910,通信接口920,存储器930通过通信总线940完成相互间的通信。处理器910可以调用存储器930中的逻辑指令,以执行治疗线程挖掘方法,该方法包括:确定与治疗线程相关的文本;对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
185.处理器910还可以调用存储器930中的逻辑指令,以执行检索方法,该方法包括:接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;所述医学数据所对应的各治疗线程基于如上所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
186.此外,上述的存储器930中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以
使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
187.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的治疗线程挖掘方法,该方法包括:确定与治疗线程相关的文本;对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
188.所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的检索方法,该方法包括:接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;所述医学数据所对应的各治疗线程基于如上所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
189.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的治疗线程挖掘方法,该方法包括:确定与治疗线程相关的文本;对所述文本进行治疗线程实体识别,将识别所得的实体作为治疗线程字段;基于所述治疗线程字段的语义和治疗线程字典中标准治疗线程字段的语义,确定与所述治疗线程字段匹配的标准治疗线程,并将与所述治疗线程字段匹配的标准治疗线程确定为所述文本对应的治疗线程。
190.所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的检索方法,该方法包括:接收用户终端发送的目标检索关键词,所述目标检索关键词包括目标治疗线程和/或目标药品;从预先确定的各药品在各治疗线程下的医学数据中,确定出与所述目标检索关键词相关联的医学数据;所述医学数据所对应的各治疗线程基于如上所述的治疗线程挖掘方法确定的,所述医学数据包括指南数据、临床试验数据和流行病学数据中的至少一项。
191.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
192.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施
例或者实施例的某些部分所述的方法。
193.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献