一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种治疗方案结构化数据库的构建方法和应用与流程

2022-02-24 16:54:59 来源:中国专利 TAG:


1.本发明涉及医疗信息处理和医学文献数据挖掘的技术领域,特别是涉及一种治疗方案结构化数据库的构建方法和应用。


背景技术:

2.医疗方案是医生根据患者的具体情况,制定适合的治疗方法对患者进行治疗的方案。
3.目前,尚无相关文献或报道公开关于结构化治疗方案方面的数据,与治疗方案相关的专利文献也为数不多,例入:公开日为2020年4月21日,公开号为cn111046649a的中国发明专利申请文献公开了一种文本分割方法和装置;公开日为2020年6月2日,公开号为cn111223543a的中国发明专利申请文献公开了一种治疗方案智能指导的方法、系统和设备,通过建立治疗方案数据库;公开日为2017年1月11日,公开号为cn106326645a的中国发明专利申请文献公开了一种治疗方案信息支持管理系统;公开日为2019年6月7日,公开号为cn109859851a的中国发明专利申请文献公开了一种治疗方案推荐方法和装置。上述专利文献涉及的技术方案,均仅仅是使用现有的公开药品数据库、药品说明书、器械操作规范等公开数据,通过信息提取手段对其中部分信息进行展示,未涉及治疗方案本身的结构化和图形化展示等。
4.随着当前医疗领域信息化的不断深入,将病案等真实世界数据进行电子化和结构化成为医疗数据研究的迫切需求。治疗方案作为其中一种数据类型,也急需一种结构化程度高,调取方便的数据库进行数据存储。
5.在实际治疗中,特别是在慢性疾病治疗过程中,治疗方案具有一定的复杂性,尤其是长期的组合治疗方案具有显著的复杂性。医生在开具或调整处方过程中,往往需要花费大量精力用于特定治疗药物的调取、药物剂量的调整以及药物使用时序性的说明。在中国医疗服务资源匮乏的现状下,通过建立来自指南、标准教科书等来源的已知治疗方案的数据库,完善治疗方案、疾病类型、方案疗效证据,这三者之间的映射关系,从而调取适用的治疗方案组合进行图形化展示,有助于提高医生的工作效率。
6.除此以外,随着现代生物医学各研究领域的长足发展,每天都有大量新的治疗方案疗效以及不同治疗方案比较的报道,医学研究者和医务工作者需要每天阅读大量的专业文献,才能跟上现代医学研究的发展速度。通过人工智能自然语言分词等自动化辅助技术,不断扩充结构化治疗方案数据库,可以解决医务工作者有限的学习时间与海量数据查阅的矛盾。


技术实现要素:

7.本发明目的在于提供一种方案结构化数据库的构建方法和系统,该数据库为临床研究前沿文献、真实世界病案数据、指南以及标准教材等不同来源、不同结构的治疗方案提供标准化、结构化的描述逻辑和存储方法,并通过建立治疗方案-疾病类型-疗效证据之间
的映射关系,以及前端模糊检索、方案调取以及图形界面的个体化方案调整等功能,为医疗工作者和患者输出针对特定疾病的定制化、可视化、图形化的合理治疗方案,同时提供治疗方案的疗效证据,提高医疗质量和效率。
8.本发明的技术方案如下:一种治疗方案结构化数据库的构建方法,其特征在于,具体的构建方案如下:(1)利用自然语言分词技术,在相应训练语料中选择需和治疗方案建立映射关系的信息进行分词和词性标注,建立治疗方案分词模型,对治疗方案进行分词和词性标注。
9.这里的自然语言分词模型至少包括mecab中文分词模型、jieba分词模型、wmseg模型、ltp模型、机械分词算法模型、n-gram模型、hmm(隐马尔可夫)模型、crf(条件随机场)模型以及深度神经网络模型等。
10.(2)建立药物单体子数据库,对药物单体子数据库中的药品中文通用名称、药品英文通用名称、商品名、别名、常见不良反应、禁忌症、给药部位、给药方式、用药剂量、剂量单位、给药频率等结构化模块进行与步骤(1)对应的词性标注,存储药品单体结构化信息,建立给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,建立药物单体数据库。
11.(3)建立药物组合方案子数据库,对药物组合方案子数据库中的组合方案通用名称、组合方案缩写词、药品组合方式等结构化模块进行与步骤(1)对应的词性标注,以步骤(2)建立的药物单体数据库为基础,在特定疾病和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,进行组合,并与药物组合方案名称建立映射关系,建立药物组合方案数据库。
12.(4)建立治疗方案时序逻辑子数据库,对治疗方案时序逻辑子数据库中的治疗频率、治疗周期、时间逻辑词、关系逻辑词等结构化模块进行与步骤(1)对应的词性标注,写入同一治疗方案下,不同药物单体、药物组合方案的相对时序逻辑,为治疗方案数据库增加时间维度,建立治疗方案时序逻辑数据库;所述治疗方案继承步骤(2)和步骤(3)中的特定疾病和特定治疗阶段的映射关系,即表明此处的治疗方案时序逻辑数据库在建立时序逻辑后,这种有时序逻辑的治疗方案继续使用从步骤(2)-(3)中被调取药物或药物组合方案的所关联的特定疾病和特定治疗阶段的映射关系。
13.(5)继承步骤(3)-步骤(4)中对于特定疾病和特定治疗阶段的映射关系,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,与该治疗方案建立映射关系,建立治疗方案-疾病-疗效证据映射关系数据库。
14.从而,完成治疗方案结构化数据库的建立。
15.根据上述数据库的建立过程,步骤(1)的具体建立方式为:首先,通过公共的药品数据库、药物商品名/别名数据库、药品说明书等,以及自建药物组合方案缩写语料库(例如tp方案、folfox方案等),为分词模型提供药品名称和药物组合方案缩写训练语料;通过自建给药剂量和剂量单位语料库(2mg/kg,5units,10mg,5mg/m^2等),自建中英文对照给药部位语料库(全身治疗,病灶局部给药等),自建中英文对照给药方式语料库(皮下注射、静脉滴注、口服等),自建给药频率语料库(qd,bid,tid等),自建给药时间语料库(day1; day1-7; day 1, 8等),自建中英文对照不良反应和禁忌症数据库(过敏、孕妇禁用等),以及自建治疗频率和治疗周期(例如,治疗频率:qw,q2w,qm等;治疗周
期:6 cycle,3 cycle等)等,为分词模型提供治疗方案其他信息训练语料;通过icd-10标准疾病名称,与icd-10标准疾病名称建立映射关系的自建中英文对照疾病名称(如肺癌、乳腺癌、高血压、糖尿病以及其常见别名等),以及自建中英文对照治疗阶段(如维持治疗、初始治疗、诱导化疗等)等,为分词模型提供需与治疗方案建立映射关系的其他信息训练语料。
16.然后,利用结巴分词技术等自然语言分词模型,对来自临床研究前沿文献、真实世界病案数据、指南以及标准教材等的治疗方案以及需建立映射关系的信息进行分词和词性标注,为后续步骤的结构化治疗方案数据库建设提供数据内容。
17.步骤(2)中进行词性标注时,可通过人工、人工智能自然语言读取辅助等手段,存储药品单体结构化信息;所述药品单体结构化信息的内容包括药品中英文通用名称,通用名与商品名/别名映射关系,常见不良反应,禁忌症,用法(给药部位,给药方式等),用量(用药剂量,剂量单位,给药频率等);所述给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,可以包括例如:商品名、常见不良反应、禁忌症、给药部位、给药方式、给药剂量、剂量单位、给药频率和对应的疾病名称及对应的特定治疗阶段。
18.步骤(3)中进行词性标注时,可通过人工、人工智能自然语言读取辅助等手段。同时,以步骤(2)药物单体数据库为基础,在特定疾病名称和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,可通过人工方式或人工智能辅助自动方式进行组合。
19.步骤(3)中建立的映射关系包括很多,例如:tp方案—顺铂;紫杉醇—乳腺癌—诱导化疗。
20.步骤(4)中进行词性标注时,可人工、人工智能自然语言读取辅助等手段。
21.进一步的,步骤(4)中,通过人工方式或人工智能辅助自动方式等,调取特定药物单体或药物组合方案的治疗频率和治疗周期,定义该药物单体或药物组合方案在治疗方案中所需治疗时间(例如,在采用与药物组合方案名称建立映射关系的治疗阶段进行表示时:诱导化疗,q3w,3 cycles);在同一治疗方案下不同药物单体或药物组合方案之间,结合该治疗方案下所有药物单体或药物组合方案的治疗频率和治疗周期,通过定义时间逻辑词(例如at, after, during, before等),采用人工方式或人工智能辅助自动方式等,写入不同药物单体或药物组合方案在时间维度的相对位置(例如:诱导化疗后,行同步放化疗时:同步放化疗,q3w,1 cycle,day1 after 诱导化疗 cycle 3);在同一治疗方案下不同药物单体或药物组合方案之间,通过定义关系逻辑词(例如and,or等),采用人工方式或人工智能辅助自动方式等,写入不同药物单体或药物组合方案的相对关系(例如,诱导化疗可选tp方案或dp方案(顺铂 多西他赛)时,tp方案 or dp方案)。
22.步骤(5)也可通过人工、人工智能自然语言读取辅助等手段进行数据提取和建立映射关系。其中,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,可以例如:诱导化疗,然后同步放化疗方案—乳腺癌—中位总生存时间,不良反应等。
23.进一步的,对于建立的治疗方案结构化数据库,在应用过程中,结构化模块的数据建立有对应的关键词索引,数据与数据间也会有关联,可以通过关键词把相关的数据以及与数据关联的其他数据检索出来,另外,可以通过分词功能将搜索词汇分割成常用的词,进而增加搜索范围,得出更多关联的数据,用于实现对治疗方案结构化数据库中任意结构化模块的模糊检索,从而调取与所述任意结构化模块有关联的其他数据库信息以及与这些数据库信息建立映射关系的信息。
24.进一步的,可以对调取信息以治疗方案结构化数据库中最小结构化数据单元为单位,进行图形化展示,展示内容包括步骤(2)-步骤(5)中涉及的该条治疗方案在治疗方案结构化数据库中的所有相关内容。对于,展示内容中的数据或数据段采用图形化展示,使用echarts等技术将结构化数据以不同形式(柱状图,折线图,散点图,甘特图,饼形等)展示,图形化数据具有可更换性,共享性,阶段性等。通过图形化展示的内容,进行对数据的监听,比如数据点的点击事件监听,数据段的选取区域监听,将这部分数据进行拷贝,临时存放,用于实现数据或数据端的截取,复制,删除等操作,完成在不同场景下将不是同一分类下的数据进行合并,或者同一分类下的数据进项拆分等操作,实现对各结构化数据单元建立映射关系的图形化模块的界面交互功能,使操作者可通过直接调整各结构化模块图形模块,对治疗方案进行调整和优化。进而,在治疗方案结构化数据库中建立新的地址,将该治疗方案中调整优化后的部分存入药物单体数据库、药物组合方案数据库或治疗方案时序逻辑数据库的相应位置。
25.本发明的有益效果如下:(1)本发明通过药物单体数据库-药物组合方案数据库-治疗方案时序逻辑数据库的三级治疗方案数据库结构,对治疗方案进行了单药使用,药物组合,治疗时间等多个维度的结构化,首次建立了一种结构化存储和调取治疗方案信息的数据库。
26.(2)本发明基于对治疗方案数据库的词性标注,使用公共和自建语料库进行人工智能自然语言处理算法模型训练,可以实现对多种来源、不同结构的治疗方案原始数据的分词、词性标注和自动存储。
27.(3)本发明可以通过人工智能自然语言分词等自动化辅助技术,以及治疗方案图形化展示和调整功能,大大提高了数据库建设效率和用户的使用效率,有助于提高医务工作者的工作和学习效率。
附图说明
28.图1为本发明的翻译模型训练流程图。
29.图2为本发明实施例8中的优化图示示意图。
具体实施方式
30.为更进一步阐述本发明为达成预定发明目的所采用的技术手段及功效,下面结合实施例阐述本发明。
31.实施例1本实施例提供了一种治疗方案结构化数据库的构建方法,其构建方案如下:(1)利用自然语言分词模型技术,对治疗方案进行分词和词性标注,并对相应训练语料中选择需和治疗方案建立映射关系的信息进行分词和词性标注,建立治疗方案分词模型;(2)建立药物单体子数据库,对药物单体子数据库中的药品中文通用名称、药品英文通用名称、商品名、别名、常见不良反应、禁忌症、给药部位、给药方式、用药剂量、剂量单位、给药频率等结构化模块进行与步骤(1)对应的词性标注,存储药品单体结构化信息,建立给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,建立药物单体数据库;
(3)建立药物组合方案子数据库,对药物组合方案子数据库中的组合方案通用名称、组合方案缩写词、药品组合方式等结构化模块进行与步骤(1)对应的词性标注,以步骤(2)建立的药物单体数据库为基础,在特定疾病和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,进行组合,并与药物组合方案名称建立映射关系,建立药物组合方案数据库;(4)建立治疗方案时序逻辑子数据库,对治疗方案时序逻辑子数据库中的治疗频率、治疗周期、时间逻辑词、关系逻辑词等结构化模块进行与步骤(1)对应的词性标注,写入同一治疗方案下,不同药物单体、药物组合方案的相对时序逻辑,为治疗方案数据库增加时间维度,建立治疗方案时序逻辑数据库;所述治疗方案继承步骤(2)和步骤(3)中的特定疾病和特定治疗阶段的映射关系,即表明此处的治疗方案时序逻辑数据库在建立时序逻辑后,这种有时序逻辑的治疗方案继续使用从步骤2-3中被调取药物或药物组合方案的所关联的特定疾病和特定治疗阶段的映射关系;(5)继承步骤(3)-步骤(4)中对于特定疾病和特定治疗阶段的映射关系,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,与该治疗方案建立映射关系,建立治疗方案-疾病-疗效证据映射关系数据库;从而,完成治疗方案结构化数据库的建立。
32.实施例2在实施例1的基础上,根据数据库的建立过程,步骤(1)的具体建立方式为:首先,通过公共的药品数据库、药物商品名/别名数据库、药品说明书等,以及自建药物组合方案缩写语料库(例如tp方案、folfox方案等),为分词模型提供药品名称和药物组合方案缩写训练语料;通过自建给药剂量和剂量单位语料库(2mg/kg,5units,10mg,5mg/m^2等),自建中英文对照给药部位语料库(全身治疗,病灶局部给药等),自建中英文对照给药方式语料库(皮下注射、静脉滴注、口服等),自建给药频率语料库(qd,bid,tid等),自建给药时间语料库(day1; day1-7; day 1, 8等),自建中英文对照不良反应和禁忌症数据库(过敏、孕妇禁用等),以及自建治疗频率和治疗周期(例如,治疗频率:qw,q2w,qm等;治疗周期:6 cycle,3 cycle等)等,为分词模型提供治疗方案其他信息训练语料;通过icd-10标准疾病名称,与icd-10标准疾病名称建立映射关系的自建中英文对照疾病名称(如肺癌、乳腺癌、高血压、糖尿病以及其常见别名等),以及自建中英文对照治疗阶段(如维持治疗、初始治疗、诱导化疗等)等,为分词模型提供需与治疗方案建立映射关系的其他信息训练语料。
33.然后,利用结巴分词技术等自然语言分词模型,对来自临床研究前沿文献、真实世界病案数据、指南以及标准教材等的治疗方案以及需建立映射关系的信息进行分词和词性标注,为后续步骤的结构化治疗方案数据库建设提供数据内容。
34.实施例3在实施例1的基础上,根据数据库的建立过程,步骤(2)中进行词性标注时,可通过人工、人工智能自然语言读取辅助等手段,存储药品单体结构化信息;所述药品单体结构化信息的内容包括药品中英文通用名称,通用名与商品名/别名映射关系,常见不良反应,禁忌症,用法(给药部位,给药方式等),用量(用药剂量,剂量单位,给药频率等)。
35.所述的给定药物的特定用量和给药时间与特定疾病和特定治疗阶段的映射关系,在本实施例中,例如:顺铂,铂龙(商品名),肾毒性、消化系统毒性、造血系统毒性、耳毒性、
神经毒性、过敏反应(常见不良反应),铂制剂过敏、怀孕、哺乳期、骨髓机能减退、严重肾功能损害、失水过多、水痘、带状疱疹、痛风、高尿酸血症、近期感染、近期因顺铂引起的外周神经病(禁忌症),全身治疗(给药部位),静脉滴注(给药方式),50(给药剂量),mg/m^2(剂量单位),day1,8(给药频率)—乳腺癌(疾病)—诱导化疗(特定治疗阶段)。
36.实施例4在实施例1的基础上,根据数据库的建立过程,步骤(3)中进行词性标注时,可通过人工、人工智能自然语言读取辅助等手段。同时,以步骤(2)药物单体数据库为基础,在特定疾病名称和特定治疗阶段的映射条件下,调取药物单体数据库中的特定药品,可通过人工方式或人工智能辅助自动方式进行组合。
37.步骤(3)中建立的映射关系包括很多,例如:tp方案—顺铂;紫杉醇—乳腺癌—诱导化疗。
38.实施例5在实施例1的基础上,根据数据库的建立过程,步骤(4)中进行词性标注时,可人工、人工智能自然语言读取辅助等手段。
39.进一步的,步骤(4)中,通过人工方式或人工智能辅助自动方式等,调取特定药物单体或药物组合方案的治疗频率和治疗周期,定义该药物单体或药物组合方案在治疗方案中所需治疗时间(例如,在采用与药物组合方案名称建立映射关系的治疗阶段进行表示时:诱导化疗,q3w,3 cycles);在同一治疗方案下不同药物单体或药物组合方案之间,结合该治疗方案下所有药物单体或药物组合方案的治疗频率和治疗周期,通过定义时间逻辑词(例如at, after, during, before等),采用人工方式或人工智能辅助自动方式等,写入不同药物单体或药物组合方案在时间维度的相对位置(例如:诱导化疗后,行同步放化疗时:同步放化疗,q3w,1 cycle,day1 after 诱导化疗 cycle 3);在同一治疗方案下不同药物单体或药物组合方案之间,通过定义关系逻辑词(例如and,or等),采用人工方式或人工智能辅助自动方式等,写入不同药物单体或药物组合方案的相对关系(例如,诱导化疗可选tp方案或dp方案(顺铂 多西他赛)时,tp方案 or dp方案)。
40.实施例6在实施例1的基础上,根据数据库的建立过程,步骤(5)也可通过人工、人工智能自然语言读取辅助等手段进行数据提取和建立映射关系。其中,提取治疗方案来源数据中关于该治疗方案疗效分析或疗效对比数据,可以例如:诱导化疗,然后同步放化疗方案—乳腺癌—中位总生存时间,不良反应等。
41.实施例7在实施例1的基础上,根据数据库的建立过程,进一步的,在应用过程中,在前端应用该治疗方案结构化数据库时,通过结构化模块的数据建立对应的关键词索引,利用数据与数据间的关联性,通过关键词可以检索到相关的数据以及与数据关联的其他数据。
42.另外,可以通过分词功能将搜索词汇分割成常用的词,进而增加搜索范围,得出更多关联的数据,用于实现对治疗方案结构化数据库中任意结构化模块的模糊检索,从而调取与所述任意结构化模块有关联的其他数据库信息以及与这些数据库信息建立映射关系的信息。
43.实施例8
在实施例1的基础上,进一步的,可以对调取信息以治疗方案结构化数据库中最小结构化数据单元为单位,进行图形化展示,展示内容包括步骤(2)-步骤(5)中涉及的该条治疗方案在治疗方案结构化数据库中的所有相关内容。对于,展示内容中的数据或数据段采用图形化展示,使用echarts等技术将结构化数据以不同形式(柱状图,折线图,散点图,甘特图,饼形等)展示,图形化数据具有可更换性,共享性,阶段性等。通过图形化展示的内容,进行对数据的监听,比如数据点的点击事件监听,数据段的选取区域监听,将这部分数据进行拷贝,临时存放,用于实现数据或数据端的截取,复制,删除等操作,完成在不同场景下将不是同一分类下的数据进行合并,或者同一分类下的数据进项拆分等操作,实现对各结构化数据单元建立映射关系的图形化模块的界面交互功能,使操作者可通过直接调整各结构化模块图形模块,对治疗方案进行调整和优化,如图2所示。进而,在治疗方案结构化数据库中建立新的地址,将该治疗方案中调整优化后的部分存入药物单体数据库、药物组合方案数据库或治疗方案时序逻辑数据库的相应位置。
44.上述实施例中,基于治疗方案结构化数据库中涉及的药物单体数据库建立、药物组合方案数据库建立、特定疾病和特定治疗阶段的映射关系、治疗方案-疾病-疗效证据映射关系数据库的各种变化均在本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献