一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种医疗电子病历的标注方法、装置、系统及存储介质与流程

2023-01-15 09:36:22 来源:中国专利 TAG:


1.本发明涉及医疗电子病历技术领域,具体为一种医疗电子病历的标注方法、装置、系统及存储介质。


背景技术:

2.目前,电子病历作为医疗信息化的主要载体,其中病案主体及包含在病案中的各种诊断相关描述、检验检查结果、查房记录、医嘱等,都可以被认为是包含丰富有价值的诊疗信息,这些信息可以作为辅助诊疗、疾病预防、健康管理等科研、临床应用的基础数据源。但是,由于医护人员的自然语言表达,这样的非结构化文本数据是电子病历数据利用方面的一大障碍,无法作为临床、科研直接应用的输入数据。因此,需要采用医疗信息抽取模型,对其进行结构化处理。
3.而基于深度学习的医疗信息抽取模型,要实现对电子病历数据较好的结构化抽取效果,需要预先人工标注数量足够多的高质量的电子病历数据。而且传统的命名实体人工手动标注方式,是一项枯燥重复且易出错的过程,要标注梳理足够多、质量足够高的病历数据,需要大量的人力物力。
4.因此,如何减轻人工标注工作量、提升电子病历标注的效率和质量,是当下有待解决的问题。


技术实现要素:

5.(一)解决的技术问题
6.针对现有技术的不足,本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质,能够实现医疗电子病历的人工手动标注、以及经训练后的模型自动标注,以及双重标注后的对实体标签、关系标签的检查勘误,解决了传统的命名实体人工手动标注方式,是一项枯燥重复且易出错的过程,要标注梳理足够多、质量足够高的病历数据,需要大量的人力物力的问题。
7.(二)技术方案
8.为实现以上目的,本发明通过以下技术方案予以实现:
9.一种医疗电子病历的装置、系统及存储介质,包括项目标注界面,所述项目标注界面包括两大块,标签界面和文本标注界面,而对于病历文本的标注,有以下两个主要任务,标注实体标签和标注关系标签,其中,人工手动标注,针对实体标签,可以通过批量和单个两种标注模式标注,针对关系标签,可以根据预定义的关系标签模板,自动匹配上经有向关系线连接的两个实体对之间的关系标签,并可以实时显示标注进度以及导出标注结果。
10.优选的,一种医疗电子病历的标注方法,标注方法的流程包括以下过程:
11.s1.创建标注项目
12.在标注前,需要先创建标注任务,具体包括定义当前标注项目的项目名称、选择项目数据来源、选择项目数据路径。
13.s2.创建标签模板或选择已有标签模板
14.在进入项目标注界面,开始对病历文本标注之前,需要选定用于标注的标签模板。可以通过以下两种方式,选择已创建好的标签模板,或者根据项目标注需求,创建新的标签模板;
15.(1)创建新的标签模板
16.在开始标注之前,需要根据该病历文本类型以及该文本所涉及到病种,结合对应的领域诊疗指南及病历文本书写规范,指定病历文本中值得标注的医学实体和医学关系,从而确定病历文本的标签模板,具体包括:
17.①
新增实体标签
18.点击按钮进入模板管理,创建模板;在定义好模板名称后,在实体列表界面,根据标签模板的定义需求,新增实体标签,并且确定好每一个标签的名称和颜色,由此完成一个实体标签的新增;
19.②
新增关系标签
20.点击按钮进入模板管理,创建模板;在定义好模板名称后,在关系列表界面,根据标签模板的定义需求,新增关系标签,并且确定好当前关系标签对应的头实体标签与尾实体标签,由此完成一个关系标签的新增。
21.(2)选择已有标签模板
22.如果新创建的标注项目,与之前已创建的标注项目,是同一标注任务,模板可共用,则在进入项目标注界面,开始对病历文本标注之前,直接选定已有的标签模板,由此开始后续的标注工作。
23.s3.标注病历文本
24.在项目标注界面,可以看到整个界面的两大块:标签界面、文本标注界面。而对于病历文本的标注,有以下两个主要任务:标注实体标签,标注关系标签。
25.(1)标注实体标签
26.①
标注方法
27.总体而言,在文本标注界面,通过拖拽光标选中一段文本内容片段,即字段,通过下面任意一种标注模式,选择与字段对应的实体标签;标注后,会对所标注字段,按照当前标签模板下该实体标签所预定义的渲染效果,进行字体背景渲染着色;并在其上方,显示对应的实体标签名称。由此,则完成一段字段的实体标签标注;
28.②
标注模式
29.a.单个标注:当选定了标注模式为“单个标注”,用于集合实体标签列表的标签界面,会在选中一段字段之后才会弹出显示,供用户进行选择;
30.当用户在标签界面的实体标签列表中选择了一个实体标签后,则标签模块会消失,则对待标注字段标注上了对应的实体标签。
31.b.批量标注:当选定了标注模式为“批量标注”,用于集合实体标签列表的标签界面,会一直在项目标注界面的右侧显示;
32.当用户在标签界面的实体标签列表中选择了一个实体标签后,可以连续多次地对之后选中的不同字段,标注同一个实体标签,直到选择另一个实体标签。
33.(2)标注关系标签
34.①
标注方法
35.在文本标注界面,通过点击一个已标实体标签的字段a的标签a,长按并拖拽一条有向连线,点击另一个已标实体标签的字段b的标签b;
36.如果当前标注项目的标签模板下,不存在预定义好的实体标签a指向实体标签b的关系标签c,则关系连线失败,字段a到字段b之间的关系有向连线消失;
37.如果当前标注项目的标签模板下,存在预定义好的实体标签a指向实体标签b的关系标签c,则关系有向连线成功连接,并在该有向连线的线体居中上方,显示关系标签c的名称;
38.由此,完成了字段a到字段b的关系标签标注。
39.s4.标注项目管理
40.(1)进度查看
41.通过统计,可以查看到当前标注项目下,待标注文本中的已完成标注的数据数量,通过“已完成标注文本的数量/当前项目总文本数量”实时展示当前项目的标注进度;
42.(2)标注检查
43.完成标注后,对该标注项目下所有的标注结果进行人工检查勘误,无误则完成本标注项目任务。
44.(3)数据导出
45.在完成标注检查后,可以通过,点击当前标注项目的标注页面下方的“全部导出”按钮,导出本标注项目的标注数据,供后续模型训练学习。
46.优选的,步骤s1中的创建标注任务具体包括以下过程:
47.(1)定义项目名称
48.在标注平台左侧项目列表上方点击“创建”,在“新增项目”界面中“项目名称”的文本框中,输入名称,完成项目名称定义。
49.(2)选择项目数据来源
50.开始标注之前,需要导入待标注的数据。标注项目的数据来源,可以是导入非结构化的原始未标注病历文本,也可以是病历标注模型自动标注了一部分的病历文本。病历标注模型,会识别标注出所述待标注文本中各字段对应的实体标签、实体之间的关系标签;其中,所述病历标注模型为根据前期适量的人工标注样本训练调优得到的。
51.(3)选择项目数据路径
52.选择标注项目待导入的病历文本所在的文件夹路径,在该标注项目确定创建后,即可导入到标注工具里,在项目标注界面,以每页一条病历文本的形式进行展示以待后续标注。
53.优选的,步骤s2中创建新的标签模板时,当按照标签模板的定义需求,新增完所有的实体标签和对应的关系标签;由此完成当前标签模板的创建。
54.优选的,步骤s4中在进行标注检查时,如果有误则进行修改,对于实体标签标注错位的字段,修改要求如下:
55.1)如果有关系标签,需要先删除其关系标签;
56.2)如果没有关系标签,可以通过以下两种方式进行实体标签的更改:
57.a.删除该实体标签,再重新按标注方法,对该字段标注正确的实体标签;
58.b.右键单击该实体标签,在之后弹出的全局显示的标签界面,选择正确的实体标签,确认后完成实体标签的更改。
59.(三)有益效果
60.本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质。
61.具备以下有益效果:
62.1、本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质,利用手动标注的部分病历文本数据对基于roberta预训练模型实现的医学关系抽取模型进行训练,得到病历自动标注模型,并构建融手动连续标注与模型自动标注两种模式的病历标注平台。
63.2、本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质,提供了手动连续标注模式和模型自动标注模式两种方法,在保证相当的病历标注准确率地前提下,将电子病历实体关系联合标注任务的速度提升了50%,大幅改善了电子病历标注的效率。
64.3、本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质,可利用手动连续标注模式,在可视化文本标注平台,可以通过选中实体标签,对一段病历文本的多处字段或多段病历文本的字段,进行连续标注,较传统手动标注模式,标注速度有大幅提升。
65.4、本发明提供了一种医疗电子病历的标注方法、装置、系统及存储介质,利用模型自动标注模式,在可视化文本标注平台,可以对单次导入的数百条未标注电子病历,在短时间内完成实体标签、关系标签准确度>60%自动标注,在自动标注模式结束后,能通过可视化文本标注平台,对模型标注结果进行及时的检查、勘误,最终完成电子病历的标注。
附图说明
66.图1为本发明的创建标注任务界面图;
67.图2为本发明的选择项目数据来源界面图;
68.图3为本发明的实体标签新增操作界面图;
69.图4为本发明的关系标签新增操作界面图;
70.图5为本发明的单个标注模式选择界面图;
71.图6为本发明的批量标注模式选择界面图;
72.图7为本发明的关系标签标注界面图;
73.图8为本发明的标注进度展示界面图;
74.图9为本发明的标注数据导出界面图。
具体实施方式
75.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
76.实施例1:
77.如图1-9所示,本发明实施例提供一种医疗电子病历的装置、系统及存储介质,包括项目标注界面,所述项目标注界面包括两大块,标签界面和文本标注界面,而对于病历文
本的标注,有以下两个主要任务,标注实体标签和标注关系标签,其中,人工手动标注,针对实体标签,可以通过批量和单个两种标注模式标注,针对关系标签,可以根据预定义的关系标签模板,自动匹配上经有向关系线连接的两个实体对之间的关系标签,并可以实时显示标注进度以及导出标注结果。
78.一种医疗电子病历的标注方法,标注方法的流程包括以下过程:
79.s1.创建标注项目
80.在标注前,需要先创建标注任务,具体包括定义当前标注项目的项目名称、选择项目数据来源、选择项目数据路径;
81.(1)定义项目名称
82.在标注平台左侧项目列表上方点击“创建”,在“新增项目”界面中“项目名称”的文本框中,输入名称,完成项目名称定义。
83.(2)选择项目数据来源
84.开始标注之前,需要导入待标注的数据。标注项目的数据来源,可以是导入非结构化的原始未标注病历文本,也可以是病历标注模型自动标注了一部分的病历文本。病历标注模型,会识别标注出所述待标注文本中各字段对应的实体标签、实体之间的关系标签;其中,所述病历标注模型为根据前期适量的人工标注样本训练调优得到的。
85.(3)选择项目数据路径
86.选择标注项目待导入的病历文本所在的文件夹路径,在该标注项目确定创建后,即可导入到标注工具里,在项目标注界面,以每页一条病历文本的形式进行展示以待后续标注。
87.s2.创建标签模板或选择已有标签模板
88.在进入项目标注界面,开始对病历文本标注之前,需要选定用于标注的标签模板。可以通过以下两种方式,选择已创建好的标签模板,或者根据项目标注需求,创建新的标签模板;
89.(1)创建新的标签模板
90.在开始标注之前,需要根据该病历文本类型以及该文本所涉及到病种,结合对应的领域诊疗指南及病历文本书写规范,指定病历文本中值得标注的医学实体和医学关系,从而确定病历文本的标签模板,具体包括:
91.①
新增实体标签
92.点击按钮进入模板管理,创建模板;在定义好模板名称后,在实体列表界面,根据标签模板的定义需求,新增实体标签,并且确定好每一个标签的名称和颜色,由此完成一个实体标签的新增;
93.②
新增关系标签
94.点击按钮进入模板管理,创建模板;在定义好模板名称后,在关系列表界面,根据标签模板的定义需求,新增关系标签,并且确定好当前关系标签对应的头实体标签与尾实体标签,由此完成一个关系标签的新增。
95.当按照标签模板的定义需求,新增完所有的实体标签和对应的关系标签;由此完成当前标签模板的创建。
96.(2)选择已有标签模板
97.如果新创建的标注项目,与之前已创建的标注项目,是同一标注任务,模板可共用,则在进入项目标注界面,开始对病历文本标注之前,直接选定已有的标签模板,由此开始后续的标注工作。
98.s3.标注病历文本
99.在项目标注界面,可以看到整个界面的两大块:标签界面、文本标注界面。而对于病历文本的标注,有以下两个主要任务:标注实体标签,标注关系标签。
100.(1)标注实体标签
101.①
标注方法
102.总体而言,在文本标注界面,通过拖拽光标选中一段文本内容片段,即字段,通过下面任意一种标注模式,选择与字段对应的实体标签;标注后,会对所标注字段,按照当前标签模板下该实体标签所预定义的渲染效果,进行字体背景渲染着色;并在其上方,显示对应的实体标签名称。由此,则完成一段字段的实体标签标注;
103.②
标注模式
104.a.单个标注:当选定了标注模式为“单个标注”,用于集合实体标签列表的标签界面,会在选中一段字段之后才会弹出显示,供用户进行选择;
105.当用户在标签界面的实体标签列表中选择了一个实体标签后,则标签模块会消失,则对待标注字段标注上了对应的实体标签。
106.b.批量标注:当选定了标注模式为“批量标注”,用于集合实体标签列表的标签界面,会一直在项目标注界面的右侧显示;
107.当用户在标签界面的实体标签列表中选择了一个实体标签后,可以连续多次地对之后选中的不同字段,标注同一个实体标签,直到选择另一个实体标签。
108.(2)标注关系标签
109.①
标注方法
110.在文本标注界面,通过点击一个已标实体标签的字段a的标签a,长按并拖拽一条有向连线,点击另一个已标实体标签的字段b的标签b;
111.如果当前标注项目的标签模板下,不存在预定义好的实体标签a指向实体标签b的关系标签c,则关系连线失败,字段a到字段b之间的关系有向连线消失;
112.如果当前标注项目的标签模板下,存在预定义好的实体标签a指向实体标签b的关系标签c,则关系有向连线成功连接,并在该有向连线的线体居中上方,显示关系标签c的名称;
113.由此,完成了字段a到字段b的关系标签标注。
114.s4.标注项目管理
115.(1)进度查看
116.通过统计,可以查看到当前标注项目下,待标注文本中的已完成标注的数据数量,通过“已完成标注文本的数量/当前项目总文本数量”实时展示当前项目的标注进度;
117.(2)标注检查
118.完成标注后,对该标注项目下所有的标注结果进行人工检查勘误,无误则完成本标注项目任务。
119.若果有误则进行修改,对于实体标签标注错位的字段,要求如下:
120.1)如果有关系标签,需要先删除其关系标签;
121.2)如果没有关系标签,可以通过以下两种方式进行实体标签的更改:
122.a.删除该实体标签,再重新按标注方法,对该字段标注正确的实体标签;
123.b.右键单击该实体标签,在之后弹出的全局显示的标签界面,选择正确的实体标签,确认后完成实体标签的更改。
124.(3)数据导出
125.在完成标注检查后,可以通过,点击当前标注项目的标注页面下方的“全部导出”按钮,导出本标注项目的标注数据,供后续模型训练学习。
126.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献