一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于抑郁症诊疗标准实现访谈文本自动标注处理的方法、系统、装置、处理器及存储介质与流程

2022-06-01 17:02:49 来源:中国专利 TAG:


1.本发明涉及人工智能领域,尤其涉及自然语言处理领域,具体是指一种基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法、系统、装置、处理器及其计算机可读存储介质。


背景技术:

2.随着社会的快速发展,心理知识的普及,抑郁症作为一种常见的心理疾病被广泛关注。针对目前传统的抑郁症诊断受主观因素影响较大,严重依赖医生水平的状况,很多研究人员开始用机器学习、深度学习等方法,研究抑郁症与语言访谈与表达方式等因素之间的关系。抑郁症作为一种疾病,所表现出的语言症状是多样化的,而且语言症状之间可能存在一定关联,仅凭借单一的经验诊断症状icd-10进行诊断很难满足诊断的高精度要求。所以本专利认为可模拟医生诊断过程,从多个语言角度综合分析患者情况,以提高诊断的准确率,辅助或验证医生诊断。
3.知识图谱作为一种网络化的知识库,可以有效的提取领域知识及知识之间的关系,目前主要的应用领域有智能搜索、智能推荐、智能问答等,将知识图谱应用到精神卫生医疗领域也是目前研究热点。基于现有的数据构建和抑郁症诊断的人工历史标注,所以可以利用知识图谱构建抑郁症智能化诊断,通过构建知识图谱,有效整合抑郁症诊断中关注的各种信息,有效模拟医生诊断过程,从多个角度为患者做出较为准确、全面的评估。在智能化诊断方案推广中,通常都依靠系统方便患者和医生的使用,本专利将利用知识图谱的知识设计一个抑郁症智能诊断标注系统。本专利首先根据icd-10量表和专家意见构建抑郁症诊断的实体及属性,然后实现了标注系统的总体设计和操作流程。


技术实现要素:

4.本发明的目的是克服了上述现有技术的缺点,提供了一种满足准确性高、操作简便、适用范围较为广泛的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法、系统、装置、处理器及其计算机可读存储介质。
5.为了实现上述目的,本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法、系统、装置、处理器及其计算机可读存储介质如下:
6.该基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法,其主要特点是,所述的方法包括以下步骤:
7.(1)对访谈文本进行自动标注处理,通过颜色标识切分和词性,并在文本的对应位置标注实体的标签;
8.(2)在词性待选列表中选择标注标签;
9.(3)判断自动标注处理时对文本的切分及标注是否有误,如果是,则继续步骤(4);否则,退出步骤;
10.(4)进行手动标注;
11.(5)保存自动标注处理的文本内容。
12.较佳地,所述的步骤(1)具体包括以下步骤:
13.(1.1)对访谈文本进行词语切分和词性标注;
14.(1.2)进行文本特征分析;
15.(1.3)在字符的上方对应位置标注实体的标签;
16.(1.3)自动识别疾病词汇标签,通过颜色标注词汇。
17.较佳地,所述的步骤(4)具体包括以下步骤:
18.(4.1)进行事件标注,选择事件类型和子类型,加载事件的模板;
19.(4.2)选择对应的事件元素,选择对应的实体或者删除已选择的实体。
20.较佳地,所述的步骤(3)具体为:
21.判断词性待选列表是否没有正确的标注标签,或自动标注处理时的切分有误,或实体的标注有误,如果是,则继续步骤(4);否则,退出步骤。
22.较佳地,所述的方法还包括以下步骤:
23.对标注内容进行数据分析,并生成标注对比报告。
24.该实现上述方法的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的系统,其主要特点是,所述的系统包括:
25.原文展示模块,用于显示医患访谈的文本内容;
26.自动标注处理模块,与所述的原文展示模块相连接,用于对访谈文本进行自动实体识别,并进行自动标注;
27.手动标注模块,与所述的原文展示模块和自动标注处理模块相连接,用于对自动标注后的标注内容进行修改完善。
28.较佳地,所述的自动标注处理模块包括:
29.切分及标注单元,与所述的原文展示模块相连接,用于对访谈文本进行词语切分和词性标注;
30.颜色标注单元,与所述的原文展示模块相连接,用于通过颜色标注切分及词性识别后的词汇;
31.标签标注单元,与所述的原文展示模块相连接,用于在字符的上方的对应位置标注实体的标签。
32.较佳地,所述的手动标注模块包括:
33.事件标注单元,与所述的原文展示模块和自动标注处理模块相连接,用于选择事件标注的内容模板,并根据模板对文本进行标注;
34.标签修改单元,与所述的原文展示模块和自动标注处理模块相连接,用于编辑或删除标注内容。
35.较佳地,所述的手动标注模块包括数据分析单元,与所述的原文展示模块相连接,用于对标注内容进行数据分析,并生成标注对比报告。
36.该用于实现基于抑郁症诊疗标准信息的访谈文本自动标注处理的装置,其主要特点是,所述的装置包括:
37.处理器,被配置成执行计算机可执行指令;
38.存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
39.该用于实现基于抑郁症诊疗标准信息的访谈文本自动标注处理的处理器,其主要特点是,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
40.该计算机可读存储介质,其主要特点是,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
41.采用了本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法、系统、装置、处理器及其计算机可读存储介质,访谈文本经过自动标注系统后,会自动处理访谈文本的icd-10标签的汇总功能,诊断标签中可以自动赋值。本发明融合手工标注和自动标注,操作简单,能够实现文本预标注和数据分析等多种功能。利用该平台,进行了抑郁症领域医学知识图谱中实体和关系标注。
附图说明
42.图1为本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的自动及手动标注流程图。
43.图2为本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的系统的界面显示的示意图。
44.图3为本发明的用于实现基于抑郁症诊疗标准信息的访谈文本自动标注处理的装置的内部结构示意图。
45.图4为本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的系统的实施例的标注示意图。
具体实施方式
46.为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。
47.本发明的该基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法,其中包括以下步骤:
48.(1)对访谈文本进行自动标注处理,通过颜色标识切分和词性,并在文本的对应位置标注实体的标签;
49.(2)在词性待选列表中选择标注标签;
50.(3)判断自动标注处理时对文本的切分及标注是否有误,如果是,则继续步骤(4);否则,退出步骤;
51.(4)进行手动标注;
52.(5)保存自动标注处理的文本内容。
53.作为本发明的优选实施方式,所述的步骤(1)具体包括以下步骤:
54.(1.1)对访谈文本进行词语切分和词性标注;
55.(1.2)进行文本特征分析;
56.(1.3)在字符的上方对应位置标注实体的标签;
57.(1.3)自动识别疾病词汇标签,通过颜色标注词汇。
58.作为本发明的优选实施方式,所述的步骤(4)具体包括以下步骤:
59.(4.1)进行事件标注,选择事件类型和子类型,加载事件的模板;
60.(4.2)选择对应的事件元素,选择对应的实体或者删除已选择的实体。
61.作为本发明的优选实施方式,所述的步骤(3)具体为:
62.判断词性待选列表是否没有正确的标注标签,或自动标注处理时的切分有误,或实体的标注有误,如果是,则继续步骤(4);否则,退出步骤。
63.作为本发明的优选实施方式,所述的方法还包括以下步骤:
64.对标注内容进行数据分析,并生成标注对比报告。
65.该实现上述方法的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的系统,其主要特点是,所述的系统包括:
66.原文展示模块,用于显示医患访谈的文本内容;
67.自动标注处理模块,与所述的原文展示模块相连接,用于对访谈文本进行自动实体识别,并进行自动标注;
68.手动标注模块,与所述的原文展示模块和自动标注处理模块相连接,用于对自动标注后的标注内容进行修改完善。
69.作为本发明的优选实施方式,所述的自动标注处理模块包括:
70.切分及标注单元,与所述的原文展示模块相连接,用于对访谈文本进行词语切分和词性标注;
71.颜色标注单元,与所述的原文展示模块相连接,用于通过颜色标注切分及词性识别后的词汇;
72.标签标注单元,与所述的原文展示模块相连接,用于在字符的上方的对应位置标注实体的标签。
73.作为本发明的优选实施方式,所述的手动标注模块包括:
74.事件标注单元,与所述的原文展示模块和自动标注处理模块相连接,用于选择事件标注的内容模板,并根据模板对文本进行标注;
75.标签修改单元,与所述的原文展示模块和自动标注处理模块相连接,用于编辑或删除标注内容。
76.作为本发明的优选实施方式,所述的手动标注模块包括数据分析单元,与所述的原文展示模块相连接,用于对标注内容进行数据分析,并生成标注对比报告。
77.本发明的该用于实现基于抑郁症诊疗标准信息的访谈文本自动标注处理的装置,其中所述的装置包括:
78.处理器,被配置成执行计算机可执行指令;
79.存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
80.本发明的该用于实现基于抑郁症诊疗标准信息的访谈文本自动标注处理的处理器,其中所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
81.本发明的该计算机可读存储介质,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现上述的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法的各个步骤。
82.本发明的具体实施方式中,提供一种支持精神卫生领域的自动标注模型,易于支持创新研究。抑郁智能诊断与病例生成系统中自动处理标注icd-10标签体系,针对访谈结果进行结构化分析。用户可以通过web可视化界面,对文字记录进行自动贴标,且对形成的标签进行编辑。
83.自动标注模块主要包含患者列表和标注详情页。其中患者列表页用于展示患者信息,方便医生选择患者。为了能够快速选择患者,在界面中添加了按照组织名、姓名、电话号码等信息进行查询。为了能够方便查看未标注和已标注的患者信息,将页面划分为左右两部分,左边为需要标注的人员列表,右边为已标注可查看报告的人员列表,其中医生对已标注的人员可以重新标注。
84.标注页面可以分为三部分,第一部分是个人信息和结果展示区,医生可以对检测的结果进行修改;第二部分是标注区,该部分会显示算法计算属性值的结果,医生通过观看自动标注的状态,提出手工编辑以及验证。
85.标注页面主要标注的内容是抑郁症icd-10诊断实体的属性值,实体属性值的计算囊括了众多算法,其中包括本专利研究的基本手工标注数据以及词典识别算法。医疗访谈中的患者描述文本数据是半结构或非结构化数据,难以对其直接进行应用。对抑郁症访谈的文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。在使用自动标注算法之前,必须引入大数据进行关系的训练,使用传统的人工标注方法费力费时,而且没有历史病历记录,已难以适应大数据发展的需求。本发明以构建中文抑郁症医学术语的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合手工标注和自动标注,操作简单,能够实现文本预标注和数据分析等多种功能。利用该平台,进行了抑郁症领域医学知识图谱中实体和关系标注。由于本专利的算法通过python脚本编程实现,故可利用node.js的child process模块在服务器部署和运行python脚本,进行属性值的计算。为了加速抑郁症知识图谱的建立,本专利在完善所有算法的情况下,先将该系统投入使用。医生在标注时,可以对未接入算法的属性值进行标注,对已接入算法的属性值进行修正。经过医生标注和修改后的数据,可以用于模型的训练和进一步优化。基于上次两次操作,实体及属性构建的抑郁症诊断标注系统的属性值的计算算法都可用时便可实现自动标注。
86.本发明的操作步骤如下:
87.步骤1:进入可视化操作界面,维护实体icd指标、实体及关系以及属性的标注,操作简单;
88.步骤2:打开访谈文本,手工选择关键进行匹配实体,内置多种自动识别及抽取算法,辅助进行标注;
89.步骤3:可以点击标注页面,浏览数据分析功能,同时支持生成标注对比报告;
90.步骤4:标注完毕后进入指标管理,浏览标注过程可汇总所有关键词,方便审核关键词保证标注质量;
91.步骤5:新的疾病可以新建指标体系,具备良好的可定制性,不仅适用于抑郁症医疗文本,更支持多种其他疾病的类似操作;所有系统都是基于.net的web框架开发,配置简单,可移植性强。
92.在本发明的实施例的操作过程中,在自动icd-10标签的标注页面,点击“标注”,页面分为三个区域:原文展示区、标注操作区(词性分析)、icd-10标签展示区,如图2所示。
93.自动标注都聚焦在标注操作区,在这里可以看到,预标注模型已经将切分和词性自动标注的区域染色显示,实体的标签也在字符的上层对应位置标注出来。在自动标注处理状态下,染色区域标识的是切分和词性标注有历史记录的词,与历史icd-10标签词性标注(标准版)的功能相同,点击相应的区域就可以在弹出的词性选择弹框的下拉列表中选择可能存在的标注标签。如果待选标签都不是正确的标注标签,或者模型预处理的切分有误时,再或者是实体的标注有误时,就需要点击右侧的“编辑模式”,进入处理问题页面做进一步的处理。当处理完毕切标和实体标注等任务后,可以选择事件标注选项框,进行事件标注功能(包含“病程”,“排除标准”,“严重程度”),事件标注的内容模板分12大类2个级别,与icd-10的定义相同。选择完事件类型和子类型后,事件的模板自动加载。点击对应的事件元素和角色框激活相应的元素,然后可以在左侧的操作区选择对应的实体,或者删除已选择的实体。在事件的元素选择完毕后可以点击“保存”来完成本轮的自动标注功能。
94.本实施例的具体实现方案可以参见上述实施例中的相关说明,此处不再赘述。
95.可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
96.需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
97.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
98.应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
99.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
100.此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
101.上述提到的存储介质可以是只读存储器,磁盘或光盘等。
102.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
103.采用了本发明的基于抑郁症诊疗标准信息实现访谈文本自动标注处理的方法、系统、装置、处理器及其计算机可读存储介质,访谈文本经过自动标注系统后,会自动处理访谈文本的icd-10标签的汇总功能,诊断标签中可以自动赋值。本发明融合手工标注和自动标注,操作简单,能够实现文本预标注和数据分析等多种功能。利用该平台,进行了抑郁症领域医学知识图谱中实体和关系标注。
104.在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献