一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

医学文本检测方法、模型的训练方法及相关装置与流程

2022-04-25 03:13:27 来源:中国专利 TAG:


1.本技术涉及智能医疗技术领域,特别是涉及一种医学文本检测方法、模型的训练方法及相关装置。


背景技术:

2.近年来,随着医院信息系统的逐渐完善,越来越多的电子病历数据被搜集存储,挖掘蕴藏在海量医学文本数据中的医学知识并加以整合利用,将能有效提升医疗服务质量和医疗服务效率。
3.目前,随着计算机技术的发展,计算机辅助挖掘医疗文本数据中的医学知识成为当前研究的热点。现有的人工智能方法严重依赖于人工标注数据,针对不同的“实体和关系”需求,需要标注大量的病历数据才能够让模型充分学习。但是,当新的需求到来时,由于标注体系的不兼容,研究者只能重新构建新的标注体系,并标注大量的数据,会造成严重的数据资源和人力资源的浪费。


技术实现要素:

4.本技术主要解决的技术问题是提供一种医学文本检测方法、模型的训练方法及相关装置,能够同时解决医学文本中的实体嵌套问题和实体关系重叠问题。
5.为了解决上述技术问题,本技术第一方面提供了一种医学文本检测方法,包括:获取待测医学文本;其中,待测医学文本包含预设数值个字符;提取待测医学文本中各个字符的语义表示;基于各个字符的语义表示,预测得到若干分值矩阵;其中,每个分值矩阵的长度和宽度均为预设数值,若干分值矩阵包括分别与若干种医学实体类别相关的第一分值矩阵和分别与若干种医学关系类别相关的第二分值矩阵,且第一分值矩阵中第一位置处第一元素值表示第一位置的第一相关字符组成的词语属于医学实体类别的可能性,第二分值矩阵中第二位置处第二元素值表示第二位置的第二相关字符形成的关系属于医学关系类别的可能性,第一相关字符、第二相关字符均属于待测医学文本;基于若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系。
6.为了解决上述技术问题,本技术第二方面提供了一种医学文本检测模型的训练方法,包括:获取样本医学文本;其中,样本医学文本包含预设数值个样本字符,且样本医学文本标注有样本医学实体及其所属的医学实体类别,以及样本医学关系及其所属的医学关系类别;基于样本医学实体及其所属的医学实体类别,编码得到分别与若干种医学实体类别相关的第一样本分值矩阵,并基于样本医学关系及其所属的医学关系类别,编码得到分别与若干种医学关系类别相关的第二样本分值矩阵;其中,每个样本分值矩阵的长度和宽度均为预设数值,第一样本分值矩阵中第一矩阵位置处第一样本元素值表示第一矩阵位置的第一样本相关字符组成的词语是否属于医学实体类别,第二样本分值矩阵中第二矩阵位置处第二样本元素值表示第二矩阵位置的第二样本相关字符形成的关系是否属于医学关系类别,第一样本相关字符、第二样本相关字符均属于样本医学文本;利用医学文本检测模型
对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵;其中,每个预测分值矩阵的长度和宽度均为预设数值,第一预测分值矩阵中第一矩阵位置处第一预测元素值表示第一矩阵位置的第一样本相关字符组成的词语属于医学实体类别的可能性,第二预测分值矩阵中第二矩阵位置处第二预测元素值表示第二矩阵位置的第二样本相关字符形成的关系属于医学关系类别的可能性;基于样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数。
7.为了解决上述技术问题,本技术第三方面提供了一种医学文本检测装置,包括:文本获取模块,用于获取待测医学文本;其中,待测医学文本包含预设数值个字符;语义提取模块,用于提取待测医学文本中各个字符的语义表示;分值预测模块,用于基于各个字符的语义表示,预测得到若干分值矩阵;其中,每个分值矩阵的长度和宽度均为预设数值,若干分值矩阵包括分别与若干种医学实体类别相关的第一分值矩阵和分别与若干种医学关系类别相关的第二分值矩阵,且第一分值矩阵中第一位置处第一元素值表示第一位置的第一相关字符组成的词语属于医学实体类别的可能性,第二分值矩阵中第二位置处第二元素值表示第二位置的第二相关字符形成的关系属于医学关系类别的可能性,第一相关字符、第二相关字符均属于待测医学文本;矩阵解码模块,用于基于若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系。
8.为了解决上述技术问题,本技术第四方面提供了一种医学文本检测模型的训练装置,包括:样本获取模块,用于获取样本医学文本;其中,样本医学文本包含预设数值个样本字符,且样本医学文本标注有样本医学实体及其所属的医学实体类别,以及样本医学关系及其所属的医学关系类别;矩阵编码模块,用于基于样本医学实体及其所属的医学实体类别,编码得到分别与若干种医学实体类别相关的第一样本分值矩阵,并基于样本医学关系及其所属的医学关系类别,编码得到分别与若干种医学关系类别相关的第二样本分值矩阵;其中,每个样本分值矩阵的长度和宽度均为预设数值,第一样本分值矩阵中第一矩阵位置处第一样本元素值表示第一矩阵位置的第一样本相关字符组成的词语是否属于医学实体类别,第二样本分值矩阵中第二矩阵位置处第二样本元素值表示第二矩阵位置的第二样本相关字符形成的关系是否属于医学关系类别,第一样本相关字符、第二样本相关字符均属于样本医学文本;模型检测模块,用于利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵;其中,每个预测分值矩阵的长度和宽度均为预设数值,第一预测分值矩阵中第一矩阵位置处第一预测元素值表示第一矩阵位置的第一样本相关字符组成的词语属于医学实体类别的可能性,第二预测分值矩阵中第二矩阵位置处第二预测元素值表示第二矩阵位置的第二样本相关字符形成的关系属于医学关系类别的可能性;参数调整模块,用于基于样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数。
9.为了解决上述技术问题,本技术第五方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的医学文本检测方法或上述第二方面中的医学文本检测模型的训练方法。
10.为了解决上述技术问题,本技术第六方面提供了一种计算机可读存储介质,存储
有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的医学文本检测方法或上述第二方面中的医学文本检测模型的训练方法。
11.上述方案,通过提取待测医学文本中各个字符的语义表示,并基于各个字符的语义表示,能够预测得到与若干种医学实体类别相关的第一分值矩阵以及与若干种医学关系类别相关的第二分值矩阵,故与不同医学实体类别相关的第一分值矩阵不同,与不同医学关系类别相关的第二分值矩阵不同,使得后续基于若干分值矩阵进行解码时,同时解决了实体嵌套问题和实体关系重叠问题。
附图说明
12.图1是本技术提供的医学文本检测方法一实施例的流程示意图;
13.图2是本技术提供的bert预训练架构一实施例的结构示意图;
14.图3是本技术提供的第一分值矩阵一实施例的示意图;
15.图4是本技术提供的第二分值矩阵一实施例的示意图;
16.图5是图1所示步骤s13一实施例的流程示意图;
17.图6是本技术提供的医学文本检测模型一实施例的结构示意图;
18.图7是图1所示步骤s14一实施例的流程示意图;
19.图8是图7所示步骤s141一实施例的流程示意图;
20.图9是图7所示步骤s142一实施例的流程示意图;
21.图10是图7所示步骤s143一实施例的流程示意图;
22.图11是本技术提供的医学文本检测模型的训练方法一实施例的流程示意图;
23.图12本技术提供的利用若干种标注体系的样本医学文本对医学文本检测模型进行训练一实施例的流程示意图;
24.图13是图12所示步骤s1202一实施例的流程示意图;
25.图14是本技术提供的异构标注体系整合流程一实施例的示意图;
26.图15是图11所示步骤s1104一实施例的流程示意图;
27.图16是本技术提供的根据对比损失函数得到第一当前位置对应的子损失一实施例的流程示意图;
28.图17是本技术提供的确定医学文本检测模型的损失一实施例的流程示意图;
29.图18是本技术提供的医学文本检测装置一实施例的框架示意图;
30.图19是本技术提供的医学文本检测模型的训练装置一实施例的框架示意图;
31.图20是本技术提供的电子设备一实施例的框架示意图;
32.图21是本技术提供的计算机可读存储介质一实施例的框架示意图。
具体实施方式
33.下面结合说明书附图,对本技术实施例的方案进行详细说明。
34.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本技术。
35.本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独
存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
36.请参阅图1,图1是本技术提供的医学文本检测方法一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。
37.如图1所示,本实施例包括:
38.步骤s11:获取待测医学文本。
39.本实施例的方法用于对待测医学文本进行解码而得到待测医学文本中的目标医学实体和目标医学关系。本文所述的待测医学文本可以但不限于病案首页、病程记录、检查检验及结果、医嘱记录、手术记录或者护理记录等,在此不做具体限定。
40.在一实施方式中,待测医学文本可以为任意需要被解码得到目标医学实体和目标医学关系的医学文本,具体可以从本地存储或云端存储中获取得到。可以理解地,在其他实施方式中,也可通过图像采集设备对当前医学文本进行图像采集得到。
41.步骤s12:提取待测医学文本中各个字符的语义表示。
42.本实施方式中,提取待测医学文本中各个字符的语义表示。在一实施方式中,可利用多层transformer模型提取待测医学文本中各个字符的语义表示。
43.可以理解地,在其他实施方式中,也可利用医学文本数据上预训练bert模型中的多层transformer架构提取待测医学文本中各个字符的语义表示,以使提取出的各个字符的语义表示不仅携带了开放域中丰富的句法、词性、语义等信息,还携带了医学文本数据的语言特点信息。
44.其中,通过将多层transformer模型堆叠,并在bert(bidirectional encoder representations from transformers)的预训练架构上进行自监督训练,会使用大量文本数据在bert的预训练架构上训练,从而将文本中携带的各类信息(例如,句法、词性、依存、语义等信息)整合到该模型参数中;然后将医学文本数据均作为预训练数据训练上述训练完成的模型中的transformer模块,从而得到医学文本数据上预训练bert模型,该医学文本数据上预训练bert模型的模型参数不仅携带了开放域中丰富的句法、词性、语义等信息,同时通过医学文本数据领域的预训练,使得模型参数更好地携带了医学文本数据的语言特点信息。
45.具体地,如图2所示,图2是本技术提供的bert预训练架构一实施例的结构示意图,bert预训练模型主体和任务设计沿用bert预训练架构,bert预训练架构包括输入模块、上下文编码模块和自监督任务模块。将获取到的医学文本数据(例如,病案首页、病程记录、检查检验及结果、医嘱记录、手术记录或者护理记录等)构建成bert预训练模型的输入;一条医学文本数据由两个子句构成,两个子句的组成有两种不同的形式,一半的样例中两个子句在自然语言中表现为上下句,而另一半的样例中下句通过随机采用得到,并且两个子句之间以【sep】连接,这种上下句配对策略构成了图2中的“预测下一个句子”的任务;另外,除了上下句设置外,一条医学文本数据还会对15%的字做遮蔽处理,被遮蔽的字以【mask】标识,以构成“[mask]预测”的任务,该任务要求模型能够预测出被mask的句子所属的具体单词。整个预训练过程在“预测下一个句子”任务和“[mask]预测”任务的引导下做自监督训练;训练中两个子任务均采用交叉熵作为损失函数调节bert预训练模型的网络参数,直至预训练模型收敛,得到医学文本数据上预训练bert模型。
[0046]
其中,bert预训练架构的主体部分由上下文编码模块构成,该模块包含12层transformer架构。
[0047]
步骤s13:基于各个字符的语义表示,预测得到若干分值矩阵。
[0048]
由于医学文本数据是一种风格特异的数据类型,在医学文本数据中,实体标签通常呈嵌套现象,例如,对于“尺神松解术”来说,该实体属于“手术”类型,但“尺神经”属于“部位”,而“松解术”属于“术式”,所以手术与部位以及手术与术式发生了实体位置上的嵌套;另外,在医学文本数据中,还会存在实体关系重叠的问题,通常表现为“头实体重叠”、“尾实体重叠”和“头实体尾实体均重叠”,例如,对于“头疼三天,来我院行ct检查”来说,“头-疼”构成了“部位-症状”关系,“头-检查”构成了“部位-检查方式”关系,这样头实体就发生了重叠。
[0049]
因此,本实施方式中,根据各个字符的语义表示,能够预测得到若干分值矩阵。其中,每个分值矩阵的长度和宽度均为预设数值,若干分值矩阵包括分别与若干种医学实体类别相关的第一分值矩阵和分别与若干种医学关系类别相关的第二分值矩阵。也就是说,根据各个字符的语义表示,能够预测得到与若干种医学实体类别相关的第一分值矩阵以及与若干种医学关系类别相关的第二分值矩阵,使得后续基于若干分值矩阵进行解码时,能够得到待测医学文本中的目标医学实体和目标医学关系,从而同时解决了实体嵌套问题和实体关系重叠问题。
[0050]
可选地,不对预设数值的大小以及若干分值矩阵、若干分值矩阵中第一分值矩阵和第二分值矩阵的数量进行限定,可根据实际使用需要具体设置。例如,若干分值矩阵为h个,与若干种医学实体类别相关的第一分值矩阵为e个,与若干种医学关系类别相关的第二分值矩阵为r个;每个分值矩阵的长度和宽度均为n;所以,根据各个字符的语义表示,能够预测得到h个n*n的分值矩阵。
[0051]
其中,第一分值矩阵中第一位置处第一元素值表示第一位置的第一相关字符组成的词语属于医学实体类别的可能性,第一相关字符属于待测医学文本。也就是说,第一分值矩阵中每一个单元格定义为整个序列中某两个第一相关字符构成医学实体的可能性。其中,不对第一位置在第一分值矩阵中的具体位置以及第一元素值的表现形式进行限定,可根据实际使用需要具体设置。例如,第一元素值为1。
[0052]
在一实施方式中,第一位置位于第一分值矩阵中第i行第j列,第一相关字符为待测医学文本中第i个字符和第j个字符,第一元素值表示待测医学文本中第i个字符和第j个字符先后排列组成的词语属于医学实体类别的可能性。也就是说,位于第一位置处的第一元素值表示待测医学文本中第i个字符和第j个字符先后排列组成的词语属于某一医学实体类别的可能性,即不同类型的实体对应不同的第一分值矩阵,从而使得后续基于分值矩阵进行解码时,能够解决实体嵌套问题。
[0053]
举例来说,如图3所示,图3是本技术提供的第一分值矩阵一实施例的示意图,第一位置位于第一分值矩阵中第9行第2列,第一相关字符为待测医学文本“头疼三天,伴咳嗽”中第9个字符“头”和第2个字符“疼”,第一元素值表示待测医学文本“头疼三天,伴咳嗽”中第9个字符“头”和第2个字符“疼”先后排列组成的词语“头疼”属于医学实体“症状”的可能性。由于第一分值矩阵表示的是属于某一医学实体类别的可能性,在图3所示的第一分值矩阵中,还包括一个属于医学实体“症状”的词语“咳嗽”,所以在图3中第一位置还位于第一分
值矩阵中第7行第8列,对应的第一相关字符为待测医学文本“头疼三天,伴咳嗽”中第7个字符“咳”和第8个字符“嗽”先后排列组成的词语“咳嗽”属于医学实体“症状”的可能性。
[0054]
具体地,以待测医学文本“头疼三天,伴咳嗽”为例,待测医学文本包括两个症状实体“头疼”和“咳嗽”、一个部位实体“头”以及持续时间实体“三天”。首先,将待测医学文本按照字和标点符号切分,从而获得“头#疼#三#天#,#伴#咳#嗽#。”,其中,“#”表示分隔符,说明此处应当被分割,分割后句子的长度记作n,由于待测医学文本的长度为9,所以此时n为9;分割后,针对各类型的医学实体分别构建一个n*n的矩阵,即构建一个9*9的矩阵;例如,以“症状”医学实体为例构建矩阵,由于“头”和“疼”能够构成一个症状实体,所以会在矩阵纵轴“头”与横轴“疼”交界的位置标注为第一元素值即1,表明序列中这两个汉字能够构成一个症状实体,同样地,由于“咳”和“嗽”能够构成一个症状实体,所以会在矩阵纵轴“咳”与横轴“嗽”交界的位置标注为第一元素值即1,从而构建得到“症状”实体对应的第一分值矩阵。其中,需要说明的是,本实施方式中,在标注第一元素值时,是以矩阵的纵轴为医学实体的开始,以横轴为医学实体的结束,所以在后续基于其他医学实体类型构建矩阵并进行标注时,均以矩阵的纵轴为医学实体的开始,以横轴为医学实体的结束,因此,如图3所示,标注的第一元素值始终保留在第一分值矩阵的上三角,下三角被“*”遮蔽掉。
[0055]
在其他实施方式中,第一位置位于第一分值矩阵中第j行第i列,第一相关字符为待测医学文本中第j个字符和第i个字符,第一元素值表示待测医学文本中第i个字符和第j个字符先后排列组成的词语属于医学实体类别的可能性。也就是说,在标注第一元素值时,也可是以矩阵的横轴为医学实体的开始,以纵轴为医学实体的结束,在此不做具体限定。
[0056]
本实施方式中,第二分值矩阵中第二位置处第二元素值表示第二位置的第二相关字符形成的关系属于医学关系类别的可能性,第二相关字符均属于待测医学文本。也就是说,第二分值矩阵中每一个单元格定义为整个序列中某两个第二相关字符构成医学关系类别的可能性。其中,不对第二位置在第二分值矩阵中的具体位置以及第二元素值的表现形式进行限定,可根据实际使用需要具体设置。例如,第二元素值为1。
[0057]
在一实施方式中,第二位置位于第二分值矩阵中第m行第n列,第二相关字符包括待测医学文本中第m个字符和第n个字符,第二元素值表示待测医学文本中第m个字符和第n个字符分属不同实体所形成的关系属于医学关系类别的可能性。也就是说,不同实体的关系类型对应不同的第二分值矩阵,从而使得后续基于分值矩阵进行解码时,能够避免实体关系重叠问题。
[0058]
举例来说,如图4所示,图4是本技术提供的第二分值矩阵一实施例的示意图,以待测医学文本“头疼三天,伴咳嗽”为例,症状实体“头疼”和持续时间实体“三天”存在关系。首先,将待测医学文本按照字和标点符号切分,从而获得“头#疼#三#天#,#伴#咳#嗽#。”,其中,“#”表示分隔符,说明此处应当被分割,分割后句子的长度记作n,由于待测医学文本的长度为9,所以此时n为9;分割后,针对各医学实体关系类型分别构建一个n*n的矩阵,即构建一个9*9的矩阵;例如,症状实体“头疼”和持续时间实体“三天”存在关系为例构建矩阵,由于“头疼”和“三天”存在关系,所以将纵轴“头疼”和横轴“三天”的交界处全部标注第二元素值即1,从而得到第二分值矩阵,第二分值矩阵中会出现一个2*2的单位矩阵,用以表示两个医学实体之间的关系。其中,需要说明的是,本实施方式中,在标注第二元素值时,是以矩阵的纵轴为关系的开始,以横轴为关系的结束,所以在后续基于其他医学实体关系类型构
建矩阵并进行标注时,均以矩阵的纵轴为关系的开始,以横轴为关系的结束。因此,如图4所示,第二分值矩阵是一个非对称的结构,并且上三角和下三角都有可能出现数值。
[0059]
在其他实施方式中,第二位置位于第二分值矩阵中第n行第m列,第二相关字符包括待测医学文本中第n个字符和第m个字符,第二元素值表示待测医学文本中第n个字符和第m个字符分属不同医学实体所形成的关系属于医学关系类别的可能性。也就是说,标注第二元素值时,也可以是以矩阵的横轴为关系的开始,以纵轴为关系的结束,所以在后续基于其他实体关系类型构建矩阵并进行标注时,均以矩阵的横轴为关系的开始,以纵轴为关系的结束。
[0060]
步骤s14:基于若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系。
[0061]
本实施方式中,根据若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系。举例来说,如图3和图4所示,包括一个第一分值矩阵和一个第二分值矩阵,解码得到待测医学文本中目标医学实体为“头疼”和“咳嗽”,解码得到待测医学文本中目标医学关系为“头疼-三天”。
[0062]
上述实施方式中,通过提取待测医学文本中各个字符的语义表示,并基于各个字符的语义表示,能够预测得到与若干种医学实体类别相关的第一分值矩阵以及与若干种医学关系类别相关的第二分值矩阵,故与不同医学实体类别相关的第一分值矩阵不同,与不同医学关系类别相关的第二分值矩阵不同,使得后续基于若干分值矩阵进行解码时,同时解决了实体嵌套问题和实体关系重叠问题。
[0063]
请参阅图5,图5是图1所示步骤s13一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图5所示的流程顺序为限。如图5所示,本实施例包括:
[0064]
步骤s131:基于预设数值个字符的语义表示进行空间映射,得到若干特征矩阵。
[0065]
本实施方式中,根据预设数值个字符的语义表示进行空间映射,能够得到若干特征矩阵。其中,每个特征矩阵的长度和宽度分别为预设数值和特征维度,若干特征矩阵包括分别与若干种医学实体类别相关的第一特征矩阵和分别与若干种医学关系类别相关的第二特征矩阵。不对与若干种医学实体类别相关的第一特征矩阵和与若干种医学关系类别相关的第二特征矩阵的数量进行限定,可根据实际使用需要具体设置。
[0066]
在一实施方式中,后续的特征矩阵对应的分值矩阵是由医学文本检测模型检测待测医学文本得到的,医学文本检测模型包括语义提取网络,语义提取网路用于执行语义提取操作,从而提取得到预设数值个字符的语义表示。在一具体实施方式中,如图6所示,图6是本技术提供的医学文本检测模型一实施例的结构示意图,医学文本检测模型包括输入模块和语义提取网络,语义提取网络包含12层transformer架构,所以可将上述医学文本数据上预训练bert模型的多层transformer参数作为语义提取网络的12层transfomer的初始化参数,以使提取出的字符的语义表示不仅携带开放域只能够丰富的句法、词法、语义等信息,同时也携带了医学文本数据的语言特点信息。具体地,输入模块接收待测医学文本,通过按字符分字后作为医学文本检测模型的输入,将输入的序列记作xi={x1,x2,

,xn},其中,n表示输入序列的文本长度。
[0067]
在一实施方式中,如图6所示,医学文本检测模型包括若干空间映射网络,其中,空间映射网络包括若干第一映射网络和若干第二映射网络,不同第一映射网络执行不同医学
实体类别的空间映射,不同第二映射网络执行不同医学关系类别的空间映射。也就是说,若干第一映射网络用于基于预设数值个字符的语义表示进行空间映射,以得到与若干种医学实体类别相关的第一特征矩阵;若干第二映射网络用于基于预设数值个字符的语义表示进行空间映射,以得到与若干种医学关系类别相关的第二特征矩阵。其中,不对空间映射网络、第一映射网络和第二映射网络的数量进行限定,可根据实际使用需要具体设置。
[0068]
在一具体实施方式中,如图6所示,空间映射网络并行连接于语义提取网络之后,空间映射网络基于预设数值个字符的语义表示进行空间映射,得到若干特征矩阵。
[0069]
在一实施方式中,如图6所示,空间映射网络为包含多层网络层的多层感知机,且多层网络层中除最后一层网络层均设有激活函数。其中,不对多层网络层的个数以及多层网络层的层数进行限定,可根据实际使用需要具体设置。例如,多层网络层为2层,2层网络层中的第2层设有激活函数,空间映射网络包括100个2层网络层。其中,多层网络层的个数表示为:
[0070]
h=e r
[0071]
其中,h表示医学实体数量和关系数量之和;e表示为医学实体数量:r表示关系数量。需要说明的是,医学实体数量为医学文本场景中,所有医学实体数量之和,而并非单一句子中医学实体数量之和;关系数量为医学文本场景中,所有关系数量的总和,而并非单一句子中关系数量之和。
[0072]
进一步地,每一个多层网络层都可以将语义提取网络输出的语义表示转换为特征矩阵hi∈rn×d,其中,n表示序列长度,d表示特征维度。
[0073]
步骤s132:对于各个特征矩阵,基于特征矩阵及其转置矩阵,得到特征矩阵对应的分值矩阵。
[0074]
本实施方式中,对于各个特征矩阵,根据特征矩阵及其转置矩阵,得到特征矩阵对应的分值矩阵。分值矩阵的具体公式如下:
[0075]
s=h*h
t
[0076]
其中,s∈r
h*n*n
表示分值矩阵;h∈r
h*n*d
表示特征矩阵;h
t
∈r
h*d*n
表示转置矩阵。其中,e个分值矩阵用于后续解码得到待测医学文本中目标医学实体,r个分值矩阵用于后续解码得到待测医学文本中目标医学关系。
[0077]
请参阅图7,图7是图1所示步骤s14一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图7所示的流程顺序为限。如图7所示,本实施例包括:
[0078]
s141:基于与医学实体类别相关的第一分值矩阵中满足第一条件的第一元素值,解码得到属于医学实体类别的目标医学实体。
[0079]
上述方式中,将待测医学文本输入至医学文本检测模型,会得到h个n*n分值矩阵,由于在编码阶段,前1到e个第一分值矩阵表示为医学实体,后e 1个到r个第二分值矩阵表示是医学实体关系。所以,本技术中先解码得到目标医学实体,然后再解码得到目标医学关系,目标医学关系的解码依赖于目标医学实体。
[0080]
因此,本实施方式中,根据与医学实体类别相关的第一分值矩阵中满足第一条件的第一元素值,解码得到属于医学实体类别的目标医学实体。也就是说,能够通过第一分值矩阵中单元格的第一元素值的大小来判断此单元格能够表示某一类型医学实体,与医学实体类别相关的第一分值矩阵中的第一元素值满足第一条件,则认为此处横轴对应的第一相
关字符作为起始位置和纵轴对应的第一相关字符作为终止位置,能够构成一个完整的目标医学实体。
[0081]
在一实施方式中,第一条件可以是第一元素值大于第一阈值,例如,第一阈值为0,即能够根据与医学实体类别相关的第一分值矩阵中大于0的第一元素值解码得到属于医学实体类别的目标医学实体。另外,由于第一元素值表示第一位置的第一相关字符组成的词语属于医学实体类别的可能性,所以第一元素值越大,第一元素值对应的单元格的横纵轴上的第一相关字符构成目标医学实体的可能越大,反之,第一元素值越小,构成目标医学实体的可能性越小。
[0082]
在一具体实施方式中,如图8所示,图8是图7所示步骤s141一实施例的流程示意图,解码得到属于医学实体类别的目标医学实体具体包括如下子步骤:
[0083]
步骤s81:分别将若干种医学实体类别作为当前实体类别,并将与当前实体类别相关的第一分值矩阵作为第一当前矩阵。
[0084]
本实施方式中,分别将若干种医学实体类别作为当前实体类别,并将与当前实体类别相关的第一分值矩阵作为第一当前矩阵。
[0085]
步骤s82:获取第一当前矩阵中满足第一条件的第一元素值所在的第一目标位置。
[0086]
本实施方式中,获取第一当前矩阵中满足第一条件的第一元素值所在的第一目标位置。其中,不对第一条件进行具体限定,可根据实际使用需要具体设置。
[0087]
举例来说,如图3所示,以第一条件是第一元素值大于0为例,第一当前矩阵中满足第一元素值大于0所在的第一目标位置为第1行第2列和第7行第8列,所以将第1行第2列和第7行第8列对应的位置作为第一目标位置。
[0088]
步骤s83:将第一目标位置的第一相关字符组成的词语,作为属于当前实体类别的目标医学实体。
[0089]
本实施方式中,将第一目标位置的第一相关字符组成的词语,作为属于当前实体类别的目标医学实体。举例来说,如图3所示,第一目标位置为第1行第2列和第7行第8列对应的位置,第一目标位置“第1行第2列”的第一相关字符“头”和“疼”组成的词语“头疼”,以及第一目标位置“第7行第8列”的第一相关字符“咳”和“嗽”组成的词语“咳嗽”,即词语“头疼”和“咳嗽”作为属于当前实体类别的目标医学实体。
[0090]
进一步地,按照上述方式遍历所有的与医学实体类别相关的第一分值矩阵中满足第一条件的第一元素值,从而可以获得目标医学实体集合en={e
hij
},其中,h∈{1,2,...,h},i∈{1,2,...,e},j∈{1,2,...,r}。
[0091]
s142:获取由目标医学实体形成的候选医学关系,并获取候选医学关系所属的医学关系类别作为候选关系类别。
[0092]
本实施方式中,获取由目标医学实体形成的候选医学关系,并选取候选医学关系所属的医学关系类别作为候选关系类别。也就是说,将目标医学实体进行组合以形成候选医学关系,并将候选医学关系所属的医学关系类别作为候选关系类别。
[0093]
在一具体实施方式中,将各个目标医学实体两两排列组合,得到候选医学关系。举例来说,目标医学实体包括“咳嗽”、“头疼”以及“三天”,所以将这三个目标医学实体进行两两排列组合后,得到候选医学关系为:“咳嗽
”‑“
头疼”、“头疼
”‑“
三天”、“头疼
”‑“
咳嗽”、“头疼
”‑“
三天”、“三天
”‑“
咳嗽”和“三天
”‑“
头疼”。
[0094]
在一具体实施方式中,如图9所示,图9是图7所示步骤s142一实施例的流程示意图,候选关系类别的确定具体包括如下子步骤:
[0095]
步骤s91:基于候选医学关系中两个目标医学实体的先后顺序以及分别所属的医学实体类别,得到候选医学关系所属的医学关系类别。
[0096]
本实施方式中,根据候选医学关系中两个目标医学实体的先后顺序以及分别所属的医学实体类别,得到候选医学关系所属的医学关系类别。举例来说,候选医学关系为:“咳嗽
”‑“
三天”和“三天
”‑“
咳嗽”,由于“咳嗽”所属的医学实体类别是症状,“三天”所属的医学实体类别是持续时间,所以“咳嗽-三天”这一候选医学关系所属的医学关系类别是“症状-持续时间”、“三天-咳嗽”这一候选医学关系所属的医学关系类别是“持续时间-症状”。
[0097]
步骤s92:将候选医学关系所属的医学关系类别,作为候选关系类别。
[0098]
本实施方式中,将候选医学关系所属的医学关系类别,作为候选关系类别。举例来说,“咳嗽-三天”这一候选医学关系所属的医学关系类别是“症状-持续时间”,所以将“症状-持续时间”作为候选关系类别。
[0099]
s143:基于与候选关系类别相关的第二分值矩阵中参考区域内第二元素值满足第二条件,解码得到目标医学关系。
[0100]
本实施方式中,根据与候选关系类别相关的第二分值矩阵中参考区域内第二元素满足第二条件,解码得到目标医学关系。其中,参考区域对应的第二相关字符包含于候选医学关系。其中,不对第二条件进行限定,可根据实际使用需要具体设置。例如,第二条件为参考区域中第二元素值大于第二阈值的占比大于或等于第三阈值,例如,第二阈值为0,第三阈值为0.8,也就是说,参考区域内第二元素值大于0的占比大于或等于0.8。
[0101]
在一具体实施方式中,如图10所示,图10是图7所示步骤s143一实施例的流程示意图,解码得到目标医学关系具体包括如下子步骤:
[0102]
步骤s1001:分别将各个候选医学关系作为当前医学关系,并将当前医学关系所属的候选关系类别作为当前医学类别,以及将与当前医学类别相关的第二分值矩阵作为第二当前矩阵。
[0103]
本实施方式中,分别将各个候选医学关系作为当前医学关系,并将当前医学关系所属的候选关系类别作为当前关系类别,以及将与当前医学类别相关的第二分值矩阵作为第二当前矩阵。例如,如图4所示,以候选医学关系为“头疼
”‑“
三天”为例,所以当前医学关系为“头疼
”‑“
三天”,当前医学关系所属的候选关系类别“症状-持续时间”作为当前医学类别,当前医学类别相关的第二分值矩阵(如图4所示)作为第二当前矩阵。
[0104]
步骤s1002:统计第二当前矩阵中参考区域内满足第二条件的第二元素值的总数值。
[0105]
本实施方式中,统计第二当前矩阵中参考区域内满足第二条件的第二元素值的总数值。具体地,通过目标实体对中目标实体的起始和终止位置,能够从第二当前矩阵中分割出一个小矩阵即参考区域,对于该小矩阵,利用投票的方式判断参考区域是否能够表示两个目标实体之间存在关系;对于参考区域,如果一个单元格中的第二元素值满足第二条件,则认为该单元格可以算作一票,统计最终的票数即统计满足第二条件的第二元素值的总数值。
[0106]
举例来说,如图4所示,通过目标实体对“头疼”和“三天”的起始和终止位置,能够
从第二当前矩阵中分割出参考区域,并统计参考区域中满足第二条件的第二元素值的总数值为4。
[0107]
步骤s1003:基于总数值满足第二条件,将当前医学关系作为目标医学关系。
[0108]
本实施方式中,根据总数值满足第二条件,将当前医学关系作为目标医学关系。具体地,当总数值满足第二条件,则表明该参考区域表示两个目标实体之间存在特定的关系,所以可将当前医学关系作为目标医学关系,即解码得到目标医学关系。
[0109]
举例来说,如图4所示,以参考区域内第二元素值大于0的占比大于或等于0.8、当前医学关系为“症状-持续时间”为例,参考区域中满足第二条件的第二元素值的总数值为4,并且总数值占比为1大于0.8,所以将当前医学关系“症状-持续时间”作为目标医学关系。
[0110]
请参阅图11,图11是本技术提供的医学文本检测模型的训练方法一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图11所示的流程顺序为限。如图11所示,本实施例包括:
[0111]
步骤s1101:获取样本医学文本。
[0112]
本实施方式中,获取样本医学文本,其中样本医学文本包含预设数值个样本字符,且样本医学文本标注有样本医学实体及其所属的医学实体类别,以及样本医学关系及其所属的医学关系类别。其中,不对预设数值的大小进行限定,可根据实际使用需要具体设置。举例来说,以样本医学文本为“头疼三天,伴咳嗽”为例,其上标注有两个样本症状实体“头疼”和“咳嗽”、一个样本部位实体“头”、样本持续时间实体“三天”以及样本症状-持续时间关系为“头疼”和“三天”。
[0113]
在一实施方式中,样本医学文本可以但不限于病案首页、病程记录、检查检验及结果、医嘱记录、手术记录或者护理记录等,在此不做具体限定。
[0114]
在一实施方式中,样本医学文本可以为任意需要被解码得到样本医学实体和样本医学关系的医学文本,具体可以从本地存储或云端存储中获取得到。可以理解地,在其他实施方式中,也可通过图像采集设备对当前样本医学文本进行图像采集得到。
[0115]
步骤s1102:基于样本医学实体及其所属的医学实体类别,编码得到分别与若干种医学实体类别相关的第一样本分值矩阵,并基于样本医学关系及其所属的医学关系类别,编码得到分别与若干种医学关系类别相关的第二样本分值矩阵。
[0116]
本实施方式中,根据样本医学实体及其所属的医学实体类别,编码得到分别与若干种医学实体类别相关的第一样本分值矩阵;并且,根据样本医学关系及其所属的医学关系类别,编码得到分别与若干种医学关系类别相关的第二样本分值矩阵。其中,每个样本分值矩阵的长度和宽度均为预设数值,第一样本分值矩阵中第一矩阵位置处第一样本元素值表示第一矩阵位置的第一样本相关字符组成的词语是否属于医学实体类别,第二样本分值矩阵中第二矩阵位置处第二样本元素值表示第二矩阵位置的第二样本相关字符形成的关系是否属于医学关系类别,第一样本相关字符、第二样本相关字符均属于样本医学文本。
[0117]
可选地,不对预设数值的大小以及第一样本分值矩阵和第二样本分值矩阵的数量进行限定,可根据实际使用需要具体设置。例如,第一样本分值矩阵为e个,第二样本分值矩阵为r个;每个样本分值矩阵的长度和宽度均为n;编码得到e个n*n的第一样本分值矩阵和r个n*n的第二样本分值矩阵。
[0118]
步骤s1103:利用医学文本检测模型对样本医学文本依次进行语义提取和分值预
测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵。
[0119]
本实施方式中,利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵。也就是说,医学文本检测模型会先对样本医学文本先进行语义提取,以提取得到样本医学文本中各个样本字符的语义表示;然后根据各个样本字符的语义表示,进行分值预测,以得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵。其中,每个预测分值矩阵的长度和宽度均为预设数值。
[0120]
可选地,不对预设数值的大小以及第一预测分值矩阵和第二预测分值矩阵的数量进行限定,可根据实际使用需要具体设置。例如,第一预测分值矩阵为e个,第二预测分值矩阵为r个;每个预测分值矩阵的长度和宽度均为n。
[0121]
其中,第一预测分值矩阵中第一矩阵位置处第一预测元素值表示第一矩阵位置的第一样本相关字符组成的词语属于医学实体类别的可能性。也就是说,第一预测分值矩阵中每一个单元格定义为整个序列中某两个第一预测相关字符构成医学实体的可能性。其中,不对第一矩阵位置在第一预测分值矩阵中的具体位置进行限定,可根据实际使用需要具体设置。第二预测分值矩阵中第二矩阵位置处第二预测元素值表示第二矩阵位置的第二样本相关字符形成的关系属于医学关系类别的可能性。也就是说,第二预测分值矩阵中每一个单元格定义为整个序列中某两个第二样本相关字符构成医学关系类别的可能性。其中,不对第二矩阵位置在第二预测分值矩阵中的具体位置进行限定,可根据实际使用需要具体设置。
[0122]
在一实施方式中,如图12所示,图12本技术提供的利用若干种标注体系的样本医学文本对医学文本检测模型进行训练一实施例的流程示意图,利用若干种标注体系的医学文本对医学文本检测模型进行训练具体包括如下子步骤:
[0123]
步骤s1201:对于每种标注体系,基于涉及标注体系的样本医学文本中的标注词语,构建体系字典。
[0124]
由于样本医学文本的标注体系是根据需要训练的模型的功能设计的,所以如果只使用一种标注体系的样本医学文本数据,数据量太少,训练出来的医学文本检测模型的精度不够,但如果不区分标签体系而直接用于医学文本检测模型的训练,也会影响训练出来的医学文本检测模型。所以,本技术中,根据各参考标注体系与目标标注体系之间的相似度,调整各参考标注体系用于训练模型的顺序。
[0125]
因此,本实施方式中,首先对于每种标注体系,根据标注体系的样本医学文本中的标注词语,构建体系字典。也就是说,会对应每种标注体系构建体系字典,以便于后续计算相似度。具体地,对于各种参考标注体系,将其记作d
others
={d1,d1,

,dn},其中,n表示当前共有n种不同的标注体系;对于目标标注体系,将其记作d
target
;对于参考标注体系i,从参考标注体系中提取各标签下已标注的标注词语,从而构建参考标注体系i对应的体系字典以同样的方式构建目标标注体系对应的体系字典dic
target
。其中,不对根据样本医学文本中的标注词语构建体系字典的具体算法进行限定,可根据实际使用需要具体设置。
[0126]
步骤s1202:基于目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的相似度,获取若干种标注体系的训练顺序。
[0127]
本实施方式中,根据目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的相似度,获取若干种标注体系的训练顺序。其中,目标标注体系的训练顺序为最末位。也就是说,后续会先利用参考标注体系对模型进行训练,然后将训练好的模型参数进行剪裁用于训练目标标注体系,从而将不同标注体系之间的相似信息迁移到目标标注体系中去,进而提高医学文本检测模型的精度。
[0128]
在一实施方式中,如图13所示,图13是图12所示步骤s1202一实施例的流程示意图,将目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的交并比,作为目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的相似度,具体包括如下子步骤:
[0129]
步骤s1301:将目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的交并比,作为相似度。
[0130]
本实施方式中,将目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的交并比,作为相似度。具体公式如下:
[0131][0132]
其中,表示参考标注体系i对应的体系字典;dic
target
表示目标标注体系对应的体系字典。该相似度用以衡量两个体系字典的重叠程度,若字典重叠程度较高,说明该参考标注体系中被标注的医学实体与目标标注体系中被标注的医学实体有较多是相似的,从而保证了当前体系中有足够的信息被迁移到目标实体中去。
[0133]
步骤s1302:按照相似度由低到高的顺序,确定若干种标注体系的训练顺序。
[0134]
本实施方式中,按照相似度由低到高的顺序,确定若干种标注体系的训练顺序。具体地,计算出不同参考标注体系与目标标注体系的相似度后,我们通过相似度得分按得分重小到大排序,其中得分越大,表明两个标注体系相似度越高。由于与目标标注体系相似度小的参考标注体系认为对医学文本检测模型最终学习目标标注体系知识的帮助比较小,所以在医学文本检测模型训练的初级阶段,而与目标标注体系相似度大的参考标注体系认为对医学文本检测模型最终学习目标标注体系知识的帮助比较大,所以在医学文本检测模型训练的后期。
[0135]
举例来说,如图14所示,图14是本技术提供的异构标注体系整合流程一实施例的示意图,当前共有n种不同的参考标注体系,具体包括参考标注体系1、参考标注体系2、参考标注体系3、
……
、参考标注体系n;按照相似度由低到高的顺序排列后,确定的若干种标注体系的训练顺序为:参考标注体系2、参考标注体系n-1、
……
、参考标注体系n。
[0136]
步骤s1203:按照若干种标注体系的训练顺序,选择一个标注体系作为当前标注体系,并基于采用当前标注体系的样本医学文本,执行利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵的步骤以及后续步骤,直至在当前标注体系下训练收敛为止。
[0137]
本实施方式中,按照上述确定的若干种标注体系的训练顺利,选择一个标注体系作为当前标注体系,并基于采用当前标注体系的样本医学文本,执行利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵的步骤以及后续步骤,直至在当前标注体系下训练收敛为止。
[0138]
具体地,如图14和6所示,将医学文本检测模型首先在相似度最低的参考标注体系上训练,在第一个参考标注体系上训练完成后,将其参数保存,医学文本检测模型记作为model1;利用model1初始化上下文编码模块以及空间映射模块,其中,不对空间映射模块中的多层感知机的最后一层做初始化,初始化参数之后,在相似度排序第二的参考标注体系上训练,训练完成后将其记作为model2;重复上述流程,直至获得医学文本检测模型modeln。最后,在目标标注体系上以同样的方式初始化模型参数,并训练医学文本检测模型,训练完成的医学文本检测模型保存为modeltarget。通过这种级联的方式,医学文本检测模型循序渐进地将不同参考标注体系之间的相似信息迁移利用到目标标注体系中去,能够使用所有标注体系下的数据,从而提升医学文本检测模型的性能。
[0139]
步骤s1204:判断是否有标注体系未被选择。
[0140]
本实施方式中,会判断是否有标注体系未被选择,从而使得后续确定是否重新执行步骤s1203。在有标注体系未被选择时,执行步骤s1205。
[0141]
步骤s1205:响应于尚有标注体系未被选择,重新执行按照若干种标注体系的训练顺序,选择一个标注体系作为当前标注体系的步骤以及后续步骤。
[0142]
本实施方式中,响应于尚有标注体系未被选择,重新执行按照若干种标注体系的训练,选择一个标注体系作为当前标注体系的步骤以及后续步骤。也就是说,在所有标注体系即所有参考标注体系和目标标注体系都被选择用于训练医学文本检测模型后,完成对医学文本检测模型的训练。
[0143]
步骤s1104:基于样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数。
[0144]
本实施方式中,根据样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数,从而使得医学文本检测模型收敛,完成对医学文本检测模型的训练。样本分值矩阵包括分别与若干种医学实体类别相关的第一样本分值矩阵和分别与若干种医学关系类别相关的第二样本分值矩阵,预测分值矩阵包括分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵。所以,会根据第一样本分值矩阵和第一预测分值矩阵之间的差异以及第二样本分值矩阵和第二预测分值矩阵之间差异,调整医学文本检测模型的网络参数,从而使得收敛后的医学文本检测模型能够同时解决样本医学文本中的实体嵌套问题和实体关系重叠问题。
[0145]
请参阅图15,图15是图11所示步骤s1104一实施例的流程示意图。需要注意的是,若有实质上相同的结果,本实施例并不以图15所示的流程顺序为限。如图15所示,本实施例包括:
[0146]
步骤s1501:将样本分值矩阵中样本元素值满足预设条件的矩阵位置作为正例位置,并将各个正例位置分别作为第一当前位置,以及将第一当前位置所在的样本分值矩阵所属类别作为第一当前类别。
[0147]
本实施方式中,将样本分值矩阵中样本元素值满足预设条件的矩阵位置作为正例位置,并将各个正例位置分别作为第一当前位置,以及将第一当前位置所在的样本分值矩阵所属类别作为第一当前类别。
[0148]
在一实施方式中,预设条件为样本分值矩阵中样本元素值大于0,则样本分值矩阵中样本元素值大于0的矩阵位置为正例位置。可以理解地,在其他实施方式中,预设条件也可以为样本分值矩阵中样本元素值等于1或者大于1等,在此不做限定,可根据实际使用需要具体设置。举例来说,以如图3为例,预设条件为样本分值矩阵中样本元素值大于0,则图3中第1行第2列的矩阵位置以及第7行第9列的矩阵位置为正例位置;此时,图3中第1行第2列的矩阵位置以及第7行第9列的矩阵位置分别作为第一当前位置,以及将第一当前位置所在的样本分值矩阵所属类别“医学实体类别”作为第一当前类别。
[0149]
又例如,以图4为例,预设条件为样本分值矩阵中样本元素值大于0,则图4中第1行第3列、第2行第3列、第1行第4列和第2行第4列的矩阵位置分别作为第一当前位置,以及将第一当前位置所在的样本分值矩阵所属类别“医学关系类别”作为第一当前类别。
[0150]
需要说明的是,在当样本分值矩阵同时有属于医学关系类别和属于医学实体类别时,第一当前类别会同时有医学实体类别和医学关系类别。
[0151]
步骤s1502:基于与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到第一当前位置对应的子损失。
[0152]
本实施方式中,根据与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到第一当前位置对应的子损失。也就是说,在第一当前类别为医学实体类别,则会根据与医学实体类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与医学实体类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到第一当前位置对应的子损失;在第一当前类别为医学关系类别,则会根据与医学关系类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与医学关系类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到第一当前位置对应的子损失。
[0153]
多标签分类损失能够有效地知道医学文本检测模型学习矩阵中哪些是实体标签,但在众多标注体系中,标注数据隐藏有另一类信息,即标注和未标注的对比信息。理论上,某一类实体矩阵中,被标注的单元格得分质检应当是尽量相互靠近的,而未标注的单元格的得分应当尽量远离,所以在一实施方式中,如图16所示,图16是本技术提供的根据对比损失函数得到第一当前位置对应的子损失一实施例的流程示意图,引入对比损失函数用以指导医学文本检测模型学习此类信息,具体包括如下子步骤:
[0154]
步骤s1601:基于与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到与各个矩阵位置对应的第一数值。
[0155]
本实施方式中,根据与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到与各个矩阵位置对应的第一数值。在某一医学实体类矩阵中,被标注的矩阵位置得分质检应当尽量相互靠近,而未被标注的矩阵位置应当尽量远离。
[0156]
步骤s1602:统计与第一当前类别相关的预测分值矩阵中各个矩阵位置对应的第一数值的总和,得到第二数值。
[0157]
本实施方式中,统计与第一当前类别相关的预测分值矩阵中各个矩阵位置对应的第一数值的总和,从而得到第二数值。也就是说,会对步骤s1601得到的各个矩阵位置对应的第一数值进行统计求和,从而得到第二数值。
[0158]
步骤s1603:将与第一当前类别相关的预测分值矩阵中第一当前位置对应的第一数值与第二数值的比值,作为第一当前位置对应的子损失。
[0159]
本实施方式中,将与第一当前类别相关的预测分值矩阵中第一当前位置对应的第一数值与第二数值的比值,作为第一当前位置对应的子损失。具体公式如下:
[0160][0161]
其中,p表示与第一当前类别相关的预测分值矩阵;exp(s
p
/t)表示与各个矩阵位置对应的第一数值;∑
a∈a
exp(sa/t)表示第二数值。
[0162]
步骤s1503:统计各个正例位置分别对应的子损失,得到第一损失。
[0163]
本实施方式中,统计各个正例位置分别对应的子损失,从而得到第一损失,以使后续能够基于第一损失调整医学文本检测模型的网络参数。具体公式如下:
[0164][0165]
其中,l1表示第一损失;exp(s
p
/t)表示与各个矩阵位置对应的第一数值;∑
a∈a
exp(sa/t)表示第二数值。
[0166]
步骤s1504:基于第一损失,调整医学文本检测模型的网络参数。
[0167]
本实施方式中,根据上述方式计算得出第一损失,从而根据第一损失调整医学文本检测模型的网络参数。具体可通过诸如梯度下降等优化方式基于第一损失调整医学文本检测模型的网络参数,并可重复步骤s1501-步骤s1503进行模型的网络参数调整,直至调整医学文本检测模型至收敛为止。
[0168]
对于每一个n*n的医学实体矩阵,可将其视为一个多标签的分类矩阵,可用多分类损失指导模型网络参数的调整。同样地,对于每一个n*n
[0169]
的医学关系矩阵,也可引入多标签分类损失。这样,整个医学文本检测模型的损失就能统一成了多标签分类损失。其中,不对损失函数进行具体限定。所以,如图17所示,图17是本技术提供的确定医学文本检测模型的损失一实施例的流程示意图,在基于第一损失,调整医学文本检测模型的网络参数之前,具体还包括如下子步骤:
[0170]
步骤s1701:将样本分值矩阵中样本元素值不满足预设条件的矩阵位置作为负例位置,并将各个负例位置分别作为第二当前位置,以及将第二当前位置所在的样本分值矩阵所属类别作为第二当前类别。
[0171]
本实施方式中,将样本分值矩阵中样本元素值不满足预设条件的矩阵位置作为负例位置,并将各个负例位置分别作为第二当前位置,以及将第二当前位置所在的样本分值矩阵所属类别作为第二当前类别。
[0172]
在一实施方式中,预设条件为样本分值矩阵中样本元素值大于0,则样本分值矩阵中样本元素值小于或等于0的矩阵位置为负例位置。可以理解地,在其他实施方式中,预设条件也可以为样本分值矩阵中样本元素值等于1或者大于1等,在此不做限定,可根据实际
使用需要具体设置。
[0173]
步骤s1702:基于与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,得到第一子项值。
[0174]
本实施方式中,根据与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,得到第一子项值。其中,第一子项值与第一当前位置处预测元素值负相关。具体公式如下:
[0175][0176]
其中,l
11
表示第一子项值;ω
pos
表示与第一当前类别相关的预测分值矩阵;si表示第i个第一当前位置处预测元素值。
[0177]
步骤s1703:基于与第二当前类别相关的预测分值矩阵中第二当前位置处预测元素值,得到第二子项值。
[0178]
本实施方式中,根据与第二当前类别相关的预测分值矩阵中第二当前位置处预测元素值,得到第二子项值。其中,第二子项值与第二当前位置处预测元素值正相关。具体公式如下:
[0179][0180]
其中,l
22
表示第二子项值;ω
neg
表示与第二当前类别相关的预测分值矩阵;si表示第i个第二当前位置处预测元素值。
[0181]
步骤s1704:基于第一子项值和第二子项值,得到第二损失。
[0182]
本实施方式中,根据第一子项值和第二子项值,得到第二损失,具体公式如下:
[0183][0184]
其中,l2表示第二损失;表示第二子项值;表示第一子项值。
[0185]
因此,在一具体实施方式中,在确定了第一损失和第二损失后,会根据第一损失和第二损失调整医学文本检测模型的网络参数,也就是说,会在实体-关系损失和对比损失的共同指导下调整医学文本检测模型的网络参数。可选地,在一实施方式中,可对第一损失和第二损失进行加权求和而得到总损失,从而根据总损失调整医学文本检测模型的网络参数。具体公式如下:
[0186]
l
total
=αl1 λl2[0187]
其中,l
total
表示总损失;l1表示第一损失;l2表示第二损失;α、λ表示超参数。其中,不对α和λ的大小进行具体限定,可根据实际使用需要具体设置。例如,α=0.7,λ=0.3。
[0188]
请参阅图18,图18是本技术提供的医学文本检测装置一实施例的框架示意图。医学文本检测装置180包括:文本获取模块181、语义提取模块182、分值预测模块183和矩阵解
码模块184。文本获取模块181用于获取待测医学文本;其中,待测医学文本包含预设数值个字符;语义提取模块182用于提取待测医学文本中各个字符的语义表示;分值预测模块183用于基于各个字符的语义表示,预测得到若干分值矩阵;其中,每个分值矩阵的长度和宽度均为预设数值,若干分值矩阵包括分别与若干种医学实体类别相关的第一分值矩阵和分别与若干种医学关系类别相关的第二分值矩阵,且第一分值矩阵中第一位置处第一元素值表示第一位置的第一相关字符组成的词语属于医学实体类别的可能性,第二分值矩阵中第二位置处第二元素值表示第二位置的第二相关字符形成的关系属于医学关系类别的可能性,第一相关字符、第二相关字符均属于待测医学文本;矩阵解码模块184用于基于若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系。
[0189]
其中,上述第一位置位于第一分值矩阵中第i行第j列,第一相关字符为待测医学文本中第i个字符和第j个字符,第一元素值表示待测医学文本中第i个字符和第j个字符先后排列组成的词语属于医学实体类别的可能性;或者,上述第一位置位于第一分值矩阵中第j行第i列,第一相关字符为待测医学文本中第j个字符和第i个字符,第一元素值表示待测医学文本中第i个字符和第j个字符先后排列组成的词语属于医学实体类别的可能性。
[0190]
其中,上述第二位置位于第二分值矩阵中第m行第n列,第二相关字符包括待测医学文本中第m个字符和第n个字符,第二元素值表示待测医学文本中第m个字符和第n个字符分属不同实体所形成的关系属于医学关系类别的可能性;或者,上述第二位置位于第二分值矩阵中第n行第m列,第二相关字符包括待测医学文本中第n个字符和第m个字符,第二元素值表示待测医学文本中第n个字符和第m个字符分属不同实体所形成的关系属于医学关系类别的可能性。
[0191]
其中,分值预测模块183用于基于各个字符的语义表示,预测得到若干分值矩阵,具体包括:基于预设数值个字符的语义表示进行空间映射,得到若干特征矩阵;其中,每个特征矩阵的长度和宽度分别为预设数值和特征维度,若干特征矩阵包括分别与若干种医学实体类别相关的第一特征矩阵和分别与若干种医学关系类别相关的第二特征矩阵;对于各个特征矩阵,基于特征矩阵及其转置矩阵,得到特征矩阵对应的分值矩阵。
[0192]
其中,上述若干分值矩阵是由医学文本检测模型处理待测医学文本而得到的,医学文本检测模型包括若干空间映射网络;其中,若干空间映射网络包括若干第一映射网络和若干第二映射网络,不同第一映射网络执行不同医学实体类别的空间映射,不同第二映射网络执行不同医学关系类别的空间映射。
[0193]
其中,上述空间映射网络为包含多层网络层的多层感知机,且多层网络层中除最后一层网络层均设有激活函数;和/或,上述医学文本检测模型包括语义提取网络,语义提取网络用于执行语义提取操作,且若干空间映射网络并行连接于语义提取网络之后。
[0194]
其中,矩阵解码模块184用于基于若干分值矩阵,解码得到待测医学文本中目标医学实体和目标医学关系,具体包括:基于与医学实体类别相关的第一分值矩阵中满足第二条件的第一元素值,解码得到属于医学实体类别的目标医学实体;获取由目标医学实体形成的候选医学关系,并获取候选医学关系所属的医学关系类别作为候选关系类别;基于与候选关系类别相关的第二分值矩阵中参考区域内第二元素值满足第二条件,解码得到目标医学关系;其中,参考区域对应的第二相关字符包含于候选医学关系。
[0195]
其中,矩阵解码模块184用于基于与医学实体类别相关的第一分值矩阵中满足第
一条件的第一元素值,解码得到属于医学实体类别的目标医学实体,具体包括:分别将若干种医学实体类别作为当前实体类别,并将与当前实体类别相关的第一分值矩阵作为第一当前矩阵;获取第一当前矩阵中满足第一条件的第一元素值所在的第一目标位置;将第一目标位置的第一相关字符组成的词语,作为属于当前实体类别的目标医学实体。
[0196]
其中,矩阵解码模块184用于获取由目标医学实体形成的候选医学关系,具体包括:将各个目标医学实体两两排列组合,得到候选医学关系;矩阵解码模块184用于获取候选医学关系所属的医学关系类别作为候选关系类别,具体包括:基于候选医学关系中两个目标医学实体的先后顺序以及分别所属的医学实体类别,得到候选医学关系所属的医学关系类别;将候选医学关系所属的医学关系类别,作为候选关系类别。
[0197]
其中,矩阵解码模块184用于基于与候选关系类别相关的第二分值矩阵中参考区域内第二元素值满足第二条件,解码得到目标医学关系,具体包括:分别将各个候选医学关系作为当前医学关系,并将当前医学关系所属的候选关系类别作为当前医学类别,以及将与当前医学类别相关的第二分值矩阵作为第二当前矩阵;统计第二当前矩阵中参考区域内满足第一条件的第二元素值的总数值;基于总数值满足第二条件,将当前医学关系作为目标医学关系。
[0198]
请参阅图19,图19是本技术提供的医学文本检测模型的训练装置一实施例的框架示意图。医学文本检测模型的训练装置190包括:样本获取模块191、矩阵编码模块192、模型检测模块193和参数调整模块194。样本获取模块191用于获取样本医学文本;其中,样本医学文本包含预设数值个样本字符,且样本医学文本标注有样本医学实体及其所属的医学实体类别,以及样本医学关系及其所属的医学关系类别;矩阵编码模块192用于基于样本医学实体及其所属的医学实体类别,编码得到分别与若干种医学实体类别相关的第一样本分值矩阵,并基于样本医学关系及其所属的医学关系类别,编码得到分别与若干种医学关系类别相关的第二样本分值矩阵;其中,每个样本分值矩阵的长度和宽度均为预设数值,第一样本分值矩阵中第一矩阵位置处第一样本元素值表示第一矩阵位置的第一样本相关字符组成的词语是否属于医学实体类别,第二样本分值矩阵中第二矩阵位置处第二样本元素值表示第二矩阵位置的第二样本相关字符形成的关系是否属于医学关系类别,第一样本相关字符、第二样本相关字符均属于样本医学文本;模型检测模块193用于利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵;其中,每个预测分值矩阵的长度和宽度均为预设数值,第一预测分值矩阵中第一矩阵位置处第一预测元素值表示第一矩阵位置的第一样本相关字符组成的词语属于医学实体类别的可能性,第二预测分值矩阵中第二矩阵位置处第二预测元素值表示第二矩阵位置的第二样本相关字符形成的关系属于医学关系类别的可能性;参数调整模块194用于基于样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数。
[0199]
其中,参数调整模块194用于基于样本分值矩阵和预测分值矩阵之间的差异,调整医学文本检测模型的网络参数,具体包括:将样本分值矩阵中样本元素值满足预设条件的矩阵位置作为正例位置,并将各个正例位置分别作为第一当前位置,以及将第一当前位置所在的样本分值矩阵所属类别作为第一当前类别;基于与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与第一当前类别相关的预测分值矩阵中各个矩阵位
置的预测元素值,得到第一当前位置对应的子损失;统计各个正例位置分别对应的子损失,得到第一损失;基于第一损失,调整医学文本检测模型的网络参数。
[0200]
其中,参数调整模块194用于基于与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,以及与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到第一当前位置对应的子损失,具体包括:基于与第一当前类别相关的预测分值矩阵中各个矩阵位置的预测元素值,得到与各个矩阵位置对应的第一数值;其中,第一数值与预测元素值正相关;统计与第一当前类别相关的预测分值矩阵中各个矩阵位置对应的第一数值的总和,得到第二数值;将与第一当前类别相关的预测分值矩阵中第一当前位置对应的第一数值与第二数值的比值,作为第一当前位置对应的子损失。
[0201]
其中,参数调整模块194用于在基于第一损失,调整医学文本检测模型的网络参数之前,具体还包括:将样本分值矩阵中样本元素值不满足预设条件的矩阵位置作为负例位置,并将各个负例位置分别作为第二当前位置,以及将第二当前位置所在的样本分值矩阵所属类别作为第二当前类别;基于与第一当前类别相关的预测分值矩阵中第一当前位置处预测元素值,得到第一子项值;其中,第一子项值与第一当前位置处预测元素值负相关;以及,基于与第二当前类别相关的预测分值矩阵中第二当前位置处预测元素值,得到第二子项值,其中,第二子项值与第二当前位置处预测元素值正相关;基于第一子项值和第二子项值,得到第二损失;参数调整模块194用于基于第一损失,调整医学文本检测模型的网络参数,具体包括:基于第一损失和第二损失,调整网络参数。
[0202]
其中,上述样本医学文本涉及若干种标注体系,且若干种标注系统包括目标标注体系和至少一种参考标注体系,参数调整模块194还用于:对于每种标注体系,基于涉及标注体系的样本医学文本中的标注词语,构建体系字典;基于目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的相似度,获取若干种标注体系的训练顺序;其中,目标标注体系的训练顺序为最末位;按照若干种标注体系的训练顺序,选择一个标注体系作为当前标注体系,并基于采用当前标注体系的样本医学文本,执行利用医学文本检测模型对样本医学文本依次进行语义提取和分值预测,得到分别与若干种医学实体类别相关的第一预测分值矩阵和分别与若干种医学关系类别相关的第二预测分值矩阵的步骤以及后续步骤,直至在当前标注体系下训练收敛为止;响应于尚有标注体系未被选择,重新执行按照若干种标注体系的训练顺序,选择一个标注体系作为当前标注体系的步骤以及后续步骤。
[0203]
其中,参数调整模块194用于基于目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的相似度,获取若干种标注体系的训练顺序,具体包括:将目标标注体系对应的体系字典分别与各种参考标注体系对应的体系字典之间的交并比,作为相似度;按照相似度由低到高的顺序,确定若干种标注体系的训练顺序。
[0204]
请参阅图20,图20是本技术提供的电子设备一实施例的框架示意图。电子设备200包括相互耦接的存储器201和处理器202,存储器201中存储有程序指令,处理器202用于执行程序指令以实现上述任一医学文本检测方法或医学文本检测模型的训练方法实施例中的步骤。具体地,电子设备200可以包括但不限于:台式计算机、笔记本电脑、服务器、手机、平板电脑等等,在此不做限定。
[0205]
具体而言,处理器202用于控制其自身以及存储器201以实现上述任一医学文本检
测方法或医学文本检测模型的训练方法实施例中的步骤。处理器202还可以称为cpu(central processing unit,中央处理单元)。处理器202可能是一种集成电路芯片,具有信号的处理能力。处理器202还可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器202可以由集成电路芯片共同实现。
[0206]
请参阅图21,图21是本技术提供的计算机可读存储介质一实施例的框架示意图。计算机可读存储介质210存储有能够被处理器运行的程序指令211,程序指令211用于实现上述任一医学文本检测方法或医学文本检测模型的训练方法实施例中的步骤。
[0207]
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
[0208]
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
[0209]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
[0210]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0211]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0212]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0213]
以上所述仅为本技术的实施方式,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献