一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

医案文本的处理方法和装置、电子设备以及计算机可读存储介质与流程

2022-11-16 07:58:34 来源:中国专利 TAG:

技术特征:
1.一种医案文本的处理方法,包括:获得待处理的医案文本,其中,所述待处理的医案文本中包括多个实体,所述实体包括标准名称实体和非标准名称实体;在编码数据库中进行检索,以获得与所述非标准名称实体相对应的候选编码;利用所述候选编码在标准名称数据库中检索,获得多个检索结果;将多个检索结果分别与所述非标准名称实体组成多个第一对齐候选对;根据所述多个第一对齐候选对的统计信息确定所述非标准名称实体的标准名称。2.根据权利要求1所述的医案文本的处理方法,其中,所述方法进一步包括:计算所述非标准名称实体与所述标准名称实体之间的差异度;根据所述差异度确定所述检索结果的数量。3.根据权利要求1所述的医案文本的处理方法,其中,所述根据所述多个第一对齐候选对的统计信息确定所述非标准名称实体的标准名称,包括:计算所述非标准名称实体在所有医案文本构成的医案数据库中的第一出现次数;计算所述第一对齐候选对在所述医案数据库中的第二出现次数;当所述第二出现次数与所述第一出现次数的比值大于第一预设阈值时,将所述第一对齐候选对中的检索结果确定为所述非标准名称实体的标准名称。4.根据权利要求1所述的医案文本的处理方法,其中,所述方法进一步包括:获取多个原始医案文本,所述待处理的医案文本来自于所述多个原始医案文本;所述根据所述多个第一对齐候选对的统计信息确定所述非标准名称实体的标准名称包括:根据所述多个第一对齐候选对分别在所述多个原始医案文本中的统计信息确定所述非标准名称实体的标准名称。5.根据权利要求3所述的医案文本的处理方法,其中,所述医案文本的处理方法进一步包括:获取所述多个原始医案文本的来源信息;根据所述来源信息确定所述第一预设阈值。6.一种医案文本的处理装置,包括:第一获取模块,用于获得待处理的医案文本,其中,所述待处理的医案文本中包括多个实体,所述实体包括标准名称实体和非标准名称实体;第一检索模块,用于在编码数据库中进行检索,以获得与所述非标准名称实体相对应的候选编码;第二检索模块,用于利用所述候选编码在标准名称数据库中检索,获得多个检索结果;对齐候选对生成模块,用于将多个检索结果分别与所述非标准名称实体组成多个第一对齐候选对;第一确定模块,用于根据所述多个第一对齐候选对的统计信息确定所述非标准名称实体的标准名称。7.根据权利要求6所述的医案文本的处理装置,其中,所述医案文本的处理装置进一步包括:第一计算模块,用于计算所述非标准名称实体与所述标准名称实体之间的差异度;
第二确定模块,用于根据所述差异度确定所述检索结果的数量。8.根据权利要求6所述的医案文本的处理方法,其中,所述第一确定模块包括:第一计算单元,用于计算所述非标准名称实体在所有医案文本构成的医案数据库中的第一出现次数;第二计算单元,用于计算所述第一对齐候选对在所述医案数据库中的第二出现次数;第一确定单元,用于当所述第二出现次数与所述第一出现次数的比值大于第一预设阈值时,将所述第一对齐候选对中的检索结果确定为所述非标准名称实体的标准名称。9.一种电子设备,包括:存储器,用于存储程序;处理器,用于运行所述存储器中存储的所述程序,所述程序运行时执行如权利要求1至5中任一所述的医案文本的处理方法。10.一种计算机可读存储介质,其上存储有可被处理器执行的计算机程序,其中,该程序被处理器执行时实现如权利要求1至5中任一所述的医案文本的处理方法。

技术总结
本申请公开了一种医案文本的处理方法和装置、电子设备以及计算机可读存储介质。该医案文本的处理方法包括:获得待处理的医案文本;在编码数据库中进行检索,以获得与非标准名称实体相对应的候选编码;利用候选编码在标准名称数据库中检索,获得多个检索结果;将多个检索结果分别与非标准名称实体组成多个第一对齐候选对;根据多个第一对齐候选对的统计信息确定非标准名称实体的标准名称。本申请在标准名称数据库中针对候选编码进行检索来寻找确定非标准名称实体在标准名称数据库中被使用,就可以根据这样确定的一对对齐候选对的统计信息来判断该对齐候选对中的非标准名称实体是否经常与该标准名称一起使用,从而为该非标准名称实体确定标准名称。非标准名称实体确定标准名称。非标准名称实体确定标准名称。


技术研发人员:谭传奇 陈漠沙 黄松芳
受保护的技术使用者:阿里巴巴新加坡控股有限公司
技术研发日:2021.05.12
技术公布日:2022/11/15
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献