一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

中医药中文文献的信息化方法及装置、电子设备和计算机可读介质

2022-10-15 08:24:18 来源:中国专利 TAG:

技术特征:
1.一种中医药中文文献的信息化方法,包括步骤:对文字化的中医药中文文献文本进行初步分割而提取中间结果信息,所述中间结果信息包括出版信息、摘要、前言、临床资料、治疗方法、结果和讨论中的至少两种;提取目标字段,以及将目标字段与所述中间结果信息相关联;以与所述中医药中文文献关联的方式存储或传送中间结果信息及与之关联的目标字段。2.根据权利要求1所述的方法,其中:以正则表达式对中医药中文文献文本进行初步分割。3.根据权利要求1所述的方法,其中:所述中间结果信息包括出版信息、摘要、前言、临床资料、治疗方法、结果。4.根据权利要求3所述的方法,其中:所述中间结果信息包括出版信息、摘要、前言、临床资料、治疗方法、结果和讨论。5.根据权利要求1-4中任一项所述的方法,还包括步骤:在“对文字化的中医药中文文献文本进行初步分割而提取中间结果信息”之前,对中医药中文文献文本进行文字识别。6.根据权利要求5所述的方法,其中:对中医药中文文献文本进行文字识别包括:步骤1:将文本进行图形化处理以得到像素图像,文本具有高度方向和宽度方向;步骤2:将像素图像划分为分隔开的多个部分,每个部分为矩形块,每个矩形块的边与高度方向或宽度方向平行,相邻矩形块之间在高度方向或宽度方向上间隔开;和步骤3:对单个矩形块分别识别,以识别矩形块中的文字。7.根据权利要求6所述的方法,其中:在步骤2中,所述分隔开的多个部分包括在高度方向上间隔开的多个矩形块;或者在步骤2中,所述分隔开的多个部分包括在宽度方向上间隔开的多个矩形块。8.根据权利要求6所述的方法,其中:在步骤2中,所述分隔开的多个部分包括在高度方向上间隔开的多个矩形块,以及在宽度方向上间隔开的多个矩形块。9.根据权利要求8所述的方法,其中:步骤2包括在高度方向上将文本分割为多个高度矩形块之后,将高度矩形块中对应的矩形块在宽度方向上分割为多个宽度矩形块;或者步骤2包括在宽度方向上将文本分割为多个宽度矩形块之后,将宽度矩形块中对应的矩形块在高度方向上分割为多个高度矩形块。10.根据权利要求6所述的方法,其中:在步骤2中,确定分割形成的最终矩形块在文本版面中的位置;且所述方法还包括步骤4:以所述确定的位置,将在步骤3中识别的文字放置到文本版面中的对应位置。11.一种中医药中文文献的信息化装置,包括:中间结果信息提取模块,对文字化的中医药中文文献文本进行初步分割而提取中间结果信息,所述中间结果信息包括出版信息、摘要、前言、临床资料、治疗方法、结果和讨论中
的至少两种;关联模块,用于确定要提取的目标字段,并将目标字段与所述中间结果信息相关联;存储或传送模块,以与所述中医药中文文献关联的方式存储或传送中间结果信息及与之关联的目标字段。12.根据权利要求11所述的装置,还包括:识别单元,用于在“对文字化的中医药中文文献文本进行初步分割而提取中间结果信息”之前,对中医药中文文献文本进行文字识别。13.根据权利要求12所述的装置,其中:所述识别单元包括:图形化模块:将文本进行图形化处理以得到像素图像,文本具有高度方向和宽度方向;分割模块:将像素图像划分为分隔开的多个部分,每个部分为矩形块,每个矩形块的边与高度方向或宽度方向平行,相邻矩形块之间在高度方向或宽度方向上间隔开;和识别模块:对单个矩形块分别识别,以识别矩形块中的文字。14.根据权利要求13所述的装置,其中:在分割模块中,所述分隔开的多个部分包括在高度方向上间隔开的多个矩形块;或者在分割模块中,所述分隔开的多个部分包括在宽度方向上间隔开的多个矩形块。15.根据权利要求13所述的装置,其中:在分割模块中,所述分隔开的多个部分包括在高度方向上间隔开的多个矩形块,以及在宽度方向上间隔开的多个矩形块。16.根据权利要求15所述的装置,其中:分割模块在高度方向上将文本分割为多个高度矩形块之后,将高度矩形块中对应的矩形块在宽度方向上分割为多个宽度矩形块;或者分割模块在宽度方向上将文本分割为多个宽度矩形块之后,将宽度矩形块中对应的矩形块在高度方向上分割为多个高度矩形块。17.根据权利要求13所述的装置,其中:分割模块确定在分割模块分割形成的最终矩形块在文本版面中的位置;和所述装置还包括排版模块,排版模块以所述确定的位置,将在识别模块识别的文字放置到文本版面中的对应位置。18.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1-10中任一项所述的方法。19.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1-10中任一项所述的方法。

技术总结
本发明涉及一种中医药中文文献的信息化方法,包括步骤:对文字化的中医药中文文献文本进行初步分割而提取中间结果信息,所述中间结果信息包括出版信息、摘要、前言、临床资料、治疗方法、结果和讨论中的至少两种;确定要提取的目标字段,以及将目标字段与所述中间结果信息相关联;以与所述中医药中文文献关联的方式存储或传送中间结果信息及与之关联的目标字段。本发明还涉及一种中医药中文文献的信息化装置、一种电子设备和一种计算机可读介质。一种电子设备和一种计算机可读介质。一种电子设备和一种计算机可读介质。


技术研发人员:韩东燃 夏椰 伍麟 刘一星 张佳玮
受保护的技术使用者:北京中医药大学
技术研发日:2021.03.23
技术公布日:2022/10/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献