一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于光学字符识别的医保零星报销目录匹配方法及系统与流程

2022-11-23 16:59:11 来源:中国专利 TAG:

技术特征:
1.基于光学字符识别的医保零星报销目录匹配方法,其特征在于,包括:获取费用清单图像;采用ocr深度学习模型对费用清单图像进行文本检测和文本识别,得到若干个文本框、以及每个文本框的位置和包含的字符;将文本框进行行对齐和列对齐后,与目录库进行匹配,以得到医保报销信息。2.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,所述行对齐的具体方法为:若两个文本框之间的纵向重叠比位于指定范围内,这两个文本框属于一行。3.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,所述列对齐的方法为:将含有目标字符的文本框,作为列名文本框;对于每个列名文本框,根据横向重叠比和距离,选取匹配参考坐标;对于每一行中的每个文本框,计算与不同列的匹配参考坐标的重叠范围,选取最大重叠范围对应的匹配参考坐标作为文本框的分列依据。4.如权利要求3所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,根据所述横向重叠比选取匹配参考坐标的具体方法为:对于某个列名文本框a,计算与所有非列名文本框的横向重叠比,将横向重叠比在设定范围内的非列名文本框全部加入匹配坐标集合;在匹配坐标集合中选取出与列名文本框a重叠度最高的非列名文本框t,并将非列名文本框t的坐标设置为列名文本框a的匹配参考坐标。5.如权利要求3所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,根据所述距离选取匹配参考坐标的具体方法为:对于某个列名文本框a,若与所有非列名文本框的横向重叠比均不在设定范围内,则检索与列名文本框a距离最近的非列名文本框t;若与非列名文本框t距离最近的列名文本框,与列名文本框a含有的字符相同,则将非列名文本框t的坐标设置为列名文本框a对应的匹配参考坐标;否则,将列名文本框a的坐标设置为列名文本框a对应的匹配参考坐标。6.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,在采用ocr深度学习模型对费用清单图像进行文本检测和文本识别之前,对费用清单图像进行预处理;所述预处理包括:对费用清单图像进行去噪、平滑和色度增强后,检测图像中的直线信息,利用霍夫变换对倾斜图像进行矫正。7.如权利要求1所述的基于光学字符识别的医保零星报销目录匹配方法,其特征在于,所述ocr深度学习模型包括文本检测模型和文本识别模型;所述文本检测模型使用可微分二值化网络结构;所述文本识别模型使用卷积循环神经网络和连接时序分类结构的深度学习模型。8.基于光学字符识别的医保零星报销目录匹配系统,其特征在于,包括:图像获取模块,其被配置为:获取费用清单图像;ocr模块,其被配置为:采用ocr深度学习模型对费用清单图像进行文本检测和文本识
别,得到若干个文本框、以及每个文本框的位置和包含的字符;目录匹配模块,其被配置为:将文本框进行行对齐和列对齐后,与目录库进行匹配,以得到医保报销信息。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于光学字符识别的医保零星报销目录匹配方法中的步骤。10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于光学字符识别的医保零星报销目录匹配方法中的步骤。

技术总结
本发明涉及目录匹配技术领域,提供了基于光学字符识别的医保零星报销目录匹配方法及系统,包括:获取费用清单图像;采用OCR深度学习模型对费用清单图像进行文本检测和文本识别,得到若干个文本框、以及每个文本框的位置和包含的字符;将文本框进行行对齐和列对齐后,与目录库进行匹配,以得到医保报销信息。可以自适应提取不同医院不同类型表格图片内容,节省了人工设计规则和模板的繁琐流程。节省了人工设计规则和模板的繁琐流程。节省了人工设计规则和模板的繁琐流程。


技术研发人员:于秋波 程秋晨 徐喆 朱晓洪 郭伟 赵丁丁 姚保岐 李旭升 张建军 董雪
受保护的技术使用者:山大地纬软件股份有限公司
技术研发日:2022.08.26
技术公布日:2022/11/22
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献