一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于OCR技术的高精度单据识别方法和系统与流程

2022-04-30 13:52:03 来源:中国专利 TAG:

一种基于ocr技术的高精度单据识别方法和系统
技术领域
1.本技术涉及数据共享技术领域,具体涉及一种基于ocr技术的高精度单据识别方法和系统。


背景技术:

2.ocr技术是光学字符识别的缩写(opticalcharacterrecognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业大量票据表格的自动扫描识别及长期存储。相对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为ocr技术的评测依据;而相对于表格及票据,通常以识别率或整张通过率及识别速度为测定ocr技术的实用标准。ocr识别技术不仅具有可以自动判断、拆分、识别和还原各种通用型印刷体表格,在表格理解上做出了令人满意的实用结果,能够自动分析文稿的版面布局,自动分栏、并判断出标题、横栏、图像、表格等相应属性,并判定识别顺序,能将识别结果还原成与扫描文稿的版面布局一致的新文本。表格自动录入技术,可自动识别特定表格的印刷或打印汉字、字母、数字,可识别手写体汉字、手写体字母、数字及多种手写符号,并按表格格式输出。提高了表格录入效率,可节省大量人力。同时支持将表格识别直接还原成ptf、pdf、html等格式文档;并可以对图像嵌入横排文本和竖排文本、表格文本进行自动排版面分析。目前利用ocr,直接从凭证影像中提取金额、帐号等重要数据,代替人的手工录入,与条码识别/流水识别紧密结合,实现建立事后副本帐、完成事后监督的工作。
3.现有技术的缺陷在于:ocr技术受限于单据本身的清晰度和完整度,其识别精度相较于人工识别仍存在较大误差,尤其是对于手写体的单据,具有智能度低,误差较大的缺陷。


技术实现要素:

4.本技术的目的在于克服现有技术的不足,提供一种基于ocr技术的高精度单据识别方法和系统,能有效提高手写体单据的识别精度,尤其是对于错字涂改、书写不标准等场景。
5.本技术的目的是通过以下技术方案来实现的:
6.本技术第一方面提供一种基于ocr技术的高精度单据识别方法,其该方法包括:
7.s101:基于光学扫描技术,将单据上的文字转化为平面图像信息;
8.s102:扫描单据正面的文字轨迹,以及手写文字的字迹凹陷深度;基于相同原理,获取单据背面手写文字的字迹凸出高度;
9.s103:对于字迹重叠不清楚的手写文字,基于所述字迹凹陷痕迹的深度和字迹凸出痕迹的高度将该重叠字迹可能表示的文字依次列出;
10.s104:从平面图像信息中获取文字信息,从列出的文字中逐一插入所述文字信息,得到第一组文字组句;
11.s105:基于逻辑判断,选择正确的文字组句,完成单据识别。
12.区别与传统的光学扫描技术,本技术基于手写文字中的涂改具有较好的识别效果,基于涂改时为了凸出显示的效果,书写较为用力这一特点,进行检测,基于凹陷和凸出的笔画痕迹来判断正确的文字,从而提高了文字的识别精度。
13.进一步的,对于字迹重叠不清楚的手写文字检测还包括一个手写文字痕迹粗细的识别,其包括:
14.提取字迹重叠区域的字迹,按笔画进行拆解得到每一个笔画;
15.将笔画由粗到细进行排序,然后按笔画由粗到细进行文字组合,得到该重叠字迹可能表示的文字;
16.将这些文字逐一插入所述文字信息,得到第二组文字组句。
17.进一步的,还包括一个相互校验的步骤,其内容为:
18.将第一组文字组句和第二组文字组句进行比对,选择第一组文字组句或第二组文字组句中的第一逻辑组句,判断该第一逻辑组句是否出现在另一文字组句中,如存在,则该第一逻辑组句为正确文字组句;
19.所述第一逻辑组句是指对应逻辑判断下所述第一组文字组句和第二组文字组句中的最佳选项。
20.进一步的,当所述第一组文字组句和第二组文字组句的第一逻辑组句相同时无需相互校验。
21.进一步的,当所述第一组文字组句和第二组文字组句的第一逻辑组句不同时,以第一逻辑组句在另一组文字组句中的排位考前的决定正确的文字组句。
22.可选的,本技术还加入了涂改时笔画较粗这一特点,将其与笔画的书写力度进行结合,两者综合考虑进一步提升了文字识别精,尤其是这种笔画涂改的场景。
23.进一步的,当所述第一组文字组句或第二组文字组句中的第一逻辑组句不在另一组逻辑组句中时,由人工进行复验。
24.进一步的,所述逻辑判断包括语义逻辑、语序逻辑以及应用场景下的语境逻辑。
25.本技术第二方面还提供了一种基于ocr技术的高精度单据识别系统,用于实现如第一方面所述的方法,该系统包括:
26.光学扫描模块,扫描单据,将单据上的文字转化为平面图像信息;
27.表面痕迹识别模块,用于扫描单据正面和背面,以获得手写文字正面的字迹凹陷深度和背面的凸出高度;
28.图像处理模块,将所述平面图像信息转化为文字信息;
29.文字处理模块,基于所述字迹凹陷深度和背面的凸出高度分析得到第一组文字组句,基于所述文字信息中的笔画粗细得到第二组文字组句;
30.逻辑判处模块,基于逻辑判断从所述第一组文字组句和第二组文字组句中获得正确的文字组句;
31.服务器,存储有计算机程序,当其运行时服务器如第一方面所述的方法配置各模块。
32.进一步的,还包括一个报警模块,当所述第一组文字组句或第二组文字组句中的第一逻辑组句不在另一组逻辑组句中时,发出警报。
33.进一步的,所述表面痕迹识别模块是基于光学技术或声波技术原理的检测设备。
34.本技术的有益效果是:本技术中利用涂改时笔画力度大和笔画加粗的特性对手写文字进行识别,尤其是针对涂改后的手写文字具有较高的识别精度,提高了单据识别的准确度。
附图说明
35.图1为本技术发明的流程示意图;
36.图2为本技术实施例的系统框图;
37.图3为本技术服务器的结构示意图。
具体实施方式
38.下面结合具体实施例进一步详细描述本技术的技术方案,但本技术的保护范围不局限于以下。
39.如图1所示,本实施例第一方面提供了本技术第一方面提供一种基于ocr 技术的高精度单据识别方法,其该方法包括:
40.s101:基于光学扫描技术,将单据上的文字转化为平面图像信息;
41.s102:扫描单据正面的文字轨迹,以及手写文字的字迹凹陷深度;基于相同原理,获取单据背面手写文字的字迹凸出高度;
42.s103:对于字迹重叠不清楚的手写文字,基于字迹凹陷痕迹的深度和字迹凸出痕迹的高度将该重叠字迹可能表示的文字依次列出;
43.s104:从平面图像信息中获取文字信息,从列出的文字中逐一插入文字信息,得到第一组文字组句;
44.s105:基于逻辑判断,选择正确的文字组句,完成单据识别。
45.可选的,在一些实施例中,对于字迹重叠不清楚的手写文字检测还包括一个手写文字痕迹粗细的识别,其包括:提取字迹重叠区域的字迹,按笔画进行拆解得到每一个笔画;将笔画由粗到细进行排序,然后按笔画由粗到细进行文字组合,得到该重叠字迹可能表示的文字;将这些文字逐一插入文字信息,得到第二组文字组句。更进一步的,还包括一个相互校验的步骤,其内容为:将第一组文字组句和第二组文字组句进行比对,选择第一组文字组句或第二组文字组句中的第一逻辑组句,判断该第一逻辑组句是否出现在另一文字组句中,如存在,则该第一逻辑组句为正确文字组句。第一逻辑组句是指对应逻辑判断下第一组文字组句和第二组文字组句中的最佳选项。在一些具体应用中其具体步骤为,选择第一组文字组句中的第一逻辑组句,在第二组文字组句中寻找是否存完全相同的文字组句,如果存在则该第一逻辑组句为正确组句。同时,选择第二组文字组句中的第一逻辑组句,在第一组文字组句中寻找是否存完全相同的文字组句,如果存在则该第一逻辑组句为正确组句。此时,如果两次第一逻辑组句相同则无效相互校验,也就是当第一组文字组句和第二组文字组句的第一逻辑组句相同时无需相互校验。当两个结果的一逻辑组句不同时,还要进一步校验,在一些实施例中,当第一组文字组句和第二组文字组句的第一逻辑组句不同时,
以第一逻辑组句在另一组文字组句中的排位考前的决定正确的文字组句。例如,第一组文字组句中的第一逻辑组句在第二组文字组句中排第二逻辑顺序,而第二组文字组句中的第一逻辑组句在第一组文字组句中排第三逻辑顺序,则选择第一组文字组句中的第一逻辑组句作为正确字句。
46.可选的,在一些实施例中,当第一组文字组句或第二组文字组句中的第一逻辑组句不在另一组逻辑组句中时,由人工进行复验。本技术中的逻辑判断包括语义逻辑、语序逻辑以及应用场景下的语境逻辑。
47.如图2所示,本技术第二方面还提供了一种基于ocr技术的高精度单据识别系统,用于实现如第一方面的方法,该系统包括:
48.光学扫描模块,扫描单据,将单据上的文字转化为平面图像信息;
49.表面痕迹识别模块,用于扫描单据正面和背面,以获得手写文字正面的字迹凹陷深度和背面的凸出高度;
50.图像处理模块,将平面图像信息转化为文字信息;
51.文字处理模块,基于字迹凹陷深度和背面的凸出高度分析得到第一组文字组句,基于文字信息中的笔画粗细得到第二组文字组句;
52.逻辑判处模块,基于逻辑判断从第一组文字组句和第二组文字组句中获得正确的文字组句;
53.服务器,存储有计算机程序,当其运行时服务器如第一方面的方法配置各模块。
54.可选的,在一些实施例中,还包括一个报警模块,当第一组文字组句或第二组文字组句中的第一逻辑组句不在另一组逻辑组句中时,发出警报。其中,报警模块优选采用语音报警装置进行语言提醒。
55.可选的,在一些实施例中,表面痕迹识别模块是基于光学技术或声波技术原理的检测设备。
56.图3是本技术实施例提供的服务器的示意图。如图3所示,该实施例的服务器包括:处理器、存储器以及存储在存储器中并可在处理器上运行的计算机程序,例如推送消息程序。处理器执行计算机程序时实现上述各个动态场景下的特征点提取方法实施例中的步骤,例如图1所示的步骤s101至s105。或者,处理器执行计算机程序时实现上述各装置实施例中各模块/单元的功能。
57.示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器中,并由处理器执行,以完成本技术。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在服务器中的执行过程。例如,计算机程序可以被分割成获取模块、解析模块、查找模块、推送模块,各模块具体功能如下:
58.服务器可以是桌上型计算机、笔记本、掌上电脑等计算设备。服务器可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,本实施例仅仅是服务器的示例,并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如服务器还可以包括输入输出设备、网络接入设备、总线等。
59.所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路
(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
60.存储器可以是服务器的内部存储单元,例如服务器的硬盘或内存。存储器也可以是服务器的外部存储设备,例如服务器上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flashcard)等。进一步地,存储器还可以既包括服务器的内部存储单元也包括外部存储设备。存储器用于存储计算机程序以及服务器所需的其他程序和数据。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
61.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
62.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
63.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
64.在本技术所提供的实施例中,应该理解到,所揭露的服务器和方法,可以通过其它的方式实现。例如,以上所描述的服务器实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
65.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
66.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
67.所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或
使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
68.以上所述仅是本技术的优选实施方式,应当理解本技术并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本技术的精神和范围,则都应在本技术所附权利要求的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献