一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信用证识别方法、装置、计算机设备和存储介质与流程

2022-05-11 12:00:26 来源:中国专利 TAG:


1.本技术涉及图像识别技术领域,特别是涉及一种信用证识别方法、装置、计算机设备和存储介质。


背景技术:

2.由于信用证票据应用场景比较特殊,因此业界几乎没有针对信用证的专用识别引擎,现有的信用证识别通常是采用人工录入与人工核对的方式,或使用通用的文字识别引擎,例如tesseract引擎,或者基于深度学习的通用ocr识别模型。
3.但是由于信用证版式提取信息内容复杂、文字密集,且需要判断复选框是否勾选、涂黑等内容,有着表格与非表格两种版式,现有的识别技术方案无法对结构复杂的信用证版式做准确的提取,也无法精确的对信用证的长文本进行定位。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够对信用证图像进行精确识别的信用证识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种信用证识别方法,该方法包括:
6.获取待识别信用证图像;
7.将待识别信用证图像进行分割,得到若干文本区域;
8.对文本区域进行文字识别,得到文本区域的识别结果;
9.根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息。在其中一个实施例中,获取待识别信用证图像之后,还包括:
10.对待识别信用证图像进行角度矫正。
11.在其中一个实施例中,对待识别信用证图像进行角度矫正,包括:
12.将待识别信用证图像进行二值化处理得到二值化图像;
13.提取二值化图像中的全部表格轮廓;
14.对全部表格轮廓进行处理得到面积最大表格的目标轮廓;
15.计算面积最大表格的目标轮廓中相邻直线夹角得到旋转角度;
16.根据旋转角度对待识别信用证图像进行角度矫正。
17.在其中一个实施例中,对全部表格轮廓进行处理得到面积最大表格的目标轮廓,包括:
18.根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格;
19.获取与当前表格相邻的待处理表格;
20.将待处理表格与当前表格合并作为新的当前表格,并继续获取与当前表格相邻的待处理表格,直至获取面积最大表格,提取面积最大表格的目标轮廓。
21.在其中一个实施例中,对文本区域进行文字识别之前,包括
22.对文本区域进行修复。
23.在其中一个实施例中,对文本区域进行修复,包括:
24.获取待识别信用证图像对应的版式;
25.根据版式对文本区域进行修复。
26.在其中一个实施例中,根据版式对文本区域进行修复,包括:
27.当待识别信用证图像为表格版式时,提取文本区域中的目标方向的待处理边界;
28.获取距离文本区域中目标类型的文本区域最近的待处理边界作为目标边界;
29.将目标类型的文本区域的边界移动至目标边界。
30.在其中一个实施例中,根据不同的版式对文本区域进行修复,包括:
31.当待识别信用证图像为非表格版式时,获取文本区域中目标类型的文本区域的坐标;
32.根据坐标以及待识别信用证图像的宽度对待识别信用证图像进行分割,得到目标类型的文本区域对应的文本切片;
33.分别对文本切片的不同方向进行对应的图像操作得到内容轮廓;
34.根据内容轮廓的横坐标对目标类型的文本区域进行修复。
35.在其中一个实施例中,根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息,包括:
36.根据预设版式结构提取识别结果中的候选字段集合;
37.根据预设版式对应的预设配置规则进行匹配得到候选字段集合中每一字段对应的字段位置以及字段内容;
38.通过字段与字段信息的位置关系,获取字段信息候选集;
39.对字段信息候选集进行过滤,得到目标信息。
40.在其中一个实施例中,根据预设版式结构提取识别结果中的候选字段集合之前,还包括:
41.获取版式区分字段;
42.将识别结果与版式区分字段进行匹配以确定待识别信用证图像的版式。
43.在其中一个实施例中,通过字段与字段信息的位置关系,获取字段信息候选集之前,还包括:
44.当待识别信用证图像为多个信用证图像时,根据多个信用证图像的出现顺序对多个信用证图像进行合并。
45.在其中一个实施例中,对字段信息候选集进行过滤,得到目标信息之前还包括:
46.当字段信息为目标字段信息时,将字段信息输入至段落分类模型;通过段落分类模型对属于同一个段落的目标字段信息进行提取。
47.在其中一个实施例中,段落分类模型是通过预先训练得到的,段落分类模型的训练过程包括:
48.获取信用证段落文本;
49.将信用证段落文本根据预设方法进行组合并进行标记,得到信用证训练数据;
50.对信用证训练数据进行预处理,得到预处理后的信用证训练数据;
51.将预处理后的信用证训练数据输入至第一机器学习模型中进行训练,以得到段落分类模型。
52.第二方面,本技术还提供了一种信用证识别装置,该装置包括:
53.获取模块,用于获取待识别信用证图像;
54.文本区域检测模块,用于将待识别信用证图像进行分割,得到若干文本区域;
55.识别模块,用于对文本区域进行文字识别,得到文本区域的识别结果;
56.后处理模块,用于根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息。
57.第三方面,本技术还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任意一个实施例中的方法。
58.第四方面,本技术还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个实施例中的方法。
59.第五方面,本技术还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任意一个实施例中的方法。
60.上述信用证识别方法、装置、设备、计算机存储介质和程序产品,首先获取待识别信用证图像,然后对待识别信用证图像进行分割得到若干文本区域,并对文本区域进行文字识别,得到文本区域的待识别结果,最后根据预设规则对文本区域的识别结果进行后处理得到机构化目标信息,实现了准确、高效地自动化提取信用证中的结构化目标信息,同时避免了人工录入过程中的隐私泄露。
附图说明
61.图1为一个实施例中信用证识别方法的应用环境图;
62.图2为一个实施例中信用证识别方法的流程示意图;
63.图3为一个实施例中待识别信用证图像示意图;
64.图4为一个实施例中信用证图像矫正示意图;
65.图5为一个实施例中信用证角度矫正的流程示意图;
66.图6为一个实施例中文本区域检测不准确的示意图;
67.图7为一个实施例中目标方向的待处理边界示意图;
68.图8为一个实施例中表格版式信用证文本区域修复示意图;
69.图9为一个实施例中表格版式信用证文本区域修复流程示意图;
70.图10为一个实施例中竖直方向二值化示意图;
71.图11为一个实施例中目标类型的文本区域的文本切片示意图;
72.图12为一个实施例中横向闭操作示意图;
73.图13为一个实施例中非表格版式信用证文本区域修复流程示意图;
74.图14为一个实施例中提取识别结果中的候选字段集合示意图;
75.图15为一个实施例中字段的规则配置示意图;
76.图16为一个实施例中收集信用证语料示意图;
77.图17为一个实施例中信用证训练集数据示意图;
78.图18为一个实施例中训练数据预处理示意图;
79.图19为一个实施例中段落分类模型的模型训练示意图;
80.图20为一个实施例中信用证识别方法流程示意图;
81.图21为一个实施例中的后处理流程示意图;
82.图22为一个实施例中信用证识别装置的结构框图;
83.图23为一个实施例中计算机设备的内部结构图。
具体实施方式
84.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
85.本技术实施例提供的信用证识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。获取待识别信用证图像;将信用证图像进行分割得到若干文本区域;对分割得到的若干文本区域进行文字识别,得到文本区域的识别结果;最后根据预设规则对文本区域的识别结果进行后处理得到结构化的目标信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
86.在一个实施例中,如图2所示,提供了一种信用证识别方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
87.s202,获取待识别信用证图像。
88.其中,待识别信用证图像是指需要进行文字识别的信用证图像,其可以是通过扫描、拍照等方式获取并上传至服务器的。信用证是一种特殊的票据,其包括description_goods与document_required两个长字段,具体结合图3所示,图3为一个实施例中待识别信用证图像示意图,图中的document_required这个长字段包括多行文本且包括多个勾选框。其中可选地,服务器可以根据需要从终端中选取部分或全部的待识别票据图像并上传至服务器,这样服务器可根据指令对待识别票据图像进行识别,这样可以减少人工录入和核对的工作量,提高效率,同时有利于保证数据的安全性。
89.s204,将待识别信用证图像进行分割,得到若干文本区域。
90.其中,文本区域是指待识别信用证图像中某一文本检测框对应的区域,具体地,继续结合图3所示,图中的每一行文本外侧的框即为文本区域。
91.具体地,服务器获取待识别信用证图像后,对待识别信用证图像中的文本区域进行检测,并对检测得到的文本区域进行分割以得到若干文本区域,在其他实施例中,可以通过预先训练的文字检测模型对待识别信用证图像中的文本区域进行识别,并对文本区域进行分割以得到若干本文区域。
92.s206,对文本区域进行文字识别,得到文本区域的识别结果。
93.其中识别结果是指对文本区域进行文字识别得到的文本内容,例如本文区域中包括信用证三个字,则该文本区域的识别结果为信用证。
94.具体地,服务器在得到若干文本区域之后,对文本区域进行识别以得到文本区域的识别结果。在其他实施例中,服务器可以将文本区域输入至预先训练的文字识别模型中,
通过文字识别模型对文本区域进行识别即可得到该文本区域对应的识别结果。
95.s208,根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息。
96.其中,预设规则是指预先设定的文本区域的识别结构进行后处理的规则,其可以根据具体地使用场景进行设置,通过预设规则对文本区域的识别结果进行后处理后即可得到结构化目标信息,其中目标信息是指待提取的信息,例如可以是待识别信用证图像中document_required字段对应的内容。结构化目标信息是指符合预设规则格式的目标信息,例如“姓名:张三”。
97.具体地,服务器在得到各个文本区域的识别结果后,会根据预设规则对识别结果进行后处理,示例性的,后处理可以是对信用证中换行属于同一内容的文本,即信用证中的长字段作为一个段落进行提取,最后输出结构化目标信息。在其他实施例中,后处理也可以是对结构化目标信息进行后处理校验,可以将结构化目标信息中不需要的信息进行过滤,最后输出结构化目标信息。
98.上述信用证识别方法中,首先获取待识别信用证图像,然后对待识别信用证图像进行分割得到若干文本区域,并对文本区域进行文字识别,得到文本区域的待识别结果,最后根据预设规则对文本区域的识别结果进行后处理得到机构化目标信息,实现了准确、高效地自动化提取信用证中的结构化目标信息,同时避免了人工录入过程中的隐私泄露。
99.在一个实施例中,获取待识别信用证图像之后,还包括:对待识别信用证图像进行角度矫正。
100.其中,角度矫正是将存在旋转的待识别信用证图像进行旋转以符合对待识别信用证图像进行处理的标准。
101.具体地,在获取待识别信用证图像之后还需要对待识别待信用证图像进行图像矫正,以使待识别信用证图像的旋转角度符合对待识别信用证图像进行处理的标准,其中可选地可以根据待识别信用证图像中最大表格的角点坐标使用放射变换进行角度矫正。具体结合图4所示,图4为一个实施例中信用证图像矫正示意图,图中左边的是待角度矫正的待识别信用证图像,右边的是角度矫正完成后的待识别信用证图像。
102.在上述实施例中,通过对待识别信用证图像进行角度矫正,可以更好地对待识别信用证图像作进行下一步处理。
103.在一个实施例中,对待识别信用证图像进行角度矫正,包括:将待识别信用证图像进行二值化处理得到二值化图像;提取二值化图像中的全部表格轮廓;对全部表格轮廓进行处理得到面积最大表格的目标轮廓;计算面积最大表格的目标轮廓中相邻直线夹角得到旋转角度;根据旋转角度对待识别信用证图像进行角度矫正。
104.其中,二值化是指将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程,二值化图像是指对待识别信用证图像进行二值化处理后得到的图像;目标轮廓是指经过对表格轮廓进行处理后得到的表格轮廓,例如可以是通过合并相邻表格框得到的表格轮廓。
105.具体地,首先将待识别信用证图像进行二值化处理后得到待识别信用证图像对应的二值化图像,这样可以方便表格轮廓的提取;然后对二值化图像中的全部表格轮廓进行提取,得到二值化图像中全部表格轮廓;得到表格轮廓后即可得到全部表格的轮廓面积,可选地,可以通过表格轮廓计算表格的轮廓面积,例如利用表格轮廓的长和宽进行计算;进一
步地,对全部的轮廓面积进行处理后得到面积最大表格的目标轮廓,其中可选地可以通过相邻表格合并的方式得到面积最大表格的目标轮廓;通过计算面积最大表格的目标轮廓中相邻直线夹角计算得到旋转角度,其中可选地,可以通过勾股定理计算目标轮廓中相邻直线夹角计算得到旋转角度;最后,根据计算得到的旋转角度对待识别信中证图像进行角度矫正。
106.在上述实施例中,通过对全部表格轮廓计算得到最大表格的目标轮廓后,计算最大表格的目标轮廓中相邻直线夹角得到旋转角度,最后根据旋转角度对待识别信用证图像进行角度矫正。这样可以在实际场景中存在倾斜的信用证图像进行矫正,避免后续在对信用证图像进行处理过程中出现回归不准确的现象。
107.在一个实施例中,对全部表格轮廓进行处理得到面积最大表格的目标轮廓,包括:根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格;获取与当前表格相邻的待处理表格;将待处理表格与当前表格合并作为新的当前表格,并继续获取与当前表格相邻的待处理表格,直至获取面积最大表格,提取面积最大表格的目标轮廓。
108.其中,轮廓面积是根据表格轮廓进行计算的面积,具体地,在得到二值化图像中的全部表格轮廓后,根据表格轮廓计算轮廓面积,其中可选地,可以得到全部表格轮廓后可以根据表格轮廓的长和宽计算每个表格的轮廓面积。其中,当前表格是指最小轮廓面积的表格;待处理表格是指与当前表格相邻需要进行合并的表格。
109.具体地,在得到二值化图像中的全部表格轮廓后,根据表格轮廓计算轮廓面积,并根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格。然后获取当前表格即最小轮廓面积的表格相邻的待处理表格,其中可选地,可以根据上下、左右两条表格线平行过滤轮廓得到与当前表格相邻的待处理表格;将当前表格与待处理表格进行合并得到新的当前表格,并继续获取与当前表格相邻的待处理表格,将当前表格与当前表格相邻的待处理表格进行合并,直至获取面积最大的表格,最后提取面积最大的表格轮廓的目标轮廓。
110.在其他实施例中,具体结合图5所示,图5为一个实施例中信用证角度矫正的流程示意图,首先将待识别信用证图像输入,并对待识别信用证图像进行图像二值化,得到二值化图像;对二值化图像进行过滤获得全部表格轮廓,根据全部表格轮廓计算轮廓面积,并根据轮廓面积进行过滤,得到面积最小的轮廓面积;然后根据上下、左右两条表格线平行率过滤,得到当前表格即面积最小的轮廓面积相邻的待处理表格,将当前表格与待处理表格进行合并得到新的当前表格,并继续根据上下、左右两条表格线平行率过滤,得到新的当前表格相邻的待处理表格,并对新的当前表格与待处理表格进行合并直至获取面积最大的表格,最后通过该表格相邻直线夹角计算旋转角度,根据旋转角度对待识别信用证图像进行角度矫正。
111.在上述实施例中,通过计算最大表格的相邻直线夹角计算旋转角度,即可得到待处理信用证图像的旋转角度,进而对待处理信用证图像进行角度矫正。
112.在一个实施例中,对文本区域进行文字识别之前,包括对文本区域进行修复。
113.其中,修复是指对文本区域的宽度或者宽度等进行调整,使文本区域能够包括完整的待识别内容,以避免后续对文本区域进行文字识别时出现提取错误的现象。
114.具体地,由于信用证图像中存在很多长且密集的文本行,因此在对待识别信用证图像中文本区域进行识别过程中会出现识别不准确的现象,例如识别的时候会将文本行首
尾漏掉或者识别错误,这样会使后续对文本区域中文字识别出现错误,具体结合图6所示,图6为一个实施例中文本区域检测不准确的示意图,图中箭头所示的地方出现了文本行首个文字漏掉的情况,因此在对文本区域进行文字识别之前需要对文本区域进行修复,使后续对文本区域中的文字识别结果更加精确。其中可选地,可以对表格和非表格版式的信用证采用不同的修复方式,以保证文本区域修复更加准确。
115.在上述实施例中,通过对文本区域的修复可以使后续对文本区域进行文字识别的结果更加准确。
116.在一个实施例中,对文本区域进行修复,包括:获取待识别信用证图像对应的版式;根据版式对文本区域进行修复。
117.版式是指待识别信用证图像对应的版式,所有的信用证都是根据相应的版式生成的,其可以是表格版式或者非表格版式。
118.具体地,服务器首先获取待识别信用证图像对应的版式,根据信用证对应的版式采用不同的方式进行修复,例如对表格版式的待识别信用证图像可以根据表格线边界进行修复,对非表格版式的待识别信用证图像可以根据基于文本行的轮廓查找方法进行修复。具体地,服务器在获取待识别信用证图像之前会对待识别信用证图像的版式进行判断,以确定待识别信用证图像对应的版式采用相应的修复方式对待识别信用证图像中待修复的文本区域进行修复。其中可选地,可以通过待识别信用证图像内部根据长短字段及是否是表格去区分待识别信用证图像版式。在其他实施例中,也可以通过判断待识别信用证图像中是否包括大量表格边界线来判断待识别信用证图像是否为表格版式的信用证,否则则为非表格版式的信用证。
119.在上述实施例中,通过获取待识别信用证图像对应的版式,分别采用不同的方式对文本区域进行修复,以实现对文本区域的精准修复。
120.在一个实施例中,根据版式对文本区域进行修复,包括:当待识别信用证图像为表格版式时,提取文本区域中的目标方向的待处理边界;获取距离文本区域中目标类型的文本区域最近的待处理边界作为目标边界;将目标类型的文本区域的边界移动至目标边界。
121.其中,目标方法是指根据预设规则设定的方向,其可以是横向也可以竖向,可以根据具体地使用场景进行选择,在本实施例中,选择了竖向作为目标方向,这是由于待识别信用证图像中存在很多长且密集的文本行,因此会出现首尾漏掉的现象,所以采用竖向作为目标方向能够避免首尾漏掉的现象。在其他实施例中,可以根据实际情况选择横向或者横向以及竖向两个方向作为目标方向。
122.其中,待处理边界是指待处理信用证图像中任意一条表格框线;其中目标类型的文本区域是指符合预设要求的文本区域,例如可以是文本区域宽度大于预设阈值的文本区域,即长文本区域,目标边界是指对目标类型的本区域的边界线移动到符合预设要求的边界,例如长字段的最近的竖直方向表格线的边界。
123.具体地,当待识别信用证图像为表格版式时,提取文本区域中的目标方向作为待处理边界线,具体结合图7所示,图7为一个实施例中目标方向的待处理边界示意图,图7中连续且颜色较深的竖向直线为待处理边界线。然后,在获取距离文本区域中目标类型的文本区域最近的待处理边界作为目标边界之前,还要获取目标类型的文本区域,其中可选地,可以预先设定一个阈值,若当前文本区域的宽度大于预设阈值时,则判定当前文本区域为
目标类型的文本区域。然后获取目标类型的文本区域最近的待处理边界作为目标边界,将目标类型的文本区域的边界移动到目标边界,具体结合图8所示,图8为一个实施例中表格版式信用证文本区域修复示意图。在其他实施例中,首先可以对待识别信用证图像进行二值化处理后,再提取文本区域中的目标方向的待处理边界。
124.在其他实施例中,结合图9所示,图9为一个实施例中表格版式信用证文本区域修复流程示意图,首先对待识别信用证图像进行二值化,然后对垂直方向核结构进行膨胀腐蚀操作,获得竖直方向的二值化图,结合图10所示,图10为一个实施例中竖直方向二值化示意图;然后根据文本区域的宽度判断是否属于长字段文本区域,其中可选地,可以预先设定一个阈值,若文本区域的宽度大于阈值,则判断为长字段文本区域;根据长字段文本区域的最近的竖直方向表格线的边界,修复长字段两端的坐标为竖直边界位置。
125.在上述实施例中,通过将目标类型的文本区域的边界移动到目标边界,实现了对表格版式待识别信用证图像的修复,能够避免文本行首尾漏掉或者识别错误的现象,以保证后续对文本区域能够进行精确识别。
126.在一个实施例中,根据不同的版式对文本区域进行修复,包括:当待识别信用证图像为非表格版式时,获取文本区域中目标类型的文本区域的坐标;根据坐标以及待识别信用证图像的宽度对待识别信用证图像进行分割,得到目标类型的文本区域对应的文本切片;分别对文本切片的不同方向进行对应的图像操作得到得到内容轮廓;根据内容轮廓的横坐标对目标类型的文本区域进行修复。
127.具体地,当待识别信用证图像为非表格版式的信用证时,首先获取文本区域中目标类型的文本区域的坐标,其中对目标类型的文本区域的判断可参照上述实施例中的具体实施方式,在此不再反复描述。然后获取文本区域中目标类型的文本区域坐标,根据目标类型的文本区域的坐标以及待识别信用证图像的宽度对待识别信用证图像进行分割,得到目标类型的文本区域对应的文本切片,具体结合图11所示,图11为一个实施例中目标类型的文本区域的文本切片示意图。接下来,分别对目标类型的文本区域的文本切片的不同方向进行对应的图像操作,其中可选地,可以分别对目标类型的文本区域的文本切片进行竖直方向开操作以及横向方向闭操作,得到文本切片中的内容轮廓。在其他实施例中,可以在分别对文本切片的不同方向进行对应的图像操作之前,对文本切片进行二值化处理,得到二值化后的文本切片后对文本切片的不同方向进行对应的图像操作。具体结合图12,图12为一个实施例中横向闭操作示意图,图中白色的区域为内容轮廓。最后根据内容轮廓的横坐标对目标类型的文本区域进行修复,示例性的可以根据内容轮廓的最小和最大横向的坐标来进行修复。
128.在其他实施例中,结合图13所示,图13为一个实施例中非表格版式信用证文本区域修复流程示意图。首先会获取到目标类型的文本区域的坐标位置,将该坐标位置(location[0],location[1],location[2],location[3])记录下来,并根据原始图片的宽度及目标类型的文本区域的高度裁剪出来切片数据;然后分别对目标类型的文本区域的竖直方向进行开操作以及横向方向进行闭操作,具体地,竖直方向开操作用于文本和竖向的表格线连在一起的情况,去除竖向表格线;横向方向闭操作用于水平方向大核结构进行横向的闭操作,将文本区域内容连成块,用于进行轮廓检测,便于求得此文本区域的文本行,如图12所示,通过分别对文本切片的不同方向进行对应的图像操作得到内容轮廓后,找到
最小的横向坐标,找到最大横向坐标作为长文本的边界,最后根据统计出上述的轮廓的最小和最大横向的坐标(min_x,location[1],max_x,location[2])进行修正。
[0129]
在上述实施例中,通过对目标类型对应的文本切片进行不同方向的图像操作,即可得到文本切片中的内容轮廓,最后根据内容轮廓的横坐标就能对目标类型的文本区域进行修复,以保证后续对文本区域能够进行精确识别。
[0130]
在一个实施例中,根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息,包括:根据预设版式结构提取识别结果中的候选字段集合;根据预设版式对应的预设配置规则进行匹配得到字段集合中每一字段对应的字段位置以及字段内容;通过字段与字段信息的位置关系,获取字段信息候选集;对字段信息候选集进行过滤,得到目标信息。
[0131]
其中,预设版式是指预先设置的信用证版式,其可以是表格版式的信用证也可以是非表格版式的信用证;候选字段集合是指待识别信用证图像中所有字段的集合;预设配置规则是指预先设定的字段匹配规则,通过预设配置规则可以得到候选字段集合中每一字段对应的字段位置及字段内容,字段信息是指字段对应的内容,例如“姓名:张三”,其中字段为“姓名”,字段信息为“张三”;字段信息候选集是指待识别信用证图像中某一字段对应的字段信息的集合;目标信息是指需要提取的所有字段信息集合中的人一个字段信息。
[0132]
具体地,服务器首先根据预设版式结构提取识别结果中的候选字段集合,例如表格版式的信用证中大多是左边是字段,右边是相对应的字段信息,根据左右平行关系可以提取得到候选字段集合。其中可选地,可以在根据预设版式结构提取识别结果中的候选字段集合之前,通过将识别结果与版式区分字段进行匹配以确定待识别信用证图像的版式,然后再提取识别结果中的候选字段集合。具体结合图14所示,图14为一个实施例中提取识别结果中的候选字段集合示意图,由于图14中的信用证版式为表格版式信用证,可以根据左右平行关系可以提取得到候选字段集合。
[0133]
具体地,在得到候选字段结合后,根据预设版式对应的预设设置规则进行匹配以得到候选字段集合中每一字段对应的字段位置以及字段内容,例如若待识别信用证图像为表格版式,则采用表格版式对应的预设配置规则进行匹配,反之则采用非表格版式对应的预设配置规则进行匹配。在其中一个实施例中,预设设置规则可以是基于字段配置的正则搜索,基于字段配置的正则搜索是根据规则内容对应的得分到进行匹配,其中规则内容为信用证中使用的全部字段,规则内容对应的得分是预先制定的。其中可选地,可以优先以得分最高的规则内容进行匹配,在遍历所有规则内容时,首先遍历得分最高的规则内容,如果候选字段集合中的字段与规则内容匹配上就不需要进行匹配了,反之需要根据得分更低的规则内容进行匹配,具体结合图15,图15为一个实施例中字段的规则配置示意图。在其他实施例中,预设设置规则可以是基于全文全称的匹配方式,如果基于字段配置的正则搜索没有匹配到对应的字段的话,会基于全文全称的匹配方式进行文本相似度搜索,找到最有可能的字段作为基准。
[0134]
具体地,在得到字段位置以及字段内容后,可以通过字段与字段信息的位置关系,来获取字段对应的字段信息候选集,由于信用证中字段与字段信息的分布规律可以分为上下结构、左右结构、非上下结构,因此可以根据候选字段位置信息垂直搜索、水平搜索、值内容搜索进行匹配查找候选字段信息集合。
[0135]
具体地,在获取字段信息候选集后,可以对字段信息候选集进行过滤,以得到目标
信息。其中可选地,过滤方式可以根据规则进行过滤,例如对于日期、金额等有固定的规则,因此可以根据部分字段的规则进行过滤。在其中一个实施例中,可以通过字段值进行过滤,因为字段信息候选集可能会误提取到其他字段关键字,而这部分显然不是需要被提取的,因此可以判断字段信息候选集合中是否有这些字段,如果有则进行过滤。其中可选地,在对字段信息候选集进行过滤前还可以对字段信息候选集中属于同一内容的长字段作为段落进行提取。
[0136]
在上述实施例中,通过预设版式结构提取识别结果中的候选字段集合,并根据预设版式对应的预设配置规则进行匹配,得到候选字段集合中每一字段对应的字段位置以及字段内容,然后再通过字段与字段信息的位置关系获取字段信息候选集,最后对字段信息候选集进行过滤得到目标信息,这样可以实现目标信息的精准提取,并可以解决信用证多版式以及段落区分等问题。
[0137]
在一个实施例中,根据预设版式结构提取识别结果中的候选字段集合之前,还包括:获取版式区分字段;将识别结果与版式区分字段进行匹配以确定待识别信用证图像的版式。
[0138]
其中,版式区分字段是指用于区分表格版式信用证与非表格版式信用证的字段。具体地,首先获取版式区分字段,然后将文本区域进行文字识别以得到识别结果与版式区分字段进行匹配,以确定待识别信用证图像的版式。例如可以采用非表格版式信用证中没有的字段作为区分表格版式信用证与非表格标识信用证的字段,若识别结果中包括该字段则判断待识别信用证图像为表格版式信用证,否则为非表格版式信用证。
[0139]
在上述实施中,通过版式区分字段进行匹配,可以确定待识别信用证图像的版式,根据不同的待识别信用证图像的版式选择相应的预设配置规则进行匹配来获取候选字段集合中每一字段对应的字段位置以及字段内容。
[0140]
在一个实施例中,通过字段与字段信息的位置关系,获取字段信息候选集之前,还包括:当待识别信用证图像为多个信用证图像时,根据多个信用证图像的出现顺序对多个信用证图像进行合并。
[0141]
具体地,由于待识别信用证图像存在多页的情况,特别是非表格版式的待识别信用证图像。当待识别信用证图像为多个信用证图像时,即存在多页的情况,因此通过字段与字段信息的位置关系,获取字段信息候选集之前,需要根据多个信用证图像的出现顺序对多个信用证图像进行合并。
[0142]
在上述实施例中,通过对多个信用证图像进行合并,可以实现结构化提取。
[0143]
在一个实施例中,对字段信息候选集进行过滤,得到目标信息之前还包括:当字段信息为目标字段信息时,将字段信息输入至段落分类模型;通过段落分类模型对属于同一个段落的目标字段信息进行提取。
[0144]
其中,目标字段信息为字段信息候选集中符合条件的字段信息,例如当预设条件为是否为description_goods与document_required等字段对应的时,目标字段信息为长字段。
[0145]
具体地,当字段信息为目标字段信息时,将字段信息输入至段落分类模型,其中段落分类模型是预先训练的,能够对换行且属于同一内容的文本需要作为一个段落进行提取的机器学习模型,通过段落分类模型能够将字段信息候选集中的目标字段信息作为一个段
落进行提取。
[0146]
在上述实施例中,通过段落分类模型能够将字段信息候选集中的目标字段信息作为一个段落进行提取,以解决相关技术中无法解决段落区分问题。
[0147]
在一个实施例中,段落分类模型是通过预先训练得到的,段落分类模型的训练过程包括:获取信用证段落文本;将信用证段落文本根据预设方法进行组合并进行标记,得到信用证训练数据;对信用证训练数据进行预处理,对信用证训练数据进行扩充;将预处理后的信用证训练数据输入至第一机器学习模型中进行训练,以得到段落分类模型。
[0148]
其中,信用证段落文本是基于真实信用证两个长字段语料,收集属于一个段落的文字,且以换行符区分是否为同一段落,结合图16所示,图16为一个实施例中收集信用证语料示意图。
[0149]
具体地,首先获取信用证段落文本,然后将信用证段落文本根据预设方法进行组合,其中可选地,可以对信用证段落文本进行随机组合,并对所有的段落文本进行标记,例如将属于同一段落的文本标记为1,否则标记为0,以得到信用证训练数据,具体结合图17所示,图17为一个实施例中信用证训练集数据示意图。
[0150]
具体地,对信用证训练数据进行预处理,例如预处理可以采用随机替换策略,以提高模型泛化性,这是因为信用证文本术语专业性,根据真实信用证两个长字段语料处理得到的训练数据会使得模型极易发生拟合,因此要对训练数据进行预处理。在其他实施例中,采用随机替换策略,达到训练语料自动扩充的目的,其中80%随机替换[mask],10%随机替换成单词,10%保持不变,具体结合图18所示,图18为一个实施例中训练数据预处理示意图。
[0151]
具体地,将预处理后的信用证训练数据输入至第一机器学习模型中进行训练,其中第一机器学习模型是指能够对相邻行的文本是否为同一段落进行判断的机器学习模型,其中可选地可以是bert语言模型,该第一机器学习模型可以对大量的信用证训练数据进行学习,得到能够对识别结果中的相邻文本行是否为同一段落进行分类的段落分类模型。具体地结合图19所示,图19为一个实施例中段落分类模型的模型训练示意图,其中第一机器学习模型选择为bert语言模型。
[0152]
在上述实施例中,通过对信用证训练数据进行预处理能够提高模型的泛化性,并且通过对信用证训练数据进行训练能够得到对识别结果中的相邻文本行是否为同一段落进行分类的段落分类模型,以实现对于换行且属于同一内容的文本需要作为一个段落进行提取。
[0153]
在一个实施例中,提供了一种信用证识别方法,具体结合图20,图20为一个实施例中信用证识别方法流程示意图,具体可分为角度矫正、检测识别以及后处理三部分。
[0154]
具体地,由于业务扫描上传的待识别信用证图像可能存在小角度的倾斜,而这会导致后续使用文字检测模型识别文本区域不准确的情况,因此在获取待识别信用证图像之后会对待识别信用证图像进行角度矫正。具体地,在本实施例中,通过图像处理操作保留信用证的最大表格,根据最大表格的角点坐标使用仿射变换进行角度矫正,可以解决信用证小角度矫正问题,具体可结合图5所示。
[0155]
具体地,使用预先训练的文字检测模型对图片进行单类别的文字检测,将图片大小进行统一,并检测出所需字段,输出文字检测框坐标点。其中文字检测模型的训练过程如
下:1、标注信用证真实数据集,其中前景文字标记为text;2、基于信用证真实数据集进行扩充,在尽量保证真实数据分布的情况下,丰富训练样本,并保证真实数据与扩充数据比值不少于1/10;3、将步骤1和步骤2中的训练集输入第二机器学习模型中,其中第二机器学习模型是指能够对文字区域进行识别的机器学习模型,在本实施例中选择retinanet模型对训练集进行训练得到基于retinanet模型的文字检测模型,基于retinanet模型的文字检测模型会根据1中的真实数据与2中的合成数据,统计anchor宽高比;考虑到文本宽高比值较大的特点,在feature map生成anchor时,根据文字宽度,仅生成宽高比大于或等于1的框;跟据统计出的anchor宽高比,结合图像增强策略等训练参数训练retinanet检测模型;根据模型推理结果好坏,不断优化训练参数、调整数据增强策略并增加数据,直至模型达到理想精度。通过基于retinanet模型的文字检测模型可对待识别信用证图像中的文字进行准确检测,然后根据检测结果对待识别信用证图像进行分割得到若干文本区域。需要说明的一点是,在本实施例中,第二机器学习模型采用的是retinanet模型,在其他实施例中可以采用任意一个机器学习模型对训练集进行训练学习,得到能够对待识别信用证图像中文本区域进行准确识别的文字检测模型。
[0156]
具体地,对长字段文本区域进行修复,这是因为信用证是文档密集型场景,存在很多长且密集的文本行,而anchor-based检测模型在长字段会存在回归不准确的情况,这样会导致识别的时候会将文本行首尾漏掉或者识别错误,导致提取错误,所以在检测模型检测完后需要对检测的结果进行修正。而信用证版式有表格与非表格两种版式,对于表格版式,修复过程如下:根据表格线边界进行定界,当长字段文本区域回归不准确的时候,也就是两端存在框不全的现象;在识别之前,会先对长字段文本区域进行判断然后强行拉到表格线附近,这里的判断是指对文本区域是否为长字段文本区域进行判断。此方法关键是先获取得到竖直的表格线;然后根据竖直的表格线在图中的位置信息作为边界,对于那些属于长字段的文本行后处理左右两端为表格线位置,具体可结合图9所示,首先对二值化设置垂直方向核结构进行膨胀腐蚀操作,获得竖直方向的二值化图,获取二值化图的轮廓坐标,然后根据长字段文本区域的最近的竖直方向表格线的边界,修复长字段两端的坐标为竖直边界位置。
[0157]
具体地,对于非表格版式,修复过程如下:非表格版式信用证数据采用基于文本行的轮廓查找方法。根据规则统计来获取边界:首先会获取到长字段文本区域中坐标位置,将该坐标位置(location[0],location[1],location[2],location[3])记录下来,并根据原始图片的宽度及长字段文本区域的高度裁剪出来切片数据;最后进行轮廓查找,找到最小的横向坐标,找到最大横向坐标作为长字段文本区域的边界。具体地,获取长字段文本区域:记录(location[0],location[1],location[2],location[3]);切图:根据长字段文本区域的纵向坐标,切图,然后根据图片的原始宽度进行裁剪,保证长字段文本区域内容都在切图里面;二值化:二值化图;竖直方向开操作:用于去除文本和竖向的表格线连在一起的情况,去除竖向表格线;横向方向闭操作:水平方向大核结构进行横向的闭操作,将文本区域内容连成块,用于进行轮廓检测,便于求得此文本区域的文本行;修复长字段:根据统计出上述的轮廓的最小和最大横向的坐标来修正(min_x,location[1],max_x,location[2])。其中可选地,在对长字段文本区域进行修复之前对分割得到的若干文本区域中长字段文本区域进行判断,若文本区域为长字段文本区域则进行修复。需要说明的一点是,在其
他实施例中,可以对分割得到所有文本区域进行修复,不局限于长字段文本区域。
[0158]
具体地,对若干文本区域中的长字段文本区域进行修复后,对文本区域进行识别。具体地使用预先训练的文字识别模型对文本区域中的文字进行识别。其中,文字识别模型的训练过程如下:1、基于真实数据与合成数据坐标,获得全部数据文本切片,作为信用证识别模型训练集;合成数据是指将文本内容填充至预先生成的信用证模板中生成的,合成数据能够减少对数据标注的人工支出;2、调整数据增强策略与1中的训练集,将训练集输入至第三机器学习模型中,其中第三机器学习模型是指能够对图像中文字进行识别的机器学习模型,在本实施例中,采用seq2seq作为第二机器学习模型;3、根据模型推理结果好坏,不断优化训练参数、调整数据增强策略并增加数据,直至模型达到理想精度,获取能够对文字进行精确识别的基于seq2seq的文字识别模型。通过基于seq2seq的文字识别模型可以对文本区域进行文字识别,得到文本区域的识别结果。需要说明的一点是,在其他实施例中可以采用任意一个机器学习模型对训练集进行训练学习,得到能够对待识别信用证图像中文字进行准确识别的文字识别模型。
[0159]
具体地,得到识别结果进行后,对识别结果进行后处理,具体结合图21所示,图21为一个实施例中的后处理流程示意图。具体流程描述如下:版式分类:区分表格和非表格版式,两种版式提取方式和提取的字段都是有差异的,加载的配置内容也有区别;表格和非表格的版式提取存在差异,所以在提取之前需要进行分类,区分版式差别然后进行结构化提取。本实施例中先配置的表格类特有的关键字段,在提取之前会先进行模糊匹配,匹配当前数据是否是表格类;具体的,遍历所有的文本行内容,如果匹配上了其中一个说明是表格版式,否则为非表格版式;版式内部根据长短字段及是否是表格去区分提取方式,例如表格类的短字段大多是左边是字段,右边是相对应的字段信息,根据左右平行关系可以提取得到。字段key匹配:信用证版式比较特殊,页数不固定、字段内容跨页且长,无法根据模板匹配方式匹配;提取字段信息之前先要找到字段候选的字段的位置及文本内容(根据正则和全称文本相似度匹配)。在本实施例案中,首先找到对应提取字段的字段位置及字段内容;由于不同图片质量的高低有差异,所以识别出来的文字或多或少会存在有个别字符识别错误的情况,影响了搜索找到字段;为了提高搜索字段的准确性,本实施例红,进行了两种方法进行搜索:1)基于key配置的正则搜索,在匹配字段前,先去加载表格和非表格对应的字段规则配置,每个txt文件对应的是每个字段的配置规则(规则内容及规则内容对应的得分,优先以得分最高的作为匹配)。基于key配置的全称的文本相似度搜索如果基于上面1)字段配置的正则搜索没有找到对应字段的话,会在基于2)全文全称的匹配方式进行文本相似度搜索,找到最有可能的字段作为基准。字段信息匹配:信用证数据是存在多页和单页情况,表格类的大多数是单页的情况,也存在多页的情况,而非表格类的大多数都是至少2页以上的数据,所以在提取识别的时候,不能只针对单页情况进行提取,故本实施例中,是针对整个待识别信用证图像作为整体进行结构化提取;待识别信用证图像里面固定字段的字段和非固定的字段信息(也就是要提取的内容)存在一定的规则和规律;字段-字段信息规则或者规律可以总结为三个:上下结构、左右结构、非上下左右结构;基于此规则或规律进行差异化结构化提取。说要说明的一点是,在提取之前,先对多页的信用证按照页的出现顺序进行合并,包括图片的合并以及检测识别结果的合并。长字段段落分类:长字段句子之间无法根据位置规则信息获取到句子语义的连续性,因此使用基于bert的语言模型进行判断长字段
上下文句子之间是否属于同个段落,并进行提取。具体地,基于bert的语言模型首先获取长字段所有候选集,并按照y坐标排序;将排好序的文本内容,每两行送入bert模型判断,判断两行输入文本是否为一句话(同一段落);根据判断结果,输出长字段信息。在基于bert的语言模型首先获取长字段所有候选集之前,还需要对候选字段信息进行判断,若候选字段信息为长字段文本则输入基于bert的语言模型,否则直接进行后处理校验。其中可选地,可以通过判断候选字段信息对应的字段是否指description_goods与document_required这两个长字段来区分候选字段信息是否为长字段。后处理校验:针对候选字段信息集合内容进行筛选过滤,最后结构化输出,具体地针对候选字段信息集合内容进行筛选过滤可以包括以下两种方式:1、根据规则过滤:部分字段具有一定的规则,比如日期等。2、过滤字段内容:候选字段信息可能会误提取到其他字段内容关键字,而这部分显然不是我们需要的,因此可以判断候选字段信息集合中是否有这些字段,如果有则进行过滤。
[0160]
在上述实施例中,针对信用证文本内容多且复杂的特点,提出了一种基于图像处理的信用证角度检测方法,简单高效;其次针对信用证两个长字段内容需要进行段落区分的要求,提出了一种基于bert语言模型的信用证长字段段落分类策略;针对信用证文本内容多且业务逻辑复杂的特点,一种包含版式分类、字段匹配、字段信息匹配、长字段段落分类、后处理校验的后处理流程,可以解决信用证多版式、识别信息跨页、背景干扰、段落区分等问题。
[0161]
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0162]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的信用证识别方法的信用证识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个信用证识别装置实施例中的具体限定可以参见上文中对于信用证识别方法的限定,在此不再赘述。
[0163]
在一个实施例中,如图22所示,提供了一种信用证识别装置,包括:获取模块100、文本区域检测模块200、识别模块300和后处理模块400,其中:
[0164]
获取模块100,用于获取待识别信用证图像。
[0165]
文本区域检测模块200,用于将待识别信用证图像进行分割,得到若干文本区域。
[0166]
识别模块300,用于对文本区域进行文字识别,得到文本区域的识别结果。
[0167]
后处理模块400,用于根据预设规则对文本区域的识别结果进行后处理得到结构化目标信息。
[0168]
在一个实施例中,上述信用证识别装置还包括:
[0169]
角度矫正模块,用于对待识别信用证图像进行角度矫正。
[0170]
在一个实施例中,上述角度矫正模块包括:
[0171]
二值化单元,用于将待识别信用证图像进行二值化处理得到二值化图像。
[0172]
表格轮廓提取单元,用于提取二值化图像中的全部表格轮廓。
[0173]
表格轮廓处理单元,用于对全部表格轮廓进行处理得到面积最大表格的目标轮廓。
[0174]
旋转角度计算单元,用于计算面积最大表格的目标轮廓中相邻直线夹角得到旋转角度。
[0175]
矫正单元,用于根据旋转角度对待识别信用证图像进行角度矫正。
[0176]
在一个实施例中,上述表格轮廓提取单元包括:
[0177]
过滤子单元,用于根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格。
[0178]
待处理表格获取单元,用于获取与当前表格相邻的待处理表格。
[0179]
合并单元,用于将待处理表格与当前表格合并作为新的当前表格,并继续获取与当前表格相邻的待处理表格,直至获取面积最大表格,提取面积最大表格的目标轮廓。
[0180]
在一个实施例中,上述信用证识别装置还包括:
[0181]
修复模块,用于对文本区域进行修复。
[0182]
在一个实施例中,上述修复模块还包括:
[0183]
版式获取单元,用于获取待识别信用证图像对应的版式。
[0184]
文本区域修复单元,用于根据版式对文本区域进行修复。
[0185]
在一个实施例中,上述文本区域修复单元包括:
[0186]
待处理边界获取子单元,用于当待识别信用证图像为表格版式时,提取文本区域中的目标方向的待处理边界。
[0187]
目标边界获取子单元,用于获取距离文本区域中目标类型的文本区域最近的待处理边界作为目标边界。
[0188]
边界移动子单元,用于将目标类型的文本区域的边界移动至目标边界。
[0189]
在一个实施例中,上述文本区域修复单元还包括:
[0190]
坐标获取子单元,用于当待识别信用证图像为非表格版式时,获取文本区域中目标类型的文本区域的坐标。
[0191]
文本切片获取子单元,用于根据坐标以及待识别信用证图像的宽度对待识别信用证图像进行分割,得到目标类型的文本区域对应的文本切片。
[0192]
内容轮廓获取子单元,用于分别对文本切片的不同方向进行对应的图像操作得到内容轮廓。
[0193]
区域修复子单元,用于根据内容轮廓的横坐标对目标类型的文本区域进行修复。
[0194]
在一个实施例中,上述后处理模块400还包括:
[0195]
候选字段集合获取单元,用于根据预设版式结构提取识别结果中的候选字段集合。
[0196]
字段匹配单元,用于根据预设版式对应的预设配置规则进行匹配得到候选字段集合中每一字段对应的字段位置以及字段内容。
[0197]
字段信息候选集获取单元,用于通过字段与字段信息的位置关系,获取字段信息候选集。
[0198]
目标信息获取单元,用于对字段信息候选集进行过滤,得到目标信息。
[0199]
在一个实施例中,上述后处理模块还包括:
[0200]
区分字段获取单元,用于获取版式区分字段。
[0201]
版式匹配单元,用于将识别结果与版式区分字段进行匹配以确定待识别信用证图像的版式。
[0202]
在一个实施例中,上述后处理模块400还包括:
[0203]
图像合并单元,用于当待识别信用证图像为多个信用证图像时,根据多个信用证图像的出现顺序对多个信用证图像进行合并。
[0204]
在一个实施例中,上述后处理模块400还包括:
[0205]
段落分类单元,用于当字段信息为目标字段信息时,将字段信息输入至段落分类模型;通过段落分类模型对属于同一个段落的目标字段信息进行提取。
[0206]
在一个实施例中,上述后处理模块400还包括:
[0207]
段落文本获取单元,用于获取信用证段落文本。
[0208]
训练数据获取单元,用于将信用证段落文本根据预设方法进行组合并进行标记,得到信用证训练数据。
[0209]
预处理单元,用于对信用证训练数据进行预处理,得到预处理后的信用证训练数据。
[0210]
模型训练单元,用于将预处理后的信用证训练数据输入至第一机器学习模型中进行训练,以得到段落分类模型。
[0211]
上述信用证识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0212]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图23所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待识别信用证图像数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信用证识别方法。
[0213]
本领域技术人员可以理解,图23中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0214]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0215]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0216]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0217]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机
可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0218]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0219]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献