一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于纸质文件的数据处理方法、装置和计算机设备与流程

2022-12-09 19:28:25 来源:中国专利 TAG:


1.本技术涉及到人工智能技术领域,特别是涉及到一种基于纸质文件的数据处理方法、装置、计算机设备和存储介质。


背景技术:

2.数据记录及处理,有些是基于纸质文件来完成的,即,纸质文件中记录有(例如采用人工手写而成)相关的数据。基于这些纸质文件的数据处理不易进行,原因在于,若采用人工处理,耗时费力且易出错;若采用计算机中的文字识别技术等来处理,只能得到等价值的数据(即无法区分出不同的数据),因此难以进行进一步地数据处理。因此,传统方案难以完成纸质文件的数据处理,尤其难以实现自动地基于纸质文件的数据处理。


技术实现要素:

3.本技术提出一种基于纸质文件的数据处理方法、装置和计算机设备,旨在解决难以对纸质文件进行数据处理的技术问题。
4.为了实现上述发明目的,本技术首先提供一种一种基于纸质文件的数据处理方法,所述纸质文件在原始状态下由直接接触层、油墨层、间隔层和文字承载层构成,所述直接接触层、油墨层、间隔层和文字承载层顺序层叠,并且所述间隔层可在保证所述直接接触层、油墨层和文字承载层相对位置不变的情况下被拆离;所述油墨层包括相互分隔的第一区域和第二区域,所述第一区域中的第一油墨材料在红外线条件下呈现第一颜色;所述第二区域中的第二油墨材料在紫外线条件下呈现第二颜色;所述数据处理方法包括:
5.采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;其中,未知状态指所述纸质文件中的直接接触层、油墨层和间隔层均未被拆离的状态,或者所述纸质文件中的直接接触层、油墨层和间隔层中的一者或者多者被拆离的状态;
6.若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,以使所述纸质文件同时处于红外线照射与紫外线照射的环境中;
7.开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像;
8.根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,其中所述翻转图片包括对应于第一背面文字图像的第一正面文字图像,以及包括对应于第二背面文字图像的第二正面文字图像;
9.采用预设的文字识别方法,对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;
10.调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。
11.进一步地,所述直接接触层、油墨层、间隔层和文字承载层均具有透光区域,所述直接接触层、油墨层、间隔层和文字承载层的透光区域在竖直方向上的空间位置相等,并且所述间隔层的透光区域的透光性弱于其余三层的透光区域的透光性;所述采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离的步骤,包括:
12.在所述直接接触层的透光区域的上方,采用预设的可见光发生器生成探测用可见光,以使所述探测用可见光穿过所述直接接触层的透光区域;
13.在所述文字承载层的下方,获取预设的光强感应器感测到的光强信号;
14.判断所述光强信号是否大于预设的光强阈值;
15.若所述光强信号大于预设的光强阈值,则判定所述纸质文件中的所述间隔层被拆离。
16.进一步地,所述开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像的步骤之后,以及所述根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,得到对应于所述背面图片的翻转图片的步骤之前,所述数据处理方法还包括:
17.根据预设的字迹断裂点检测方法,对所述背面图片进行检测,从而得到字迹断裂点数量;
18.判断所述字迹断裂点数量是否小于预设的断裂点数量阈值;
19.若所述字迹断裂点数量小于预设的断裂点数量阈值,则生成镜像翻转指令,所述镜像翻转指令用于指示根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理。
20.进一步地,所述第一识别文字和所述第二识别文字均包括文字部分和数字部分;所述使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果的步骤,包括:
21.利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字,以及将所述第二识别文字拆分为第二文字和第二数字;
22.调用预设的计算公式,并将所述第一数字和所述第二数字输入所述计算公式中,从而得到计算结果;
23.调用预设的表格模板,将所述第一文字和所述第二文字分别填入所述表格模板中的预设文字位置中,以及将所述计算结果填入所述表格模板中的预设数字位置中,并将填写完的表格模板记为所述处理结果。
24.进一步地,所述文字承载层上预先绘制有由第二油墨绘制成的第一形状区域,以及由第一油墨绘制成的第二形状区域,所述第一文字在垂直于纸面的方向上位于所述第一形状区域内,所述第一数字在垂直于纸面的方向上位于所述第二形状区域内;所述利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字的步骤,包括:
25.获取所述翻转图片中显现为第二颜色的第一形状区域,以及获取所述翻转图片中显现为第一颜色的第二形状区域;
26.将所述翻转图片的第一形状区域中的第一识别文字记为第一文字,并将所述翻转图片的第二形状区域中的第一识别文字记为第一数字。
27.本技术提供一种基于纸质文件的数据处理装置,所述纸质文件在原始状态下由直接接触层、油墨层、间隔层和文字承载层构成,所述直接接触层、油墨层、间隔层和文字承载层顺序层叠,并且所述间隔层可在保证所述直接接触层、油墨层和文字承载层相对位置不变的情况下被拆离;所述油墨层包括相互分隔的第一区域和第二区域,所述第一区域中的第一油墨材料在红外线条件下呈现第一颜色;所述第二区域中的第二油墨材料在紫外线条件下呈现第二颜色;所述装置包括:
28.间隔层判断单元,用于采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;其中,未知状态指所述纸质文件中的直接接触层、油墨层和间隔层均未被拆离的状态,或者所述纸质文件中的直接接触层、油墨层和间隔层中的一者或者多者被拆离的状态;
29.闪光灯开启单元,用于若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,以使所述纸质文件同时处于红外线照射与紫外线照射的环境中;
30.背面图片获取单元,用于开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像;
31.翻转图片获取单元,用于根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,其中所述翻转图片包括对应于第一背面文字图像的第一正面文字图像,以及包括对应于第二背面文字图像的第二正面文字图像;
32.识别文字获取单元,用于采用预设的文字识别方法,对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;
33.处理结果获取单元,用于调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。
34.进一步地,所述直接接触层、油墨层、间隔层和文字承载层均具有透光区域,所述直接接触层、油墨层、间隔层和文字承载层的透光区域在竖直方向上的空间位置相等,并且所述间隔层的透光区域的透光性弱于其余三层的透光区域的透光性;所述间隔层判断单元,包括:
35.探测用可见光生成子单元,用于在所述直接接触层的透光区域的上方,采用预设的可见光发生器生成探测用可见光,以使所述探测用可见光穿过所述直接接触层的透光区域;
36.光强信号获取子单元,用于在所述文字承载层的下方,获取预设的光强感应器感测到的光强信号;
37.光强阈值判断子单元,用于判断所述光强信号是否大于预设的光强阈值;
38.间隔层判定子单元,用于若所述光强信号大于预设的光强阈值,则判定所述纸质文件中的所述间隔层被拆离。
39.进一步地,所述装置,还包括:
40.字迹断裂点检测单元,用于根据预设的字迹断裂点检测方法,对所述背面图片进
行检测,从而得到字迹断裂点数量;
41.断裂点数量阈值判断单元,用于判断所述字迹断裂点数量是否小于预设的断裂点数量阈值;
42.镜像翻转指令生成单元,用于若所述字迹断裂点数量小于预设的断裂点数量阈值,则生成镜像翻转指令,所述镜像翻转指令用于指示根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理。
43.本技术提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的数据处理方法的步骤。
44.本技术提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的数据处理方法的步骤。
45.本技术的基于纸质文件的数据处理方法、装置、计算机设备和存储介质,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,从而得到不同颜色的文字,实现了数据区分,为自动化的数据处理提供了可能;开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,可以杜绝因为直接接触层、油墨层的阻隔而无法获取到准确的图片的情况发生,为后续数据处理的准确性提供保障;对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,克服了正面阻碍(即直接接触层、油墨层),以得到记录有文字承载层上的文字的翻转图片;对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果,结合图片文字识别和处理模型,从而提高了基于纸质文件的数据处理的效率与准确性。
附图说明
46.图1为本技术一实施例的基于纸质文件的数据处理方法的流程示意图;
47.图2为本技术一实施例的基于纸质文件的数据处理装置的结构示意框图;
48.图3为本技术一实施例的计算机设备的结构示意框图;
49.图4为本技术一实施例的纸质文件的结构示意图。
50.附图标记如下:直接接触层1、油墨层2、间隔层3和文字承载层4。
51.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
52.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
53.参照图1,本技术实施例提供一种基于纸质文件的数据处理方法,所述纸质文件在原始状态下由直接接触层、油墨层、间隔层和文字承载层构成,所述直接接触层、油墨层、间隔层和文字承载层顺序层叠,并且所述间隔层可在保证所述直接接触层、油墨层和文字承
载层相对位置不变的情况下被拆离;所述油墨层包括相互分隔的第一区域和第二区域,所述第一区域中的第一油墨材料在红外线条件下呈现第一颜色,并且所述第一油墨材料在可见光条件下呈现第三颜色;所述第二区域中的第二油墨材料在紫外线条件下呈现第二颜色,并且所述第二油墨材料在可见光条件下呈现第三颜色;所述数据处理方法包括:
54.s1、采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;其中,未知状态指所述纸质文件中的直接接触层、油墨层和间隔层均未被拆离的状态,或者所述纸质文件中的直接接触层、油墨层和间隔层中的一者或者多者被拆离的状态;
55.s2、若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,以使所述纸质文件同时处于红外线照射与紫外线照射的环境中;
56.s3、开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像;
57.s4、根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,其中所述翻转图片包括对应于第一背面文字图像的第一正面文字图像,以及包括对应于第二背面文字图像的第二正面文字图像;
58.s5、采用预设的文字识别方法,对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;
59.s6、调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。
60.本技术通过特别的设计,以实现自动地基于纸质文件的数据处理,具体的特别之处在此先行介绍:
61.1、采用特别的纸质文件,即所述纸质文件在原始状态下由直接接触层、油墨层、间隔层和文字承载层构成(如图4所示),所述直接接触层、油墨层、间隔层和文字承载层顺序层叠,并且所述间隔层可在保证所述直接接触层、油墨层和文字承载层相对位置不变的情况下被拆离;所述油墨层包括相互分隔的第一区域和第二区域,所述第一区域中的第一油墨材料在红外线条件下呈现第一颜色,并且所述第一油墨材料在可见光条件下呈现第三颜色;所述第二区域中的第二油墨材料在紫外线条件下呈现第二颜色,并且所述第二油墨材料在可见光条件下呈现第三颜色。从而在常态下(可见光状态下),所述纸质文件与普通文件并无区别,不影响正常使用;但在红外线条件下与紫外线条件下,不同区域的文字(若所述纸质文件上已写有文字)呈现不同的颜色,从而可将数据区分开来。从而以这种设计,在不影响正常使用的前提下,实现了数据区分,为自动化的数据处理提供了可能。
62.2、采用了采集背面图片的方式,避免正面图片可能采集不到具体文字的缺陷(因为纸质文件的直接接触层和油墨层中的一层或多层可能未被拆离,此时会阻碍正面图片的采集)。
63.3、所述纸质文件的末层,即文字承载层在常态下(即可见光状态下)不显现文字,因此有利于提高信息安全性,但不会妨碍使用(用于计算机识别)。
64.本技术可应用于任意可行场景,例如应用于财务领域等,更具体地,所述纸质文件例如为财务中的票据等,所述直接接触层上可用实体笔进行书写,对应地所述文字承载层
上将印有可见光状态下不可见的文字。
65.本技术的纸质文件中的直接接触层、油墨层、间隔层和文字承载层顺序层叠,可以用任意可行方式连接或者不连接,例如通过夹接、粘接等方式顺序层叠。所述第一油墨材料在红外线条件下呈现第一颜色,是指所述第一油墨材料中包含能够将红外线转换为呈现第一颜色的可见光的物质,该物质例如为掺杂杂质的氟氧基类化合物,该掺杂杂质例如为高掺杂er
3
等离子,从而能够将红外线转为绿色可见光;所述第二油墨材料在紫外线条件下呈现第二颜色,是指所述第二油墨材料中包含能够将紫外线转换为呈现第二颜色的可见光的物质,例如为马来酸酐共聚物基树脂等等。
66.所述纸质文件上书写文字的过程在此进行介绍:使用者先将间隔层拆离后(若不拆离,则文字承载层无法承接油墨),再使用实体笔在所述直接接触层上书写文字,从而直接接触层上有手写文字,此时油墨层由于实体笔的压力,将第一油墨材料或者第二油墨材料印制在文字承载层上。在此需要注意的是,在书写完文字之后,所述直接接触层可用于人眼直接识别,作为日常使用,而文字承载层人眼无法识别,作为计算机识别使用,从而以两种不同的形式,同时记录了信息。
67.如上述步骤s1所述,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;其中,未知状态指所述纸质文件中的直接接触层、油墨层和间隔层均未被拆离的状态,或者所述纸质文件中的直接接触层、油墨层和间隔层中的一者或者多者被拆离的状态。其中所述纸质文件被置于识别区域可采用人工放置,或者采用机械手放置的方式,优选采用机械手放置的方式,从而实现整体方案的全自动化实施。其中所述间隔层拆离判断方法可采用任意可行方法,例如通过监测纸质文件的厚度,从而判断纸质文件中的所述间隔层是否被拆离。
68.如上述步骤s2所述,若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,以使所述纸质文件同时处于红外线照射与紫外线照射的环境中。若所述纸质文件中的所述间隔层被拆离,表明所述纸质文件可能被使用过,意味着所述文字承载层上很可能印制有油墨,可作为进一步识别的基础。而文字承载层上的油墨是在可见光下不可见的,因此需要开启预设的红外线闪光灯与紫外线闪光灯,以使文字承载层上的油墨发出不同颜色的可见光。
69.如上述步骤s3所述,开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像。本技术采用所述第一摄像头对所述纸质文件的背面进行拍照,而非对所述纸质文件的正面进行拍照,原因在于,所述纸质文件可在仅拆离间隔层的情况下再进行识别,此时纸质文件依次层叠有直接接触层、油墨层和文字承载层,若从正面进行拍照,由于直接接触层、油墨层的阻隔,则无法获得准确的图片。另外,由于油墨层和文字承载层相邻,因此油墨层可能在背面图片呈现出背景颜色,但是,由于文字承载层上的油墨是通过实体笔的压力压制而成的,因此具有一定的压痕,反应在背面图片上,则能够与其他区域存在明显区别,因此能够被识别出。进一步地,本技术还采用所述油墨层和文字承载层以间隔预设距离的方式层叠的设计,以提高背面图片中图像的对比度。进一步地,所述文字承载层的透光率大于预设的透光阈值,以便于背面图片更清晰地获取文字。进一步地,所述文字承载层的的厚度小于预设的厚度阈值,以便于背面图片更清
晰地获取文字。
70.如上述步骤s4所述,根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,其中所述翻转图片包括对应于第一背面文字图像的第一正面文字图像,以及包括对应于第二背面文字图像的第二正面文字图像。背面图片中的文字与普通的文字图片不同,是相反着的,因此需要进一步进行处理。因此,本技术根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,所得到的翻转图片即与正面图片的文字相同。从而本技术以这种设计,克服了正面阻碍(即直接接触层、油墨层),以得到记录有文字承载层上的文字的翻转图片。
71.如上述步骤s5所述,采用预设的文字识别方法,对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字。其中所述文字识别文法可采用任意可行的识别方法,例如为ocr识别方法等。由于翻转图片中存在不同颜色的文字图像,即呈现第一颜色的第一正面文字图像,以及呈现第二颜色的第二正面文字图像,因此以颜色为依据从而实现了数据的区分,从而克服了传统方案难以完成纸质文件的数据处理(因为传统方案难以区分数据)。
72.如上述步骤s6所述,调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。其中所述处理模型可为任意可行模型,在此试举一例。所述处理模型例如为包括计算公式的模型,所述第一识别文字和所述第二识别文字分别包括第一数值和第二数值,将第一数值和第二数值输入计算公式即可得到计算结果,并将计算结果作为所述处理模型输出的处理结果。其中,所述处理模型可存储于预先设置的区块链中。
73.在一个实施方式中,所述直接接触层、油墨层、间隔层和文字承载层均具有透光区域,所述直接接触层、油墨层、间隔层和文字承载层的透光区域在竖直方向上的空间位置相等,并且所述间隔层的透光区域的透光性弱于其余三层的透光区域的透光性;所述采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离的步骤s1,包括:
74.s101、在所述直接接触层的透光区域的上方,采用预设的可见光发生器生成探测用可见光,以使所述探测用可见光穿过所述直接接触层的透光区域;
75.s102、在所述文字承载层的下方,获取预设的光强感应器感测到的光强信号;
76.s103、判断所述光强信号是否大于预设的光强阈值;
77.s104、若所述光强信号大于预设的光强阈值,则判定所述纸质文件中的所述间隔层被拆离。
78.如上所述,实现了采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离。其中,所述透光区域可设于每层的任意可行位置,例如为中央位置,侧边边缘位置等。当所述纸质文件包括四层时,由于间隔层的存在,因此纸质文件的透光区域的透光性较差;当拆离了间隔层时,由于透光性差的间隔层的去除,因此纸质文件的透光区域的透光性较强,据此,可作为所述纸质文件中的所述间隔层是否被拆离的判断依据。因此,本技术在所述直接接触层的透光区域的上方,采用预设的可见光发生器生成探测用可见光,以使所述探测用可见光穿过所述直接接触层的透光区域;在所述文字承载层的下方,获取预设的光强感应器感测到的光强信号;若所述光强信号大于预设的光强阈值,则判定所述纸质文件中的所述间隔层被拆离。从而实现了精确判断所述间隔层是否被拆离。
79.在一个实施方式中,所述开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像的步骤s3之后,以及所述根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,得到对应于所述背面图片的翻转图片的步骤s4之前,还包括:
80.s31、根据预设的字迹断裂点检测方法,对所述背面图片进行检测,从而得到字迹断裂点数量;
81.s32、判断所述字迹断裂点数量是否小于预设的断裂点数量阈值;
82.s33、若所述字迹断裂点数量小于预设的断裂点数量阈值,则生成镜像翻转指令,所述镜像翻转指令用于指示根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理。
83.如上所述,实现了生成镜像翻转指令。本技术是以获取背面图片的方式,来绕过正面图片不可得的阻碍。但是,背面图片毕竟存在本征的文字承载层的阻碍,因此文字清晰度不可避免的较差。在文字清晰度不够的情况下,则该背面图片可能造成识别错误,因此不能作为识别依据。而文字清晰度不够,在本技术的文字中,反应为字迹断裂点较多(即文字承载层正面的文字的部分未显现在背面图片上,因此造成断裂,从而字迹断裂点较多)。因此,本技术根据预设的字迹断裂点检测方法,对所述背面图片进行检测,从而得到字迹断裂点数量;再以判断所述字迹断裂点数量是否小于预设的断裂点数量阈值的方式,来确定背面图片是否可用。若所述字迹断裂点数量小于预设的断裂点数量阈值,则生成镜像翻转指令,从而保证了最终的识别与数据处理的准确性。
84.在一个实施方式中,所述第一识别文字和所述第二识别文字均包括文字部分和数字部分;所述使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果的步骤s6,包括:
85.s601、利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字,以及将所述第二识别文字拆分为第二文字和第二数字;
86.s602、调用预设的计算公式,并将所述第一数字和所述第二数字输入所述计算公式中,从而得到计算结果;
87.s603、调用预设的表格模板,将所述第一文字和所述第二文字分别填入所述表格模板中的预设文字位置中,以及将所述计算结果填入所述表格模板中的预设数字位置中,并将填写完的表格模板记为所述处理结果。
88.如上所述,实现了使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理。本技术尤其适用于将纸质文件上记录的数据,例如数字等,进行识别后并进行处理。具体地,本技术利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字,以及将所述第二识别文字拆分为第二文字和第二数字;调用预设的计算公式,并将所述第一数字和所述第二数字输入所述计算公式中,从而得到计算结果;再将所述第一文字和所述第二文字分别填入所述表格模板中的预设文字位置中,以及将所述计算结果填入所述表格模板中的预设数字位置中,从而得到处理结果。其中,所述纸质文件例如为财务领域的票据,其中存在文字及数字(当然在识别过程中统一处理为识别文字),该数字例如为报销金额等,文字例如为提交人名等。其中数字需要具体计算,例如对于报销金额,其可能需要乘
以相应的比例系数(预先设置),再与预设的金额数值相比,以确定不超过所述预设的金额数值;另外,数字还可以包括任意可行的数字,例如包括垫付金额等。在识别出第一数字和第二数字后,再调用预设的计算公式,即可得到计算结果,其中所述计算公式与第一数字和第二数字对应,即第一数字和第二数字是来自于财务领域的票据,则计算公式为对应的预设的任意可行的财务计算公式。最终,得到的填写完的表格模板是对纸质文件的最终处理结果,实现了基于纸质文件的全自动数据处理。
89.在一个实施方式中,所述文字承载层上预先绘制有由第二油墨绘制成的第一形状区域,以及由第一油墨绘制成的第二形状区域,所述第一文字在垂直于纸面的方向上位于所述第一形状区域内,所述第一数字在垂直于纸面的方向上位于所述第二形状区域内;所述利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字的步骤s601,包括:
90.s6011、获取所述翻转图片中显现为第二颜色的第一形状区域,以及获取所述翻转图片中显现为第一颜色的第二形状区域;
91.s6012、将所述翻转图片的第一形状区域中的第一识别文字记为第一文字,并将所述翻转图片的第二形状区域中的第一识别文字记为第一数字。
92.如上所述,实现了利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字。本技术采用特别的设计,以提高第一识别文字的拆分速度。即,所述文字承载层上预先绘制有由第二油墨绘制成的第一形状区域,以及由第一油墨绘制成的第二形状区域,所述第一文字在垂直于纸面的方向上位于所述第一形状区域内,所述第一数字在垂直于纸面的方向上位于所述第二形状区域内。在此需要强调的是,第一文字对应的第一形状区域,其是由第二油墨绘制成的,而第一数字对应的第二形状区域,其是由第一油墨绘制而成的,这是有重要区别的。原因在于,采用这种设置之后,采用两种不同的油墨绘制的形状区域、不同的形状区域、不同的识别文字(呈现不同的颜色),能够尽可能多的实现数据的区分,从而基于纸质文件的全自动数据处理更易实现,且能够适用于数据类别(例如需要将第一数字进一步划分出多个子数字等)更多的场景。
93.本技术的基于纸质文件的数据处理方法,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯;开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片;对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片;对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。从而提高了基于纸质文件的数据处理的效率与准确性。
94.参照图2,本技术实施例提供一种基于纸质文件的数据处理装置,所述纸质文件在原始状态下由直接接触层、油墨层、间隔层和文字承载层构成,所述直接接触层、油墨层、间隔层和文字承载层顺序层叠,并且所述间隔层可在保证所述直接接触层、油墨层和文字承载层相对位置不变的情况下被拆离;所述油墨层包括相互分隔的第一区域和第二区域,所述第一区域中的第一油墨材料在红外线条件下呈现第一颜色,并且所述第一油墨材料在可见光条件下呈现第三颜色;所述第二区域中的第二油墨材料在紫外线条件下呈现第二颜
色,并且所述第二油墨材料在可见光条件下呈现第三颜色;所述装置包括:
95.间隔层判断单元,用于采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;其中,未知状态指所述纸质文件中的直接接触层、油墨层和间隔层均未被拆离的状态,或者所述纸质文件中的直接接触层、油墨层和间隔层中的一者或者多者被拆离的状态;
96.闪光灯开启单元,用于若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯,以使所述纸质文件同时处于红外线照射与紫外线照射的环境中;
97.背面图片获取单元,用于开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片,其中所述背面图片包括呈现第一颜色的第一背面文字图像和呈现第二颜色的第二背面文字图像;
98.翻转图片获取单元,用于根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片,其中所述翻转图片包括对应于第一背面文字图像的第一正面文字图像,以及包括对应于第二背面文字图像的第二正面文字图像;
99.识别文字获取单元,用于采用预设的文字识别方法,对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;
100.处理结果获取单元,用于调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。
101.其中上述单元、子单元或模块分别用于执行的操作与前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
102.在一个实施方式中,所述直接接触层、油墨层、间隔层和文字承载层均具有透光区域,所述直接接触层、油墨层、间隔层和文字承载层的透光区域在竖直方向上的空间位置相等,并且所述间隔层的透光区域的透光性弱于其余三层的透光区域的透光性;所述间隔层判断单元,包括:
103.探测用可见光生成子单元,用于在所述直接接触层的透光区域的上方,采用预设的可见光发生器生成探测用可见光,以使所述探测用可见光穿过所述直接接触层的透光区域;
104.光强信号获取子单元,用于在所述文字承载层的下方,获取预设的光强感应器感测到的光强信号;
105.光强阈值判断子单元,用于判断所述光强信号是否大于预设的光强阈值;
106.间隔层判定子单元,用于若所述光强信号大于预设的光强阈值,则判定所述纸质文件中的所述间隔层被拆离。
107.其中上述单元、子单元或模块分别用于执行的操作与前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
108.在一个实施方式中,所述装置,还包括:
109.字迹断裂点检测单元,用于根据预设的字迹断裂点检测方法,对所述背面图片进行检测,从而得到字迹断裂点数量;
110.断裂点数量阈值判断单元,用于判断所述字迹断裂点数量是否小于预设的断裂点数量阈值;
111.镜像翻转指令生成单元,用于若所述字迹断裂点数量小于预设的断裂点数量阈值,则生成镜像翻转指令,所述镜像翻转指令用于指示根据预设的左右镜像翻转处理方法,对所述背面图片进行翻转处理。
112.其中上述单元、子单元或模块分别用于执行的操作与前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
113.在一个实施方式中,所述第一识别文字和所述第二识别文字均包括文字部分和数字部分;所述处理结果获取单元,包括:
114.文字拆分子单元,用于利用所述处理模型将所述第一识别文字拆分为第一文字和第一数字,以及将所述第二识别文字拆分为第二文字和第二数字;
115.计算结果获取子单元,用于调用预设的计算公式,并将所述第一数字和所述第二数字输入所述计算公式中,从而得到计算结果;
116.处理结果获取子单元,用于调用预设的表格模板,将所述第一文字和所述第二文字分别填入所述表格模板中的预设文字位置中,以及将所述计算结果填入所述表格模板中的预设数字位置中,并将填写完的表格模板记为所述处理结果。
117.其中上述单元、子单元或模块分别用于执行的操作与前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
118.在一个实施方式中,所述文字承载层上预先绘制有由第二油墨绘制成的第一形状区域,以及由第一油墨绘制成的第二形状区域,所述第一文字在垂直于纸面的方向上位于所述第一形状区域内,所述第一数字在垂直于纸面的方向上位于所述第二形状区域内;所述文字拆分子单元,包括:
119.形状区域获取模块,用于获取所述翻转图片中显现为第二颜色的第一形状区域,以及获取所述翻转图片中显现为第一颜色的第二形状区域;
120.文字和数字获取模块,用于将所述翻转图片的第一形状区域中的第一识别文字记为第一文字,并将所述翻转图片的第二形状区域中的第一识别文字记为第一数字。
121.其中上述单元、子单元或模块分别用于执行的操作与前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
122.本技术的基于纸质文件的数据处理装置,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯;开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片;对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片;对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。从而提高了基于纸质文件的数据处理的效率与准确性。
123.参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接
口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于纸质文件的数据处理方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于纸质文件的数据处理方法。
124.上述处理器执行上述基于纸质文件的数据处理方法,其中所述方法包括的步骤分别与执行前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
125.本领域技术人员可以理解,图中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定。
126.本技术的计算机设备,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯;开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片;对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片;对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。从而提高了基于纸质文件的数据处理的效率与准确性。
127.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现基于纸质文件的数据处理方法,其中所述方法包括的步骤分别与执行前述实施方式的基于纸质文件的数据处理方法的步骤一一对应,在此不再赘述。
128.本技术的计算机可读存储介质,采用预设的间隔层拆离判断方法,判断所述纸质文件中的所述间隔层是否被拆离;若所述纸质文件中的所述间隔层被拆离,则开启预设的红外线闪光灯与紫外线闪光灯;开启预设的第一摄像头,并采用所述第一摄像头对所述纸质文件的背面进行拍照,从而得到背面图片;对所述背面图片进行翻转处理,从而得到对应于所述背面图片的翻转图片;对所述翻转图片进行文字识别处理,从而得到对应于所述第一正面文字图像的第一识别文字,以及得到对应于所述第二正面文字图像的第二识别文字;调用预设的处理模型,并使用所述处理模型对所述第一识别文字和所述第二识别文字进行处理,从而得到所述处理模型输出的处理结果。从而提高了基于纸质文件的数据处理的效率与准确性。
129.进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
130.本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
131.区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
132.本技术可应用于智慧城市领域中,从而推动智慧城市的建设。
133.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
134.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
135.以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献