一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于OCR技术的文档信息智能获取和纠错方法、系统及设备与流程

2022-02-20 13:25:12 来源:中国专利 TAG:

基于ocr技术的文档信息智能获取和纠错方法、系统及设备
技术领域
1.本发明实施例涉及人工智能领域,尤其涉及一种基于ocr技术的文档信息智能获取和纠错方法、系统及设备。


背景技术:

2.一些平台会发布一些在售的产品的公告文件,例如,金融平台发布的一些基金类相关的公告文件,而快速准确的获取到公告文件中的重要信息显得尤为重要。随着互联网技术的高速发展,网络上的信息量也在爆炸式增长,各个金融平台发布的公告文件若只靠用户自行阅读难以完成对所有的产品要素信息进行获取,且通过人工检索公告中的产品要素信息容易出现遗漏和录入误差等。而现有技术中用于提取各类公告中的产品要素信息的工具往往存在准确率低和效率低的问题。因此,如何解决现有技术中对于各类公告中的产品要素信息提取工具的提取准确率低和提取效率低的问题,成为了当期亟需解决的技术问题。


技术实现要素:

3.有鉴于此,有必要提供一种基于ocr技术的文档信息智能获取和纠错方法、系统、设备及可读存储介质,以解决现有技术中对于各类公告中的产品要素信息提取工具的提取准确率低和提取效率低的问题。
4.为实现上述目的,本发明实施例提供了一种基于ocr技术的文档信息智能获取和纠错方法,所述方法步骤包括:
5.获取公告文件,并解析所述公告文件以得到公告文本;
6.通过预先训练好的语言表示模型获取所述公告文本中各个字符的置信度;
7.判断所述公告文本是否为预设类型文本;
8.如果所述公告文本不是所述预设类型文本,则将所述公告文本和各个字符的置信度输入到预设ocr纠错模型,以通过所述预设ocr纠错模型对所述公告文本中置信度低于预设阈值的字符进行纠错操作,得到纠错后的目标公告文本;
9.根据所述目标公告文本从预先配置的信息要素表中匹配多个目标要素值;及
10.根据所述多个目标要素值从所述目标公告文本中提取多个公告数据。
11.可选的,所述获取公告文件,并解析所述公告文件以得到公告文本的步骤,包括:
12.对所述公告文件进行格式转换操作,以得到图片格式的公告文件;及
13.基于文字识别技术提取所述图片格式的公告文件的文字内容,并根据所述文字内容生成所述公告文本。
14.可选的,还包括:
15.如果所述公告文本是所述预设类型文本,则根据预设关键词表对所述公告文本进行纠错操作,以得到所述纠错后的目标公告文本。
16.可选的,所述如果所述公告文本是所述预设类型文本,则根据预设关键词表对所
述公告文本进行纠错操作,以得到所述纠错后的目标公告文本的步骤,包括:
17.从所述公告文本中获取置信度低于预设阈值的多个目标字符;
18.根据所述多个目标字符从所述公告文本中提取多个候选词;及
19.根据所述预设关键词表对所述多个候选词进行纠错操作,以得到所述纠错后的目标公告文本。
20.可选的,所述根据所述多个目标要素值从所述目标公告文本中提取多个公告数据的步骤,包括:
21.根据所述多个目标要素值和预先配置的匹配规则从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素;及
22.根据所述多个目标要素从所述目标公告文本中提取多个公告数据。
23.可选的,所述根据所述多个目标要素值和预先配置的匹配规则从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素的步骤,包括:
24.根据所述匹配规则将所述多个目标要素值转化为多个正则表达式;及
25.根据所述多个正则表达式从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素。
26.可选的,还包括:将所述多个公告数据上传到区块链。
27.为实现上述目的,本发明实施例还提供了一种基于ocr技术的文档信息智能获取和纠错系统,包括:
28.解析模块,用于获取公告文件,并解析所述公告文件以得到公告文本;
29.获取模块,用于通过预先训练好的语言表示模型获取所述公告文本中各个字符的置信度;
30.判断模块,用于判断所述公告文本是否为预设类型文本;
31.输入模块,用于如果所述公告文本不是所述预设类型文本,则将所述公告文本和各个字符的置信度输入到预设ocr纠错模型,以通过所述预设ocr纠错模型对所述公告文本中置信度低于预设阈值的字符进行纠错操作,得到纠错后的目标公告文本;
32.匹配模块,用于根据所述目标公告文本从预先配置的信息要素表中匹配多个目标要素值;及
33.提取模块,用于根据所述多个目标要素值从所述目标公告文本中提取多个公告数据。
34.为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上述的基于ocr技术的文档信息智能获取和纠错方法的步骤。
35.为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的基于ocr技术的文档信息智能获取和纠错方法的步骤。
36.本发明实施例提供的基于ocr技术的文档信息智能获取和纠错方法、系统、计算机设备及计算机可读存储介质,本实施例通过解析不能直接识别的公告文件,并对解析后的公告文件进行纠错处理,以得到纠错后的公告文本,最后通过信息要素表从公告文本查找
需要获取的公告数据,提高了从公告文件获取需要的公告数据的效率和准确率,解决了现有技术中对于各类公告中的产品要素信息提取工具的提取准确率低和提取效率低的问题。
附图说明
37.图1为本发明实施例基于ocr技术的文档信息智能获取和纠错方法的流程示意图;
38.图2为本发明基于ocr技术的文档信息智能获取和纠错系统实施例二的程序模块示意图;
39.图3为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
40.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
42.实施例一
43.参阅图1,示出了本发明实施例之基于ocr技术的文档信息智能获取和纠错方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。本实施例中的基于ocr技术的文档信息智能获取和纠错系统可以被执行在计算机设备2中,下面以计算机设备2为执行主体进行示例性描述。具体如下。
44.步骤s100,获取公告文件,并解析所述公告文件以得到公告文本。
45.所述公告文件可以是券商等金融平台公布的基金公告类文件,这些文件可以包括基金分红,费率折扣,基金变更等信息。计算机设备2可以从发布有目标公告的金融平台上下载所述公告文件,所述公告文件通常是pdf文件。当获取到所述公告文件后,计算机设备2可以对所述公告文件中信息进行解析,以得到公告文本。
46.在示例性的实施例中,所述步骤s100还包括步骤s200~步骤s202,其中,步骤s200,对所述公告文件进行格式转换操作,以得到图片格式的公告文件;及步骤s202,基于文字识别技术提取所述图片格式的公告文件的文字内容,并根据所述文字内容生成所述公告文本。本实施例可以通过ocr(optical characterrecognition光学字符识别)文字识别技术对所述公告文件进行文字识别,并生成所述目标公告对应的公告文本。所述公告文本可以是可编辑的文档,如word 文档。本实施例通过将所述公告文件转换图片格式的公告文件,并通过ocr 文字识别技术识别所述图片格式的公告文件的文字内容,提高了公告文件的信息提取效率。
47.需要说明的是,现有的公告文件的信息提取效率及准确率往往较低,提取后还需
要人工介入进行复查;例如,当获取到公告信息后,通过业务人员录入到产品系统中,再线下通知复核人员复核信息,核对没问题再展示给用户。这一流程不仅耗时耗力,且通过人工检索公告中的产品要素信息容易出现遗漏和录入误差等。为了解决公告文件的信息提取效率低和准确率低的问题,本实施例还可以对所述公告文本进行纠错,以提高公告文件的信息提取准确率,其中,具体纠错过程如下:
48.步骤s102,通过预先训练好的语言表示模型获取所述公告文本中各个字符的置信度。
49.本实施例还可以获取所述公告文本中每个字符的单字符置信度,其中,所述每个字符的单字符置信度的获取可以通过预先训练好的bert(bidirectionalencoder representation from transformers语言表示模型)模型,例如,可以将所述公告文本输入到所述bert模型中,以获取所述公告文本中每个位置的字符的置信度,如,可以利用bert模型对输入的句子中每个字符进行预测,预测出所述公告文本中每个位置字符的单字置信度。
50.步骤s104,判断所述公告文本是否为预设类型文本。
51.述预设类型文本可以是文本较短、范围较窄的单据类文本等。
52.步骤s106,如果所述公告文本不是所述预设类型文本,则将所述公告文本和各个字符的置信度输入到预设ocr纠错模型,以通过所述预设ocr纠错模型对所述公告文本中置信度低于预设阈值的字符进行纠错操作,得到纠错后的目标公告文本。
53.由于通过所述ocr识别技术识别得到的所述公告文本可能会存在一些错误,鉴于此,本实施例还提供了预先配置的ocr纠错模型,以对所述公告文本进行纠错处理。例如,可以通过预先训练好的纠错模型对所述公告文本进行纠错操作,其中,所述纠错模型可以是预先基于ocr技术纠错算法配置的所述ocr纠错器。具体来说,当得到所述公告文本和各个字符的置信度后,可以将所述公告文本和各个字符的置信度输入到所述纠错模型,以通过纠错模型对所述公告文本检错处理,当检测到错误时再进行纠错处理,并输出纠错后的公告文本。
54.为了方便理解本实施例还通过一个纠错模型的检错过程的具体实例,具体可以包括:
55.例如:
56.输入:
57.text=['唯见长江大际流']
[0058]
probs=[[0.99,0.99,0.99,0.99,0.56,0.99,0.99]]
[0059]
输出:
[0060]
text_corrected=['唯见长江天际流']。
[0061]
本实施例通过获取所述公告文本中每个字符的单字符置信度,可以减少 ocr纠错模型检错的过程,提高了提高纠错的准确率和纠错速度。实践表明,通过配置置信度阈值,检错召回率可以达到100%,误纠率为0.1,不采用这种方法,会有误纠的风险。
[0062]
在示例性的实施例中,所述基于ocr技术的文档信息智能获取和纠错方法还包括步骤s300:如果所述公告文本是所述预设类型文本,则根据预设关键词表对所述公告文本进行纠错操作,以得到所述纠错后的目标公告文本。为了进一步地提高所述公告文本的纠
错效率,本实施例还可以针对不同的公告文本的文件类型进行不同的纠错操作;具体的,针对一些特殊文本(预设类型文本) 可以通过关键字纠错技术进行文本纠错。例如,针对类单据类文本,可以预先建立形近字字典,并根据该形近字字典配置一个预设关键词表,以根据所述预设关键词表对类单据类文本进行纠错;其中,该关键词表包括多个形近字,纠错范围限于形近字。本实施例通过判断所述公告文本是否为预设类型文本,并为所述预设类型文本配置对应的预设关键词表,以通过预设关键词表对所述公告文本进行纠错操作,提高了对特殊文本(预设类型文本)的纠错效率。
[0063]
在示例性的实施例中,所述步骤s300还包括步骤s400~步骤s404,其中,步骤s400,从所述公告文本中获取置信度低于预设阈值的多个目标字符;步骤 s402,根据所述多个目标字符从所述公告文本中提取多个候选词;及步骤s404,根据所述预设关键词表对所述多个候选词进行纠错操作,以得到所述纠错后的目标公告文本。本实施例通过所述预设关键词表对所述多个候选词进行纠错操作,进一步地提高了公告文本的纠错效率。
[0064]
为了方便理解,本实施例通过预先训练好的语言表示模型(bert模型: bidirectional encoder representation from transformers语言表示模型)获取所述公告文本中各个字符的置信度,其中,各个字符的置信度为bert模型的 softmax层输出的概率值,根据所述softmax层输出的概率值可以从所述公告文本中获取置信度低于预设阈值的多个目标字符。在一些实施例中,从所述公告文本中提取多个候选词可以包括:第一步,通过mlm模型(masked languagemodel掩码语言模型)确定候选字符;第二步,通过csd(character similaritydecoder字符相似度解码器)过滤候选字符。其中,第一步可以是掩码语言模型的encoder部分,所述encoder部分可以是训练好的bert(bidirectionalencoder representations from transformers)模型;第二步可以是掩码语言模型的decoder部分,其中,decoder可以是csd,通过所述字符相似度解码器可以提高对语境的把握度。
[0065]
当得到所述多个目标字符后,计算机设备2可以通过bk-tree算法算法 (burkhard keller tree模糊匹配)从所述公告文本中提取多个候选词,并确定各个候选词在公告文本中对应的位置,最后根据所述预设关键词表中的多个预设关键词对所述多个候选词进行匹配并替换,以得到所述纠错后的目标公告文本。
[0066]
在一些实施例中,当得到纠错后的目标公告文本后可以提取目标公告文本中各个字符的置信度;若所述目标公告文本还存在置信度低于预设阈值的字符,还对所述目标公告文本进行纠错操作,直到目标公告文本中各个字符的置信度高于所述预设阈值。
[0067]
步骤s108,根据所述目标公告文本从预先配置的信息要素表中匹配多个目标要素值。
[0068]
所述信息要素表中包括多个要素。本实施例可以通过预先确定需要获取的数据,然后根据需要获取的数据配置一个信息要素表,并根据每个需要获取的数据(要素)配置一个要素值。需要说明的是,从公告文本提取的要素(公告数据)可以是产品的属性专业词,而这些属性专业词是固定的一般不会变化,所以可以预先将这些属性专业词配置在一个信息要素表中,其中,一个属性专业词可以配置一个要素值(key)。
[0069]
步骤s110,根据所述多个目标要素值从所述目标公告文本中提取多个公告数据。
[0070]
当得到所述纠错后的公告文本时,可以根据所述要素值从所述纠错后的公告文本
提取多个公告数据。当需要从公告文本提取的要素时,可以根据所述多个目标要素值从所述目标公告文本提取多个公告数据。
[0071]
在示例性的实施例中,所述步骤s110还包括步骤s500~步骤s502,其中,步骤s500,根据所述多个目标要素值和预先配置的匹配规则从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素;及步骤s502,根据所述多个目标要素从所述目标公告文本中提取多个公告数据。由于一些属性专业词可能是英文或其他语言文字,本实施例还可以将多种语言对应的同一个术语配置统一key,检索时针对这key的关键词返回的值都会认为指代的是同一属性的值。这个要素的多种语言的配置可以针对需要实时调整新增。本实施例根据多个目标要素值从所述信息要素表中获取各个目标要素值所对应的要素,已根据多个目标要素从所述目标公告文本中提取多个公告数据,提高了从所述目标公告文本中提取多个公告数据的准确率。
[0072]
在示例性的实施例中,所述步骤s500还包括步骤s600~步骤s602,其中,步骤s600,根据所述匹配规则将所述多个目标要素值转化为多个正则表达式;步骤s602,根据所述多个正则表达式从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素。本实施例通过将所述多个目标要素值转化为多个正则表达式,提高了从所述信息要素表中获取各个目标要素值所对应的要素的准确性和安全性。
[0073]
当得到提取多个公告数据多个公告数据后,还可以查找所述目标公告对应的基金产品,并上传所述多个公告数据和所述纠错后的公告文件,其中,所述多个公告数据可以录入到所述信息要素表中。
[0074]
本实施例通过将图片格式、pdf格式等不可直接搜索文件中内容的公告文件解析成直接在文件中搜索文件内容的word格式的文档,并将该word格式的文档中的文本内容输入到使用bert模型,以通过ocr纠错器实现文本纠错。当完成整个纠错后,可以基于需要检索的关键字进行关键字检错,获取需要的要素值,并自动将值录入到相应的产品信息中,这一系列的操作没有人工介入,结合ocr的文件解析处理功能,在此基础上,加入ocr纠正模型的文件处理,在运营效率方面提升了85%,减少人工操作误差90%,提高了公告数据获取效率和准确性,进一步地提高了公告数据的时效性。
[0075]
在示例性的实施例中,所述基于ocr技术的文档信息智能获取和纠错方法还包括步骤s700:将所述多个公告数据上传到区块链。
[0076]
示例性的,将所述多个公告数据上传至区块链可保证其安全性和公正透明性。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0077]
实施例二
[0078]
图2为本发明基于ocr技术的文档信息智能获取和纠错系统实施例二的程序模块示意图。基于ocr技术的文档信息智能获取和纠错系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述基于ocr技术的文档信息智能获取和纠错方法。本发明实施例所
称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述基于ocr技术的文档信息智能获取和纠错系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
[0079]
获取模块200,用于获取公告文件,并解析所述公告文件以得到公告文本;
[0080]
获取模块202,用于通过预先训练好的语言表示模型获取所述公告文本中各个字符的置信度;
[0081]
判断模块204,用于判断所述公告文本是否为预设类型文本;
[0082]
输入模块206,用于如果所述公告文本不是所述预设类型文本,则将所述公告文本和各个字符的置信度输入到预设ocr纠错模型,以通过所述预设ocr 纠错模型对所述公告文本中置信度低于预设阈值的字符进行纠错操作,得到纠错后的目标公告文本;
[0083]
匹配模块208,用于根据所述目标公告文本从预先配置的信息要素表中匹配多个目标要素值;及
[0084]
提取模块210,用于根据所述多个目标要素值从所述目标公告文本中提取多个公告数据。
[0085]
示例性的,所述获取模块200,还用于:对所述公告文件进行格式转换操作,以得到图片格式的公告文件;及基于文字识别技术提取所述图片格式的公告文件的文字内容,并根据所述文字内容生成所述公告文本。
[0086]
示例性的,所述基于ocr技术的文档信息智能获取和纠错系统20还包括,纠错模块,所述纠错模块,用于如果所述公告文本是所述预设类型文本,则根据预设关键词表对所述公告文本进行纠错操作,以得到所述纠错后的目标公告文本。
[0087]
示例性的,所述纠错模块,还用于:从所述公告文本中获取置信度低于预设阈值的多个目标字符;根据所述多个目标字符从所述公告文本中提取多个候选词;及根据所述预设关键词表对所述多个候选词进行纠错操作,以得到所述纠错后的目标公告文本。
[0088]
示例性的,所述提取模块210,还用于:根据所述多个目标要素值和预先配置的匹配规则从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素;及根据所述多个目标要素从所述目标公告文本中提取多个公告数据。
[0089]
示例性的,所述提取模块210,还用于:根据所述匹配规则将所述多个目标要素值转化为多个正则表达式;及根据所述多个正则表达式从所述信息要素表中获取各个目标要素值所对应的要素,以得到多个目标要素。
[0090]
示例性的,所述基于ocr技术的文档信息智能获取和纠错系统20还包括,上传模块,所述上传模块,用于将所述多个公告数据上传到区块链。
[0091]
实施例三
[0092]
参阅图3,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图所示,计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及基于ocr技术的文档信息智能获取和纠错系统20。
[0093]
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储
介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器 (rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2 的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。当然,存储器21还可以既包括计算机设备 2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的基于ocr 技术的文档信息智能获取和纠错系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0094]
处理器22在一些实施例中可以是中央处理器(central processing unit, cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器 21中存储的程序代码或者处理数据,例如运行基于ocr技术的文档信息智能获取和纠错系统20,以实现实施例一的基于ocr技术的文档信息智能获取和纠错方法。
[0095]
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将计算机设备2与外部终端相连,在计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(intranet)、互联网(internet)、全球移动通讯系统(global system of mobilecommunicati/on,gsm)、宽带码分多址(wideband code divisi/on multipleaccess,wcdma)、4g网络、5g网络、蓝牙(bluetooth)、wi-fi等无线或有线网络。
[0096]
需要指出的是,图3仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
[0097]
在本实施例中,存储于存储器21中的基于ocr技术的文档信息智能获取和纠错系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22) 所执行,以完成本发明。
[0098]
例如,图2示出了本发明实施例二之所述实现基于ocr技术的文档信息智能获取和纠错系统20的程序模块示意图,该实施例中,所述基于ocr技术的文档信息智能获取和纠错系统20可以被划分为解析模块200、获取模块202、判断模块204、输入模块206、匹配模块208和提取模块210。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述基于ocr技术的文档信息智能获取和纠错系统20在计算机设备 2中的执行过程。所述程序模块200-210的具体功能在实施例二中已有详细描述,在此不再赘述。
[0099]
实施例四
[0100]
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相
应功能。本实施例的计算机可读存储介质基于ocr技术的文档信息智能获取和纠错系统20,被处理器执行时实现实施例一的基于ocr技术的文档信息智能获取和纠错方法。
[0101]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0102]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
[0103]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献