一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信息处理装置、信息处理方法以及计算机可读介质与流程

2022-07-10 13:48:44 来源:中国专利 TAG:


1.本公开涉及信息处理装置、信息处理方法以及计算机可读介质。


背景技术:

2.以往,已知有如下的信息处理装置,其执行对光学地读取了表单的图像影像进行字符识别的信息处理。例如,在日本特开2005-18678号公报中公开了表单数据输入处理装置,其特征在于,具有:读取单元,其光学地读取读取对象的表单而生成图像影像;字段区域检测单元,其基于预先存储的表单的表单定义信息,检测所述图像影像的字段区域;字符识别单元,其按照由所述检测单元检测出的每个字段区域,对各个字段中所包含的字符影像进行字符识别,在能够识别字符的情况下赋予对应的字符代码;核对单元,其对由所述字符识别单元识别出所有字符的字段,将由这些能够识别的字符构成的字符串与在所述表单中使用的字符串进行核对,在该核对结果是不能用于所述表单的字符串的情况下,输出表示该字段是误读字段的识别状态信息;以及显示单元,其在将与由所述字符识别单元赋予的字符代码对应的字符字形与字段影像进行对比而显示时,基于由所述核对单元输出的识别状态信息,以能够将误读字段识别为正确读取字段的方式显示。


技术实现要素:

3.在用户通过字符识别处理(ocr)识别由手写等所记载的字符串的情况下,识别结果不一定与用户想要的字符串一致。例如,在记载在系统中规定的多个字符串中的任意字符串的情况下,用户想要的字符串是在系统中规定的多个字符串中的任意字符串。因此,通过ocr识别由用户记载的字符串,使用系统中规定的多个字符串已登记的数据库(db)来确定与其识别结果对应的字符串并进行显示。但是,用户难以判断所显示的字符串的候选是字符识别的结果还是字符识别并核对的结果。
4.本公开的目的在于,提供一种用户能够将记载了字符串的图像识别而得到的结果和对识别结果进行核对而得到的核对结果区分掌握的信息处理装置信息处理方法、以及计算机可读介质。
5.根据本公开的第一方案,提供一种信息处理装置,具有处理器,所述处理器以将如下的识别结果和如下的核对结果排列显示的方式控制显示部,其中,该识别结果是对记载有字符串的图像进行识别而得到的结果、该核对结果是将所述识别结果与预先登记的数据库进行核对而得到的结果。
6.根据本公开的第二方案,所述处理器以如下方式控制所述显示部:以表示所述识别结果与所述核对结果的对应的方式,显示所述识别结果和所述核对结果。
7.根据本公开的第三方案,表示所述对应的方式是如下方式:使用表示所述识别结果与所述核对结果的依存关系的依存图像,显示所述识别结果和所述核对结果。
8.根据本公开的第四方案,所述处理器以显示不同的多个核对结果作为所述核对结果的方式控制显示部。
9.根据本公开的第五方案,所述处理器以如下方式进行控制:以能够选择所述多个核对结果中的任意核对结果的方式进行显示,并将被选择的核对结果作为与所述识别结果对应的核对结果而显示于显示部。
10.根据本公开的第六方案,所述处理器显示针对所述识别结果的核对的吻合度超过阈值的核对结果作为所述多个核对结果。
11.根据本公开的第七方案,所述处理器以按照吻合度从高到低的顺序显示所述多个核对结果的方式控制所述显示部。
12.根据本公开的第八方案,所述处理器以如下方式进行控制:在不能获取超过作为所述阈值而预先规定的第一阈值的吻合度的核对结果的情况下,获取超过比所述第一阈值低的第二阈值的吻合度的多个核对结果,显示表示不能获取与所述识别结果吻合的核对结果的无对应信息、和超过所述第二阈值的吻合度的核对结果。
13.根据本公开的第九方案,提供一种计算机可读介质,其存储有使计算机执行处理的程序,在所述处理中,以将如下的识别结果和如下的核对结果排列显示的方式控制显示部,其中,该识别结果是对记载有字符串的图像进行识别而得到的结果、该核对结果是将所述识别结果与预先登记的数据库进行核对而得到的结果。
14.根据本公开的第十方案,提供一种信息处理方法,其中,以将如下的识别结果和如下的核对结果排列显示的方式控制显示部,其中,该识别结果是对记载有字符串的图像进行识别而得到的结果、该核对结果是将所述识别结果与预先登记的数据库进行核对而得到的结果。
15.(效果)
16.根据所述第一、第九、第十的各方案,用户能够将记载有字符串的图像识别而得到的结果和对识别结果进行核对而得到的识别结果区分掌握。
17.根据所述第二方案,与不考虑识别结果与核对结果的对应关系的情况相比,用户能够确认到识别结果与核对结果的对应关系。
18.根据所述第三方案,与未用图像来表示识别结果与核对结果的依存关系的情况相比,用户能够直观地确认识别结果与核对结果的相关性。
19.根据所述第四方案,与仅显示一个核对结果的情况相比,用户能够确认与识别结果相关的核对结果。
20.根据所述第五方案,与显示跟识别结果对应的唯一的核对结果的情况相比,能够显示用户想要的核对结果。
21.根据所述第六方案,与不考虑针对识别结果的核对的吻合度而显示多个核对结果的情况相比,能够对识别结果显示准确的核对结果。
22.根据所述第七方案,与不考虑多个核对结果之间的关系的情况相比,用户能够直观地确认吻合度。
23.根据所述第八方案,能够确认数据库中没有对应的候选而选择了接近的字符。
附图说明
24.图1是示出实施方式所涉及的表单系统的概略结构的图。
25.图2是示出实施方式所涉及的信息处理装置的电气概略结构的一例的图。
26.图3是示出实施方式所涉及的信息处理装置的功能结构的一例的图。
27.图4是示出读取定义设定的设定画面的一例的图。
28.图5是示出读取定义设定的设定画面中包含的设定区域的图像的一例的图,图5的(a)表示设定前的图像,图5的(b)表示设定后的图像。
29.图6是示出基于实施方式所涉及的信息处理程序的信息处理的流程的一例的流程图。
30.图7是示出实施方式所涉及的确认订正画面的一例的图。
31.图8是示出实施方式所涉及的确认订正画面的一例的图。
32.图9是示出实施方式所涉及的确认订正画面的一例的图。
33.图10是示出包含识别结果与核对结果的依存关系的图像例的图。
34.图11是示出包含识别结果与核对结果的依存关系的图像例的图。
35.图12是示出包含未提取核对结果的情况的确认画面的图像例的图。
36.图13是示出与数据变换相关的设定画面的一例的图。
37.图14是示出与数据变换相关的设定画面的一例的图。
具体实施方式
38.以下,参照附图对用于实施本公开的技术的实施方式的一例进行详细说明。另外,有时对于动作、作用、功能承担相同功能的构成要素以及处理,在全部附图中标注相同的符号,并适当省略重复说明。各附图只不过是以能够充分理解本公开的技术的程度概略地示出。因此,本公开的技术不限于图示例。并且,在实施方式中,对于与本公开不直接关联的结构、公知结构,有时省略说明。
39.[第一实施方式]
[0040]
图1是示出本实施方式所涉及的表单系统10的概略结构的图。
[0041]
如图1所示,表单系统10包括信息处理装置20、客户终端40以及输入装置60。这些装置与未图示的网络连接,能够经由网络彼此通信。作为一例,该网络应用因特网、lan(local area network:局域网)、wan(wide area network:广域网)、wan(wide area network:广域网)等。
[0042]
信息处理装置20管理对通过输入装置60输入的、包含表单的多张文件的图像数据进行ocr(optical character recoition:光学字符识别)处理、将ocr处理的结果输出到预先规定的输出目的地的一系列处理的流程。稍后将描述信息处理装置20的具体结构以及作用。
[0043]
客户终端40向信息处理装置20发送与ocr处理相关的各种指示。在该各种指示中,作为一例,包含使图像数据的信息的读取开始的指示、以及显示读取了图像数据的信息的结果的指示等。并且,客户终端40根据接收到的各种指示,显示信息处理装置20进行的ocr处理的结果、以及与ocr处理相关的通知等各种信息。作为一例,客户终端40应用服务器计算机或个人计算机(pc:personal computer)等通用的计算机装置。在图1中,仅准备了一台客户终端40,但不限于此,也可以准备多台客户终端40,作为一例,可以按照每个处理而区分使用客户终端40。
[0044]
输入装置60将成为ocr处理的对象的图像数据输入到信息处理装置20。作为一例,
输入装置60应用服务器计算机、或者pc等通用计算机装置、以及具有扫描功能、打印机功能以及传真功能等的图像形成装置等。另外,除了输入装置60以外,还可以从客户终端40向信息处理装置20输入图像数据。
[0045]
接着,对表单系统10的概要进行说明。
[0046]
表单系统10是信息处理装置20对通过输入装置60输入的图像数据进行ocr处理,并将ocr处理的结果输出到预先规定的输出目的地的系统。
[0047]
信息处理装置20在ocr处理中,管理(1)业务设计以及运用验证、(2)数据输入、(3)数据读取、(4)表单判别确认订正、(5)读取结果确认订正、(6)业务检查、(7)数据输出、以及(8)退回、的各种处理。在本实施方式中,不仅包括从图像数据中读取字符和记号等的处理,还包括字符的修正等后处理在内而称为ocr处理。
[0048]
作为各种处理的管理的一例,(1)业务设计以及运用验证、(2)数据输入、(3)数据读取、(6)业务检查、以及(7)数据输出的处理分别由信息处理装置20自动执行。另外,作为各种处理的管理的一例,(4)表单判别确认订正、以及(5)读取结果确认订正的处理分别通过经由客户终端40的用户的输入接受。另外,作为各种处理的管理的一例,(8)退回的处理有由信息处理装置20自动执行的情况、和通过经由客户终端40的基于用户的输入而接受的情况。
[0049]
在(1)业务设计以及运用验证的处理中,制作包含读取定义设定、输出设定以及业务检查设定的作业规则。在读取定义设定中,作为一例,设定作为在“(3)数据读取”的处理中读取图像数据的信息的范围的读取范围。更具体而言,作为一例,能够设定从作为关键字提取的项目的右侧附近读取作为值的项目值这样的定义。在输出设定中,作为一例,设定在“(7)数据输出”的处理中输出的输出数据的文件格式以及输出目的地。在业务检查设定中,作为一例,设定在“(6)业务检查”的处理中作为检测对象的表单中的必须的输入项目、以及能够输入的字符数等格式等。
[0050]
在(2)数据输入的处理中,接受来自输入装置60的图像数据的输入。接收到输入的图像数据被登记为作为“(3)数据读取”的处理的执行单位的作业。
[0051]
在(3)数据读取的处理中,使用由用户从在“(1)业务设计以及运用验证”的处理中制作出的作业规则中选择出的、被执行的作业用的作业规则,进行该作业内的图像数据的信息的读取。作为一例,在该处理中,进行该作业内的图像数据中所包含的表单的判别(以下,称为“表单判别”)以及读取范围内的字符以及记号的读取。
[0052]
在(4)表单判别确认订正的处理中,基于在“(3)数据读取”的处理中进行的表单判别的结果,作业内的图像数据被分割为表示作业内所包含的表单的记录。之后,在该处理中,显示被分割的记录,接受基于用户的表单判别的确认订正。
[0053]
在(5)读取结果确认订正的处理中,显示在“(3)数据读取”的处理中进行的读取范围内的字符以及记号的读取结果,接受基于用户的读取结果的确认订正。
[0054]
在(6)业务检查的处理中,通过由用户从在“(1)业务设计以及运用验证”的处理中制作出的作业规则中选择出的、该作业用的作业规则中所包含的业务检查设定,检测在先的各处理中的错误。检测结果也可以提示给用户。
[0055]
在(7)数据输出的处理中,使用由用户从在“(1)业务设计以及运用验证”的处理中制作出的作业规则中选择出的、该作业用的作业规则中所包含的输出设定来制作输出数
据,并将所生成的输出数据输出到预先规定的输出目的地。
[0056]
在(8)退回的处理中,从在ocr处理中执行的处理,退回到一个阶段或多个阶段前的处理。关于退回,作为一例,在“(4)表单判别确认订正”以及“(5)读取结果确认订正”等各种处理的执行中,由用户从客户终端40进行指示。另外,关于退回,作为一例,根据在“(6)业务检查”与“(7)数据输出”的处理之间进行的基于管理者的检查的结果,从管理者的客户终端40指示。
[0057]
在上述的ocr处理中,“(1)业务设计以及运用验证”的处理是在进行“(3)数据读取”以后的处理之前、即在表单系统10的运用前执行。进而,“(1)业务设计以及运用验证”的处理也可以在进行“(3)数据读取”以后的处理的表单系统10的运用中执行。作为一例,在表单系统10的运用前能够根据表单系统10的运用中的“(5)读取结果确认订正”的处理的结果来适当地修正在“(1)业务设计以及运用验证”的处理中制作出的作业规则。
[0058]
(信息处理装置)
[0059]
接着,参照图2,对信息处理装置20的结构的一例进行说明。图2是示出本实施方式所涉及的信息处理装置20的电气概略结构的一例的图。信息处理装置20例如应用服务器计算机、pc等通用计算机装置。
[0060]
具体而言,如图2所示,信息处理装置20具有计算机主体21。计算机主体21具有cpu(central processing unit:中央处理器)22、ram(random access memory:随机存取存储器)23、rom(read-only memory:只读存储器)24、存储部25以及输入输出端口(i/o)26。cpu22、ram23、rom24、存储部25以及i/o26经由总线彼此连接。
[0061]
并且,在i/o26上连接有包含以下部分的各功能部:通信部27,其能够与外部装置进行通信;操作输入部28,其能够进行基于用户的操作输入;以及显示部29,其能够进行图像的显示。这些各功能部能够经由i/o26与cpu22相互通信。
[0062]
计算机主体21可以构成为控制信息处理装置20的一部分动作的子控制部,也可以构成为控制信息处理装置20整体的动作的主控制部的一部分。计算机主体21的各模块的一部分或全部例如使用lsi(large scale integration:大规模集成电路)等集成电路或ic(integrated circuit:集成电路)芯片组。上述各模块可以使用单独的电路,也可以使用将一部分或全部集成而成的电路。上述各模块彼此可以一体地设置,也可以单独设置一部分模块。并且,在上述各模块各自中,也可以单独设置其一部分。计算机主体21的集成化并不限于lsi,也可以使用专用电路或通用处理器。
[0063]
在存储部25中存储有用于使信息处理装置20作为本公开的信息处理装置发挥功能的信息处理程序25p。cpu22从存储部25读出信息处理程序25p并在ram23中展开而执行处理。由此,执行了信息处理程序25p的信息处理装置20作为本公开的信息处理装置动作。信息处理程序25p也可以由cd-rom等记录介质提供。另外,关于信息处理装置20的具体的处理,稍后将描述。
[0064]
作为存储部25,例如使用hdd(hard disk drive:硬盘驱动器)、ssd(solid state drive:固态硬盘)、闪存等辅助存储装置。
[0065]
信息处理程序25p也可以存储在rom24中。并且,例如,信息处理程序25p可以预先安装在信息处理装置20中。信息处理程序25p也可以通过将存储于非易失性存储介质、或者经由未图示的网络发布的程序信息适当地安装于信息处理装置20来实现。另外,作为非易
失性的存储介质的例,可设想cd-rom(compact disc read only memory:光盘只读存储器)、光磁盘、hdd、dvd-rom(digital versatile disc read only memory:数字多功能光盘只读存储器)、闪存、存储卡等。
[0066]
并且,在存储部25中还存储有用于在信息处理装置20中实现ocr处理的各功能的系统程序25s。cpu22从存储部25读出系统程序25s并在ram23中展开而执行ocr处理。由此,执行了系统程序25s的信息处理装置20以能够执行基于ocr处理的系统功能的方式动作。
[0067]
另外,在本实施方式中,将信息处理程序25p和系统程序25s作为单独的程序进行说明,但信息处理程序25p也可以作为系统程序25s中所包含的一部分的程序来执行。
[0068]
而且,在存储部25中还存储有存储了在信息处理装置20中能够利用的数据的数据库(db)25d。数据库25d作为登记有在外部的系统中使用的预先规定的多个字符串(例如,项目以及项目值)的存储部的一例而发挥功能。数据库25d不限于存储在存储部25中。例如,也可以预先存储于未图示的外部装置,经由通信线路对未图示的外部装置进行询问或者写入。
[0069]
通信部27与通信网连接,被构成为能够在信息处理装置20与外部装置之间进行通信。“通信网”是包含能够经由基于有线连接以及无线连接中的至少一方的连接的通信线路而在设备之间进行数据收发的网络的概念。例如,可以举出能够在企业的据点进行数据收发的狭域通信网(例如lan:local areanet work)、以及能够通过公众的通信线路进行数据收发的因特网等广域通信网(例如wan:wide area network)。
[0070]
操作输入部28例如设置有键盘、鼠标等操作输入用的设备。
[0071]
显示部29例如是液晶显示器(lcd:liquid crystal display)、有机el(electro luminescence:电致发光)显示器等。显示部29也可以应用具有操作输入部28的功能的触摸面板。操作输入部28以及显示部29从信息处理装置20的用户接受各种指示。显示部29显示根据从用户接受的指示而执行的处理的结果、针对处理的通知等各种信息。
[0072]
图3是示出本实施方式所涉及的信息处理装置20的功能结构的一例的框图。
[0073]
如图3所示,本实施方式的信息处理装置20的cpu22通过执行信息处理程序25p而作为本公开的信息处理装置发挥功能。本公开的信息处理装置包括作为获取部220、核对部222、和显示控制部224中的各个部分而发挥功能的功能部。
[0074]
获取部220是获取表示对记载有字符串的图像进行识别而得到的识别结果的信息的功能部。在表示识别结果的信息的一例中,应用表示对在表单中记载有字符串的图像进行字符识别而得到的识别结果的信息。
[0075]
核对部222是对由获取部220获取的识别结果进行核对、即、将表示识别结果的信息与预先登记于数据库25d的表示字符串等的信息进行核对的功能部。核对部222包含从数据库25d中提取与表示识别结果的信息对应的1个以上的信息(例如,字符串信息)的功能。从数据库25d中提取1个以上的信息(例如,字符串信息)的功能应用提取与表示识别结果的信息吻合的信息的公知的提取处理。公知的提取处理能够使用字符串之间的类似性的判定处理、以及字符串之间的意思的距离的判定处理。在后面叙述实现从数据库25d中提取的功能的处理的详细内容。
[0076]
显示控制部224是将表示由获取部220获取的识别结果的信息和表示由核对部222获取的核对结果的信息,在显示部29的至少一部分区域排列显示的功能部。
[0077]
接着,说明本实施方式所涉及的信息处理装置20的作用。
[0078]
在本实施方式中,在信息处理装置20中,对通过输入装置60输入的、针对包含表单的多张文件的图像数据的ocr处理中的读取结果确认订正的处理(图1中所示的(5)的处理)进行说明。即,对在数据读取的处理中进行的读取范围内的字符以及记号的读取结果进行显示,对与基于用户的读取结果的确认订正相关的处理进行说明。
[0079]
例如,在用户在外部的系统中规定的多个字符串中的任意字符串记载在表单的情况下,假定通过手写等记载的字符串是在外部的系统中规定的多个字符串中的任意字符串。因此,使用在外部的系统中已登记的数据库(db)来确定与对由用户记载的字符串进行了字符识别的识别结果对应的字符串,并进行显示。然而,字符识别的识别结果不一定与用户想要的字符串一致。因此,用户难以判断作为读取结果而显示的字符串的候选是进行了字符识别的识别结果、还是用字符识别了的字符串进行了核对的核对结果。
[0080]
因此,在本实施方式中,以排列显示识别了记载有字符串的图像而得到的识别结果、和作为将该识别结果与预先登记的数据库进行了核对的结果的核对结果的方式控制显示部29。
[0081]
在本公开中,“排列显示识别结果和核对结果”是包含以在同一画面上、表示识别结果的图像和表示核对结果的图像不重复的方式进行显示的处理的显示处理的概念。作为排列显示的显示的一例,可举出在显示部29的至少一部分的区域中,以能够向用户共同提示表示识别结果的图像和表示核对结果的图像的方式进行显示。
[0082]
并且,“读取结果”是包含进行了字符识别的识别结果(例如字符串)、和使用已登记多个字符串的数据库进行核对而得的核对结果(例如字符串)的概念。核对结果包含如下的字符串,该字符串是使用在外部的系统中预先规定的多个字符串已登记完毕的数据库,对字符识别了的识别结果的字符串进行核对,将与识别结果的字符串对应的字符串确定为核对结果,并进行显示的字符串。
[0083]
另外,在本实施方式中,设为由用户对作业规则预先设定了读取定义设定。参照图4以及图5对该读取定义设定进行说明。
[0084]
图4以及图5示出设定画面的一例。图4是示出由用户设定的读取定义设定的设定画面的一例的图。图5是示出读取定义设定的设定画面中所包含的设定区域的图像的一例的图,图5的(a)表示设定前的图像,图5的(b)表示设定后的图像。
[0085]
如图4所示,设定画面80包含:包含成为ocr处理的对象的图像(以下,称为对象图像)的基于扫描的图像(以下,称为扫描图像)、例如表单的扫描图像800、以及由用户设定的设定区域的图像(以下,称为设定图像)802。在设定画面80中,在扫描图像800中还显示表示成为ocr处理的对象的图像的区域的范围图像801。
[0086]
如图5的(a)所示,设定图像802包括显示区域803和显示区域804。在显示区域803中显示对成为范围图像801中所示的ocr处理的对象的图像进行字符识别而得到的识别结果。在图5中,显示区域803是与标记为项目“ocr结果”的项目对应的显示区域。在显示区域804中显示与是否进行候选校正的设定相应的结果。在图5中,显示区域804是与标记为项目“识别结果”的项目对应的显示区域,是显示核对结果的显示区域。
[0087]
并且,设定图像802包含基于核对的候选校正的设定区域805以及基于核对的数据变换的设定区域806。
[0088]
在基于核对的候选校正的设定区域805中包含单选按钮、核对用数据的显示区域以及校正结果的显示区域。基于核对的候选校正表示将与对象图像的识别结果对应的字符串信息从数据库25d提取并显示的校正处理的执行。设定区域805的单选按钮是用于设定是否执行基于核对的候选校正的单选按钮(在图5中,能够选择“进行”以及“不进行”中的任意一方)。
[0089]
核对用数据的显示区域在单选按钮被设定为“进行”的情况下被激活,能够设定数据库25d中所包含的数据的类别、种类等的分类。核对用数据除了能够设定与数据的类别、种类等的分类相关的设定以外,还能够设定数据的项目。校正结果的显示区域也在单选按钮被设定为“进行”的情况下被激活,显示基于核对的候选校正的结果。
[0090]
因此,在单选按钮中指定了基于核对的候选校正的执行的情况下,如图5的(b)中所示,能够设定核对用数据(在图5的(b)中示出了设定了“客户列表-公司名”的情形。)。并且,在校正结果的显示区域中显示基于核对的候选校正的结果(在图5的(b)中示出了显示了“富士施乐株式”的情形。)。
[0091]
另外,也可以在基于核对的候选校正的设定区域805的单选按钮被设定为“进行”的情况下,执行基于核对的候选校正的处理,也可以在设定了执行后进行了新的指示时执行该处理。在本实施方式中,根据基于刷新按钮807的按下的指示,执行该处理。
[0092]
在基于核对的数据变换的设定区域806中包含单选按钮、变换用数据的显示区域以及变换结果的显示区域。基于核对的数据变换表示从数据库25d确定与进行了基于核对的候选校正的字符串信息对应的代码等识别信息并显示的变换处理的执行。设定区域806的单选按钮是用于设定是否执行基于核对的数据变换的单选按钮(在图5中,能够选择“进行”以及“不进行”中的任意一方)。
[0093]
变换用数据的显示区域在单选按钮被设定为“进行”的情况下被激活,能够设定数据库25d中所包含的数据的类别、种类等的分类。变换结果的显示区域也在单选按钮被设定为“进行”的情况下被激活,显示基于核对的数据变换的结果。
[0094]
因此,在单选按钮中指定了基于核对的数据变换的执行的情况下,如图5的(b)所示,能够设定变换用数据(在图5的(b)中示出了“客户列表-公司代码”被设定的情形。)。并且,在变换结果的显示区域中显示基于核对的数据变换的结果(在图5的(b)中示出了显示与“富士施乐株式”对应的代码“db001”的情形。)。
[0095]
另外,也可以在基于核对的数据变换的设定区域806的单选按钮被设定为“进行”的情况下,执行基于核对的数据变换的处理,也可以在设定了执行后进行了新的指示时执行该处理。在本实施方式中,根据基于刷新按钮807的按下的指示,执行该处理。
[0096]
接着,将详细说明按照由用户设定为作业规则的读取定义设定执行的信息处理。
[0097]
图6是示出基于本实施方式所涉及的信息处理程序25p的信息处理的流程的一例的流程图。
[0098]
首先,若对信息处理装置20指示了信息处理程序25p的启动,则cpu22执行以下的各步骤。
[0099]
在步骤s100中,获取表示识别了记载有字符串的表单的扫描图像的识别结果的信息。表示识别结果的信息能够从在信息处理装置20中通过系统程序25s的执行而被处理的ocr处理中的数据读取的处理(图1中所示的(3)的处理)的执行结果中得到。获取表示识别
结果的信息的处理是图3所示的获取部220的功能的一例。
[0100]
在步骤s102中,将表示在步骤s100中获取的识别结果的信息与表示已登记在数据库25d中的字符串等的信息进行核对,获取表示该核对结果的信息。获取表示核对结果的信息的处理是图3所示的核对部222的功能的一例。
[0101]
具体而言,在步骤s102中,首先,执行从数据库25d中提取与表示识别结果的信息对应的1个以上信息(例如,字符串信息)的提取处理。该提取处理是提取与表示识别结果的信息吻合的信息的处理。在提取处理中,导出作为表示识别结果的信息的字符串与在数据库25d中已登记的字符串的吻合度,从数据库25d中提取表示超过了预先规定的吻合度的已登记的字符串的信息。作为提取处理的一例,能够通过由公知的处理导出字符串之间的类似度,并判定所导出的类似度超过了预先规定的阈值的类似性的情况的判定处理来实现。并且,能够通过由公知的处理导出字符串间的意思的距离,并判定所导出的意思的距离超过了预先规定的阈值的距离的情况的判定处理来实现。
[0102]
在步骤s104中,显示用于使用户确认表示所获取的识别结果的信息、和表示核对后的核对结果的信息的确认订正画面。另外,在步骤s102中,在提取了表示多个核对结果的信息的情况下,将吻合度比其他信息高的信息、即吻合度最大的信息确定为表示核对结果的信息并进行显示。
[0103]
图7是示出本实施方式所涉及的确认订正画面的一例的图。图7是将表示包含表单的扫描图像800的画面的表单视图作为确认修正画面81而示出的一例。
[0104]
确认订正画面81包含:表单的扫描图像800、以及能够使用户进行识别结果以及核对结果的确认、且能够进行核对结果的订正的确认订正区域的图像(以下,称为确认订正图像)810。在确认订正画面81中,对于扫描图像800,还显示表示作为成为ocr处理的对象的图像的区域的读取范围的范围图像801。
[0105]
确认订正图像810按作为读取范围而预先规定的每个项目,包含显示区域811。在图7所示的例中,作为项目名的一例,按交付日、登记信息以及住址的每个项目具有显示区域811。在各个显示区域811中显示分别与项目名、扫描图像、识别结果、确信度以及确认相关的图像。例如,项目名“交付日”的显示区域811包含表示项目名的图像812、扫描图像813、表示识别结果的图像814、表示确信度的图像815、以及用于使用户设定项目确认的结束的图像816。
[0106]
在图7所示的确认修正图像810中,将基于识别结果的核对结果显示为表示“识别结果”的图像814。显示为图像814的字符串以能够由用户订正的方式被显示。并且,表示确信度的图像815是表示上述的吻合度的图像,具体而言,是表示针对表示识别结果的信息(字符串)的、已登记在数据库25d中的信息(字符串)的吻合度的指标的图像。在图7中,显示了表示吻合度高的情况,例如表示吻合度超过了阈值的“高”的图像。图像816是表示用于用户设定结束了项目确认的情况的复选框的图像。图像816被控制为:通过在项目确认结束时用户指示图像816,复选框变化为被选中的状态的图像。
[0107]
在此,如上所述,在设定了基于核对的数据变换处理的执行的情况下,变换用数据的显示区域被激活,显示基于核对的数据变换的结果。
[0108]
图8是示出设定了基于核对的数据变换处理的执行的情况下的确认订正画面的一例的图。
[0109]
如图8所示,示出了在设定了基于核对的数据变换处理的执行的情况下,从在变换结果的显示区域未显示信息的确认订正图像810x向显示了基于核对的数据变换的结果的确认订正图像810y的迁移过程。具体而言,作为确认订正图像810y,示出了在变换结果的显示区域显示与
“あんぱん”
对应的代码“ms-05b”的情形。
[0110]
然而,如上所述,在用户确认确认订正图像810的情况下,很难判断作为读取结果而显示的字符串的候选是进行了字符识别的识别结果还是通过进行了字符识别的字符串进行了核对的核对结果。因此,在本实施方式中,执行将识别记载有字符串的图像而得到的识别结果、和作为将该识别识别与预先登记的数据库进行核对的结果的核对结果排列显示的控制。
[0111]
具体而言,在图6所示步骤s106中,cpu22通过判定来自操作输入部28的信息来判断是否指示了针对作为读取结果而显示的字符串的确认指示。在步骤s106中作出肯定判断的情况下,在步骤s108中,在执行将识别结果和基于数据库25d的核对结果排列显示在同一画面上的控制之后,将处理转移到步骤s110。另一方面,在步骤s106中作出否定判断的情况下,将处理转移到步骤s110。
[0112]
在步骤s110中,根据来自表示基于用户操作的结束指示的操作输入部28的信息、或者表示针对全部项目结束了确认订正的信息,判断是否结束信息处理。在步骤s110中作出否定判断的情况下,使处理返回步骤s104,在肯定判断的情况下,结束基于本信息处理程序25p的一系列的处理。
[0113]
图9是示出本实施方式所涉及的确认订正画面中的识别结果和核对结果的确认画面的图像例的图。该确认画面的图像在确认订正画面中被指示了针对作为读取结果而显示的字符串的确认指示的情况下,进一步显示。
[0114]
在图9所示的例中,在确认订正图像810的显示区域811中,作为项目名的一例,显示有与“商品名1”的项目相关的信息。并且,确认订正图像810在表示识别结果的图像814的右方,在作为读取范围而预先规定的每个项目的显示区域811中包含用于指示确认结果和核对结果的确认的用户指示的图标图像820。并且,在表示识别结果的图像814的下方,显示有表示与作为核对结果而从数据库25d提取的信息有关的属性信息的图像821。
[0115]
通过用户操作,当图标图像820被进行了选择指示(例如点击)时,确认画面的图像822与图标图像820相关联起来显示。在图9所示的例中,在来自图标图像820的对白框图像内显示有确认画面的图像822。
[0116]
确认画面的图像822包括表示基于字符识别的识别结果的图像823、和表示针对该识别结果的基于数据库25d的核对结果的图像824。确认画面的图像822进行将基于字符识别的识别结果、和针对该识别结果的基于数据库25d的核对结果排列显示于同一画面的控制。
[0117]
在图9所示的例中,表示识别结果的图像823包含识别结果的字符串信息(
“あんぱい”
)和表示该字符串信息是基于字符识别的识别结果的属性信息(“ocr结果”)。并且,表示核对结果的图像824包含核对结果的字符串信息、和表示该字符串信息是从数据库25d提取的字符串的候选的属性信息。作为表示识别结果的图像814而显示的核对结果,被显示确认画面的图像822的核对结果中的吻合度超过了阈值(例如最大值的)核对结果。在图9中,示出关于从数据库25d提取的多个字符串的候选,从吻合度为最大值的核对结果起依次显示
的例。
[0118]
从数据库25d提取的字符串的候选也可以预先设定优先顺序,关于被提取的字符串,按照优先顺序进行排列。
[0119]
通过这样将识别结果和核对结果显示在同一画面上,用户能够关于在字符识别(ocr)中如何进行读取处理、在核对中提取了什么样的的候选能够确认各自的结果。
[0120]
如上所述,进行将识别结果和核对结果显示于同一画面的控制。在本实施方式中,能够以能够确认识别结果与核对结果的依存关系的方式进行显示。并且,作为表示识别结果的图像814而显示的核对结果,能够从基于多个字符串的候选的核对结果中选择任意一个候选。
[0121]
图10是示出包含确认画面中的识别结果与核对结果的依存关系的图像例的图。
[0122]
如图10所示,作为确认画面的图像例的图像822包含箭头图像830,该箭头图像830表示基于字符识别的识别结果的图像823和表示核对结果的图像824的依存关系。并且,表示核对结果的图像824以能够从基于多个字符串的候选的核对结果中选择任意一个候选的方式显示。在图10的例中,示出了表示第一候选(字符串信息
“あんぱん”
、记载为属性信息“基于db核对的候选(1)”的核对结果)的选择图像840。
[0123]
另外,如图11所示,通过使表示识别结果与作为核对结果的各个候选的依存关系的图像850不同来进行显示,能够使用户确认识别结果与作为核对结果的各个候选的依存关系的依存程度。在图11所示的例中,示出了将表示识别结果与作为核对结果的各个候选的依存关系的图像850以使箭头图像的线种类不同的显示方式显示的情形。此时,根据实线、单点划线以及双点划线的顺序示出依存关系变弱。
[0124]
在上述的处理中,从数据库25d中提取与表示识别结果的信息对应的一个以上信息(例如,字符串信息)、即作为吻合度超过了预先规定的阈值的信息的信息。但是,有时在数据库25d中已登记的信息不包含吻合度超过了预先确定的阈值的信息。在该情况下,无法从数据库25d中提取与表示识别结果的信息对应的信息。因此,在本实施方式中,在不能提取超过作为阈值而预先规定的第一阈值的吻合度的核对结果的情况下,能够提取超过比第一阈值低的第二阈值的吻合度的多个核对结果。在该情况下,能够以如下方式控制显示部29:显示表示不能获取与识别结果吻合的核对结果的无对应信息、和超过第二阈值的吻合度的核对结果。
[0125]
图12是示出包含不能提取核对结果的情况的确认画面的图像例的图。
[0126]
如图12所示,作为包含不能提取核对结果的情况的确认画面的图像例的图像822包含表示不能获取与识别结果吻合的核对结果的无对应信息的图像860。在图12的例中,作为无对应信息,记载有字符串信息“无对应”和属性信息“基于db核对的候选(0)”的各信息。并且,在图12中,示出了以使箭头图像的线种类不同的显示方式显示了包含表示识别结果与无对应信息的关系的图像的图像862的情形。
[0127]
如以上说明,根据本实施方式,通过将识别结果和核对结果显示在同一画面上,关于在字符识别中如何进行读取处理、在核对中提取了什么样的候选,用户能够确认各自的结果。
[0128]
另外,本实施方式的信息处理装置20被构成为能够进行基于csv(comma separated value:逗号分隔值)形式的数据输出。因此,在本实施方式中,执行在同一画面
上显示识别结果和核对结果的处理,识别结果被确定之后,能够进行与向外部的系统输出数据(例如,csv文件)时的数据变换相关的设定。数据变换的一例应用csv变换。
[0129]
图13以及图14示出与数据变换相关的设定画面的一例。图13是示出用于关于包含识别结果的各信息,例如设定作为csv文件输出数据时的数据形式的设定画面的一例的图。图14是示出与文件中的一个项目(在图14中为a列)相关的设定画面的一例的图。如图13和图14所示,通过执行与数据输出变换相关的设定,能够自动或手动地输出读取结果(例如、识别结果)和与读取结果对应起来的信息。
[0130]
以上,例示实施方式所涉及的信息处理装置而进行了说明。实施方式也可以是用于使计算机执行信息处理装置所具备的各部的功能的程序的方式。实施方式也可以是存储有该程序的计算机能够读取的存储介质的方式。
[0131]
此外,在上述实施方式中说明的信息处理装置的结构是一例,也可以在不脱离主旨的范围内根据状况进行变更。
[0132]
并且,在上述实施方式中说明的程序的处理的流程也是一例,也可以在不脱离主旨的范围内删除不需要的步骤,或者追加新步骤,或者调换处理顺序。
[0133]
并且,在上述实施方式中,关于通过执行程序,实施方式所涉及的处理利用计算机通过软件结构来实现的情形进行了说明,但不限于此。实施方式例如也可以通过硬件结构、硬件结构与软件结构的组合来实现。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献