一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文档自动化审查方法、装置及存储介质与流程

2022-02-19 03:40:34 来源:中国专利 TAG:


1.本技术涉及文档处理的技术领域,尤其是涉及一种文档自动化审查方法、装置及存储介质。


背景技术:

2.文档是企业管理、工作记录中所必须的一种重要手段,特别是电子文档,随着电子科技的发展,电子文档的使用为企业带来了巨大的便利。
3.文档制作完成之后,通常为了保证文档内容的准确性,都需要对文档进行审查,而目前的审查方式大多是通过人工审查的方式,对文档内容进行逐一的排查。
4.针对上述相关技术,发明人认为通过该种审查方式,审查效率低,需要耗费大量的人力,且通过人工审查的方式容易受到审查人员主观判断的影响,审查的准确性较低。


技术实现要素:

5.为了提高文档审查的效率,同时降低审查过程中消耗的人力,提高审查的准确性,本技术提供一种文档自动化审查方法、装置及存储介质。
6.第一方面,本技术提供一种文档自动化审查方法,采用如下的技术方案:一种文档自动化审查方法,包括:获取文档标题;选择与所述文档标题对应的所述检查策略;基于所述检查策略对文档进行检查,生成检查情况;基于所述检查情况输出审查结果。
7.通过采用上述技术方案,文档存入到系统之后获取文档标题,然后文档标题与预设的检查策略进行匹配,当匹配成功之后获取文档内容并根据检查策略对文档内容进行检查,然后根据检查的情况输出检查成功或者检查失败的结果,通过该种方式对文档进行检查,提高文档审查的效率,同时降低审查过程中消耗的人力,提高审查的准确性。
8.可选的,所述检查策略包括策略要求,所述基于所述检查策略对文档进行检查,生成检查情况包括如下步骤:获取文档正文;基于所述文档正文获取关键要求;将所述关键要求与所述策略要求进行匹配生成检查情况。
9.通过采用上述技术方案,获取文档正文之后获取文档正文中的关键要求,首先将文档标题与策略标题匹配,匹配成功之后将关键要求与策略要求进行匹配,当匹配成功之后输出匹配成功的结果,当匹配不成功时,输出匹配不成功的结果,从而通过文档标题和关键要求双重保障对文档进行审查,进一步提高文档审查的准确性。
10.可选的,所述基于所述文档正文获取关键要求包括如下步骤:获取文档的文档类型;
根据所述文档类型选择相应解析方案对所述文档进行解析;基于解析后的文档获取段落内容;基于所述段落内容获取所述关键要求。
11.通过采用上述技术方案,对文档的类型进行解析,从而方便识别不同类型的文档,进而能够更好的文档的内容进行识别,从而进一步提高文档识别的准确性。
12.可选的,还包括:基于解析后的文档获取段落类型;基于所述段落类型获取文档结构;将所述文档结构与策略结构进行匹配,并获得匹配结果;其中,所述检查策略还包括所述策略结构。
13.通过采用上述技术方案,将文档的结构与策略结构进行匹配,从而能够进一步提高文档审核的严谨性,进而提高文档审查的准确度。
14.可选的,所述关键要求包括正文篇幅、关键字和设计图中的至少一个。
15.通过采用上述技术方案,以正文篇幅、关键字和设计图进行审查,审查的方式较为全面,从而提高审查的准确性。
16.可选的,所述输出审查结果包括如下步骤:将所述正文篇幅与所述检查策略的篇幅阈值进行对比;当所述正文篇幅大于所述篇幅阈值时,输出的所述审查结果为超量提示。
17.通过采用上述技术方案,将正文篇幅与篇幅阈值进行对比之后,当正文篇幅大于篇幅阈值时,输出超量提示从而提示文档不符合要求,并通过提示超出的数量,方便使用者对文档篇幅进行更改。
18.可选的,所述输出审查结果还包括如下步骤:基于所述策略要求判断文档中是否存在与所述策略要求匹配的关键字和/或设计图名称;若是,则输出的所述审查结果为匹配成功;若否,则输出的所述审查结果为未匹配成功的关键字和/或设计图名称。
19.通过采用上述技术方案,通过匹配关键字和/或设计图名称,匹配成功时,提示匹配成功,提示使用者文档符合标准,当匹配不成功时,输出关键字和/或设计图名称,从而提示审查的文档中那部分不合格,从而进一步判断文档是否符合判断的要求,从而确定文档是否符合审查的标准,且方便对不合格的文档进行有目标的修改。
20.可选的,还包括:基于对比结果输出统计数据,所述统计数据包括各个类型的所述审查结果对应所述审查结果总量的比率。
21.通过采用上述技术方案,通过输出的统计数据,能够方便知晓文档中不合格的地方和合格的地方与文档总体的占比,同时能够获得合格文档和不合格文档对所有检查的文档的占比,进而方便使用者后续对文档的分配进行管理。
22.第二方面,本技术提供一种文档自动化审查装置,采用如下的技术方案:一种文档自动化审查装置,包括:存储器,存储有智能处理程序;处理器,在运行所述智能处理程序时执行权利要求1

9任一所述方法的步骤。
23.通过采用上述技术方案,存储器能够对信息进行存储,处理器能够对信息进行调取并发出控制指令,保证程序的有序执行并实现上述方案的效果。
24.第三方面,本技术提供一种计算机可读存储介质,采用如下的技术方案:一种计算机可读存储介质,存储有能够被处理器加载并执行如上述任一种方法的计算机程序。
25.通过采用上述技术方案,当所述计算机可读存储介质被装入任一计算机后,任一计算机就能执行本技术提供的一种文档自动化审查方法。
26.综上所述,本技术包括以下至少一种有益技术效果:1.系统获取文档标题和检查策略,然后文档标题与检查策略进行匹配,,当匹配成功之后获取文档内容并根据检查策略对文档内容进行检查,然后根据检查的情况输出检查成功或者检查失败的结果,通过该种方式对文档进行检查,提高文档审查的效率,同时降低审查过程中消耗的人力,提高审查的准确性;2.系统获取文档正文并基于文档正文获取关键要求,然后将文档标题与策略标题进行匹配,不成功则说明文档审查不通过,匹配成功则再将关键要求与策略要求进行匹配,然后根据匹配结果输出审查结果,从而进一步判断文档是否通过审查,进一步提高文档审查的准确性;3.系统获取文档的类型,并根据文档的类型的不同使用不同的工具对文档进行解析,从而获取文档中段落的类型和内容,然后根据段落的内容获取关键要求,从而能够适应不同的文档类型,方便对不同类型的文档进行解析,提高文档审查的全面性,从而提高文档审查的准确性。
附图说明
27.图1是本技术实施例提供的一种文档自动化审查方法的整体流程图;图2是本技术实施例中基于检查情况输出审查结果步骤s4的详细流程示意图。
具体实施方式
28.以下结合附图1

2对本技术作进一步详细说明。
29.本技术实施例公开一种文档自动化审查方法。
30.参照图1,文档自动化审查方法包括:s1:获取文档标题;s2:选择与文档标题对应的检查策略;s3:基于检查策略对文档进行检查;s4:基于检查情况输出审查结果。
31.具体来说,检查策略包括策略标题、策略要求、策略结构和篇幅阈值。上述方法的步骤均是通过计算机系统完成,操作过程中,操作人员将文档输入到系统内,计算机系统读取文档的文档标题。且,操作者预先将检测策略输入到计算机系统内,然后系统将文档标题与检查策略中的策略标题进行匹配,并基于匹配的结果输出审查结果。
32.具体来说,当匹配成功之后,输出匹配成功的信息,例如在计算机系统的显示屏上显示“标题匹配成功”的字样,从而提示工作人员,文档标题与策略标题相同,初步审查通
过。当匹配不成功时,输出匹配不成功的信息,例如在显示屏上显示“标题匹配不成功”的字样,即文档标题错误,从而提示文档初步审查不通过,并将文档标题错误的文档抽离到计算机系统的其他路径中。例如,计算机系统新建一个“标题错误”的文件夹,从而将标题错误的文档移动至该文件夹下,方便后续对标题错误的文档进行查找和修改。
33.当文档标题匹配成功时,系统获取文档的内容,并且系统根据检查策略的检查要求对文档的内容进行检查,判断文档的内容是否符合检查策略的要求,当文档内容与策略要求相符合时,生成检查情况,并根据检查情况输出检查成功的审查结果,当文档内容与策略要求不相符时,输出检查不成功的审查结果。
34.具体来说,参照图1和图2,步骤s4包括如下子步骤:s41:获取文档正文;s42:基于文档正文获取关键要求;s43:将关键要求与策略要求进行匹配;s44:生成检查情况。
35.具体来说,首先判断文档的类型,然后根据不同文档类型,使用不同的解析方法对文档进行解析获得文档的正文内容,即获得文档正文。然后根据文档振文获取关键要求,关键要求包括:正文篇幅、关键字和设计图名称。需要说明的是,策略要求包括关键字要求和设计图要求,系统基于关键字要求和设计图要求提取文档正文中的关键字和设计图名称。然后系统将关键要求与策略要求进行匹配,生成检查情况。
36.当然,通过上述的描述我们知道,还需要获取文档的文档类型,然后选择相应的解析方案对文档进行解析。具体来说,首先系统根据输入到系统中的文档的类型进行识别,文档优选为word文档。目前word文档的类型主要分为“docx”和“doc”两种类型,首先系统通过java语言中的poi工具包,解析word文档的类型,当系统判断word文档的类型为“docx”类型时,系统利用xwpfdocument工具类,解析出xwpfparagraph类,再通过getstyle()和gettext()方法,分别获取段落的类型和内容。当系统判断word文档的类型为“doc”类型时,系统利用hwpfdocument工具类获取paragraph类的getstyleindex()和text()方法,分别获取段落类型和段落内容。
37.系统通过上述的两种方式获取段落的内容之后,即可获取文档正文。系统识别文档正文的内容获取关键要求。
38.当文档标题匹配成功之后,系统基于关键字要求,判断文档正文中是否存在与关键字要求匹配的关键字,即系统根据关键字要求提取文档正文中的关键字,若能提取到即判断存在与关键字要求匹配的关键字,则输出匹配成功的结果,例如在显示屏上显示“关键字匹配成功”;若提取不到关键字则输出未匹配成功的结果,且输出为匹配成功的关键字,例如在显示屏上显示“关键字匹配未成功”,且显示关键字要求中未匹配到的关键字,方便提示使用者对相应的关键字进行修改。
39.同时,系统基于设计图要求,判断文档正文中是否存在与设计图要求匹配的设计图,即系统根据设计图要求提取文档正文中的设计图名称,若能提取到即判断存在与设计图要求匹配的设计图,则输出匹配成功的结果,例如在显示屏上显示“设计图匹配成功”;若提取不到设计图则输出未匹配成功的结果,且输出未匹配成功的设计图名称,例如在显示屏上显示“设计图匹配未成功”,且显示设计图要求中未匹配到的设计图名称,方便提示使
用者对相应的设计图进行修改。
40.当关键字和设计图名称中的其中一个未匹配成功时,则系统单独输出其中的一个未匹配成功的结果;当关键字和设计图均未匹配成功时,系统输出两个均为匹配成功的结果,从而能够进一步对使用者进行提示,且通过该种检查方式,能够进一步提高文档审查的准确性,提高文档审查的效率。
41.在另一个实施例中,还包括将正文篇幅与篇幅阈值进行对比。系统读取文档正文的篇幅,然后将正文篇幅与篇幅阈值进行大小对比,当正文篇幅的数值大于篇幅阈值的数值时,输出超量提示并提示超出数量。例如在显示屏上显示“篇幅超量”,并显示超量的具体数值,例如1、2、3等正整数数值,从而提示操作者文档篇幅错误以及错误的数量,进而能够进一步提高文档审查的准确性,且方便后续对错误的文档进行更改。
42.在另一个实施例中,系统获取段落类型之后,根据段落类型获取文档结构,也就是获取文档正文的段落的总体结构。且系统根据策略结构将策略结构与文档结构进行匹配,并根据匹配结果输出匹配信息。
43.具体来说,策略结构包括总分式、并列式、分总式等,系统根据策略结构的当前形式,例如当前为总分式,根据文档正文的段落的整体结构和正文内容判断,文档的结构是否为总分式,若是,则判断策略结构与文档的结构匹配,此时即可输出匹配成功信息,例如显示器上显示“结构匹配成功”;若文档的结构与策略结构不匹配,则判断二者不匹配,此时输出匹配不成功信息,例如在显示器上显示“结构匹配不成功”,同时系统将结构匹配不成功的文档移动到单独的文件夹中,从而能够进一步提高文档审查准确性的同时,方便对不通过的文档进行查找和更改。
44.上述的结构判断,对于总分式的结构,系统可以通过标号的方式进行实现,例如“总”的段落用“1”表示,则分的段落用“1.1”、“1.2”或“1

1”、“1

2”等方式表示,当系统识别到文档中的这些数字格式,且“1”在“1.1”、“1.2”或“1

1”、“1

2”之前,即可判断文档的结构为总分,则判断文档的结构与策略结构匹配成功,反之则是不成功,同样的,其他的结构也可用数字标号的方式进行判断,比如只有1、2、3或其他形式相同的数字,则可判断为并列式,“1”在“1.1”、“1.2”或“1

1”、“1

2”之后则判断为分总式。
45.最后,当所有的文档均审查完成之后,系统根据判断结果和对比结果输出统计数据。统计数据包括各个类型的所述审查结果对应所述审查结果总量的比率,也就是系统将匹配不成功的文档占所有被审查文档的比例进行计算并输出到显示器上;同时将单个文档中,因为文档的结构审查不通过、因为关键字匹配不成功、因为设计图匹配不成功、因为正文篇幅匹配不成功,以及文档标题匹配不成功在所有审查项中所分别占的比例进行计算并输出,从而方便审查人员判断统计结果,进而方便根据统计结果对文档制作人员进行考核,提高文档的管理效果。
46.本技术实施例一种文档自动化审查方法的实施原理为:系统获取文档标题和检查策略,然后将文档标题与检查策略中的策略标题进行匹配,匹配不成功则将不通过的文档进行筛选,匹配成功则获取文档正文中的关键要求,并将关键要求与检查策略中的策略要求进行匹配,匹配不成功进一步将不通过的文档进行筛选,从而提高文档审查的准确性并提高审查的效率,且能够降低审查过程中的劳动力。
47.本技术实施例还公开一种文档自动化审查装置。
48.文档自动化审查装置包括存储器和处理器。存储器,存储有智能处理程序。处理器,运行智能处理程序时执上述方法的步骤。智能处理程序能够采用公知的处理程序对文档进行识别、判断、筛选等一系列步骤,从而实现对文档的自动化审查。
49.本技术实施例还公开一种计算机可读存储介质,其存储有能够被处理器加载并执行如上述的文档自动化审查方法的计算机程序,该计算机可读存储介质例如包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
50.以上均为本技术的较佳实施例,并非依此限制本技术的保护范围,故:凡依本技术的结构、形状、原理所做的等效变化,均应涵盖于本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献