文档质量检测方法、装置、计算机设备及存储介质与流程

2022-11-19 12:25:41 来源：中国专利 TAG：

1.本发明涉及图像处理技术领域，尤其涉及一种文档质量检测方法、装置、计算机设备及存储介质。

背景技术：

2.文档资料自动化识别对于提高信息的转储和分析效率至关重要。在一些业务场景中，例如在保险业务中，有大量的文档资料以图片的形式上传，因此，自动化识别文档资料中的信息能够极大的减轻人工录入和核对的负担。
3.然而，在对文档资料对应的文档图像进行识别过程中，常常因为上传文档图像的质量太差而不能准确的提取文档资料的信息，所以在对文档资料进行信息提取前，需要对质量差的文档图像进行拦截，及时的通知用户重新上传质量符合要求的文档图像，提高整体流程的流转效率。
4.传统的文档质量分析方法通常是直接对整张文档图像进行质量检测，容易使文档图像的背景区域对文档图像的质量评价造成干扰，影响文档质量检测的准确性。

技术实现要素：

5.本发明实施例提供一种文档质量检测方法、装置、计算机设备及存储介质，以解决文档质量检测的准确性较差的问题。
6.一种文档质量检测方法，包括：
7.获取待检测文档图像；
8.对所述待检测文档图像进行文本块提取，获取至少两个目标文本块；
9.对至少两个所述目标文本块进行拼接处理，获取目标检测文档图像；
10.采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理，获取空间融合特征；
11.根据所述空间融合特征，获取所述待检测文档图像对应的文档质量评分。
12.一种文档质量检测装置，包括：
13.图像获取模块，用于获取待检测文档图像；
14.文本块提取模块，用于对所述待检测文档图像进行文本块提取，获取至少两个目标文本块；
15.拼接处理模块，用于对至少两个所述目标文本块进行拼接处理，获取目标检测文档图像；
16.空间融合模块，用于采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理，获取空间融合特征；
17.质量评分模块，用于根据所述空间融合特征，获取所述待检测文档图像对应的文档质量评分。
18.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理
器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述文档质量检测方法。
19.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述文档质量检测方法。
20.上述文档质量检测方法、装置、计算机设备及存储介质，首先获取待检测文档图像，并对待检测文档图像进行文本块提取，获取至少两个目标文本块，以根据至少两个目标文本块进行文档质量检测，避免对整个待检测文档图像进行检测，从而避免待检测文档图像中的干扰因素对待检测文档图像的质量检测造成影响，然后对至少两个目标文本块进行拼接处理，获取目标检测文档图像，并采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征，最后根据空间融合特征，获取待检测文档图像对应的文档质量评分，结合目标文本块在空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测的准确性。
附图说明
21.为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
22.图1是本发明一实施例中文档质量检测方法的一应用环境示意图；
23.图2是本发明一实施例中文档质量检测方法的一流程图；
24.图3是本发明一实施例中文档质量检测方法的另一流程图；
25.图4是本发明一实施例中文档质量检测方法的另一流程图；
26.图5是本发明一实施例中文档质量检测方法的另一流程图；
27.图6是本发明一实施例中文档质量检测方法的另一流程图；
28.图7是本发明一实施例中文档质量检测方法的另一流程图；
29.图8是本发明一实施例中文档质量检测方法的另一流程图；
30.图9是本发明一实施例中文档质量检测装置的一示意图；
31.图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
32.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
33.本发明实施例提供的文档质量检测方法，该文档质量检测方法可应用如图1所示的应用环境中。具体地，该文档质量检测方法应用在文档质量检测系统中，该文档质量检测系统包括如图1所示的客户端和服务器，客户端与服务器通过网络进行通信，用于提高文档质量检测的准确性。其中，客户端又称为用户端，是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来
实现。
34.在一实施例中，如图2所示，提供一种文档质量检测方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：
35.s201：获取待检测文档图像。
36.s202：对待检测文档图像进行文本块提取，获取至少两个目标文本块。
37.s203：对至少两个目标文本块进行拼接处理，获取目标检测文档图像。
38.s204：采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征。
39.s205：根据空间融合特征，获取待检测文档图像对应的文档质量评分。
40.其中，待检测文档图像是指需要进行文档质量检测的文档图像。该文档图像可以为对纸质文档进行拍摄或扫描所形成的图像。该纸质文档可以是不同业务场景中的文档。示例性地，该业务场景可以是保险业务、银行业务或者其他需要识别大量纸质文档的业务场景。
41.作为一示例，在步骤s201中，服务器可获取用户触发的待检测文档图像，例如，可接收客户端发送的文档质量检测请求，根据文档质量检测请求获取待检测文档图像。其中，该文档质量检测请求是指指示服务器进行文档质量检测的请求。可选地，该文档质量检测请求可以包括该待检测文档图像或者该待检测文档图像对应的数据库地址，即服务器可以直接从文档质量检测请求获取该待检测文档图像，也可以根据该数据库地址，从数据库中获取该待检测文档图像。需要说明的是，也可以采用其他获取待检测文档图像的方式，只要能够获取待检测文档图像即可，在此不做限制。
42.其中，目标文本块是指对待检测文档图像进行文本块提取后获取的文本块。
43.作为一示例，在步骤s202中，服务器获取待检测文档图像后，对待检测文档图像进行文本块提取，获取至少两个目标文本块。
44.示例性地，服务器可以按照预设的文本块提取逻辑，对待检测文档图像进行文本块提取，获取至少两个目标文本块。其中，预设的文本块提取逻辑是指对待检测文档图像进行文本块提取的逻辑。可选地，该预设的文本块提取逻辑可以是随机地从待检测文档图像的多个提取位置上，提取至少两个目标文本块，也可以是按照预设的至少两个提取位置，从待检测文档图像中提取至少两个目标文本块。例如，该提取位置可以是文档标题、文档签名或其他文档内容所在的位置。
45.可以理解地，不同的提取位置在待检测文档图像中的空间位置是不同的。例如，文档标题在该待检测文档图像中的上方，该文档签名在待检测文档图像的右下方。作为优选地，该预设的文本块提取逻辑为随机地从待检测文档图像的多个提取位置上，提取至少两个目标文本块，由于不同的待检测文档图像中的文档内容在待检测文档图像中的空间位置是不同的，因此，可通过预设的文本块提取逻辑，随机地从待检测文档图像的多个提取位置上，提取至少两个目标文本块，能够提高后续文档质量检测的准确性。
46.在本示例中，服务器对待检测文档图像进行文本块提取，获取至少两个目标文本块，以在后续步骤中，根据至少两个目标文本块进行文档质量检测，避免对整个待检测文档图像进行检测，从而避免待检测文档图像中的背景区域或者其他干扰因素，对待检测文档图像的质量检测造成影响，提高对待检测文档图像进行质量检测的准确性。其中，该干扰因
素与文本内容无关、会对文本内容检测造成干扰的因此，例如，该干扰因素可以为待检测文档图像中的背景区域。
47.其中，目标检测文档图像是指对至少两个目标文本块进行拼接处理后得到的文档图像。
48.作为一示例，在步骤s203中，服务器对至少两个目标文本块进行拼接处理，获取目标检测文档图像。在本示例中，通过对至少两个目标文本块进行拼接处理，获取目标检测文档图像，从而结合至少两个目标文本块在待检测文档图像中不同的空间位置这一特性，在后续步骤中对目标检测文档图像进行检测，以达到提高文档质量检测准确性的目的。
49.其中，预先训练的文档检测模型是指预先训练的，用于文档质量检测的模型。示例性地，该预先训练的文档检测模型用于对目标检测文档图像进行空间特征融合处理的模型。空间融合特征是指对采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理得到的空间特征。
50.作为一示例，在步骤s204中，服务器采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征。示例性地，服务器根据目标检测文档图像中，至少两个目标文本块在待检测文档图像中的空间位置，将该至少两个目标文本块对应的特征，以及至少两个目标文本块在待检测文档图像中的空间位置对应的特征，进行空间特征融合处理，从而获取空间融合特征。在本示例中，通过将采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征，从而在后续步骤中，结合目标文本块在空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测准确性。
51.其中，文档质量评分是指根据空间融合特征，获取的待检测文档图像对应的质量评分。
52.作为一示例，在步骤s205中，服务器根据空间融合特征，获取待检测文档图像对应的文档质量评分。示例性地，服务器在获取空间融合特征后，采用预先训练的文档检测模型对空间融合特征进行评分处理，获取待检测文档图像对应的文档质量评分。例如，服务器采用预先训练的文档检测模型，根据空间融合特征，确定待检测文档图像中，高质量文档的待检测文档图像的概率和低质量文档的待检测文档图像的概率，并根据高质量文档的待检测文档图像的概率和低质量文档的待检测文档图像的概率，确定为待检测文档图像对应的质量评分。
53.在本实施例中，首先获取待检测文档图像，并对待检测文档图像进行文本块提取，获取至少两个目标文本块，以根据至少两个目标文本块进行文档质量检测，避免对整个待检测文档图像进行检测，从而避免待检测文档图像中的干扰因素对待检测文档图像的质量检测造成影响，然后对至少两个目标文本块进行拼接处理，获取目标检测文档图像，并采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征，最后根据空间融合特征，获取待检测文档图像对应的文档质量评分，结合目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测的准确性。
54.在一实施例中，如图3所示，步骤s202中，即对待检测文档图像进行文本块提取，获取至少两个目标文本块，包括：
55.s301：对待检测文档图像进行文本框检测，获取至少两个文本框图像，并获取每一文本框图像对应的中心坐标和文本框大小。
56.s302：基于每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块。
57.其中，文本框图像是指对待检测文档图像进行文本框检测获取的文本图像。文本框图像对应的中心坐标是指文本框图像中心位置的坐标。例如x轴和y轴形成的坐标。文本框大小是指文本框图像的大小。
58.作为一示例，在步骤s301中，服务器对待检测文档图像进行文本框检测，获取至少两个文本框图像。作为优选地，服务器可以随机地对待检测文档图像进行文本框检测，获取至少两个文本框图像，即随机地从待检测文档图像上，获取至少两个文本框图像。进一步地，服务器可以采用文本框检测工具对待检测文档图像进行文本框检测，获取至少两个文本框图像。可选地，该文本框检测工具可以是mobilenet_v3—ssd网络模型。
59.作为一示例，在步骤s301中，服务器获取至少两个文本框图像后，对每一文本框图像对应的中心坐标和文本框大小进行检测，获取每一文本框图像对应的中心坐标和文本框大小，以便于后续步骤中，根据每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块。
60.作为一示例，在步骤s302中，服务器基于每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块。示例性地，服务器可以预设的文本块提取规则，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块。其中，该预设的文本块提取规则是指对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块的规则。示例性地，该预设的文本块提取规则可以是从每一文本框图像中提取一个目标文本块，也可以是从每一文本块图像中提取多个目标文本块。进一步地，该预设的文本块提取规则可以是从每一文本框图像的中心坐标处提取目标文本块，也可以是在每一文本块图像中的预定位置中提取目标文本块。该预定位置为自定义设置的位置，具体可根据实际需求设置，在此不作限制。作为优选地，该预设的文本块提取规则可以是从每一文本框图像的中心坐标处提取目标文本块。由于文档内容主要位于文本块图像的中心坐标对应的位置，因此，将预设的文本块提取规则配置为从每一文本框图像的中心坐标处提取目标文本块，从而使提取的目标文本块能够更好的反映出待检测文档图像的文档质量。
61.需要说明的是，本实施例获取每一文本框图像对应的中心坐标和文本框大小，还为后续步骤中对目标检测文档图像进行空间特征融合处理提供基础。
62.在本实施例中，通过对待检测文档图像进行文本框检测，获取至少两个文本框图像，并获取每一文本框图像对应的中心坐标和文本框大小，并基于每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块，便能够从待检测文档图像中提取至少两个目标文本块。
63.在一实施例中，如图4所示，步骤s302中，即基于每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块，包括：
64.s401：基于每一文本框图像对应的中心坐标和文本框大小，确定每一文本框图像
中的目标提取位置。
65.s402：基于每一文本框图像中的目标提取位置和预设块大小阈值，获取，获取每一文本框图像对应的目标文本块。
66.其中，目标提取位置是指从每一文本框图像中的确定的位置，用于提取目标文本块。可选地，该目标提取位置可以是与文本框图像的中心坐标相同的位置，也可以是文本块图像中的预定位置。该预定位置为自定义设置的位置，具体可根据实际需求设置，在此不作限制。
67.作为一示例，在步骤s401中，服务器基于每一文本框图像对应的中心坐标和文本框大小，确定每一文本框图像中的目标提取位置，从而在后续步骤中基于目标提取位置获取目标文本块。
68.其中，预设块大小阈值为自定义设置的阈值，用于限定目标文本块的大小。
69.作为一示例，在步骤s402中，服务器基于每一文本框图像中的目标提取位置和预设块大小阈值，获取，获取每一文本框图像对应的目标文本块。示例性地，设预设块大小阈值为512*512，目标提取位置为(xc，yc)，则提取的目标文本块为[xc-256:xc 255，yc-256:yc 256]。
[0070]
在本实施例中，通过基于每一文本框图像对应的中心坐标和文本框大小，确定每一文本框图像中的目标提取位置，然后基于每一文本框图像中的目标提取位置和预设块大小阈值，获取，获取每一文本框图像对应的目标文本块，便能够获取至少两个目标文本块。
[0071]
在一实施例中，如图5所示，步骤s203中，即对至少两个目标文本块进行拼接处理，获取目标检测文档图像，包括：
[0072]
s501：对至少两个目标文本块进行预处理，获取至少两个文本处理块。
[0073]
s502：获取每一文本处理块对应的中心坐标，并基于文本处理块对应的中心坐标，确定目标空间位置顺序。
[0074]
s503：基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像。
[0075]
其中，文本处理块是指对至少两个目标文本块进行预处理后获取的文本块。
[0076]
作为一示例，在步骤s501中，服务器对至少两个目标文本块进行预处理，获取至少两个文本处理块，以便于对至少两个目标文本块进行拼接处理，获取目标检测文档图像。该预处理可以是公有的预处理技术，只要满足对至少两个目标文本块进行预处理，获取至少两个文本处理块后，可以对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像即可。示例性地，服务器对至少两个目标文本块进行预处理可以是对目标文本块进行滤波去噪、去均值、归一化和白化等处理。
[0077]
其中，目标空间位置顺序是指每一文本处理块在待检测文档图像中的空间位置对应的顺序。示例性地，目标空间顺序包括每一文本处理块之间在待检测文档图像中的空间上下文关系。例如，文档标题对应的文本处理块在该待检测文档图像中的上方，该文档签名对应的文本处理块在待检测文档图像的右下方。
[0078]
作为一示例，在步骤s502中，服务器基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像，以在后续步骤中基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像。
[0079]
作为一示例，在步骤s503中，服务器基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像。示例性地，服务器基于目标空间位置顺序，便能够获取至少两个文本处理块在空间位置上的关系，从而对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像。对至少两个文本处理块进行顺序调整是指根据目标文本块在待检测文档图像中的空间位置，调整至少两个文本处理块的通道拼接顺序。对至少两个文本处理块进行通道拼接是指将至少两个文本处理块对应的通道进行拼接，获取目标检测文档图像。
[0080]
在本实施例中，通过对至少两个目标文本块进行预处理，获取至少两个文本处理块，并获取每一文本处理块对应的中心坐标，并基于文本处理块对应的中心坐标，确定目标空间位置顺序，最后基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像，从而使目标检测文档图像结合目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测的准确性。
[0081]
在一实施例中，如图6所示，步骤s204中，即采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征，包括：
[0082]
s601：采用单通道分割模块对目标检测文档图像进行特征向量提取，获取多个空间特征向量。
[0083]
s602：采用注意力机制模块对多个空间特征向量进行特征融合处理，获取空间融合特征。
[0084]
其中，单通道分割模块是指channelsplit模块。空间特征向量是指对目标检测文档图像进行特征向量提取后获取的特征向量。
[0085]
作为一示例，在步骤s601中，服务器通过单通道分割模块对目标检测文档图像进行特征向量提取，获取多个空间特征向量，即提取每一目标文本块在待检测文档图像中的空间位置对应的空间特征向量。在本示例中，采用单通道分割模块对目标检测文档图像进行特征向量提取，获取多个空间特征向量，以便于在后续步骤中根据该多个空间特征向量，以在目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测。
[0086]
其中，注意力机制模块是指self-attention模块。
[0087]
作为一示例，在步骤s602中，服务器采用注意力机制模块对多个空间特征向量进行特征融合处理，获取空间融合特征。示例性地，注意力机制模块将多个空间特征向量，转换成查询向量、键向量和值向量，并根据预设的特征融合公式，获取空间融合特征。其中，根据特征融合公式：
[0088][0089]
其中，q为查询向量，k为键向量和v为值向量，attention为空间融合特征，包括多个空间特征向量之间的空间上下文关系。在本示例中，可通过上述公式对多个空间特征向量进行特征融合处理，获取空间融合特征。
[0090]
在本实施例中，通过采用单通道分割模块对目标检测文档图像进行特征向量提取，获取多个空间特征向量，并采用注意力机制模块对多个空间特征向量进行特征融合处
理，便能够获取空间融合特征，以在目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测，提高文档质量检测的准确性。
[0091]
在一实施例中，如图7所示，步骤s205中，即采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征，包括：
[0092]
s701：采用全卷积网络模块对空间融合特征进行分类处理，获取目标分类结果。
[0093]
s702：采用平均池化模块对目标分类结果进行评分处理，获取待检测文档图像对应的文档质量评分。
[0094]
其中，全卷积网络模块是指fc全连接层模块。目标分类结果是指对空间融合特征进行分类处理后得到的结果。该目标分类结果可以高质量文档的待检测文档图像和低质量文档的待检测文档图像中的任一个。
[0095]
作为一示例，在步骤s701中，服务器采用全卷积网络模块对空间融合特征进行分类处理，获取目标分类结果。示例性地，服务器采用全卷积网络模块对空间融合特征进行分类处理，判断空间融合特征对应的待检测文档图像是否为高质量文档或低质量文档，将空间融合特征对应的待检测文档图像分类成高质量文档或低质量文档，即目标分类结果。
[0096]
其中，平均池化模块是指average pooling模块。文档质量评分是指对目标分类结果进行评分处理获取的质量评分。
[0097]
作为一示例，在步骤s702中，服务器采用平均池化模块对目标分类结果进行评分处理，获取待检测文档图像对应的文档质量评分。示例性地，服务器通过平均池化模块，统计目标分类结果中高质量文档的概率和低质量文档的概率，并将该高质量文档的概率和低质量文档的概率确定为待检测文档图像对应的文档质量评分，从而完成文档质量检测。
[0098]
在本实施例中，通过采用全卷积网络模块对空间融合特征进行分类处理，获取目标分类结果，并采用平均池化模块对目标分类结果进行评分处理，获取待检测文档图像对应的文档质量评分，结合目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测的准确性。
[0099]
在一实施例中，如图8所示，在步骤s201之前，即在获取待检测文档图像之前，文档质量检测方法还包括：
[0100]
s801：获取训练文档图像，训练文档图像携带文档标签。
[0101]
s802：对训练文档图像进行文本块提取，获取训练文本块。
[0102]
s803：将训练文本块依次经过单通道分割模块、注意力机制模块、全卷积网络模块和平均池化模块处理，获取每一训练文档图像对应的预测标签。
[0103]
s804：根据每一训练文档图像对应的预测标签和文档标签，确定目标损失函数，在目标损失函数收敛时，获取文档检测模型。
[0104]
其中，训练文档图像是指用于训练文档检测模型的图像。文档标签是指每一训练文档图像对应标签。
[0105]
作为一示例，在步骤s801之前，即获取训练文档图像之前，服务器先获取正样本文档图像；对正样本文档图像进行模糊处理，获取负样本文档图像；将正样本文档图像和负样本文档图像确定为训练文档图像。其中，该正样本文档图像为高清图像。该模糊处理包括但不限于高斯模糊，高斯噪声，运动模糊和jpeg压缩。该正样本文档图像和负样本文档图像的
比例为1:1。
[0106]
其中，训练文本块为对训练文档图像进行文本块提取，获取的文本块。
[0107]
作为一示例，在步骤s802中，服务器对训练文档图像进行文本块提取，获取训练文本块。在本示例中，服务器对训练文档图像进行文本块提取，获取训练文本块的过程，与步骤s301-s302类似，在此不再赘述。
[0108]
作为一示例，在步骤s803中，服务器将训练文本块依次经过单通道分割模块、注意力机制模块、全卷积网络模块和平均池化模块处理，获取每一训练文档图像对应的预测标签。该预测标签是指采用单通道分割模块、注意力机制模块、全卷积网络模块和平均池化模块对训练文本块进行处理后，输出的预测训练文档图像为高质量文档还是低质量文档的结果标签。
[0109]
其中，目标损失函数是指根据根据每一训练文档图像对应的预测标签和文档标签确定的损失函数。
[0110]
作为一示例，在步骤s804中，服务器根据每一训练文档图像对应的预测标签和文档标签，计算目标损失函数，并在目标损失函数收敛时，获取文档检测模型。在本示例中，根据每一训练文档图像对应的预测标签和文档标签，计算目标损失函数，在目标损失函数收敛时，认定其预测标签与文档标签相同的概率较大，因此，可获取文档检测模型，以保证文档检测模型的准确性。
[0111]
在本实施例中，先获取训练文档图像，该训练文档图像携带文档标签，然后通过对训练文档图像进行文本块提取，获取训练文本块，并将训练文本块依次经过单通道分割模块、注意力机制模块、全卷积网络模块和平均池化模块处理，获取每一训练文档图像对应的预测标签，最后根据每一训练文档图像对应的预测标签和文档标签，确定目标损失函数，在目标损失函数收敛时，获取文档检测模型，以使该文档检测模型能够结合目标文本块在待检测文档图像中的空间位置这一维度，对待检测文档图像进行质量检测，使文档质量检测更加趋近于人工检测的效果，提高文档质量检测的准确性。
[0112]
应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。
[0113]
在一实施例中，提供一种文档质量检测装置，该文档质量检测装置与上述实施例中文档质量检测方法一一对应。如图9所示，该文档质量检测装置包括图像获取模块901、文本块提取模块902、拼接处理模块903、空间融合模块904和质量评分模块905。各功能模块详细说明如下：
[0114]
图像获取模块901，用于获取待检测文档图像；
[0115]
文本块提取模块902，用于对待检测文档图像进行文本块提取，获取至少两个目标文本块；
[0116]
拼接处理模块903，用于对至少两个目标文本块进行拼接处理，获取目标检测文档图像；
[0117]
空间融合模块904，用于采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理，获取空间融合特征；
[0118]
质量评分模块905，用于根据空间融合特征，获取待检测文档图像对应的文档质量
评分。
[0119]
进一步地，文本块提取模块902包括：
[0120]
文本框单元，用于对待检测文档图像进行文本框检测，获取至少两个文本框图像，并获取每一文本框图像对应的中心坐标和文本框大小；
[0121]
文本块单元，用于基于每一文本框图像对应的中心坐标和文本框大小，对每一文本框图像进行文本块提取，获取每一文本框图像对应的目标文本块。
[0122]
进一步地，文本块单元包括：
[0123]
目标位置单元，用于基于每一文本框图像对应的中心坐标和文本框大小，确定每一文本框图像中的目标提取位置；
[0124]
预设阈值单元，用于基于每一文本框图像中的目标提取位置和预设块大小阈值，获取，获取每一文本框图像对应的目标文本块。
[0125]
进一步地，拼接处理模块903包括：
[0126]
预处理单元，用于对至少两个目标文本块进行预处理，获取至少两个文本处理块；
[0127]
空间位置单元，用于获取每一文本处理块对应的中心坐标，并基于文本处理块对应的中心坐标，确定目标空间位置顺序
[0128]
目标图像单元，用于基于目标空间位置顺序，对至少两个文本处理块进行顺序调整和通道拼接，获取目标检测文档图像。
[0129]
进一步地，空间融合模块904包括：
[0130]
特征向量单元，用于采用单通道分割模块对目标检测文档图像进行特征向量提取，获取多个空间特征向量；
[0131]
特征融合单元，用于采用注意力机制模块对多个空间特征向量进行特征融合处理，获取空间融合特征。
[0132]
进一步地，质量评分模块905包括：
[0133]
分类结果单元，用于采用全卷积网络模块对空间融合特征进行分类处理，获取目标分类结果；
[0134]
评分处理单元，用于采用平均池化模块对目标分类结果进行评分处理，获取待检测文档图像对应的文档质量评分。
[0135]
进一步地，文档质量检测装置还包括：
[0136]
文档图像获取模块901，用于获取训练文档图像，训练文档图像携带文档标签；
[0137]
训练文本块模块，用于对训练文档图像进行文本块提取，获取训练文本块；
[0138]
识别结果模块，用于将训练文本块依次经过单通道分割模块、注意力机制模块、全卷积网络模块和平均池化模块处理，获取每一训练文档图像对应的预测标签；
[0139]
模型获取模块，用于根据每一训练文档图像对应的预测标签和文档标签，确定目标损失函数，在目标损失函数收敛时，获取文档检测模型。
[0140]
关于文档质量检测装置的具体限定可以参见上文中对于文档质量检测方法的限定，在此不再赘述。上述文档质量检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
[0141]
在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文档质量检测过程中产生的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文档质量检测方法。
[0142]
在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中文档质量检测方法，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现文档质量检测装置这一实施例中的各模块/单元的功能，为避免重复，这里不再赘述。
[0143]
在一实施例中，提供一计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中文档质量检测方法，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现上述文档质量检测装置这一实施例中的各模块/单元的功能，为避免重复，这里不再赘述。
[0144]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0145]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。
[0146]
以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种存储集群容灾管理方法、系统、电子设备和存储介质与流程

文档质量检测方法、装置、计算机设备及存储介质与流程

相关文献

最热文献