相邻表格处理方法、装置、计算机设备和存储介质与流程

2021-11-25 00:21:00 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，特别是涉及一种相邻表格处理方法、装置、计算机设备和存储介质。

背景技术：

2.随着人工智能技术的发展，人工智能在自然语言学习、图形处理等等领域得到了大量的应用。对于文本进行识别的时候，相邻的页、相邻的栏或者相邻换行存在表格，相邻的页、相邻的栏或者相邻换行的表格在进行文本识别的时候，需要判断是否进行合并。
3.传统技术中，对于表格是否合并的判断仅是单纯地通过表格分割线进行判断。
4.然而，当无表格分割线的时候，对于相邻的表格的行是否需要合并则无法进行准确判断。

技术实现要素：

5.基于此，有必要针对上述技术问题，提供一种能够提高准确性的相邻表格处理方法、装置、计算机设备和存储介质。
6.一种相邻表格处理方法，所述相邻表格处理方法包括：
7.获取相邻的待处理表格；
8.对相邻的所述待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征；
9.根据所提取的单元格特征计算得到第一方向上的第一特征，所述第一方向为相邻的所述待处理表格的合并方向；
10.通过对所述第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征；
11.根据所述第二特征判断所述相邻的待处理表格是否需要合并。
12.在其中一个实施例中，所述对相邻的所述待处理表格中每一单元格进行单元格特征提取，包括：
13.将所述待处理表格中的每一字符进行编码处理得到编码结果；
14.对所述编码结果进行字符特征提取得到每一字符对应的字符特征；
15.根据所述字符特征得到每一单元格的单元格特征。
16.在其中一个实施例中，所述将所述待处理表格中的每一字符进行编码处理得到编码结果，包括：
17.通过自动学习模型、word2vec模型以及预训练语言模型中的至少一种方法，将所述待处理表格中的每一字符进行编码处理得到编码结果。
18.在其中一个实施例中，所述对所述编码结果进行字符特征提取得到每一字符对应的字符特征，包括：
19.将所述编码结果输入至特征提取层得到字符初始特征，所述特征提取层通过预训
练语言模型、卷积网络以及循环神经网络中的至少一种方法实现；
20.通过第一激活函数对所述初始特征进行处理得到对应的字符特征。
21.在其中一个实施例中，所述根据所述字符特征得到每一单元格的单元格特征，包括：
22.通过求取每个单元格中的字符的字符特征的统计量特征作为所述单元格特征。
23.在其中一个实施例中，所述第一特征和所述第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征；并通过第二激活函数对所述方向初始特征进行处理得到的。
24.在其中一个实施例中，所述第一特征向量中每一元素包括第二方向上待合并的两部分；所述通过对所述第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征，包括：
25.将所述第一特征中每一元素在第二方向上的两部分分别进行拼接得到第二特征，所述第二特征包括所述待处理表格的字符特征、第一方向信息和第二方向信息。
26.在其中一个实施例中，所述根据所述第二特征判断所述相邻的待处理表格是否需要合并，包括：
27.通过全连接网络和第三激活函数根据所述第二特征判断所述相邻的待处理表格是否需要合并。
28.一种相邻表格处理装置，所述相邻表格处理装置包括：
29.待处理表格获取模块，用于获取相邻的待处理表格；
30.单元格特征提取模块，用于对相邻的所述待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征；
31.第一特征提取模块，用于根据所提取的单元格特征计算得到第一方向上的第一特征，所述第一方向为相邻的所述待处理表格的合并方向；
32.第二特征提取模块，用于通过对所述第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征；
33.判断模块，用于根据所述第二特征判断所述相邻的待处理表格是否需要合并。
34.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的任意一个实施例中的方法的步骤。
35.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
36.上述相邻表格处理方法、装置、计算机设备和存储介质，先提取了每一个单元格的单元格特征，然后根据单元格特征计算得到第一方向上的第一特征，并根据第一方向上的第一特征计算得到了第二方向上的第二特征，这样使得第二特征包括了单元格的信息、第一方向上的信息和第二方向上的信息，使得第二特征包含的信息更多，进而根据该第二特征进行相邻的待处理表格是否需要合并的判断更为准确。
附图说明
37.图1为一个实施例中相邻表格处理方法的流程示意图；
38.图2为一个实施例中跨页的待处理表格的示意图；
39.图3为一个实施例中的跨栏的待处理表格的示意图；
40.图4为另一个实施例中跨页的待处理表格的示意图；
41.图5为一个实施例中的相邻表格处理方法的系统架构图；
42.图6为一个实施例中的相邻表格处理方法的模型结构图；
43.图7为一个实施例中相邻表格处理装置的结构框图；
44.图8为一个实施例中计算机设备的内部结构图。
具体实施方式
45.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
46.在一个实施例中，如图1所示，提供了一种相邻表格处理方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：
47.s102：获取相邻的待处理表格。
48.具体地，相邻的待处理表格是指相邻的页、相邻的栏或者相邻换行存在表格，具体可以参见图2至图4所示，其中图2为一个实施例中跨页的待处理表格的示意图，图3为一个实施例中的跨栏的待处理表格的示意图，图4为另一个实施例中跨页的待处理表格的示意图。
49.在图2中其中第一行表示前一页的最后一行单元格，第二行表示后一页的第一行单元格。在图3中第一行表示前一栏的最后一行单元格，第二行表示后一栏的第一行单元格。在图4中第一列表示前一页的最后一列单元格，第二列标识后一页的第一列单元格。
50.其中在实际应用上，上述的相邻的待处理表格为输入，输出则为对应的单元格是否需要进行合并，其中输出的结果可以新增一行或一列，例如图2和图3中则新增一行用于表征对应的单元格是否需要合并，其中可以通过对应的标识进行标识，例如标识为1，则标识需要合并，否则不需要合并。
51.s104：对相邻的待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征。
52.具体地，单元格特征通过每个单元格中的所有字符的字符特征计算得到的，这样所得到的单元格特征可以表征单元格中所有的字符。该单元格特征的物理含义是单元格中每个字符的词性、组词概率等。
53.其中，终端可以并行对每个单元格进行处理以得到每个单元格对应的单元格特征。其中可选地，对于单元格特征的提取可以通过人工智能的方式进行，例如终端可以先通过特征提取器对单元格中所有字符的字符特征进行提取得到单元格特征，其中特征提取的方法可以是根据单元格中所有字符特征的统计量计算得到，例如通过求和、求平均或者是求最大值等，在此不做具体限制。其中求和是指单元格的所有字符特征向量求和的向量作为单元格特征向量；求平均是该单元格的所有字符特征向量求平均作为单元格特征向量；求最大值是该单元格中字符特征向量每一维的最大值作为单元格单元格特征向量这一维
度对应的值，上述模型可以使用其一或者多个进行自由组合。
54.s106：根据所提取的单元格特征计算得到第一方向上的第一特征，第一方向为相邻的待处理表格的合并方向。
55.具体地，第一方向是指相邻的待处理表格的合并方向，以图2和图3为例，其中合并方向为竖向，因此第一方向即为竖向，第一方向上的第一特征即为竖向的第一特征，也即列特征。
56.其中，终端将对应列的单元格特征连接或者是组合得到列特征。具体地，终端开始处理的时候是先是读取以第二方向，以图2和图3为例，即以行方向读取单元格特征，这样在计算第一特征时，则仅需要将两行单元格特征，即在第二方向上的两个单元格特征向量输入至第一特征提取层，并通过激活函数得到第一特征。其中第一特征提取层可以选择任意特征提取层，优选地，可以采用预训练语言模型、卷积网络以及循环神经网络中的至少一种方法，其中预训练语言模型包括transformer、bert以及其他所有预训练语言模型，卷积网络可以为cnn、多层rnn等；循环神经网络可以包括rnn以及gru、dynamic_lstm、双向lstm、单层lstm、多层lstm、双向多层lstm等，上述模型可以使用其一或者多个进行自由组合。
57.s108：通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征。
58.具体地，第二方向是与第一方向对应的方向，例如第一方向为竖向，则第二方向为横向，第一方向为横向，则第二方向为竖向。仍以图2为例，其中第二方向为横向，这样第二特征即为行特征。
59.其中，第一特征中的每个元素是由两部分组成的，这两部分分别对应第二方向上不同的行/列，终端将第一特征中的每个元素中对应的第二方向上的两部分分开，然后按照第二方向上的行/列进行拼接即可得到第二特征。
60.具体地，终端将第一特征的两部分分开，然后将所有第一特征中对应的部分进行拼接即可以得到第二特征。其中第二特征提取层可以选择任意特征提取层，优选地，可以采用预训练语言模型、卷积网络以及循环神经网络中的至少一种方法，其中预训练语言模型包括transformer、bert以及其他所有预训练语言模型，卷积网络可以为cnn、多层rnn等；循环神经网络可以包括rnn以及gru、dynamic_lstm、双向lstm、单层lstm、多层lstm、双向多层lstm等，上述模型可以使用其一或者多个进行自由组合。
61.s110：根据第二特征判断相邻的待处理表格是否需要合并。
62.具体地，终端拼接得到的第二特征包括了单元格的信息、第一方向上的信息和第二方向上的信息，使得第二特征包含的信息较多，终端再将该第二特征输入至分类器中进行判断，以确定对应的第一方向上的单元格是否需要合并。
63.其中，终端将第二特征输入至分类器中，并将分类器的输出输入至激活函数中得到最后的输出，其中输出为一包括多个维度的向量，该向量的每一维度表示第一方向上的两个单元格是否需要合并，其可以是通过概率表示或者是通过标志进行标识。以图2和图3为例，输出的向量的每一维度为对应列的两行单元格是否需要合并，例如行特征输入分类器linear，获得2维向量，通过softmax激活函数后将向量元素映射到(0，1)，选择二维向量中最大值所在的索引表示预测标签，0表示不合并，1表示合并。
64.上述相邻表格处理方法，先提取了每一个单元格的单元格特征，然后根据单元格
特征计算得到第一方向上的第一特征，并根据第一方向上的第一特征计算得到了第二方向上的第二特征，这样使得第二特征包括了单元格的信息、第一方向上的信息和第二方向上的信息，使得第二特征包含的信息更多，进而根据该第二特征进行相邻的待处理表格是否需要合并的判断更为准确。
65.在其中一个实施例中，对相邻的待处理表格中每一单元格进行单元格特征提取，包括：将待处理表格中的每一字符进行编码处理得到编码结果；对编码结果进行字符特征提取得到每一字符对应的字符特征；根据字符特征得到每一单元格的单元格特征。
66.具体地，终端先获取两个句子，以图2和图3为例其一行表格对应一个句子，图4则一列表格对应一个句子，这样包括两个句子，且每个句子中以特定的符号标定不同的单元格，例如以特定的符号将两个单元格中的字符进行连接。终端将两个句子输入至字符向量编码层获得每一个字符对应的编码结果，然后将编码结果进行字符特征提取得到每一个字符对应的字符特征，最后根据每个单元格中对应的字符的字符特征计算得到单元格特征。
67.其中，以图2和图3中为例进行说明，假设需要预测的句子为[{c
11
，c
12
，c
13
，...c
1n
}{c
21
，c
22
，c
23
...c
2n
}]，其中c
ij
表示第i行第j列的单元格，(i＝1，2表示最多两行，j＝1，2，...，100，表示最多100列)，n＜＝100；c
ij
＝[v
ij1
，v
ij2
，...v
ijk
]表示单元格中的字符，(k＜＝100)例如v
ij1
表示单元格c
ij
第一个字符。
[0068]
字符v经过一个全连接层，得到字符的编码结果，以词向量v进行表示，则c
ij
＝[v
ij1
，v
ij2
，...v
ijk
]。
[0069]
终端将行列的单元格展开得到{c
11
，c
12
，c
13
，...c
1n
，c
21
，c
22
，c
23
，...c
2n
}，其中c
ij
＝[v
ij1
，v
ij2
，...v
ijk
]；经过一个字符特征提取层得到c1
ij
＝[h1
ij1
，h1
ij2
，...h1
ijk
]；h1
ijr
是一个100维的向量，表示第i行第j列的第r个字符的字符特征，其中以特征向量的方式表示；再提取单元格的特征：选择[h1
ij1
，h1
ij2
，...h1
ijk
]中每一个维度中的统计量组成一个向量h1
ij
作为第i行第j列的单元格的向量，其中例如选择每一维度的最大值，则通过这一步得到每个单元格有一个100维的特征向量，也即单元格特征。优选地，为了后续第一特征的提取的维度符合要求，终端将单元格特征输入一全连接层和relu激活函数以降低单元格特征的维度，其中降维后的单元格特征为{c1
11
，c1
12
，c1
13
，...c1
1n
，c1
21
，c1
22
，c1
23
，...c1
2n
}，c1
ij
的向量维度为50。
[0070]
可选地，将待处理表格中的每一字符进行编码处理得到编码结果，包括：通过自动学习模型、word2vec模型以及预训练语言模型中的至少一种方法，将待处理表格中的每一字符进行编码处理得到编码结果。
[0071]
具体地，向量编码层可以选择：linear全连接层随机初始化，通过模型训练自动学习字符向量表示；word2vec模型，例如通过skip_gram或者cbow训练得到的词向量模型以及预训练语言模型如bert、roberta、elmo、electra、gpt的词向量。且可选地，上述一项或者多项的自由组合也可以用于字符编码层，比如使用word2vec的词向量加上bert的词向量或者bert词向量加gpt的词向量
[0072]
在其中一个实施例中，对编码结果进行字符特征提取得到每一字符对应的字符特征，包括：将编码结果输入至特征提取层得到字符初始特征，特征提取层通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法实现；通过第一激活函数对初始特征进行处理得到对应的字符特征。
[0073]
具体地，字符特征提取可以是先通过特征提取层提取到字符初始特征，然后通过第一激活函数对初始特征进行处理得到对应的字符特征。其中特征提取层通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法实现，其中与训练语言模型可以是transformer、bert以及其他所有预训练语言模型，卷积网络可以为cnn、多层rnn等；循环神经网络可以包括rnn以及gru、dynamic_lstm、双向lstm、单层lstm、多层lstm、双向多层lstm等，上述模型可以使用其一或者多个进行自由组合。上述模型可以使用其一或者多个进行自由组合，比如通过双向lstm后，再过一个bert模型来提取字符特征，在模型后可按照实际案例添加线性层或者激活函数作为维度调节和引入非线性因素。
[0074]
在其中一个实施例中，根据所述字符特征得到每一单元格的单元格特征，包括：通过求取每个单元格中的字符的字符特征的统计量特征作为单元格特征。
[0075]
具体地，终端将每个单元格中的字符特征进行处理得到单元格特征，其中，单元格特征提取的方法可以是根据单元格中所有字符特征的统计量计算得到，例如通过求和、求平均或者是求最大值等，在此不做具体限制。其中求和是指单元格的所有字符特征向量求和的向量作为单元格特征向量；求平均是该单元格的所有字符特征向量求平均作为单元格特征向量；求最大值是该单元格中字符特征向量每一维的最大值作为单元格的单元格特征向量这一维度对应的值，上述模型可以使用其一或者多个进行自由组合。
[0076]
上述实施例中，在不同的层可以通过不同的模型进行自由组合，从而以提取到单元格特征。
[0077]
在其中一个实施例中，第一特征和第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征；并通过第二激活函数对方向初始特征进行处理得到的。
[0078]
具体地，第一特征是将两行/两列待合并的单元格所对应的单元格特征输入至特征提取层，并通过激活函数获取到列/行的特征表示。第二特征是将所得到的列/行的特征进行向量拼接得到的行/列特征。
[0079]
其中第一特征和第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征，例如第一特征可以是使用其一或者多个进行自由组合，比如通过cnn后再过一个gru模型来提取列特征，在模型后可按照实际案例添加线性层或者激活函数作为维度调节和引入非线性因素。第二特征可以是使用其一或者多个进行自由组合，比如通过dynamic_lstm后再过一个transformer模型来提取列特征，在此不做具体的限定。
[0080]
具体地，仍以上述例子为例进行说明，将列{c1
.1
，c1
.2
，c1
.3
，...c1
.n
}，其中c1
.j
＝[h1
1j
，h1
2j
]，经过一个dynamic_lstm，得列向量{c2
.2
，c2
.2
，c2
.3
，
…
c2
n
}，其中c2
.j
＝[h2
1j
，h2
2j
]，h2
1j
维度为100。
[0081]
终端将列向量维度降低：即将{c2
.1
，c2
.2
,c2
.3
，
…
c2
.n
}再经过全连接层和relu激活函数，得到{c3
.1
，c3
.2
，c3
.3
，...c3
.n
}，其中c3
.j
＝[h3
1j
，h3
2j
]，h3
1j
维度为50，c3
.j
为100维，通过降维后再进行拼接是为了让输入到每一个编码器的维度保持一致为100维。
[0082]
在其中一个实施例中，第一特征向量中每一元素包括第二方向上待合并的两部分；通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征，包括：将第一特征中每一元素在第二方向上的两部分分别进行拼接得到第二特征，第二特征
包括待处理表格的字符特征、第一方向信息和第二方向信息。
[0083]
具体地，终端将列向量{c3
.1
，c3
.2
，c3
.3
，...c3
.n
}进行向量拼接得到{c31，c32，c33，...c3
n
}，其中c3
j
＝[h3
1j
，h3
2j
]，h3
1j
维度为50，c3
j
的维度为100。{c31，c32，c33，
…
c3
n
}经过一个dynamic_lstm，再经过全连接层和relu激活函数得到{c41，c42，c43，...c4
n
}，其中c4
j
的维度为50维，再将{c41，c42，c43，...c4
n
}经过全连接层，得到{t1，t2，t3，...t
n
}，n就是列的个数。
[0084]
上述实施例中，通过多种方式对第一特征和第二特征进行提取。
[0085]
在其中一个实施例中，根据第二特征判断相邻的待处理表格是否需要合并，包括：通过全连接网络和第三激活函数根据第二特征判断相邻的待处理表格是否需要合并。
[0086]
具体地，终端将第二特征输入至分类器中判断单元格是否需要合并，其中该分类器可以是采用全连接网络和第三激活函数。
[0087]
此外需要说明的一点是上文中的第一激活函数、第二激活函数以及第三激活函数可以是采用sigmoid函数、tanh函数、relu函数、softmax函数或者是其他激活函数等，在此不做具体限定。
[0088]
具体地，仍以上述例子为例进行说明，t
j
的维度为需要预测的标签个数，对t
j
过一个softmax得到对应的标签，通过这一步每一个t就得到了对应的标签，即判断了上下列单元格，或者是左右列单元格是否需要合并。
[0089]
具体地，请参见图5和图6所示，图5为一个实施例中的相邻表格处理方法的系统架构图，图6为一个实施例中的相邻表格处理方法的模型结构图。
[0090]
在该实施例中，该系统架构包括输入层、字符编码层、字符特征提取层、单元格特征提取层、第一特征提取层、第二特征提取层、分类器以及输出层。其中各个层所涉及的模型的选择范围可以参见上文所述，在此不再赘述，但是需要说明的一点是，图5所示系统架构中每一层例举的模型皆可与其他层的模型自由组合，例如所有特征提取都用bert，或者字符特征提取使用lstm，第二特征提取使用bert、第一特征提取使用cnn；再例如字符编码层使用gpt，字符特征提取使用循环神经网络(lstm或gru或cnn)，行特征提取使用transformer,列特征提取使用elmo，特征提取方法使用average，激活函数使用sign或者tanh，符合上述系统架构的使用案例都属于本技术的保护范畴。
[0091]
其中，以图6为例，若字符编码层选择linear，单元格特征提取器用max方法，其他的特征提取层选择dynamic_lstm时，激活函数使用relu和softmax，该相邻表格处理方法的模型结构可以描述为：
[0092]
终端先根据字典映射将字符和标签都转换为模型需要的数据形式，实现文本向量化，将文本向量输入模型，通过linear编码层获得字符向量表示。然后终端将单元格的字符通过字符特征提取层dynamic_lstm以及激活函数relu，得到单元格中每一个字符的字符的特征向量。终端再通过max方法提取单元格的特征，即该单元格中字符特征向量每一维的最大值作为该单元格特征的这一维度的值。这样终端将两行的单元格特征向量输入列特征提取层dynamic_lstm，再通过激活函数relu，获得列的特征表示，也即上文中的第一特征。进而终端将两行的列特征向量进行拼接，输入列特征提取层dynamic_lstm，再通过激活函数relu，获得行的特征表示，即上文中的第二特征，如果有n列，这里得到的是n个行特征表示，经过前面几步特征提取层之后，该行特征向量包含了单元格的字符信息、单元格的行信息
以及单元格的列信息，所以可以作为后续表格合并判断输入。
[0093]
最后终端将行特征输入分类器linear，获得两维向量，通过softmax激活函数后将向量元素映射到(0，1)，选择二维向量中最大值所在的索引表示预测标签，0表示不合并，1表示合并。
[0094]
其中上文中所述的linear为全连接的神经网络层，dynamic_lstm是动态lstm神经网络，relu、是激活函数，softmax是归一化指数函数。
[0095]
这样在相邻表格合并判断的时候基于神经网络进行判断，并依次对单元格、列以及行进行处理得到包括单元格的字符信息、单元格的行信息以及单元格的列信息的第二特征，再进行模型处理，从而保证了分类器输出的结果的准确性。
[0096]
应该理解的是，虽然图1和图6的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1和图6中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0097]
在一个实施例中，如图7所示，提供了一种相邻表格处理装置，包括：待处理表格获取模块701、单元格特征提取模块702、第一特征提取模块703、第二特征提取模块704和判断模块705，其中：
[0098]
待处理表格获取模块701，用于获取相邻的待处理表格；
[0099]
单元格特征提取模块702，用于对相邻的待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征；
[0100]
第一特征提取模块703，用于根据所提取的单元格特征计算得到第一方向上的第一特征，第一方向为相邻的待处理表格的合并方向；
[0101]
第二特征提取模块704，用于通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征；
[0102]
判断模块705，用于根据第二特征判断相邻的待处理表格是否需要合并。
[0103]
在其中一个实施例中，上述单元格特征提取模块702包括：
[0104]
编码单元，用于将待处理表格中的每一字符进行编码处理得到编码结果；
[0105]
字符特征提取单元，用于对编码结果进行字符特征提取得到每一字符对应的字符特征；
[0106]
单元格特征提取单元，用于根据字符特征得到每一单元格的单元格特征。
[0107]
在其中一个实施例中，上述编码单元用于通过自动学习模型、word2vec模型以及预训练语言模型中的至少一种方法，将待处理表格中的每一字符进行编码处理得到编码结果。
[0108]
在其中一个实施例中，上述字符特征提取单元包括：
[0109]
字符初始特征提取子单元，用于将编码结果输入至特征提取层得到字符初始特征，特征提取层通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法实现；
[0110]
字符特征提取子单元，用于通过第一激活函数对初始特征进行处理得到对应的字
符特征。
[0111]
在其中一个实施例中，上述单元格特征提取单元用于通过求取每个单元格中的字符的字符特征的统计量特征作为单元格特征。
[0112]
在其中一个实施例中，第一特征和第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征；并通过第二激活函数对方向初始特征进行处理得到的。
[0113]
在其中一个实施例中，第一特征向量中每一元素包括第二方向上待合并的两部分；第二特征提取模块704用于将第一特征中每一元素在第二方向上的两部分分别进行拼接得到第二特征，第二特征包括待处理表格的字符特征、第一方向信息和第二方向信息。
[0114]
在其中一个实施例中，上述判断模块705用于通过全连接网络和第三激活函数根据第二特征判断相邻的待处理表格是否需要合并。
[0115]
关于相邻表格处理装置的具体限定可以参见上文中对于相邻表格处理方法的限定，在此不再赘述。上述相邻表格处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
[0116]
在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种相邻表格处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。
[0117]
本领域技术人员可以理解，图8中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0118]
在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取相邻的待处理表格；对相邻的待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征；根据所提取的单元格特征计算得到第一方向上的第一特征，第一方向为相邻的待处理表格的合并方向；通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征；根据第二特征判断相邻的待处理表格是否需要合并。
[0119]
在一个实施例中，处理器执行计算机程序时所实现的对相邻的待处理表格中每一单元格进行单元格特征提取，包括：将待处理表格中的每一字符进行编码处理得到编码结果；对编码结果进行字符特征提取得到每一字符对应的字符特征；根据字符特征得到每一单元格的单元格特征。
[0120]
在一个实施例中，处理器执行计算机程序时所实现的将待处理表格中的每一字符进行编码处理得到编码结果，包括：通过自动学习模型、word2vec模型以及预训练语言模型中的至少一种方法，将待处理表格中的每一字符进行编码处理得到编码结果。
[0121]
在一个实施例中，处理器执行计算机程序时所实现的对编码结果进行字符特征提取得到每一字符对应的字符特征，包括：将编码结果输入至特征提取层得到字符初始特征，特征提取层通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法实现；通过第一激活函数对初始特征进行处理得到对应的字符特征。
[0122]
在一个实施例中，处理器执行计算机程序时所实现的根据字符特征得到每一单元格的单元格特征，包括：通过求取每个单元格中的字符的字符特征的统计量特征作为单元格特征。
[0123]
在一个实施例中，处理器执行计算机程序时所涉及的第一特征和第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征；并通过第二激活函数对方向初始特征进行处理得到的。
[0124]
在一个实施例中，处理器执行计算机程序时所涉及的第一特征向量中每一元素包括第二方向上待合并的两部分；处理器执行计算机程序时所实现的通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征，包括：将第一特征中每一元素在第二方向上的两部分分别进行拼接得到第二特征，第二特征包括待处理表格的字符特征、第一方向信息和第二方向信息。
[0125]
在一个实施例中，处理器执行计算机程序时所实现的根据第二特征判断相邻的待处理表格是否需要合并，包括：通过全连接网络和第三激活函数根据第二特征判断相邻的待处理表格是否需要合并。
[0126]
在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取相邻的待处理表格；对相邻的待处理表格中每一单元格进行单元格特征提取，得到每一个单元格的单元格特征；根据所提取的单元格特征计算得到第一方向上的第一特征，第一方向为相邻的待处理表格的合并方向；通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征；根据第二特征判断相邻的待处理表格是否需要合并。
[0127]
在一个实施例中，计算机程序被处理器执行时所实现的对相邻的待处理表格中每一单元格进行单元格特征提取，包括：将待处理表格中的每一字符进行编码处理得到编码结果；对编码结果进行字符特征提取得到每一字符对应的字符特征；根据字符特征得到每一单元格的单元格特征。
[0128]
在一个实施例中，计算机程序被处理器执行时所实现的将待处理表格中的每一字符进行编码处理得到编码结果，包括：通过自动学习模型、word2vec模型以及预训练语言模型中的至少一种方法，将待处理表格中的每一字符进行编码处理得到编码结果。
[0129]
在一个实施例中，计算机程序被处理器执行时所实现的对编码结果进行字符特征提取得到每一字符对应的字符特征，包括：将编码结果输入至特征提取层得到字符初始特征，特征提取层通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法实现；通过第一激活函数对初始特征进行处理得到对应的字符特征。
[0130]
在一个实施例中，计算机程序被处理器执行时所实现的根据字符特征得到每一单
元格的单元格特征，包括：通过求取每个单元格中的字符的字符特征的统计量特征作为单元格特征。
[0131]
在一个实施例中，计算机程序被处理器执行时所涉及的第一特征和第二特征是通过预训练语言模型、卷积网络以及循环神经网络中的至少一种方法提取得到方向初始特征；并通过第二激活函数对方向初始特征进行处理得到的。
[0132]
在一个实施例中，计算机程序被处理器执行时所涉及的第一特征向量中每一元素包括第二方向上待合并的两部分；计算机程序被处理器执行时所实现的通过对第一特征中每一元素对应的第二方向上的部分进行特征拼接得到第二特征，包括：将第一特征中每一元素在第二方向上的两部分分别进行拼接得到第二特征，第二特征包括待处理表格的字符特征、第一方向信息和第二方向信息。
[0133]
在一个实施例中，计算机程序被处理器执行时所实现的根据第二特征判断相邻的待处理表格是否需要合并，包括：通过全连接网络和第三激活函数根据第二特征判断相邻的待处理表格是否需要合并。
[0134]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read
‑
only memory，rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。
[0135]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0136]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于微站等多维数据的潜在大气污染源识别方法与流程

相邻表格处理方法、装置、计算机设备和存储介质与流程

相关文献

最热文献