一种基于类增量学习模型的数据处理方法及装置与流程

2022-02-22 18:22:32 来源：中国专利 TAG：

1.本技术实施例涉及计算机技术领域，尤其涉及一种基于类增量学习模型的数据处理方法及装置。

背景技术：

2.随着短视频、直播、新闻资讯等平台的迅速发展，带来的视频、音频数据量与日俱增，对音视频内容的审核提出了更高的要求。目前，对音视频内容的审核主要以机器审核为主，通过机器审核滤除大量无效、违规的音视频数据，只推送少量潜在的违规数据供人工审核。
3.在审核系统中，一般是通过训练好的分类识别模型对音视频数据进行识别分析，并输出对应的标签类别。但是在提出新的审核类型时，往往需要加入新的样本数据，重新训练一个分类识别模型，训练过程繁琐，效率较低。

技术实现要素：

4.本技术实施例提供一种基于类增量学习模型的数据处理方法及装置，以解决现有技术中在提出新的审核类型时，需要重新训练分类识别模型，训练过程繁琐，效率较低的技术问题，提高对标签类别的识别效果。
5.在第一方面，本技术实施例提供了一种基于类增量学习模型的数据处理方法，包括：
6.获取待审核的待处理数据；
7.将待处理数据输入至第二标签识别模型，由所述第二标签识别模型输出所述待处理数据对应的数据标签类别，所述第二标签识别模型通过在第一标签识别模型中添加第二标签参数，并利用第一标签数据和第二标签数据进行训练得到，所述第一标签识别模型基于所述第一标签数据进行训练得到；
8.从所述待处理数据中，筛选出所述数据标签类别与设定的目标类别一致的目标数据。
9.在第二方面，本技术实施例提供了一种基于类增量学习模型的数据处理装置，包括数据获取模块、标签识别模块和数据筛选模块，其中：
10.所述数据获取模块，用于获取待审核的待处理数据；
11.所述标签识别模块，用于将待处理数据输入至第二标签识别模型，由所述第二标签识别模型输出所述待处理数据对应的数据标签类别，所述第二标签识别模型通过在第一标签识别模型中添加第二标签参数，并利用第一标签数据和第二标签数据进行训练得到，所述第一标签识别模型基于所述第一标签数据进行训练得到；
12.所述数据筛选模块，用于从所述待处理数据中，筛选出所述数据标签类别与设定的目标类别一致的目标数据。
13.在第三方面，本技术实施例提供了一种基于类增量学习模型的数据处理设备，包
括：存储器以及一个或多个处理器；
14.所述存储器，用于存储一个或多个程序；
15.当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的基于类增量学习模型的数据处理方法。
16.在第四方面，本技术实施例提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的基于类增量学习模型的数据处理方法。
17.本技术实施例通过在原有第一标签识别模型的基础上添加第二标签参数得到第二标签识别模型，并利用第一标签数据和第二标签数据对第二标签识别模型进行训练，在保证旧标签识别能力的情况下，实现更对新标签识别能力的覆盖，有效减少模型训练的复杂度和训练耗时，保证第二标签识别模型相对于原先的第一标签识别模型偏移不会过大，进而保证了对原先的第一标签数据的识别效果，提高对标签识别模型的优化效率。
附图说明
18.图1是本技术实施例提供的一种基于类增量学习模型的数据处理方法的流程图；
19.图2是本技术实施例提供的另一种基于类增量学习模型的数据处理方法的流程图；
20.图3是本技术实施例提供的一种第一标签识别模型的示意图；
21.图4是本技术实施例提供的一种第二标签识别模型的示意图；
22.图5是本技术实施例提供的另一种基于类增量学习模型的数据处理方法的流程图；
23.图6本技术实施例提供的一种对第二标签识别模型进行训练的流程示意图；
24.图7是本技术实施例提供的一种基于类增量学习模型的数据处理装置的结构示意图；
25.图8是本技术实施例提供的一种基于类增量学习模型的数据处理设备的结构示意图。
具体实施方式
26.为了使本技术的目的、技术方案和优点更加清楚，下面结合附图对本技术具体实施例作进一步的详细描述。可以理解的是，此处所描述的具体实施例仅仅用于解释本技术，而非对本技术的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
27.图1给出了本技术实施例提供的一种基于类增量学习模型的数据处理方法的流程图，本技术实施例提供的基于类增量学习模型的数据处理方法可以由基于类增量学习模型的数据处理装置来执行，该基于类增量学习模型的数据处理装置可以通过硬件和/或软件
的方式实现，并集成在基于类增量学习模型的数据处理设备中。
28.下述以基于类增量学习模型的数据处理装置执行基于类增量学习模型的数据处理方法为例进行描述。参考图1，该基于类增量学习模型的数据处理方法包括：
29.s101：获取待审核的待处理数据。
30.其中，待审核的待处理数据可以是短视频、直播、新闻资讯等平台提供的音频、视频、图片等数据。这些待处理数据中可能存在违规内容，需要利用标签识别模型对待处理数据进行初步的筛选，从待处理数据中筛选出可能存在违规内容的目标数据，再将目标数据提交到人工审核流程进行更准确的审核工作。
31.示例性的，待处理数据的获取可以是在用户新上传数据(包括完整的数据和实时数据流)时进行，例如在用户上传新的数据到短视频、直播、新闻资讯等平台时，将用户上传的新的数据作为待审核内容。待处理数据的获取还可以是随机从短视频、直播、新闻资讯等平台抽取用户上传的数据作为待审核内容。可选的，对于已经经过标签类别识别的数据，可将数据对应的状态标签从未识别更新为已识别，在获取待处理数据时，仅从状态标签为未识别的数据中心进行选择。
32.s102：将待处理数据输入至第二标签识别模型，由第二标签识别模型输出待处理数据对应的数据标签类别，第二标签识别模型通过在第一标签识别模型中添加第二标签参数，并利用第一标签数据和第二标签数据进行训练得到，第一标签识别模型基于第一标签数据进行训练得到。
33.示例性的，在得到待处理数据后，将待处理数据输入到第二标签识别模型，由第二标签识别模型对待处理数据进行分析处理，并输出待处理数据对应的数据标签类别。
34.本实施例提供的第一标签识别模型基于第一标签数据进行训练得到，并且第一标签数据记录有对应的第一标签类别。例如根据不同的违规内容设定不同的第一标签类别，分别根据不同的第一标签类别采集第一标签数据，基于神经学习网络建立第一标签识别模型，并设置第一标签识别模型的第一参数，并利用第一标签数据训练训练第一标签识别模型，对第一参数进行优化。将待处理数据输入到第一标签识别模型后，第一标签识别模型将输出待处理数据对应的数据标签类别(可识别的标签类别仅包括第一标签类别)。
35.进一步的，在第一标签识别模型的第一参数中添加第二标签参数，得到包含有第一参数和第二标签参数的第二参数，并将添加了第二标签参数的第一标签识别模型作为第二标签识别模型，利用第一标签数据和第二标签数据对第二标签识别模型进行训练，从而对第二参数进行优化，最终得到可识别第一标签类别和第二标签类别的第二标签识别模型。其中第二标签数据记录有对应的第二标签类别。例如根据需要新增的违规内容设定对应的第二标签类别，根据第二标签类别采集第二标签数据，在第一标签识别模型第一参数的基础上添加第二标签数据，此时第一参数更新为第二参数，第一标签识别模型被更新为设置有第二参数的第二标签识别模型，并利用第一标签数据和第二标签数据训练第二标签识别模型，对第二参数进行优化。将待处理数据输入到第二标签识别模型后，第二标签识别模型将输出待处理数据对应的数据标签类别(可识别的标签类别包括第一标签类别和第二标签类别)。
36.可以理解的是，在待处理数据中包含有多个类型的目标内容时，第一标签识别模型或第二标签识别模型将输出多个目标内容对应的数据标签类别。在下一次新增违规内容
并重新更新标签识别模型时，本次训练完成的第二标签识别模型、第一标签数据和第二标签数据、第一标签类别和第二标签类别、第二参数将作为下一次基于类增量学习模型的数据处理流程中的第一标签识别模型、第一标签数据、第一标签类别、第一参数。
37.s103：从待处理数据中，筛选出数据标签类别与设定的目标类别一致的目标数据。
38.在确定待处理数据的数据标签类别后，将数据标签类别与设定的目标类别进行比较，筛选出数据标签类别与设定的目标类别一致的待处理数据，并将这些待处理数据作为目标数据。进一步的，可将筛选出的目标数据提交到人工审核流程，进行人工审核操作。可以理解的是，在第二标签识别模型将输出多个数据标签类别时，只要有一个与目标类别阈值的数据标签类别，即可将待处理数据筛选为目标数据。
39.在一个实施例中，目标类别可以是第一标签类别和第二标签类别的集合，或者是第一标签类别和第二标签类别中的部分的集合(例如在后续的审核中不再将部分目标内容设定为违规内容，则相应的删除对应的目标类别)。
40.上述，通过在原有第一标签识别模型的基础上添加第二标签参数得到第二标签识别模型，并利用第一标签数据和第二标签数据对第二标签识别模型进行训练，在保证旧标签识别能力的情况下，实现更对新标签识别能力的覆盖，有效减少模型训练的复杂度和训练耗时，保证第二标签识别模型相对于原先的第一标签识别模型偏移不会过大，进而保证了对原先的第一标签数据的识别效果，提高对标签类别的识别效果。
41.在上述实施例的基础上，图2给出了本技术实施例提供的另一种基于类增量学习模型的数据处理方法的流程图，该基于类增量学习模型的数据处理方法是对上述基于类增量学习模型的数据处理方法的具体化。参考图2，该基于类增量学习模型的数据处理方法包括：
42.s201：在设置有第一参数的第一标签识别模型中添加第二标签参数，得到第二标签识别模型，第二标签识别模型的第二参数包括第一参数和第二标签参数，第一参数包括骨干网络参数和第一标签参数。
43.其中，第一参数由第一标签识别模型基于第一标签数据进行训练得到。图3给出了本技术实施例提供的一种第一标签识别模型的示意图，如图3所示，本实施例提供的第一标签识别模型中设置的第一参数包括骨干网络参数(图中wb)和第一标签参数(图中wo)，其中骨干网络(图中backbone)是第一标签识别模型中用于提取特征的基础网络，第一标签参数根据需要识别的第一标签类别(图中old label)进行设置(第一标签参数与第一标签类别的数量对应)。在搭建好第一标签识别模型后，利用第一标签数据对第一标签识别模型进行训练，完成对骨干网络参数和第一标签参数的优化，其中第一标签数据记录有对应的第一标签类别(例如音视频数据中所包含的内容类别，例如人物、动物、图案、动作、物品类型等)，第一标签数据可对应一种或多种不同的第一标签类别。
44.可以理解的是，训练完成的第一标签识别模型可上线至机器审核流程中，将等待识别的待处理数据(例如音视频数据、图片等)输入到第一标签识别模型中，由第一标签识别模型对待处理数据进行分析处理，并输出对应的标签识别结果。其中标签识别结果中包含一个或以上的第一标签类别，分别反映待处理数据中所以包含的内容类别，例如将包含有人物和动物的视频输入到第一标签识别模型中，第一标签识别模型将输出的标签识别结果中包含人物和动物对应的第一标签类别。根据标签识别结果即可确定待处理数据中所包
含的内容类别。
45.在一个实施例中，预先设定需要提交给人工审核流程的目标第一标签类别，在待处理数据对应的标签识别结果中，包含目标第一标签类别时，将待处理数据推送给人工审核流程进行进一步的审核。
46.在需要新增第一标签类别时，在原有的第一标签识别模型中添加第二标签参数，得到第二标签识别模型。图4给出了本技术实施例提供的一种第二标签识别模型的示意图，结合图3和图4，第二标签识别模型在原先的第一标签识别模型的基础上，增加了新的第一标签类别(图中new label)对应的分支，并将新增的分支的参数设置为第二标签参数。那么，该第二标签识别模型中设置的第二参数包括有原先第一标签识别模型中的骨干网络参数和第一标签参数，以及新加入的第二标签参数(图中wn)。
47.s202：固定骨干网络参数和第一标签参数，利用第二标签数据对第二标签识别模型进行训练，以对第二标签参数进行优化。
48.在得到第二标签识别模型后，固定第二标签识别模型中原先第一标签识别模型中的第一参数，即固定第二标签识别模型中的骨干网络参数和第一标签参数，在步骤s202训练第二标签识别模型的过程中，保持骨干网络参数和第一标签参数不变。其中第二标签数据记录有对应的第一标签类别，并且第二标签数据对应当前需要添加的第一标签类别。
49.进一步的，利用第二标签数据对第二标签识别模型进行训练，即对第二标签识别模型进行热身初始化(warm up，一种热身初始化模型的方法，有利于后续模型训练收敛)，直至第二标签识别模型中的第二标签参数收敛，以实现对第二标签参数的热身优化，使得新加入的第二标签参数得到较好的参数初始化，利于后续对第二标签识别模型的优化和收敛，保证对新标签类别(第二标签类别)的识别性能。可选的，对第二标签识别模型的热身初始化可以采用随机初始化、xavier初始化、kaiming初始化等方式，本实施例不做限定。
50.s203：利用第一标签数据和第二标签数据，对第二标签识别模型进行训练，以对第二参数进行优化。
51.示例性的，在完成对第二标签识别模型的热身初始化后，利用第一标签数据和第二标签数据对第二标签识别模型进行训练，即将第一标签数据和第二标签数据作为输入，第一标签数据和第二标签数据各标签数据对应的第一标签类别作为输出对第二标签识别模型进行训练，直至设定的模型损失函数小于设定的损失函数阈值。
52.可以理解的是，在对第二标签识别模型进行训练，是一个对第二参数进行优化的过程，即对骨干网络参数、第一标签参数和第二标签参数进行优化的过程，在设定的模型损失函数小于设定的损失函数阈值，骨干网络参数、第一标签参数和第二标签参数收敛。
53.在完成对第二标签识别模型的训练后，可将第二标签识别模型上线至机器审核流程中，将等待识别的待处理数据输入到第一标签识别模型中，由第二标签识别模型对待处理数据进行分析处理，并输出对应的标签识别结果。此时，第二标签识别模型在保留原先第一标签识别模型对旧标签类别(第一标签类别)的识别能力的基础上，新增了对新标签类别(第二标签类别)的识别能力。例如原先第一标签识别模型能识别的第一标签类别为人物和动物，那么在第一标签识别模型的基础上添加第二标签参数得到第二标签识别模型后，利用包含第一标签类别为植物的第二标签数据对第二标签识别模型进行热身初始化，并利用原先的第一标签数据和新增的第二标签数据对第二标签识别模型进行训练，训练完成后的
第二标签识别模型将具备对人物、动物和植物对应的第一标签类别进行识别的能力。
54.s204：获取待审核的待处理数据。
55.s205：将待处理数据输入至第二标签识别模型，由第二标签识别模型输出待处理数据对应的数据标签类别。
56.s206：从待处理数据中，筛选出数据标签类别与设定的目标类别一致的目标数据。
57.上述，通过在原有第一标签识别模型的基础上添加第二标签参数得到第二标签识别模型，并固定原先对第一标签识别模型进行训练得到的第一标签参数和骨干网络参数，利用第二标签数据对第二标签识别模型进行训练，以对第二标签参数进行热身初始化，然后利用第一标签数据和第二标签数据对第二标签识别模型进行训练，实现对骨干网络参数、第一标签参数和第二标签参数的优化，在保证旧标签识别能力的情况下，实现更对新标签识别能力的覆盖，并且通过对第二标签识别模型的热身微调，使得新加入的第二标签参数有一个较好的初始化，提高第二标签识别模型在后续的收敛能力，有效减少模型训练的复杂度和训练耗时，保证第二标签识别模型相对于原先的第一标签识别模型偏移不会过大，进而保证了对原先的第一标签数据的识别效果，提高对标签识别模型的优化效率。
58.在上述实施例的基础上，图5给出了本技术实施例提供的另一种基于类增量学习模型的数据处理方法的流程图，该基于类增量学习模型的数据处理方法是对上述基于类增量学习模型的数据处理方法的具体化。参考图5，该基于类增量学习模型的数据处理方法包括：
59.s301：按照设定标签数量，对不同第一标签类别对应的第一标签数据进行筛选。
60.其中，不同的第一标签数据对应不同的第一标签类别(每个第一标签数据均记录有其所对应的第一标签类别)。可以理解的是，在对第一标签识别模型进行训练时，未对训练所用到的第一标签数据的数据量进行限制，若仍利用原先数据量的第一标签数据对第二标签识别模型进行训练，会存在由于原先的第一标签数据的数据量过大而导致第二标签识别模型训练效率过低的情况。基于此，在对热身初始化后的第二标签识别模型进行训练之前，还按照设定标签数量对不同第一标签类别对应的第一标签数据进行筛选，使得每个第一标签类别下的第一标签数据的数量保持在设定标签数量以内。
61.可以理解的是，在某个第一标签类别下的第一标签数据的数量在设定标签数量以内时，不需要对该第一标签类别下的第一标签数据进行筛选。在完成对某个第一标签类别下的第一标签数据的筛选时，可保持该第一标签类别下的第一标签数据不变，在后续的基于类增量学习模型的数据处理流程中，对新加入的第一标签类别下的第一标签数据进行筛选即可。在完成本次基于类增量学习模型的数据处理流程后，本次流程中的第二标签数据将成为第一标签数据，第二标签识别模型将成为第一标签识别模型加入到下一次的基于类增量学习模型的数据处理流程中，并且原先的第一标签数据已完成筛选，在下一次基于类增量学习模型的数据处理流程中对新增加的第一标签数据(即本次流程中的第二标签数据)进行筛选即可。通过对第一标签数据的筛选可以控制旧标签(第一标签数据)训练数据量，并且保留住旧标签的主要特征。
62.在一个实施例中，采用特征聚类筛选的方式对不同第一标签类别对应的第一标签数据进行筛选，基于此，在对不同第一标签类别对应的第一标签数据进行筛选时，具体包括步骤s3011-s3012：
63.s3011：将第一标签数据输入到第一标签识别模型中，得到每个第一标签数据的特征向量。
64.具体的，对于第一标签数据的数据量超过设定数据量的第一标签类别，将这些第一标签类别下的所有第一标签输入到第一标签识别模型中，获取第一标签识别模型在处理每个第一标签数据时输出的特征向量。例如将各个第一标签类别下的所有第一标签过一遍第一标签识别模型，获取第一标签识别模型在处理每个第一标签数据时输出中间层特征(例如第一标签数据全连接层中输出的一维向量，该一维向量的尺寸为1x1024)。
65.s3012：根据特征向量之间的特征距离，对不同第一标签类别对应的第一标签数据进行筛选。
66.对于每一种第一标签类别，根据各个第一标签数据的特征向量之间的特征距离，对各个第一标签类别下的第一标签数据进行筛选。根据特征距离对第一标签数据进行筛选的方式可以是采用距离度量(比如最近邻)的方法进行，基于此，步骤s3012具体包括步骤s30121-s30122：
67.s30121：确定每个第一标签类别中，各个第一标签数据的特征向量之间的向量均值。
68.s30122：对于每个第一标签类别，根据各个第一标签数据的特征向量与向量均值之间的特征距离，对第一标签数据进行筛选。
69.具体的，针对每个第一标签类别，确定各个第一标签类别中各个第一标签数据对应特征向量之间的向量均值。进一步的，计算各个第一标签类别中，每个第一标签数据的特征向量与对应第一标签类别的向量均值之间的特征距离，按照特征距离从小到大的顺序筛选出设定标签数量的第一标签数据。通过特征度量的方式筛选出的第一标签数据，保留了大部分的原先的第一标签数据的主要特征，减少了后续第二标签识别模型进行训练的复杂度和时间，保证对原先的第一标签数据的识别效果。
70.s302：在设置有第一参数的第一标签识别模型中添加第二标签参数，得到第二标签识别模型，第二标签识别模型的第二参数包括第一参数和第二标签参数，第一参数包括骨干网络参数和第一标签参数。
71.s303：固定骨干网络参数和第一标签参数，利用第二标签数据对第二标签识别模型进行训练，以对第二标签参数进行优化。
72.s304：利用第一标签数据和第二标签数据，对第二标签识别模型进行训练，以对第二参数进行优化。
73.在一个实施例中，可基于设定的模型损失函数对第二标签识别模型进行训练，直至第二标签识别模型的模型损失达到预先设定的损失函数阈值。基于此，对第二标签识别模型进行训练，包括：
74.s3041：基于设定的模型损失函数，对第二标签识别模型进行训练，设定的模型损失函数包括分类网络损失函数、旧模型约束蒸馏损失函数和新旧模型参数约束损失函数中的一种或多种的组合。
75.其中，模型损失函数包括分类网络损失函数、旧模型约束蒸馏损失函数和新旧模型参数约束损失函数中的一种或多种的组合，本实施例以分类网络损失函数、旧模型约束蒸馏损失函数和新旧模型参数约束损失函数中的三种损失函数的组合为例进行描述，三种
损失函数的组合可以是按照设定的权重进行加权求和的方式，不同的损失函数的权重取值可根据实际进行设置。例如各个损失函数的权重取值都设置为1，假设分类网络损失函数、旧模型约束蒸馏损失函数和新旧模型参数约束损失函数分别为loss1、loss2和loss3，那么模型损失函数loss＝loss1 loss2 loss3。
76.在一个实施例中，分类网络损失函数基于以下公式确定：
77.loss1＝ce(y1,y2) r(wb,wo,wn)
78.其中，loss1为分类网络损失函数，ce(y1,y2)为交叉熵损失函数(包括第二标签识别模型在第一标签数据和第二标签数据下的交叉熵损失函数)，y1为第一标签数据或第二标签数据对应的第一标签类别或第二标签类别(真实的标签类别)，y2为将第一标签数据或第二标签数据输入第二标签识别模型时，第二标签识别模型输出的第一标签类别或第二标签类别(预测的标签类别)，可以理解的是，预测的标签类别与真实的标签类别越接近，交叉熵损失函数越小。进一步的，r(wb,wo,wn)为正则化损失函数，其中wb为骨干网络参数，wo为第一标签参数，wn为第二标签参数，正则化损失函数可选用l1正则化、l2正则化等，l1正则化通过稀疏参数(特征稀疏化，降低权重参数的数量)来降低模型的复杂度，l2正则化通过降低权重的数值大小来降低模型复杂度。本实施例将分类网络损失函数纳入模型损失函数的考量中，使得优化第二标签识别模型后的预测结果向真实的标签类别(第一标签类别或第二标签类别)靠近。
79.在一个实施例中，旧模型约束蒸馏损失函数基于以下公式确定：
80.loss2＝ce(y3,y2)
81.其中，loss2为旧模型约束蒸馏损失函数，ce(y3,y2)为带有温度系数(t)调节的交叉熵损失函数，y2为第二标签识别模型输出的第一标签数据对应的第一标签类别，y3为第一标签识别模型输出的第一标签类别。需要进行解释的是，第二标签识别模型可输出第一标签数据对应的第一标签类别和第二标签数据对应的第二标签类别，在旧模型约束蒸馏损失函数的计算中，第二标签识别模型输出的标签类别中，只有第一标签数据对应的第一标签类别参与计算。
82.在刚开始训练第二标签识别模型时，将温度系数设置为较大的第一设定值，那么第二标签识别模型预测的概率分布会比较平滑，那么对应的损失会较大，从而避免第二标签识别模型陷入局部最优解。随着训练的进行，将温度系数减小(降温过程)，使第二标签识别模型收敛。其中温度系数t的取值可设置为：
[0083][0084]
其中，t0为第一设定值，n为训练的循环次数。
[0085]
本实施例将旧模型约束蒸馏损失函数纳入模型损失函数的考量中，保证第二标签识别模型在旧标签类别(第一标签类别)上的预测结果，和第一标签识别模型在旧标签类别(第一标签类别)上的预测结果接近，保证对旧标签类别(第一标签类别)的识别效果。
[0086]
在一个实施例中，新旧模型参数约束损失函数基于以下公式确定：
[0087]
loss3＝mse(w
new
,wo
ld
)
[0088]
其中，loss3为新旧模型参数约束损失函数，mse(w
new
,wo
ld
)为均方误差损失函数，w
old
为第一参数，w
new
为第二参数，第二参数至少包括骨干网络参数和第一标签参数。需要进
行解释的是，第二参数还包括第二标签参数，即第二参数包括骨干网络参数、第一标签参数和第二标签参数，在新旧模型参数约束损失函数的计算中，第二参数中只有骨干网络参数和第一标签参数参与计算。本实施例将新旧模型参数约束损失函数纳入模型损失函数的考量中，保证第二标签识别模型和第一标签识别模型的参数接近，减少因参数变化过大而导致第二标签识别模型预测旧标签类别(第一标签类别)的效果下降的情况。
[0089]
图6给出了本技术实施例提供的一种对第二标签识别模型进行训练的流程示意图，如图6所示，在第一标签模型(第一标签模型设置有经训练优化得到的骨干网络参数和第一标签参数)的基础上添加第二标签参数，得到第二标签识别模型，该第二标签识别模型中包含的参数有骨干网络参数、第一标签参数和第二标签参数。并固定骨干网络参数和第一标签参数，利用第二标签数据对第二标签识别模型进行热身初始化(warm up)，直至第二标签识别模型收敛，得到初始化后的第二标签参数。其中第二标签数据标记有对应的新的第一标签类别。
[0090]
另外，将先前用于对第一标签识别模型进行训练的第一标签数据过一遍第一标签识别模型，提取每个第一标签数据的特征向量，并确定每个第一标签类别中各个第一标签数据的特征向量对应的限量均值。在每个第一标签类别中，根据各个第一标签数据的特征向量与向量均值之间的特征距离，筛选处设定标签数量的第一标签数据。可以理解的是，对第二标签识别模型进行热身初始化以及对第一标签数据进行筛选的步骤之间并没有确定的先后顺序，两者之间可同步执行，也可不同步执行。其中第一标签数据标记有对应的旧的第一标签类别。
[0091]
进一步的，在完成对第二标签识别模型进行热身初始化以及对第一标签数据进行筛选后，利用筛选后的第一标签数据和第二标签数据对热身初始化后的第二标签识别模型进行训练，此时不再固定骨干网络参数和第一标签参数，同时对骨干网络参数、第一标签参数和第二标签参数进行优化。并在训练过程中，基于模型损失函数(包括分类网络损失函数、旧模型约束蒸馏损失函数和新旧模型参数约束损失函数)判断是否完成对第二标签识别模型的训练。在完成对第二标签识别模型的训练后，可将第二标签识别模型上线至机器审核流程中，将等待识别的待处理数据输入到第一标签识别模型中，由第二标签识别模型对待处理数据进行分析处理得到对应的数据标签类别，并从待处理数据中筛选出数据标签类别与设定的目标类别一致的目标数据。
[0092]
s305：获取待审核的待处理数据。
[0093]
s306：将待处理数据输入至第二标签识别模型，由第二标签识别模型输出待处理数据对应的数据标签类别。
[0094]
s307：从待处理数据中，筛选出数据标签类别与设定的目标类别一致的目标数据。
[0095]
例如，对于短视频、直播、新闻资讯等平台提供的音频、视频、图片这些数据，需要对这些数据进行审核，利用标注有设定的目标类别的第一标签数据对第一标签识别模型进行训练，其中目标类别反映需要进行进一步审核或需要筛选出来的违规内容，将需要进行审核的待处理数据输入到第一标签识别模型中，输出每个待处理数据对应的第一标签类别。
[0096]
而在需要新增需要审核的违规内容的类型时，根据新增的违规内容采集标注有第二标签类别的第二样本数据，并在原先的第一标签识别模型上添加第二标签参数得到第二
标签识别模型，在对第二标签识别模型进行热身优化后，利用第一标签数据和第二标签数据对第二标签识别模型进行训练。
[0097]
在接收到后续需要审核的待处理数据时，可将待处理数据输入到训练好的第二标签识别模型中，由第二标签识别模型输出对应的数据标签类别(可识别的标签类别包括第一标签类别和第二标签类别)，可根据数据标签类别和目标标签类别的对应情况对待处理数据进行筛选，并将从待处理数据筛选出的目标数据提交至人工审核流程进行人工审核，在保持原有标签类别识别能力的基础上，增加线上发现新违规标签类别的能力，减轻人工审核的压力，并且在原有第一标签识别模型的基础上，扩充标签识别模型的标签识别能力，减少模型训练所消耗的时间，在保证原有标签识别效果的前提下，不增加新的机器消耗，覆盖更多的违规内容的识别，进一步减轻人工审核侧的负担。
[0098]
上述，通过在原有第一标签识别模型的基础上添加第二标签参数得到第二标签识别模型，并固定原先对第一标签识别模型进行训练得到的第一标签参数和骨干网络参数，利用第二标签数据对第二标签识别模型进行训练，以对第二标签参数进行热身初始化，然后利用第一标签数据和第二标签数据对第二标签识别模型进行训练，实现对骨干网络参数、第一标签参数和第二标签参数的优化，在保证旧标签识别能力的情况下，实现更对新标签识别能力的覆盖，并且通过对第二标签识别模型的热身微调，使得新加入的第二标签参数有一个较好的初始化，提高第二标签识别模型在后续的收敛能力。同时，通过对第一标签数据的筛选可以控制第一标签数据的训练数据量，并且保留第一标签数据的主要特征，减少了后续第二标签识别模型进行训练的复杂度和时间，保证对原先的第一标签数据的识别效果，在旧标签能力不下降的情况下，覆盖更多新标签，实现模型实时学习新标签类别(第二标签类别)数据，有效减少在新旧标签数据集(第二标签数据和第一标签数据)数量巨大的情况下，重新训练模型耗时大，效率低，大量消耗计算和存储资源的情况。同时，通过旧模型约束蒸馏损失函数和新旧模型参数约束损失函数的实现对原有第一参数的约束，实现对第二标签识别模型相对于第一标签识别模型的偏移约束，保证对旧标签类别(第一标签类别)的识别效果。利用第二标签识别模型和第一标签识别模型联合的新旧模型联合训练方式，以及不同损失函数的适应设置，有效减少模型训练复杂度，实现新旧标签类别(第一标签类别)识别效果的平衡，高效快速扩充标签识别模型，审核流程在保证原有类别识别效果的前提下，减少机器消耗，覆盖更多的第一标签类别，进一步减轻人工审核侧的负担。
[0099]
图7给出了本技术实施例提供的一种基于类增量学习模型的数据处理装置的结构示意图。参考图7，该基于类增量学习模型的数据处理装置包括数据获取模块31、标签识别模块32和数据筛选模块33。
[0100]
其中，所述数据获取模块31，用于获取待审核的待处理数据；所述标签识别模块32，用于将待处理数据输入至第二标签识别模型，由所述第二标签识别模型输出所述待处理数据对应的数据标签类别，所述第二标签识别模型通过在第一标签识别模型中添加第二标签参数，并利用第一标签数据和第二标签数据进行训练得到，所述第一标签识别模型基于所述第一标签数据进行训练得到；所述数据筛选模块33，用于从所述待处理数据中，筛选出所述数据标签类别与设定的目标类别一致的目标数据。
[0101]
本技术实施例还提供了一种基于类增量学习模型的数据处理设备，该基于类增量学习模型的数据处理设备可集成本技术实施例提供的基于类增量学习模型的数据处理装
置。图8是本技术实施例提供的一种基于类增量学习模型的数据处理设备的结构示意图。参考图8，该基于类增量学习模型的数据处理设备包括：输入装置43、输出装置44、存储器42以及一个或多个处理器41；存储器42，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器41执行，使得一个或多个处理器41实现如上述实施例提供的基于类增量学习模型的数据处理方法。上述提供的基于类增量学习模型的数据处理装置、设备和计算机可用于执行上述任意实施例提供的基于类增量学习模型的数据处理方法，具备相应的功能和有益效果。
[0102]
本技术实施例还提供一种包含计算机可执行指令的存储介质，计算机可执行指令在由计算机处理器执行时用于执行如上述实施例提供的基于类增量学习模型的数据处理方法。当然，本技术实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上的基于类增量学习模型的数据处理方法，还可以执行本技术任意实施例所提供的基于类增量学习模型的数据处理方法中的相关操作。上述实施例中提供的基于类增量学习模型的数据处理装置、设备及存储介质可执行本技术任意实施例所提供的基于类增量学习模型的数据处理方法，未在上述实施例中详尽描述的技术细节，可参见本技术任意实施例所提供的基于类增量学习模型的数据处理方法。
[0103]
上述仅为本技术的较佳实施例及所运用的技术原理。本技术不限于这里的特定实施例，对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本技术的保护范围。因此，虽然通过以上实施例对本技术进行了较为详细的说明，但是本技术不仅仅限于以上实施例，在不脱离本技术构思的情况下，还可以包括更多其他等效实施例，而本技术的范围由权利要求的范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种动态处理虚拟化资源的方法、装置及存储介质与流程

一种基于类增量学习模型的数据处理方法及装置与流程

相关文献

最热文献