数据处理方法与数据处理模型的训练方法与流程

2021-12-14 21:00:00 来源：中国专利 TAG：

1.本公开涉及机器学习技术领域，具体而言，涉及一种数据处理方法与数据处理模型的训练方法。

背景技术：

2.随着智能手机的不断普及，很多公司推出了手机碎屏险。在理赔过程中，首先要求客户或维修商拍摄带有imei码(international mobile equipment identity，国际移动设备识别码)的手机屏幕图片，进行以下图像识别和验证工作：(1)筛选出带有手机屏幕的图像；(2)判断手机屏幕是否真的出现破碎；(3)识别图像中的imei码并根据imei码判断该手机是否为已投保手机；(4)判断手机机型与imei码对应的手机的机型是否一致。
3.相关技术中，通常使用基于传统机器学习方式和深度学习方式的多个模型完成上述四个任务。但是由于对应每个模型的训练数据有限，各模型的精度都无法达到最优，此外，在实际应用过程中对各模型的调用会造成数据处理效率低下和数据庞大。
4.因此，需要一种具有更高精度和更高数据处理效率的数据处理方法。
5.需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素：

6.本公开的目的在于提供一种数据处理方法与数据处理模型的训练方法，用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的多任务处理过程中多个模型的匹配对训练样本要求高、实际应用过程中数据处理效率低下等缺陷。
7.根据本公开实施例的第一方面，提供一种数据处理方法，包括：获取目标数据，所述目标数据包括目标图像；使用第i个处理层组处理所述目标数据以输出第i个处理结果，所述第i个处理层组包括按顺序连接的前n
i
个公共特征处理层与第i个分支层组，所述分支层组包括多个分支特征处理层，其中i≥1，n
i 1
≥n
i
≥1；根据至少一个所述处理结果确定所述目标数据的最终处理结果。
8.在本公开的一种示例性实施例中，所述使用第i个处理层组处理所述目标数据以输出第i个处理结果包括：在所述第i个处理结果符合预设条件时，使用第i 1个处理层组处理所述目标数据；在所述第i个处理结果不符合所述预设条件时，停止处理所述目标图像。
9.在本公开的一种示例性实施例中，所述使用第i个处理层组处理所述目标数据以输出第i个处理结果包括：同时使用n个处理层组处理所述目标数据以同时输出n个处理结果，n≥2。
10.在本公开的一种示例性实施例中，在所述目标数据为用于碎屏险理赔的第一目标图像时，所述分支层组包括：图片筛选分支层组，用于检测所述第一目标图像是否为包含手机屏幕的第二目标图像；碎屏检测分支层组，用于检测所述第二目标图像中的手机屏幕是否破碎；识别码检测分支层组，用于检测所述第二目标图像中的识别码；机型识别分支层
组，用于检测所述第二目标图像中的手机机型。
11.在本公开的一种示例性实施例中，所述识别码检测分支层组中的各分支特征处理层与尺寸对应的公共特征处理层通道连接。
12.在本公开的一种示例性实施例中，所述根据至少一个所述处理结果确定所述目标数据的最终处理结果包括：在所述图片筛选分支层组的处理结果为判断所述第一目标图像为包含手机屏幕的第二目标图像时，同时使用所述碎屏检测分支层组、所述识别码检测分支层组、所述机型识别分支层组处理所述第二目标图像；在所述碎屏检测分支层组的处理结果为检测到碎屏、根据所述识别码检测分支层组的处理结果判断检测到投保识别码、根据所述机型识别分支层组的处理结果判断检测到与所述投保识别码相符的机型时，输出所述第一目标图像的所述最终处理结果为符合理赔条件。
13.在本公开的一种示例性实施例中，第i个分支层组中的分支特征处理层的数量小于第i 1个分支层组中的分支特征处理层的数量。
14.在本公开的一种示例性实施例中，在所述目标数据处理模型用于识别用于碎屏险理赔的第一目标图像时，所述分支层组包括：图片筛选分支层组，用于检测第一目标图像是否为包含手机屏幕的第二目标图像；碎屏检测分支层组，用于检测所述第二目标图像中的手机屏幕是否破碎；识别码检测分支层组，用于检测所述第二目标图像中的识别码；机型识别分支层组，用于检测所述第二目标图像中的手机机型。
15.在本公开的一种示例性实施例中，第i个分支层组中的分支特征处理层的数量小于第i 1个分支层组中的分支特征处理层的数量。
16.根据本公开的第二方面，提供一种数据处理模型的训练方法，用于训练目标数据处理模型，所述目标数据处理模型包括一个公共层组和n个分支层组，所述公共层组包括多个公共特征处理层，每个所述分支层组包括多个分支特征处理层，所述训练方法包括：将第i个分支层组与前n
i
个公共特征处理层连接以形成第i个处理层组，共形成n个处理层组，其中n≥1，i≥1，n
i 1
≥n
i
≥1；根据每个所述分支层组对应的训练数据子集生成训练数据合集；使用所述训练数据合集分别对所述n个处理层组进行训练；固定所述公共层组的参数；再次使用所述训练数据合集分别对所述n个处理层组进行训练，以确定每个所述分支层组的参数。
17.在本公开的一种示例性实施例中，第i个分支层组中的分支特征处理层的数量小于第i 1个分支层组中的分支特征处理层的数量。
18.在本公开的一种示例性实施例中，所述识别码检测分支层组中的各分支特征处理层与尺寸对应的公共特征处理层通道连接。
19.根据本公开实施例的第三方面，提供一种数据处理装置，包括：数据获取模块，设置为获取目标数据，所述目标数据包括目标图像；分组处理模块，设置为使用第i个处理层组处理所述目标数据以输出第i个处理结果，所述第i个处理层组包括按顺序连接的前n
i
个公共特征处理层与第i个分支层组，所述分支层组包括多个分支特征处理层，其中i≥1，n
i 1
≥n
i
≥1；结果输出模块，设置为根据至少一个所述处理结果确定所述目标数据的最终处理结果。
20.根据本公开实施例的第四方面，提供一种数据处理模型的训练装置，用于训练目标数据处理模型，所述目标数据处理模型包括一个公共层组和n个分支层组，所述公共层组
包括多个公共特征处理层，每个所述分支层组包括多个分支特征处理层，所述训练装置包括：网络构建模块，设置为将第i个分支层组与前n
i
个公共特征处理层连接以形成第i个处理层组，共形成n个处理层组，其中n≥1，i≥1，n
i 1
＞n
i
≥1；训练数据构建模块，设置为根据每个所述分支层组对应的训练数据子集生成训练数据合集；公共层组训练模块，设置为使用所述训练数据合集分别对所述n个处理层组进行训练；公共层组保存模块，设置为固定所述公共层组的参数；分支层组训练模块，设置为再次使用所述训练数据合集分别对所述n个处理层组进行。
21.根据本公开的第五方面，提供一种电子设备，包括：存储器；以及耦合到所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如上述任意一项所述的方法。
22.根据本公开的第六方面，提供一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如上述任意一项所述的数据处理方法。
23.本公开实施例通过使用具有连接公共特征处理层的多个分支层组对目标数据进行处理，可以有效利用多个分支层组对各公共特征处理层的影响提高公共特征处理层的处理能力，进而通过公共特征处理层有效提升各分支层组的处理能力，无需调用多个数据处理模型即可实现端到端输出，一次输入完成多项数据处理任务，具有更高的数据处理能力、数据处理精度和数据处理效率。
24.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
25.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
26.图1是本公开示例性实施例中数据处理方法的流程图。
27.图2是本公开一个实施例中使用的数据处理模型的示意图。
28.图3是本公开实施例提供的数据处理模型的训练方法的流程图。
29.图4是本公开一个实施例中第二处理层组的分支设置示意图。
30.图5是本公开一个示例性实施例中一种数据处理装置的方框图。
31.图6是本公开一个示例性实施例中一种数据处理模型的训练装置的方框图。
32.图7是本公开一个示例性实施例中一种电子设备的方框图。
具体实施方式
33.现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可
以实践本公开的技术方案而省略所述特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
34.此外，附图仅为本公开的示意性图解，图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
35.下面结合附图对本公开示例实施方式进行详细说明。
36.图1示意性示出本公开示例性实施例中数据处理方法的流程图。参考图1，数据处理方法100可以包括：
37.步骤s102，获取目标数据，所述目标数据包括目标图像；
38.步骤s104，使用第i个处理层组处理所述目标数据以输出第i个处理结果，所述第i个处理层组包括按顺序连接的前n
i
个公共特征处理层与第i个分支层组，所述分支层组包括多个分支特征处理层，其中i≥1，n
i 1
≥n
i
≥1；
39.步骤s106，根据至少一个所述处理结果确定所述目标数据的最终处理结果。
40.本公开实施例通过使用具有连接公共特征处理层的多个分支层组对目标数据进行处理，可以有效利用多个分支层组对各公共特征处理层的影响提高公共特征处理层的处理能力，进而通过公共特征处理层有效提升各分支层组的处理能力，无需调用多个数据处理模型即可实现端到端输出，一次输入完成多项数据处理任务，具有更高的数据处理能力、数据处理精度和数据处理效率。
41.下面，对数据处理方法100的各步骤进行详细说明。
42.在步骤s102，获取目标数据，所述目标数据包括目标图像。
43.在本公开的一个实施例中，目标数据例如可以为用于碎屏险理赔的图像。可以在用户申请碎屏险理赔时，要求用户上传带有手机屏幕的图像，最好是手机屏幕上带有imei码、手机外观完整的图像，以便于通过一张图像完成屏幕破损检测、投保资格审核以及手机型号复核。
44.在其他实施例中，目标数据也可以为文本数据、视频数据、音频数据、定位数据或其他图像数据等等，本公开对此不作特殊限制，任何需要根据一次数据输入得到多个处理结果的任务均可应用数据处理方法100进行处理。
45.在步骤s104，使用第i个处理层组处理所述目标数据以输出第i个处理结果，所述第i个处理层组包括按顺序连接的前n
i
个公共特征处理层与第i个分支层组，所述分支层组包括多个分支特征处理层，其中i≥1，n
i 1
≥n
i
≥1。
46.本公开实施例使用预先训练的数据处理模型实现端到端的数据处理。
47.在本公开实施例中，数据处理模型例如为数据处理模型，该数据处理模型主要包括公共层组和多个分支层组，公共层组包括多个公共特征处理层，每个分支层组包括多个分支特征处理层。
48.各分支层组连接在公共层组中的某一个公共特征处理层之后，在进行数据处理时，由公共层租的第一层接收目标数据，向后处理，在到达连接分支层组的位置时，将本层
数据传递到本层连接的分支层组进行继续处理，同时可以选择是否继续将数据传递到下一层的公共特征处理层进行处理。即，在进行数据处理时，第i个分支层组与若干个公共特征处理层形成第i个处理层组，第i个处理层组中的公共特征处理层的数量为n
i
。各分支层组有可能共同使用公共层组的前若干个公共特征处理层，不同的分支层组使用的公共特征处理层的数量可以相同，也可以不同。
49.图2是本公开一个实施例中使用的数据处理模型的示意图。本公开实施例涉及的数据处理模型例如可以为神经网络模型。可以理解的是，图2所示实施例中公共特征处理层的数量、各分支特征处理层的数量和种类仅为示例，本领域技术人员可以根据实际情况自行设置处理层的数量和各处理层的种类。
50.参考图2，在目标数据是用于碎屏险理赔的第一目标图像时，数据处理模型200可以包括：
51.公共层组20，包括多个公共特征处理层201～205；
52.图片筛选分支层组21，用于检测第一目标图像是否为包含手机屏幕的第二目标图像；
53.碎屏检测分支层组22，用于检测第二目标图像中的手机屏幕是否破碎；
54.识别码检测分支层组23，用于检测第二目标图像中的识别码；
55.机型识别分支层组24，用于检测第二目标图像中的手机机型。
56.在图2所示实施例中，图片筛选分支层组21与前3个公共特征处理层201～203连接，形成第一处理层组，i＝1，n1＝3；碎屏检测分支层组22与前5个公共特征处理层201～205连接，形成第二处理层组，i＝2，n2＝5；识别码检测分支层组23也与前5个公共特征处理层201～205连接，形成第三处理层组，i＝3，n3＝5；机型识别分支层组24也与前5个公共特征处理层201～205连接，形成第四处理层组，i＝4，n4＝5。第一、二、三、四处理层组分别能够输出对应各自分支层组功能的处理结果。
57.在数据处理模型200进行数据处理时，用户提供的第一目标图像从公共特征处理层201输入，公共特征处理层201的神经网络属性例如可以为输入层(input layer)。
58.在实际应用中，各处理层组既可以顺序工作，也可以同时工作，还可以先顺序工作再同时工作，或者先同时工作再顺序工作。
59.例如，当各处理层组顺序工作时，可以在第i个处理结果符合预设条件时，使用第i 1个处理层组处理目标数据；在第i个处理结果不符合预设条件时，停止处理目标图像。当各处理层组同时工作时，可以同时使用n个处理层组处理目标数据以同时输出n个处理结果，n≥2。
60.仍以图2所示实施例为例，由于碎屏险理赔的任务处理首先要在用户提供的图片中筛选出包括手机屏幕的图片，以进行其他识别，因此，可以将第一处理层组的工作作为第二处理层组、第三处理层组、第四处理层组的前置。
61.可以首先将第一目标图像输入公共层组20，公共层组20运行第一处理层组的处理逻辑，输出分类结果，判断第一目标图像是否为包含手机屏幕的第二目标图像，只有在第一目标图像为包含手机屏幕的第二目标图像时才继续进行其他检测识别，否则丢弃第一目标图像。
62.在确定一个第一目标图像为第二目标图像时，可以将该图像重新输入公共层组20
的第一层，公共层组20联合分支处理层组22、23、24同时工作，同时执行第二处理层组、第三处理层组、第四处理层组的逻辑，并同时输出三个处理结果。第二处理层组输出的处理结果是判断第二目标图片中的手机屏幕是否破碎，第三处理层组输出的处理结果至少是第二目标图片中的imei码，第四处理层组输出的处理结果至少是第二目标图片中手机的机型。由此，输入一张包含手机屏幕的图片，可以同时获得三个处理结果，极大地提高了数据处理效率。
63.在其他实施例中，也可以设置全部处理层组同时运行，或者，设置若干个处理层组先同时运行，根据运行结果的综合判断来控制其他处理层组的运行方式。处理层组的运行顺序可以由本领域技术人员自行设置，本公开对此不作特殊限制。
64.由于各分支层组均共用公共层组中的一或多层，因此公共层组的能力对各分支层组均有支持，通过对公共层组和分支层组联合训练，不但可以提高公共层组的处理能力和处理准确度，也可以提高分支层组的处理能力和处理准确度，从而可以整体提高对目标数据的处理能力和处理准确度。数据处理模型200的训练方法可以参见本公开的后续实施例。
65.在步骤s106，根据至少一个所述处理结果确定所述目标数据的最终处理结果。
66.可以在各处理层组之后设置处理结果分析层以对多个处理结果进行分析。例如，当图2所示实施例中的第二处理层组输出的处理结果是判断第二目标图片中的手机屏幕是否破碎，第三处理层组输出的处理结果是第二目标图片中的imei码，第四处理层组输出的处理结果是第二目标图片中手机的机型时，可以设置一个数据处理层，用于判断imei码是否为已投保imei码、手机机型是否与imei码匹配，并只有在判断手机屏幕破碎、imei码为已投保imei码、手机机型与imei码匹配时，才输出最终处理结果为符合理赔条件。
67.在一个实施例中，可以在第二处理层组判断手机屏幕存在碎屏时，根据第三处理层组输出的处理结果获取imei字符，然后与系统中的已投保imei码数据比对。当imei码比对成功时，判断第四处理层组输出的机型是否与系统中记录的与该imei码对应的机型一致，只有当机型一致时才判定为理赔审核通过，继续后续的理赔流程。
68.此外，也可以在各分支层组的最后几层增加进一步的处理结果功能，从而对各处理层组的输出进行简单的逻辑判断即可输出最终处理结果。例如，当图2所示实施例中的识别码检测分支层组23包括imei码权限判断功能时，可以直接输出是否检测到投保识别码的处理结果。
69.通过使用各处理层组联合对目标数据进行处理，并根据各处理层组输出的处理结果确定目标数据的最终处理结果，可以实现端对端处理，通过一次输入得到最终处理结果，极大地提高数据处理效率。
70.图3是本公开实施例提供的数据处理模型的训练方法的流程图。图3所示方法可以用来训练如图2所示的数据处理模型200，当然，图3所示方法可以训练的数据处理模型的形态可以有多种，图2仅为示例。
71.参考图3，训练方法300可以包括：
72.步骤s31，将第i个分支层组与前n
i
个公共特征处理层连接以形成第i个处理层组，共形成n个处理层组，其中n≥1，i≥1，n
i 1
≥n
i
≥1；
73.步骤s32，根据每个所述分支层组对应的训练数据子集生成训练数据合集；
74.步骤s33，使用所述训练数据合集分别对所述n个处理层组进行训练；
75.步骤s34，固定所述公共层组的参数；
76.步骤s35，再次使用所述训练数据合集分别对所述n个处理层组进行训练，以确定每个所述分支层组的参数。
77.首先，可以根据模型架构进行网络模型的搭建，设置一个公共层组和多个分支层组，将第i个分支层组与前n
i
个公共特征处理层连接以形成第i个处理层组，共形成n个处理层组，其中n≥1，i≥1，n
i 1
≥n
i
≥1。
78.可以根据分支层组的任务难易分布将各分支层组设置在网络的不同位置，并且根据各任务之间的相似性设计不同数量的公共特征处理层。
79.在一个实施例中，为了提高顺序运行各分支层组的效率，可以将简单分支层组在网络中的位置进行前置，使得简单任务的推理时间缩短，例如图像筛选分支任务较为简单，可以设置图像筛选分支使用较少的公共特征处理层，在网络前端就进行输出，以避免图像筛选分支层组的执行效率影响后续其他分支层组的执行，即可以设置n
i 1
≥n
i
，且第i个分支层组中的分支特征处理层的数量小于第i 1个分支层组中的分支特征处理层的数量，以使层数较少的分支层组对应较少的公共特征处理层。
80.通过对相似分支任务添加公共特征处理层，使得数据处理模型不仅可以高效利用各个分支层组对应的训练数据，还不影响每个分支的训练过程。
81.公共层组中的公共特征检测层可以使用resnet50(残差神经网络)、vgg(visual geometry group network，视觉几何组模型)、inception网络等作为backbone(神经网络模型)，即直接对现有神经网络模型进行改进后使用。其余分支层组也可以选取resnet50的设计思想作为block(模块)进行搭建。
82.在图2所示实施例中，识别码检测分支层组23可以将公共层组20作为自身的top-down(自顶向下)结构，在自身的bottom-up(自底向上)结构中使用上采样以及普通卷积操作，从而在第三处理层组中实现从公共特征处理层201到分支特征处理层235的处理过程。在第三处理层组的运行过程中，可以将识别码检测分支层组23中的各分支特征处理层231～235与尺寸对应的公共特征处理层205～201做通道连接操作，以在较后期处理时获取前期处理的同尺度特征图的更多信息，提高对小尺度目标物体的识别能力。在识别码检测分支层组23中的最后一个分支特征处理层235，可以将处理层235的输出图像与原始图像即第二目标图片做位操作，抠取imei区域，然后调用ocr(optical character recognition，光学字符识别)接口获得imei字符。
83.然后，准备用于训练的数据集。可以直接使用原来用于训练各分支功能对应的数据处理模型的训练数据子集，对各训练数据子集取合集以形成训练数据合集。虽然每个训练数据子集只用于训练特定的功能，训练数据不多，但是形成合集后，训练数据大大增多，能够更好地实现对各功能的训练。
84.在相关技术中，由于每个训练数据子集中的训练数据只涉及特定功能的标签，例如用于训练手机屏幕识别模型的训练数据子集中的训练数据可能只具有是否存在手机屏幕的标签、用于训练碎屏检测模型的训练数据子集中的训练数据可能只具有屏幕是否破碎的标签等，所以各训练数据子集只能训练对应的特定功能的数据处理模型。
85.但是本技术提供的数据处理模型由于具有公共层组，在训练各处理层组时，各训练数据子集的训练数据均能对公共层组的若干个公共特征处理层进行训练，从而本技术对
训练数据合集中的训练数据的标签完备性不作要求，不需要提供打好全部分支层组对应标签的训练数据，在极大增加了训练数据的同时也避免了增加训练数据带来的完善训练数据标签工作，极大提高了训练准备的工作效率。
86.形成训练数据合集之后，可以对公共特征检测层进行预训练权重的加载，并且使用训练数据合集中与各分支层组功能对应的训练数据对各处理层组进行各自训练，各个处理层组进行交替训练，不断的更新和迭代公共层组中各公共特征处理层组的参数，当迭代至一定的批次时，冻结公共层组的参数。由于此时公共层组参与了与各分支层组的联合训练，公共特征处理层具备了多个分支层组的能力，数据处理能力得到了极大的提升。
87.接下来，再次使用训练数据合集和参数固定的公共层组对各分支层组的私有层(分支特征处理层)进行训练，直至每一个分支层组(处理层组)都能输出较为准确的处理结果。
88.保存各分支层组的参数后，即形成能够实现端对端多任务处理的数据处理模型，如图2所示的数据处理模型。
89.总的来说，图3所示实施例是在前期训练时解冻全部层，分别针对每一个分支层组进行训练，各分支共同迭代优化公共特征处理层的参数(高效利用全部的数据，不会因为训练数据没有全部分支对应的标签而造成数据浪费)，然后在公共特征处理层已经具备丰富的特征表达能力时冻结公共层组的参数，后期通过参数固定的公共层组分别训练各分支层组的私有层，进一步优化各分支层组的任务处理能力。
90.训练后的数据处理模型能够输出更准确的处理结果。
91.例如，由于碎屏检测和机型识别均需要对图片中的手机区域进行“关注”，所以这两个分支层组具有更多的公共特征处理层，这些公共特征处理层由于使用了碎屏图片以及机型图片进行训练，对图像中的手机区域的识别会更加准确。由于imei码的识别也需要首先识别手机屏幕区域，而且该网络的top-down分支就是对应的公共特征处理层，所以该分支层组的处理效果也会更为准确。
92.在一个实施例中，为了进一步提高公共层组的处理能力，可以在imei掩模的输出部分加上输出手机区域掩膜的功能，从而使公共层组在与识别码检测分支层组23的联合训练中对手机掩膜区域的识别进行学习，更准确地定位到第二目标图片中的手机区域，进而增强其他处理层组识别手机区域的能力。
93.在一个实施例中，为了提高碎屏检测分支层组22检测微小裂纹的能力，可以结合不同尺度下的特征图将第二处理层组修改为如图4所示的多个尺度的预测分支。参考图4，在第二处理层组的处理过程(201-224)中，目标图像被执行卷积操作，特征图不断缩小，因此会丢失很多细节信息，导致对小裂纹的检测效果降低。在本公开实施例中，可以在第二处理层组中设置一个或一个以上的全连接操作分支。如图4所示，可以设置对203层的输出数据进行一或两个卷积操作以得到第一全连接层41，对221层的输出进行池化或卷积操作以得到第二全连接层42，在224层进行全连接操作时，可以对224层、第一全连接层41、第二全连接层42进行连接，以增强细节处理能力。由于第一全连接层41和第二全连接层42是直接根据较为靠前的特征图输出的，细节信息保存的更完整，因此连接这三个全连接层会使模型学习到不同尺度且更为丰富的特征，使模型对微小裂纹的检测效果更好。以上第一全连接层41、第二全连接层42的位置和数量设置仅为示例，可以根据公共特征处理层的数量和
碎屏检测分支层组22中的分支特征处理层的数量调整。
94.综上所述，本公开实施例将多个网络模型任务融合成了一个网络模型，并且对模型结构以及训练过程进行了优化，设计了一个高效利用数据的端到端的多任务网络模型结构，可以解决以下问题：
95.1.解决手机碎屏险智能理赔流程需要分阶段进行检测的问题。不需要再分阶段进行检测，只需要将图像输入一次便可得到全部的结果。
96.2、解决各分支网络训练样本少，特征无法进行有效提取的问题。通过设计公共特征提取层，前期通过各分支网络的数据对公共层组进行共同学习和迭代，使得公共层组具备丰富的特征表达能力。
97.3、传统多分支网络在训练过程中需要保证每一张训练图像具有对应多个分支的所有标签，当分支较多时，标签维度往往很大，并且多分支经常在网络最后的特征层进行分支，当某些分支任务较为简单并且与其他分支任务明显不同的时候，该网络架构就会出现冗余并且学习不到有效的私有特征。本技术通过对训练方法以及数据处理模型的改进，使得仅具备部分标签的训练图像也可以对各分支层组的处理能力进行训练，使得模型的适应性更强。
98.对应于上述方法实施例，本公开还提供一种数据处理装置，可以用于执行上述方法实施例。
99.图5示意性示出本公开一个示例性实施例中一种数据处理装置的方框图。
100.参考图5，数据处理装置500可以包括：
101.数据获取模块51，设置为获取目标数据，所述目标数据包括目标图像；
102.分组处理模块52，设置为使用第i个处理层组处理所述目标数据以输出第i个处理结果，所述第i个处理层组包括按顺序连接的前n
i
个公共特征处理层与第i个分支层组，所述分支层组包括多个分支特征处理层，其中i≥1，n
i 1
≥n
i
≥1；
103.结果输出模块53，设置为根据至少一个所述处理结果确定所述目标数据的最终处理结果。
104.数据处理装置500可以用于执行图1和图2所示实施例的全部方法。
105.图6示意性示出本公开一个示例性实施例中一种数据处理模型的训练装置的方框图。数据处理装置600用于训练目标数据处理模型，所述目标数据处理模型包括一个公共层组和n个分支层组，所述公共层组包括多个公共特征处理层，每个所述分支层组包括多个分支特征处理层。
106.参考图6，数据处理装置600可以包括：
107.网络构建模块61，设置为将第i个分支层组与前n
i
个公共特征处理层连接以形成第i个处理层组，共形成n个处理层组，其中n≥1，i≥1，n
i 1
＞n
i
≥1；
108.训练数据构建模块62，设置为根据每个所述分支层组对应的训练数据子集生成训练数据合集；
109.公共层组训练模块63，设置为使用所述训练数据合集分别对所述n个处理层组进行训练；
110.公共层组保存模块64，设置为固定所述公共层组的参数；
111.分支层组训练模块65，设置为再次使用所述训练数据合集分别对所述n个处理层
组进行。
112.数据处理装置600可以用于执行图3和图4所示实施例的全部方法。
113.由于装置500和装置600的各功能已在其对应的方法实施例中予以详细说明，本公开于此不再赘述。
114.应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
115.在本公开的示例性实施例中，还提供了一种能够实现上述方法的电子设备。
116.所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。
117.下面参照图7来描述根据本发明的这种实施方式的电子设备700。图7显示的电子设备700仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
118.如图7所示，电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于：上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730。
119.其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元710执行，使得所述处理单元710执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元710可以执行上述任一实施例所示的步骤。
120.存储单元720可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(ram)7201和/或高速缓存存储单元7202，还可以进一步包括只读存储单元(rom)7203。
121.存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204，这样的程序模块7205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。
122.总线730可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
123.电子设备700也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备700交互的设备通信，和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口750进行。并且，电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器760通过总线730与电子设备700的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备700使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
124.通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施
方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是cd-rom，u盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
125.在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
126.根据本发明的实施方式的用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
127.所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
128.计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
129.可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、rf等等，或者上述的任意合适的组合。
130.可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(lan)或广域网(wan)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
131.此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。
132.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其
它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和构思由权利要求指出。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

数据处理方法与数据处理模型的训练方法与流程

相关文献

最热文献