一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型调整与业务处理的方法、装置、设备及存储介质与流程

2022-06-01 14:10:36 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,尤其涉及一种模型调整的方法、一种业务处理方法、一种模型调整的装置、一种业务处理装置、一种业务处理设备、一种计算机可读存储介质以及一种计算机程序产品。


背景技术:

2.考虑到短视频/图片审核以及推荐的实时性和规模性问题,目前大部分的审核和推荐流程都倾向于使用机器和人工结合的方式进行,其中机器处理部分占据主要地位。以机审为例,其能够在保证一定准确率的同时高速发现并处理90%以上的违规。
3.当前主流的深度学习机审/机推系统都倾向于使用平面化的方法来解决大范围的、复杂的审核/推荐应用情景,即并行使用多个功能不同的模型来应对不同的业务需求。当业务的大环境发生变化时,由于业务系统较低的复用能力,使得其较难适应快速变化的业务需求和数据分布,在需要对系统进行更新调整时也需要花费较长的时间,特别是多模型协作的情况使得花费的时间更长。


技术实现要素:

4.本技术提供一种模型调整与业务处理的方法、装置、设备及存储介质,以解决现有技术中当业务的大环境发生变化时,系统较难适应快速变化的业务需求和数据分布,在需要对系统进行更新调整时也需要花费较长的时间的问题。
5.第一方面,本技术实施例提供了一种模型调整的方法,所述方法包括:
6.确定待调整的目标模型的目标调整类型;
7.根据所述目标调整类型,确定所述目标模型的已有能力数据;
8.根据所述目标调整类型,确定所述目标模型中需要调整的目标权重;
9.获取与所述目标权重对应的目标训练数据;
10.基于所述已有能力数据以及所述目标训练数据对所述目标模型进行调整,所述调整包括对所述目标权重的调整。
11.第二方面,本技术实施例还提供了一种业务处理方法,所述方法包括:
12.业务数据获取模块,用于获取待处理的业务数据;
13.目标模型加载模块,用于加载上述第一方面所述的方法获得的目标模型;
14.业务处理模块,用于采用所述目标模型对所述业务数据进行处理。
15.第三方面,本技术实施例还提供了一种模型调整的装置,所述装置包括:
16.调整类型确定模块,用于确定待调整的目标模型的目标调整类型;
17.已有能力数据确定模块,用于根据所述目标调整类型,确定所述目标模型的已有能力数据;
18.目标权重确定模块,用于根据所述目标调整类型,确定所述目标模型中需要调整的目标权重;
19.目标训练数据获取模块,用于获取与所述目标权重对应的目标训练数据;
20.模型调整模块,用于基于所述已有能力数据以及所述目标训练数据对所述目标模型进行调整,所述调整包括对所述目标权重的调整。
21.第四方面,本技术实施例还提供了一种业务处理装置,所述装置包括:
22.获取待处理的业务数据;
23.加载根据上述第一方面的方法获得的目标模型;
24.采用所述目标模型对所述业务数据进行处理。
25.第五方面,本技术实施例还提供了一种业务处理设备,所述业务处理设备包括:
26.一个或多个处理器;
27.存储装置,用于存储一个或多个程序,
28.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述第一方面或第二方面的方法。
29.第六方面,本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面或第二方面的方法。
30.第七方面,本技术实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述计算机可执行指令在被执行时用于实现上述第一方面或第二方面的方法。
31.本技术所提供的技术方案,具有如下有益效果:
32.在本实施例中,当需要对目标模型进行调整时,通过确定目标模型的目标调整类型来确定调整方向,然后根据该目标调整类型确定目标模型的已有能力数据,以及确定目标模型中需要调整的目标权重。根据该已有能力数据以及目标训练数据来对目标模型进行调整,从而实现对目标权重的调整,使得目标模型在保住旧模式识别能力的同时学会新的能力;使得业务系统能够在尽量保留原有系统能力的前提下,针对变化的业务需求和数据分布进行新功能的扩展,以避免其在新的数据分布和业务条件下性能的大幅下降,甚至让系统具备一定的自动优化和智能提高的能力,提升系统灵活依据业务变化进行快速调整的能力。
附图说明
33.图1是本技术实施例一提供的一种模型调整的方法实施例的流程图;
34.图2是本技术实施例二提供的一种模型调整的方法实施例的流程图;
35.图3是本技术实施例三提供的一种模型调整的方法实施例的流程图;
36.图4是本技术实施例三提供的一种范围扩展分支划分的示意图;
37.图5是本技术实施例四提供的一种模型调整的方法实施例的流程图;
38.图6是本技术实施例四提供的一种扩展新任务功能时采用映射衔接层连接的架构示意图;
39.图7是本技术实施例五提供的一种模型调整的装置实施例的结构框图;
40.图8是本技术实施例六提供的一种业务处理方法实施例的流程图;
41.图9是本技术实施例七提供的一种业务处理装置实施例的流程图;
42.图10是本技术实施例六提供的一种业务处理设备的结构示意图。
具体实施方式
43.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本技术,而非对本技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本技术相关的部分而非全部结构。
44.实施例一
45.图1为本技术实施例一提供的一种模型调整的方法实施例的流程图,本实施例可以应用于业务系统对所使用的模型或模型集合进行自适应调整的场景,如图1所示,本实施例可以包括如下步骤:
46.步骤110,确定待调整的目标模型的目标调整类型。
47.其中,目标模型可以包括需要进行模型更新或调整的模型,可以包括业务系统所需的各种用于应对不同业务需求的、不同功能的模型,例如可以包括行为识别模型、场景分类模型、年龄回归模型、性别识别模型、语音识别模型、用户画像模型、多模态集成模型、敏感词检测模型、枪支检测模型等。
48.其中,目标模型可以是用户指定需要更新的模型,也可以是系统按照预设的模型更新策略自动确定的需要进行更新的模型,本实施例对此不作限制。
49.目标调整类型用于指导目标模型调整的方向,不同的目标模型可以有不同的调整类型。
50.在一种实施例中,步骤110进一步可以包括如下步骤:
51.步骤110-1,获取用户针对所述目标模型输入的模型需求信息。
52.其中,模型需求信息可以包括用户期望目标模型能够实现的业务功能,或者能够执行的任务类型。例如,假设用户希望一个模型能实现的业务功能是进行任务分类和任务分割,则模型需求信息可以包括:用于指示进行任务分类的标识信息,以及,用于指示进行任务分割的标识信息。
53.在一种实现中,可以向用户展示交互界面,该交互界面中可以包括多种模型功能元素以及提供多种基础模型以供用户选择,用户可以根据实际需求,从多种基础模型中选择一个或多个基础模型,作为目标模型;然后从模型功能元素中选取一个或多个模型功能元素作为期望目标模型能够实现的功能,根据用户选择的模型功能元素可以生成模型需求信息。
54.在其他实施例中,用户还可以通过命令行等指令的方式输入模型需求信息,该模型需求信息也可以携带目标模型的标识,本实施例对此不作限制。
55.通过用户输入的模型需求信息,便于用户更灵活地配置人为条件,增强了对业务需求处理的灵活性。
56.步骤110-2,获取所述目标模型的已有模型信息。
57.其中,已有模型信息是指用于表示目标模型已有的能力的描述信息,例如,已有模型信息可以包括目标模型的模型架构、模型参数及对应的参数值、模型的已实现功能等等。
58.在实现时,当确定目标模型以后,则可以加载该目标模型的数据,并从该目标模型的数据中提取出目标模型的已有模型信息。
59.步骤110-3,将所述模型需求信息与所述已有模型信息进行比较,以确定模型扩展信息。
60.当确定目标模型的模型需求信息以及已有模型信息以后,则可以将两者进行比较,以从模型需求信息中确定当前目标模型不具备的能力信息,作为模型扩展信息。在实现时,通过对模型需求信息进行分析,确定其中包含的一个或多个需求,然后逐个需求判断是否是目标模型已经能够实现的需求(即已具备的能力),如果某一个或多个需求是目标模型还没有实现的需求,则将其作为模型扩展信息。
61.步骤110-4,获取一个或多个预设的调整类型的调整逻辑。
62.在一种实现中,调整类型是开发人员预先根据经验抽象出的、用于指引模型调整方向的调整信息。不同的调整类型可以具备不同的调整侧重点,不同调整类型的调整侧重点可以采用调整逻辑进行描述。
63.例如,由于业务系统中被调整的模型涉及到种类繁多的任务和结构设计,为了尽可能地减少系统的复杂度,可以把多样的模型任务类型整理为如下调整类型:模式调整类型、范围调整类型及功能调整类型等。
64.其中,模式调整类型涉及数据模式覆盖的多样性调整,即调整模型对类别内部数据识别的广度。例如,假设模型为枪支识别模型,原有的枪支识别模型只能识别某个地区或者作品中的某种类型的枪支。如果用户想要该模型能够识别全球大部分种类的枪支,或者覆盖多种作品的枪支识别,这种就属于模式覆盖多样性的调整。
65.范围调整类型涉及对同一种任务功能内部所能处理的数据范围的调整,例如,增加分类任务的类别、增加关键点检测数、增加检测任务的锚框类型等等。比如,一个“增加分类任务的类别”的例子可以为:假设原有的模型能够识别猫和狗两种动物,如果用户想要该模型能够识别狮子,这种调整不会改变任务类型(都是分类任务),只是增加了识别的种类,则这种调整就属于模型范围的调整。
66.与模式调整类型不同的是,范围调整类型可以改变模型所能识别的类型范围,而模式调整类型不会增加或减少识别的类型范围,而是增加同一种类识别的广度(从某地区扩展到全国或者全球等)。
67.功能调整类型涉及对模型所能处理的任务功能数量或者组合的调整,例如让单任务功能模型变为多任务功能模型,或者增加原有模型没有的任务功能,比如把原本只具备分类能力的模型扩展为同时具备分类和检测能力的双能模型,或者把单纯的关键点识别能力升级为关联关系识别能力。
68.与上述范围调整类型不同的是,功能调整类型可以增加或减少任务功能。例如,假设原有的模型能够实现分类任务,如果用户想要该模型还能够实现分割任务,则这种调整属于任务功能的调整。
69.当然,除了上面的三种调整类型以外,本领域技术人员根据实际需求,还可以抽象出其他的调整类型,并定义每种调整类型的调整逻辑,本实施例对此不作限制。
70.步骤110-5,将所述模型扩展信息与所述一个或多个预设调整类型的调整逻辑进行匹配,并将匹配到的调整类型作为所述目标调整类型。
71.其中,通过对模型扩展信息进行分析,可以判定对于目标模型的扩展,是属于哪方面的扩展,从而确定目标调整类型。在一种实现中,可以采用如下方式来确定目标调整类型:
72.根据模型扩展信息判断是否涉及任务功能的增加或者减少,若是,则确定目标调
整类型为功能调整类型;若否,则进一步判断模型扩展信息是否涉及同一任务功能的任务种类的增加或者减少,如果是,则确定目标调整类型为范围调整类型;如果否,则进一步判断模型扩展信息是否涉及同一任务功能的同一任务种类的模式(或广度)是否增加或者减少,若是则确定目标调整类型为模式调整类型;若否则可以将模型扩展信息提供给开发人员进行人工判断。
73.步骤120,根据所述目标调整类型,确定所述目标模型的已有能力数据。
74.其中,已有能力数据是指目标模型已有的、与目标调整类型关联的数据。而上述步骤110-2中的已有模型信息是指目标模型已有的所有能力数据。
75.在实现时,可以根据目标调整类型的调整逻辑,从目标模型的已有模型信息中提取出已有能力数据。由于不同的调整类型的调整逻辑是不同的,因此不同的调整类型对应的已有能力数据也可以是不同的。
76.步骤130,根据所述目标调整类型,确定所述目标模型中需要调整的目标权重。
77.在实际中,在对模型进行调整时,包括对模型的各个权重的调整。在调整权重时,可以调整模型的全部权重,或者有针对性地调整部分权重也是可以的。在实现时,可以根据目标调整类型的调整逻辑,确定需要调整的目标权重。由于不同的调整类型的调整逻辑是不同的,因此不同的调整类型对应的目标权重也可以是不同的。
78.步骤140,获取与所述目标权重对应的目标训练数据。
79.其中,目标训练数据可以是已有的训练数据,或者是新产生的训练数据,本实施例对此不作限制。
80.在实现时,可以从用于存储训练数据的数据库中查找与目标权重对应的目标训练数据。例如,如果目标权重是用于识别狮子的处理层的权重,则可以将标注有狮子的训练数据作为目标训练数据。
81.步骤150,基于所述已有能力数据以及所述目标训练数据对所述目标模型进行调整。
82.在该步骤中,可以根据目标调整类型的调整逻辑,采用已有能力数据以及目标训练数据对目标模型进行调整,其中可以包含对目标权重的调整。其中,上述调整可以包括:对目标模型的迭代更新、或对目标模型进行扩展(比如将旧领域使用的目标模型扩展到新领域)、或对目标模型进行缩减(比如缩减某些多余的功能),等等。
83.在一种实现中,在对目标模型进行调整时,可以根据目标模型的已有能力数据,采用迁移学习方法以及持续学习方法的至少一种进行目标模型的调整。其中,迁移学习是一种把当前领域的处理模型的能力迁移至新模型,或者扩展至新领域的模型学习方法,主要是希望用上学到的模式识别能力。持续学习是一种避免出现灾难性遗忘的学习方法,目的是希望保住旧模式识别能力的同时学会新的能力。灾难性遗忘通常是指基于旧权重参数新训练的模型在后续训练中失去了对过去数据模式识别的能力的一种现象,多出现在数据分布变化较大时。
84.本实施例使用迁移学习方法以及持续学习方法的双学习机制对业务系统的能力进行调整,可以降低开发成本。进一步地,从系统开发的时间轴来讲,双学习机制在不同的开发阶段也肩负了重要的使命。在系统开发早期的扩张阶段,缺乏标注数据,此时迁移学习的自监督思想发挥了巨大的作用,很多不同的业务需求可根据其数据分布的共性由单一任
务领域迁移而来。在中后期的优化/扩展阶段,则通过持续学习的思想,避免对已有能力的灾难性遗忘,保持原有能力的同时,稳步扩展,逐步加强对多变的人为条件的应对能力,使系统在变化的环境中也能保持较高的精度。
85.需要说明的是,上述提及的对目标模型的调整均是基于扩展产生的调整,在实际中调整还可以包括对目标模型进行缩减产生的调整。在这种情况下,可以对多余的无需用到分支或者整个模型作相应的屏蔽处理,而无需删除或在结构上处理。这样做主要是为了防止后续需要再次用上被缩减掉的功能时所增加的调整开销。某些特殊的缩减需求可以通过预设的后处理策略对过细的输出作合并即可。
86.在本实施例中,当需要对目标模型进行调整时,通过确定目标模型的目标调整类型来确定调整方向,然后根据该目标调整类型确定目标模型的已有能力数据,以及确定目标模型中需要调整的目标权重。根据该已有能力数据以及目标训练数据来对目标模型进行调整,从而实现对目标权重的调整,使得目标模型在保住旧模式识别能力的同时学会新的能力;使得业务系统能够在尽量保留原有系统能力的前提下,针对变化的业务需求和数据分布进行新功能的扩展,以避免其在新的数据分布和业务条件下性能的大幅下降,甚至让系统具备一定的自动优化和智能提高的能力,提升系统灵活依据业务变化进行快速调整的能力。
87.由于本实施例对目标模型的调整是以复用模型的已有能力数据为基础,辅以特定的学习机制来完成,同时还可以利用当前系统反馈的数据标记,周期性地作普通迭代优化,所以可以凭借较低的开销在稳定的条件下实现系统调整,用以匹配短视频/图片等业务的关注点快速变化的潮流,在快速适应变化的同时不会导致效果的大幅下降。
88.实施例二
89.图2为本技术实施例二提供的一种模型调整的方法实施例的流程图,本实施例在实施例一的基础上,对基于模式调整类型的模型调整过程进行说明,如图2所示,本实施例可以包括如下步骤:
90.步骤210,确定待调整的目标模型的目标调整类型。
91.步骤220,获取所述目标模型的模式库。
92.在本实施例中,运用了持续学习中“重演”的思想,创建了模式库。其中,重演是一种特殊的持续学习方法,主要操作是根据已学过的数据或数据原型,先在新模型演绎出对旧数据分布的识别能力,再学习新数据的模式。模式库中可以包括多个模式条目,模式条目可以为基于目标模型提取出的指定特征信息生成的信息。模式条目用于后续对目标模型进行调整时,能够快速恢复模型对旧数据模式的识别能力,避免调整后的模型对曾经能识别的数据出现灾难性遗忘。
93.在一种实现中,模式库可以存储在业务系统所在的服务器中,也可以由专门的存储服务器进行管理。通过目标模型的标识可以查找出对应的模式库。
94.步骤230,获取所述目标模型的各个处理层的权重,所述处理层包括固定处理层以及非固定处理层。
95.在一种实现中,可以由开发人员指定目标模型中的固定处理层以及非固定处理层。例如,开发人员可以根据先验知识指定具体哪些处理层是固定处理层,则剩下的就是非固定处理层。或者,开发人员还可以指定固定处理层具备的特性信息,然后系统可以根据该
特性信息从目标模型的多个处理层中确定固定处理层。比如可以将特征提取层或者注意力层作为固定处理层。
96.步骤240,将所述模式库以及所述各个处理层的权重作为所述已有能力数据。
97.在本实施例中,可以将目标模型的模式库以及目标模型的各个处理层的权重,作为目标模型的已有能力数据。该已有能力数据是指与目标调整类型相关的模型数据。
98.步骤250,将所述非固定处理层的权重进行初始化,并将初始化后的所述权重作为所述目标模型中需要调整的目标权重。
99.在对目标模型进行更新调整时,可以固定住固定处理层的权重,然后对于非固定处理层的权重进行初始化,则可以将初始化后的非固定处理层的权重作为目标模型中需要调整的目标权重。
100.步骤260,获取与所述目标权重对应的目标训练数据。
101.其中,目标训练数据就是新的训练数据,也就是用于对目标模型进行更新的训练数据。
102.步骤270,基于所述模式库中的模式条目,确定所述目标模型的旧模式特征信息。
103.在该步骤中,可以从目标模型的模式库中取出所有模式条目,并针对每个模式条目进行处理,生成该模式条目的旧模式特征信息。
104.在一种实施例中,步骤270进一步可以包括如下步骤:
105.步骤270-1,采用随机向量生成器,针对各模式条目生成对应的一个或多个扰动向量,其中,所述随机向量生成器为模拟了多模态的正态分布的随机向量生成器。
106.步骤270-2,以所述模式条目作为中心,分别采用所述一个或多个扰动向量对所述模式条目进行扰动,获得该模式条目对应的旧模式特征信息。
107.其中,扰动向量用于对模式条目进行扰动,以生成该模式条目的特征信息(即旧模式特征信息)。对于一个模式条目而言,可以生成一个扰动向量,也可以生成多个扰动向量。如果生成多个扰动向量,则是对该模式条目进行多次扰动,每个扰动向量对应会生成一个旧模式embedding(即旧模式特征信息)。
108.可以通过模拟了多模态的正态分布的随机向量生成器,为各个模式条目生成对应的一个或多个扰动向量。然后以当前模式条目为中心,采用这些生成的扰动向量对当前模式条目进行扰动,获得该模式条目对应的旧模式特征信息。
109.例如,假设一个模式条目的特征向量为(x1,x2,x3,...,xn),扰动向量是(d1,d2,...,dn),那么一次的扰动结果可以为(x1 d1,x2 d2,...,xn dn)。当需要进行多次扰动时,以模式条目的特征向量作为中心,每个扰动向量分别作用在这个“中心”上(比如每个扰动向量相加在这个中心的特征向量上),就得到了多个对应的旧模式embedding。
110.步骤280,将所述目标训练数据输入所述目标模型,在所述目标模型中采用所述固定处理层对所述目标训练数据进行特征提取,获得新特征信息。
111.在该实施例中,除了会计算旧模式embedding以外,还需要计算基于新的训练数据(即目标训练数据)得到的新数据的embedding(即新特征信息)。在实现时,可以将目标训练数据输入至目标模型中,在目标模型中,通过固定处理层来计算新特征信息。
112.步骤290,采用所述旧模式特征信息以及所述新特征信息对所述目标模型进行调整。
113.在该步骤中,旧模式特征信息以及新特征信息会被共同用于目标模型的调整,在一种实施例中,可以采用旧模式特征信息对目标权重进行更新,并采用新特征信息对所有处理层的权重进行更新。即,旧模式特征信息仅用于对初始化的那部分权重(即目标权重)的更新,而新特征信息则用于对所有权重参数进行更新,这样既让模型快速地恢复对旧数据模式的识别能力也让其学习了新数据的模式。
114.在一种实施例中,为了使得目标模型可以快速恢复对旧模式的记忆,在对目标模型进行调整时,可以采用l2正则项来扩充损失函数,直到模型收敛。其中,该l2正则项为结合了拉普拉斯(laplace)估计和fisher编码的正则项。laplace估计是使用拉普拉斯矩阵和最大似然估计评估新分布向旧分布靠近的一种后验概率估计方法;fisher编码是一种基于曲率的编码方式,可以通过控制曲率的大小,迫使模型向特定数据分布进行学习。这样可以在模型训练早期使模型快速学习旧数据分布,然后在训练后期促进对新数据分布的学习。
115.在一种实施例中,在对目标模型调整完成以后,本实施例还可以包括如下步骤:
116.当对目标模型调整完成以后,采用调整后的目标模型对新产生的训练数据提取特征信息;将所有获得的特征信息进行聚类,获得聚类中心;将所述聚类中心作为模式条目添加至所述模式库中。
117.在该实施例中,每次完成模型的调整时,会使用新收敛好的模型对新产生的训练数据提取embedding(特征信息),这些embedding可以为多个特征向量或特征图。然后可以对所有新产生的训练数据的embedding使用密度聚类方法获取聚类中心,接着可以把该聚类中心作为模式条目存放至模式库中。
118.在其他实现中,除了使用密度聚类方法获取聚类中心,还可以使用层次聚类的方法确定聚类中心,并利用层次信息过滤掉带有负效果的分部信息。
119.本实施例通过存储聚类中心和扰动恢复的方式可以大大减少存储“重演原型”所需的空间。
120.在本实施例中,针对提高数据覆盖多样性的需求,通过重演思想创建模式库实现旧模式特征信息的复用,结合通过新的训练数据得到的新特征信息对目标模型进行调整,实现快速恢复原有能力的同时,学习新数据的模式。在完全不扩张模型的权重参数量的前提下,达到数据覆盖提升的目的,降低了存储所需的空间开销并提高已开发模块的复用能力。
121.实施例三
122.图3为本技术实施例三提供的一种模型调整的方法实施例的流程图,本实施例在实施例一的基础上,对基于任务范围调整类型的模型调整过程进行说明,如图3所示,本实施例可以包括如下步骤:
123.步骤310,确定待调整的目标模型的目标调整类型。
124.在一种实施例中,步骤310进一步可以包括如下步骤:
125.获取用户针对所述目标模型输入的模型需求信息;获取所述目标模型的已有模型信息;将所述模型需求信息与所述已有模型信息进行比较,以确定模型扩展信息;获取一个或多个预设的调整类型的调整逻辑;将所述模型扩展信息与所述一个或多个预设调整类型的调整逻辑进行匹配,并将匹配到的调整类型作为所述目标调整类型。
126.步骤320,获取所述目标模型的各个处理层的权重,所述处理层包括低层处理层、
中层处理层以及高层处理层。
127.在该实施例中,可以将目标模型的处理层划分为低层处理层、中层处理层以及高层处理层,划分的策略可以人为指定。
128.步骤330,获取所述目标模型的各个已有输出分支的权重。
129.例如,对于处理分类任务的分类模型而言,模型可以有多个输出分支,一个输出分支对应于一个类别。
130.步骤340,将所述各个处理层的权重以及所述各个已有输出分支的权重作为已有能力数据。
131.步骤350,针对模型扩展信息生成对应的范围扩展分支。
132.在该实施例中,当目标模型需要扩展任务范围时,可以获取模型扩展信息,该模型扩展信息为用于表示目标模型需要扩展的信息。当获得模型扩展信息以后,则可以针对该模型扩展信息在目标模型中添加一个小型的处理分支,称为范围扩展分支。
133.在实际中,对于扩展目标模型的任务范围的场景,可以考虑如下两种情况:一种是扩展当前模型输出不包含的任务类型,即扩展未知任务范围;另一种是把已有输出的任务类型扩充或拆解为更细的类型,即扩展已知任务范围。本实施例在处理上述两种情况时,都运用了迁移学习的思想,把当前学到的模式识别能力迁移到更大范围的任务里面。
134.为了保持模型的泛化能力,以及避免负迁移(负迁移是指对新领域任务学习带来反效果的迁移学习操作)对已有识别能力的影响,如图4所示,当需要扩展模型的未知任务范围时,在新建的范围扩展分支(即图4中的新裂解分支)中可以设置指定输出选项,该指定输出选项示例性地可以包括“其他”类型。该指定输出选项可以对应于无标签的训练数据。当需要扩展已知任务范围时,则无需在新建的范围扩展分支中设置指定输出选项,这是因为该范围扩展分支的输出实际上来源于原有分支的某个输出,无标签数据只需要集中在原有分支的指定输出选项即可,这样可以使得模型能够尽可能地继承对原有类型模式的识别能力。
135.步骤360,将所述范围扩展分支的权重初始化。
136.在该步骤中,新建的范围扩展分支的权重可以为初始权重。
137.步骤370,将所述范围扩展分支初始化的权重以及所述高层处理层的权重作为所述目标权重。
138.步骤380,分别固定所述低层处理层的权重以及所述中层处理层的权重。
139.在一种实现中,在首次训练目标模型时,可以先通过大规模的通用数据集训练好目标模型的低层处理层以及中层处理层,并固定好低层处理层的权重以及中层处理层的权重。后面的每次调整都只对新增的范围扩展分支的权重以及高层处理层的权重进行更新,这样可以使特征提取的主体部分具备强大的泛化特征提炼能力,同时减少每次调整时的训练开销。
140.步骤390,获取与所述目标权重对应的目标训练数据。
141.示例性地,在该实施例中,目标训练数据可以包括模型扩展前的训练数据以及模型扩展后的训练数据,模型扩展后的训练数据主要指范围扩展分支对应的训练数据。
142.步骤3110,采用所述目标训练数据,对所述目标权重进行调整。
143.在一种实现中,在采用目标训练数据对目标权重进行调整时,所使用的损失函数
可以为基于领域匹配的损失函数,其中,领域匹配是指一种用于无标签数据的自学习方案,一般通过已有数据的部分来推理学习未知数据。基于领域匹配的损失函数例如可以包括基于laplace估计的损失函数。
144.在实际训练时,已有输出分支计算的梯度和范围扩展分支计算的梯度会共同作用于需要被更新的权重参数。这样做可以在调整的时候,继续增强特征提取部分的泛化能力。同时,以小型分支的形式进行扩展也最大限度地控制了参数量的增加,避免在后期模型过于庞大;也给拥有增长特性的业务更好的扩展能力。
145.在一种实施例中,已有能力数据还包括已有输出分支的指定输出选项;步骤3110进一步可以包括如下步骤:
146.获取已有输出分支的指定输出选项对应的第一训练数据;
147.判断所述范围扩展分支是否包含指定输出选项;
148.若是,则获取所述范围扩展分支的指定输出选项的第二训练数据,并基于所述第一训练数据及所述第二训练数据,采用自监督方式对所述范围扩展分支的权重以及所述已有输出分支的权重进行调整;
149.若否,则基于所述第一训练数据,采用自监督方式对所述范围扩展分支的权重以及所述已有输出分支的权重进行调整。
150.具体的,在进行模型调整时,如果判定范围扩展分支包含指定输出选项,则表示当前的范围扩展为未知范围的扩展。则可以获取范围扩展分支的指定输出选项的第二训练数据,结合已有输出分支的指定输出选项对应的第一训练数据,作为训练数据集合。然后采用自监督方式对训练数据集合进行学习,以完成对当前范围扩展分支的权重以及已有输出分支的权重进行调整。
151.需要说明的是,已有输出分支的指定输出选项(如“其它”类型)只会对决策层的最后一层做反向传播,以微调参数,通过设置指定输出选项是为了保持模型的泛化能力,以及避免“负迁移”对已有识别能力的影响。
152.另一方面如果判定范围扩展分支不包含指定输出选项,则表示当前的范围扩展为已知范围的扩展。在对当前范围扩展分支的权重进行调整时,可以把该范围扩展分支对应的原有的任务类型屏蔽掉,训练时主要训练当前范围扩展分支的权重。在训练时,可以基于第一训练数据,采用自监督方式对范围扩展分支的权重以及已有输出分支的权重进行调整。
153.在本实施例中,针对扩展同一任务的任务范围的需求,运用了迁移学习的思想,把当前学到的模式识别能力迁移到更大范围的任务里面。在针对模型扩展信息生成对应的范围扩展分支以后,在对目标模型进行调整时,着重调整范围扩展分支权重与高层处理层的权重,以小型分支的形式进行扩展能够最大限度地控制了参数量的增加,避免在后期模型过于庞大,也给拥有增长特性的业务更好的扩展能力。
154.另外,本实施例分别为扩展未知任务范围和已知任务范围作了对应设计,通过对不确定标签数据的自监督学习,为后续进一步扩展任务范围留下空间。
155.实施例四
156.图5为本技术实施例四提供的一种模型调整的方法实施例的流程图,本实施例在实施例一的基础上,对基于任务功能调整类型的模型调整过程进行说明,如图5所示,本实
施例可以包括如下步骤:
157.步骤510,确定待调整的目标模型的目标调整类型。
158.在一种实施例中,步骤510进一步可以包括如下步骤:
159.获取用户针对所述目标模型输入的模型需求信息;获取所述目标模型的已有模型信息;将所述模型需求信息与所述已有模型信息进行比较,以确定模型扩展信息;获取一个或多个预设的调整类型的调整逻辑;将所述模型扩展信息与所述一个或多个预设调整类型的调整逻辑进行匹配,并将匹配到的调整类型作为所述目标调整类型。
160.步骤520,获取所述目标模型的各个已有功能分支的权重。
161.步骤530,将所述各个已有功能分支的权重作为所述已有能力数据。
162.步骤540,针对所述模型扩展信息生成对应的功能扩展分支。
163.步骤550,将所述功能扩展分支的权重初始化。
164.步骤560,在所述功能扩展分支与各已有功能分支之间构建映射衔接层,所述映射衔接层用于对已有的功能分支的特征信息进行映射,并从已有的功能分支的特征信息中确定共享权重,所述共享权重用于作为所述已有能力数据。
165.步骤570,将所述扩展分支初始化的权重以及所述映射衔接层的权重作为所述目标权重。
166.步骤580,基于所述已有能力数据以及所述目标训练数据,对所述目标模型进行调整,所述调整包括对所述目标权重的调整。
167.任务功能调整类型的模型调整方法,与图3实施例中的任务范围调整类型类似,也是针对模型扩展信息生成对应的扩展分支,本实施例称为功能扩展分支,用以承载新的任务功能。新构建的小型的功能扩展分支会接上扩展的任务功能对应的输出,以及使用对应任务功能相关的损失函数训练该功能扩展分支。
168.在实际中,由于新任务功能的输出可能与原任务功能相差较大,比如分割任务功能是以完整的热力图作为输出,而分类功能则只包括多个类别的置信度序列。因此,本实施例的功能扩展分支比图3的范围扩展分支的构造更加复杂多样。
169.在进行目标模型的调整时,对功能扩展分支的权重进行初始化并进行针对性训练。同时与旧有的任务功能共享一部分特征提取层的权重,这主要是因为该学习机制主要针对任务功能的变化,数据分布基本会保持一致或小幅波动,原有任务功能的特征提取能力对新任务功能的表现也会有很大的帮助。
170.具体的,如图6所示,在扩展新任务功能时,会在功能扩展分支与各已有功能分支之间构建映射衔接层(即图6中的衔接层),这主要是因为功能扩展分支的判别虽然也需要结合已有功能分支的特征提取能力,但在做决策输出时会受到新任务功能输出的影响较大,所以已有功能分支的特征信息还需要经过一定的映射,才能被新功能合理使用。同时,因为不清楚哪个已有功能分支的特征信息更有利于新功能的决策,所以多个已有功能分支的特征提取层都会与映射衔接层连接,由映射衔接层去判断选取合适的共享特征信息进行使用。训练时,映射衔接层也会和新的功能扩展分支一起训练,损失函数的梯度反向传播也会覆盖至映射衔接层以及新的功能扩展分支。
171.在本实施例中,通过结合衔接映射层和新功能分支的方式,实现任务功能的扩展,既利用了旧任务功能的特征提取能力,也为新任务功能的决策提供了合适映射。
172.另外,本实施例融合了持续学习和迁移学习的思想,既不会导致对过去已学能力的灾难性遗忘,也完成了把单一功能领域的能力扩散至多功能领域的目标,使系统跟上业务需求和数据分布的变化。
173.实施例五
174.图7为本技术实施例五提供的一种模型调整的装置实施例的结构框图,可以包括如下模块:
175.调整类型确定模块710,用于确定待调整的目标模型的目标调整类型;
176.已有能力数据确定模块720,用于根据所述目标调整类型,确定所述目标模型的已有能力数据;
177.目标权重确定模块730,用于根据所述目标调整类型,确定所述目标模型中需要调整的目标权重;
178.目标训练数据获取模块740,用于获取与所述目标权重对应的目标训练数据;
179.模型调整模块750,用于基于所述已有能力数据以及所述目标训练数据对所述目标模型进行调整,所述调整包括对所述目标权重的调整。
180.在一种实施例中,调整类型确定模块710具体用于:
181.获取用户针对所述目标模型输入的模型需求信息;
182.获取所述目标模型的已有模型信息;
183.将所述模型需求信息与所述已有模型信息进行比较,以确定模型扩展信息;
184.获取一个或多个预设的调整类型的调整逻辑;
185.将所述模型扩展信息与所述一个或多个预设调整类型的调整逻辑进行匹配,并将匹配到的调整类型作为所述目标调整类型。
186.在一种实施例中,已有能力数据确定模块720具体用于:
187.获取所述目标模型的模式库,所述模式库中包括多个模式条目;
188.获取所述目标模型的各个处理层的权重;
189.将所述模式库以及所述各个处理层的权重作为所述已有能力数据。
190.在一种实施例中,所述处理层包括固定处理层以及非固定处理层;目标权重确定模块730具体用于:
191.将所述非固定处理层的权重进行初始化;
192.将初始化后的所述权重作为所述目标模型中需要调整的目标权重。
193.在一种实施例中,模型调整模块750进一步可以包括如下子模块:
194.旧模式特征信息确定子模块,用于基于所述模式库中的模式条目,确定所述目标模型的旧模式特征信息;
195.新特征信息获取子模块,用于将所述目标训练数据输入所述目标模型,在所述目标模型中采用所述固定处理层对所述目标训练数据进行特征提取,获得新特征信息;
196.模型调整子模块,用于采用所述旧模式特征信息以及所述新特征信息对所述目标模型进行调整。
197.在一种实施例中,旧模式特征信息确定子模块具体用于:
198.采用随机向量生成器,针对各模式条目生成对应的一个或多个扰动向量,其中,所述随机向量生成器为模拟了多模态的正态分布的随机向量生成器;
199.以所述模式条目作为中心,分别采用所述一个或多个扰动向量对所述模式条目进行扰动,获得该模式条目对应的旧模式特征信息。
200.在一种实施例中,模型调整子模块具体用于:
201.采用所述旧模式特征信息对所述目标权重进行更新;
202.采用所述新特征信息对所有处理层的权重进行更新。
203.在一种实施例中,所述装置还可以包括如下模块:
204.损失函数扩充模块,用于在对所述目标模型进行调整时,采用l2正则项来扩充损失函数,所述l2正则项为结合了拉普拉斯估计和fisher编码的正则项。
205.在一种实施例中,所述装置还可以包括如下模块:
206.模式添加模块,用于当对目标模型调整完成以后,采用调整后的目标模型对新产生的训练数据提取特征信息;将所有获得的特征信息进行聚类,获得聚类中心;将所述聚类中心作为模式条目添加至所述模式库中。
207.在另一种实施例中,所述目标调整类型包括任务范围调整类型,已有能力数据确定模块720具体用于:
208.获取所述目标模型的各个处理层的权重;
209.获取所述目标模型的各个已有输出分支的权重;
210.将所述各个处理层的权重以及所述各个已有输出分支的权重作为所述已有能力数据。
211.在一种实施例中,所述处理层包括高层处理层;目标权重确定模块730具体用于:
212.针对所述模型扩展信息生成对应的范围扩展分支;
213.将所述范围扩展分支的权重初始化;
214.将所述范围扩展分支初始化的权重以及所述高层处理层的权重作为所述目标权重。
215.在一种实施例中,所述处理层还包括低层处理层以及中层处理层;模型调整模块750具体用于:
216.分别固定所述低层处理层的权重以及所述中层处理层的权重;
217.采用所述目标训练数据,对所述目标权重进行调整。
218.在一种实施例中,所述已有能力数据还包括已有输出分支的指定输出选项;
219.所述模型调整模块750具体用于:
220.获取已有输出分支的指定输出选项对应的第一训练数据;
221.判断所述范围扩展分支是否包含指定输出选项;
222.若是,则获取所述范围扩展分支的指定输出选项的第二训练数据,并基于所述第一训练数据及所述第二训练数据,采用自监督方式对所述范围扩展分支的权重以及所述已有输出分支的权重进行调整;
223.若否,则基于所述第一训练数据,采用自监督方式对所述范围扩展分支的权重以及所述已有输出分支的权重进行调整。
224.在又一种实施例中,已有能力数据确定模块720具体用于:
225.获取所述目标模型的各个已有功能分支的权重;
226.将所述各个已有功能分支的权重作为所述已有能力数据。
227.在一种实施例中,目标权重确定模块730具体用于:
228.针对所述模型扩展信息生成对应的功能扩展分支;
229.将所述功能扩展分支的权重初始化;
230.在所述功能扩展分支与各已有功能分支之间构建映射衔接层,所述映射衔接层用于对已有的功能分支的特征信息进行映射,并从已有的功能分支的特征信息中确定共享权重,所述共享权重用于作为所述已有能力数据;
231.将所述扩展分支初始化的权重以及所述映射衔接层的权重作为所述目标权重。
232.本技术实施例所提供的一种模型调整的装置可执行本技术实施例一至实施例四中任一实施例的一种模型调整的方法,具备执行方法相应的功能模块和有益效果。
233.实施例六
234.图8为本技术实施例六提供的一种业务处理方法实施例的流程图,可以包括如下步骤:
235.步骤810,获取待处理的业务数据;
236.步骤820,加载根据实施例一至实施例四任一实施例获得的目标模型;
237.步骤830,采用所述目标模型对所述业务数据进行处理。
238.在本实施例中,在进行业务处理时使用的目标模型是经过实时调整的模型,在尽量保留原有模型能力的前提下,针对变化的业务需求和数据分布进行新功能的扩展。由于其调整以复用已有模型为基础辅以特定的学习机制来完成,而且还利用了模型实时反馈的数据标记周期性地作普通迭代优化,所以可以凭借较低的开销在稳定的条件下实现模型调整,用以匹配业务关注点快速变化的潮流,在快速适应变化的同时不会导致效果的大幅下降。
239.实施例七
240.图9为本技术实施例七提供的一种业务处理装置实施例的流程图,可以包括如下模块:
241.业务数据获取模块910,用于获取待处理的业务数据;
242.目标模型加载模块920,用于加载根据实施例一至实施例四任一实施例获得的目标模型;
243.业务处理模块930,用于采用所述目标模型对所述业务数据进行处理。
244.本技术实施例所提供的一种业务处理装置可执行本技术实施例七的一种业务处理方法,具备执行方法相应的功能模块和有益效果。
245.实施例八
246.图10为本技术实施例八提供的一种业务处理设备的结构示意图,如图10所示,该业务处理设备包括处理器1010、存储器1020、输入装置1030和输出装置1040;业务处理设备中处理器1010的数量可以是一个或多个,图10中以一个处理器1010为例;业务处理设备中的处理器1010、存储器1020、输入装置1030和输出装置1040可以通过总线或其他方式连接,图10中以通过总线连接为例。
247.存储器1020作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本技术实施例中的上述实施例一至实施例四的任一实施例或实施例六对应的程序指令/模块。处理器1010通过运行存储在存储器1020中的软件程序、指令以及模
块,从而执行业务处理设备的各种功能应用以及数据处理,即实现上述的方法实施例一至实施例四的任一实施例或实施例六中提到的方法。
248.存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器1020可进一步包括相对于处理器1010远程设置的存储器,这些远程存储器可以通过网络连接至设备/终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
249.输入装置1030可用于接收输入的数字或字符信息,以及产生与业务处理设备的用户设置以及功能控制有关的键信号输入。输出装置1040可包括显示屏等显示设备。
250.实施例九
251.本技术实施例七还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述方法实施例一至实施例四的任一实施例或实施例六的方法。
252.当然,本技术实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本技术任意实施例所提供的方法中的相关操作。
253.实施例十
254.本技术实施例十还提供一种计算机程序产品,该计算机程序产品包括计算机可执行指令,所述计算机可执行指令在由计算机处理器执行时用于执行上述方法实施例一至实施例四的任一实施例或实施例六的方法。
255.当然,本技术实施例所提供的一种计算机程序产品,其计算机可执行指令不限于如上所述的方法操作,还可以执行本技术任意实施例所提供的方法中的相关操作。
256.通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本技术可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台业务处理设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
257.值得注意的是,上述装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。
258.注意,上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解,本技术不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此,虽然通过以上实施例对本技术进行了较为详细的说明,但是本技术不仅仅限于以上实施例,在不脱离本技术构思的情况下,还可以包括更多其他等效实施例,而本技术的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献