一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种资源分配方法、电子设备、应用程序及存储介质与流程

2022-06-05 02:18:01 来源:中国专利 TAG:


1.本说明书实施例涉及数据处理技术领域,尤其涉及一种资源分配方法、电子设备、应用程序及存储介质。


背景技术:

2.优化模型(optimization model)是一种运用线性规划、非线性规划、动态规划、整数规划以及系统科学方法所确定的表示最优方案的模型。优化模型能反映条件极值问题,即在既定目标下,如何最有效地利用各种资源,或者在资源有限制的条件下,如何获取到最好的效果。通过求解优化模型可以解决资源最佳分配问题、最优部门结构问题、生产力合理布局问题、最优积累率问题、物资合理调运问题、最低成本问题等实际业务问题。
3.在一些场景中,若优化模型难以求解,可以采用原始对偶(primal-dual)模型进行求解,即将优化模型转换为对偶模型,通过求解对偶模型获得优化模型的求解结果。
4.针对于在线分配任务,相关决策平台需基于在线分配任务的任务数据进行实时决策,其中一种方式是构建在线分配任务的对偶模型,通过求解对偶模型获得决策结果。然而在相关技术中,上述求解过程往往需要人工参与,尚未能实现在线分配任务的自动化决策。


技术实现要素:

5.本说明书实施例提供了一种资源分配方法、电子设备、应用程序及存储介质,以实现在线分配任务的自动化决策。
6.根据本说明书实施例的第一方面,提供一种资源分配方法,用于解决从多个资源中向目标对象分配目标资源的分配任务;基于所述分配任务预先建立有原始模型,所述原始模型包括决策变量、优化目标和约束条件;所述方法包括:响应于在线分配任务的处理请求,调用预设的数据模板;其中,所述数据模板指示有处理分配任务所需的系数;所述系数包括从所述优化目标中提取的目标系数、从所述约束条件中提取的约束系数、以及基于所述原始模型确定的对偶系数;所述数据模板还包括所述对偶系数的系数值;根据所述数据模板,读取所述在线分配任务中每个资源对应的系数值;根据预先确定的评估规则和所述每个资源对应的系数值,确定每个资源的评估结果;其中,所述评估规则基于所述原始模型对应的对偶模型确定;基于每个所述资源的评估结果,从所述多个资源中确定分配给所述目标对象的目标资源。
7.在一些例子中,所述评估结果表征所述资源分配给所述目标对象所获取的收益;所述目标资源为所述收益最大的资源。
8.在一些例子中,所述目标系数和所述约束系数从用户输入的用于描述所述原始模型的输入信息中获取的;所述输入信息包括:用于描述所述决策变量的信息、用于描述所述优化目标的信息、以及用于描述所述约束条件的信息。
9.在一些例子中,所述数据模板中还指示有所述目标系数的系数值存储地址和约束系数的系数值存储地址;所述根据所述数据模板,读取所述在线分配任务中每个资源对应的系数值,包括:从所述目标系数的系数值存储地址中读取所述在线分配任务中每个资源的目标系数的系数值;以及,从所述约束系数的系数值存储地址中读取所述在线分配任务中每个资源对应的约束系数的系数值。
10.在一些例子中,所述目标系数的系数值存储地址和所述约束系数的系数值存储地址从用户输入的用于描述所述原始模型的输入信息中获取。
11.在一些例子中,所述输入信息从用户界面中获取,所述用户界面包括决策变量输入组件、优化目标输入组件以及约束条件输入组件;所述数据模板中的目标系数根据所述优化目标输入组件中的输入信息确定;所述数据模板中的约束系数根据所述约束条件输入组件中的输入信息确定。
12.在一些例子中,所述对偶系数的确定过程包括:基于所述原始模型的决策变量、优化目标和约束条件、引入的对偶变量、以及若干历史分配任务对应的历史数据集合,构建无约束的目标优化模型;利用梯度下降法求解所述目标优化模型,或者利用交替方向乘子法迭代求解所述目标优化模型,直到最后一轮迭代的约束误差满足预设误差;确定得到的所述对偶变量的解作为所述对偶系数的系数值。
13.在一些例子中,所述目标对象包括申请贷款用户;所述资源包括银行;所述处理请求包括贷款请求;所述决策变量包括贷款额度;所述目标系数包括所述银行对所述申请贷款用户的通过率;所述约束系数包括所述申请贷款用户对所述银行的风险率。
14.根据本说明书实施例的第二方面,提供一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器调用所述可执行指令时实现上述第一方面任一所述方法的操作。
15.根据本说明书实施例的第三方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述方法的步骤。
16.根据本说明书实施例的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有若干计算机指令,所述计算机指令被执行时执行上述第一方面任一所述的方法。
17.本说明书实施例的实施例提供的技术方案可以包括以下有益效果:本说明书实施例提供了一种资源分配方法、电子设备、应用程序及存储介质,用于解决从多个资源中向目标对象分配目标资源的分配任务。其中,基于该分配任务,预先建立有相应的优化模型,也称原始模型,以及预设有数据模板。其中,数据模板指示有处理分配任务所需的系数,包括从优化目标中提取的目标系数、从约束条件中提取的约束系数、以及基于该原始模型确定的对偶系数。且数据模板还包括对偶系数的系数值。如此,在发生在线分配任务的处理请求时,可以通过调用上述数据模板,读取到在线分配任务中每个资源对应的系数值。然后根据预先确定的评估规则,利用每个资源对应的系数值,确定每个资源的
评估结果。最后基于每个资源的评估结果,从多个资源中确定分配给目标对象的目标资源,以获得在线分配任务的决策结果。在上述过程中,评估每个资源所需的数据均可以通过数据模板获取,每个资源的评估规则也已经预先设定,在整个决策过程中无需人工参与,实现了在线分配任务的自动化决策。
18.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
附图说明
19.此处的附图被并入说明书中并构成本说明书实施例的一部分,示出了符合本说明书实施例的实施例,并与说明书一起用于解释本说明书实施例的原理。
20.图1是本说明书根据一实施例示出的一种资源分配方法的流程图。
21.图2是本说明书根据一实施例示出的用户界面的示意图。
22.图3是本说明书根据另一实施例示出的一种资源分配方法的流程图。
23.图4是本说明书根据一实施例示出的一种电子设备的硬件结构图。
具体实施方式
24.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书实施例的一些方面相一致的装置和方法的例子。
25.在本说明书实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书实施例。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
26.应当理解,尽管在本说明书实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
27.优化模型(optimization model)是一种运用线性规划、非线性规划、动态规划、整数规划以及系统科学方法所确定的表示最优方案的模型。优化模型能反映条件极值问题,即在既定目标下,如何最有效地利用各种资源,或者在资源有限制的条件下,如何获取到最好的效果。通过求解优化模型可以解决资源最佳分配问题、最优部门结构问题、生产力合理布局问题、最优积累率问题、物资合理调运问题、最低成本问题等实际业务问题。
28.优化模型一般包括决策变量、优化目标和约束条件。其中,决策变量是指实际业务问题中涉及的与约束条件和优化目标有关的待求解的变量。优化目标是指与决策变量有关的待求其极值的函数,用于指导决策变量的求解过程。约束条件是指在求优化目标的极值时,决策变量必须满足的限制。
29.针对于在线分配任务,相关决策平台需基于在线分配任务的任务数据进行实时决策。例如,从多个资源中向目标对象分配目标资源。在线分配任务包括多种场景,作为例子,假设在金融贷款场景中,在有多家银行的情况下,需要从多家银行决策出将申请贷款用户分配给哪家银行贷款。申请贷款用户可以用i表示,银行可以用j表示。每家银行对每个申请贷款用户进行贷款评估,确定一个通过率,可以用a
ij
表示。每个申请贷款用户对每家银行有风险等级,可以用r
ij
表示。每家银行有风险金额上限控制,可以记录为rj。现在需要决策每家银行向每个用户审批多少贷款额度,记为x
ij
,从而决定将该申请贷款用户分配给哪家银行贷款。基于该贷款分配任务,可以建立优化模型。其中,决策变量可以包括贷款额度x
ij
;优化目标可以包括最大化通过率(即希望能最大化银行向用户审批的贷款额度),即;约束条件可以包括每个银行的风险金额不超过上限,即 。该分配任务的决策结果为将贷款额度最高的银行作为目标银行,将分配任务中的申请贷款用户分配到该目标银行进行贷款。
30.作为另一个例子,假设在金融理财场景中,在有多个可选择的理财产品的情况下,需要从多份理财产品中决策出向选购理财产品的用户分配目标理财产品。基于该理财产品分配任务,可以建立优化模型。其中,决策变量可以包括将各个理财产品分配给用户所能获取的收益;优化目标可以包括最大化该收益;约束条件可以包括各理财产品需要遵循的限制条件,比如每个理财产品对应有最低投资金额限制、每个理财产品对应有最低持有时长限制,用户打算投资的金额上限、和/或用户打算持有理财产品的时长上限等等。该理财产品分配任务的决策结果为将收益最大的理财产品作为分配给用户的目标理财产品。
31.在一些场景中,若优化模型难以求解,可以采用原始对偶(primal-dual)模型进行求解,即将优化模型(也称原始模型)转换为对偶模型,通过求解对偶模型获得优化模型的求解结果。如在上述在线分配任务中,相关决策平台可以采用原始对偶模型得到在线分配任务的实时决策结果。也即通过求解在线分配任务的优化模型相应的对偶模型,得到实时决策结果。然而在相关技术中,上述过程往往需要人工参与,包括由人工导出对偶系数以及推导对偶模型,再在决策平台线上实现相关决策逻辑,最终得到决策结果。在相关技术中,在线分配任务实现过程需要人工参与,尚未能实现在线分配任务的自动化决策。
32.为了实现在线分配任务的自动化决策,本技术提出了一种资源分配方法,用于解决从多个资源中向目标对象分配目标资源的分配任务。基于该分配任务预先建立有原始模型,也即优化模型。该原始模型包括决策变量、优化目标和约束条件。上述资源分配方法包括如图1所示的步骤:步骤110:响应于在线分配任务的处理请求,调用预设的数据模板;其中,所述数据模板指示有处理分配任务所需的系数;所述系数包括从所述优化目标中提取的目标系数、从所述约束条件中提取的约束系数、以及基于所述原始模型确定的对偶系数;所述数据模板还包括所述对偶系数的系数值;步骤120:根据所述数据模板,读取所述在线分配任务中每个资源对应的系数值;步骤130:根据预先确定的评估规则和所述每个资源对应的系数值,确定每个资源的评估结果;
其中,所述评估规则基于所述原始模型对应的对偶模型确定;步骤140:基于每个所述资源的评估结果,从所述多个资源中确定分配给所述目标对象的目标资源。
33.上述资源分配方法可由电子设备来执行,所述电子设备包括但不限于计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理或者服务器等具有数据处理能力的设备。示例性的,所述电子设备包括有存储器和处理器,所述存储器上存储有所述分配任务处理方法的可执行指令,以便处理器在执行所述可执行指令时能够实现所述资源分配方法。示例性的,所述资源分配方法可以封装成一计算机程序产品,并集成在所述电子设备中。
34.分配任务是指从多个资源中向目标对象分配目标资源的任务。其中,目标系数是影响分配任务的决策变量(或者说影响优化目标)的因子;约束系数是指约束所述分配任务的决策变量的约束条件中的因子。分配任务可以包括多种应用场景,作为例子,分配任务可以是从多家银行决策出将申请贷款用户分配给哪家银行贷款。如此,上述目标对象可以包括申请贷款用户;上述多个资源可以包括多个银行;上述处理请求可以包括在线的贷款请求。原始模型的决策变量可以包括贷款额度;优化目标可以包括最大化通过率,那么,从优化目标提取出的目标系数可以包括银行对申请贷款用户的通过率;约束条件可以包括每个银行的风险金额不超过上限,那么,从约束条件提取出的约束系数可以包括申请贷款用户对银行的风险率。
35.作为另一个例子,分配任务可以是从多种理财产品中决策出向购买用户分配哪种理财产品。如此,上述目标对象可以包括购买用户;上述多个资源可以包括多种理财产品;上述处理请求可以包括在线的购买请求。原始模型的决策变量可以包括购买用户获取的收益;从优化目标提取出的目标系数可以依据实际应用场景进行具体设置,比如各个理财产品均对应有预期收益率,该目标系数与所述预期收益率有关。约束条件可以包括各理财产品需要遵循的限制条件,那么,从约束条件提取出的约束系数可以依据实际应用场景进行具体设置,比如理财产品的最低投资金额、最低持有时长等。
36.本说明书实施例提供的资源分配方法预设有数据模板,其中数据模板指示有处理分配任务所需的系数,包括目标系数、约束系数以及对偶系数。如上所述,目标系数与约束系数是从原始模型中的优化目标以及约束条件中分别提取出的;而对偶系数是基于原始模型确定。对偶系数的确定过程将在下文展开详细论述,在此先不进行说明。
37.可以理解的是,不同的目标对象针对不同资源有不同的系数值。数据模板指示有系数,可以通过数据模板获取到系数对应的系数值,即系数的具体取值。根据预先确定的评估规则以及目标对象对每个资源的系数值,可以确定每个资源的评估结果。每个资源都有相应的评估结果,其中,评估结果可以表征将该资源分配给目标对象所能获取的收益。基于每个资源的评估结果可以确定分配给目标对象的目标资源。其中,目标资源可以是收益最大的资源。评估规则是基于原始模型对应的对偶模型确定的。评估规则的确定过程将在下文展开详细论述,在此先不进行说明。
38.本说明书实施例提供了一种资源分配方法,用于解决从多个资源中向目标对象分配目标资源的分配任务。由于预先建立有相应的优化模型,也称原始模型,以及预设有数据模板,且数据模板中指示有处理分配任务所需的系数,因此在发生在线分配任务的处理请
求时,可以通过调用上述数据模板,读取到在线分配任务中每个资源对应的系数值。然后根据预先确定的评估规则,利用每个资源对应的系数值,确定每个资源的评估结果。最后基于每个资源的评估结果,从多个资源中确定分配给目标对象的目标资源,以获得在线分配任务的决策结果。如此,在上述过程中,评估每个资源所需的数据均可以通过数据模板获取,每个资源的评估规则也已经预先设定,在整个决策过程中无需人工导出对偶系数以及推导对偶模型,实现了在线分配任务的自动化决策。
39.在一些实施例中,原始模型可以由用户输入,值得注意的是,这里的用户是指技术人员,如运维决策平台的技术人员。用户可以输入用于描述原始模型的输入信息,包括用于描述决策变量的信息、用于描述优化目标的信息、以及用于描述约束条件的信息。如此,数据模板中的目标系数与约束系数可以从上述输入信息中获取。
40.在一些实施例中,输入信息可以是表达式,所谓表达式,是指由数字、算符、数字分组符号(如括号)、自由变量、和约束变量等以能求得数值的有意义排列方式所得的组合。其中,约束变量在表达式中已被指定数值,自由变量则未指定数值。
41.如此,用于描述决策变量的信息可以包括决策变量表达式;用于描述优化目标的信息可以包括优化目标表达式;用于描述约束条件的信息可以包括约束条件表达式。其中,为了让计算机识别到用户输入的表达式为哪一种表达式,用户输入的表达式中可以包括有预定义的字符串。例如决策变量表达式包括预定义的决策变量字符串;优化目标表达式包括预定义的优化目标字符串;约束条件表达式包括预定义的约束条件字符串。
42.作为例子,决策变量字符串可以包括起始标识和决策变量标识。起始标识用于定义决策变量和/或参数,是一个预定的符号标识。例如,起始标识可以是包括但不限于符号“@”、符号“#”、符号“%”中的一种或多种的组合。决策变量标识可以是x。如此,决策变量字符串可以是字符串“@x”。作为例子,优化目标字符串可以是字符串“obj”。作为例子,约束条件字符串可以是字符串“cn”,其中,n可以是正整数。当然,上述预定义的字符串不限于上述举例,还可以是其他字符串,本技术在此不做限制。
43.在一些实施例中,用户可以在用户界面中输入上述输入信息。如此,输入信息可以从用户界面中获取。如图2示出的用户界面的示意图所示,用户界面200可以包括决策变量输入组件210、优化目标输入组件220以及约束条件输入组件230。
44.其中,决策变量输入组件210可以用于供用户输入描述决策变量的信息。比如在上述的金融贷款场景中,用户可以通过决策变量输入组件指示i为用户,j为银行,决策变量x ij
为每家银行向每个用户审批的贷款额度。又比如在上述的金融理财场景中,用户可以通过决策变量输入组件指示i为用户,j为理财产品,决策变量xij为每个理财产品能够为用户带来的收益。
45.优化目标输入组件220可以用于供用户输入描述优化目标的信息,如此,可以根据优化目标输入组件220中的输入信息确定数据模板中的目标系数。描述优化目标的信息包括影响决策变量(或者说影响所述优化目标)的目标系数以及优化目标的运算方式。比如在上述的金融贷款场景中,用户可以通过优化目标输入组件220指示所述目标系数为每家银行对每个用户的贷款通过率a ij
,以及优化目标的运算方式为最大化(max)处理。
46.作为例子,用户可以在优化目标输入组件220的目标系数控件中输入目标系数。例如,若目标系数的系数值以表格形式存储,那么用户可以在目标系数控件中输入目标系数
在表格中对应的字段。如此,可以根据输入的字段,从相应的表格中查找到目标系数,并记录到数据模板中。
47.约束条件输入组件230可以用于供用户输入描述约束条件的信息,如此,可以根据优化目标输入组件220中的输入信息确定数据模板中的目标系数。描述约束条件的信息包括有约束所述决策变量的约束系数、约束向量以及约束关系(比如等于关系、大于关系或者小于关系)。其中,约束条件包括有等式约束条件和/或不等式约束条件。比如在上述的金融贷款场景中,约束系数为每个用户对每家银行的风险等级r
ij
,约束向量为每家银行的风险金额上限r j
,约束关系为小于或等于关系,则有 。
48.作为例子,用户可以在约束条件输入组件230的约束系数控件中输入约束系数;在约束向量空间中输入约束向量;以及在约束关系空间中输入约束关系。例如,若上述系数的系数值以表格形式存储,那么用户可以在上述控件中分别输入相应的系数在表格中对应的字段。如此,可以根据输入的字段,从相应的表格中查找到相应的系数,并记录到数据模板中。
49.可以理解的是,图2所示的用户建模界面仅为示例性说明,并不构成为输入方式的限制,可依据实际应用场景进行具体设置。
50.在一些实施例中,数据模板中还指示有目标系数的系数值存储地址和约束系数的系数值存储地址。可以理解的是,不同的目标对象对不同的资源有不同的系数值。因此数据模板中并未记录具体的系数值,而是指示有系数值的存储地址。如此,通过调用数据模板,可以根据数据模板指示的系数值存储地址逐一读取目标对象对每个资源的系数值。如此,上述步骤120系数值的读取过程可以包括从目标系数的系数值存储地址中读取在线分配任务中每个资源的目标系数的系数值;以及,从约束系数的系数值存储地址中读取在线分配任务中每个资源对应的约束系数的系数值。
51.在一些实施例中,上述系数值的存储地址,包括目标系数的系数值存储地址以及约束系数的系数值存储地址,可以从上述用户输入的输入信息中获取。用户输入的输入信息中可以携带有系数值的存储地址。如此,数据模板可以从输入信息中提取目标系数、约束系数、目标系数的系数值存储地址、以及约束系数的系数值存储地址。作为例子,系数值可以以表格形式存储在数据源中;其中,数据源可以包括但不限于odps(open data processing service,开放数据处理服务)数据库,mysql(关系型数据库管理系统)数据库等。如此,用户输入的输入信息可以携带系数值所在表格在数据源中存储位置,以及系数值在表格中的位置信息。其中,在计算机处理输入信息时,为了让计算机识别到存储位置,在一些实施例中,输入信息可以携带数据源标识和系数值的存储位置。数据源标识用于表示参数从数据源中确定,数据源标识可以是预先定义好的标识,当计算机识别到数据源标识时,表示跟随在数据源标识后的字符串为系数值的存储位置。在一些实施例中,数据源标识可以包括起始标识和参数输入标识。参数输入标识用于表示参数的输入操作。作为例子,参数输入标识可以包括但不限于“input”。当然,起始标识与参数标识并不限于上述举例,还可以是形式的标识,本技术在此不做限制。在本实施例中,数据源标识可以是“@input”。
52.在上述任一实施例中,用户可以输入用于描述原始模型的输入信息。随后,数据模板可以从输入信息中离线提取到目标系数、约束系数以及这两个系数的系数值存储地址。
此外,根据输入信息还可以离线建立分配任务的原始模型。基于原始模型可以离线确定出对偶系数。可以理解的是,所谓离线,即在执行在线分配任务前预先执行的操作步骤。其中,对偶系数的确定过程可以包括如图3所示的步骤:步骤310:基于所述原始模型的决策变量、优化目标和约束条件、引入的对偶变量、以及若干历史分配任务对应的历史数据集合,构建无约束的目标优化模型;步骤320:利用梯度下降法求解所述目标优化模型,或者利用交替方向乘子法迭代求解所述目标优化模型,直到最后一轮迭代的约束误差满足预设误差;步骤330:确定得到的所述对偶变量的解作为所述对偶系数的系数值。
53.具体地,基于原始模型的决策变量、优化目标和约束条件、以及引入的对偶变量,可以将原始模型转化为无约束的目标优化模型。其中,无约束的目标优化模型的优化目标与原始模型的优化目标一致。引入的对偶变量可以将约束条件耦合到原始模型,从而获取无约束的目标优化模型。作为例子,目标优化模型可以是拉格朗日函数或者增广拉格朗日模型。
54.若干历史分配任务对应的历史数据集合可以包括若干历史分配任务的决策变量对应的目标系数矩阵、约束系数矩阵和约束向量矩阵。其中,目标系数矩阵为n
×
1维矩阵,n为若干历史分配任务中包括的决策变量的数量;约束系数矩阵为m
×
n维的矩阵,m为约束条件的数量,n为若干历史分配任务中包括的决策变量的数量;所述约束向量矩阵为m
×
1维矩阵,m为约束条件的数量,其中,m,n均为大于0的整数。
55.在一些实施例中,为了进一步提高在线分配任务的处理准确性,考虑到目标对象的分布类型的差异性,针对不同分布类型可以有相应的历史数据集合。即针对不同目标对象类型,可以有不同的历史数据集合。如此,针对于所述目标对象所属类型不同的多个历史数据集合,可以分别构建无约束的目标优化模型以及分别求解目标优化模型,从而获取不同类型的目标对象分别对应的对偶系数。由于不同类型的目标对象分别对应有对偶系数,可以预存不同类型的目标对象与对偶系数的映射关系。在执行在线分配任务中,可以根据在线分配任务的目标对象所属类型从所述映射关系中确定对应的目标对偶系数,以便使用目标对偶系数实时处理该在线分配任务,实现提高在线分配任务的处理准确性。
56.如在上述金融贷款场景中,假设引入的对偶变量为λ,针对于原始模型的优化目标 ,以及约束条件 ;则基于原始模型的决策变量、优化目标和约束条件、以及引入的对偶变量,可以将原始模型转化为无约束的目标优化模型: 。该目标优化模型需要求解的变量包括所述历史分配任务的决策变量和引入的对偶变量。
57.在一些实施例中,可以利用历史数据集合通过梯度下降法求解该目标优化模型,得到对偶变量的取值。
58.在另一些实施例中,可以使用交替方向乘子法(alternating direction method of multipliers,admm)迭代求解所述目标优化模型,直到最后一轮迭代的约束误差满足预设误差。作为例子,可以利用交替方向乘子法将该目标优化模型分解为多个并行的子模型,并对多个所述子模型进行迭代优化直到最后一轮迭代的约束误差满足预设误差;其中,不
同的子模型用于求解所述目标优化模型中的不同变量;所述目标模型中的变量包括决策变量和对偶变量。本实施例使用admm算法将目标优化模型分解成多个并行的子模型来求解,可以加快目标优化模型的求解速度,并且其迭代求解方式可以在约束误差满足预设误差的情况下即可停止迭代,不要求约严格约束,则即使在分配任务的原始优化模型无可行解的情况下也可以在误差允许范围内求解得到每个约束条件对应的对偶变量。
59.最后,确定得到的所述对偶变量的解作为对偶系数,用于在线分配任务的实时决策,从而保证在线任务的决策过程能够稳定进行。
60.在一些实施例中,约束条件包括两种,如上述的金融贷款场景中,第一种约束条件是对每个j有个总和约束,即银行有风险金额上限控制,表示为 ;第二种约束条件是对所有i,j的全局约束,表示为 。对于每一种约束条件,可以有相应的对偶变量,以及求解出相应的对偶系数的系数值。
61.在一些实施例中,在构建目标优化模型时,还可以添加一个惩罚项,比如,可以构建一个包括对角矩阵的二次项,该对角矩阵包括有惩罚变量,然后基于添加有对偶变量的约束项、决策项以及该二次项(惩罚项)构建目标优化模型,比如,可以将上述项求和得到该目标优化模型。
62.在本实施例中,根据输入信息可以离线建立分配任务的原始模型。基于该原始模型,可以离线建立和求解目标优化模型,从而离线获得对偶系数的系数值。进一步地,数据模板可以提取该系数值。如此,数据模板中指示有目标系数及其系数值的存储地址、约束系数及其系数值的存储地址、以及对偶系数及其系数值。由于离线建立有数据模板,而数据模板中指示有处理分配任务所需的系数、系数值以及其存储地址。因此当接收到在线分配任务的处理请求时,可以通过调用数据模板来读取到每个资源对应的系数值,从而无需人工导出各个系数的系数值。
63.在一些实施例中,评估规则是基于原始模型对应的对偶模型离线建立的。作为例子,可以基于原始模型的决策变量、优化目标、约束条件以及离线获得的对偶系数,建立原始模型的对偶模型,然后基于对偶模型,可以确定评估规则。作为例子,可以根据对偶模型中对偶系数、目标系数以及约束系数之间的运算关系,以及对偶系数的系数值,确定资源的评估规则。
64.如在上述金融贷款场景中,针对于原始模型的优化目标 ,第一种约束条件,以及第二种约束条件 ;基于原始模型的决策变量、优化目标、约束条件、以及离线获得的对偶系数λk,可以建立原始模型的对偶模型 。将离线求解的对偶系数λk代入后,针对每个决策变量x
ij
,有 。对于每个用户,选择的j为 。如此,评估规则可以是计
算每个资源对应的评估分数,而评估分数的计算公式可以基于对偶模型获取,即。当然,评估规则除了可以是计算每个资源的评估分数以外,还可以包括其他形式的评估规则。本技术在此不做限制。
65.在一些实施例中,资源的评估过程实现功能可以集成软件开发工具包(software development kit,sdk)。其中,对于java版本,集成的sdk为jar包;对于python版本,集成的sdk为whl包。响应于在线分配任务的处理请求,可以通过该sdk调用内部的实现逻辑,来完成资源的评估过程,最终输出目标资源。其中,sdk内部的实现逻辑可以包括调用离线建立的数据模板,基于数据模板读取每个资源对应的系数值;然后基于离线确定的评估规则和所获取的系数值,确定每个资源的评估结果;最后基于评估结果确定目标资源。
66.在本实施例中,根据用户输入的输入信息,数据模板可以离线提取到目标系数、约束系数以及这两个系数的系数值存储地址。此外,根据输入信息还可以离线建立分配任务的原始模型。基于该原始模型,可以离线建立和求解目标优化模型,从而离线获得对偶系数的系数值。进一步地,数据模板可以提取该系数值。如此,数据模板中指示有目标系数及其系数值的存储地址、约束系数及其系数值的存储地址、以及对偶系数及其系数值。由于离线建立有数据模板,而数据模板中指示有处理分配任务所需的系数、系数值以及其存储地址。同时,基于原始模型,还可以离线推导出相应的对偶模型,基于求解的对偶系数,可以从对偶模型中离线得到评估规则。如此,在离线阶段,本实施例获取到数据模板和评估规则。当接收到在线分配任务的处理请求时,可以通过调用数据模板来获取每个资源对应的系数值,以及根据预先确定的评估规则对每个资源进行评估,最终根据评估结果确定出目标资源。
67.在上述过程中,一方面,整个过程只需用户输入用于描述原始模型的信息,各个系数的导出以及对偶模型的推导均由计算机离线执行,因此实现了在线分配任务的自动决策。另一方面,针对于在线分配任务,根据预设的数据模板可以快速获取每个资源的系数值,以及可以根据预先确定的评估规则快速确定每个资源的评估结果,从而可以实时获取在线分配任务的决策结果,提高了在线分配任务的决策效率。
68.基于上述任意实施例所述的一种资源分配方法,本说明书实施例还提供了如图4所示的一种电子设备的结构示意图。如图4,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述任意实施例所述的一种资源分配方法。
69.基于上述任意实施例所述的一种资源分配方法,本说明书实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可用于执行上述任意实施例所述的一种资源分配方法。
70.基于上述任意实施例所述的一种资源分配方法,本说明书实施例还提供了一种计算机存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时可用于执行上述任意实施例所述的一种资源分配方法。
71.上述对本说明书实施例特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺
序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
72.本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本说明书实施例的其它实施方案。本说明书实施例旨在涵盖本说明书实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书实施例的一般性原理并包括本说明书实施例未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书实施例的真正范围和精神由下面的权利要求指出。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献