一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于混合增点与区间缩减的代理模型全局优化方法与流程

2022-07-10 06:47:58 来源:中国专利 TAG:


1.本发明属于飞行器设计中的多学科设计优化技术领域,具体涉及一种基于混合增点与区间缩减的代理模型全局优化方法。


背景技术:

2.飞行器多学科设计优化,涉及气动分析、结构分析、弹道计算等多个学科,优化问题具有多峰性和耗时性特征。优化过程中,采用基于梯度的经典优化算法难以找到全局最优解,而具有全局寻优能力的现代智能启发式算法(如遗传算法、粒子群算法等)由于需要大量的函数评估,在对耗时模型优化时又面临计算量巨大的问题。为了平衡优化过程中全局性与计算量的矛盾,基于代理模型的优化算法(surrogate-based optimization,sbo)应运而生。当前代理模型在优化问题中的应用主要是通过试验设计获取一组数量较少的初始样本点集,然后分析当前样本点集分布特征和代理模型特征,根据一定策略增加新的样本点并更新代理模型,重复这一序贯增点和更新代理模型的步骤,直至满足终止条件(如满足给定精度或达到最大计算次数)。这类方法可以在训练样本点与代理模型精度之间进行合理权衡,并在一定的序贯增点策略条件下实现以较小代价构造满足精度要求的代理模型。
3.基于代理模型的优化算法主要采用代理模型代替原模型进行优化,只需要提高代理模型在全局最优点附近区域的局部近似精度,因此需要对近似模型潜在最优区域进行重点抽样。由于代理模型能够并行增点计算快速,因此能够避免直接优化中计算量和全局搜索的矛盾。这类算法目前主要研究点在于如何进一步加快算法收敛速度并保证算法的全局搜索能力和对不同问题的适应性。现有方法主要是采取某一种能够平衡局部与全局探索的增点方式对代理模型进行更新,也有部分学者采用不同准则并行增点的方式更新代理模型,而鲜有在计算资源有限条件下通过串行混合增点的方式。关于串行混合增点方法及其特性进行研究对进一步提高耗时模型的优化效率具有重要意义。
4.因此,现阶段需设计一种基于混合增点与区间缩减的代理模型全局优化方法,来解决以上问题。


技术实现要素:

5.本发明目的在于提供一种基于混合增点与区间缩减的代理模型全局优化方法,用于解决上述现有技术中存在的技术问题,现有方法主要是采取某一种能够平衡局部与全局探索的增点方式对代理模型进行更新,也有部分学者采用不同准则并行增点的方式更新代理模型,而鲜有在计算资源有限条件下通过串行混合增点的方式。
6.为实现上述目的,本发明的技术方案是:
7.一种基于混合增点与区间缩减的代理模型全局优化方法,包括以下步骤:
8.步骤1:确定初始样本点集合s0;
9.步骤2:利用初始样本集s0分别建立目标和约束函数的初始代理模型和
10.步骤3:获取初始最优点;
11.步骤4:通过混合增点准则和区间缩减策略,寻找新的样本点xk;
12.步骤5:利用找到的样本点位置xk计算新增点的目标和约束函数值,并更新样本点集合;
13.步骤6:利用更新后的样本集合更新代理模型;
14.步骤7:在当前最优点集合中寻找最优点,并更新当前最优点;
15.步骤8:判断是否到达最大计算次数,如果达到则执行步骤9,否则返回步骤4;
16.步骤9:算法结束。
17.进一步的,步骤1中,采用拉丁超立方抽样方法确定初始样本集合s0,其中样本数量与样本维度的关系为|s0|=2dim(x) 1。
18.进一步的,步骤2中,采用的代理模型为交叉验证优化超参数后的径向基函数;采用下式进行超参数优化:
[0019][0020]
式中,n为样本点数量,xi为第i样本点输入值,yi为第i个样本点输出值,s为样本集合,c为超参数,为rbf代理模型。
[0021]
进一步的,步骤3中,在当前样本点中选择满足约束的最优值作为当前最优点,如果没有满足约束条件的样本点,选择目标函数最小的点作为初始最优点。
[0022]
进一步的,步骤4中,采用三种不同的代理模型增点准则,分别为:面向全局优化的最小化准则、面向全局精度的均匀化准则、加速局部收敛的区间缩减优化准则,具体包括:
[0023]
面向全局搜索的准则,通过优化寻找潜在全局最优点:
[0024][0025]
式中,xk为第k次迭代增加的样本点,为目标函数,为约束函数,s
k-1
为当前样本集合;
[0026]
面向全局精度的均匀化准则,通过优化寻找可提高代理模型全局精度的样本点:
[0027][0028]
式中,d为优化点x到s
k-1
中各样本点最小距离的函数;
[0029]
面向局部搜索的准则,通过区间缩减和梯度优化算法寻找提高局部收敛精度的样本点:
[0030][0031]
式中,t
k-1
为重要区域样本集合,为当前样本集合s
k-1
的子集,由距离当前最优点最近的p个样本点构成;p越大重要区域越大,算法收敛越慢,越不容易陷入局部最优;p越小,算法收敛越快,但容易引起算法过早收敛。
[0032]
进一步的,步骤5中,利用找到的样本点位置xk计算新增点的目标和约束函数值,并采用如下关系sk=s
k-1
∪{(xk,j(xk),g(xk))}更新样本点集合。
[0033]
进一步的,步骤6中,利用更新后的样本集合重新构造目标和约束函数的代理模型,并通过交叉验证对代理模型的超参数进行优化。
[0034]
进一步的,步骤7中,更新当前最优点;在样本集合中寻找满足约束条件且目标函数值最小的点作为当前最优点,并选择最邻近的p个样本点构成的区域作为新的最优区域。
[0035]
进一步的,步骤8中,采用最大增点次数作为算法的终止条件。
[0036]
一种计算机存储介质,所述存储介质上存储有计算机程序,所述计算机程序被运行时执行如上述的一种基于混合增点与区间缩减的代理模型全局优化方法。
[0037]
与现有技术相比,本发明所具有的有益效果为:
[0038]
本方案其中一个有益效果在于,本发明方法通过三种不同特性准则的混合,可保证对包含全局最优点的区域进行充分探索,并避免寻优过程陷入局部最优点,从而兼顾全局搜索能力、局部搜索速度,减少优化过程中耗时仿真模型的评估次数,提升找到全局最优解的概率和效率。
附图说明
[0039]
图1为本技术一个实施例的序贯代理模型优化算法流程图。
[0040]
图2为本技术一个实施例的二维问题当前最优目标及约束函数的迭代过程示意图。
[0041]
图3为本技术一个实施例的二维问题代理模型更新迭代过程示意图。
[0042]
其中,图2中的虚线为真实约束函数g1(x)=0、g2(x)=0和g3(x)=0的等高线;深色区域分别代表约束函数的代理模型和所确定的不可行区域;符号

、分别代表初始和增加的样本点;曲线族代表目标函数的代理模型的等高线;线框代表包含当前最优点的区间缩减区域。
具体实施方式
[0043]
下面结合本发明的附图1-附图3,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
基于代理模型的优化算法主要采用代理模型代替原模型进行优化,只需要提高代
理模型在全局最优点附近区域的局部近似精度,因此需要对近似模型潜在最优区域进行重点抽样。由于代理模型能够并行增点计算快速,因此能够避免直接优化中计算量和全局搜索的矛盾。这类算法目前主要研究点在于如何进一步加快算法收敛速度并保证算法的全局搜索能力和对不同问题的适应性。现有方法主要是采取某一种能够平衡局部与全局探索的增点方式对代理模型进行更新,也有部分学者采用不同准则并行增点的方式更新代理模型,而鲜有在计算资源有限条件下通过串行混合增点的方式。
[0045]
如图1所示,提出一种基于混合增点与区间缩减的代理模型全局优化方法。混合增点准则能够有效针对无约束和约束优化问题进行增点,其中面向全局搜索的准则,通过全局优化算法求解代理模型最优解,寻找潜在全局最优点;面向全局精度的均匀化准则,在样本稀疏的地方增点,保证样本点的均匀性,使得代理模型能有效捕获包含全局最优点的区域信息;面向局部搜索的准则,将优化区间缩减为包含一定数量样本点的超立方区域,并通过该子空间的样本点构建局部代理模型,采用梯度优化算法寻优,从而增加算法的局部搜索能力。算法主要步骤为增加样本点的迭代过程,详细步骤如下:
[0046]
步骤1:确定初始样本点集合s0。与牛顿迭代初值化单点值不同,这里初始化选择多点样本集合。由于模型信息完全未知,越均匀越好,故采用优化拉丁方抽样(latin hypercube sampling,lhs)。初始样本的数目与模型复杂程度相关,模型越复杂则初始样本点数目应该越多。一般情况下,初始样本点越多,算法越稳定,全局搜索能力越强,但是初始计算量也越大;样本点较少时,初始代理模型很难捕获到包含全局最优点的区域,后续为了改善代理模型全局精度不得在迭代过程中增加更多的点。因此,选择一个合理的初始样本点数量对算法全局收敛性和收敛速度都有一定影响。然而实际应用中,模型复杂度通常未知,且没有统一的量化方法,对于初始样本数量的选择也没有统一的原则,一般根据具体问题的维度、计算资源和设计者经验选择。这里选取初始样本数为|s0|=2dim(x) 1。
[0047]
步骤2:利用初始样本集s0分别建立目标和约束函数的初始代理模型和由于径向基函数具有较强的插值能力、全局精度和非线性适应能力且参数优化相对简单,因此这里选择rbf作为代理模型,并利用交叉验证方法优化模型参数。值得注意的是,由于算法要求较高的局部精度,因此这里只能采用经过样本点的插值型代理模型,不能采用不严格经过样本点的回归型代理模型,采用rbf模型:
[0048][0049]
式中,为x点的预测响应,βi是径向基系数向量β的第i个分量,f(||x-xi||||c)=(1 c||x-xi||2)-1/2
是径向基函数向量f(x|c)的第i个分量。r=||x-xi||是两个样本之间的欧几里得距离,c是超参数。将样本点代入式(1)得
[0050][0051]
假设y=[y1,y2,

,yn]
t
,f=[f(r
ij
)]n×n,β=[β1,β2,

,βn]
t
,则预测点x的代理模型预测值为:
[0052][0053]
式中,f(x|c)与预测点x和样本输入矩阵x=[x1,x2,

,xn]
t
有关,f-1
y只与x和y相关。对于新的预测样本,计算一次f(x|c)就能获得其预测值应指出的是,对模型精度有很大影响的超参数c包含在f中,由经验或其他优化标准确定。由于这里处理的是耗时仿真问题,训练样本的数量很少,这说明没有额外的样本用于模型验证。这里通过优化交叉验证误差来获得超参数c:
[0054][0055]
步骤3:获取初始最优点。在当前样本点中选择满足约束的最优值作为当前最优点。这里也相当于直接在样本集合中通过穷举的方式进行寻优。如果没有满足约束条件的样本点,选择目标函数最小的点作为初始最优点。
[0056]
步骤4:通过优化准则,寻找新的样本点。寻找新的点主要是为了获得近似的全局最优点,并通过迭代逼近真实的全局最优点。由于真实模型是未知的,代理模型在样本点稀疏的地方具有较大不确定性,如果一味在代理模型的全局最优点处增点可能让算法过早收敛到局部最优点,因此需要引入探索机制保证算法的全局收敛性,这样就需要满足多个目标的增点准则,这里采用混合增点准则来实现这一目的:
[0057]
准则1:面向全局优化的最小化准则。该准则的侧重点在于寻找全局最优点。由于代理模型在迭代初期全局精度较差,一般不可能一开始就精确捕获到全局最优解,随着样本点增加才能逐渐捕获到可能的全局最优区域,该过程可表述为如下优化问题:
[0058][0059]
该优化问题直接对基于目标和约束函数构建的代理模型进行优化,采用全局优化算法(遗传算法、模拟退火算法等)进行全局寻优。然而,如果初始代理模型不具有捕获全局最优点大致位置的能力,即使是对代理模型采用全局优化算法也无法获得真实函数的全局最优解,仅能保证算法收敛到局部最优解。
[0060]
准则2:面向全局精度的均匀化准则。该准则侧重于提高代理模型的全局精度,为了达到这个目的,算法在全局精度最差的地方增加样本点。由于代理模型的精度与样本的稀疏程度密切相关,这里假设样本点最稀疏的地方代理模型精度最差。一般样本越稀疏其最近点距离越大,样本越密集其最近点距离越小。因此增加代理模型全局精度的优化准则可以表示为:
[0061][0062]
该准则的目标函数是多峰函数,存在局部最优解众多,常规梯度优化算法很难直接求得最优解,有时候甚至难以求得可行解;遗传算法虽然理论上能够找到全局最优解,但是实践表明求解这类问题时其表现并不令人满意,为此可通过蒙特卡罗方法随机生成一个样本集,再用穷举的方式获得样本集中满足优化准则的最优点。该增点过程不依赖于代理
模型,仅依赖于输入样本相互之间的距离,在离现有样本距离最远(最稀疏)的地方增加新的点,从而保证增点具有均匀化的趋势,当增点准则1利用当前代理模型不能够找到更优的解时,增点准则2保持对可能包含全局最优点的区域进行充分探索,从而避免寻优过程陷入局部最优点。
[0063]
准则3:加速局部收敛的区间缩减准则。该准则主要目的是提高算法局部搜索效率。当代理模型较复杂时,全局优化算法并不能很好地增加局部搜索能力,得到的优化解在局部区域波动较大,使得在局部搜索中收敛缓慢。此时需要在一定区域内采用局部搜索精度较高的梯度优化算法。可以通过序列二次规划方法求解如下优化问题:
[0064][0065]
该准则构建的代理模型没有采用所有样本点,而是采用当前最优点附近重要区域的点构建代理模型,同时,优化的区间也在该重要区域中进行。由于在局部区域建立的代理模型精度较高,以当前最优点作为算法初值,采用具有较好收敛精度的sqp算法进行寻优,即可有效加速寻优效率。局部收敛准则只能加快算法在局部区域的收敛精度,加快算法的收敛,仍然需要结合准则2提高代理模型的全局精度才能够找到真正的全局最优解。
[0066]
步骤5:利用找到的样本点位置xk计算新增点的目标和约束函数值,并更新样本点集合:
[0067]
sk=s
k-1
∪{(xk,j(xk),g(xk))}
ꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0068]
步骤6:更新代理模型。利用更新后的样本集合重新构造目标和约束函数的代理模型,并通过交叉验证对代理模型的超参数进行优化。这一步与构建初始代理模型类似,不同之处在于用到的样本集合发生了改变。
[0069]
步骤7:更新当前最优点。在样本集合中寻找满足约束条件且目标函数值最小的点作为当前最优点,并选择最邻近的p个样本点构成的区域作为新的最优区域。
[0070]
t
k-1
={(x(i),j(x(i)),g(x(i)))|1≤i≤p}
ꢀꢀꢀꢀꢀꢀꢀ
(9)
[0071]
步骤8:判断是否到达最大计算次数,如果达到则执行步骤9,否则返回步骤4。由于这类算法相邻两次甚至多次的最优点并无任何变化,因此不能通过相邻函数值的比较来判断算法的收敛性,这里通过最大增点次数对算法进行终止。
[0072]
步骤9:算法结束。
[0073]
综上所述,为了提高耗时仿真模型的全局搜索能力及局部搜索效率,本方案提出一种基于代理模型的序贯优化算法(sequential surrogate-based optimization,ssbo)。该算法包含三个基本的代理模型增点准则以平衡全局和局部搜索。首先,为了保证算法全局搜索能力,利用全局优化算法寻找当前代理模型的全局最优点。但是该准则能够找到全局最优点的前提是代理模型能够捕获到包含全局最优点的区域,如果初始集合选择不恰当,开始找到的优化点就离全局最优点较远,虽然算法仍会收敛,但是容易收敛到局部最优点,原因在于代理模型获取的模型信息有限,如果实际模型复杂度超过了代理模型描述的复杂度,离样本点较远的地方的估计值误差较大,通过代理模型获取的最优点信息不能够反映复杂模型的真实全局最优特性。其次,为了增加代理模型的全局精度,采用均匀性增点准则在样本稀疏的地方进行加密,随着样本点的增加,理论上当样本点达到一定数量,样本
点密度足够,总会有点落入包含全局最优点的区域。最后,为了加快算法局部收敛效率,避免全局优化算法局部收敛精度不高导致的在最优点附近局部区域收敛缓慢的问题,在可能包含全局最优解的区域构建局部代理模型,并采用局部搜索能力较强的梯度优化算法寻优。基于以上三个准则,增加的样本点位于尚未被充分搜索并且包含潜在最优点的区域。当潜在的最优点被锁定,局部搜索准则就能够迅速在其周围找到局部最优点。数值及工程算例的统计结果表明,本文提出的算法具有良好的全局搜索能力和搜索效率。
[0074]
实施案例具体分析:
[0075]
结合附图2和3对本发明的内容作进一步的描述。
[0076]
实施例为包含2个优化变量,3个不等式约束的确定性优化问题,问题描述如下:
[0077][0078]
步骤1:确定初始样本点集合s0。本例包含两个优化变量,取初始样本点数s0=2dim(x) 1=5,采用拉丁超立方抽样方法确定初始样本点集合,见图2a)。
[0079]
步骤2:利用初始样本集s0和rbf代理模型式(3)~(4)建立目标和约束函数的初始代理模型和
[0080]
步骤3:获取初始最优点。选择初始样本集合s0中的目标函数值最小的样本点作为初始最优点。
[0081]
步骤4:通过混合增点准则和区间缩减策略,寻找新的样本点。根据迭代次数k选择增点的优化准则:当k≡1(mod 3)时,选用准则1即式(5)增点;当k≡2(mod 3)时,选用准则2即式(6)增点;当k≡3(mod 3)时,选用准则3即式(7)增点。
[0082]
步骤5:利用找到的样本点位置xk计算新增点的目标和约束函数值,利用式(8)并更新样本点集合。
[0083]
步骤6:更新代理模型。利用当前样本集sk和rbf代理模型式(3)~(4)建立目标和约束函数的初始代理模型和见图2b)~2h)。
[0084]
步骤7:更新当前最优点。选择当前样本集合sk中的目标函数值最小且满足约束的样本点作为当前最优点,并利用式(9)跟新当前最优区域,见图2b)~2h)。
[0085]
步骤8:判断是否到达最大迭代次数,如果达到则执行步骤9,否则返回步骤4。本例中最大迭代次数为20。
[0086]
步骤9:算法结束。
[0087]
图2展示了随着迭代的进行当前最优点目标和约束函数的变化。可以看出迭代开始目标函数下降较快,在经过约12次迭代后收敛。约束函数和收敛时达到0边界,为主动约束;而约束函数没有达到0边界,为非主动约束。
[0088]
图3给出了代理模型的迭代更新过程。可以看出,迭代开始时由于样本点较少,代
理模型误差较大;随着迭代的进行,包含最优点的区域样本点逐渐增加,通过区间缩减逐渐加速收敛到实际最优点。在最优点附近的主动约束和由于样本点较多,所以精度较高;同时在远离最优区域的非主动约束函数由于样本点较少而在边界线上精度较差。由于非主动约束离最优点较远,较差的精度并不会影响到最优点的搜索,因此使得该算法能够有效减少非最优区域的样本评估,从而提高搜索效率。
[0089]
表1展示了不同算法的优化统计结果。由于问题只有一个局部最优点,因此各种算法均能够收敛到全局最优点。但是由于初始样本不同,需要的函数评估次数差别较大。本文方法该问题中用16次平均函数评估次数收敛到了最优点,收敛方差较小,函数评估次数最少,兼顾了收敛速度和收敛精度,验证了算法的有效性和精度。
[0090]
表1二维问题不同方法计算结果对比(50次平均值)
[0091][0092]
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献