一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图卷积神经网络的移动应急电源车优化调度方法与流程

2022-11-12 22:32:54 来源:中国专利 TAG:


1.本发明属于应急资源调度技术领域,具体涉及一种基于图卷积神经网络的移动应急电源车优化调度方法。


背景技术:

2.由于自然灾害所引发的配电网电力负荷中断很难避免,因此配电网的灾后应急响应能力十分重要。移动应急电源车因其移动灵活且环境适应能力强,用作区域性支援时可以为快速恢复供电、降低事故影响提供支撑。然而,移动应急电源车容量和数量均有限,如何合理分配应急资源,快速制定合理的调度方案,对保障用户电力供应的及时恢复和电网整体安全的提升具有十分重要的意义;近年来,部分研究者针对故障发生后移动应急电源车调配方法进行了研究,针对问题规模较大这一点,利用各种启发式算法对优化问题进行求解,禁忌搜索法、局部搜索法、变邻域搜索法和一些进化算法可以在可接受的时间内获得足够好的解,在运行时间上有着显著优势,但这类算法求出的解通常只有局部最优,并不能证明得到的解为全局最优解。
3.深度学习以多种方式被应用于移动应急电源车的优化调度中,为该问题带来了源源不绝的生机与活力,其中,基于图卷积神经网络的混合整数线性规划问题的求解算法可以有效加快问题的求解速度,因此更适用于移动应急电源车优化调度问题在实际中的应用。


技术实现要素:

4.本发明的主要目的在于克服现有技术的缺点与不足,提出一种基于图卷积神经网络的移动应急电源车优化调度方法。
5.为了达到上述目的,本发明采用以下技术方案:
6.基于图卷积神经网络的移动应急电源车优化调度方法,包括以下步骤:
7.s1、建立以停电后总停电损失费用最小且迟到惩罚最小为目标的调度优化目标函数;
8.s2、基于调度优化目标函数,考虑冗余容量约束、缺电台区供应约束、可达约束以及供应容量约束四个约束,构建移动应急电源车优化调度模型;
9.s3、对建立的移动应急电源车优化调度模型进行线性化处理,得到混合整数线性规划问题;
10.s4、使用分支定界法构建移动应急电源车优化调度模型的求解框架;
11.s5、利用强化学习构建基于图卷积神经网络的分支变量选择策略,对移动应急电源车优化调度模型的求解框架进行改进;
12.s6、使用改进后的移动应急电源车优化调度模型的求解框架对灾后移动应急电源车优化调度问题进行求解,得到最优调度方案。
13.进一步的,步骤s1中,以停电后总停电损失费用最小为目标表示为:
14.minf1=f
11-f
12
[0015][0016][0017]
其中,k∈k代表移动应急电源车;j∈j={1,2,

,n}代表缺电台区;i∈d={n 1,n 2,

,n m}代表供应点,即一共有m个供应点;l,i,j∈l=j∪d={1,2,

,n m}表示移动应急电源车所有可以到达的位置,包括所有的供应点以及所有的缺电台区;t

表示从停电开始到该城市的移动应急电源接到调度指令发车所需的时间;t
i,j
∈r

表示从位置i∈l到位置j∈j的行驶时间;表示移动应急电源车的接入时间;pk表示移动应急电源车k∈k的可供应容量;y
i,j,k
∈{0,1}为决策变量,如果移动应急电源车k∈k从位置i∈l被调度到了位置j∈j,则该项取值为1,否则取值为0;cj(
·
)表示缺电台区j∈j的分段单位停电损失函数;cj(t)表示该台区停电时间到达t分钟时的停电损失/元
·
kw-1
;tj表示缺电台区j∈j的最长停电时间,dj表示缺电台区j∈j的缺电功率;
[0018]
的具体取值如下:
[0019][0020]
进一步的,步骤s1中,以迟到惩罚最小为目标表示为:
[0021][0022]
其中,πj∈{1,2,3,4,5}表示缺电台区j∈j的优先级权重,πj对应的数字越大,该台区的供电优先级越高;m1∈n是一个极大值;zj≥0表示缺电台区j∈j的迟到量,zj=max{0,t

t
j-bj};bj∈r

为缺电台区j∈j供电的最晚到达时间,对缺电台区来说是该台区用户可容忍的最长停电时间。
[0023]
进一步的,以停电后总停电损失费用最小且迟到惩罚最小为目标的调度优化目标函数表示为:
[0024]
minf=w1·
f1 w2·
f2[0025]
其中,w1和w2均为权重系数,w1=w2=1。
[0026]
进一步的,步骤s2中,考虑冗余容量约束、缺电台区供应约束、可达约束以及供应容量约束四个约束表示为:
[0027]
冗余容量约束,理想情况下,移动应急电源车供应给一个台区的总容量应该恰好可以满足该台区的需求,且存在一定的冗余;
[0028]
假设调度来的移动应急电源车少任意一个的时候该台区的需求都无法得到满足,即小于该台区的缺电功率,将供应容量约束加入约束条件中:
[0029][0030]
其中,x
j,k
∈{0,1}为决策变量,如果缺电台区j∈j被分配给了移动应急电源车k∈k供电,则该变量取值为1,否则取值为0;
[0031]
缺电台区供应约束,针对每一个缺电台区,至少分配一个可以供应的移动应急电源车给这个台区,否则要声明该台区的需求没有得到满足:
[0032][0033]
其中,k(j)表示可以用于给缺电用户j∈j供电的移动应急电源车子集;gj为决策变量,当缺电用户j∈j无法恢复电力供应时,该变量为1,否则为0;
[0034]
可达约束,针对每个移动应急电源车和每一个缺电台区,如果移动应急电源车接到任务要为这个缺电台区供电,则该应急车一定存在上一个可达地点:
[0035][0036]
供应容量约束,移动应急电源车所供应的移动应急电源容量之和应满足该缺电台区的缺电功率:
[0037][0038]
综合以上四个约束,构建移动应急电源车优化调度模型:
[0039][0040]
其中,i,j∈l={1,2,

,n m},k∈k={1,2,

,k}。
[0041]
进一步的,步骤s3中,进行线性化处理具体包括对最大值函数线性化和对二次项线性化;
[0042]
对最大值函数线性化:
[0043]
移动应急电源车优化调度模型中,存在非线性函数:
[0044][0045]
对该式进行线性化处理,引入0-1辅助变量b
i,j
以及w
p,i,j
进行处理,其中w
p,i,j
的取值如下式所示:
[0046][0047]
与非线性函数tj等价的线性化处理结果如下:
[0048][0049]
添加以下约束,完成最大值函数线性化:
[0050][0051]
其中,b
i,j
表示供应点i是否是最后一辆到达缺电台区j的移动应急电源车的起始位置;w
p,i,j
是一个行驶时间的比较量;m2∈n是一个极大值。
[0052]
进一步的,对二次项线性化具体为:
[0053]
完成最大值函数线性化后,将调度优化目标函数式转化为下式:
[0054][0055]
其中,b
i,j
与y
i,j,k
均为决策变量;该目标函数存在二次项,考虑到二者均为0-1决策变量,因此引入辅助变量r
i,j,k
=x
j,k
·bi,j
对其进行线性化转换并引入以下约束条件,得:
[0056][0057]
引入辅助变量t
j,k,s
=x
j,k
·
x
j,s
,则得:
[0058][0059]
进一步的,步骤s4中,基于scip开源求解器,使用分支定界法进行移动应急电源车优化调度模型的求解框架的构建,具体为:
[0060]
分支定界法首先将要求解的整数规划最小化问题设为问题将与它相应的线性规划问题设为问题
[0061]
求解问题可能得到以下情况之一:
[0062]
没有可行解,这时也没有可行解,则停止;
[0063]
有最优解,并符合问题的整数条件,b的最优解即为的最优解,则停止;
[0064]
有最优解,但不符合问题的整数条件,记它的目标函数值为z
lower

[0065]
用观察法找问题的一个整数可行解,求得其目标函数值,并记作z
upper
;以z
*
表示
问题的最优目标函数值,此时z
lower
≤z
*
≤z
upper
,进行迭代:
[0066]
分支,在的最优解中任选一个不符合整数条件的变量sj,其值为pj,以[pj]表示小于pj的最大整数,构造两个约束条件:
[0067]
sj≤[pj]和sj≥[pj] 1
[0068]
将这两个约束条件分别加入问题得到两个后继规划问题和不考虑整数条件求解这两个后继问题;
[0069]
定界,以每个后继问题为一分枝标明求解的结果,与其它问题的解的结果中,找出最优目标函数值最小者作为新的下界z
lower
;从已符合整数条件的各分支中,找出目标函数值为最小者作为新的上界z
upper
,若无作用z
upper
不变;
[0070]
比较与剪枝,各分枝的最优目标函数中若有大于z
upper
者,则剪掉该枝,此后不再考虑,若小于z
upper
,且不符合整数条件,则重复步骤分支与定界,直到最后得到z
*
=z
upper
为止,得最优整数解。
[0071]
进一步的,步骤s5具体为:
[0072]
将步骤s3中构建出的混合整数线性规划问题转化为二部图的表示形式,使用变量特征、约束特征以及边的特征作为输入,将强分支方法作为专家,通过模仿学习的手段学习强分支方法的分支变量选择策略;
[0073]
使用一个图卷积神经网络拟合分支变量选择的策略函数π(a
t
|s
t
),具体实施过程如下:
[0074]
使用(s,a,t,r)代表马尔可夫决策过程;
[0075]
其中,s表示环境中智能体的状态集合,a表示智能体可以产生的行为的集合,t表示采取行动a从当前状态到下一个状态的状态转移概率,r表示在某个特定状态下采取某个行动能够获得的报酬;
[0076]
将t时刻智能体的状态记为s
t
,采取的行动记为a
t
,使得状态在t 1时刻变为s
t 1
,在此过程中智能体所获得的报酬为r
t 1
,智能体采取行动a从状态s∈s转移到状态s

∈s的概率记为
[0077]
每次智能体在当前叶节点上从可分变量集中选择一个分支变量的过程都是根据策略π(a
t
|s
t
)产生的;根据智能体的选择,整个分支定界树得以拓展,求解器将对智能体选择的分支变量上产生的两个松弛子问题进行求解,然后选择下一个要分支的叶节点,智能体的状态得以更新s
t 1
,从当前分支开始,再次做出决策,整个过程不断持续,直到求解器得出最优解,即没有下一个可以分支的变量;
[0078]
智能体的一系列行为将会产生一个轨迹序列,该轨迹序列产生的概率表示如下:
[0079][0080]
其中,控制分支变量选择的策略π(a
t
|s
t
)是利用模仿学习的手段通过图卷积神经网络拟合得到;
[0081]
图卷积过程被分为了两个通道,第一个通道是从变量到约束的卷积,第二个通道是约束到变量的卷积,两个通道的表示形式如下:
[0082][0083][0084]
其中,对于所有的fc,gc,都是带有relu激活函数的双层感知机;在经过这个图卷积层之后,得到一个与输入的拓扑结构完全相同的二部图;
[0085]
使用的归一化层被称为预归一化层,即x

(x-β)/σ,其中β和α为在初始阶段就固定的参数,训练过程中保持不变;
[0086]
随后将得到的变量节点输入到最后的两层感知机中,然后经过一个带掩码的softmax激活函数产生候选分支变量上的概率分布,即分支变量选择策略π(x)。
[0087]
进一步的,步骤s6具体为:
[0088]
输入移动应急电源车数据,包括当前所在地位置、容量;输入缺电台区数据,包括缺电功率、供电优先级、地理位置;
[0089]
根据步骤s1建立的调度优化目标函数、步骤s2建立的四个约束条件和步骤s3中的线性化处理,确定待求解的移动应急电源车优化调度模型;使用步骤s5中利用强化学习构建基于图卷积神经网络的分支变量选择策略π(x),改进由分支定界法构建的优化调度模型求解框架;
[0090]
将移动应急电源车和缺电台区数据输入至改进的优化调度模型求解框架中,通过scip开源求解器直接求得最优调度方案。
[0091]
本发明与现有技术相比,具有如下优点和有益效果:
[0092]
1、本发明方法针对现有方法的不足,将基于图卷积神经网络的混合整数规划问题求解算法应用于移动应急电源车调度问题中,使用该方法解决这一混合整数规划问题,同时在移动应急电源车调度问题的模型构建过程中,对目标函数进行了改进,引入迟到惩罚项以保证移动应急电源车尽可能在规定时间内到达缺电用户;本发明方法在求解过程中运行时间明显减少,在确定移动应急电源车最优调度方案的求解速度方面优越性显著。
附图说明
[0093]
图1是本发明方法的流程示意图;
[0094]
图2是本发明利用强化学习构建基于图卷积神经网络的分支变量选择策略方法的卷积结构示意图。
具体实施方式
[0095]
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0096]
实施例
[0097]
如图1所示,本发明,基于图卷积神经网络的移动应急电源车优化调度方法,包括以下步骤:
[0098]
s1、建立以停电后总停电损失费用最小且迟到惩罚最小为目标的调度优化目标函数;具体的,以停电后总停电损失费用最小为目标表示为:
[0099]
minf1=f
11-f
12
[0100][0101][0102]
其中,k∈k代表移动应急电源车;j∈j={1,2,

,n}代表缺电台区;i∈d={n 1,n 2,

,n m}代表供应点,即一共有m个供应点;l,i,j∈l=j∪d={1,2,

,n m}表示移动应急电源车所有可以到达的位置,包括所有的供应点以及所有的缺电台区;t

表示从停电开始到该城市的移动应急电源接到调度指令发车所需的时间;t
i,j
∈r

表示从位置i∈l到位置j∈j的行驶时间;表示移动应急电源车的接入时间;pk表示移动应急电源车k∈k的可供应容量;y
i,j,k
∈{0,1}为决策变量,如果移动应急电源车k∈k从位置i∈l被调度到了位置j∈j,则该项取值为1,否则取值为0;cj(
·
)表示缺电台区j∈j的分段单位停电损失函数;cj(t)表示该台区停电时间到达t分钟时的停电损失/元
·
kw-1
;tj表示缺电台区j∈j的最长停电时间,dj表示缺电台区j∈j的缺电功率。
[0103]
的具体取值如下:
[0104][0105]
以迟到惩罚最小为目标表示为:
[0106][0107]
其中,πj∈{1,2,3,4,5}表示缺电台区j∈j的优先级权重,πj对应的数字越大,该台区的供电优先级越高;m1∈n是一个极大值;zj≥0表示缺电台区j∈j的迟到量,zj=max{0,t

t
j-bj};bj∈r

为缺电台区j∈j供电的最晚到达时间,对缺电台区来说是该台区用户可容忍的最长停电时间。
[0108]
综上,以停电后总停电损失费用最小且迟到惩罚最小为目标的调度优化目标函数表示为:
[0109]
minf=w1·
f1 w2·
f2[0110]
其中,w1和w2均为权重系数,w1=w2=1。
[0111]
s2、基于调度优化目标函数,考虑冗余容量约束、缺电台区供应约束、可达约束以及供应容量约束四个约束,构建移动应急电源车优化调度模型;
[0112]
四个约束表示为:
[0113]
冗余容量约束,理想情况下,移动应急电源车供应给一个台区的总容量应该恰好可以满足该台区的需求,且存在一定的冗余;
[0114]
假设调度来的移动应急电源车少任意一个的时候该台区的需求都无法得到满足,即小于该台区的缺电功率,将供应容量约束加入约束条件中:
[0115][0116]
其中,x
j,k
∈{0,1}为决策变量,如果缺电台区j∈j被分配给了移动应急电源车k∈k供电,则该变量取值为1,否则取值为0。
[0117]
缺电台区供应约束,针对每一个缺电台区,至少分配一个可以供应的移动应急电源车给这个台区,否则要声明该台区的需求没有得到满足:
[0118][0119]
其中,k(j)表示可以用于给缺电用户j∈j供电的移动应急电源车子集;gj为决策变量,当缺电用户j∈j无法恢复电力供应时,该变量为1,否则为0;
[0120]
可达约束,针对每个移动应急电源车和每一个缺电台区,如果移动应急电源车接到任务要为这个缺电台区供电,则该应急车一定存在上一个可达地点:
[0121][0122]
供应容量约束,移动应急电源车所供应的移动应急电源容量之和应满足该缺电台区的缺电功率:
[0123][0124]
综上,构建移动应急电源车优化调度模型:
[0125][0126]
其中,i,j∈l={1,2,

,n m},k∈k={1,2,...,k}。
[0127]
s3、对建立的移动应急电源车优化调度模型进行线性化处理,得到混合整数线性规划问题;进行线性化处理具体包括对最大值函数线性化和对二次项线性化;
[0128]
对最大值函数线性化:
[0129]
移动应急电源车优化调度模型中,存在非线性函数:
[0130][0131]
对该式进行线性化处理,引入0-1辅助变量b
i,j
以及w
p,i,j
进行处理,其中w
p,i,j
的取值如下式所示:
[0132][0133]
与非线性函数tj等价的线性化处理结果如下:
[0134][0135]
添加以下约束,完成最大值函数线性化:
[0136][0137]
其中,b
i,j
表示供应点i是否是最后一辆到达缺电台区j的移动应急电源车的起始位置;w
p,i,j
是一个行驶时间的比较量;m2∈n是一个极大值。
[0138]
对二次项线性化具体为:
[0139]
完成最大值函数线性化后,将调度优化目标函数式转化为下式:
[0140][0141]
其中,b
i,j
与y
i,j,k
均为决策变量;该目标函数存在二次项,考虑到二者均为0-1决策变量,因此引入辅助变量r
i,j,k
=x
j,k
·bi,j
对其进行线性化转换并引入以下约束条件,得:
[0142][0143]
引入辅助变量t
j,k,s
=x
j,k
·
x
j,s
,则得:
[0144][0145]
s4、使用分支定界法构建移动应急电源车优化调度模型的求解框架;在本实施例中,移动应急电源车优化调度模型的求解框架的构建,基于scip开源求解器构建整体求解框架;具体为:
[0146]
分支定界法首先将要求解的整数规划最小化问题设为问题将与它相应的线性规划问题设为问题求解问题可能得到以下情况之一:
[0147]
没有可行解,这时也没有可行解,则停止;
[0148]
有最优解,并符合问题的整数条件,b的最优解即为的最优解,则停止;
[0149]
有最优解,但不符合问题的整数条件,记它的目标函数值为z
lower

[0150]
用观察法找问题的一个整数可行解,求得其目标函数值,并记作z
upper
;以z
*
表示问题的最优目标函数值,此时z
lower
≤z
*
≤z
upper
,进行迭代:
[0151]
分支,在的最优解中任选一个不符合整数条件的变量sj,其值为pj,以[pj]表示
小于pj的最大整数。构造两个约束条件:
[0152]
sj≤[pj]和sj≥[pj] 1
[0153]
将这两个约束条件分别加入问题得到两个后继规划问题和不考虑整数条件求解这两个后继问题。
[0154]
定界,以每个后继问题为一分枝标明求解的结果,与其它问题的解的结果中,找出最优目标函数值最小者作为新的下界z
lower
;从已符合整数条件的各分支中,找出目标函数值为最小者作为新的上界z
upper
,若无作用z
upper
不变。
[0155]
比较与剪枝,各分枝的最优目标函数中若有大于z
upper
者,则剪掉该枝,此后不再考虑。若小于z
upper
,且不符合整数条件,则重复步骤分支与定界,直到最后得到z
*
=z
upper
为止,得最优整数解。
[0156]
s5、利用强化学习构建基于图卷积神经网络的分支变量选择策略,从而对移动应急电源车优化调度模型的求解框架进行改进;具体为:
[0157]
将步骤s3中构建出的混合整数线性规划问题转化为二部图的表示形式,使用变量特征、约束特征以及边的特征作为输入,将强分支方法作为专家,通过模仿学习的手段学习强分支方法的分支变量选择策略;
[0158]
使用一个图卷积神经网络拟合分支变量选择的策略函数π(a
t
|s
t
),具体实施过程如下:
[0159]
使用(s,a,t,r)代表马尔可夫决策过程;
[0160]
其中,s表示环境中智能体的状态集合,a表示智能体可以产生的行为的集合,t表示采取行动a从当前状态到下一个状态的状态转移概率,r表示在某个特定状态下采取某个行动能够获得的报酬;
[0161]
将t时刻智能体的状态记为s
t
,采取的行动记为a
t
,使得状态在t 1时刻变为s
t 1
,在此过程中智能体所获得的报酬为r
t 1
,智能体采取行动a从状态s∈s转移到状态s

∈s的概率记为
[0162]
每次智能体在当前叶节点上从可分变量集中选择一个分支变量的过程都是根据策略π(a
t
|s
t
)产生的;根据智能体的选择,整个分支定界树得以拓展,求解器将对智能体选择的分支变量上产生的两个松弛子问题进行求解,然后选择下一个要分支的叶节点,智能体的状态得以更新s
t 1
,从当前分支开始,再次做出决策,整个过程不断持续,直到求解器得出最优解,即没有下一个可以分支的变量;
[0163]
智能体的一系列行为将会产生一个轨迹序列,该轨迹序列产生的概率表示如下:
[0164][0165]
其中,控制分支变量选择的策略π(a
t
|s
t
)是利用模仿学习的手段通过图卷积神经网络拟合得到;
[0166]
图卷积过程被分为了两个通道,第一个通道是从变量到约束的卷积,第二个通道是约束到变量的卷积,两个通道的表示形式如下:
[0167][0168][0169]
其中,对于所有的fc,gc,都是带有relu激活函数的双层感知机;在经过这个图卷积层之后,得到一个与输入的拓扑结构完全相同的二部图;
[0170]
使用的归一化层被称为预归一化层,即x

(x-β)/σ,其中β和α为在初始阶段就固定的参数,训练过程中保持不变;
[0171]
随后将得到的变量节点输入到最后的两层感知机中,然后经过一个带掩码的softmax激活函数产生候选分支变量上的概率分布,即分支变量选择策略π(x)。整个算法过程的卷积结构如图2所示。
[0172]
s6、使用改进后的移动应急电源车优化调度模型的求解框架对灾后移动应急电源车优化调度问题进行求解,得到最优调度方案。具体为:
[0173]
输入移动应急电源车数据,包括当前所在地位置、容量;输入缺电台区数据,包括缺电功率、供电优先级、地理位置。
[0174]
根据步骤s1建立的调度优化目标函数、步骤s2建立的四个约束条件和步骤s3中的线性化处理,确定待求解的移动应急电源车优化调度模型;使用步骤s5中利用强化学习构建基于图卷积神经网络的分支变量选择策略π(x),改进由分支定界法构建的优化调度模型求解框架;
[0175]
将移动应急电源车和缺电台区数据输入至改进的优化调度模型求解框架中,通过scip开源求解器直接求得最优调度方案。
[0176]
本发明首先对该问题进行建模,以停电后总停电损失费用最小且迟到惩罚最小为目标的调度优化目标函数,同时考虑冗余容量约束、缺电台区供应约束、可达约束以及供应容量约束四个约束,构建移动应急电源车优化调度模型,并对该模型进行线性化求解,其次,针对构建出的混合整数线性规划问题,将其转化为二部图的表示形式,通过模仿学习的方式训练出一个图卷积神经网络来学习强分支策略,加速模型的求解,有效避免了传统分支定界法运行速度过慢的问题。该方法在求解过程中运行时间明显减少,在确定移动应急电源车最优调度方案的求解速度方面优越性显著。
[0177]
还需要说明的是,在本说明书中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0178]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的
一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献