一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于物流业务响应过程的资源调度优化控制方法与流程

2021-11-22 13:22:00 来源:中国专利 TAG:


1.本发明涉及物流技术领域和调度领域,尤其涉及一种基于物流业务响应过程的资源调度优化控制方法。


背景技术:

2.物流信息平台的出现整合了社会上闲置的物流资源,有效缓解了公路货运中供需信息不对称、空载严重的问题。基于物流信息平台的物流业务交易需要用户之间的响应才能最终达成,而目前物流信息平台目前主要为用户提供匹配撮合交易,对于匹配之后的响应过程却鲜有涉及,更没有对于物流业务响应过程的资源调度优化控制研究。由于缺乏调度控制机制,物流业务的响应过程存在资源竞争问题即在某一时刻有多个资源需求方响应同一个资源,导致需求方响应成功率低、平台资源利用率差,同时一部分资源因为无人响应而浪费。因此,解决物流信息平台业务响应过程中存在的资源竞争问题,提高需求方响应成功率和平台资源利用率,促进平台交易功能的完善尤为重要。
3.现有的各类资源共享平台如云制造平台、云计算平台等,为了资源利用更优化,考虑将时间、成本等因素纳入到调度过程中,但是缺乏对需求方决策因素的考量。而物流信息平台作为典型的双向匹配平台,业务交易过程需要需求方的决策响应支持。如果在探究平台的调度机制过程中不考虑需求方的决策因素,则调度会缺乏稳定性和有效性。平台调度的实施最终是为了促进需求方交易的完成,为此,将需求方决策因素纳入到平台资源调度优化控制中更有利于实现调度优化。


技术实现要素:

4.本发明的目的在于提供一种基于物流业务响应过程的资源调度优化控制方法,以解决物流业务响应过程中的资源竞争、需求方响应成功率不高、平台资源利用率差等的技术问题。找到平台资源调度优化方案,为物流信息平台实现资源调度、完善其服务功能提供可能。
5.本发明以实现对业务响应过程的有效控制,避免资源竞争的情况,提高需求方响应成功率和平台资源利用率。同时,在调度过程中考虑了需求方的决策响应行为,以提高调度的稳定性和调度结果的有效性。
6.一种基于物流业务响应过程的资源调度优化控制方法,所述方法包括如下步骤:
7.步骤1:收集需求方信息和资源业务信息,并整合为供需信息,然后判断分析需求方是否会产生资源竞争行为,如果会进入步骤2,如果没有进入步骤 4;
8.步骤2:对于产生资源竞争的需求方通过一阶段方法求解其最佳决策时间点,以系统拥挤程度最低和系统调度风险最低为优化目标建立规划模型,并使用粒子群算法求解;
9.步骤3:在步骤2基础上通过二阶段方法求解资源业务分布方案,基于需求方的决策行为,以需求方决策收益值最大为优化目标建立规划模型,并使用遗传算法求解;
10.步骤4:初始调度结束,监测需求方决策情况,并实时更新资源业务分布状况,实现
动态调度。
11.进一步地,所述步骤2的系统拥挤程度为需求方决策的集中程度,以某时刻做决策响应的人数与总的需求人数之间的比值衡量系统每个时刻的拥挤程度。
12.进一步地,所述步骤2中系统调度风险以需求方的群体满意度来衡量,需求方的决策方案是每个需求者决策时间点的组合结果,第e个群决策方案表示为s
e
(x
1j
,x
2j
,...,x
ij
),i为正整数,表示第i个需求方,j为正整数,表示第j个时间点,x
ij
表示需求方i在时间点j的决策情况,x
ij
=1则表示做出响应, x
ij
=0表示不做出响应,不同的决策方案s
e
(x
1j
,x
2j
,...,x
ij
)会有其对应的群体满意度,群体满意度可以从整体上表明决策的好坏以及稳定性,群体满意度越高需求方的决策越稳定,系统也就越稳定,选择群体满意度最大值d0作为参照点,每种决策方案的群体满意度与d0之间表现为损失,则损失值表示系统调度风险。
13.进一步地,所述步骤2中目标建立规划模型的目标函数和约束条件为,在需求方决策时间窗内的平均拥挤程度最低函数为:
[0014][0015]
系统调度风险最低函数为:需求方在时间窗内只会选择一个时间点做出决策响应函数为:
[0016][0017]
每个时刻的系统拥挤程度函数为:
[0018][0019]
每个时刻做出决策响应的总人数函数为:
[0020]
系统调度风险函数为:
[0021][0022]
其中,表示0

1变量,需求方i在时间点j做出决策响应时,x
ij
=1,反之x
ij
=0。m为需求方总数,为正整数,t为时间点总数,为正整数,λ为损失厌恶系数,β为风险态度系数, c
j
表示时间点为j时的系统拥挤程度。
[0023]
进一步地,所述步骤2中粒子群算法对规划模型求解的具体过程为:编码,采用0

1编码,每一条染色体对应一个可行解,代表需求方在决策时间窗内各个时间点的决策响应情况,0为不做决策响应,1为做出决策响应,每条染色体的基因数为需求方数量和时间点数量的乘积;
[0024]
适应度函数,求解公式(1)和(2)两个函数的理想点为(0,0),因此基于理想点法将
多目标转化为单目标模型并将其作为适应度函数,则适应度函数值越小越好;
[0025]
粒子公式,粒子群算法根据粒子公式不断更新自己的速度和位置在解空间中追随最优的粒子进行搜索,粒子公式如式(8)和(9)所示:
[0026][0027][0028]
其中,o表示第o个粒子,ll表示第ll次迭代,d表示第d维分量,ω为惯性权重,r1和r2为随机数,取值范围是[0,1];pbest
od
是个体中最优情况下的粒子位置;gbest
d
表示全局最优情况下的粒子位置;表示第ll次迭代粒子o 飞行速度矢量的第d维分量;表示第ll次迭代粒子o位置矢量的第d维分量。
[0029]
终止循环条件,设定最大的迭代次数为50

100代,并且根据群体的收敛程度相结合的方式来终止循环,求解得到最优解。
[0030]
进一步地,所述步骤3中需求方决策收益值计算具体过程为:
[0031]
步骤2.1:需求方评价值标准化,需求方对时间窗内的资源从若干个方面属性去判断,设需求方i对资源k的属性h的评价值为由于不同属性评价值的取值量纲不同,因此采用线性比例变换法进行标准化,对于数值类属性评价值标准化公式如式(10)和(11)所示:
[0032][0033][0034]
对于语言类属性评价值,假设为r级语言评价值集合{s0,s1,...,s
i
,...,s
r
}元素,r为语言评价值集合的级数。则评价值标准化公式如(12)

(13)所示:
[0035][0036][0037]
其中,标准化后的评价值表示为(10)和(12)为收益型属性标准化过程,(11)和(13)为成本型属性标准化过程;
[0038]
步骤2.2:构成需求方状态空间,所有资源的评价值集合构成了属性h的评价值空间l为评价值种类,表示属性h的评价值共有l种,所有属性的评价值空间即为需求方i的状态空间f表示第f个状态空间,g为属性总个数。即需求方i 的状态空间可以表示为:从g个属性去描述需求方的状态,其中每个属性包含 l种状态评价值;
[0039]
步骤2.3:需求方状态空间评价值概率计算,需求方在不同时间点的状态评价值取值概率不一样,由各时间点的资源业务分布决定如公式(14)所示:
[0040][0041]
其中,y
kj
为0

1变量,当时间点j有资源k时为1,反之为0,为0

1变量,当需求方对资源的评价值与其状态空间评价值相等时记为1,否则为0,如式(15)所示:
[0042][0043]
步骤2.4:求解需求方基于各时间点的决策收益,将需求方基于各属性的状态评价值与其概率相乘,最后求和即可得到需求方i在时间点j的决策收益值如式(16)所示:
[0044][0045]
步骤2.5:根据需求方收益模型,同理得到资源方决策收益值如式(17)

(20) 所示:
[0046][0047][0048][0049][0050]
其中,为资源方状态空间评价值;表示资源方k对需求方i基于属性h的评价值;yy
ij
为01变量,当时间点j属于需求方i的决策时间窗内时为 1,反之为0;为01变量,当资源方对需求方的评价值与其状态空间评价值相等时为1,反之为0;为资源方状态空间评价值取值概率;p
kj
为资源方被选择概率;sse
kj
为资源方k在时间点j的决策收益值。
[0051]
进一步地,所述步骤3中优化目标建立规划模型的目标函数和约束条件为:目标函数和约束条件如公式(21)

(27):
[0052]
[0053][0054][0055][0056][0057][0058][0059]
式(21)为目标函数,表示需求方平均决策收益值最大,c
i
表示需求方i 的调度时间点。式(22)

(27)为约束条件,式(22)表示各需求方在调度时间点的决策收益值要大于其他时间点的决策收益值,式(23)为0

1变量,当资源方k在时间点j的决策收益值大于或等于阈值w
k
时为1,反之为0,式(24) 表示资源方至少有一个时间点的决策收益值要大于或等于阈值w
k
,式(25) 表示概率取值范围,式(26)为0

1决策变量,式(27)为非负约束。
[0060]
进一步地,所述遗传算法对规划模型求解的具体过程为:
[0061]
编码,使用0

1编码,一条染色体对应一个可行解,表示每个时间点上每种资源的分配情况,0表示不分配,1表示分配;
[0062]
适应度函数,将目标函数作为适应度函数,适应度函数值越大目标函数越大,染色体越优;
[0063]
选择操作,采用轮盘赌选择,个体适应度值越大,被选中的概率越大,在选择过程中采用罚函数法调整适应度值,对于不满足约束条件的染色体适应度赋予罚函数,使其适应度值变低,则在选择过程中只会以较小的概率保留,从而淘汰掉不符合约束条件的个体;
[0064]
交叉、变异操作,交叉操作采取两点交叉,随机选择两点,两个个体交换这两点的基因,变异操作则随机选取染色体上的两个位置点进行交换;
[0065]
终止循环条件,设定最大的迭代代数为100

800代来终止循环,并且根据群体的收敛程度相结合的方式来终止循环,求解得到最优解。
[0066]
进一步地,所述步骤4中动态调度为当每个时刻的需求方响应结束后,若其响应的资源会对后续时刻的需求方响应产生影响,则执行步骤3重新调整资源业务分布,反之则保持初始调度方案等待后续需求方响应资源,直至该决策时间窗内所有需求方响应完毕,则调度控制结束。
[0067]
本方案分为两个阶段实现平台资源调度优化控制,第一阶段为求解需求方最佳决策时间点,业务响应过程中资源竞争问题的出现是因为没有从车货交易业务系统全局去考虑需求方的决策方案(决策时间点)。为此从系统的角度分析需求方决策时间点的变化。以系统最优,包括系统拥挤程度最低和系统调度风险最低作为优化目标求解需求方决策时间点,为实施后续的资源调整做准备。第二阶段为确定资源业务分布方案,通过分析需求方的
决策行为,根据资源业务分布会影响需求方决策收益这一特点,以需求方平均决策收益值最大化为优化目标求解资源业务分布方案。即通过调整资源业务分布满足需求方在对应的一阶段决策时间点的收益值最高,并将业务分布调整之后得到的最佳决策方案反馈给各需求方,引导其在相应的决策时间点做出响应。从而实现一阶段系统最优情况下需求方的决策情况,避免资源竞争的现象。并且,在两阶段资源调度优化控制基础上,提出平台动态调度策略,合理化调度流程。
[0068]
本发明采用了上述技术方案,本发明具有以下技术效果:
[0069]
本发明针对物流信息平台的业务响应过程,设计了二阶段资源调度优化模型,实现对业务响应过程的有效控制。在调度过程中考虑到需求方决策因素,通过调整资源业务分布实现对需求方决策行为的引导,避免资源竞争的情况。以保证供需双方之间交易的顺利进行,促成业务的达成。同时,本发明基于二阶段调度方法提出了平台动态调度策略,更符合平台的实际调度情况。并针对二阶段调度模型,分别采用粒子群算法和遗传算法求出最优解,更好实现平台的调度优化结果。本发明避免了传统物流信息平台无调度控制的无序响应状态以及由于资源竞争导致的需求方响应成功率不高、平台资源利用率差的情况,可更好的完善物流信息平台的功能,从系统上提高物流信息平台对物流业务的运作水平,增强用户对平台的粘性,促进物流信息平台健康发展。也可供其他基于互联网的资源共享平台应用。
附图说明
[0070]
图1是本发明的资源调度优化控制方法流程图。
[0071]
图2是本发明的动态调度策略思路图。
具体实施方式
[0072]
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本发明的这些方面。
[0073]
如图1所示,一种基于物流业务响应过程的资源调度优化控制方法,所述方法包括如下步骤:
[0074]
步骤1:收集需求方信息和资源业务信息,并整合为供需信息,然后判断分析需求方是否会产生资源竞争行为,如果会进入步骤2,如果没有进入步骤4。对于物流信息平台业务响应过程中产生资源竞争的交易实施调度优化控制的问题可以描述为:平台通过需求预测发现时间窗t内的需求方会产生资源竞争行为,为此提前实行调度优化控制,为保障t内各需求方响应的顺利进行。
[0075]
步骤2:对于产生资源竞争的需求方通过一阶段方法求解其最佳决策时间点,以系统拥挤程度最低和系统调度风险最低为优化目标建立规划模型,并使用粒子群算法求解。系统拥挤程度为需求方决策的集中程度,以某时刻做决策响应的人数与总的需求人数之间的比值衡量系统每个时刻的拥挤程度。
[0076]
系统调度风险以需求方的群体满意度来衡量,需求方的决策方案是每个需求者决
策时间点的组合结果,第e个群决策方案表示为s
e
(x
1j
,x
2j
,...,x
ij
),i 为正整数,表示第i个需求方,j为正整数,表示第j个时间点,x
ij
表示需求方i在时间点j的决策情况,x
ij
=1则表示做出响应,x
ij
=0表示不做出响应,不同的决策方案s
e
(x
1j
,x
2j
,...,x
ij
)会有其对应的群体满意度,群体满意度可以从整体上表明决策的好坏以及稳定性,群体满意度越高需求方的决策越稳定,系统也就越稳定,选择群体满意度最大值d0作为参照点,每种决策方案的群体满意度与d0之间表现为损失,则损失值表示系统调度风险。
[0077]
目标建立规划模型的目标函数和约束条件为,在需求方决策时间窗内的平均拥挤程度最低函数为:
[0078][0079]
系统调度风险最低函数为:需求方在时间窗内只会选择一个时间点做出决策响应函数为:
[0080][0081]
每个时刻的系统拥挤程度函数为:
[0082][0083]
每个时刻做出决策响应的总人数函数为:
[0084]
系统调度风险函数为:
[0085][0086]
其中,表示0

1变量,需求方i在时间点j做出决策响应时,x
ij
=1,反之x
ij
=0。m为需求方总数,为正整数,t为时间点总数,为正整数,λ为损失厌恶系数,β为风险态度系数, c
j
表示时间点为j时的系统拥挤程度。
[0087]
粒子群算法对规划模型求解的具体过程为:编码,采用0

1编码,每一条染色体对应一个可行解,代表需求方在决策时间窗内各个时间点的决策响应情况,0为不做决策响应,1为做出决策响应,每条染色体的基因数为需求方数量和时间点数量的乘积;
[0088]
适应度函数,求解公式(1)和(2)两个函数的理想点为(0,0),因此基于理想点法将多目标转化为单目标模型并将其作为适应度函数,则适应度函数值越小越好;
[0089]
粒子公式,粒子群算法根据粒子公式不断更新自己的速度和位置在解空间中追随最优的粒子进行搜索,粒子公式如式(8)和(9)所示:
[0090]
[0091][0092]
其中,o表示第o个粒子,ll表示第ll次迭代,d表示第d维分量,ω为惯性权重,r1和r2为随机数,取值范围是[0,1];pbest
od
是个体中最优情况下的粒子位置;gbest
d
表示全局最优情况下的粒子位置;表示第ll次迭代粒子o 飞行速度矢量的第d维分量;表示第ll次迭代粒子o位置矢量的第d维分量。
[0093]
终止循环条件,设定最大的迭代次数为50

100代,并且根据群体的收敛程度相结合的方式来终止循环,求解得到最优解。
[0094]
步骤3:在步骤2基础上通过二阶段方法求解资源业务分布方案,基于需求方的决策行为,以需求方决策收益值最大为优化目标建立规划模型,并使用遗传算法求解。
[0095]
步骤3.1:需求方评价值标准化,需求方对时间窗内的资源从若干个方面属性去判断,设需求方i对资源k的属性h的评价值为由于不同属性评价值的取值量纲不同,因此采用线性比例变换法进行标准化,对于数值类属性评价值标准化公式如式(10)和(11)所示:
[0096][0097][0098]
对于语言类属性评价值,假设为r级语言评价值集合{s0,s1,...,s
i
,...,s
r
}之一,r为语言评价值集合的级数。则评价值标准化公式如(12)

(13)所示:
[0099][0100][0101]
其中,标准化后的评价值表示为(10)和(12)为收益型属性标准化过程,(11)和(13)为成本型属性标准化过程;
[0102]
步骤3.2:构成需求方状态空间,所有资源的评价值集合构成了属性h的评价值空间l为评价值种类,表示属性h的评价值共有l种,所有属性的评价值空间即为需求方i的状态空间f表示第f个状态空间,g为属性总个数。即需求方i 的状态空间可以表示为:从g个属性去描述需求方的状态,其中每个属性包含 l种状态评价值;
[0103]
步骤3.3:需求方状态空间评价值概率计算,需求方在不同时间点的状态评价值取值概率不一样,由各时间点的资源业务分布决定如公式(14)所示:
[0104]
[0105]
其中,y
kj
为0

1变量,当时间点j有资源k时为1,反之为0,为0

1变量,当需求方对资源的评价值与其状态空间评价值相等时记为1,否则为0,如式(15)所示:
[0106][0107]
步骤3.4:求解需求方基于各时间点的决策收益,将需求方基于各属性的状态评价值与其概率相乘,最后求和即可得到需求方i在时间点j的决策收益值如式(16)所示:
[0108][0109]
步骤3.5:根据需求方收益模型,同理得到资源方决策收益值如式(17)

(20) 所示:
[0110][0111][0112][0113][0114]
其中,为资源方状态空间评价值;表示资源方k对需求方i基于属性h的评价值;yy
ij
为01变量,当时间点j属于需求方i的决策时间窗内时为 1,反之为0;为01变量,当资源方对需求方的评价值与其状态空间评价值相等时为1,反之为0;为资源方状态空间评价值取值概率;p
kj
为资源方被选择概率;sse
kj
为资源方k在时间点j的决策收益值。
[0115]
优化目标建立规划模型的目标函数和约束条件为:目标函数和约束条件如公式(21)

(27):
[0116][0117][0118]
[0119][0120][0121][0122][0123]
式(21)为目标函数,表示需求方平均决策收益值最大,c
i
表示需求方i 的调度时间点。式(22)

(27)为约束条件,式(22)表示各需求方在调度时间点的决策收益值要大于其他时间点的决策收益值,式(23)为0

1变量,当资源方k在时间点j的决策收益值大于或等于阈值w
k
时为1,反之为0,式(24) 表示资源方至少有一个时间点的决策收益值要大于或等于阈值w
k
,式(25) 表示概率取值范围,式(26)为0

1决策变量,式(27)为非负约束。
[0124]
所述遗传算法对规划模型求解的具体过程为:
[0125]
编码,使用0

1编码,一条染色体对应一个可行解,表示每个时间点上每种资源的分配情况,0表示不分配,1表示分配;
[0126]
适应度函数,将目标函数作为适应度函数,适应度函数值越大目标函数越大,染色体越优;
[0127]
选择操作,采用轮盘赌选择,个体适应度值越大,被选中的概率越大,在选择过程中采用罚函数法调整适应度值,对于不满足约束条件的染色体适应度赋予罚函数,使其适应度值变低,则在选择过程中只会以较小的概率保留,从而淘汰掉不符合约束条件的个体;
[0128]
交叉、变异操作,交叉操作采取两点交叉,随机选择两点,两个个体交换这两点的基因,变异操作则随机选取染色体上的两个位置点进行交换;
[0129]
终止循环条件,设定最大的迭代代数为100

800代来终止循环,并且根据群体的收敛程度相结合的方式来终止循环,求解得到最优解。
[0130]
步骤4:初始调度结束,监测需求方决策情况,并实时更新资源业务分布状况,实现动态调度。动态调度为当每个时刻的需求方响应结束后,若其响应的资源会对后续时刻的需求方响应产生影响,则执行步骤3重新调整资源业务分布,反之则保持初始调度方案等待后续需求方响应资源,直至该决策时间窗内所有需求方响应完毕,则调度控制结束。
[0131]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献