一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

具有丢包和多时滞的网络控制系统的最优控制研究方法与流程

2021-11-05 21:07:00 来源:中国专利 TAG:


1.本发明属于网络控制领域,具体涉及一种具有丢包和多时滞的网络控制系统的最优控制 研究方法。


背景技术:

2.网络控制系统(ncss)是一种反馈控制系统,该系统的控制环通过一个共享通信网络形 成闭合回路,且在通信网络中,系统信号(如参考输入、控制输入、设备输出等)可以在所 有的系统组件(如传感器、控制器、执行器等)中进行传输。与传统的控制系统相比,网络 控制系统具有布线少、成本低、系统灵活性高和可维护性强等特点,因此在工业控制、过程 控制、工程系统、航空航天系统、智能系统等实际应用中得到广泛的发展。
3.近年来出现了很多关于网络控制系统的热点问题,其中包括网络安全、容错网络控制系 统、分散和分布式网络控制系统、云网络控制系统等。在这些控制系统中经常出现丢包和网 络时滞的情形,这是由于节点故障或信息冲突以及信号采样或接收延迟所导致的。值得注意 的是,如果丢包和时滞超过了一定的期望值,装置或者设备可能会受到损坏,或者性能有所 下降。考虑到控制信号的传输经过一个不可靠的信道时,通过使用随机极大值原理,给出了 控制输入存在时滞时的最优控制器。针对具有量测丢包的网络控制系统,给出了最优估计器 的递推式和最优控制器的显示解。当系统输入不仅存在时滞,也存在从控制器到执行器之间 传输的数据丢包时,通过利用动态规划方法,给出了最优控制器的显式解。针对具有信息不 对称的网络控制系统,通过引入极大值原理,分别给出了有限时间和无限时间内的最优控制 问题可解的充分必要条件。
4.可以看出,以上的这些研究所讨论的问题都不够完善,对于带有乘性噪声的网络控制系 统,当有丢包和多时滞发生时,特别是系统中存在量测时滞时,很少有文章对此进行研究。 当系统中没有量测时滞时,最优估计器可以直接用量测数据进行设计,并且基于设计的估计 器可以求解最优控制器,分析稳定性问题。但是,上述研究成果有一个共同的缺陷,即没有 考虑系统中有量测时滞的情况,这使得所求得的控制器在实际中的应用有一定的局限性。本 文所讨论的问题如图1所示,当传感器的信号通过一个不可靠的信道进行传输时,会产生量 测丢包和量测时滞,而且在控制器到执行器的信号传输过程中存在输入时滞。由于量测时滞 的存在,量测数据{y
k
}不能直接用于估计器的设计。而且基于现有的估计器,最优输出反馈 控制器无法求解。换句话说,当系统中同时存在丢包和多时滞时,输出反馈控制和稳定性问 题将会变得更加的复杂。


技术实现要素:

5.针对现有技术中存在的上述技术问题,本发明提出了一种具有丢包和多时滞的网络控制 系统的最优控制研究方法,设计合理,克服了现有技术的不足,具有良好的效果。
6.为了实现上述目的,本发明采用如下技术方案:
7.具有丢包和多时滞的网络控制系统的最优控制研究方法,首先给出如下定义:符
号表 示n维欧氏空间;上标'表示矩阵的转置;实数矩阵m>0表示矩阵m是正定的;实数矩阵m≥0 表示矩阵m是半正定的;表示指示函数,即当元素时,有否则有是由随机过程x所产生的自然滤波;e[
·
]是数学期望且是关于的条件期望;p(x)表 示当事件x发生时的概率;i表示单位矩阵;δ
kl
表示克罗内克函数,即当k=l时有δ
kl
=1,否 则有δ
kl
=0;
[0008]
所述方法具体包括如下步骤:
[0009]
步骤1:利用带有时滞的量测数据{y
k
}设计出了最优估计器;
[0010]
步骤2:利用极大值原理,解出了最优控制器,并给出了有限时间范围内可解的充分必 要条件;且最优控制器的增益为耦合的黎卡提方程的解;
[0011]
步骤3:通过定义一个李雅普诺夫函数,得出系统在均方意义下是可镇定的,当且仅当 给定的耦合的黎卡提方程有唯一解。
[0012]
优选地,在步骤2中,具体设计如下:
[0013]
有限时间的情况
[0014]
问题描述
[0015]
考虑下面带有丢包、输入时滞和量测时滞的乘性噪声系统:
[0016][0017]
y
k
=ω
k
x
k

θ

ꢀꢀꢀ
(2);
[0018]
其中,代表状态向量,代表控制器,代表其协方差为的标 量高斯白噪声;代表量测过程,ω
k
是服从概率为p(ω
k
=1)=p=1

q∈[0,1]的伯努利分布; a,b,是具有适当维数的常值矩阵,d和θ(>0)分别表示输入时滞和量测时滞;初始值x0表 示均值为μ,协方差为θ的高斯随机向量,初始控制器u
i
,i=

d,...,θ

1的值是已知的,而且 {ω
k
}和x0彼此相互独立;
[0019]
系统(1)和(2)的性能指标定义为:
[0020][0021]
其中,常值矩阵分别是用来平衡状态向量和输入向量的权重矩阵, x
n 1
为终端状态向量,为有界的常数终端加权矩阵;
[0022]
对于具有丢包和多时滞的乘性噪声系统,控制器u
k
只允许访问量测过程{y
θ
,...,y
k
},也 就是说,u
k
是可量测的;为了方便起见,将表示为同时,将 表示为将表示为
[0023]
问题1对于系统(1)和(2),利用量测数据{y
k
},找到一个可量测的控制器u
k
使 得目标函数(3)最小;
[0024]
为了确保问题的可解性,给出下面的假设:
[0025]
假设1目标函数(3)中矩阵满足q≥0,r>0和m
n 1
≥0;
[0026]
最优估计
[0027]
在求解最优控制器之前,首先给出最优估计器的表达式;为了表示方便,将估计器
表示 为下面给出本小节的重要定理:
[0028]
定理1对于系统的状态方程(1)和量测方程(2),最优估计器的递推式为:
[0029][0030]
其中
[0031][0032]
初始值为且有 和p(ψ
k
=1)=q=1

p,θ≤k≤n,表示指示函数;
[0033]
除此之外,由系统方程(1)能够直接计算得到
[0034][0035]
证首先计算最优估计器的初始值令y
θ
=ω
θ
x0=h,则由条件期望的定义得到
[0036][0037]
其中,p(x
θ
=r
i
|y
θ
=h)表示在y
θ
=h发生的情况下x
θ
取值为r
i
的条件概率;下面进行讨论:
[0038]
1)对于量测数据y
θ
,当出现数据丢包时,也就是说y
θ
=h=0,此时有 p(x
θ
=r
i
,y
θ
=0)=p(x
θ
=r
i
)p(y
θ
=0),则由(5)能够得到
[0039][0040]
2)当没有发生丢包时,也即y
θ
=h≠0,则由(5)能够得到
[0041][0042]
因此,结合式(6)和(7),估计器的初始值表示为
[0043][0044]
由于系统噪声和{ω
k
}是相互独立的,则通过系统状态方程(1)得到
[0045][0046]
下面进一步分析最优估计器的一般形式θ≤k≤n;
[0047]
为了方便起见,令y
k
={y
θ
,...,y
k
};类比式(5),利用条件期望的定义,可得
[0048][0049]
分类讨论如下:
[0050]
1)若y
θ
=y
θ 1
...=y
k
=0,则有
[0051]
p(x
k
=r
i
,y
θ
=0,y
θ 1
=0,...,y
k
=0)=p(x
k
=r
i
)p(y
θ
=0,y
θ 1
=0,...,y
k
=0);
[0052]
因此,根据式(8)可得
[0053]
e[x
k
|y
θ
=h
θ
,y
θ 1
=h
θ 1
,...,y
k
=h
k
]=ex
k
(9);
[0054]
2)若有y
k
=h
k
=0,且其中{θ,θ 1,...,k

1}= {i
θ
,i
θ 1
,...,i
k
‑1},i
θ
<i
θ 1
<...<i
j
;此时有;此时有
[0055]
则根据式(8)可得
[0056][0057]
3)若k时刻没有数据丢包,即y
k
=h
k
≠0,估计器能够表示为
[0058][0059]
其中y
k
=ω
k
x
k

θ
,且上式第二行利用了状态{x
k
}的马尔可夫特性;
[0060]
由式(1)和(11)可得
[0061][0062]
同理可得
[0063][0064]
则由式(12)和(13),式(11)中的估计器能够写成递推的形式,如下:
[0065][0066]
综上所述,由式(9)

(11)可得最优估计器的形式为
[0067][0068]
同时由系统方程(1)直接计算可得
[0069][0070]
下面对式(14)作进一步的化简;利用指示函数的特性可知
[0071][0072][0073]
因此,当y
θ
=y
θ 1
...=y
k
=0时,由式(16),式(14)能够写为
[0074]
e[x
k
|y
θ
,...,y
k
]=ex
k
=ae[x
k
‑1|y
k
‑1] bu
k

d
‑1ꢀꢀꢀ
(18);
[0075]
同时,若有其中i
θ
<i
θ 1
<...<i
j
<...≤i
k
‑1,则
[0076]
1)当i
j
<k

1时,即且y
k
‑1=0,由式(17),式(14)能够写为
[0077][0078]
2)当i
j
=k

1时,即y
k
‑1≠0,由式(17),式(14)能够写为
[0079][0080]
因此,由式(14),(18)

(20),并将定义为ψ
k
,得到最优估计器的递推形式为
[0081][0082]
上式即为式(4);
[0083]
最优输出反馈控制
[0084]
为了得到问题1的解,对系统状态方程(1)和目标函数(3)应用极大值原理得到如下 的共态方程:
[0085]
λ
n
=m
n 1
x
n 1
ꢀꢀꢀ
(21);
[0086][0087][0088]
其中下面给出问题1完整的解;
[0089]
定理2基于假设1,对于系统(1)和(2,问题1有唯一的解,当且仅当矩阵δ
k
>0, k=d θ,...,n;且设计的令目标函数(3)最小的最优输出反馈控制器为
[0090][0091]
其中估计器满足下式
[0092][0093]
估计器已经在定理1中给出,且增益δ
k d
和γ
k d
满足
[0094][0095][0096]
在式(25)和(26)中,矩阵ψ
k

k
满足下列的黎卡提差分方程
[0097][0098][0099][0100][0101]
φ
k
=(1

q)a

ψ
k 1
a a

φ
k 1
a,
ꢀꢀꢀ
(31);
[0102]
式(27)

(31)中的终端条件为
[0103]
同时可得式(3)中的最优目标函数为
[0104][0105]
且状态和共态之间的关系满足下式
[0106][0107]
推论令
[0108]
对式(27)

(31)两端从i=3到d 1进行累加,得到下面耦合的黎卡提方程
[0109][0110][0111][0112]
φ
k
=(1

q)a

ψ
k 1
a a

φ
k 1
a,
ꢀꢀꢀ
(37);
[0113]
上式中的终端值为ξ
n 1
=π
n 1
=m
n 1
,且矩阵δ
k
和γ
k
能够直接计算得到
[0114][0115][0116]
下面给出定理2的证明:
[0117]
证首先给出必要性的证明,即在假设1的前提下,如果问题1有唯一解,式(25)中的 矩阵δ
k
,d θ≤k≤n是严格正定的;定义新的目标函数为
[0118][0119]
令式(40)中的k=n,得到
[0120]
j(n)=e[x
n

qx
n
u
n

d

ru
n

d
] x
n 1

m
n 1
x
n 1

[0121]
将系统的状态方程(1)代入上式,则j(n)能够写成状态x
n
和控制器u
n

d
的二次型形式, 且由于控制器解的唯一性,该二次型必然是正定的;令状态x
n
=0,得到
[0122][0123]
因此δ
n
>0成立;
[0124]
下面计算最优控制器;由式(1)和(21),平衡方程(23)能够写为
[0125][0126]
因此,当k=n时的最优控制器为
[0127][0128]
明显式(41)满足式(24);
[0129]
接下来说明k=n时的共态方程具有式(33)的形式;利用式(1)、(21)、(22)和(41), 得到
[0130][0131]
上式满足式(33),且矩阵m
n1
和分别满足式(27)和(28);
[0132]
为了进一步分析一般情况,并利用数学归纳法,取d θ≤l≤n,当k≥l 1,假设式(25) 中的矩阵是正定的,且控制器u
k

d
和共态λ
k
‑1的表达式为式(24)和(33);接下来证明该情形 在k=l时也成立;
[0133]
首先需要证明矩阵δ
l
的可逆性;由式(1)、(22)和(23),得到
[0134][0135]
将上式从k=l 1到n进行累加,得到
[0136][0137]
利用上式以及式(21),并令式(40)中的k=l,则j(l)表示成
[0138][0139][0140]
将式(33)代入上式,并令x
l
=0,则j(l)被写成
[0141][0142]
由于最优控制器解u
l

d
的唯一性,则式(25)中矩阵δ
l
是严格正定的,也即δ
l
>0成立;
[0143]
下面求解最优控制器;将式(33)代入式(23)得到
[0144][0145]
则最优控制器的解为
[0146][0147]
其中矩阵δ
l
和γ
l
分别满足式(25)和(26);因此,最优控制器(24)在k=l时也成立;
[0148]
最后证明状态和共态之间的关系式满足式(33),如下:
[0149][0150]
显然该式成立;这就完成了必要性的证明;
[0151]
下面给出充分性的证明,即当式(25)中的矩阵δ
k
>0,k=d θ,...,n时,证明问题1有 唯一解;定义
[0152][0153]
则由式(1)、(25)

(31),能够计算得到v
n
(k 1,x
k 1
)如下
[0154][0155][0156]
令v
n
(k,x
k
)和v
n
(k 1,x
k 1
)作差,得到
[0157][0158]
对式(41)两端从k=d θ到n进行累加,得到
[0159][0160]
利用上式将目标函数写为
[0161][0162]
在上式中,x0,u
i
,i=

d,...,θ

1已经初始化,对于0≤k≤d θ

1,x
k
能够由初始值进行求 解,且矩阵δ
k
是严格正定的;因此,令目标函数取到最小值,最优控制器的唯一性即可得证, 且满足式(24)。
[0163]
优选地,在步骤3中,具体设计如下:
[0164]
无限时间的情况
[0165]
问题描述
[0166]
为了分析系统的镇定性,求解系统(1)和(2)在无限时间时的镇定问题;当n

∞时 考虑如下的性能指标:
[0167][0168]
首先给出下面几个重要的定义:
[0169]
定义1对于给定的初始值x0,u

d
,...,u
θ
‑1,且控制器u
k

d
=0,k≥d θ,如果有
[0170][0171]
则称方程(1)为渐进均方稳定的;
[0172]
定义2方程(1)在均方意义下是可镇定的,当存在一个可量测的控制器 k≥θ,其中l和l
i
(i=1,...,d θ)是常值矩阵,且满足使得 (1)的闭环系统是渐进均方稳定的;
[0173]
定义3对于下面的随机系统
[0174][0175]
为了方便起见,将上述系统简记为基于假设1,有q=c'c成立;如果有下式成立
[0176][0177]
则称系统是完全可观测的;
[0178]
问题2找到一个可测的控制器u
k

d
使得系统(1)是渐进均方稳定的,同时使
得 目标函数(44)最小;
[0179]
假设2是完全可观测的;
[0180]
问题2的解
[0181]
为了表述清晰,将矩阵δ
k

k

k

k

k

k
写为δ
k
(n),γ
k
(n),ψ
k
(n), φ
k
(n),ξ
k
(n),π
k
(n);由于终端值m
n 1
=0,故上述矩阵都为时不变矩阵;
[0182]
下面给出几个重要引理:
[0183]
引理1基于假设1,得到π
k
(n)≥ξ
k
(n)≥0,φ
k
(n)<0和 [0184]
证在定理1中已经证得了δ
k
(n)>0,k≥d θ,由式(28)

(31)能够直接观察得出矩 阵ψ
k
(n),φ
k
(n)都是负定的;接下来证明π
k
(n)≥ξ
k
(n)≥0和成立;定义
[0185][0186]
其中m≥d θ;由式(3)和(32)能够类比得到式(45)的最优解为
[0187][0188][0189]
对式(46)分析如下:
[0190][0191]
其中有同理可得
[0192][0193][0194]
则由式(46)

(49);得到
[0195][0196]
由于状态x
d θ
是随机变量,因此,得到
[0197]
ξ
d θ
(m)≥0;
[0198]
也即由定理2看出则必有利用ξ
d θ
(m),和的时 不变特性,令m=n d θ

k,则有ξ
k
(n)=ξ
d θ
(n d θ

k)≥0,和 [0199]
因此不等式π
k
(n)≥ξ
k
(n)≥0,和也成立;
[0200]
引理2基于假设1和2,存在一个常数n0>0,使得当n>n0时,有ξ
d θ
(n)>0;
[0201]
证对于式(46),选定状态向量x
d θ
(≠0),则有假设ξ
d θ
(n)=0成立,那么式(46)能够写为
[0202][0203]
其中和分别代表最优状态策略和最优控制器;由假设1可知,q=c'c≥0且r>0, 再由式(51)能够观察得出
[0204][0205]
则系统方程(1)能够写成
[0206][0207]
基于定义3和假设2,得到x
d θ
=0,矛盾;因此假设不成立,则有n0>0,使得当n>n0时,有ξ
d θ
(n)>0成立;
[0208]
引理3系统方程(1)是可镇定的,当且仅当不等式成立;
[0209]
证首先给出充分性的证明;显然,如果成立,则必有基于 定义2可知系统方程(1)是可镇定的;
[0210]
下面证明必要性,即若系统方程(1)是可镇定的,则不等式成立;
[0211]
由定义2可知,存在使得系统方程(1)是渐进均方稳定的;定 义如下矩阵
[0212]
[0213][0214]
利用上述矩阵可将系统方程(1)转变为一个新的状态方程为
[0215][0216]
且控制器u
k
能够写为
[0217][0218]
将式(53)代入式(52)得到
[0219][0220]
回顾定义2可知,控制器可使系统方程(1)渐进均方稳定,也即存在同时,我们能够得到
[0221][0222]
则由式(54)能够直接得到且有因此可得
[0223][0224]
利用式(55),能够得到也即
[0225][0226]
定理3系统方程在均方意义下是可镇定的,当且仅当推论中耦合的黎卡提方程有唯一解, 且有π≥ξ>0,m1≥0,ψ,φ≤0和m
j
≤0,j=2,...,d 1:
[0227][0228][0229]
ψ=

(a

)
d
γ

δ
‑1γa
d
qa

ψa
ꢀꢀꢀ
(58);
[0230]
φ=(1

q)a

ψa a

φa
ꢀꢀꢀ
(59);
[0231]
其中δ和γ为
[0232][0233]
[0234]
使系统镇定的控制器为
[0235][0236]
式(44)对应的最优目标函数为
[0237][0238]
其中
[0239][0240]
下面给出定理3的证明:
[0241]
必要性:即若系统方程(1)是均方可镇定的,则式(34)

(39)中耦合的黎卡提方程 有唯一解,且π≥ξ>0,ψ,φ≤0;
[0242]
首先给出矩阵ξ
d θ
(n),π
d θ
(n),ψ
d θ
(n)和φ
d θ
(n)关于n的单调性证明;回顾式(32)和(42), 最优目标函数能够写为
[0243][0244]
其中,且u
j
=0,j=

d,...,

1,1,下面对式(65)进行讨论:
[0245]
1)如果有x0=ex0成立,则由定理1可以得到那么式(65)能够写为
[0246][0247]
由于j
*
(n)≤j
*
(n 1)能够得到也即 π0(n)≤π0(n 1)成立;
[0248]
2)如果有ex0=0成立,能够得到类比上述分析得
[0249][0250]
3)对于给定的x
d θ
,由式(46),令m=n,可有h
*
(n)≤h
*
(n 1),则可得
[0251][0252]
也即ξ
d θ
(n)≤ξ
d θ
(n 1)成立;
[0253]
综上所述,看出π0(n),和ξ
d θ
(n)关于n是单调递增的;
[0254]
下面证明上述矩阵是有界的;由定义2知,存在控制器使得系统方程(1)镇 定;选定一常数λ使得q≤λi,成立;则有
[0255][0256]
其中c和c1是常数;因此,得到
[0257][0258]
再由式(50),可知
[0259][0260]
上式表明矩阵ξ
d θ
(n)是有界的;
[0261]
类比式(65)进行如下讨论:
[0262]
1)若x0=ex0,则有故有
[0263][0264]
上式表明矩阵是有界的;
[0265]
2)若ex0=0,则有故有
[0266][0267]
得出也是有界的;
[0268]
综上可知矩阵ξ
d θ
(n),π0(n),ψ0(n)和φ0(n)都是收敛的;且上述矩阵都是时不变矩 阵,即有
[0269]
ξ
d θ
(n)=ξ0(n

d

θ),π
d θ
(n)=π0(n

d

θ);
[0270]
ψ
d θ
(n)=ψ0(n

d

θ);
[0271]
φ
d θ
(n)=φ0(n

d

θ);
[0272]
因此,存在矩阵ξ,π,m1,ψ和φ,满足
[0273][0274][0275][0276]
同时,在式(25),(26),(28)和(29)两端取极限也可得到收敛值为
[0277][0278][0279]
因此,当时间变量n

∞,式(56)

(61)是成立的;且利用引理1和2直接得到,π≥ξ>0, m1≥0,ψ<0,φ<0和m
j
≤0,j=2,...,d 1;
[0280]
最后证明式(56)

(59)的解是唯一的;现假设存在另外一组解h,f,p和k也满足式(56)

(59);当有x0=ex0时,对式(66)两端取极限,得到
[0281]
j
*
(n)=e(x
′0πx0)=e(x
′0fx0);
[0282]
则有π=f;而且若有ex0=0,可得
[0283]
j
*
(n)=e{x
′0[π0(n)

qψ0(n)

qφ0(n)]x0}
[0284]
ꢀꢀꢀꢀꢀ
=e{x
′0[f0(n)

qp0(n)

qk0(n)]x0};
[0285]
由式(30)和(31),看出φ
k
(n)依赖于ψ
k
(n),也即若ψ0(n)≠p0(n),则有φ0(n)≠k0(n),这 与上述方程式矛盾;故在该方程两侧取极限得到ψ=p,φ=k;同时,对于给定的x
d θ
,在式 (51)两端取极限,直接得到e(x

d θ
ξx
d θ
)=e(x

d θ
hx
d θ
),则有ξ=h;综上可知式(56)

(61) 的解是唯一的;
[0286]
充分性:若式(56)

(61)中耦合的黎卡提方程有唯一解,则控制器(62)能够使得系 统方程(1)镇定;
[0287]
首先,令
[0288][0289]
同时经计算也能够得到
[0290][0291]
则对k≥d θ,有
[0292][0293][0294]
从式(69)看出,控制器满足式(62),且函数v(k,x
k
)关于n是单调递
减的; 同时经计算可得到
[0295][0296]
上式表明函数v(k,x
k
)是有界的,由单调有界原理可知函数v(k,x
k
)是收敛的;
[0297]
因此,通过式(69)得到
[0298][0299]
再由式(50)可得
[0300][0301]
在式(71)两端取极限并利用式(70),可得
[0302][0303]
利用引理2知ξ
d θ
(n)>0,则有也即式(62)中的控制器能够使得系统方程 (1)镇定;
[0304]
接下来证明控制器(62)可使目标函数(44)最小为(63);对式(68)两端从k=0到n 进行累加,得到
[0305][0306]
其中v(0,x0)和v(n 1,x
n 1
)已在式(67)中给出定义;利用射影定理可有
[0307][0308]
我们已经得到控制器(62)能够使得系统(1)镇定,因此有则
在式(72)两端对n取极限,目标函数(44)能够写为
[0309][0310]
通过以上的分析,控制器(62)可以使得目标函数(44)最小,且最优目标函数为式(63)。
[0311]
本发明所带来的有益技术效果:
[0312]
本文分析了带有乘性噪声、丢包、输入和量测时滞的离散网络控制系统中的最优输出反 馈控制和镇定性问题。对于带有丢包和量测时滞的乘性噪声系统,首次给出了递归的最优估 计器。基于该估计器,利用极大值原理求得了最优输出反馈控制器。同时给出了有限时间范 围内最优控制问题可解的充分必要条件。最后,基于标准的可观性假设,证明了在均方意义 下设计的控制器可以使得系统方程镇定,当且仅当耦合的黎卡提方程有唯一解。
附图说明
[0313]
图1为带有丢包和多时滞的网络控制系统图。
[0314]
图2为控制器为时系统的状态轨迹e(x

k
x
k
)图。
[0315]
图3为控制器为时系统的状态轨迹e(x

k
x
k
)图。
具体实施方式
[0316]
下面结合附图以及具体实施方式对本发明作进一步详细说明:
[0317]
具有丢包和多时滞的网络控制系统的最优控制研究方法,首先给出如下定义:符号表 示n维欧氏空间;上标'表示矩阵的转置;实数矩阵m>0表示矩阵m是正定的;实数矩阵m≥0 表示矩阵m是半正定的;表示指示函数,即当元素时,有否则有是由随机过程x所产生的自然滤波;e[
·
]是数学期望且是关于的条件期望;p(x)表 示当事件x发生时的概率;i表示单位矩阵;δ
kl
表示克罗内克函数,即当k=l时有δ
kl
=1,否 则有δ
kl
=0;
[0318]
所述方法具体包括如下步骤:
[0319]
步骤1:利用带有时滞的量测数据{y
k
}设计出了最优估计器;
[0320]
步骤2:利用极大值原理,解出了最优控制器,并给出了有限时间范围内可解的充分必 要条件;且最优控制器的增益为耦合的黎卡提方程的解;
[0321]
步骤3:通过定义一个李雅普诺夫函数,得出系统在均方意义下是可镇定的,当且仅当 给定的耦合的黎卡提方程有唯一解。
[0322]
在步骤2中,具体设计如下:
[0323]
有限时间的情况
[0324]
问题描述
[0325]
考虑下面带有丢包、输入时滞和量测时滞的乘性噪声系统:
[0326][0327]
y
k
=ω
k
x
k

θ

ꢀꢀꢀ
(2);
[0328]
其中,代表状态向量,代表控制器,代表其协方差为的标 量高斯白噪声;代表量测过程,ω
k
是服从概率为p(ω
k
=1)=p=1

q∈[0,1]的伯努利分布; a,b,是具有适当维数的常值矩阵,d和θ(>0)分别表示输入时滞和量测时滞;初始值x0表 示均值为μ,协方差为θ的高斯随机向量,初始控制器u
i
,i=

d,...,θ

1的值是已知的,而且 {ω
k
}和x0彼此相互独立;
[0329]
系统(1)和(2)的性能指标定义为:
[0330][0331]
其中,常值矩阵分别是用来平衡状态向量和输入向量的权重矩阵, x
n 1
为终端状态向量,为有界的常数终端加权矩阵;
[0332]
对于具有丢包和多时滞的乘性噪声系统,控制器u
k
只允许访问量测过程{y
θ
,...,y
k
},也 就是说,u
k
是可量测的;为了方便起见,将表示为同时,将 表示为将表示为
[0333]
问题1对于系统(1)和(2),利用量测数据{y
k
},找到一个可量测的控制器u
k
使 得目标函数(3)最小;
[0334]
为了确保问题的可解性,给出下面的假设:
[0335]
假设1目标函数(3)中矩阵满足q≥0,r>0和m
n 1
≥0;
[0336]
最优估计
[0337]
在求解最优控制器之前,首先给出最优估计器的表达式;为了表示方便,将估计器表示 为下面给出本小节的重要定理:
[0338]
定理1对于系统的状态方程(1)和量测方程(2),最优估计器的递推式为:
[0339][0340]
其中
[0341][0342]
初始值为且有 和p(ψ
k
=1)=q=1

p,θ≤k≤n,表示指示函数;
[0343]
除此之外,由系统方程(1)能够直接计算得到
[0344][0345]
证首先计算最优估计器的初始值令y
θ
=ω
θ
x0=h,则由条件期望的定义得到
[0346][0347]
其中,p(x
θ
=r
i
|y
θ
=h)表示在y
θ
=h发生的情况下x
θ
取值为r
i
的条件概率;下面进行讨论:
[0348]
1)对于量测数据y
θ
,当出现数据丢包时,也就是说y
θ
=h=0,此时有 p(x
θ
=r
i
,y
θ
=0)=p(x
θ
=r
i
)p(y
θ
=0),则由(5)能够得到
[0349][0350]
2)当没有发生丢包时,也即y
θ
=h≠0,则由(5)能够得到
[0351][0352]
因此,结合式(6)和(7),估计器的初始值表示为
[0353][0354]
由于系统噪声和{ω
k
}是相互独立的,则通过系统状态方程(1)得到
[0355][0356]
下面进一步分析最优估计器的一般形式θ≤k≤n;
[0357]
为了方便起见,令y
k
={y
θ
,...,y
k
};类比式(5),利用条件期望的定义,可得
[0358][0359]
分类讨论如下:
[0360]
1)若y
θ
=y
θ 1
...=y
k
=0,则有
[0361]
p(x
k
=r
i
,y
θ
=0,y
θ 1
=0,...,y
k
=0)=p(x
k
=r
i
)p(y
θ
=0,y
θ 1
=0,...,y
k
=0);
[0362]
因此,根据式(8)可得
[0363]
e[x
k
|y
θ
=h
θ
,y
θ 1
=h
θ 1
,...,y
k
=h
k
]=ex
k
ꢀꢀꢀ
(9);
[0364]
2)若有且其中{θ,θ 1,...,k

1}= {i
θ
,i
θ 1
,...,i
k
‑1},i
θ
<i
θ 1
<...<i
j
;此时有;此时有
[0365]
则根据式(8)可得
[0366][0367]
3)若k时刻没有数据丢包,即y
k
=h
k
≠0,估计器能够表示为
[0368][0369][0370]
其中y
k
=ω
k
x
k

θ
,且上式第二行利用了状态{x
k
}的马尔可夫特性;
[0371]
由式(1)和(11)可得
[0372][0373]
同理可得
[0374][0375]
则由式(12)和(13),式(11)中的估计器能够写成递推的形式,如下:
[0376][0377]
综上所述,由式(9)

(11)可得最优估计器的形式为
[0378][0379]
同时由系统方程(1)直接计算可得
[0380][0381]
下面对式(14)作进一步的化简;利用指示函数的特性可知
[0382][0383][0384]
因此,当y
θ
=y
θ 1
...=y
k
=0时,由式(16),式(14)能够写为
[0385]
e[x
k
|y
θ
,...,y
k
]=ex
k
=ae[x
k
‑1|y
k
‑1] bu
k

d
‑1ꢀꢀꢀ
(18);
[0386]
同时,若有其中i
θ
<i
θ 1
<...<i
j
<...≤i
k
‑1,则
[0387]
1)当i
j
<k

1时,即且y
k
‑1=0,由式(17),式(14)能够写为
[0388][0389]
2)当i
j
=k

1时,即y
k
‑1≠0,由式(17),式(14)能够写为
[0390][0391]
因此,由式(14),(18)

(20),并将定义为ψ
k
,得到最优估计器的递推形式为
[0392][0393]
上式即为式(4);
[0394]
最优输出反馈控制
[0395]
为了得到问题1的解,对系统状态方程(1)和目标函数(3)应用极大值原理得到如下 的共态方程:
[0396]
λ
n
=m
n 1
x
n 1
ꢀꢀꢀ
(21);
[0397][0398][0399]
其中下面给出问题1完整的解;
[0400]
定理2基于假设1,对于系统(1)和(2,问题1有唯一的解,当且仅当矩阵δ
k
>0, k=d θ,...,n;且设计的令目标函数(3)最小的最优输出反馈控制器为
[0401][0402]
其中估计器满足下式
[0403][0404]
估计器已经在定理1中给出,且增益δ
k d
和γ
k d
满足
[0405][0406][0407]
在式(25)和(26)中,矩阵ψ
k

k
满足下列的黎卡提差分方程
[0408][0409][0410][0411][0412]
φ
k
=(1

q)a

ψ
k 1
a a

φ
k 1
a,
ꢀꢀꢀ
(31);
[0413]
式(27)

(31)中的终端条件为ψ
n 1
=0,φ
n 1
=0;
[0414]
同时可得式(3)中的最优目标函数为
[0415][0416]
且状态和共态之间的关系满足下式
[0417][0418]
推论令
[0419]
对式(27)

(31)两端从i=3到d 1进行累加,得到下面耦合的黎卡提方程
[0420][0421]
[0422][0423]
φ
k
=(1

q)a

ψ
k 1
a a

φ
k 1
a,
ꢀꢀꢀ
(37);
[0424]
上式中的终端值为ξ
n 1
=π
n 1
=m
n 1
,且矩阵δ
k
和γ
k
能够直接计算得到
[0425][0426][0427]
下面给出定理2的证明:
[0428]
证首先给出必要性的证明,即在假设1的前提下,如果问题1有唯一解,式(25)中的 矩阵δ
k
,d θ≤k≤n是严格正定的;定义新的目标函数为
[0429][0430]
令式(40)中的k=n,得到
[0431]
j(n)=e[x
n

qx
n
u
n

d

ru
n

d
] x
n 1

m
n 1
x
n 1

[0432]
将系统的状态方程(1)代入上式,则j(n)能够写成状态x
n
和控制器u
n

d
的二次型形式, 且由于控制器解的唯一性,该二次型必然是正定的;令状态x
n
=0,得到
[0433][0434]
因此δ
n
>0成立;
[0435]
下面计算最优控制器;由式(1)和(21),平衡方程(23)能够写为
[0436][0437]
因此,当k=n时的最优控制器为
[0438][0439]
明显式(41)满足式(24);
[0440]
接下来说明k=n时的共态方程具有式(33)的形式;利用式(1)、(21)、(22)和(41), 得到
[0441][0442]
上式满足式(33),且矩阵和分别满足式(27)和(28);
[0443]
为了进一步分析一般情况,并利用数学归纳法,取d θ≤l≤n,当k≥l 1,假设式(25) 中的矩阵是正定的,且控制器u
k

d
和共态λ
k
‑1的表达式为式(24)和(33);接下来证明该情形 在k=l时也成立;
[0444]
首先需要证明矩阵δ
l
的可逆性;由式(1)、(22)和(23),得到
[0445][0446]
将上式从k=l 1到n进行累加,得到
[0447]
[0448]
利用上式以及式(21),并令式(40)中的k=l,则j(l)表示成
[0449][0450]
将式(33)代入上式,并令x
l
=0,则j(l)被写成
[0451][0452]
由于最优控制器解u
l

d
的唯一性,则式(25)中矩阵δ
l
是严格正定的,也即δ
l
>0成立;
[0453]
下面求解最优控制器;将式(33)代入式(23)得到
[0454][0455]
则最优控制器的解为
[0456][0457]
其中矩阵δ
l
和γ
l
分别满足式(25)和(26);因此,最优控制器(24)在k=l时也成立;
[0458]
最后证明状态和共态之间的关系式满足式(33),如下:
[0459][0460]
显然该式成立;这就完成了必要性的证明;
[0461]
下面给出充分性的证明,即当式(25)中的矩阵δ
k
>0,k=d θ,...,n时,证明问题1有 唯一解;定义
[0462][0463]
则由式(1)、(25)

(31),能够计算得到v
n
(k 1,x
k 1
)如下
[0464][0465]
令v
n
(k,x
k
)和v
n
(k 1,x
k 1
)作差,得到
[0466][0467]
对式(41)两端从k=d θ到n进行累加,得到
[0468][0469]
利用上式将目标函数写为
[0470][0471][0472]
在上式中,x0,u
i
,i=

d,...,θ

1已经初始化,对于0≤k≤d θ

1,x
k
能够由初始值进行求 解,且矩阵δ
k
是严格正定的;因此,令目标函数取到最小值,最优控制器的唯一性
即可得证, 且满足式(24)。
[0473]
在步骤3中,具体设计如下:
[0474]
无限时间的情况
[0475]
问题描述
[0476]
为了分析系统的镇定性,求解系统(1)和(2)在无限时间时的镇定问题;当n

∞时 考虑如下的性能指标:
[0477][0478]
首先给出下面几个重要的定义:
[0479]
定义1对于给定的初始值x0,u

d
,...,u
θ
‑1,且控制器u
k

d
=0,k≥d θ,如果有
[0480][0481]
则称方程(1)为渐进均方稳定的;
[0482]
定义2方程(1)在均方意义下是可镇定的,当存在一个可量测的控制器 其中l和l
i
(i=1,...,d θ)是常值矩阵,且满足使得 (1)的闭环系统是渐进均方稳定的;
[0483]
定义3对于下面的随机系统
[0484][0485]
为了方便起见,将上述系统简记为基于假设1,有q=c'c成立;如果有下式成立
[0486][0487]
则称系统是完全可观测的;
[0488]
问题2找到一个可测的控制器u
k

d
使得系统(1)是渐进均方稳定的,同时使得 目标函数(44)最小;
[0489]
假设2是完全可观测的;
[0490]
问题2的解
[0491]
为了表述清晰,将矩阵δ
k

k

k

k

k

k
写为δ
k
(n),γ
k
(n),ψ
k
(n), φ
k
(n),ξ
k
(n),π
k
(n);由于终端值m
n 1
=0,故上述矩阵都为时不变矩阵;
[0492]
下面给出几个重要引理:
[0493]
引理1基于假设1,得到π
k
(n)≥ξ
k
(n)≥0,φ
k
(n)<0和 [0494]
证在定理1中已经证得了δ
k
(n)>0,k≥d θ,由式(28)

(31)能够直接观察得出矩 阵ψ
k
(n),φ
k
(n)都是负定的;接下来证明π
k
(n)≥ξ
k
(n)≥0和成立;定义
[0495]
[0496]
其中m≥d θ;由式(3)和(32)能够类比得到式(45)的最优解为
[0497][0498]
对式(46)分析如下:
[0499][0500]
其中有同理可得
[0501][0502][0503]
则由式(46)

(49);得到
[0504][0505]
由于状态x
d θ
是随机变量,因此,得到
[0506]
ξ
d θ
(m)≥0;
[0507]
也即由定理2看出则必有利用ξ
d θ
(m),和的时 不变特性,令m=n d θ

k,则有ξ
k
(n)=ξ
d θ
(n d θ

k)≥0,和 [0508]
因此不等式π
k
(n)≥ξ
k
(n)≥0,和也成立;
[0509]
引理2基于假设1和2,存在一个常数n0>0,使得当n>n0时,有ξ
d θ
(n)>0;
[0510]
证对于式(46),选定状态向量x
d θ
(≠0),则有假设ξ
d θ
(n)=0成立,那么式(46)能够写为
[0511][0512]
其中和分别代表最优状态策略和最优控制器;由假设1可知,q=c'c≥0且r>0, 再由式(51)能够观察得出
[0513]
[0514]
则系统方程(1)能够写成
[0515][0516]
基于定义3和假设2,得到x
d θ
=0,矛盾;因此假设不成立,则有n0>0,使得当n>n0时,有ξ
d θ
(n)>0成立;
[0517]
引理3系统方程(1)是可镇定的,当且仅当不等式成立;
[0518]
证首先给出充分性的证明;显然,如果成立,则必有基于 定义2可知系统方程(1)是可镇定的;
[0519]
下面证明必要性,即若系统方程(1)是可镇定的,则不等式成立;
[0520]
由定义2可知,存在使得系统方程(1)是渐进均方稳定的;定 义如下矩阵
[0521][0522][0523]
利用上述矩阵可将系统方程(1)转变为一个新的状态方程为
[0524][0525]
且控制器u
k
能够写为
[0526][0527]
将式(53)代入式(52)得到
[0528][0529]
回顾定义2可知,控制器可使系统方程(1)渐进均方稳定,也即存在
同时,我们能够得到
[0530][0531]
则由式(54)能够直接得到且有因此可得
[0532][0533]
利用式(55),能够得到也即
[0534][0535]
定理3系统方程在均方意义下是可镇定的,当且仅当推论中耦合的黎卡提方程有唯一解, 且有π≥ξ>0,m1≥0,ψ,φ≤0和m
j
≤0,j=2,...,d 1:
[0536][0537][0538]
ψ=

(a

)
d
γ

δ
‑1γa
d
qa

ψa
ꢀꢀꢀ
(58);
[0539]
φ=(1

q)a

ψa a

φa
ꢀꢀꢀ
(59);
[0540]
其中δ和γ为
[0541][0542][0543]
使系统镇定的控制器为
[0544][0545]
式(44)对应的最优目标函数为
[0546][0547]
其中
[0548][0549]
下面给出定理3的证明:
[0550]
必要性:即若系统方程(1)是均方可镇定的,则式(34)

(39)中耦合的黎卡提方程 有唯一解,且π≥ξ>0,ψ,φ≤0;
[0551]
首先给出矩阵ξ
d θ
(n),π
d θ
(n),ψ
d θ
(n)和φ
d θ
(n)关于n的单调性证明;回顾式(32)和(42), 最优目标函数能够写为
[0552][0553]
其中,且u
j
=0,j=

d,...,

1,1,下面对式(65)进行讨论:
[0554]
1)如果有x0=ex0成立,则由定理1可以得到那么式(65)能够写为
[0555][0556]
由于j
*
(n)≤j
*
(n 1)能够得到也即 π0(n)≤π0(n 1)成立;
[0557]
2)如果有ex0=0成立,能够得到类比上述分析得
[0558][0559]
3)对于给定的x
d θ
,由式(46),令m=n,可有h
*
(n)≤h
*
(n 1),则可得
[0560][0561]
也即ξ
d θ
(n)≤ξ
d θ
(n 1)成立;
[0562]
综上所述,看出π0(n),和ξ
d θ
(n)关于n是单调递增的;
[0563]
下面证明上述矩阵是有界的;由定义2知,存在控制器使得系统方程(1)镇 定;选定一常数λ使得q≤λi,成立;则有
[0564][0565]
其中c和c1是常数;因此,得到
[0566][0567]
再由式(50),可知
[0568][0569]
上式表明矩阵ξ
d θ
(n)是有界的;
[0570]
类比式(65)进行如下讨论:
[0571]
1)若x0=ex0,则有故有
[0572][0573]
上式表明矩阵是有界的;
[0574]
2)若ex0=0,则有故有
[0575][0576]
得出也是有界的;
[0577]
综上可知矩阵ξ
d θ
(n),π0(n),ψ0(n)和φ0(n)都是收敛的;且上述矩阵都是时不变矩 阵,即有
[0578]
ξ
d θ
(n)=ξ0(n

d

θ),π
d θ
(n)=π0(n

d

θ);
[0579]
ψ
d θ
(n)=ψ0(n

d

θ);
[0580]
φ
d θ
(n)=φ0(n

d

θ);
[0581]
因此,存在矩阵ξ,π,m1,ψ和φ,满足
[0582][0583][0584][0585]
同时,在式(25),(26),(28)和(29)两端取极限也可得到收敛值为
[0586][0587][0588]
因此,当时间变量n

∞,式(56)

(61)是成立的;且利用引理1和2直接得到,π≥ξ>0, m1≥0,ψ<0,φ<0和m
j
≤0,j=2,...,d 1;
[0589]
最后证明式(56)

(59)的解是唯一的;现假设存在另外一组解h,f,p和k也满足式 (56)

(59);当有x0=ex0时,对式(66)两端取极限,得到
[0590]
j
*
(n)=e(x
′0πx0)=e(x
′0fx0);
[0591]
则有π=f;而且若有ex0=0,可得
[0592]
j
*
(n)=e{x
′0[π0(n)

qψ0(n)

qφ0(n)]x0}
[0593]
ꢀꢀꢀꢀꢀ
=e{x
′0[f0(n)

qp0(n)

qk0(n)]x0};
[0594]
由式(30)和(31),看出φ
k
(n)依赖于ψ
k
(n),也即若ψ0(n)≠p0(n),则有φ0(n)≠k0(n),这 与上述方程式矛盾;故在该方程两侧取极限得到ψ=p,φ=k;同时,对于给定的x
d θ
,在式 (51)两端取极限,直接得到e(x

d θ
ξx
d θ
)=e(x

d θ
hx
d θ
),则有ξ=h;综上可知式(56)

(61) 的解是唯一的;
[0595]
充分性:若式(56)

(61)中耦合的黎卡提方程有唯一解,则控制器(62)能够使得系 统方程(1)镇定;
[0596]
首先,令
[0597][0598]
同时经计算也能够得到
[0599][0600]
则对k≥d θ,有
[0601][0602]
=e[x

k
qx
k
u

k

d
ru
k

d
]≥0。
ꢀꢀꢀ
(69);
[0603]
从式(69)看出,控制器满足式(62),且函数v(k,x
k
)关于n是单调递减的; 同时经计算可得到
[0604][0605]
上式表明函数v(k,x
k
)是有界的,由单调有界原理可知函数v(k,x
k
)是收敛的;
[0606]
因此,通过式(69)得到
[0607][0608]
再由式(50)可得
[0609][0610]
在式(71)两端取极限并利用式(70),可得
[0611][0612]
利用引理2知ξ
d θ
(n)>0,则有也即式(62)中的控制器能够使得系统方程 (1)镇定;
[0613]
接下来证明控制器(62)可使目标函数(44)最小为(63);对式(68)两端从k=0到n 进行累加,得到
[0614][0615]
其中v(0,x0)和v(n 1,x
n 1
)已在式(67)中给出定义;利用射影定理可有
[0616][0617][0618]
我们已经得到控制器(62)能够使得系统(1)镇定,因此有则在式(72)两端对n取极限,目标函数(44)能够写为
[0619][0620]
通过以上的分析,控制器(62)可以使得目标函数(44)最小,且最优目标函数为式(63)。
[0621]
仿真例子
[0622]
例1令系统方程(1)和目标函数(3)的参数为
[0623]
a=0.8,σ2=1,d=3,θ=2
[0624]
x0=1,u1=0.8,u
i
=0,i=

3,...,0
[0625]
q=r=1,n=7,m
n 1
=0。
[0626]
利用推论直接计算可以得到
[0627]
ξ5=1.7101,ξ6=1.5399,ξ7=1
[0628]
π5=2.6821,π6=1.8900,π7=1
[0629]
ψ5=0,ψ6=0,ψ7=0
[0630]
φ5=0,φ6=0,φ7=0
[0631]
δ5=2.0570,δ6=1.6500,δ7=1
[0632]
γ5=1.2404,γ6=0.7600,γ7=0。
[0633]
从上述值中可以看出对于k=4,5,6有δ
k
>0,因此由定理2可知输出反馈控制问题有唯一 解。计算得到的最优控制器为
[0634]
u4=0。
[0635]
例2该数值算例证明了对于无限时间的情况,在定理3中设计的控制器可以使系统方程 (1)镇定。考虑系统方程(1)和目标函数(3)的参数为
[0636]
a=0.4,b=0.4,σ2=1,d=4,θ=3
[0637]
x0=1,u1=0.5,u2=1,u
i
=0,i=

4,...,0
[0638]
q=r=1>0,
[0639]
且假设1和2都满足。通过解式(56)

(61)可以得到
[0640]
ξ=2.2074,π=31.4114,ψ=

0.0165,φ=

0.0025
[0641]
δ=21.4310,γ=22.9407,
[0642]
明显有π>ξ>0,ψ<0和φ<0。由定理3可知,在均方意义下求得的控制器u
k

d


1.0704
[0643]
可以使得系统方程(1)镇定。如图所示,系统状态是渐进均方稳定的。
[0644]
例3为了证明定理3的有效性,根据例2的描述,选择另外一个控制器u
k

d


4.5596
[0645]
其中该控制器的增益也是解式(56)

(61)中耦合的黎卡提方程得到的。此时相关的 仿真例子如图所示,可以明显的看出选定的控制器不能使系统方程(1)镇定。
[0646]
本文分析了带有乘性噪声、丢包、输入和量测时滞的离散网络控制系统中的最优输出反 馈控制和镇定性问题。对于带有丢包和量测时滞的乘性噪声系统,首次给出了递归的最优估 计器。基于该估计器,利用极大值原理求得了最优输出反馈控制器。同时给出了有限时间范 围内最优控制问题可解的充分必要条件。最后,基于标准的可观性假设,证明了在均方意义 下设计的控制器可以使得系统方程镇定,当且仅当耦合的黎卡提方程有唯一解。
[0647]
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的 技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护 范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献