一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于联盟形成博弈的无人设备内容协同实现方法与流程

2021-10-27 20:28:00 来源:中国专利 TAG:博弈 协同 分布 控制 方法


1.本发明涉及的是一种分布信息控制领域的技术,具体是一种基于联盟形成博弈(coalition formation game,cfg)的无人设备内容协同实现方法。


背景技术:

2.缓存技术是一种缓解链路拥塞的有潜力的技术。对于用户密集场景,目前大多数现有的缓存工作通常是在没有移动性的静态网络中进行,缓存的内容存储在地面静态基站。然而,在用户超密集和高层建筑等地区,具有缓存的静态地面基站可能无法满足用户的高容量需求。由于快速高效、los链接到地面节点、可控制移动等优点,无人机在未来无线通信中具有很高的缓存前景,可以部署为空中基站来辅助传统的蜂窝网络。
3.现有的无人机群协同技术包括通过场方法构建的人工势场与人工涡旋场来计算加速度参考值,或将夏普利值作为联盟收益分配的解;但这些技术大多在机群合作时未考虑系统可靠性、传输时延、单个无人机负载压力以及等问题,构建联盟的算法过程中会出现重复计算无人机加入、收敛速度慢,难以满足实际工程需要。


技术实现要素:

4.本发明针对现有技术在基站负荷过大时导致用户服务质量差问题,提出一种基于联盟形成博弈的无人设备内容协同实现方法,基于联盟博弈算法构建无人设备联盟,分析无人设备传输能耗和用户满意度以及系统可靠性,建立多无人设备协同通信策略,以达到最大化系统效用目标。
5.本发明是通过以下技术方案实现的:
6.本发明涉及一种基于联盟形成博弈的无人设备内容协同实现方法,根据用户间相似度,利用谱聚类算法对用户进行分簇,并基于用户偏好和目前内容流行度分布,在无人设备上进行内容缓存,再根据无人设备系统效用函数最大化原则,将无人设备的协作内容传输问题建模为联盟博弈模型,进行无人设备结盟博弈,最终收敛形成稳定的联盟结构。
7.所述方法具体包括:
8.步骤a,基于谱聚类算法的用户分簇:为提高无人机缓存资源的利用效率,考虑用户之间的相似性其中:用户间内容偏好相似性sim1
u,v
和用户间物理距离相似性sim2
u,v

9.步骤a

1,内容偏好相似性,设定当用户u对内容f的兴趣为p
u,f
,用户v对内容f的兴趣为p
v,f
,即用户请求某个内容的概率,则用户间内容偏好相似度其中:p
u
=[p
u,1
,p
u,2
,...,p
u,f
],p
v
=[p
v,1
,p
v,2
,...,p
v,f
]为用户u,v的兴趣向量,f为内容数量。
[0010]
步骤a

2,物理距离相似度其中:dist
u,v
是用户u和v之间的距
离,maxdist表示所有用户间的最大距离。为避免单个uav的接入用户数量过大造成链路拥堵,对内容偏好相似度和物理距离相似度分别以α1和α2进行加权,则用户间相似度为任意两个用户间的相似度构成用户间相似度矩阵s。
[0011]
步骤a

3,矩阵s作为输入,利用谱聚类算法进行用户簇的划分,具体包括:
[0012]
步骤a

31,数据准备,构建相似度矩阵s,根据s构建邻接矩阵w=s和度矩阵d,其中:d对角元素为
[0013]
步骤a

32,计算拉普拉斯矩阵l=d

w以及标准化后的拉普拉斯矩阵d

1/2
ld

1/2

[0014]
步骤a

33,计算d

1/2
ld

1/2
最小的n个特征值和对应的特征向量,并对特征向量组成的矩阵进行标准化,得到特征矩阵f;
[0015]
步骤a

34,将f中的每一行作为一个样本,使用聚类方法进行聚类,得到簇划分c(c1,c2,...,c
n
),其中:n为无人机数量,即聚类维数。
[0016]
步骤b,根据步骤a得到的用户分簇划分结果c(c1,c2,...,c
n
)和内容流行度进行内容缓存,具体为:根据每个无人机服务的用户确定,利用zipf模型构建内容f的流行度分布其中:f为内容数量,β表示分布的偏态,在无人机n中内容f的缓存概率为其中:f为内容数量,β表示分布的偏态,在无人机n中内容f的缓存概率为其中:p
u,f
为用户兴趣,γ1和γ2表示内容流行度和用户偏好对缓存策略的影响程度。
[0017]
步骤c,根据步骤a得到的用户分簇划分结果和无人机位置信息以及步骤b得到的内容缓存策略c
n,f
,采用基于合作博弈的无人设备联盟构建,以实现系统效用最大化为目标构建联盟,具体包括:
[0018]
步骤c

1,初始化联盟,每个无人设备作为独立联盟,定义历史选择集合h
n
和候选集合ca
n

[0019]
步骤c

2,计算无人机n的自身效用u
n
,联盟效用和系统总效用其中:s
k
为联盟,π为联盟结构。
[0020]
步骤c

3,将无人机n加入现存联盟中的一个联盟,计算加入后的自身效用、联盟效用和系统效用,判断无人机n是否满足以下三个转移条件:
[0021]
步骤c

31,无人机n从当前联盟s
i
加入到联盟s
j
时,自身效用不小于加入前的效用;
[0022]
步骤c

32,无人机n从当前联盟s
i
加入到联盟s
j
后,系统效用大于加入前的联盟结构下的系统效用;
[0023]
步骤c

33,选择的联盟s
j
不存在于h
n
中。若满足前两个转移条件,则联盟s
j
加入到ca
n
,若不满足转移条件,则重新选择一个联盟加入。
[0024]
步骤c

4,若ca
n
不为空,将无人机加入ca
n
中使系统效用最大的联盟s
opt
,并将s
opt
加入到历史选择集合h
h
,更新联盟结构。否则,历史集合不变。
[0025]
步骤c

5,所有无人机历史选择集合不再发生改变,博弈结束,获得最优联盟。技术效果
[0026]
本发明整体解决了现有技术在用户密集场所下,用户内容访问服务质量下降问
题。利用无人设备协助地面基站,充分考虑用户之间的相似性和无人设备之间的通信能力,构建无人设备联盟以协同传输内容,优化内容传输系统并提升系统效用;本发明在用户密集分布的情况下,获得的系统性能明显优于无人设备非合作方式。本发明将合作博弈理论和内容缓存与传输问题结合在一起,以系统整体效用最大化为目标,对基于博弈形成联盟的无人设备协同内容缓存与传输问题进行了研究。为了得到最大的系统效用,无人设备之间不断博弈形成联盟以更好地服务于用户,最终得到使系统最大化的稳定联盟结构,并且效果与传统的联盟形成准则相比更优异,表明本发明效用更好。
附图说明
[0027]
图1为实施例场景示意图;
[0028]
图2为分簇后的用户分布和无人机分布位置示意图;
[0029]
图3为系统收敛情况的仿真结果图;
[0030]
图4为本发明与非合作方式对比的结果图;
[0031]
图5为网络效用与内容缓存方式的关系图;
[0032]
图6为网络效用与无人机数量的关系图;
[0033]
图7为本发明的具体步骤流程图。
具体实施方式
[0034]
实验环境为windows10 64bit操作系统,cpu为intel i5

10210u,gpu为nvidia geforce mx 250,内存为16gb,实验的开发语言为matlab。
[0035]
当所有通信采用正交信道,以减少其他设备的干扰。并当无人机和用户在数据传输过程中不移动,则无人机与用户之间(uav

ue链路)、宏基站与无人机之间(mbs

uav链路)、无人机与无人机之间(uav

uav链路)的信噪比snr分别为:
[0036]
1)uav

ue链路:无人机到用户的传播信道采用标准对数法向阴影模型。标准对数法向阴影模型可以通过选择特定的通道参数对视距los和非视距nlos链路进行建模,具体为:
[0037]
其中:n为无人机,u为用户,f=5ghz为载波频率,d
n,u
表示无人机n与用户u之间的距离,η
los
=1.6dbm和η
nlos
=23dbm分别表示视距los和非视距nlos链路的额外路径损耗分量。
[0038]
los链路的概率取决于环境(建筑的密度和高度),无人机和用户的位置,无人机与用户之间的仰角,具体为:其中:x=11.9和y=0.13是常数,取决于环境因素(城市,郊区,密集城市等),是无人机与用户之间的俯仰角,h=100m为无人机悬停高度。
[0039]
无人机与用户之间的路损为:
[0040]040]
其中:a=η
los

η
nlos
,b=20log(4πf/c) η
nlos
,则无人机与用户链路的snr为:p
n
=30dbm表示无人机发射功率。
[0041]
2)mbs

uav链路:宏基站与无人机之间同样采用los链路和nlos链路模型。从宏基站到无人机的los和nlos路损分别为其中:α=2是路损指数,是nlos链路的额外路损系数。则los和nlos链路的概率为:是nlos链路的额外路损系数。则los和nlos链路的概率为:其中:同样计算路损同样计算路损得到宏基站与无人机链路的snr为:其中p0=43dbm表示宏基站发射功率。
[0042]
3)uav

uav链路:无人机之间的通信采用wi

fi通信,对于wi

fi信号在自由空间传播时的路损即无人机之间协作链路的路损为pl
n,n

=32.44 20lg f
w
20lg d
n,n

,其中:f
w
=2.4ghz为无人机工作频率,d
n,n

是无人机之间的距离。则无人机与无人机链路的snr为:是无人机之间的距离。则无人机与无人机链路的snr为:
[0043]
通过上述计算,得到uav

ue、mbs

uav和uav

uav链路的信噪比,对于数据传输,计算其传输速率和传输时延。
[0044]
对于uav与用户之间的无线接入链路、mbs与uav之间的回程链路和uav

uav之间的协作链路,当无线接入链路带宽b=20mhz,回程链路带宽b
b
=10mhz,协作链路带宽为b
c
=10mhz,内容大小统一为s
f
=10mbits,其数据率分别是=10mbits,其数据率分别是其中:n为无人机数量,u
n
为无人机n服务下的用户数量。因此其传输时延分别是:d
n,u
=s
f
/r
n,u
,d
0,u
=s
f
/r
0,u
,d
n,n

=s
f
/r
n,n


[0045]
如图7所示,本实施例涉及一种基于联盟形成博弈的无人机内容协同实现方法,具体步骤包括:
[0046]
步骤一、基于用户之间的内容偏好相似和距离相似并添加不同权重形成分簇标准,对用户进行分簇,使得每个无人机确定其服务用户以提高有限的无人机缓存资源的利用效率,具体为:其中:用户对内容偏好相似度物理距离相似性p
u
是用户u对所有内容的偏好分布,p
v
是用户v对所有内容的偏好分布,dist
u,v
是用户u和v之间的距离,maxdist表示所有用户间的最大距离,α1和α2分别为权重参数,用户关联变量y
n,u
∈{0,1},y
n,u
=1表示用户u关联到无人机n。
[0047]
所述的分簇标准,同时考虑无人机的负载情况,控制无人机接入用户的数量,避免单个无人机接入用户数量过大造成链路拥塞,具体为:利用谱聚类(spectral clustering,sc)算法对用户进行分簇,将用户之间的相似度矩阵sim={sim
n,u
,n∈n,u∈u}作为输入,最终获得每个簇的划分情况即每个无人机的服务用户分布情况c(c1,c2,...,c
n
),如图2左所示;无人机的位置确定为每个簇的簇心,因此无人机与用户位置分布情况如图2右所示。
[0048]
步骤二、计算基于用户偏好和流行度的内容缓存策略,并根据缓存策略对内容进行排序,选择前q个内容在无人机内进行内容缓存,具体为:内容缓存策略c
u,f
=γ1p
u,f
γ2q
f
,其中:q
f
表示内容流行度,即任一时间段内用户u对内容f的请求概率p
u,f
表示用户偏好,γ1和γ2为权重参数,用以表示在内容缓存过程中,内容流行度和用户偏好所占
比重。
[0049]
所述的内容缓存策略,根据每个无人机服务下的用户确定,考虑当前内容流行度分布,同时考虑每个无人机服务用户的偏好和无人机缓存空间q的限制。
[0050]
步骤三、通过传输能耗、用户满意度和系统可靠性构建系统效用函数,将无人机协作内容传输问题建模为联盟博弈模型。
[0051]
所述的系统效用函数u
n
=εmos
n

δe
n
ηr
n
,其中:ε、δ和η分别为划分三个指标对无人机效用函数的影响大小的比例因子,mos
n
为服务无人机n的用户满意度,e
n
为通信能耗,r
n
为无人机系统的可靠性函数。
[0052]
所述的用户满意度,利用mos(mean opinion score,平均主观意见分)模型,来评估用户的qoe,因此可得服务无人机n的满意度其中:c1,c2为常数,c1>0,为用户请求时延,x
n,f
为内容缓存变量,x
n,f
=1表示无人机n缓存了内容f,x
n,f
=0表示无人机n未缓存内容f,x
n

,f
为无人机n

(除无人机n之外的其他无人机)的内容缓存变量。
[0053]
所述的通信能耗其中:无人机将内容传输给用户产生的能耗为无人机通过协作链路与其他无人机通信产生的能耗为内容在其它无人机下都未缓存而通过回程链路向宏基站请求时产生的能耗为p0和p
n
表示宏基站发射功率和无人机发射功率。
[0054]
所述的无人机系统的可靠性函数其中:r
n
=in(re
n
),re
n
为单个无人机通信时的可靠性,d
n,u,f
为无人机n服务下的用户u请求内容f的时延,r
n,u,f
∈{0,1}为用户请求内容二进制变量,r
n,u,f
=1表示无人机n下的用户u请求了内容f。
[0055]
所述的无人机协作内容传输问题是指:当用户在其服务无人机中未请求到所需内容时,无人机可通过协作链路与其他无人机进行通信,当其他无人机缓存了该内容,则无人机可以将该内容传输给用户,减少从宏基站访问过程,进而减少时延。因此无人机协作方式能够减少用户请求时延,提高用户满意度,进而提高系统效用。
[0056]
所述的联盟博弈模型,具体为:
[0057][0058]
s.t.x
n,f
∈{0,1},r
n,u,f
∈{0,1}
[0059]
其中:u
sys
为系统总效用,s
k
为联盟,π={s1,s2,...,s
k
}为联盟组结构,s
k
的联盟效用u
n
为无人机效用,x
n,f
为内容缓存变量,r
n,u,f
为用户请求变量,不等式表示内容缓存数量之和不超过无人机缓存空间。
[0060]
步骤四、构建基于合作博弈的联盟,即同一联盟的无人机进行协作传输,无人机之间以系统效用最大化为目标进行博弈,最终联盟结构达到收敛稳定。
[0061]
所述的联盟结构是在n中,所有玩家的联盟组π={s1,s2,

,s
k
},其中:},其中:k是分区π中的联盟总数量。例如n={1,2,3,4,5,6,7,8},则联
盟s1={1,2,3},s2={3,5,6},s3={7,8}是n的分区,当没有联盟s
k
内的玩家成员会通过加入其它联盟入其它联盟来改变当前的分区或者分裂成更小的不相邻的联盟时,该联盟结构π={s1,s2,...,s
k
}是稳定的分区。
[0062]
所述的基于合作博弈是指:对于任意的无人机,它可以加入任意的联盟,并与联盟中的无人机进行协作传输内容。对于无人机n,定义>
n
为无人机n可能形成的所有可行联盟集合上的一个完整的可传递的关系。当s
i

n
s
j
,表示无人机n相比于联盟s
j
更愿意加入联盟s
i
,这种偏好关系会影响着最终联盟结构的形成。无人机之间互相博弈形成联盟,根据这种偏好关系即联盟形成准则考虑加入新联盟或停留在原联盟,最后达到所有联盟稳定。在联盟形成博弈中,偏好顺序可以保证联盟稳定性的存在。除了偏好顺序外,联盟的形成还有很多准则,不同的准则导致不同的联盟结果。
[0063]
所述的联盟形成准则是指:当无人机n加入联盟后联盟总效用高于加入联盟前联盟总效用且自身效用提高,则该无人机将加入到新联盟中,具体为:当无人机选择加入联盟s1而不是s2时,其自身效用增加,并且会增加系统总效用。因此,本发明的联盟形成准则为:时,其自身效用增加,并且会增加系统总效用。因此,本发明的联盟形成准则为:其中:是无人机n加入联盟s
i
后的新联盟s
i
和原联盟s
j
的联盟效用,是无人机n加入联盟s
i
前的联盟s
i
和原联盟s
j
的联盟效用。由于无人机的加入只会影响新旧联盟,对其他联盟不会产生影响,因此考虑新旧联盟的联盟效用进而影响系统效用是可行的。
[0064]
所述的联盟形成准则,不但要满足当无人机加入联盟时,其自身效用增加且会增加系统总效用的同时,还要满足未出现在历史选择集合才能进行转移到新联盟中,同时将该联盟加入到候选集合ca
n
中。在候选集合中选择使系统效用最大的最优联盟作为无人机n最终加入的联盟,并将最优联盟加入到无人机n的历史选择集合h
n
中。
[0065]
所述的收敛稳定是指:在联盟博弈过程中,为确保上述准则即无人机转移条件能够收敛,并且加快收敛速度,避免无人机重复加入同一个联盟,本发明定义一个历史选择集合h
n
和候选集合ca
n
,具体如下:对于每个无人机n,其历史选择集合h
n
包含了曾经加入的所有联盟。
[0066]
所述的联盟结构达到收敛稳定是指:通过无人机根据联盟形成准则和设置候选集合与历史选择集合,不断博弈并最终收敛形成稳定的联盟结构,具体包括:
[0067]
4.1)初始化联盟:每个无人机为一个独立联盟,即初始联盟为π={{1},{2},...,{k}},设置无人机历史选择集合h
n
和候选集合ca
n

[0068]
4.2)在现存联盟下计算无人机n的自身效用u
n
,各个联盟效用和总系统效用u
sys

[0069]
4.3)无人机n从现存联盟中选择一个联盟,计算其加入后的自身效用、联盟效用和系统效用,判断无人机n是否满足以下转移条件:
[0070]
a)无人机n从当前联盟s
i
转移到联盟s
j
时,自身效用不小于加入前的效用;
[0071]
b)无人机n从当前联盟s
i
转移到联盟s
j
时,形成新的联盟结构后,系统效用大于加入前的原联盟结构下的系统效用;
[0072]
c)选择的联盟s
j
不存在于历史集合中。
[0073]
当满足转移条件,则将联盟s
j
加入到候选集合中;当不满足转移条件,则重新选择一个联盟加入。
[0074]
4.4)当候选集合不为空,在无人机n的候选联盟中选择使系统效用最大的联盟s
opt
,将无人机加入,并将该联盟s
opt
加入到无人机n的历史选择集合中,同时更新联盟结构。否则,历史选择集合不发生改变。
[0075]
4.5)当所有无人机的历史集合不再发生改变,则博弈结束,获得稳定的联盟结构。
[0076]
如图1所示,为本实施例涉及的具体应用场景,包括:一个宏基站、n个无人机和u个分布在二维平面不同位置的用户。
[0077]
所述的用户,通过随机几何理论来建模其分布,将其建模为密度为λ的泊松点过程分布,则宏基站位置为w0=(x0,y0),用户位置为w
u
=(x
u
,y
u
),无人机在二维平面的位置为w
n
=(x
n
,y
n
),本实施例中无人机在同一高度h悬停。
[0078]
无人机辅助地面基站服务用户时,其与地面基站存在回程链路,无人机与用户之间存在无线接入链路。由于无人机之间通信间隔在几百米之间,按照无线电频率划分和频谱运用状况,无人机之间通信选择wi

fi的数据通信方式,频段选择2.4ghz,因此无人机之间的协作链路采用wi

fi通信链路。
[0079]
经过具体实际实验,在500m
×
500m仿真区域、无人机飞行高度为h=100m的具体环境设置下,以用户密度u=200、内容数量f=100、无人机数量n=7、无人机缓存空间q=30、内容流行度zipf参数β=0.8运行上述方法,得到系统总效用u
sys
=16.7405,最终划分为2个联盟{s1,s2}={(1,6),(2,3,4,5,7)},最优联盟效用为[4.0826,12.6579],各无人机效用为[1.9750,2.3385,2.5901,2.6670,2.4088,2.1077,2.6535]。
[0080]
如图3所示,为系统收敛情况的仿真结果图,可以看出本发明提出的方法能够很快达到收敛。
[0081]
如图4所示,为在不同用户数量下的本发明提出的无人机进行内容缓存并协作传输方法与非协作方法的对比情况,可以看出协作方式优于非协作方式。
[0082]
如图5所示,为所提出的缓存方式与随机缓存和无缓存方式的对比情况,可以看出提出的内容缓存方式优于随机缓存和无缓存。
[0083]
如图6所示,为系统总效用与无人机数量的关系图,可以看出,本发明与传统的基于帕累托顺序的联盟形成算法和基于自私顺序的联盟形成算法相比,具有很大的优势。
[0084]
综上,本方法首先利用谱聚类算法对用户进行分簇以更好地管理,其次,考虑用户偏好和内容流行度以进行内容缓存,最后将无人机的协作内容传输问题建模为联盟博弈模型。每个无人机从非协作状态出发,根据联盟形成准则,以最大化系统总效用为目标进行博弈,最终快速收敛形成一个稳定的联盟结构并显著提高了系统总效用。
[0085]
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜