一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

管廊无线传感网的中继节点选择的方法、装置及终端与流程

2021-12-07 20:55:00 来源:中国专利 TAG:


1.本发明涉及无线通信技术领域,尤其涉及一种管廊无线传感网的中继节点选择的方法、装置及终端。


背景技术:

2.近年来,随着新型城市化的发展,城市基础设施质量与工艺的衡量标准越来越高。城市地下管廊易受土质、压力等环境因素和爆炸、火灾、地震等动力因素的干扰,存在重大的安全隐患,其作为城市基础设施的重要组成,亟需一种持久、可靠、高效的监测方法进行监测。
3.传统地下管廊传感网络一般采用有线通信方式,通过电缆进行信息传递,这种通信方式在稳定性、安全性、传输速率和传输质量方面表现突出,但是地下管廊的内部结构复杂,一旦发生事故,则极易造成电缆故障甚至损坏,且通常很难找到其故障点,因此无线传感网广泛应用于城市态势感知、地下管廊监测和应急容灾场景等多种复杂环境,其能够随时随地的远程监控地下管廊内部的情况。无线传感器网络通常是由多个低成本低功耗的传感器节点组成,在数据传输过程中,由于源节点和目标节点之间的距离较远,因此在源节点和目标节点之间还设置多个中继节点进行数据的传输。
4.然后现有技术中,不同中继节点由于在地下管廊中所处位置不同,受到电磁干扰不同,导致传输性能差异较大,另外由于地下管廊的通信环境复杂,导致无法实现网络总能耗最优。


技术实现要素:

5.本发明实施例提供了一种管廊无线传感网的中继节点选择的方法、装置及终端,以解决现有技术中因为不同中继节点的传输性能差异以及地下管廊环境复杂导致的网络总能耗较低的问题。
6.第一方面,本发明实施例提供了一种管廊无线传感网的中继节点选择的方法,包括:
7.根据管廊无线传感网构建中继节点选择模型;其中所述管廊无线传感网包括:源节点、目标节点以及分别与所述源节点和所述目标节点连接的i个中继节点,i为正整数;
8.分别初始化所述中继节点选择模型中的x
i,t
、和k
i,t
;其中,x
i,t
的值为1时表示在第t个时隙内选择中继节点m
i
,x
i,t
的值为0时表示在第t个时隙内未选择中继节点m
i
,t为正整数,表示在第t个时隙内中继节点m
i
的平均能耗,k
i,t
表示到第t个时隙选择中继节点m
i
的总次数;
9.根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新并根据更新后的确定自适应探索因子;
10.生成随机数,并根据所述随机数和所述自适应探索因子的大小关系,基于选择策略确定每个时隙进行信息传输的最优中继节点。
11.在一种可能的实现方式中,所述中继节点选择模型包括:接入时隙模型、任务传输模型、能耗模型以及问题模型;
12.所述接入时隙模型包括:每个时隙为一个传输任务从所述源节点到所述目标节点的传输时间,每个时隙内无线传感网的通信信道状态保持不变,但不同时隙之间无线传感网的通信信道状态随机变化;
13.所述任务传输模型包括:信息从所述源节点传输到所述目标节点的传输时延为
[0014][0015]
其中,表示在第t个时隙内信息从所述源节点传输到中继节点m
i
的传输时延,表示在第t个时隙内信息从中继节点m
i
传输到所述目标节点的传输时延,a(t)表示在第t个时隙内的传输任务,表示在第t个时隙内信息从所述源节点传输到中继节点m
i
的传输速率,表示在第t个时隙内信息从中继节点m
i
传输到所述目标节点的传输速率,b表示信道带宽,p
ism
表示所述源节点到中继节点m
i
的传输功率;表示所述源节点到中继节点mi的信道增益;σ0表示链路噪声;表示所述源节点到中继节点m
i
过程中由管廊内部高压电缆及设备造成的电磁干扰;p
img
表示中继节点m
i
到所述目标节点的传输功率;表示中继节点m
i
到所述目标节点的信道增益;表示中继节点m
i
到所述目标节点过程中由管廊内部高压电缆及设备造成的电磁干扰;
[0016]
所述能耗模型包括:在第t个时隙内,信息从所述源节点到所述目标节点的总能耗为
[0017][0018]
其中,e
i,t
表示在第t个时隙内,信息从所述源节点经到中继节点m
i
所述目标节点的总能耗,e
pro
表示收发电路的能耗系数;
[0019]
所述问题模型包括:
[0020][0021]
其中,m表示中继节点的集合,m={m1,m2,

,m
i
,

m
i
},t表示时隙的集合,t={1,

,t,

t}。
[0022]
在一种可能的实现方式中,所述根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新包括:
[0023]
根据
[0024]
其中,表示在第(t

1)个时隙内中继节点m
i
的平均能耗,k
i,t
‑1表示到第(t

1)个时隙选择中继节点m
i
的总次数。
[0025]
在一种可能的实现方式中,所述根据更新后的确定自适应探索因子,包括:
[0026]
根据更新后的的倒数,确定所述源节点对中继节点m
i
的历史平均奖赏值;
[0027]
根据所述历史平均奖赏值和x
i,t
确定在第t个时隙内所有中继节点的历史平均奖赏值;
[0028]
根据所述第t个时隙内所有中继节点的历史平均奖赏值计算得到自适应探索因子。
[0029]
在一种可能的实现方式中,所述根据所述历史平均奖赏值和x
i,t
确定在第t个时隙内所有中继节点的历史平均奖赏值,包括:
[0030]
根据确定在第t个时隙内所有中继节点的历史平均奖赏值;
[0031]
其中,表示在第t个时隙内所有中继节点的历史平均奖赏值,表示所述历史平均奖赏值,l表示中继选择所进行的次数。
[0032]
在一种可能的实现方式中,所述根据所述第t个时隙内所有中继节点的历史平均奖赏值计算得到自适应探索因子,包括:
[0033]
根据计算得到自适应探索因子;
[0034]
其中,ε
t
表示自适应探索因子,α表示对数函数底数,且α>1。
[0035]
在一种可能的实现方式中,所述根据所述随机数和所述自适应探索因子的大小关
系,基于选择策略确定每个时隙进行信息传输的最优中继节点,包括:
[0036]
根据确定第t个时隙中进行信息传输的最优中继节点;
[0037]
其中,selec(t)表示确定的第t个时隙中的最优中继节点。
[0038]
第二方面,本发明实施例提供了一种管廊无线传感网的中继节点选择的装置,包括:
[0039]
模型建立模块,用于根据管廊无线传感网构建中继节点选择模型;其中所述管廊无线传感网包括:源节点、目标节点以及分别与所述源节点和所述目标节点连接的i个中继节点,i为正整数;
[0040]
初始化模块,用于分别初始化所述中继节点选择模型中的x
i,t
、和k
i,t
;其中,x
i,t
的值为1时表示在第t个时隙内选择中继节点m
i
,x
i,t
的值为0时表示在第t个时隙内未选择中继节点m
i
,t为正整数,表示在第t个时隙内中继节点m
i
的平均能耗,k
i,t
表示到第t个时隙选择中继节点m
i
的总次数;
[0041]
更新模块,用于根据x
i,t
、和k
i,t
和管廊内中继节点的信息传输性能,更新并根据更新后的确定自适应探索因子;
[0042]
选择模块,用于生成随机数,并根据所述随机数和所述自适应探索因子的大小关系,基于选择策略确定每个时隙进行信息传输的最优中继节点。
[0043]
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
[0044]
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
[0045]
本发明实施例提供一种管廊无线传感网的中继节点选择的方法、装置及终端,通过更新模块确定自适应探索因子,其能够在管廊环境变化的情况下确定合适的探索因子,然后根据自适应探索因子选择模块进行最优中继节点的选择,即根据自适应探索因子自适应调节选择策略的探索力度,平衡中继节点选择策略中探索和利用之间的关系,实现最大网络周期下的高可靠和能耗最低的通信。
附图说明
[0046]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1是本发明实施例提供的管廊无线传感网的中继节点选择的方法的应用场景图;
[0048]
图2是本发明实施例提供的三种算法下平均能耗随时隙的变化示意图;
[0049]
图3是本发明实施例提供的三种算法下平均奖赏值随时隙变化的示意图;
[0050]
图4是本发明实施例提供的最优中继节点选择概率随时隙的变化情况示意图;
[0051]
图5是本发明实施例提供的管廊无线传感网的中继节点选择的装置的结构示意图;
[0052]
图6是本发明实施例提供的终端的示意图。
具体实施方式
[0053]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0054]
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
[0055]
图1为本发明实施例提供的一种管廊无线传感网的中继节点选择的方法的实现流程图,详述如下:
[0056]
步骤101,根据管廊无线传感网构建中继节点选择模型。
[0057]
其中管廊无线传感网包括:源节点、目标节点以及分别与源节点和目标节点连接的i个中继节点,i为正整数。i个中继节点的集合可以记为m={m1,m2,

,m
i
,

m
i
}。
[0058]
如图2所示的管廊无线传感网中继节点选择模型,可以包括无线传感网和控制中心两部分。无线传感网是由有数据转发需求的无线传感器和控制中心两部分构成的二维平面,源节点和目标节点为无线传感器,中继节点是具有无线转发功能的设备,例如无线路由、无线传感器等。
[0059]
控制中心部署于无线传感网络覆盖范围内,用于对源节点和目标节点进行控制和信息处理。
[0060]
可选的,中继节点选择模型可以包括:接入时隙模型、任务传输模型、能耗模型以及问题模型。下面一一对上述模型进行具体描述。
[0061]
(1)接入时隙模型包括:每个时隙为一个传输任务从源节点到目标节点的传输时间,每个时隙内无线传感网的通信信道状态保持不变,但不同时隙之间无线传感网的通信信道状态随机变化。
[0062]
参见图2,无线传感网中可以包括1个源节点sn、1个目标节点gn和i个中继节点,并将i个中继节点的集合记为m={m1,m2,

,m
i
,

m
i
}。将整个时间段划分为t个时隙,其集合记为t={1,

,t,

t}。定义一个传输任务从源节点sn到目标节点gn的传输时间为一个时隙,在每个时隙内信道状态是动态变化的,使得源节点sn到目标节点gn的数据传输时延不确定,因此每个时隙的长度不同。每个时隙内由控制中心根据无线传感网的通信信道状态决定无线传感网络的中继节点的选择。为了简化接入时隙模型,假设每个时隙内无线传感网的通信信道状态保持不变,但不同时隙之间无线传感网的通信信道状态随机变化。另外,
定义中继节点选择的指示变量为x
i,t
,x
i,t
的值为1时表示在第t个时隙内选择中继节点m
i
,x
i,t
的值为0时表示在第t个时隙内未选择中继节点m
i
,t为正整数。
[0063]
(2)任务传输模型
[0064]
在第t个时隙内,源节点sn到目标节点gn的数据传输过程分为两个部分,即从源节点sn到中继节点m
i
的传输过程和从中继节点m
i
到目标节点gn的传输过程。因此,根据香农公式,从源节点sn到中继节点m
i
的传输速率为:从中继节点m
i
到目标节点gn的传输速率为:其中,表示在第t个时隙内信息从源节点传输到中继节点m
i
的传输速率,表示在第t个时隙内信息从中继节点m
i
传输到目标节点的传输速率,b表示信道带宽,p
ism
表示所述源节点到中继节点m
i
的传输功率;表示所述源节点到中继节点m
i
的信道增益;σ0表示链路噪声;表示所述源节点到中继节点m
i
过程中由管廊内部高压电缆及设备造成的电磁干扰;p
img
表示中继节点m
i
到所述目标节点的传输功率;表示中继节点m
i
到所述目标节点的信道增益;表示中继节点m
i
到所述目标节点过程中由管廊内部高压电缆及设备造成的电磁干扰;
[0065]
假设在第t个时隙内,由源节点sn产生的传输任务大小为a(t),则从源节点sn到中继节点m
i
的传输时延为即,从中继节点m
i
到目标节点gn的传输时延为即,其中,表示在第t个时隙内信息从源节点传输到中继节点m
i
的传输时延,表示在第t个时隙内信息从中继节点m
i
传输到目标节点的传输时延,a(t)表示在第t个时隙内的传输任务。
[0066]
(3)能耗模型
[0067]
在信息(数据)传输过程中,各个节点动作包括接收数据和发送数据,因此,将节点传输能耗分为接收能耗和发送能耗两部分。其中,接收能耗为节点在数据接收过程中支撑设备处理信号所消耗的能量,表示为a(t)e
pro
,e
pro
为收发电路的能耗系数。发送能耗包括两个部分,一部分是节点在数据发送过程中支撑设备处理信号所消耗的能量,其大小与节点
接收能耗视为一致,同样表示为a(t)e
pro
;另一部分是射频功率放大器在数据发射时所消耗的能量,为传输功率与传输时延的乘积,即p
tx
τ,其中p
tx
是于节点传输数据的传输功率,τ是传输时延。
[0068]
因此,在第t个时隙内,信息从源节点到目标节点的总能耗为
[0069][0070]
其中,e
i,t
表示在第t个时隙内,信息从源节点经中继节点m
i
到目标节点的总能耗,e
pro
表示收发电路的能耗系数。
[0071]
(4)问题模型
[0072]
在本实施例中,我们构建一个动态的中继节点选择问题,优化目标为最小化数据传输总能耗,则问题模型构建为:
[0073][0074]
其中,m表示中继节点的集合,m={m1,m2,

,m
i
,

m
i
},t表示时隙的集合,t={1,

,t,

t}。x
i,t
∈{0,1},和这两个约束条件,可以保证在每一个时隙内,有且只有一个中继节点被选择。即在信息传输过程中,源节点将信息转发给中继节点,中继节点将信息发送给目标节点,在源节点和中继节点之间进行信息传输的中继节点的数量只有一个。
[0075]
步骤102,分别初始化中继节点选择模型中的x
i,t
、和k
i,t

[0076]
其中,x
i,t
的值为1时表示在第t个时隙内选择中继节点m
i
,x
i,t
的值为0时表示在第t个时隙内未选择中继节点m
i
,t为正整数,表示在第t个时隙内中继节点m
i
的平均能耗,k
i,t
表示到第t个时隙选择中继节点m
i
的总次数。
[0077]
在构建中继节点选择模型之后,可以根据构建的模型以及自适应∈

greedy算法确定每个时隙内信息传输时采用的最优的中继节点。自适应∈

greedy算法通过利用历史中继选择策略的累计奖赏值自适应调节行为策略的探索力度,从而权衡“探索”与“利用”求解最优策略,该系统中主要包括玩家、摇臂、回报、动作、策略等要素,具体分析如下:
[0078]
(1)玩家:执行策略并产生动作的主体,可以通过学习历史反馈的回报值,不断更新策略。我们可以将控制中心定义为玩家。
[0079]
(2)摇臂:玩家可以进行动作的选择,每个选择对应一个候选项,有多少个候选项即有多少个摇臂。我们将中继节点定义为摇臂。
[0080]
(3)回报:每个回合玩家进行动作之后收到的反馈信息。我们将控制中心选择中继
节点后的回报定义为能耗的倒数,即
[0081]
(4)动作:玩家选定摇臂。我们将控制中心选择中继节点的行为定义为动作。
[0082]
(5)策略:执行动作的依据。我们将中继节点选择定义为策略,并且设计了基于自适应∈

greedy算法的中继选择策略。
[0083]
在进行中继节点选择时,首先需要进行初始化,即需要对涉及的变量进行初始化。即将x
i,t
=0。在最初的t个时隙内,控制中心分别选择所有的中继节点各进行一次信息传输,确定各个中继节点的传输性能,并根据各个中继节点在信息传输过程中消耗的能量,计算得到各个中继节点的平均能耗,得到初始化的并根据计算过程中选择中继节点的次数,初始化k
i,t

[0084]
步骤103,根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新并根据更新后的确定自适应探索因子。
[0085]
在本步骤中,根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新可以包括:
[0086]
根据更新
[0087]
其中,表示在第(t

1)个时隙内中继节点m
i
的平均能耗,k
i,t
‑1表示到第(t

1)个时隙选择中继节点m
i
的总次数。
[0088]
可选的,在根据更新后的确定自适应探索因子时,可以包括:
[0089]
根据更新后的的倒数,确定源节点对中继节点m
i
的历史平均奖赏值;这里奖赏值即回报;
[0090]
根据历史平均奖赏值和x
i,t
确定在第t个时隙内所有中继节点的历史平均奖赏值;可选的,根据确定在第t个时隙内所有中继节点的历史平均奖赏值;其中,表示在第t个时隙内所有中继节点的历史平均奖赏值,表示历史平均奖赏值,l表示中继选择所进行的次数。
[0091]
根据第t个时隙内所有中继节点的历史平均奖赏值计算得到自适应探索因子;可选的,根据计算得到自适应探索因子;其中,ε
t
表示自适应探索因子,α表示对数函数底数,且α>1。
[0092]
本实施例中,通过确定自适应探索因子,使得∈

greedy算法可以根据管廊的环境进行自适应调整,确定更合适的探索因子,较现有技术中采用固定的探索因子或者采用递减变化的探索因子而言,可以使得确定的中继节点的能耗更少。
[0093]
步骤104,生成随机数,并根据随机数和自适应探索因子的大小关系,基于选择策略确定每个时隙进行信息传输的最优中继节点。
[0094]
可选的,随机数为随机确定的一个在0到1的范围内的一个数,即随机数需要满足u∈(0,1),例如,随机数可以为0.6,0.9等。
[0095]
可选的,根据确定第t个时隙中进行信息传输的最优中继节点;
[0096]
其中,selec(t)表示确定的第t个时隙中的最优中继节点。
[0097]
这里中继节点需要满足的是,在μ>ε
t
时,确定历史平均奖赏中值中最大的一个,当μ≤ε
t
时,随机确定所有中继节点中任意一个,此时可能确定的仍然是历史平均奖赏中值中最大的一个。
[0098]
根据本实施例提供的管廊无线传感网的中继节点选择的方法进行仿真实验,以说明本方法带来的有益效果。
[0099]
假设源节点到中继节点以及中继节点到目标节点的信道增益均满足正态分布n(127 30log(l),4),其中l为节点之间的距离,单位可以为km,取值范围为[0.03,0.08]。设置两种典型的ε

greedy算法进行对比。第一个是传统的ε

greedy算法,其算法思想是确定一个探索因子ε,然后在选择动作时,智能体有1

ε的概率选择最利于完成最终任务的动作,有ε的概率随机选择一个动作,其中ε取值为定值0.1。第二个是递减ε

greedy算法,该算法为传统的ε

greedy算法的一个变形,用一个递减的概率来接近最优策略,其中递减因子ε
t
由1/t给出。
[0100]
参见图2和图3,图2示出了三种算法下平均能耗随时隙的变化示意图,图3示出了三种算法下平均奖赏值随时隙变化的示意图,可以看出,相比于传统ε

greedy算法和递减ε

greedy算法,本方案提供的自适应的ε

greedy算法在平均奖赏值方面性能最优,在能耗方面性能分别提升3.54%和6.49%。递减ε

greedy算法在平均奖赏值方面和能耗方面略优于传统ε

greedy算法,其原因在于递减ε

greedy算法初期趋向于探索,在后期收集到一定信息的基础上,能够利用当前经验收集更多的即时奖励来收敛到最优策略,即初期尽可能多地进行“探索”,以求准确估计,而在后期尽可能多地“利用”,以求最大化平均回报,因此其性能优于传统ε

greedy算法。但递减ε

greedy算法的缺点在于探索因子单调递减,未考虑历史环境状态,具有一定的盲目性。而本方案所提的自适应的ε

greedy算法依据平均累计奖赏值自适应调节“探索”与“利用”的力度,探索因子并非单调降低,因此在能耗与平均累计奖赏值方面表现最优。
[0101]
参见图4,图4示出了最优中继节点选择概率随时隙的变化情况。可以看出,在中继选择初期,本方案所提的自适应的ε

greedy算法与递减ε

greedy算法最优中继节点选择概率均较低,随选择次数的增多而逐渐增加,最终稳定在0.9左右。本方案所提的自适应的ε

greedy算法在最优中继节点选择概率方面表现最优,递减ε

greedy算法次之,传统ε

greedy算法表现最差。其原因在于本方案所提的自适应的ε

greedy算法与递减ε

greedy算法中ε值动态变化,其初期为探索阶段,导致最优选择概率均较低,而后期为前期经验值的利用阶段,因此能够以更大的概率选择最优的中继节点进行信息传输。而传统ε

greedy算法探索因子固定,无法充分利用环境信息,因此其性能表现最差。
[0102]
上述管廊无线传感网的中继节点选择的方法,通过确定自适应探索因子,其能够在管廊环境变化的情况下确定合适的探索因子,然后根据自适应探索因子进行最优中继节点的选择,即根据自适应探索因子以及平均奖赏值自适应调节选择策略的探索力度,平衡中继节点选择策略中探索和利用之间的关系,实现最大网络周期下的高可靠低成本通信。
[0103]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0104]
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
[0105]
图5示出了本发明实施例提供的管廊无线传感网的中继节点选择的装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
[0106]
如图5所示,管廊无线传感网的中继节点选择的装置5包括:模型建立模块501、初始化模块502、更新模块503和选择模块504。
[0107]
模型建立模块501,用于根据管廊无线传感网构建中继节点选择模型;其中所述管廊无线传感网包括:源节点、目标节点以及分别与所述源节点和所述目标节点连接的i个中继节点,i为正整数;
[0108]
初始化模块502,用于分别初始化所述中继节点选择模型中的x
i,t
、和k
i,t
;其中,x
i,t
的值为1时表示在第t个时隙内选择中继节点m
i
,x
i,t
的值为0时表示在第t个时隙内未选择中继节点m
i
,t为正整数,表示在第t个时隙内中继节点m
i
的平均能耗,k
i,t
表示到第t个时隙选择中继节点m
i
的总次数;
[0109]
更新模块503,用于根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新并根据更新后的确定自适应探索因子;
[0110]
选择模块504,用于生成随机数,并根据所述随机数和所述自适应探索因子的大小关系,基于选择策略确定每个时隙进行信息传输的最优中继节点。
[0111]
在一种可能的实现方式中,中继节点选择模型包括:接入时隙模型、任务传输模型、能耗模型以及问题模型;
[0112]
接入时隙模型包括:每个时隙为一个传输任务从源节点到目标节点的传输时间,每个时隙内无线传感网的通信信道状态保持不变,但不同时隙之间无线传感网的通信信道状态随机变化;
[0113]
任务传输模型包括:信息从源节点传输到目标节点的传输时延为
[0114][0115]
其中,表示在第t个时隙内信息从源节点传输到中继节点m
i
的传输时延,表示在第t个时隙内信息从中继节点m
i
传输到目标节点的传输时延,a(t)表示在第t个时隙内的传输任务,表示在第t个时隙内信息从源节点传输到中继节点m
i
的传输速率,表示在第t个时隙内信息从中继节点m
i
传输到目标节点的传输速率,b表示信道带宽,p
ism
表示所述源节点到中继节点m
i
的传输功率;表示所述源节点到中继节点mi的信道增益;σ0表示链路噪声;表示所述源节点到中继节点m
i
过程中由管廊内部高压电缆及设备造成的电磁干扰;p
img
表示中继节点m
i
到所述目标节点的传输功率;表示中继节点m
i
到所述目标节点的信道增益;表示中继节点m
i
到所述目标节点过程中由管廊内部高压电缆及设备造成的电磁干扰;
[0116]
能耗模型包括:在第t个时隙内,信息从源节点到目标节点的总能耗为
[0117][0118]
其中,e
i,t
表示在第t个时隙内,信息从源节点经中继节点m
i
到目标节点的总能耗,e
pro
表示收发电路的能耗系数;
[0119]
问题模型包括:
[0120][0121]
其中,m表示中继节点的集合,m={m1,m2,

,m
i
,

m
i
},t表示时隙的集合,t={1,

,t,

t}。
[0122]
在一种可能的实现方式中,更新模块503根据x
i,t
、k
i,t
和管廊内中继节点的信息传输性能,更新时,用于:
[0123]
根据更新
[0124]
其中,表示在第(t

1)个时隙内中继节点m
i
的平均能耗,k
i,t
‑1表示到第(t

1)个时隙选择中继节点m
i
的总次数。
[0125]
在一种可能的实现方式中,更新模块503根据更新后的确定自适应探索因子时,用于:
[0126]
根据更新后的的倒数,确定源节点对中继节点m
i
的历史平均奖赏值;
[0127]
根据历史平均奖赏值和x
i,t
确定在第t个时隙内所有中继节点的历史平均奖赏值;
[0128]
根据第t个时隙内所有中继节点的历史平均奖赏值计算得到自适应探索因子。
[0129]
在一种可能的实现方式中,更新模块503根据历史平均奖赏值和x
i,t
确定在第t个时隙内所有中继节点的历史平均奖赏值时,用于:
[0130]
根据确定在第t个时隙内所有中继节点的历史平均奖赏值;
[0131]
其中,表示在第t个时隙内所有中继节点的历史平均奖赏值,表示历史平均奖赏值,l表示中继选择所进行的次数。
[0132]
在一种可能的实现方式中,更新模块503根据第t个时隙内所有中继节点的历史平均奖赏值计算得到自适应探索因子时,用于:
[0133]
根据计算得到自适应探索因子;
[0134]
其中,ε
t
表示自适应探索因子,α表示对数函数底数,且α>1。
[0135]
在一种可能的实现方式中,选择模块504根据随机数和自适应探索因子的大小关系,基于选择策略确定每个时隙进行信息传输的最优中继节点时,用于:
[0136]
根据确定第t个时隙中进行信息传输的最优中继节点;
[0137]
其中,selec(t)表示确定的第t个时隙中的最优中继节点。
[0138]
上述管廊无线传感网的中继节点选择的装置,通过更新模块确定自适应探索因子,其能够在管廊环境变化的情况下确定合适的探索因子,然后根据自适应探索因子选择模块进行最优中继节点的选择,即根据自适应探索因子以及平均奖赏值自适应调节选择策
略的探索力度,平衡中继节点选择策略中探索和利用之间的关系,实现最大网络周期下的高可靠低成本通信。
[0139]
图6是本发明实施例提供的终端的示意图。如图6所示,该实施例的终端6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个管廊无线传感网的中继节点选择的方法实施例中的步骤,例如图1所示的步骤101至步骤104。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块/单元501至504的功能。
[0140]
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端6中的执行过程。例如,所述计算机程序62可以被分割成图5所示的模块/单元501至504。
[0141]
所述终端6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端6可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端6的示例,并不构成对终端6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
[0142]
所称处理器60可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field

programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0143]
所述存储器61可以是所述终端6的内部存储单元,例如终端6的硬盘或内存。所述存储器61也可以是所述终端6的外部存储设备,例如所述终端6上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器61还可以既包括所述终端6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
[0144]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0145]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0146]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0147]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0148]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0149]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0150]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个管廊无线传感网的中继节点选择的方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
[0151]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献