一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

多源异构网络数据并行传输方法与流程

2022-03-26 13:21:24 来源:中国专利 TAG:


1.本发明涉及网络通信技术领域,特别是涉及多源异构网络数据并 行传输方法。


背景技术:

2.现今已进入全球工业互联网的快速成长期,工业设备数据分发需 求日趋增加。一些工业互联网场景中需要通过中心控制点分发控制信 息给分布在生产场地的各种传感器。这些控制信息往往关系到生产安 全和生产效率,需要确保各节点能够及时、准确的获取该信息。然而 由于工业场地面积大,干扰因素多,常采用的单源点以广播形式进行 数据分发的方法无法确保节点的接收率,并且导致延迟较长,传输效 率较低。另外,低占空比的zigbee节点实现多跳回传确认机制可能 造成数据丢失、延迟长、能耗低等问题。因此,如何对工业互联网通 信做出优化并提高网络传输效率,成为工业互联网通信技术中亟待解 决的问题。
3.近些年的研究成果已经实现了异构无线设备(如wi-fi和zigbee 设备)之间的直接通信,解决了信道争用导致的频谱利用率低的问题。 但是现有的异构网络通信技术由于使用ack确认机制保证可靠传输, 在信道条件较差的时候会导致大量的超时重传,降低了传输效率,甚 至发生网络拥塞等。例如,异构网络节点wi-fi和zigbee进行通信, 由于wi-fi传输的距离长而zigbee传输的距离短,zigbee发送ack 时需要多跳才能将确认消息通过邻居节点发送到wi-fi。若反馈过程 中遇到“休眠”节点,或者在数据传输过程中发生了数据包丢失,则 会导致超时重传,从而再次增加传输延迟。另外,在大范围场地数据 分发场景下,单数据源节点不能实现全覆盖,发送的数据包仍需要多 跳才能传输至所有的zigbee节点(如图1所示)。尤其在低占空比的 zigbee网络环境中,节点周期性休眠导致更低的网络传输效率。


技术实现要素:

4.本发明的目的是提供多源异构网络数据并行传输方法,以解决上 述现有技术存在的问题。
5.为实现上述目的,本发明提供了如下方案:本发明提供多源异构 网络数据并行传输方法,包括以下步骤:
6.构建异构网络,所述异构网络包括若干网络节点,其中,所述网 络节点包括若干汇点节点和zigbee节点,
7.构建待传输的数据包,基于所述数据包的大小,设置所述zigbee 节点解码阈值和节点时隙;
8.基于所述zigbee节点解码阈值、所述节点时隙和所述数据包, 并根据基于马尔可夫模型的损失函数动态调整分发调度表,获得最优 所述分发调度表,按照最优所述分发调度表传输所述数据包。
9.可选地,所述异构网络在时间t下的拓补结构为 g(t)=(v,e(t)),其中,v表示包
含了k个汇点的节点集合 {s1,s2,s3,

,sk}和n个zigbee节点{z1,z2,z3,

,zn}的节点 集合,e(t)表示在时间t的边集合,对于任意一条边(si,zj)∈e(t)表 示zj在所述时间t苏醒。
10.可选地,所述汇点节点为异构网络设备,在发送wi-fi数据的同 时,利用64个子载波中的7个子载波捎带传输zigbee数据。
11.可选地,所述数据包采用分布式喷泉码。
12.可选地,所述动态调整分发调度表采用随机马尔可夫决策过程方 法。
13.可选地,动态调整所述分发调度表,获得所述最优所述分发调度 表包括:
14.基于所述随机马尔可夫决策过程,构建动态优化模型,对所述动 态优化模型进行求解,得到最优策略,即最优所述分发调度表。
15.可选地,构建所述动态优化模型包括:
16.设置所述汇点的状态集合sta、行为集合act和收益函数,其中, 所述行为集合act如式(4)所示,所述收益函数如式(5)所示:
[0017][0018]
其中,表示没有收到汇点发送的喷泉码包,表示收到汇点 sk发送的喷泉码包;
[0019]
rew(sta,sta

,act)=loss(g)
ꢀꢀ
(5),
[0020]
其中,g为网络拓扑;
[0021]
设置所述汇点的收包率为l
ij
=1-b
ij
,则,所述汇点sk的策略π 如式(7)所示:
[0022][0023]
其中,n为zigbee节点的个数,i为第i汇点,j为第j个zigbee 节点;
[0024]
基于所述策略π、所述状态集合sta和行为集合act,构建所述汇 点的值函数v
π
(sta)如式(8)所示,其中,所述值函数用于评价所 述策略π获得的长期回报:
[0025][0026]
其中,γ为折扣因子,γ∈[0,1],p(sta
t 1
|sta
t
,π(sta
t
))表示在 状态sta
t
下,采取策略π(sta
t
),系统从状态sta
t
转到状态sta
t 1
的 概率;r(sta
t
,π(sta
t
))为收益函数,v
π
(sta
t 1
)为价值函数。
[0027]
设置行动价值函数q
π
(sta,act),其中,所述行动价值函数表示 在所述状态合sta
t
采取行动act后的长期回报值,如式(9)所示:
[0028][0029]
其中,γ为折扣因子,γ∈[0,1],p(sta
t 1
|sta
t
,act
t
)表示在状 态sta
t
下,执行行动act
t
,系统从状态sta
t
转到状态sta
t 1
的概率。
[0030]
可选地,所述最优策略如式(10)所示:
[0031]
[0032]
其中,γ为折扣因子,π
*
为最优策略。
[0033]
本发明公开了以下技术效果:
[0034]
本发明提供的多源异构网络数据并行传输方法,通过利用喷泉码 的编码特性,只要接收机接收到足够的编码包,数据就可以恢复,以 实现无反馈传输,减少通信延迟,提出基于马尔可夫决策过程的损耗 模型的方法,在保证系统损耗最小的前提下,通过bellman递推方程, 找到最优数据分发调度方案,获得最优价值函数和,从而大幅降低收 敛时间和能量损耗。
附图说明
[0035]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面 将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描 述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来 讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他 的附图。
[0036]
图1为现有技术中异构网络结构示意图;
[0037]
图2为本发明实施例中多源异构网络数据并行传输方法流程示 意图;
[0038]
图3为本发明实施例中多源异构网络数据并行传输方法数据处 理流程示意图;
[0039]
图4为本发明实施例中网络结构示意图;
[0040]
图5为本发明实施例中喷泉码编译码流程图;
[0041]
图6为本发明实施例中mdp决策过程示意图。
具体实施方式
[0042]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方 案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部 分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普 通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
[0043]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结 合附图和具体实施方式对本发明作进一步详细的说明。
[0044]
本发明提供多源异构网络数据并行传输方法,如图2-3所示,包 括以下步骤:
[0045]
s1、构建异构网络。
[0046]
如图4所示,本实施例中的异构网络的所有节点随机分布在一个 正方形区域内,网络由多个汇点和若干静止的zigbee节点组成,汇 点是一个异构网络设备,其在发送wi-fi数据的同时,利用64个子 载波中的7个子载波捎带传输zigbee数据。发送节点位于如图所示 的长方形区域的边界(数据分发模型),每个zigbee节点以低占空比 (例如:1%或更少)设置操作,根据唤醒时间表周期性地打开无线电以 发送或接收数据包。一个工作周期t等分为固定长度的时间单元,称 为时隙。又由于低占空比操作,苏醒时隙的长度通常非常有限。因此 本实施例将时隙设置成能够完成所有数据包的收发操作。
[0047]
本实施例中,用g(t)=(v,e(t))来表示网络在时间t下的拓扑 结构,其中v表示包含了k个汇点的节点集合{s1,s2,s3,

,sk}和n 个zigbee节点{z1,z2,z3,

,zn}的节点集合,e(t)表示在时间t 的边集合,对于任意一条边(si,zj)∈e(t)表示zj在时间t苏醒,能 够接
收数据。从本质上来讲,g(t)代表了t时刻网络内潜在的流量。 显然,g(t)是一个依赖时间的网络。
[0048]
并且本实施例中的异构网络中仅存在wi-fi和zigbee两种设备, 且除了实验本身设备之间的相互影响以外,不考虑其他设备所造成的 影响。所有的zigbee设备都工作在占空比可调的低占空比模式下, 每个zigbee节点在加入工作的网络之前,其占空比以及唤醒时间都 被发送节点所知。事实上,这是因为zigbee节点的占空比和开始工 作的时间都是人为可控的。考虑最差的情况下,zigbee的本地时钟 发生偏移时,可以发送一个数据包到发送节点。一方面,这一数据包 所包含的数据量很小,可以视为一个控制包,不会影响系统的可靠性; 另一方面,这种校准操作进行的频率也不会太频繁,所以这种假设也 是合理的。另外,每个zigbee节点的链路上的最高丢包率是已知的。
[0049]
s2、构建待传输的数据包,基于所述数据包的大小,设置所述 zigbee节点解码阈值和节点时隙。
[0050]
由于在低占空比无线传感器网络中,很少会有多个接收器在同一 时隙醒来,因此广播是通过多次单播实现的,并且由于有损链路,需 要多次重传,不仅造成接收信号的时延还带来反馈拥塞问题,所以本 实施例使用分布式喷泉码保证数据传输的可靠性。
[0051]
喷泉码是一种新颖的信道编码技术,可有效应用于分组级前向纠 删码技术中,每个数据源独立的产生编码数据包,然后发给接收端, 接收端从所有的数据源接收编码数据包,当接收到足够的编码数据包 后,就可以断开所有连接,成功接收所传输的数据,无需检测编码数 据包具体是由哪个数据源发送过来的,以及每个数据源具有的数据损 失率和发送速率。具体的喷泉码编译码流程图如图5所示:发送端的k 个原始数据包称为输入符号(input symbols),编码后的数据包称为 输出符号m(output symbols)。每个输出符号是根据度分布函数随 机选择输入符号的异或和。接收端只要收到任意r编码分组,即可通 过译码以高概率成功恢复全部原始分组,如式(1)所示:。
[0052]
r=k(1 ε)
ꢀꢀ
(1)
[0053]
其中,ε为译码开销,r为解码阈值,k为源包数量。
[0054]
s3、根据zigbee节点解码阈值、节点时隙和数据包,动态调整 分发调度表,获得最优分发调度表,按照最优所述分发调度表,进行 数据包传输。
[0055]
本实施例中,为实现分发调度表的动态调整而构建动态优化型模 型,该动态优化模型采用随机马尔可夫决策机制构建。
[0056]
一个基本的马尔可夫决策过程(markov decision process,mdp) 包括以下要素:
[0057]
(1)状态集合sta,描述系统的状态。
[0058]
(2)行为集合act,描述决策者在状态空间中可能的行为.通常行 为集合会依赖于当前状态,即可将其记为act(sta)。
[0059]
(3)收益函数rew(sta,sta

,act),sta,sta

∈s,act∈act, 描述系统在决策者行为的影响下运行所产生的收益。
[0060]
(4)状态转移关系stam,描述系统状态在决策行为影响下的转移 过程。
[0061]
马尔可夫决策过程的一个显著特征是无后效性,即系统在下一时 刻的状态仅依赖于当前所处的状态与决策行为,而与系统的历史无关。 因此,对zigbee节点的工作状态马尔可夫化,即在下一时刻的吞吐 量只依赖当前时刻zigbee节点的工作状态与决策行为,
而与过去的 状态无关。因此这个过程如图6所示:
[0062]
马尔可夫决策过程收益函数定义为r(sta,act)状态sta下采用行 为act所产生的收益,如式(2)所示:
[0063][0064]
在基于分布式喷泉码的多源数据分发策略中,本实施例考虑具有 n个zigbee节点的异构网络下行链路传输中,每个zigbee节点都需 要接收足够的喷泉码包才能够进行解码,因此如何快速解码,提高解 码效率需要找到一个数据分发策略。我们根据马尔科夫链的动态优化 算法求解最优策略。
[0065]
借助马尔科夫链对动态优化(多源数据分发策略)进行建模过程 如下:
[0066]
根据马尔可夫链统计,时间是时隙的,系统在t时隙的状态可用表示,并在下一个时隙内演变成另一种状 态。则系统的状态转移方程定义为如式(3)所示:
[0067][0068]
其中,f为收包总数(吞吐量),j为第j个zibee节点,n为zigbee 节点的数量,t为时隙。
[0069]
此时决策行为受到下式所示的守恒条件约束:
[0070][0071]
其中,k为汇点的个数,f为收包总数(吞吐量),j为第j个zibee 节点,n为zigbee节点的数量,t为时隙。
[0072]
汇点是决策者,控制在每个时隙向zigbee节点发送喷泉码数据 包。汇点的行为空间可定义为如式(4)所示:
[0073][0074]
其中,表示没有收到汇点发送的喷泉码包,表示收到汇点 sk发送的喷泉码包。
[0075]
异构网络在汇点决策行为影响下运行产生系统损耗,则收益函数 可定义为系统损耗的倒数,系统损耗越大,收益就越小。收益函数的 定义如式(5)所示:
[0076]
rew(sta,sta

,act)=loss(g)
ꢀꢀ
(5)
[0077]
在马尔可夫决策过程中,策略π定义为从状态集合sta到行为集合 act的一个映射。决策者根据策略π来得到当前所需的决策行为。最常 见的策略表达方式是一个条件概率分布π(act|sta),即在状态sta时 采取动作act的概率。即表示为如式(6)所示:
[0078]
π(act|sta)=p(act
t
=act|sta
t
=sta)
ꢀꢀ
(6)
[0079]
其中,p表示概率。此时概率大的动作被个体选择的概率较高。 通常由随机抽样得到,具有随机性。然而本实施例定义策略是通过让 当前时隙苏醒zigbee节点收包率和越大的汇点进行数据的发送,当 某些zigbee节点达到解码阈值,进行解码。则可能发生此时隙收包 率不是当前汇点最大,因此也具有随机性。某汇点的收包率为 l
ij
=1-b
ij
,则在状态
sta行为汇点sk的策略定义为如式(7)所示:
[0080][0081]
其中,l表示某汇点的收包率。
[0082]
个体在策略π和状态sta时,采取行动后的价值(value),一般用 v
π
(sta)表示。这个价值一般是一个期望函数。虽然当前动作会给一 个延时奖励rew
t 1
,但是光看这个延时奖励是不行的,因为当前的延时 奖励高,不代表到了t 1,t 2,...时刻的后续奖励也高。价值函数 v
π
(sta)表示为如式(8)所示的bellman递推方程:
[0083][0084]
其中γ为折扣因子,取值范围[0,1],γ∈[0,1], p(sta
t 1
|sta
t
,π(sta
t
))表示在状态sta
t
下,采取策略π(sta
t
),系 统从状态sta
t
转到状态sta
t 1
的概率;r(sta
t
,πsta
t
))为收益函数, v
π
(sta
t 1
)为价值函数。
[0085]
设置行动价值函数q
π
(sta,act),其中,所述行动价值函数表示 在所述状态合sta采取行动act后的长期回报值,如式(9)所示:
[0086][0087]
其中,γ为折扣因子,γ∈[0,1],p(sta
t 1
|sta
t
,act
t
)表示在状态 sta
t
下,执行行动act
t
,系统从状态sta
t
转到状态sta
t 1
的概率。
[0088]
根据bellman求得最优v
*
(sta),给定策略π,则在状态sta的值函 数等于当前一步决策所得收益与下一时刻折扣后值函数期望的和。根 据所建立的bellman递推方程,对模型进行求解,得到最优策略π*, 如式(10)所示:
[0089][0090]
以最大化目标函数为例,根据当前所得的值函数v
*
求得在状态 sta下应该采取的策略π*。
[0091]
马尔科夫决策过程求解:从bellman递推方程可以看出,能够定 义出子问题求解每个状态的值函数,同时式(10)又是一个递推式, 意味着利用它,能够使用上一个迭代周期内的状态价值来计算更新当 前迭代周期某状态s的状态价值,求出最优价值函数。
[0092]
在本实施例中的g(t)网络的数据包传输过程中,如果在某个时隙 苏醒的节点数很少,而在这时广播消耗的能耗很大,这样势必会造成 很大的能耗的浪费,在很多应用中不能满足能耗的要求。因此,在利 用动态优化型模型进行动态调整分发调度表时需要获得一个数据分 发调度表,如式(11)所示,以满足如式(12)所示的损失函数需求。
[0093]
s={(s1,t1),...,(sm,tm)}(t0≤t1...≤tm)
ꢀꢀ
(11)
[0094]
其中,s为调度表的集合,tm为第m个时隙,sm为第m个汇点
[0095][0096]
其中,总的能耗即消息转发成本e,则发送一次喷泉码所消耗的能 量可以定义为
si表示发送节点的发送次数,表示发送一次所 消耗的能量,k为汇点的个数。收敛时间d,t为周期,d为发送节点 和接收节点之间的时延差,αi为矩阵an的i列向量,为αi的转置, α,β为常数,表示权衡系数。
[0097]
本实施例将全部接收节点的工作时间表中的用矩阵an表示,如式(13)所示,能够清晰的看出 每个时隙节点苏醒的密度。其中,每个元素a
ij
表示在ti时隙zj节点 工作状态。a
ij
=1表示zj节点处于苏醒时隙。a
ij
=0表示zj节点处 于休眠时隙。
[0098][0099]
如式(14)所示,矩阵bk×n表示在每个发送节点发送数据对应 每个接收节点的丢包率。b
ij
表示汇点si发送数据时给zj节点时的丢包 率。
[0100][0101]
任意汇点si(1≤i≤k)在任意时隙ti(1≤i≤n)的某个接 收节点zj(1≤j≤n)苏醒状态的收包数ci=p
si
*(1-b
ij
)。某一 时隙ti(1≤i≤n)某一汇点si(1≤i≤k)发送数据时任意接收 节点的收包数可以用向量表示,第 ti(1≤i≤n)总的收包数f
ii
(吞吐量)为如式(15)所示:
[0102][0103]
因此,使用如式(16)所示的矩阵fk×n表示每个时隙每个发送节 点对应的收包总数,而且fk×n是动态变化的。
[0104][0105]
根据fk×n矩阵,可以分析出,在考虑丢包率的条件下,选出每时 隙中最大的收包
数,让对应的汇点进行数据分发,而且收敛时间最小。 然而,假设有100个zigbee节点,汇点必须将同一消息转发100次, 能耗最大。如果这些zigbee节点的苏醒时隙有重叠,则时延变大, 但能耗变小。因此,本实施例中引入门限值tv和损失函数,来进行 收敛时间和能耗的权衡,并且根据特定的场景,选择合适的数据分发 策略,合理的规划汇点的数据分发调度表,满足所需的时延和能耗的 要求。
[0106]
目标函数取决于能耗和收敛时间,通常由目标需求所定。通过对 (α,β)分配不同的权重,适应广泛的应用需求。例如:如果广播的消 息是关于紧急事件且规模较小,则给α分配一个较大的权重值,β分 配一个较小的权重值,确保喷泉码包能被快速的传递到整个网络,更 快的解码,尽管可能此时消耗更大的能量。如果大的非紧急消息,例 如:代码的更新,则给α分配一个较小的权重值,β分配一个较大的 权重值。能有效的节省发送次数,从而节省能耗。因此,值得注意的 是,最佳转发调度表实际上取决于发送喷泉码包和收敛时间的权重。 为了满足用户需求并能够尽最大可能的减小节点的能耗,时延应在小 于时延上限的前提下尽可能的接近时延上限。而不是越小越好,因为 时延越小意味着节点处于活动状态的时间越长,能耗也就越大,在已 经满足时延限定的条件下这是完全没有必要的能量消耗。鉴于此,可 以把问题归结为在考虑网络总成本的前提下,权衡节点的能耗和网络 时延。由此,本实施例引入tv门限值,表示在时延和能耗权衡下的 最小收包数,其与权衡系数α,β有关,如果α占的比重大,则时延的 重要性占比重大,并且门限值tv随有效节点的减少而动态变化,每 个周期更新矩阵pk×n有效收包数矩阵:元素表示实际收包数与解码阈 值的比值,如式(17)所示:
[0107][0108]
需要判断发包数与还需要的收包数之间的差,如果应收包数大于 还需收包数,应与实际收包数一致,直到矩阵中的元素全为1,解码 成功。最后输出数据分发调度表。
[0109]
最后输出数据分发调度表,即数据分发策略。并且实现了发送节 点发送的数据包的大小是随解码阈值和实际收包数的差动态变化的 收到的数据包动态,以节约能耗。
[0110]
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式, 用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不 局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域 的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明 揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行 修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而 这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实 施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因 此,本发明的保护范围应所述以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献