一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种无线传感器网络中基于强化学习的自适应传输方法与流程

2021-10-26 19:31:00 来源:中国专利 TAG:

技术特征:

1.一种无线传感器网络中基于强化学习的自适应传输方法,其特征在于:包括如下步骤:

1)无线传感器节点构成的通信网络和所述通信网络所处环境进行交互作用;

2)无线传感器节点之间根据当前信道环境结合现有的强化学习算法实时计算得到待发送的数据包数;

3)以无线传感器节点发送数据包到其接收到ACK包的时间或超时计时器设定的时间作为回报;

4)由无线传感器节点利用不同数据传输动作及其对应的数据包传输时间回报来重新计算节点发送数据包数的实时策略。

2.根据权利要求1所述的一种无线传感器网络中基于强化学习的自适应传输方法,其特征在于:所述强化学习算法利用Q学习算法进行迭代计算,算法的状态空间是网络中源节点到目标节点的信道状态,算法的动作空间是节点的数据包增殖个数,动作对应的回报是反馈的时间;对于网络中正在传输的节点从Q值表中选择使得Q值最大的动作;在每次动作之后根据观察到的回报和状态依据以下公式更新更新Q值:

其中Q(S,A)表示无线传感器网络节点S选择动作a的预期收益值,即Q值,α表示取值在(0,1]的学习率,R表示节点在当前动作下得到的回报,γ表示取值在[0,1)的折扣因子,S′表示传输信道即将转移到的下一个节点。

3.根据权利要求1所述的一种无线传感器网络中基于强化学习的自适应传输方法,其特征在于:所述无线传感器包括感受器模块、信号处理模块、数模转换器模块、无线发送器模块、输出电路模块、电源模块及无线接收器模块。

4.根据权利要求4所述的一种无线传感器网络中基于强化学习的自适应传输方法,其特征在于:所述无线传感器根据实际需要利用通信协议建立通信网络,其中有一种或多种类型的信息传输设备发送和接收信息。

5.根据权利要求4所述的一种无线传感器网络中基于强化学习的自适应传输方法,其特征在于:所述无线传感器节点发送数据包存在丢包行为,无线发送器模块可以通过数据包增殖提高数据被接受的概率,当数据包被成功接受则返回确认字符ACK,若数据包因为环境因素传输过久或丢失,当其传输时间超过超时计时器设定时间,则源节点根据当前环境状态重新选择策略发送数据包,直到重传次数达到预设的最大次数,则发送下一段数据。


技术总结
本发明公开一种无线传感器网络中基于强化学习的自适应传输方法,该方法包括由无线传感器节点构成的通信网络和所述网络所处环境的交互作用;节点之间根据当前信道环境结合强化学习实时计算得到待发送的数据包数;状态空间是网络中源节点到目标节点的信道状态,动作空间是节点的数据包增殖个数,以节点发送数据包到其接收到数据包的时间或超时计时器设定的时间作为回报;以及由节点利用不同数据传输动作及其对应的数据传输时间回报来重新计算各个节点发送数据包数的实时策略。

技术研发人员:郑水华;徐逸伦;林伟;周浩杰;
受保护的技术使用者:浙江工业大学;
技术研发日:2021.07.31
技术公布日:2021.10.26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜