一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信道接入方法及相关装置与流程

2022-12-20 20:38:06 来源:中国专利 TAG:

技术特征:
1.一种信道接入方法,其特征在于,所述方法包括:接入点ap接收n个站点sta分别上报的动作信息,n个所述动作信息用于确定每个sta的第一神经网络的训练结果,所述n为正整数;所述ap根据n个所述动作信息,确定每个sta的第一神经网络的训练结果;所述ap将所述每个sta的第一神经网络的训练结果发送给对应的sta。2.根据权利要求1所述的方法,其特征在于,所述动作信息是指一段时间的动作,所述动作为发送或不发送。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:所述ap接收所述n个sta分别上报的载波侦听结果信息或报文传输结果信息;所述ap根据n个所述动作信息,确定每个sta的第一神经网络的训练结果,包括:所述ap根据n个所述动作信息和n个所述载波侦听结果信息,确定每个sta的第一神经网络的训练结果;或者,所述ap根据n个所述动作信息和n个所述报文传输结果信息,确定每个sta的第一神经网络的训练结果。4.根据权利要求1至3任一项所述的方法,其特征在于,所述训练结果为神经网络参数或梯度,所述神经网络参数/梯度用于sta更新第一神经网络。5.根据权利要求1或2所述的方法,其特征在于,所述动作信息携带于sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作;所述数据t子字段用于指示sta上一次成功接收所述第一响应信息后的第t个时隙内的动作。6.根据权利要求1或2所述的方法,其特征在于,所述动作信息携带于sta上报的第一帧的动作详细信息字段中;所述作详细信息字段包括时间指示子字段、动作1子字段和时间1子字段、
……
、动作p子字段和时间p子字段,所述p为正整数;所述时间指示子字段用于指示sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息;所述动作1子字段用于指示sta在上一次成功接收所述第一响应信息后的第一个动作,所述时间1子字段用于指示所述动作1的持续时间或所述动作1的结束时间;所述动作p子字段用于指示sta在上一次成功接收所述第一响应信息的时刻距离当前时刻内的第p个动作,所述时间p子字段用于指示所述动作p的持续时间或所述动作p的结束时间。7.根据权利要求1或2所述的方法,其特征在于,所述动作信息携带于sta上报的第一帧的动作详细信息字段中;
所述动作详细信息字段包括时间1指示子字段和动作1子字段、
……
、时间p指示子字段和动作p子字段,所述p为正整数;所述时间1指示子字段用于指示动作1的起始时间,所述动作1子字段用于指示sta在上一次成功接收第一响应信息后的第一个动作,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息;所述时间p指示子字段用于指示动作p的起始时间,所述动作p子字段用于指示sta在上一次成功接收所述第一响应信息后的时刻距离当前时刻内的第p个动作。8.根据权利要求1或2所述的方法,其特征在于,所述动作信息携带于sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间1指示子字段和持续时间1子字段、
……
、时间k指示子字段和持续时间k子字段,所述k为正整数;所述时间1指示子字段用于指示动作1的开始时间/结束时间,所述动作1是sta在上一次成功接收第一响应信息后,第一次发送报文且未接收到第二响应信息时的发送动作,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息,所述第二响应信息是所述ap成功接收sta发送的报文时发送的响应信息,所述持续时间1子字段用于指示所述动作1的持续时间;所述时间k指示子字段用于指示动作k的开始时间/结束时间,所述动作k是sta在上一次成功接收所述第一响应信息后,第k次发送报文且未接收到所述第二响应信息时的发送动作,所述持续时间k子字段用于指示所述动作k的持续时间。9.根据权利要求1或2所述的方法,其特征在于,所述动作信息携带于sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括第一时间1指示子字段和第二时间1指示子字段、
……
、第一时间k指示子字段和第二时间k指示子字段,所述k为正整数;所述第一时间1指示子字段用于指示动作1的起始时间,所述动作1是sta在上一次成功接收第一响应信息后,第一次发送报文且未接收到第二响应信息时的发送动作,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息,所述第二响应信息是所述ap成功接收sta发送的报文时发送的响应信息,所述第二时间1指示子字段用于指示所述动作1的结束时间;所述第一时间k指示子字段用于指示动作k的起始时间,所述动作k是sta在上一次成功接收所述第一响应信息后,第k次发送报文且未接收到所述第二响应信息时的发送动作,所述第二时间k指示子字段用于指示所述动作k的结束时间。10.根据权利要求3所述的方法,其特征在于,所述动作信息和所述载波侦听结果信息携带于sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作和载波侦听结果;
所述数据t子字段用于指示sta在上一次成功接收所述第一响应信息后的第t个时隙内的动作和载波侦听结果。11.根据权利要求3所述的方法,其特征在于,所述动作信息和所述报文传输结果信息携带于sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作和报文传输结果;所述数据t子字段用于指示sta在上一次成功接收所述第一响应信息后的第t个时隙内的动作和报文传输结果。12.根据权利要求1至11任一项所述的方法,其特征在于,所述ap根据n个所述动作信息,确定每个sta的第一神经网络的训练结果,包括:所述ap将每个sta的状态信息输入到对应sta的第一神经网络,获得所述第一神经网络的输出值;所述ap将每个第一神经网络的输出值输入到第二神经网络,获得所述第二神经网络的输出值,所述第二神经网络的输出值用于表征预设时间内的期望奖励;所述ap根据所述第二神经网络的输出值和奖励函数训练第三神经网络,通过最小化所述第三神经网络的损失函数,确定所述每个第一神经网络的训练结果,所述第三神经网络包括所述每个第一神经网络和所述第二神经网络;其中,所述sta的状态信息是根据sta的动作信息获得的,所述第二神经网络的神经网络参数是根据n个所述动作信息获得的,所述奖励函数是根据n个所述动作信息确定的;或者,所述sta的状态信息是根据sta的动作信息和载波侦听结果信息获得的,所述第二神经网络的神经网络参数是根据n个所述动作信息和n个所述载波侦听结果信息获得的,所述奖励函数是根据n个所述动作信息和n个所述载波侦听结果信息确定的;或者,所述sta的状态信息是根据sta的动作信息和报文传输结果信息获得的,所述第二神经网络的神经网络参数是根据n个所述动作信息和n个所述报文传输结果信息获得的,所述奖励函数是根据n个所述动作信息和n个所述报文传输结果信息确定的。13.根据权利要求12所述的方法,其特征在于,所述方法还包括:所述ap在根据n个所述动作信息确定第一sta发送报文成功时,将所述奖励函数的值设置为1,所述第一sta是所述n个sta中上一次成功接收第二响应信息的时刻距离当前时刻的时间间隔最长的sta。14.根据权利要求12所述的方法,其特征在于,所述方法还包括:所述ap在根据n个所述动作信息确定第二sta发送报文成功时,将所述奖励函数的值设置为第一时长减1;所述第二sta是所述n个sta中,除第一sta外的sta;所述第一sta是所述n个sta中上一次成功接收第二响应信息的时刻距离当前时刻的时间间隔最长的sta;
所述第一时长是所述第二sta上一次成功接收所述第二响应信息的时刻距离当前时刻的时长。15.根据权利要求12所述的方法,其特征在于,所述方法还包括:所述ap在根据n个所述动作信息确定所述n个sta中的m个sta在同一时隙上发送报文时,将所述奖励函数的值设置为-1,所述m为小于或等于所述n的正整数。16.根据权利要求12所述的方法,其特征在于,所述方法还包括:所述ap在根据n个所述动作信息确定所述n个sta在同一时隙上均未发送报文时,将所述奖励函数的值设置为0。17.根据权利要求1至16任一项所述的方法,其特征在于,所述n个sta共享神经网络参数;所述ap将所述每个sta的第一神经网络的训练结果发送给对应的sta,包括:所述ap将所述第一神经网络的训练结果广播给所述n个sta。18.根据权利要求1至16任一项所述的方法,其特征在于,所述n个sta中的s个sta共享神经网络参数,所述s为小于或等于所述n的正整数;所述ap将所述每个sta的第一神经网络的训练结果发送给对应的sta,包括:所述ap将s个sta对应的第一神经网络的训练结果组播给所述s个sta,以及将n-s个第一神经网络的训练结果单播给对应的sta。19.根据权利要求1至16任一项所述的方法,其特征在于,所述n个sta不共享神经网络参数时,所述每个第一神经网络的训练结果是单播给对应的sta的。20.一种信道接入方法,其特征在于,所述方法包括:站点sta向接入点ap上报动作信息,所述动作信息用于确定所述sta的第一神经网络的训练结果;所述sta接收来自所述ap的第一神经网络的训练结果,所述第一神经网络的训练结果用于更新所述第一神经网络,以确定所述sta是否接入信道;所述sta根据所述第一神经网络的训练结果更新所述第一神经网络,并在侦听到信道空闲时根据更新后的第一神经网络和所述sta当前的状态信息确定是否接入信道。21.根据权利要求20所述的方法,其特征在于,所述动作信息是指一段时间的动作,所述动作为发送或不发送。22.根据权利要求20或21所述的方法,其特征在于,所述方法还包括:所述sta向所述ap上报载波侦听结果信息或报文传输结果信息,所述载波侦听结果信息或所述报文传输结果信息用于确定所述sta的第一神经网络的训练结果。23.根据权利要求20至22任一项所述的方法,其特征在于,所述训练结果为神经网络参数或梯度;所述神经网络参数/梯度用于所述sta更新所述第一神经网络。24.根据权利要求20或21所述的方法,其特征在于,所述动作信息携带于所述sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示所述sta上一次成功接收第一响应信息的时刻,所述第
一响应信息是所述成功接收所述sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作;所述数据t子字段用于指示所述sta上一次成功接收所述第一响应信息后的第t个时隙内的动作。25.根据权利要求20或21所述的方法,其特征在于,所述动作信息携带于所述sta上报的第一帧的动作详细信息字段中;所述作详细信息字段包括时间指示子字段、动作1子字段和时间1子字段、
……
、动作p子字段和时间p子字段,所述p为正整数;所述时间指示子字段用于指示所述sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息;所述动作1子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第一个动作,所述持续时间1子字段用于指示所述动作1的持续时间或所述动作1的结束时间;所述动作p子字段用于指示所述sta在上一次成功接收所述第一响应信息的时刻距离当前时刻内的第p个动作,所述持续时间p子字段用于指示所述动作p的持续时间或所述动作p的结束时间。26.根据权利要求20或21所述的方法,其特征在于,所述动作信息携带于所述sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间1指示子字段和动作1子字段、
……
、时间p指示子字段和动作p子字段,所述p为正整数;所述时间1指示子字段用于指示动作1的起始时间,所述动作1子字段用于指示所述sta在上一次成功接收第一响应信息后的第一个动作,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息;所述时间p指示子字段用于指示动作p的起始时间,所述动作p子字段用于指示所述sta在上一次成功接收所述第一响应信息后的时刻距离当前时刻内的第p个动作。27.根据权利要求20或21所述的方法,其特征在于,所述动作信息携带于所述sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间1指示子字段和持续时间1子字段、
……
、时间k指示子字段和持续时间k子字段,所述k为正整数;所述时间1指示子字段用于指示动作1的开始时间/结束时间,所述动作1是所述sta在上一次成功接收第一响应信息后,第一次发送报文且未接收到第二响应信息时的发送动作,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息,所述第二响应信息是所述ap成功接收所述sta发送的报文时发送的响应信息,所述持续时间1子字段用于指示所述动作1的持续时间;所述时间k指示子字段用于指示动作k的开始时间/结束时间,所述动作k是所述sta在上一次成功接收所述第一响应信息后,第k次发送报文且未接收到所述第二响应信息时的发送动作,所述持续时间k子字段用于指示所述动作k的持续时间。28.根据权利要求20或21所述的方法,其特征在于,所述动作信息携带于所述sta上报的第一帧的动作详细信息字段中;
所述动作详细信息字段包括第一时间1指示子字段和第二时间1指示子字段、
……
、第一时间k指示子字段和第二时间k指示子字段,所述k为正整数;所述第一时间1指示子字段用于指示动作1的起始时间,所述动作1是所述sta在上一次成功接收第一响应信息后,第一次发送报文且未接收到第二响应信息时的发送动作,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息,所述第二响应信息是所述ap成功接收所述sta发送的报文时发送的响应信息,所述第二时间1指示子字段用于指示所述动作1的结束时间;所述第一时间k指示子字段用于指示动作k的起始时间,所述动作k是所述sta在上一次成功接收所述第一响应信息后,第k次发送报文且未接收到所述第二响应信息时的发送动作,所述第二时间k指示子字段用于指示所述动作k的结束时间。29.根据权利要求22所述的方法,其特征在于,所述动作信息和所述载波侦听结果信息携带于所述sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示所述sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作和载波侦听结果;所述数据t子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第t个时隙内的动作和载波侦听结果。30.根据权利要求22所述的方法,其特征在于,所述动作信息和所述报文传输结果信息携带于所述sta上报的第一帧的动作详细信息字段中;所述动作详细信息字段包括时间指示子字段、数据1子字段至数据t子字段,所述t为正整数;所述时间指示子字段用于指示sta上一次成功接收第一响应信息的时刻,所述第一响应信息是所述ap成功接收所述sta发送的动作信息时发送的响应信息;所述数据1子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第一个时隙内的动作和报文传输结果;所述数据t子字段用于指示所述sta在上一次成功接收所述第一响应信息后的第t个时隙内的动作和报文传输结果。31.根据权利要求20至30任一项所述的方法,其特征在于,所述sta根据所述第一神经网络的训练结果更新所述第一神经网络,并在侦听到信道空闲时根据更新后的第一神经网络和所述sta当前的状态信息确定是否接入信道,包括:所述sta将该sta当前的状态信息输入到更新后的第一神经网络,输出第一值和第二值,所述第一值用于表征接入信道获得的预期奖励,所述第二值用于表征不接入信道获得的预期奖励;所述sta在所述第一值大于所述第二值时,确定接入信道;所述sta在所述第一值小于所述第二值时,确定不接入信道。32.一种通信装置,其特征在于,所述通信装置包括:
通信单元,用于接收n个站点sta分别上报的动作信息,n个所述动作信息用于确定每个sta的第一神经网络的训练结果,所述n为正整数;处理单元,用于根据n个所述动作信息,确定每个sta的第一神经网络的训练结果;通信单元,还用于将所述每个sta的第一神经网络的训练结果发送给对应的sta。33.一种通信装置,其特征在于,所述通信装置包括:通信单元,用于向接入点ap上报动作信息,所述动作信息用于确定处理单元的第一神经网络的训练结果;通信单元,还用于接收来自所述ap的第一神经网络的训练结果,所述第一神经网络的训练结果用于更新所述第一神经网络,以确定所述处理单元是否接入信道;所述处理单元,用于根据所述第一神经网络的训练结果更新所述第一神经网络,并在侦听到信道空闲时根据更新后的第一神经网络和所述处理单元当前的状态信息确定是否接入信道。34.一种通信装置,其特征在于,包括处理器和收发器,所述收发器用于与其它通信装置进行通信;所述处理器用于运行程序,以使得所述通信装置实现权利要求1至19任一项所述的方法,或者,以使得所述通信装置实现权利要求20至31任一项所述的方法。35.一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当其在计算机上运行时,使得权利要求1至19任一项所述的方法被执行;或者权利要求20至31任一项所述的方法被执行。36.一种包含指令的计算机程序产品,当其在计算机上运行时,使得权利要求1至19任一项所述的方法被执行;或者权利要求20至31任一项所述的方法被执行。

技术总结
本申请提供了一种信道接入方法及相关装置。该方法中,接入点AP接收N个站点STA分别上报的动作信息,N个动作信息用于确定每个STA的第一神经网络的训练结果,N为正整数;从而AP根据该N个动作信息,确定每个STA的第一神经网络的训练结果,并将每个STA的第一神经网络的训练结果发送给对应的STA。每个STA的第一神经网络的训练结果是根据N个STA上报的动作信息确定的,而不是只根据自身STA的动作信息确定的,可提高第一神经网络的预测能力,从而有利于提高每个STA对其他STA信道接入行为的预测能力,进而有利于提高系统的吞吐量和降低通信时延。进而有利于提高系统的吞吐量和降低通信时延。进而有利于提高系统的吞吐量和降低通信时延。


技术研发人员:郭子阳 刘鹏 罗嘉俊 杨讯 李云波
受保护的技术使用者:华为技术有限公司
技术研发日:2021.06.17
技术公布日:2022/12/19
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献