一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于大数据的组队循迹规划导航方法与流程

2022-02-19 23:49:36 来源:中国专利 TAG:

技术特征:
1.一种基于大数据的组队循迹规划导航方法,其特征在于,包括如下步骤:(1)获取组队各节点环境和运动数据;(2)对组队的各节点进行轨迹规划,依据节点运动速度确定节点每一步的步长;根据步长规划出从轨迹起点到终点的n个定位轨迹点;(3)n个定位轨迹点处搜索节点的最优空间位置;(4)获得节点运动最优状态;(5)根据节点运动最优状态,构建节点运动轨迹;(6)通过随机森林回归的运动动作优化形成修正偏置的映射;(7)对各节点包括综合数据的轨迹进行实时规划导航。2.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(1)包括:(1.1)设定最小防碰撞距离:其中:表示t时刻i1、i2两个节点的位置,i1≠i2,s
min
为节点最小防碰撞距离;(1.2)获取路程距离:其中:v
t,m
为t时刻标号为m节点的移动速度,m为节点总数,o为循迹规划终点位置,x
t,m
为t时刻m节点的位置,t1为节点运动的起始时间,t2为节点运动的终止时间,其中i为标号;(1.3)设定最大通信距离:其中:为主节点a
i
在t时刻的位置,为从节点b
i
在t时刻的位置,s
max
为节点最大通信距离;(1.4)获取安全代价:获取t时刻第i个节点到第r个雷达的距离:(x
t,i
,y
t,i
,z
t,i
)为第i个节点在t时刻的位置;为各节点上共r个雷达中第r个雷达探测区域的中心位置坐标;获取t时刻第r个雷达对第i个节点的单位时间威胁代价:
s
rmax
为第r部雷达的最远探测半径;s
rmin
为第r部雷达的预警区域半径;获得外部节点威胁代价:获取t时刻第i个节点到第w个禁行区域的距离:获取t时刻第i个节点到第w个禁行区域的距离:为w个禁行区域中第w个禁行区域的中心位置;获取t时刻第w个禁行区域对第i个节点的单位时间威胁代价:s
wmin
为禁行区域的最小威胁半径,s
wmax
为禁行区域的最大威胁半径;获得禁行区域威胁代价:获得节点运动的安全代价:s
th
=s
an
s
pr
(1.5)获得节点的姿态参数:其中:v
max
为节点的最大速度、为节点的最大俯仰角、θ
max
为节点的最大方位角、v
t,i
为t时刻i节点的速度、为t时刻i节点的俯仰角、θ
t,i
为t时刻i节点的方位角。3.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(3)包括:(3)包括:其中:k为当前迭代次数,c1和c2为学习因子,rand()为随机函数,pbest
k
为t时刻第i个
节点的历史最好位置,gbest
k
为所有节点经历的最好位置,α为惯性系数。4.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(4)包括:(4.1)在t时刻,节点运动的状态向量为:ξ
i
(t)=[q
i
(t),v
i
(t)]
t
式中,q
i
(t)=[q
x,i
(t),q
y,i
(t),q
z,i
(t)]
t
表示节点位置信息,q
x,i
(t)、q
y,i
(t)和q
z,i
(t)分别代表笛卡尔坐标系下,第i个节点t时刻在三维空间中x、y和z三个方向的位置坐标点,v
i
(t)=[v
x,i
(t),v
y,i
(t),v
z,i
(t)]
t
表示第i个节点t时刻的速度信息,v
x,i
(t)、v
y,i
(t)和v
z,i
(t)分别代表笛卡尔坐标系下,第i个节点t时刻在三维空间中x、y和z三个方向的速度分量;(4.2)根据t

1时刻节点的运动状态ξ
i
(t

1|t),完成t时刻的状态预测:式中,为任意ω个采样间隔内节点的机动模型,为节点在实际环境中运动的随机扰动或白噪声;(4.3)计算t时刻的量测预测:β
i
(t|t

1)=h
i
(t)δ
i
(t|t

1)线性测量矩阵为:|| ||表示求模运算;(4.4)节点传感器获得有效量测数据m
i
(t):(4.5)计算每个有效量测数据m
i
(t)的新息:ε
i
(t)=m
i
(t)

β
i
(t|t

1)(4.6)计算t

1时刻节点状态协方差为:cov()表示协方差运算;(4.7)计算t时刻的状态协方差预测p
i
(t|t

1):1):为随机扰动对应的协方差;(4.8)预测新息的协方差o(t):
y(t)为量测噪声协方差:(4.9)计算每个量测数据的关联概率γ
i
(t):(t):(4.10)综合新息:(4.11)更新节点在t时刻的最优状态ξ
i
(t|t),用于t 1时刻的最优运动状态更新:ξ
i
(t|t)=ξ
i
(t|t

1) k(t)ε(t)k(t)=p
i
(t|t

1)h
i
(t)i
‑1(t)为卡尔曼滤波器增益;(4.12)更新节点在t时刻的状态协方差预测p(t|t):(4.13)重复执行步骤(4.2)到(4.12),得到节点的最优运动状态。5.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(5)包括:(5.1)根据节点运动的状态向量ξ
i
(t),确定节点轨迹规划的强化学习状态空间s
i,t
为:s
i,t
=ξ
i
(t|t)(5.2)获取节点轨迹规划的强化学习动作空间a
i,t
为:为:θ
i,t
=θ
t,i
;(5.3)设定节点轨迹规划的强化学习奖励函数r
i,t
为:r
i,t
=r
i,1
r
i,2
r
i,1
为第i个节点的达正奖励,r
i,2
为负奖励;为负奖励;式中,p
t1
为节点的起始位置,s
max
表示节点能源可提供的最大可运动距离;(5.4)搭建actor网络和critic网络,均为3层全连接网络结构,actor网络的输入层为2个神经元,输出层为6个神经元,critic网络的输入层为8个神经元,输出层为1个神经元;actor网络学习率为2
×
10
‑4,critic网络学习率为4
×
10
‑4,设置训练参数:回合更新次数为15000,每回合时间步数为75,延迟步数为3,记忆池大小为6000,采集经验数据的批量大小为16,折扣因子大小为0.99;
(5.5)按照td3算法进行网络训练,得到节点运动轨迹,其中网络为actor网络和critic网络,均为3层全连接网络结构,actor网络的输入层为2个神经元,输出层为6个神经元,critic网络的输入层为8个神经元,输出层为1个神经元;actor网络学习率为2
×
10
‑4,critic网络学习率为4
×
10
‑4,设置训练参数:回合更新次数为15000,每回合时间步数为75,延迟步数为3,记忆池大小为6000,采集经验数据的批量大小为16,折扣因子大小为0.99。6.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(6)包括:(6.1)采集t时刻节点i轨迹连线和节点与终点连线的动作偏置构建任意t时刻节点i的角度数据集,生成回归模型训练的数据集生成回归模型训练的数据集(6.2)按照td3算法训练的actor网络,决策节点每一时刻的强化学习动作空间a
i,t
;节点执行运动动作到下一位置;连接前后两个位置形成标定线;(6.3)设置随机森林回归模型的基本参数:决策树个数100,决策树最大深度10,训练随机森林回归模型,得到运动动作到运动动作修正偏置的映射。7.根据权利要求1所述的一种基于大数据的组队循迹规划导航方法,其特征在于,步骤(7)包括:(7.1)将节点在t时刻的最优状态ξ
i
(t|t)输入td3算法训练的actor网络,决策动作空间a
i,t
;(7.2)将步骤动作空间a
i,t
输入已训练的随机森林回归模型,得到对应的动作偏置(7.3)判决运动动作偏置:若τ>0.85,则不进行动作优化;若τ≤0.85,则进行动作优化;(7.4)若不优化运动动作,则继续按照动作空间a
i,t
控制输出;若需要优化运动动作,则新的动作空间为a
i,t_new
:(7.5)在节点运动过程中,循环执行步骤(7.1)—(7.4),形成最终轨迹。

技术总结
本发明涉及一种高可靠性、高精度、用时短的基于大数据的组队循迹规划导航方法。具体包括:获取组队各节点环境和运动数据;对组队的各节点进行轨迹规划,依据节点运动速度确定节点每一步的步长;根据步长规划出从轨迹起点到终点的N个定位轨迹点;N个定位轨迹点处搜索节点的最优空间位置;获得节点运动最优状态;根据节点运动最优状态,构建节点运动轨迹;通过随机森林回归的运动动作优化形成修正偏置的映射;对各节点包括综合数据的轨迹进行实时规划导航。采用上述技术方案解算的组队拥有相对于现有方法更优异的循迹导航效果,定位精度高、运行时间短。运行时间短。运行时间短。


技术研发人员:ꢀ(74)专利代理机构
受保护的技术使用者:哈尔滨工程大学
技术研发日:2021.10.20
技术公布日:2022/1/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献