一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自组织增量神经网络的机械臂非均匀采样规划方法与流程

2022-11-19 13:43:59 来源:中国专利 TAG:


1.本发明涉及基于自组织增量神经网络的机械臂非均匀采样规划方法,属于机械臂采样规划技术领域。


背景技术:

2.机器人操作规划是各类操作任务能否顺利完成的重要保障。尤其是对于复杂障碍物场景来说,操作规划的时间往往较长,其规划路径质量、成功率等会大幅下降,对操作任务的执行产生较大影响。由机器人学的相关内容可知,操作规划包括运动规划、轨迹和抓取三部分内容。其中,运动规划由于需要对构型空间进行探索和碰撞检测来生成离散的路径点,是整个操作规划的基础,其时间消耗也非常大;轨迹规划本质上属于插值拟合的数值计算问题,耗时很短,可以忽略不计。抓取规划对于二指夹持器来说,其时间消耗也可以忽略不计。因此,高速操作规划问题就转化为了复杂障碍物环境下的运动规划问题。
3.运动规划问题可以定义为在障碍物环境中,在起始状态点和目标状态点之间寻找一条可行的轨迹。许多研究已经表明,基于采样的运动规划算法在高维、连续的构型空间中非常有效,具备概率完备性。基于采样概率方法的基本思想就是对整个构型空间进行无差别采样(即随机采样)并通过碰撞检测模块找到局部连接来获得机器人工作空间(即状态空间)的高维隐式表示。由于受到动力学或其他隐含约束的限制,大多数物理机器人只能在受限空间内操作。事实上,正是由于这些约束,使得碰撞检测成为基于采样的运动规划算法的一个重要组成部分。此外,大多数基于采样的规划算法,如prm、rrt、rrt-star,通常需要大量的基于运动学的碰撞检测来生成候选路径。在这个过程中,每个样本都需要生成和计算,并通过碰撞检测算法判断它是否属于无碰撞空间。许多专家表明,对于基于采样的规划算法来说,碰撞检测可占据总规划时间的90%以上。因此,减少碰撞检测消耗就可以大幅缩短运动规划算法的执行时间,从而提高机器人操作规划的执行效率。
4.实际上,对于这些采样规划算法,它们的样本通常是由一个样本源生成的,大部分样本源都是均匀且随机的。这样的采样策略可以获得一条良好的路径,但是为了区分障碍物区域和非障碍物区域,需要进行碰撞检测,尤其是如果障碍物数量非常多的话,检测碰撞将耗费大量的时间。为了减少碰撞检测的时间损耗,比较理想的解决方案是设计一个非均匀采样策略,如果可以确保采样过程只发生在无碰撞区域,那么就无需进行碰撞检测,从而节省大量规划时间。通过自组织增量神经网络的学习方法,就可以形成一个新的采样源,使得采样过程只发生在构型空间的无碰撞区域中。相比于普通的采样规划算法来说,这种通过学习的方式获得的采样源在相同时间内可以在无碰撞的空间中生成更多的样本,进而可以获得更高质量的路径。
5.通过以上分析,基于自组织增量神经网络的机械臂非均匀采样运动规划有巨大的潜力。由于复杂障碍物环境存在大量障碍物信息约束,传统的机械臂操作规划方法例如rrt、rrt-star、prm-star需要耗费大量的时间进行碰撞检测以实现避障,导致规划时间长、计算消耗多、路径质量差等问题。针对这些问题,提出一种基于自组织增量神经网络的运动
规划方法。首先是离线学习,把已经规划好的路径作为自组织增量神经网络的学习输入,目的是表征学习构型空间中的障碍物区域分布和非障碍物区域分布。然后将已训练好的soinn作为构型空间的非均匀采样样本生成器,有目的性地引导采样规划器算法的搜索和扩展在构型空间中对应的非障碍物区域展开,减少或者避免碰撞检测,进而在较短时间内生成质量更高的候选路径。最后搭建了面向复杂障碍物场景的仿真系统,对所提出方法进行验证。


技术实现要素:

6.本发明目的是提供了基于自组织增量神经网络的机械臂非均匀采样规划方法,通过在线规划的非均匀采样,路径发生碰撞的概率大大减低,缩短了规划时间。
7.本发明为实现上述目的,通过以下技术方案实现:
8.步骤1:进行离线训练,获取过往成功的规划信息,作为自组织神经网络的训练输入数据,训练产生障碍物区域和非障碍物区域,其中非障碍物区域作为非均匀采样源;
9.步骤2:基于自组织增量神经网络的非均匀采样离线训练,具体过程如下:
10.步骤2-1:初始化网络模型,令节点集合为空;
11.步骤2-2:输入训练样本x;
12.步骤2-3:对激活节点集合a进行检测,如果节点集合a为空,则初始化一个新的节点,然后跳转步骤2-2;如果节点集合a不为空,从集合a中获取获胜节点i,并更新获胜节点;
13.步骤2-4:在集合a中建立节点之间的连接,将这些连接放在邻接表集合e;
14.步骤2-5:检测获胜节点i和邻接节点j,如果这些节点满足合并条件,则进行合并操作,合并规则参考公式(1.3)-(1.5);
15.步骤2-6:如果所有训练样本均处理完毕,则执行聚类操作,否则,跳转步骤2-2;
16.步骤3:对节点进行聚类操作,具体步骤如下:
17.步骤3-1:初始化节点并清除附着标签等信息;选择一个未分类的节点i并给定标签为类别f;
18.步骤3-2:搜索节点集合寻找所有符合条件的节点并将其划分为和节点8相同的类别,所述符合条件的节点是指节点8和符合条件的节点之间存在着直接或间接的连接;
19.步骤3-3:跳转步骤3-2继续此过程,直到所有节点都被分类,则聚类结束,进行样本点生成;
20.步骤4:上层非均匀采样策略及样本点生成;经过上述离线训练可得到两个训练后的网络:一个代表无碰撞区域的样本分布,另一个代表碰撞区域的样本分布;这些采样数据可直接用于生成扩展树或者概率图,而无需进行碰撞检测;
21.非均匀采样点样本,通过采样算法,得到从起点到终点的候选路径,再对该路径进行碰撞检测,如果发生碰撞,就从采样点样本中重新规划新的候选路径,直到没有碰撞发生。最终输出安全路径,并把它作为下次神经网络的数据输入。
22.2、根据权利要求1所述的基于自组织增量神经网络的机械臂非均匀采样规划方法,其特征在于,所述自组织增量神经网络包括两个网络层:输入层和竞争层;所述输入层,神经元的数目与输入数据的维数相同,所述竞争层,其神经元的初始数目为零,跟随训练过程,竞争层自适应地添加、合并和删除节点。
23.3、根据权利要求2所述的基于自组织增量神经网络的机械臂非均匀采样规划方法,其特征在于,所述竞争层中添加新节点u的方式如下:
24.u:<cu=x,mu=σi,nu=1,hu=εn>
25.其中,x为输入,σ是一个小的正参数,i是单位矩阵,另外ε是nu的函数。
26.4、根据权利要求3所述的基于自组织增量神经网络的机械臂非均匀采样规划方法,其特征在于,从集合a中获取获胜节点i的具体方法如下:所述获胜节点为离x马氏距离最近的节点,计算节点c和节点x马氏距离的方法如下:
[0027][0028]
其中n是集合a的节点数,m是协方差矩阵。
[0029]
5、根据权利要求4所述的基于自组织增量神经网络的机械臂非均匀采样规划方法,其特征在于,所述合并操作的具体方式如下:如果离节点x的马氏距离最近的两个节点i,j之间有连接,则节点i和节点j满足合并条件,合并规则如下:
[0030]
nm=ni nj[0031]cm
=(n
ici
n
jcj
)/nm[0032]mm
=(nimi njmj)/nm。
[0033]
本发明的优点在于:本技术采用自组织增量神经网络产生的采样点样本作为运动规划的采样源。通过在线规划的非均匀采样,路径发生碰撞的概率大大减低,因此规划时间缩短。在离线训练过程中,通过对输入样本的添加、删除以及合并,让训练出来的采样源能够更准确的表现非障碍物区域。通过马氏距离计算出获胜节点,而以前的算法通常使用欧氏距离。马氏距离修正了欧氏距离中各个维度尺度不一致且相关的问题,更适合神经网络的训练。
附图说明
[0034]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0035]
图1为本发明系统结整体流程示意图。
[0036]
图2为本发明非均匀采样策略示意图。
[0037]
图3为本发明训练自组织增量神经网络的样本示意图。
[0038]
图4为本发明训练后的采样点分布样本示意图。
[0039]
图5为二维规划问题示意图。
[0040]
图6为传统采样运动规划示意图,a为rrt,b为rrt-star,c为prm。
[0041]
图7为基于神经网络的运动规划示意图,a为rrt,b为rrt-star,c为prm。
具体实施方式
[0042]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0043]
3.1.1整体流程图
[0044]
首先是离线训练,获取过往成功的规划信息,作为自组织神经网络的训练输入数据。训练产生障碍物区域和非障碍物区域,其中非障碍物区域作为非均匀采样源。
[0045]
然后是在线规划,输入运动的起点和终点,让非障碍物区域生成非均匀采样点样本,对此样本使用路径规划算法。待算法生成运动路径后开始进行碰撞检测,如果路径发生了膨胀,则再次运行在线规划,重新生成采样点样本如果没有发生碰撞,则表明这条路径可行,再把这次规划好的路径作为训练数据输入给神经网络中,更新数据库。
[0046]
3.1.2离线训练采样分布
[0047]
首先,需要利用先前成功的规划信息,通过离线训练的方法对自组织增量神经网络进行训练。需要说明的是,这些训练数据可以通过人工示教、已完成的运动规划、先前存在的路径等信息中获取。离线训练的目的是表征学习构型空间中的障碍物区域分布和非障碍物区域分布,这也是非均匀采样策略的基础。在训练过程中,自组织增量神经网络有两个网络层:输入层和竞争层。对于输入层,神经元的数目与输入数据的维数相同。对于竞争层,其神经元的初始数目为零。随着训练的进行,竞争层可以自适应地添加、合并和删除节点来描述原始输入数据的拓扑结构。
[0048]
竞争层中添加新节点u的方式如下:
[0049]
u:<cu=x,mu=σi,nu=1,hu=εn>
[0050]
其中,x为输入,σ是一个小的正参数,i是单位矩阵,另外ε是nu的函数,其目的是控制超椭球的伸缩度。
[0051]
需要从集合a中计算出输入节点x的获胜节点,获胜节点就是离x马氏距离最近的节点。计算节点c和节点x马氏距离的方法如下:
[0052][0053]
其中n是集合a的节点数,m是协方差矩阵。
[0054]
如果离节点x的马氏距离最近的两个节点i,j之间有连接,则节点i和节点j满足合并条件,合并规则如下:
[0055]
nm=ni nj[0056]cm
=(n
ici
n
jcj
)/nm[0057]mm
=(nimi njmj)/nm[0058]
基于自组织增量神经网络的非均匀采样离线训练过程的完整算法如下:
[0059]
1初始化网络模型,令节点集合为空。
[0060]
2输入训练样本x。
[0061]
3对激活节点集合a进行检测,确保该集合的元素是由输入样本x所激活的节点。
[0062]
4如果节点集合a为空,则使用公式(1.1)初始化一个新的节点,然后跳转步骤2。
[0063]
5如果节点集合a不为空,用公式(1.2)从集合a中获取获胜节点i,并更新获胜节点。
[0064]
6在集合a中建立节点之间的连接,将这些连接放在邻接表集合e。
[0065]
7检测获胜节点i和邻接节点j。如果这些节点满足合并条件,则进行合并操作。合并规则参考公式(1.3)-(1.5)。
[0066]
8如果所有训练样本均处理完毕,则跳转步骤9。否则,跳转步骤2。
[0067]
9开始执行聚类操作。
[0068]
3.1.3聚类操作
[0069]
当训练数据输入到网络中时,获胜节点及其邻接点可以通过上述公式完成合并。如果训练过程完成,自组织增量神经网络将对学习的节点进行聚类并显示训练结果。当竞争层中所有的激活节点连接起来形成一个足够有用的拓扑图(即训练样本数足以获得其稠密分布)时,拓扑图中的每个连通子图都可以作为一个簇。每个节点表示局部区域的数据分布,而节点之间的邻域关系则反映局部区域在输入空间中的拓扑关系,即反映全局关系。因此,原始输入数据的拓扑结构可以用全局拓扑关系和局部分布细节来描述。聚类的算法如下:
[0070]
1初始化节点并清除附着标签等信息。
[0071]
2选择一个未分类的节点i并给定标签为类别e。
[0072]
3搜索节点集合寻找所有符合条件的节点并将其划分为和节点8相同的类别。(注意,符合条件的节点是指节点8和符合条件的节点之间存在着直接或间接的连接。)
[0073]
4跳转步骤2继续此过程,直到所有节点都被分类,则聚类结束。开始样本点生成。
[0074]
3.1.4上层非均匀采样策略及样本点生成
[0075]
经过上述离线训练可得到两个训练后的网络:一个代表无碰撞区域的样本分布,另一个代表碰撞区域的样本分布。那么,基于已训练网络的非均匀采样策略如图2所示。这些采样数据
[0076]
3.1.4运动规划和碰撞检测
[0077]
通过上一步得到的非均匀采样点样本,再运行rrt、prm、rrt-star等采样算法,可以得到从起点到终点的候选路径。之后再对该路径进行碰撞检测,大部分情况下,自组织增量神经网络的采样点不会发生碰撞,但为了保证安全,还是对路径进行碰撞检测。如果发生碰撞,就从采样点样本中重新规划新的候选路径,直到没有碰撞发生。最终输出安全路径,并把他作为下次神经网络的数据输入。具体流程图可查看图1。
[0078]
以上就是基于自组织增量神经网络的机械臂非均匀采样运动规划的整题思路和方法。
[0079]
3.2、实施方案中的关键点
[0080]
1.本文采用自组织增量神经网络产生的采样点样本作为运动规划的采样源。通过在线规划的非均匀采样,路径发生碰撞的概率大大减低,因此规划时间缩短。
[0081]
2.在离线训练过程中,通过对输入样本的添加、删除以及合并,让训练出来的采样源能够更准确的表现非障碍物区域。
[0082]
3.通过马氏距离计算出获胜节点,而以前的算法通常使用欧氏距离。马氏距离修正了欧氏距离中各个维度尺度不一致且相关的问题,更适合神经网络的训练。
[0083]
3.3、算法的仿真和对比
[0084]
3.3.1自组织增量神经网络的训练
[0085]
为了验证自组织神经网络的有效性,先找到一张图片并使用神经网络进行训练,如图3所示。图中可以看到,在黑色障碍物中,存在白色的环形和圆形为非障碍区域,对这张图片进行训练。可以得到训练结果如图4。
[0086]
通过图4可以看到,训练后的采样点分布非常准确的表述了图3中非障碍物区域,并通过聚类把不同的节点分为两个类。
[0087]
3.3.2在运动规划中验证算法并对比实验
[0088]
使用基本的rrt、rrt-star、prm三种算法和对应的基于神经网络算法进行对比。设置几何规划问题如图5所示:
[0089]
传统运动规划算法和采用自组织增量升级网络的规划算法如图6和图7:
[0090]
从图6和图7的对比,可以看出相较于传统算法,基于神经网络的路径规划算法采用非均匀采样源,相同时间内,会有更多的采样点落在空白区域,因此路径也更优,耗时更短。并且神经网络训练的输入采用已经规划好的路径,可以最大限度的避免碰撞,因此碰撞检测消耗的时间也更少。而且规划好的路径可以再次作为神经网络模型训练的输入,让非障碍物区域越来越精确,规划效果也会越来越好。
[0091]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献