一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

机器人的自主探索方法、机器人及计算机可读存储介质与流程

2022-02-25 22:34:49 来源:中国专利 TAG:

技术特征:
1.一种机器人的自主探索方法,其特征在于,所述机器人的自主探索方法包括:以机器人的当前位置作为待探索点,获取所述待探索点的状态数据;调用策略网络模型,根据所述策略网络模型对所述状态数据进行路径探索,以输出所述待探索点对应的目标信息;所述目标信息包括所述机器人下一步探索的目标点;基于所述目标点和所述待探索点,生成所述机器人的行走路径,并控制所述机器人按照所述行走路径进行探索。2.根据权利要求1所述的机器人的自主探索方法,其特征在于,基于所述目标点和所述待探索点,生成所述机器人的行走路径,并控制所述机器人按照所述行走路径进行探索之后,所述机器人的自主探索方法还包括:在所述机器人到达所述目标点的行进过程中不断计算预设信息对应的数据;若所获取到的预设信息对应的数据满足预设特定条件,则控制所述机器人执行所述预设特定条件对应的特定探索策略。3.根据权利要求2所述的机器人的自主探索方法,其特征在于:所述预设信息配置在所述机器人上,所述预设信息至少包括已探索区域覆盖率值、第一预设时间内物理碰撞次数和待探索区域的尺寸参数的一种或多种。4.根据权利要求3所述的机器人的自主探索方法,其特征在于,若所获取到的预设信息对应的数据满足预设特定条件,则控制所述机器人执行预设特定条件对应的特定探索策略,所述特定探索策略至少包括:若所述机器人的已探索区域覆盖率值大于地图覆盖率阈值,则控制所述机器人以预设路径执行探索操作;若所述机器人在第一预设时间内物理碰撞次数大于碰撞次数阈值,则控制所述机器人停止探索操作;若所述机器人获取的待探索区域的尺寸参数小于尺寸阈值时,则控制所述机器人标记前方探索区域为障碍物。5.根据权利要求1所述的机器人的自主探索方法,其特征在于,所述基于所述目标点和所述待探索点,生成所述机器人的行走路径,并控制所述机器人按照所述行走路径进行探索之后,所述机器人的自主探索方法还包括:若所述机器人在第二预设时间后仍未到达所述目标点,则基于所述机器人当前所在位置重新更新所述目标点。6.根据权利要求1所述的机器人的自主探索方法,其特征在于,所述状态数据包括:当前时隙已建立的占据栅格地图、表征机器人当前位置的图、表征机器人的历史运行路径的数据、表征机器人已探知区域和未探知区域情况的数据和表征机器人一段时间内碰撞位置和/或次数的数据中的一种或多种。7.根据权利要求1所述的机器人的自主探索方法,其特征在于:所述策略网络模型是经过训练的策略网络模型,所述策略网络模型包括若干级联设置的卷积层、若干级联设置的全连接层以及归一化层。8.根据权利要求7所述的机器人的自主探索方法,其特征在于:通过所述卷积层对所述状态数据进行映射变换或特征提取,得到状态特征图,所述状态特征图经过所述全连接层及所述归一化层处理后得到待探索目标图,所述待探索目标图包括所述目标点的坐标信
息。9.根据权利要求7所述的机器人的自主探索方法,其特征在于,所述策略网络模型的训练中还配置有评价网络,所述评价网络用于辅助所述策略网络模型的训练。10.根据权利要求1所述的机器人的自主探索方法,其特征在于,所述机器人的自主探索方法还包括:根据所述待探索点对应的目标信息绘制所述机器人当前位置的局部地图或全局地图。11.一种机器人,包括壳体、收容在所述壳体内用于控制所述机器人运行的控制装置,其特征在于:所述机器人还包括探索模块、数据处理模块、策略网络模型以及路径规划模块,所述探索模块用于探索待探索点的信息;所述数据处理模块用于接收所述待探索点的信息,并输出所述待探索点的状态数据;所述控制装置调用所述策略网络模型,将状态数据输入所述策略网络模型,并通过所述策略网络模型输出所述待探索点对应的目标信息;所述目标信息包括所述机器人下一步探索的目标点;所述路径规划模块用于基于所述目标点和所述待探索点,生成所述机器人的行走路径;所述控制装置用于控制所述机器人按照所述行走路径进行探索。12.根据权利要求11所述的机器人,其特征在于:所述数据处理模块包括数据缓存、数据提取、数据更新、数据预处理和数据合并的一种或多种处理程序。13.根据权利要求11所述的机器人,其特征在于:所述机器人还包括定位建图模块,所述定位建图模块用于根据所述待探索点对应的目标信息绘制所述机器人当前位置的局部地图或全局地图。14.根据权利要求11所述的机器人,其特征在于:所述策略网络模型包括若干层神经网络。15.根据权利要求11所述的机器人,其特征在于:所述机器人还包括学习模块和评价模块,所述学习模块用于训练所述策略网络模型,所述评价模块用于辅助所述策略网络模型的训练。16.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质上存储有机器人的自主探索的程序,所述机器人的自主探索的程序被控制装置执行时实现如权利要求1-10任一项所述机器人的自主探索方法。

技术总结
本发明提供了机器人的自主探索方法、机器人及计算机可读存储介质。该机器人的自主探索方法包括:以机器人当前位置作为待探索点,获取待探索点的状态数据;调用策略网络模型,根据策略网络模型对状态数据进行路径探索,以输出待探索点对应的目标信息;目标信息包括机器人下一步探索的目标点;基于目标点和待探索点,生成机器人的行走路径,并控制机器人按照行走路径进行探索。本发明的机器人的自主探索方法通过使用神经网络参数化表征的探索策略,有效提升了机器人的探索效率。有效提升了机器人的探索效率。有效提升了机器人的探索效率。


技术研发人员:竺浩 吴泽晓 刘建平 宋昱慧
受保护的技术使用者:深圳市杉川机器人有限公司
技术研发日:2021.11.11
技术公布日:2022/2/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献