用于学习神经网络的参数、用于生成外骨骼的轨迹以及用于将外骨骼设置处于运动中的方法与流程

2022-05-12 00:01:44 来源：中国专利 TAG：

1.本发明涉及外骨骼类型的机器人领域。2.更准确地说，本发明涉及用于学习神经网络的参数的方法、用于使用神经网络生成外骨骼轨迹的方法、以及用于将外骨骼设置处于运动中的方法。
背景技术：
：：3.最近，对于患有严重行动问题的人(诸如截瘫患者)，出现了称为外骨骼的辅助行走设备，这些辅助行走设备是操作者(人类用户)由于将外骨骼的移动与他们自己的移动联系起来的紧固件系统而“穿上”的外部机器人设备。用于下肢的外骨骼具有几个关节(通常至少在膝盖和臀部处)以再现行走移动。致动器使得可以移动这些关节，这些关节进而移动操作者。界面系统允许操作者向外骨骼给出命令，并且控制系统将这些命令转换为用于致动器的命令。该设备通常利用传感器进行补充。4.这些外骨骼相对于轮椅构成了进步，因为它们允许操作者站起来并且行走。外骨骼不再受轮限制，并且理论上可以在不平坦的大多数环境中四处移动：与腿相反，轮使得不能跨越实质性的障碍，诸如台阶、楼梯、具有过高的高度的障碍等。5.然而，在它们的使用中，这些外骨骼中没有一个实行自主人类行走，也就是说，在各种各样的地形上稳定且切实可行并且是拟人化的且无辅助的。6.在大多数情况下，这些限制由于设备无法自己管理平衡或行走方向而形成。然后，这两个任务通常被转移给操作者，该操作者借助拐杖来执行它们，如例如在rewalk的专利us7153242或ekso-bionics的申请us2016038371中所提出的那样。7.rex-bionics的专利ep2231096描述了唯一可以在没有外部帮助的情况下用于不能确保自身稳定性的人的外骨骼。段落[0122]中描述的控制原理清楚地解释了将支撑多边形的一部分(与地面的接触点的凸包络线)的压力中心(与由地面对系统施加的反作用力的合力相对应的物理点)转移到支撑多边形的另一部分的必要性。[0008]这种限制使得步行极慢(每分钟几米，但是正常的步行超过2km/h)、具有较短的步子(小于30cm，但是正常的步幅范围从50到80cm)，在此期间支撑脚始终与地面保持平坦接触。因此，可以进入的环境类型是有限的，因为事实上不包括不平坦的地形。同样地，如果在给定时刻系统将系统的脚放在最小的障碍物上，最小的障碍物(诸如卵石、小物体)也生成系统失衡的风险，并最终导致系统倒下。[0009]相反，“自然”人类行走的特征在于一系列的阶段，在这些阶段中，脚可以平放在地面上、在空中或在地面上转动的过程中。转动脚的这种能力对于行走是必不可少的，因为它使得可以进行更大的步子并允许各种各样的地形上的稳定性。[0010]然而，上文描述的所谓的第一代外骨骼不具有被致动脚或者将支撑脚保持在地面上。[0011]对于两足人形机器人或机器人设备来说，实行这种转动确实是复杂的。当压力中心达到支撑多边形的极限时，系统开始围绕这个点转动并且因此不再处于静态平衡。[0012]在行走的情况下，脚的转动意味着在支撑脚处与地面的接触的部分丢失、具有几个后果：[0013]-支撑多边形(支撑表面)减小，潜在地到达这样的点，使得难以甚至不可能保持压力中心在支撑多边形内部；[0014]-系统处于欠致动的状态，也就是说，它不再能在其所有自由度上起作用。[0015]然后全部移动不再可能。[0016]在这种情况下，利用平脚行走的常规形式(诸如在文献“kajitas.,k.f.(2003),bipedwalkingpatterngenerationbyusingpreviewcontrolofzero-momentpoint.icra,(pp.1620-1626)”中描述的)或者专利rex-bionicsep2231096中描述的原理已经不能工作。[0017]自然的想法是将摆动腿带到前面并将第二只脚放在地面上以便返回到支撑多边形和平衡，与此同时系统围绕支撑脚处于自由旋转，可以说是处于“摔倒”的过程中。这被称为动态行走，因为身体经历一系列不稳定的姿势，但仅作为过渡(如果人在空中被“阻止”，他们就会摔倒)。[0018]在动态行走的这种方法中，将摆动的腿快速带到至少短暂地重新建立平衡的位置是复杂的。实际上，如果使这个脚遵循在预先计算的时间内参数化的轨迹，由于欠致动系统的不可控行为，即使在受到轻微的干扰(也不可能修正稍微偏离所规划的轨迹的轨迹)时，这个脚也有过早或过晚触地的风险。这对于操作者可能生成不适，使操作者失去平衡，或者甚至导致他们摔倒，包括在简单的地形上。[0019]为此，所有第一代外骨骼(和许多人形机器人)试图通过保持支撑脚平坦来避免这种类型的情况，其结果是对行走速度、步子的长度、可允许的地形类型和行走的总体稳定性的上述限制。[0020]因此，在申请wo2018130784中提出了一种新的外骨骼行走模式，结合了“虚拟约束”和“混合零动态”(hybridzerodynamics，hzd)的原理允许快速和自然行走，并且即使在困难和不可预见的地形上也没有摔倒或失衡的风险。[0021]常规上，轨迹(即每个自由度的变化)被表示为时间的函数。系统的“动态”由以下函数定义：[0022][0023]以及起始点[0024]ξ∈χ[0025]函数f被写成[0026][0027]χ是外骨骼1的状态空间，u是控制空间，以及t代表时间。[0028]相反，hzd是未被致动的自由度的动态。这种动态被称为“零”，因为它对应于命令不能或不想作用的程度，也就是说，命令值为0并且是“混合的”，因为脚在地面上的冲击强加了与连续相位相交的不连续瞬时相位。[0029]在所谓的“虚拟约束”方法中，原理是针对选择所致动的自由度定义通过变化参数而不通过时间参数化、但是直接根据配置来参数化的轨迹，这个参数称为相位变量。这种相位变量的示例是脚跟-臀部轴线和竖直线之间的角度，该角度构成了以上提及的未致动的自由度。[0030]相位变量使得可以定义步子的“进度”。更准确地说，在每个步子，相位变量在被重新分配初始值之前，不断地从初始值切换到最终值：这是下一步子的开始。为了使事情变得简单，可以将相位参数的值归一化到0至1之间。[0031]变化参数的每个值对应于系统必须寻求遵循的被致动的自由度的值：其是被称为虚拟约束的这些关系(期望以这种方式控制的每个所致动的动自由度一个)。[0032]如果系统精确地遵循可能和期望作用的自由度的这个轨迹，换句话说，如果虚拟约束符合这些自由度，那么系统的变化完全由这些没有被致动的遵循它们自己的动态的自由度决定，这是hzd。[0033]因此，良好的虚拟约束选择可以使这种动态包含吸引人的周期性“轨道”，也就是说，稳定的轨迹，系统自然地被吸引朝向这个轨迹。[0034]这种hzd方法提供了很大的满意度，但是困难在于生成轨迹(而且，“平足”方法也是这种情况)。实际上，给定的轨迹与行走的“特性”相关联，诸如步子的长度、行走频率和胸部的倾斜度，而且在爬楼梯的情况下还有步子的高度、弯曲移动的瞬时旋转角度、重心的位置和在康复活动框架中胸部的侧向偏差相关联，并且必须是稳定的。如果行走的特性改变，则需要新的轨迹。[0035]目前，还没有使得可以实时生成轨迹的解决方案，有必要预先计算并测试它们，并且这样的原因如下：[0036]-当前的轨迹生成算法是基于用于在约束条件下针对非线性非凸问题进行优化的方法。这种类型的算法没有任何收敛保证。因此，即使被限制在数学上紧凑的搜索空间的情况下，也不可能确认能够获得期望的行走特性的轨迹。[0037]-在约束条件下解决这样的非线性非凸问题是复杂的，并且需要大量的计算能力。在高端计算机上，每个物理内核的每个轨迹需要大约90秒的计算时间，尽管为了考虑实时操作，这个时间必须是约100μs。[0038]-目前，计算在远程服务器上执行，然后结果通过互联网传送，这迫使外骨骼的用户具有永久稳定的连接，这代表了日常生活中的使用的极大的不方便。[0039]因此，将期望的是具有一种用于生成最终可以实时实施的轨迹，并且对外骨骼的操作者没有丝毫风险的新的解决方案。技术实现要素：[0040]因此，根据第一方面，本发明涉及一种用于学习神经网络的参数以生成外骨骼的轨迹的方法，该方法包括由第一服务器的数据处理装置实施以下步骤：[0041](a)根据外骨骼的一组可能行走的周期性轨迹的第一学习数据库，学习适合于生成外骨骼的、各自用于由n元组行走参数定义的外骨骼的给定行走的周期性基本轨迹的第一神经网络的参数；[0042](b)根据外骨骼的一组可能行走的周期性基本轨迹和过渡的第二学习数据库，使用来自第一神经网络的参数，学习适用于生成外骨骼的周期性基本轨迹和从外骨骼的一个周期性基本轨迹到外骨骼的另一周期性基本轨迹的过渡的第二神经网络的参数。[0043]根据其他有利的和非限制性特性：[0044]步骤(a)包括通过使用优化算法为外骨骼的一组可能行走构建周期性轨迹的所述第一学习数据库。[0045]以均匀覆盖其中所述n元组步子参数具有值的空间的方式来选择外骨骼的所述一组可能行走。[0046]步骤(a)还包括验证代表第一神经网络的预测的准确度的标准，并且如果该标准未被验证，则重复步骤(a)。[0047]步骤(b)包括构建所述第二数据库，用于使用第一学习数据库学习外骨骼的一组可能行走的周期性轨迹和过渡。[0048]所述第二数据库包括从第一学习数据库的外骨骼的周期性基本轨迹到第一学习数据库的外骨骼的另一周期性基本轨迹的所有过渡。[0049]从外骨骼的周期性基本轨迹(称为初始周期性基本轨迹)到外骨骼的另一周期性基本轨迹(称为最终周期性基本轨迹)的每个过渡被定义为周期性基本轨迹序列，该序列连续地包括初始周期性基本轨迹、至少一个中间周期性基本轨迹和最终周期性基本轨迹，第二数据库的构建包括，对于第一学习数据库的每对初始和最终周期性轨迹，确定至少一个中间周期性基本轨迹。[0050]初始周期性基本轨迹和最终周期性轨迹之间的每个中间周期性基本轨迹是所述初始和最终周期性基本轨迹的线性混合。[0051]为一对初始周期性基本轨迹和最终周期性轨迹确定至少一个中间周期性基本轨迹使用在周期性基本轨迹的图中从初始周期性基本轨迹到最终周期性轨迹的所谓最短路径算法，使得从一个周期性基本轨迹转变到另一周期性基本轨迹的成本代表外骨骼的动态的不一致性。[0052]步骤(b)还包括验证代表第二神经网络的预测的准确度的标准，并且如果该标准未被验证，则重复步骤(b)。[0053]根据第二方面，本发明涉及一种用于生成外骨骼的轨迹的方法，包括以下步骤：[0054](c)在第二服务器的存储器中存储使用根据第一方面的用于学习神经网络的参数以生成外骨骼的轨迹的方法学习的第二神经网络的参数；[0055](d)通过使用所述第二神经网络，由第二服务器的数据处理装置生成外骨骼的轨迹。[0056]根据其他有利的和非限制性特性：[0057]所述外骨骼接纳人类操作者，步骤(d)包括确定所述操作者期望的外骨骼的n元组行走参数的序列，并且根据所述n元组的序列生成外骨骼的轨迹。[0058]对于所述序列的每个n元组，外骨骼的所生成的轨迹包括新的周期性基本轨迹和到这个新的周期性基本轨迹的过渡。[0059]根据第三方面，本发明涉及一种用于将外骨骼设置处于运动中的方法，该外骨骼具有多个自由度，其中的至少一个自由度由数据处理装置控制的致动器致动，该方法包括步骤(e)：由外骨骼的数据处理装置以使所述外骨骼行走的方式来执行通过根据第二方面的用于生成外骨骼的轨迹的方法生成的外骨骼的轨迹。[0060]根据第四方面，本发明涉及一种系统，该系统包括各自包括数据处理装置的第一服务器、第二服务器和外骨骼，其中所述数据处理装置被配置成实施根据第一方面的用于学习神经网络的参数以生成外骨骼的轨迹的方法、根据第二方面的用于生成外骨骼的轨迹的方法、和/或根据第三方面的用于将外骨骼设置处于运动中的方法。[0061]根据第五和第六方面，本发明涉及一种包括代码指令的计算机程序产品，这些代码指令用于执行根据第一方面的用于学习神经网络的参数以生成外骨骼的轨迹的方法、根据第二方面的用于生成外骨骼的轨迹的方法和/或根据第三方面的用于将外骨骼设置处于运动中的方法；以及一种可以由一件it装备读取的存储装置，在其上计算机程序产品包括代码指令，这些代码指令用于执行根据第一方面的用于学习神经网络的参数以生成外骨骼的轨迹的方法、根据第二方面的用于生成外骨骼的轨迹的方法和/或根据第三方面的用于将外骨骼设置处于运动中的方法。附图说明[0062]当阅读优选实施例的以下描述时，本发明的其他特征和优点将会显现。将参考附图进行描述，其中：[0063]图1是用于实施根据本发明的方法的架构的图；[0064]图2是由根据本发明的方法使用的外骨骼的图；[0065]图3是在根据本发明的方法中使用的神经网络的图；[0066]图4是示出根据本发明的方法的优选实施例的图。具体实施方式[0067]架构[0068]根据本发明的三个互补方面，提出了以下内容：[0069]-用于学习神经网络的，特别是fnn(feedforwardneuralnetwork，前馈神经网络)类型的参数以用于生成外骨骼1的轨迹的方法；[0070]-用于生成外骨骼1的轨迹的方法(使用神经网络，由于前述方法而有利地学习的)；以及[0071]-用于将外骨骼1设置处于运动中的方法(应用由于根据第二方面的方法而生成的轨迹)。[0072]由于第一和/或第二服务器10a、10b，这三种类型的方法在如图1所示的架构内实施。第一服务器10a是学习服务器(实施第一方法)，第二服务器10b是用于生成轨迹的服务器(实施第二方法)。完全有可能的是这两个服务器是混杂的，但是实际上第一服务器10a是远程服务器，而第二服务器10b可以由外骨骼1嵌入用于实时操作。[0073]这些服务器10a、10b中的每一个通常是连接到广域网20(诸如因特网)用于交换数据的一件it装备，尽管实际上一旦神经网络被学习并嵌入到第二服务器10b上，通信就可能被中断，至少是间歇地中断。每一个包括处理器类型的数据处理装置11a、11b(特别地，第一服务器的数据处理装置11a具有高计算能力，因为与学习的神经网络的简单使用相比，学习是漫长且复杂的)，并且在适用的情况下包括数据存储装置12a、12b，诸如计算机存储器，例如硬盘驱动器。稍后描述可以由第一服务器10b的存储器12a存储的学习数据库。[0074]根据结合了根据本发明的三种类型的方法的优选实施例，该系统包括经由网络20连接到嵌入所述第二件装备10b的外骨骼1的第一服务器10a：[0075]-第一服务器10a使用其计算能力，在适用的情况下构成两个学习数据库，然后使用这些学习数据库实施用于学习第二神经网络的参数的方法，并且它将从第二神经网络学习的参数传输到第二服务器1b；[0076]-第二服务器10b实施用于由于使用从第一服务器10a检索的参数的神经网络来生成外骨骼1的轨迹的方法；[0077]-外骨骼1直接应用原位生成的所述轨迹以便设置处于运动中。[0078]应当理解的是，可以有各自嵌入它们的第二服务器10b(其可以具有有限的功率和空间，因为它只为其专用的外骨骼1生成轨迹)的多个外骨骼1，或者有各自连接到更大功率并且可选地与第一服务器10a混杂(并且具有为所有外骨骼1动态生成轨迹的能力)的第二服务器10b的多个外骨骼1。[0079]参考图2，术语外骨骼1是指双足机器人设备类型的铰接机械系统，其被致动和控制、设置有两条腿、更准确地说接纳具有各自附接到外骨骼1的腿上(特别是由于带)的其下肢的人类操作者。因此，它或多或少可以是人形机器人。在此“行走”在广义上是指设置进入机器人设备1的运动，这实际上导致在站立位置(在平坦地上、斜坡上、楼梯上等)腿上的交替支撑，以便产生位移而且产生从坐立位置到站立位置的移动(移动称为“站起来”)或者相反。[0080]外骨骼1具有多个自由度，也就是说，可变形的关节(通常通过旋转)，即，相对于彼此是可移动的，其中的每一个是“被致动的”或“未被致动的”。[0081]被致动的自由度表示设置有由数据处理装置11c控制的致动器的关节，也就是说，这个自由度是受控的，并且它可以被作用。相反，未被致动的自由度表示没有致动器的关节，也就是说，这个自由度遵循其自身动态，并且数据处理装置11c对其没有任何直接控制(而是通过其他被致动的自由度的先验的间接控制)。在图1的示例中，脚跟-地面接触是点状的，并且因此外骨骼1相对于该接触点自由旋转。因此，脚跟-臀部轴线和竖直线之间的角度构成了不被致动的自由度。[0082]本发明的外骨骼自然地包括至少一个被致动的自由度，优选地多个，并且还优选地包括未被致动的至少一个自由度，也就是说，如上所述，其被称为“欠致动”。未被致动的自由度的数量称为欠致动度。[0083]数据处理装置11c表示如果其是嵌入的(图2中示出的情况)则在适用的情况下与第二服务器10b的数据处理装置11b混杂并且适用于处理指令和生成用于各种致动器的命令的一件it装备(通常是处理器，如果外骨骼1是“遥控的”，则是外部的，但是优选地是嵌入在外骨骼1中)。后者可以是电动的、液压的等等。[0084]外骨骼1还可以包括存储器12(特别是第二服务器10b的存储器，也就是说，如果服务器10b没有被嵌入，装置12可以在外部)以及各种传感器，诸如用于检测脚在地面上的冲击的装置13、惯性测量装置14、操作者的传感器背心15等。[0085]本技术不应限于任何外骨骼1架构，并且示例应如申请wo2015140352和wo2015140353中所述那样得到。[0086]因此，优选地并且根据这些应用，外骨骼1在每条腿上包括脚结构，该脚结构包括当脚平坦时穿戴外骨骼的人的腿的脚可以承载抵靠在其上的支撑平面。[0087]这个支撑平面包括前平台和后平台，使得脚枢轴连接件通过构成未被致动的自由度将前平台连接到后平台。这种架构特别地适用于“hzd”型的轨迹。[0088]然而，本领域技术人员将知道如何将本方法适于任何其他机械架构。[0089]本发明的原理[0090]最近几年，人工智能技术在实时控制领域引起了浓厚的兴趣。[0091]不幸的是，用于生成轨迹的当前过程很难与通过强化进行学习的方法兼容，因为没有误差反向传播所需的解析梯度。然后需要求助于更复杂的方法并且这需要更多的实验数据，获得这些数据是昂贵的，诸如q学习和策略梯度。此外，这些方法使得不可以在实际的外骨骼1上进行学习。因此，必须进行模拟。[0092]因此，尽管机器人学中的某些工作利用神经网络来实行规划任务，但其使用仅限于非线性回归，最常见的目的是压缩轨迹的数据库，并且因此容易将其嵌入到真实设备中。这种方法将神经网络归入研究框架中的“黑盒”工具的状态，专注于源于传统机器人领域而非机器学习的问题、为研究提供了很少的视角。而且，这些工作降低了性能，因为轨迹是难以建模的数据，后者在输入参数方面具有许多不规则性和混沌性质。[0093]本方法通过实际上连续学习两个神经网络(指定为第一和第二神经网络)巧妙地解决了这些困难。第二神经网络是“输出”网络，其有效地使得可以生成外骨骼的轨迹。[0094]如所解释的那样，外骨骼的“轨迹”是指表示为时间或相位变量的函数的每个自由度(特别是被致动的)中的变化。[0095]思想是将“复杂”轨迹定义为通过过渡相交的一序列周期性轨迹(被称为“基本”轨迹)。术语“周期性轨迹”是指在步子的持续时间内以这样的方式应用的任何轨迹(在重复应用的情况下)，即在步子的开始时(脚接触的时刻)从外骨骼1的初始状态开始，在下一步子的开始时返回相同的状态(如所解释的那样，这涵括任何平坦行走，但是也涵括在斜坡上、上楼梯或下楼梯等)。还可以说周期性轨迹形成“极限环”。因此，所述周期性轨迹可以以稳定的方式应用于任意数量的步子。[0096]换句话说，每个基本轨迹与外骨骼1的给定行走相关联(行走由n元组行走参数定义)，并且使得可以以稳定和可行的方式保持这种行走(也就是说，如将看到的那样，考虑到优化问题的所有约束并且尽可能最小化成本函数)。如所解释的那样，所述行走参数对应于行走方式的“特性”，诸如步子的长度、行走频率和胸部的倾斜度，以及在爬楼梯的情况下还有步子的高度、弯曲运动的瞬时旋转角度；以及对应于操作者的形态特性(称为患者参数的行走参数的子组)，诸如他们的大小、体重、大腿或胫骨的长度、重心的位置(朝向前部的偏移的值)以及在康复活动框架中胸部的侧向偏差。[0097]上文提及的行走的所述“约束”可以变化，并且取决于所期望的行走的类型，例如“平足”行走或“hzd”。本方法将不限于任何类型的期望行走。[0098]过渡对应于行走的变化，即所述行走参数的值的变化(例如步子的长度的增加)：已知初始组行走参数和最终组行走参数，以及因此初始周期性轨迹(与初始组行走参数相关联)和最终周期性轨迹(与最终组行走参数相关联)，所述过渡是使得可以从初始周期性轨迹经过到最终轨迹的轨迹段。注意，可能存在“初始”或“最终”过渡，例如站立或坐下移动，但应关注周期性轨迹之间的“中间”过渡，因为初始或最终过渡可以预先计算。[0099]如将看到的那样，这种过渡被巧妙地视为周期性轨迹的空间中的路径，即，可以在初始周期性轨迹和最终周期性轨迹之间规划一个或多个中间轨迹，特别地对应于这两个轨迹之间的“混合”，即，在这些初始和最终轨迹之间具有中间行走参数。实际上，连续组的可能的中间周期性基本轨迹可以预先获得(通过从初始和最终轨迹中的一个到另一线性地改变行走参数获得的所有轨迹)，并且过渡轨迹的确定包括选择适当系列的中间轨迹(有利地通过称为“渐进”的函数来参数化，如将在下文中看到的那样)。这些中间轨迹的数量可以被设定，并且它们有利地均匀分布，也就是说，所有可能的中间轨迹形成连续且线性系列。[0100]换句话说，不是立即从初始轨迹经过到最终轨迹，而是在连续循环中以小增量前进。如果过渡足够慢，那么轨迹的渐进变化的影响可以被忽略。换句话说，系统的状态在每个步子处实际上属于极限循环。[0101]第一神经网络能够预测行走，即，为外骨骼1的给定行走生成外骨骼1的周期性基本轨迹。换句话说，第一神经网络将n元组行走参数取为输入，并生成相对应的周期性轨迹取为输出。优点是这种方法限制了维度的数量，并且因此保持在当前系统的范围内。[0102]第二神经网络能够生成与由第一神经网络所获得的那些周期性行走相同的周期性行走，而且能够预测周期性行走循环之间物理上可允许的过渡，即生成周期性基本轨迹和过渡，即最终生成任何轨迹。因此，它概括了第一神经网络并作为替代物出现。[0103]第一和第二网络中的每一个优选地是fnn(前馈神经网络)类型的网络，也就是说，其中信息仅在一个方向上流动，从输入节点向前、通过隐藏层(在适用的情况下)并且到达输出节点，而没有递归连接，因为这样的网络具有极好的可扩展性。特别地，可以采用具有2或3个隐藏层并且每层具有200至300个神经元的fnn。替代性地，可以使用其他类型的神经网络，诸如卷积神经网络(convolutionalneuralnetwork，cnn)、长短期记忆(longshort-termmemory，lstm)或门控递归单元(gatedrecurrentunit，gru)类型的递归网络等。[0104]注意，期望的是第一和/或第二神经网络具有关于行走参数的连续可导性质，并且为此，例如使用sigmoid类型的激活函数的网络是优选的，其是连续可导的(特别是与relu相反)。[0105]根据图3中示出的特别优选的实施例，第一和第二网络中的每一个有利地是具有称为去卷积(或转置卷积)的最终块的fnn，该最终块替代性地使用卷积层和上采样层。更准确地说，这种架构形成了一种称为自动编码器(或“编码器-解码器”)的结构，其中主fnn块通过生成称为初始编码序列的小尺寸的特征图来起到编码器的作用，而去卷积块通过重构定义从初始编码序列预测的轨迹的输出序列来起到解码器的作用。这种架构使得可以具有要学习的很少的参数，因为其结构自然地预测彼此相关的时间序列，因此没有必要像常规fnn那样学习这种零行为。[0106]学习的方法[0107]根据第一方面，提出了由第一服务器1a的数据处理装置11a实施的用于学习的方法。[0108]如所解释的并且如图4所示，该方法开始于步骤(a)：根据外骨骼1的一组可能行走的周期性轨迹的第一学习数据库，学习能够生成外骨骼1的、用于由n元组行走参数定义的外骨骼1的给定行走的周期性基本轨迹的第一神经网络的参数。[0109]优选地，这个步骤(a)包括构建所述第一学习数据库，即生成构成该数据库的所述周期性轨迹。[0110]构思是覆盖外骨骼1的该组可能行走，即，对于大量n元组的行走参数，如果可能的话，具有良好分布的相关联的轨迹。[0111]如所解释的那样，优化工具为此是已知的，特别地能够通过在由各种行走参数构成的一组可允许的研究的紧凑空间上进行优化来生成轨迹的第一数据库。例如，在hzd轨迹的情况下，生成轨迹的问题以最优控制问题的形式被公式化，该最优控制问题可以优选地通过所谓的直接配置算法(参见文献“omarharib等人,feedbackcontrolofanexoskeletonforparaplegicstowardrobustlystablehands-freedynamicwalking”)来解决。[0112]有利的是，样本是根据有限集上的统一和离散法则随机生成的，该有限集每个参数具有相同数量的可能值，以便即使对于较小数量的样本也能保证整个空间的均匀覆盖，并且准确地包括其边界。从数学上讲，这意味着对于任何给定的n元组参数，存在“接近的”样本。[0113]注意，构造第一学习基础的这个步骤很长，但可以在很远的上游完成，并且第一基础可以一点一点地完成。也可以以预构建基础开始。[0114]关于第一网络本身的学习，可以以传常规方式进行，特别是通过监督学习，并且最后验证代表神经网络的预测的准确性的标准，以便校验学习是否可行。[0115]更严格地说，预测误差必须有利地平均地显著小于步子期间实际外骨骼上的参考监测的最大误差，也就是说，小于给定部分(特别是4％)的预测具有大于阈值(诸如0.01rad)的预测的最大误差(在无限标准中，即所有关节和所有瞬间作为整体)。[0116]如果不是这种情况，轨迹生成算法本身以以下方式可以被修改：鼓励它产生类似于参考的、在当前情况下对应于神经网络的预测的轨迹。[0117]然后，优选地通过遵循这个方法生成新的第一数据库，并且在步骤(a)的新出现中，在这个新的基础上重新训练第一神经网络而不重新初始化它，而是相对于其先前状态递增地重新训练(即，我们从步骤(a)的第一次出现结束时获得的权重开始)。如果预测的准确性标准仍未得到验证，则重复该过程。[0118]在步骤(a)结束时，能够预测周期性轨迹的第一神经网络是可用的。这些周期性轨迹被保证是可行的和稳定的，也就是说，其满足来自轨迹优化算法的优化问题的所有约束并且尽可能多地最小化原始问题的成本函数。正如所解释的那样，不可能将所提出的方法扩展到过渡的生成，因为要探索的维度的数量变得太大。[0119]应当理解的是，对于给定的任务(即，满足约束的任务)，存在较大数量(甚至无限)的可行轨迹。优化过程的作用是计算从后者中选择的使成本(实际上是能量)最小化的一个。然而，所有这些解决方案难以通过神经网络来建模，这就是为什么其试图将优化问题仅仅限制在可以被完美建模的轨迹上。具体而言，这是数据库的所有轨迹之间的一致性问题：后者必须彼此一致，以便能够被建模为一组，并且因此保证准确且可靠的预测(即，对于训练样本以及对于测试样本，在外骨骼1上是可行/稳定的)。这就是迭代方法发挥作用的地方，因为直接解决这个问题是不可能的，因为它太复杂了。[0120]因此，如所解释的那样，该方法然后包括步骤(b)：根据外骨骼1的一组可能行走的周期性基本轨迹和过渡的第二学习数据库，使用来自第一神经网络的参数，学习适用于生成外骨骼1的周期性基本轨迹和从外骨骼1的一个周期性基本轨迹到外骨骼1的另一周期性基本轨迹的过渡的第二神经网络的参数。[0121]优选地，如所解释的那样，第二神经网络和第一神经网络具有相同的架构(例如，图3的架构)，但是第二神经网络包括更大数量的参数(例如，通过对于fnn具有更多的逐层参数，或者对于卷积网络具有更多的通道)，同时附加参数能够在步骤(b)期间被学习。通过从步骤(a)中获得的值开始，公共参数也可以可选地在步骤(b)中被重新学习。替代性地，第二神经网络可以对应于相对于第一网络具有附加层的第一神经网络，其参数将在步骤(b)期间学习。122.以同样的方式应理解的是，对于步骤(a)，步骤(b)可以包括构建所述第二学习数据库，即生成构成它的所述周期性轨迹和过渡，并且这有利地来自第一数据库。更准确地说，将从第一学习数据库的所谓初始周期性轨迹到第一学习数据库的另一所谓最终周期性轨迹构建所有的过渡。同样，第二学习基础可以在很远的上游构造、一点一点地完成、和/或预先构建。[0123]如所解释的那样，过渡可以以这种方式被视为从初始轨迹到最终轨迹的周期性轨迹的空间中的路径，即，对于第一基础的每对初始和最终周期性基本轨迹(即，每对n元组行走参数，一个指定初始轨迹并且另一个指定最终轨迹)，所述第二基础可以包含从一个到另一个的过渡。有利的是，所有可能的过渡被认为是等概率的，而不管过渡的幅值如何。[0124]实际上，可以提出仅基于周期性行走预测的启发式方法。方法如下：[0125]1.通过线性改变行走参数，生成范围从初始周期性轨迹到最终轨迹的周期性轨迹(其是尽可能多的中间轨迹)的网格。这些中间轨迹对应于两个初始和最终轨迹之间的线性混合。如所解释的那样，可以设置中间轨迹的数量，并且它们有利地均匀分布。[0126]2.过渡对应于穿过这个栅格从左上角(即初始时间的初始周期性轨迹)到右下角(最终时间的最终周期性轨迹)的任何路径。然后，可以使用所谓的约束下最短路径算法来计算在无限可能性选择中被认为是最佳的过渡。通过将网格视为无向图，即图的顶点是周期性基本轨迹(初始、最终或中间)，与从一个顶点到另一顶点的每个过渡(边的行进，即轨迹的变化)相关联的成本对应于由于从一个周期性行走到另一周期性行走的过渡而导致的动态的“不一致性”，目标是最小化整个轨迹上的过渡的“不一致性”。更确切地说，期望的是在过渡的持续时间期间避免会具有过高冲击从而有产生失衡的风险的轨迹的变化。这种不一致性在数学上对应于违反了沿过渡轨迹的动态方程：例如，可以使用从过渡轨迹计算的数值导数和根据动态方程的预期项之间的剩余误差。实际上，如所解释的那样，网格中的行进可以通过被称为“渐进”的函数来参数化，该函数定义了初始和最终周期性轨迹之间的渐进过渡，该渐进过渡可以例如通过多项式来参数化，该多项式的系数被优化以最小化不一致性，并且由于所述最短路径算法而考虑了边缘条件。[0127]关于第二网络本身的学习，可以传统地通过最小化成本函数来进行，并且在最后再次检查代表神经网络的预测的准确性的所述标准，以便校验学习是否可行。[0128]在步骤(b)结束时，能够预测复杂轨迹(包括过渡)的第一神经网络是可用的。然后，在步骤(c)中，第二神经网络(更具体地，它的所学习的参数)可以嵌入在第二服务器10b上(优选地在外骨骼1上)。[0129]用于生成轨迹的方法[0130]根据第二方面，提出了用于生成外骨骼1的轨迹的轨迹的方法，该方法由第二服务器1b的数据处理装置11b实施。用于生成外骨骼1的轨迹的轨迹的所述方法跟随着的是实施根据第一方面的用于第二神经网络的学习的方法。更准确地说，它开始于所述步骤(c)：在第二服务器10b的存储器12上存储第二神经网络的通过用于学习神经网络的参数以生成外骨骼1的轨迹的方法学习的参数。[0131]如所解释的那样，第二神经网络可以预先很好地生成、嵌入在大量外骨骼1上等。优选地，它是实时实施的。[0132]所述第二方法可以在外骨骼1的操作持续时间内定期地实施，并且特别地包括可选地以这样的方式重复调用第二神经网络，即在用于通过使用所述第二神经网络由第二服务器10b的数据处理装置11b生成外骨骼1的轨迹的步骤(d)中获得周期性轨迹和/或过渡。[0133]更准确地说，假设渐进地获得的n元组行走参数的序列(例如由于来自外骨骼的操作者的新命令)。对于每个新的n元组参数，第二神经网络确定新的周期性轨迹和朝向这个新的周期性轨迹的过渡。[0134]为此，用于生成轨迹的方法有利地包括确定(在适用的情况下定期地重复)外骨骼1的n元组行走参数。[0135]实际上，如果外骨骼1是接纳人类操作者的外骨骼，则是所述人类操作者的姿势(以及可选的按钮的按压)确定了所述参数(与普通机器人的情况相反，普通机器人可以直接接纳包括行走速度和/或方向的设定点的启动请求)。[0136]为此，如所解释的那样，可以为操作者提供传感器背心15，该传感器背心使得可以检测他们的胸部的构型(后者的取向)。操作者使其胸部定向的方向是他们希望行走的方向，并且速度由他们向前放置其胸部的强度(操作者倾斜的程度)给出。启动请求可以对应于操作者按下按钮(或特定姿势)，从而发信号通知他们开始行走的意图并因此命令数据处理装置确定所述参数。在爬楼梯的情况下，一些参数(诸如瞬时旋转角度或步子的高度)可以通过其他传感器13、14预先确定或获得。[0137]根据第三方面，提出了一种用于将外骨骼1设置处于运动中的方法，包括实施根据第二方面的用于生成外骨骼的轨迹的所述方法(步骤(a)、(b)、(c)、(d))、然后(在标记为(e)的步骤中)以外骨骼1行走的方式执行所述轨迹。[0138]可以以总是实时校正外骨骼1的轨迹的方式来重复步骤(d)和(e)。[0139]装备和系统[0140]根据第四方面，本发明涉及用于实施根据第一和第二和/或第三方面的方法的系统。[0141]如所解释的那样，这个系统包括可能混杂的第一服务器10a、第二服务器10b和外骨骼1。[0142]第一服务器10a包括用于实施根据第一方面的方法的数据处理装置11a。[0143]第二服务器10b包括用于实施根据第二方面的方法的数据处理装置11b，并且通常包括用于存储第二神经网络(或者更确切地说是其学习参数)的数据存储装置12。[0144]外骨骼1包括被配置用于实施根据第三方面的方法的数据处理装置11c，以及必要时包括数据存储装置12(特别是第二服务器10b的那些数据存储装置)、惯性测量装置14(惯性测量单元)、用于检测脚在地面上的冲击的装置13(接触传感器或可选的压力传感器)和/或传感器背心15。[0145]它具有多个自由度，其中至少一个自由度由在实施根据第三方面的方法的框架中由数据处理装置11c控制的致动器来致动。[0146]计算机程序产品[0147]根据第五和第六方面，本发明涉及一种包括代码指令的计算机程序产品，该代码指令用于执行(在处理装置11a、11b、11c上)根据第一方面的学习神经网络参数的方法、根据第二方面的用于生成外骨骼1的轨迹的方法和/或根据第三方面的用于将外骨骼1设置处于运动中的方法；以及可以由这个计算机程序产品所在的一件it装备读取的存储装置。当前第1页12当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种适用于电子信息技术的标签检测装置

用于学习神经网络的参数、用于生成外骨骼的轨迹以及用于将外骨骼设置处于运动中的方法与流程

相关文献

最热文献