基于毫米波雷达的环境鲁棒的手语识别方法及系统

2022-09-01 10:11:41 来源：中国专利 TAG：

1.本发明属于无线感知领域，涉及无线信号处理、特征融合、特征提取，以及手语分类。

背景技术：

2.据资料统计，我国听力语言残疾居视力残疾，肢残，智残等五大残疾之首，超过2000万人。聋哑人在生活中会遇到各种各样的问题，其中一个问题是，他们不能与正常人方便的进行沟通。聋哑人之间可以通过手语来进行交流，但是大部分正常人是不会手语的，需要开发出手语翻译系统，来解决聋哑人与正常人之间的交流问题。
3.现有的大部分手语翻译系统，分为以下几类：基于计算机视觉，基于可穿戴设备，基于wi-fi设备等等。其中，基于计算机视觉的，会需要采集人的身体全部信息，在使用过程中，会侵犯人的隐私，造成隐私泄露问题，同时在光照条件不理想的情况下，识别效率会明显的降低。基于可穿戴设备的手语翻译系统，需要手语执行者佩戴一些特殊定制的手套，或者手表等设备，从而获取到手臂的移动信息，从而识别手语。但是，这种设备，需要手语执行者全程佩戴该设备，会造成用户的不适感，降低用户的体验。基于wi-fi设备的手语识别，当用户执行手语动作时，csi值会发生一定程度的变化。基于wi-fi设备的手语识别采用csi作为原始的特征，再在上面进行处理，从而对手语进行分类。然而，csi对环境的要求较高，当用户换了一个环境之后，比如，用户与wifi 设备的相对角度，相对距离，以及wifi设备部署在另外一个环境时，识别率会显著下降。
4.综上所述，现有方法存在以下问题：1.侵犯隐私，在光照条件不理想时，识别率降低；2.需要用户一直佩戴，降低用户舒适性；3.对环境不鲁棒，环境变化识别率会降低。

技术实现要素：

5.针对以上技术存在的不足，本发明的目的在于，提供一种基于毫米波雷达的环境鲁棒的手语翻译系统，来解决上述方法中存在的问题。
6.为了解决上述技术问题，本发明采用如下技术方案予以实现：
7.一种基于毫米波雷达的环境鲁棒的手语识别方法，该方法包括以下步骤：
8.步骤1：设计毫米波雷达信号方案
9.确定毫米波雷达型号、频段、使用带宽、斜率、采样率、帧数、帧间隔和 adc采样点数；
10.步骤2：毫米波雷达设备部署
11.确定毫米波雷达设备的部署高度，确定毫米波雷达设备与人之间的距离和角度以及确定毫米波雷达摆放的场景；
12.步骤3：毫米波雷达信号的采集
13.根据确定的毫米波雷达设备的部署高度，在毫米波雷达设备与人之间的不同距离、不同角度，以及毫米波雷达所处的不同场景进行数据收集；
14.步骤4：手语无线信号特征处理
15.选择采用原始无线信号经过两次傅里叶变换同时再经过去噪，去除静态物体信息的无线信号range，doppler特征作为分类网络的特征；
16.步骤5：手语单词分类
17.使用分类网络对手语的回波无线信号进行分类，所述的分类网络为无线信号的frame-range，frame-doppler特征以及手语符号即对应的标签经过训练得到深度神经网络学习模型；
18.所述的分类网络包括特征提取部分和分类部分，特征提取部分将range， doppler特征输入到两个特征提取器进行特征提取，将提取到的特征形成融合特征，最后在融合特征的基础上提取特征；分类部分将融合特征，输入到全连接层中，对特征进行分类，输出预测的概率结果。
19.进一步地，所述的步骤4手语无线信号特征处理，具体包括：
20.将原始无线信号经过两次傅里叶变换之后，得到一个frame-range-doppler的三维数据，然后经过去除静态物体，即去除掉doppler在0附近的信号，再分别沿着range维度和doppler维度进行压缩，得到frame-range、 frame-doppler两个特征图像。
21.进一步地，步骤5手语单词分类步骤中训练得到的深度神经网络模型，其中深度神经网络的输入样本为：
[0022][0023]
式中：
[0024]
d为输入到神经网络中数据样本的集合表示；
[0025]
i为输入到神经网络的第i个样本；
[0026]
f为经过两次fft以及静态物体消除的三维无线信号特征；
[0027]
|x(f)|i为无线信号特征沿着range维度压缩得到的frame-doppler特征图像；
[0028]
|r(f)|i为无线信号特征沿着doppler维度压缩得到的frame-range特征图像；
[0029]
yi为第i个样本的类别标签；
[0030]
n为输入到神经网络的样本总数。
[0031]
所述的深度神经网络模型采用resnet的网络框架作为其特征提取层，将两个特征分别输入到两个基于resnet的特征提取器中，用于提取信息，再将提取到的特征进行融合，不断进行特征提取以及特征分类。
[0032]
进一步地，基于resnet的特征融合的分类网络，其深度神经网络的激活函数为relu。
[0033]
所述的基于resnet的特征融合的分类网络，其深度神经网络的优化函数选择adamdelta。
[0034]
步骤4手语无线信号特征处理去除静态信号，只提取出手势的动态信息。
[0035]
本发明还公开了一种基于毫米波雷达的环境鲁棒的手语识别系统，包括数据采集板、处理器，还包括毫米波雷达板，所述的毫米波雷达板与数据采集板相连，数据采集板与处理器相连，毫米波雷达板与处理器相连；毫米波雷达板包括发送天线和接收天线；所述的处理器执行权利要求1-7任意一项所述的方法。
[0036]
本发明与现有技术相比，具有如下技术效果：
[0037]
(ⅰ)本发明的方法通过去除静态物体的影响，只提取手势动作的特征信号，同时，可以通过对特征图像的平移来消除距离的影响。从而，对环境距离鲁棒性好、抗干扰强。
[0038]
(ⅱ)本发明的方法相对于现有大部分采用frame-range-doppler作为输入特征相比，使用frame-range，frame-doppler作为输入特征，降低了输入的维度，极大的压缩了需要使用的数据大小，同时，输入到神经网络的数据量也减少，可以更快的进行计算，提升性能。
[0039]
(ⅲ)本发明的方法通过采用resnet的基本网络架构，对两个特征进行提取融合，相较于单个特征，能够有效的提升识别率。
[0040]
(ⅳ)本发明的方法所需要的神经网络模型小，占用的资源较小，模型的处理速度较快，系统延迟低。
附图说明
[0041]
图1为本发明的方法流程图
[0042]
图2为本发明无线手势信号处理与分类方法的流程示意图
[0043]
图3为无线手势分类网络结构示意图
[0044]
图4为本发明在不同环境下的识别性能图
[0045]
图5为本发明在不同距离下的识别性能图
[0046]
图6为本发明在不同角度下的识别性能图图7为本发明对照实验默认环境布置条件
[0047]
以下结合实施例对本发明的具体内容作进一步详细解释说明。
具体实施方式
[0048]
与本发明技术方案相关的相关名词解释：frame代表的是毫米波雷达的帧， doppler代表的是多普勒，range代表的是距离，pc指的是个人电脑，fmcw指的是调频连续波，fft指的是快速傅里叶变换，relu指的是线性整流单元。
[0049]
遵从上述技术方案，以下给出本发明的具体实施例，需要说明的是本发明并不局限于以下具体实施例，凡在本技术技术方案基础上做的等同变换均落入本发明的保护范围。
[0050]
实施例1：
[0051]
参见图1，本实施例给出一种基于毫米波雷达的环境鲁棒的手语识别分类方法，该方法包括以下步骤：
[0052]
步骤1：设计毫米波雷达信号方案
[0053]
确定毫米波雷达型号、频段、使用带宽、斜率、采样率、帧数、帧间隔和 adc采样点数；
[0054]
步骤2：毫米波雷达设备部署
[0055]
确定毫米波雷达设备的部署高度，确定毫米波雷达设备与人之间的距离和角度以及确定毫米波雷达摆放的场景；
[0056]
步骤3：毫米波雷达信号的采集
[0057]
根据确定的毫米波雷达设备的部署高度，在毫米波雷达设备与人之间的不同距
离、不同角度，以及毫米波雷达所处的不同场景进行数据收集；
[0058]
步骤4：手语无线信号特征处理
[0059]
选择采用原始无线信号经过两次傅里叶变换同时再经过去噪，去除静态物体信息的无线信号range，doppler特征作为分类网络的特征；
[0060]
步骤5：手语单词分类
[0061]
使用分类网络对手语的回波无线信号进行分类，所述的分类网络为无线信号的frame-range，frame-doppler特征以及手语符号即对应的标签经过训练得到深度神经网络学习模型；
[0062]
所述的分类网络包括特征提取部分和分类部分，特征提取部分将range， doppler特征输入到两个特征提取器进行特征提取，将提取到的特征形成融合特征，最后在融合特征的基础上提取特征；分类部分将融合特征，输入到全连接层中，对特征进行分类，输出预测的概率结果。
[0063]
参见图2，步骤4手语无线信号特征处理具体过程如下，将原始无线信号经过两次傅里叶变换之后，得到一个frame-range-doppler的三维数据，然后经过去除静态物体，即去除掉doppler在0附近的信号，再分别沿着range维度和 doppler维度进行压缩，得到frame-range、frame-doppler两个特征图像。
[0064]
参见图3，步骤5手语单词分类步骤中训练得到的深度神经网络模型，所述深度神经网络的输入样本为：
[0065][0066]
式中：
[0067]
d为输入到神经网络中数据样本的集合表示；
[0068]
i为输入到神经网络的第i个样本；
[0069]
f为经过两次fft以及静态物体消除的三维无线信号特征；
[0070]
|x(f)|i为无线信号特征沿着range维度压缩得到的frame-doppler特征图像；
[0071]
|r(f)|i为无线信号特征沿着doppler维度压缩得到的frame-range特征图像；
[0072]
作为本实施例的一种优选方案，深度神经网络采用resnet框架作为特征提取的基础框架，随着网络深度增加,会出现一种退化问题,也就是当网络变得越来越深的时候,训练的准确率会趋于平缓,但是训练误差会变大,这明显不是过拟合造成的,因为过拟合是指网络的训练误差会不断变小,但是测试误差会变大。为了解决这种退化现象,resnet被提出，resnet也即为残差网络。残差网络与普通网络不同的地方就是引入了跳跃连接,这可以使上一个残差块的信息没有阻碍的流入到下一个残差块,提高了信息流通,并且也避免了由与网络过深所引起的消失梯度问题和退化问题，残差网络是由多个浅的网络融合而成，浅的网络在训练时不会出现消失的梯度问题,所以它能够加速网络的收敛。
[0073]
作为本实施例的一种优选方案，基于resnet的深度神经网络的优化函数选择adamdelta。adadelta是对adagrad的扩展，最初方案依然是对学习率进行自适应约束，但是进行了计算上的简化。adagrad会累加之前所有的梯度平方，而adadelta只累加固定大小的项，并且也不直接存储这些项，仅仅是近似计算对应的平均值。adadelta在训练初中期，加速效果不错，较快。
[0074]
本实施例中，神经网络的选择，输入数据特征选择、激活函数选择、优化函数的选
择、相互协同增效使得识别率最优，分类效果最佳、使得神经网络拓扑最小化。
[0075]
使得分类效果最优，通过调整卷积核大小、卷积步长等参数，观察组数据的分类效果，选择分类效果最高的作为网络的超参数。
[0076]
参见图4-图6，为了进一步验证本发明的直接技术效果，申请人结合不同环境、不同距离、不同角度，进行试验对比效果。具体对照试验条件及对照方案如下：
[0077]
本实验默认条件为：毫米波雷达放置在实验受试者的正前方，距离受试者 1.4米，距离地面0.9米，具体如图7所示。
[0078]
1、验证不同环境下的性能
[0079]
本实验设置三个环境(受试者所处的环境)进行验证，分别为走廊、大厅、办公室，其他条件与默认条件保持一致。
[0080]
2、验证不同距离下的性能
[0081]
本实验设置三个不同距离(毫米波雷达距离受试者的距离)进行验证，距离分别为：1米，1.4米，1.8米，其他条件与默认条件保持一致。
[0082]
3、验证不同角度的性能
[0083]
本实验设置5个角度(毫米比雷达与受试者的水平方位角)进行验证，分别为：-40
°
，-20
°
，0
°
，20
°
，40
°
，其他条件与默认条件保持一致。
[0084]
与此同时，本发明还给出了一种基于毫米波雷达的环境鲁棒的手语识别系统，包括数据采集板、处理器，还包括毫米波雷达板，所述的毫米波雷达板与数据采集板相连，数据采集板与处理器相连，毫米波雷达板与处理器相连；毫米波雷达板包括发送天线和接收天线；所述的处理器执行本发明的基于毫米波雷达的环境鲁棒的手语识别方法。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种web端实现流程图的方法及系统与流程

基于毫米波雷达的环境鲁棒的手语识别方法及系统

相关文献

最热文献