一种基于机载设备的特定说话人启动人脸识别方法与流程

2021-06-25 11:15:00 来源：中国专利 TAG：飞行器特定识别说话启动

1.本发明涉及飞行器领域，具体为一种基于机载设备的特定说话人启动人脸识别方法。

背景技术：

2.飞行器等对于身份的识别认证尤为重要，通过特定人的语音和说话人内容的识别加人脸识别双重确认身份的方式极大提高了飞行员的身份确认，具有很大的应用价值；其价值体现在三个方面：（1）作为飞行器中身份确认设备，采用双重认证的方式极大提高了设备的准确性；（2）采用身份认证通过方可启动引擎的方式，可以防止被他人恶意使用；（3）语音识别不仅仅局限于语音身份认证，还包括语音控制飞行器各种飞行动作与其他控制指令；目前基于机载设备的语音启动人脸识别方法，主要有以下几个局限：（1）飞行环境下的噪声特别大，在70分贝左右，容易导致语音内容识别精确度不高，不利于指令的识别；（2）采用语音特定人和语音内容识别模型并启动人脸识别模型大大增加了识别时间，不利于快速识别与身份确认；因此，有必要提出一种能够快速又准确地识别出特定飞行员身份的方法。

技术实现要素：

3.本发明的目的在于提供一种基于机载设备的特定说话人启动人脸识别方法，为实现上述目的，本发明提供如下技术方案：一种基于机载设备的特定说话人启动人脸识别方法，包含有以下步骤，步骤s1，采集特定飞行员语音数据与其他说话人的孤立词条语音数据；步骤s2，采用端点检测、预加重、分帧加窗语音数据前端处理；步骤s3，提取12维mfcc特征向量；步骤s4，设计并训练特定飞行员语音模型和语音内容识别模型；步骤s5，将测试语音数据的mfcc特征信息送入到特定飞行员语音识别模型与语音内容识别模型进行计算打分；以及，步骤s6，识别出特定人与语音内容后启动人脸识别设备。
4.作为一种基于机载设备的特定说话人启动人脸识别方法的优选方案，所述步骤s1中采集数据集操作方法，包含有，步骤s11，室内环境下采集n名待实验飞行员语音数据，语音内容至少有：启动身份认证，确认及飞行控制相关指令，n为大于1的整数；步骤s12，室内环境下采集其他说话人的语音数据，语音内容与步骤s11相同；步骤s13，在空中飞行环境中采集带有噪音的语音数据集，语音内容与步骤s11相同。
5.作为一种基于机载设备的特定说话人启动人脸识别方法的优选方案，所述采集数据集必须包括模拟飞行环境和室内环境下的语音数据，且占比不低于0.2。
6.作为一种基于机载设备的特定说话人启动人脸识别方法的优选方案，所述步骤s3中mfcc特征提取的方法，包含有，
步骤s31，经端点检测、预加重、分帧和加窗操作后，使用基为2的fft算法对每一帧语音进行快速傅里叶变换；步骤s32，计算实部和虚部得到平方和后，然后采用可消除谐波作用的三角窗滤波器得到输出能量；步骤s33，人耳感受到的音调与声音的频率成对数关系，计算各个滤波器组输出的对数能量；步骤s34，经离散余弦变换（dct）得到12维的mfcc特征信息，并在语音特征中加入其一阶差分倒谱和二阶差分倒谱。
7.作为一种基于机载设备的特定说话人启动人脸识别方法的优选方案，所述步骤s4中设计特定飞行员语音模型和语音内容模型的方法，包含有，步骤s41，利用其他说话人和飞行员的语音数据集训练可用于语音内容识别的隐马尔科夫模型；步骤s42，利用特定飞行员的语音数据集设计并训练n个待测特定飞行员的gmm-ubm语音模型，其中步骤s41训练的语音内容识别模型充当gmm-ubm中的ubm；步骤s43，利用特征语音自适应技术，并结合步骤s41、s42可实现特定飞行员身份与语音内容的同时识别。
8.作为一种基于机载设备的特定说话人启动人脸识别方法的优选方案，所述步骤s5中识别出特定人与语音内容后启动人脸识别设备的方法，包含有，步骤s51，识别出特定人信息和语音内容是启动身份认证后，自动打开摄像头开始人脸识别，进行2次身份认证；步骤s52，拍摄待测飞行员的头像，并提取头像特征；步骤s53，启动已训练好的人脸识别模型进行人脸比对，确认是否为该飞行员；步骤s54，是，则可以发动引擎；否，则无法启动飞行器引擎。
9.与现有方法相比，本发明的有益效果是：可通过验证说话人语音和内容启动人脸识别共两个步骤验证飞行员信息，极大提高了待验证飞行员身份的准确率。本发明采用的特定说人识别是一种说话人身份与语音内容同时识别的机制，能够在一定程度上缩减识别时间。本发明提出的一种基于机载设备的特定说话人启动人脸识别方法，不仅仅只用于身份认证，还在语音内容识别模型中增加了20多条控制飞行器各种飞行动作及其他控制指令，极大减少了飞行员繁琐的控制操作。
附图说明
10.图1为本发明系统流程图。
11.图2为本发明语音数据预处理与特征提取流程图。
12.图3为本发明特定说话人与语音内容识别流程图。
具体实施方式
13.下面将结合本发明实施例中的附图，对本发明实施例中的方法方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通方法人员在没有做出创造性劳动前提下所获得的所有其他
实施例，都属于本发明保护的范围。
14.请参阅图1，本发明提供一种方法方案：一种基于机载设备的特定说话人启动人脸识别方法，包括以下步骤：a、采集特定飞行员语音数据与其他说话人（除特定飞行员以外的人，数量越多越好）的孤立词条语音数据；b、采用端点检测、预加重、分帧加窗等语音数据前端处理；c、提取12维mfcc特征向量；d、设计并训练n个特定飞行员语音模型和语音内容识别模型；e、将测试语音数据的mfcc特征信息送入到n个特定飞行员语音识别模型与语音内容识别模型进行计算打分；f、同时识别出特定人与语音内容后启动人脸识别设备。
15.本发明中，步骤a中采集数据集操作方法如下：a、室内环境下采集n名待实验飞行员语音数据，语音内容为：启动身份认证，确认及飞行控制相关指令等20条语音信息；b、室内环境下采集其他说话人的语音数据用于语音内容识别，语音内容与a相同；c、在空中飞行环境中采集带有噪音的语音数据集，语音内容与a相同。
16.本发明中采集的特定飞行员语音用于说话人识别，不同说话人的语音数据用于语音内容识别并尽可能的加入了模拟飞行环境下的语音数据集，使得模型更具鲁棒性。
17.请参阅图2，本发明中，步骤b与c中语音数据预处理与特征提取方法如下：a、采用统计模型与能量检测相结合的方法提升语音开始端和结束端的检测精度和效率，预加重的值固定为0.9375，帧长设置为30ms，帧移10ms，窗函数设置为为汉明窗；b、经端点检测、预加重、分帧和加窗操作后，使用基为2的fft算法对每一帧语音进行快速傅里叶变换；c、计算实部和虚部得到平方和后，然后采用可消除谐波作用的三角窗滤波器得到输出能量；d、人耳感受到的音调与声音的频率成对数关系，因此需计算各个滤波器组输出的对数能量；e、经离散余弦变换（dct）得到12维的mfcc特征信息，并在语音特征中加入其一阶差分倒谱和二阶差分倒谱。
18.请参阅图3，本发明中，步骤d中特定说话人与语音内容识别方法如下：a、首先利用其他说话人和飞行员的语音数据集训练可用于语音内容识别的隐马尔科夫模型；b、其次利用特定飞行员的语音数据集设计并训练n个待测特定飞行员的gmm-ubm语音模型，其中a训练的语音内容识别模型充当gmm-ubm中的ubm；c、利用特征语音自适应技术，并结合a、b步骤可实现特定飞行员身份与语音内容的同时识别。
19.本发明中特定说人识别是一种说话人身份与语音内容同时识别的机制，能够在一定程度上缩减识别时间。
20.综上所述，本发明采用的一种基于机载设备的特定说话人启动人脸识别方法极大
提高了待测试飞行员身份认证的准确度，并大大减少了飞行员繁琐的控制操作。
21.尽管已经示出和描述了本发明的实施例，对于本领域的普通方法人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

再多了解一些

1/3 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音频压缩方法、音频解压缩方法及装置与流程

一种基于机载设备的特定说话人启动人脸识别方法与流程

相关文章

最热文献