一种居家老人呼救设备的制作方法

2021-07-06 18:47:00 来源：中国专利 TAG：呼救中文居家语音识别老人

技术特征：

1.一种居家老人呼救设备，其特征在于：包括用于部署声纹识别模型、语音识别模型训练环境及训练的服务器端、用于声纹识别、语音识别和拨打电话的客户端，所述客户端包括微处理器、拾音设备、电话卡和扬声器，所述拾音设备与微处理器的音频输入接口连接，将捕捉到的语音输入微处理器，所述微处理器上部署维纳滤波器，对接收到的语音信号进行降噪处理；所述电话卡和扬声器与微处理器音频输出接口连接，用以执行电话功能；所述服务器端训练完成的声纹识别模型、语音识别模型和训练环境打包部署到客户端的微处理器，采集经降噪处理的目标用户语音信号，对客户端声纹识别模型进行参数微调，录入目标用户声纹，从而构成本地声纹识别模型、本地语音识别模型及运行环境；经降噪处理的语音信号输入本地声纹识别模型和语音识别模型，根据声纹识别结果进行目标用户的判断，当声纹识别结果为目标用户，则将语音信号输入本地语音识别模型，获取识别语音结果，根据语音识别结果，微处理器执行对应的执行指令；当声纹识别结果为非目标用户，则不进行语音识别，微处理器控制扬声器发出用户不匹配的指令。

2.根据权利要求1所述的一种居家老人呼救设备，其特征在于：所述客户端的微处理器为嵌入式龙芯2k1000处理器。

3.根据权利要求1所述的一种居家老人呼救设备，其特征在于：所述服务器端的声纹识别模型为基于gmm(高斯混合模型)的声纹识别模型，是通过以下步骤获取的：

步骤s1、语音提供者标注：将st-cmds数据中语音提供者的语音信号进行标注，对同一语音提供者的普通wav语音信号打上相同标签；

步骤s2、特征提取：将普通wav语音信号通过mfcc特征提取方法转换为卷积神经网络需要的二维频谱图像信号，即语音信号特征矩阵；

步骤s3、非目标用户声纹模型训练：将语音信号特征矩阵输入高斯混合模型gmm中，进行gmm模型的参数估计；

步骤s4、模型参数固定：基于最大似然估计算法，通过em算法进行迭代，得到gmm模型的最优参数，将不同语音提供者的语音特征分簇。

4.根据权利要求3所述的一种居家老人呼救设备，其特征在于：所述客户端的本地声纹识别模型为基于gmm-ubm的声纹识别模型，是通过以下步骤获取的：

步骤k1、客户端部署gmm模型：将在服务器端经过非目标用户训练的基于gmm的声纹识别模型和运行环境部署到客户端；

步骤k2、目标用户语音信号录入：启动基于gmm的声纹识别模型，通过客户端拾音设备录入目标用户语音信号，存储为模型训练数据；

步骤k3、声纹识别模型参数微调：通过背景模型ubm，使用目标用户训练数据，利用最大后验概率算法，经过自适应训练，得到本地声纹识别模型；

步骤k4、本地声纹模型识别保存：在客户端保存训练完成的本地声纹识别模型。

5.根据权利要求3所述的一种居家老人户呼救设备，其特征在于：所述服务器端的基于gmm的声纹训练模型由协方差矩阵、混合分量均值向量、混合权重共同组成。

6.根据权利要求1所述的一种居家老人呼救设备，其特征在于：所述服务器端的语音识别模型为基于卷积神经网络的语音识别模型，是通过以下步骤获取的：

步骤y1、特征提取：将st-cmds数据集中的普通wav语音信号通过mfcc特征提取方法转换为卷积神经网络需要的二维频谱图像信号，即语音信号特征矩阵；

步骤y2、基于卷积神经网络的语音识别模型的构建：使用卷积神经网络对mfcc处理后的语音信号特征矩阵进行提取，建立语音识别模型；

步骤y3、使用st-cmds数据集进行语音识别模型训练；随机将st-cmds数据集的80％划分为训练集，20％划分为测试集，重复五次，实验结果取五次实验平均值；

步骤y4、语音识别模型的保存：在服务器端保存训练完成的语音识别模型。

7.根据权利要求6所述的一种居家老人呼救设备，其特征在于：所述st-cmds数据集中包含10万余条语音文件，语音文件数据内容为日常语音聊天和智能语音控制语句，语音提供者为855个。

8.根据权利要求6所述的一种居家老人呼救设备，其特征在于：所述mfcc特征由静态mfcc系数、动态差分参数、帧能量共同构成。

9.根据权利要求6所述的一种居家老人呼救设备，其特征在于：所述步骤y2中的基于卷积神经网络的语音识别模型是由2层卷积层和5层全连接层组成，初始的输入尺寸为40*11*3，第二个卷积层的输入为第一个卷积层的输出，卷积核大小分别8*9*3、3*1*3，卷积核数分别为16、32,得到规格更小的语音信号特征矩阵；引入池化处理，简化卷积层的输出；经过全连接层，将最终语音信号特征与语料库匹配，得到语音的识别结果。

10.根据权利要求1所述的一种居家老人呼救设备，其特征在于：所述微处理器执行对应的执行指令，其执行指令中至少包括启动或关闭语音识别程序、拨打报警及急救电话功能，当语音识别模型识别的语音为启动语音识别程序的口令时，默认等待10s,之后若接收不到其它口令，则关闭语音识别程序；当语音识别模型识别的语音为报警口令时，则由微处理器通过电话卡和扬声器拨打报警电话，进行语音交流；当语音识别模型识别的语音为拨打急救电话口令时，则由微处理器通过电话卡和扬声器拨打急救电话，进行语音交流。

技术总结
本发明提供一种居家老人呼救设备，包括用于声纹、语音识别模型训练的服务器端、用于声纹、语音识别和拨打电话的客户端，客户端包括微处理器及与其连接的拾音设备、电话卡和扬声器，微处理器上部署维纳滤波器对语音信号进行降噪处理；服务器端训练完成的声纹、语音识别模型打包部署到客户端，采集目标用户语音信号，对客户端声纹识别模型进行参数微调，构成本地声纹、语音识别模型及运行环境；当语音信号输入本地声纹、语音识别模型，若声纹识别结果为目标用户，则进行语音识别，获取识别语音结果，微处理器执行对应的执行指令；否则不进行语音识别。本发明使用语音识别技术实现老人呼救，相比起传统的按键、打电话方法，更加便捷，人性化。

技术研发人员：韩振华;薛海涛
受保护的技术使用者：山西云芯新一代信息技术研究院有限公司
技术研发日：2021.04.01
技术公布日：2021.07.06

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种语音处理方法、装置和用于语音处理的装置与流程

一种居家老人呼救设备的制作方法

相关文章

最热文献