一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种居家老人呼救设备的制作方法

2021-07-06 18:47:00 来源:中国专利 TAG:呼救 中文 居家 语音识别 老人

技术特征:

1.一种居家老人呼救设备,其特征在于:包括用于部署声纹识别模型、语音识别模型训练环境及训练的服务器端、用于声纹识别、语音识别和拨打电话的客户端,所述客户端包括微处理器、拾音设备、电话卡和扬声器,所述拾音设备与微处理器的音频输入接口连接,将捕捉到的语音输入微处理器,所述微处理器上部署维纳滤波器,对接收到的语音信号进行降噪处理;所述电话卡和扬声器与微处理器音频输出接口连接,用以执行电话功能;所述服务器端训练完成的声纹识别模型、语音识别模型和训练环境打包部署到客户端的微处理器,采集经降噪处理的目标用户语音信号,对客户端声纹识别模型进行参数微调,录入目标用户声纹,从而构成本地声纹识别模型、本地语音识别模型及运行环境;经降噪处理的语音信号输入本地声纹识别模型和语音识别模型,根据声纹识别结果进行目标用户的判断,当声纹识别结果为目标用户,则将语音信号输入本地语音识别模型,获取识别语音结果,根据语音识别结果,微处理器执行对应的执行指令;当声纹识别结果为非目标用户,则不进行语音识别,微处理器控制扬声器发出用户不匹配的指令。

2.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述客户端的微处理器为嵌入式龙芯2k1000处理器。

3.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述服务器端的声纹识别模型为基于gmm(高斯混合模型)的声纹识别模型,是通过以下步骤获取的:

步骤s1、语音提供者标注:将st-cmds数据中语音提供者的语音信号进行标注,对同一语音提供者的普通wav语音信号打上相同标签;

步骤s2、特征提取:将普通wav语音信号通过mfcc特征提取方法转换为卷积神经网络需要的二维频谱图像信号,即语音信号特征矩阵;

步骤s3、非目标用户声纹模型训练:将语音信号特征矩阵输入高斯混合模型gmm中,进行gmm模型的参数估计;

步骤s4、模型参数固定:基于最大似然估计算法,通过em算法进行迭代,得到gmm模型的最优参数,将不同语音提供者的语音特征分簇。

4.根据权利要求3所述的一种居家老人呼救设备,其特征在于:所述客户端的本地声纹识别模型为基于gmm-ubm的声纹识别模型,是通过以下步骤获取的:

步骤k1、客户端部署gmm模型:将在服务器端经过非目标用户训练的基于gmm的声纹识别模型和运行环境部署到客户端;

步骤k2、目标用户语音信号录入:启动基于gmm的声纹识别模型,通过客户端拾音设备录入目标用户语音信号,存储为模型训练数据;

步骤k3、声纹识别模型参数微调:通过背景模型ubm,使用目标用户训练数据,利用最大后验概率算法,经过自适应训练,得到本地声纹识别模型;

步骤k4、本地声纹模型识别保存:在客户端保存训练完成的本地声纹识别模型。

5.根据权利要求3所述的一种居家老人户呼救设备,其特征在于:所述服务器端的基于gmm的声纹训练模型由协方差矩阵、混合分量均值向量、混合权重共同组成。

6.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述服务器端的语音识别模型为基于卷积神经网络的语音识别模型,是通过以下步骤获取的:

步骤y1、特征提取:将st-cmds数据集中的普通wav语音信号通过mfcc特征提取方法转换为卷积神经网络需要的二维频谱图像信号,即语音信号特征矩阵;

步骤y2、基于卷积神经网络的语音识别模型的构建:使用卷积神经网络对mfcc处理后的语音信号特征矩阵进行提取,建立语音识别模型;

步骤y3、使用st-cmds数据集进行语音识别模型训练;随机将st-cmds数据集的80%划分为训练集,20%划分为测试集,重复五次,实验结果取五次实验平均值;

步骤y4、语音识别模型的保存:在服务器端保存训练完成的语音识别模型。

7.根据权利要求6所述的一种居家老人呼救设备,其特征在于:所述st-cmds数据集中包含10万余条语音文件,语音文件数据内容为日常语音聊天和智能语音控制语句,语音提供者为855个。

8.根据权利要求6所述的一种居家老人呼救设备,其特征在于:所述mfcc特征由静态mfcc系数、动态差分参数、帧能量共同构成。

9.根据权利要求6所述的一种居家老人呼救设备,其特征在于:所述步骤y2中的基于卷积神经网络的语音识别模型是由2层卷积层和5层全连接层组成,初始的输入尺寸为40*11*3,第二个卷积层的输入为第一个卷积层的输出,卷积核大小分别8*9*3、3*1*3,卷积核数分别为16、32,得到规格更小的语音信号特征矩阵;引入池化处理,简化卷积层的输出;经过全连接层,将最终语音信号特征与语料库匹配,得到语音的识别结果。

10.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述微处理器执行对应的执行指令,其执行指令中至少包括启动或关闭语音识别程序、拨打报警及急救电话功能,当语音识别模型识别的语音为启动语音识别程序的口令时,默认等待10s,之后若接收不到其它口令,则关闭语音识别程序;当语音识别模型识别的语音为报警口令时,则由微处理器通过电话卡和扬声器拨打报警电话,进行语音交流;当语音识别模型识别的语音为拨打急救电话口令时,则由微处理器通过电话卡和扬声器拨打急救电话,进行语音交流。


技术总结
本发明提供一种居家老人呼救设备,包括用于声纹、语音识别模型训练的服务器端、用于声纹、语音识别和拨打电话的客户端,客户端包括微处理器及与其连接的拾音设备、电话卡和扬声器,微处理器上部署维纳滤波器对语音信号进行降噪处理;服务器端训练完成的声纹、语音识别模型打包部署到客户端,采集目标用户语音信号,对客户端声纹识别模型进行参数微调,构成本地声纹、语音识别模型及运行环境;当语音信号输入本地声纹、语音识别模型,若声纹识别结果为目标用户,则进行语音识别,获取识别语音结果,微处理器执行对应的执行指令;否则不进行语音识别。本发明使用语音识别技术实现老人呼救,相比起传统的按键、打电话方法,更加便捷,人性化。

技术研发人员:韩振华;薛海涛
受保护的技术使用者:山西云芯新一代信息技术研究院有限公司
技术研发日:2021.04.01
技术公布日:2021.07.06
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜