一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种结合瞬时频率的多通道语音识别方法与流程

2022-06-01 08:26:15 来源:中国专利 TAG:

技术特征:
1.一种结合瞬时频率的多通道语音识别方法,其特征在于,所述方法包括:获取麦克风阵列中的每个单通道的原始频域语音信号作为目标语音信号;估计每个单通道的目标语音信号的瞬时频率,根据所述瞬时频率提取瞬时频率特征;根据每个单通道的目标语音信号提取mel特征;组合所述mel特征和所述瞬时频率特征,得到目标特征;将所述目标特征输入预设的声学模型,获得语音识别结果。2.根据权利要求1所述的一种结合瞬时频率的多通道语音识别方法,其特征在于,在获取麦克风阵列中的每个单通道的原始频域语音信号作为目标语音信号之前,所述方法还包括:获取麦克风阵列中的每个单通道时域的语音信号,作为原始时域语音信号;对所述原始时域语音信号进行预加重处理和分帧,对分帧后的每帧语音信号加窗,对加窗后的每帧语音信号进行快速傅里叶变换,得到每个单通道频域的原始语音信号,作为原始频域语音信号。3.根据权利要求1所述的一种结合瞬时频率的多通道语音识别方法,其特征在于,估计每个单通道的目标语音信号的瞬时频率,根据所述瞬时频率提取瞬时频率特征,包括:针对每个单通道,计算该单通道和其他单通道之间的交叉teager能量算子;将期望最小的交叉teager能量算子作为gabor滤波器的滤波系数对该单通道的目标语音信号进行解调,得到该单通道的目标语音信号的瞬时频率;根据该单通道的瞬时频率提取该单通道的瞬时频率特征。4.根据权利要求3所述的一种结合瞬时频率的多通道语音识别方法,其特征在于,每个单通道的目标语音信号包括多个子信号;针对每个单通道,计算该单通道和其他单通道之间的交叉teager能量算子,包括:针对每个单通道,根据能量算子公式计算该单通道的能量算子;其中,x(t)为目标语音信号的任意子信号,为x(t)的一阶导数,为x(t)的二阶导数;根据该单通道的能量算子、其他任意单通道的能量算子和交叉teager能量算子公式计算该单通道和各个其他单通道之间的交叉teager能量算子。5.根据权利要求1所述的一种结合瞬时频率的多通道语音识别方法,其特征在于,根据每个单通道的目标语音信号提取mel特征,包括:针对每个单通道的目标语音信号,使用mel滤波器对该单通道的目标语音信号进行滤波,得到mel域频谱;对mel域频谱取log对数,然后进行离散余弦变换得到该单通道的mel特征。6.根据权利要求1所述的一种结合瞬时频率的多通道语音识别方法,其特征在于,组合所述mel特征和所述瞬时频率特征,得到目标特征,包括:将所述麦克风阵列中各个通道提取的mel特征并联,得到规整的多通道mel特征;将所述多通道mel特征与各个单通道的瞬时频率特征并联,得到目标特征。

技术总结
本发明公开了一种结合瞬时频率的多通道语音识别方法,涉及语音识别技术领域。获取麦克风阵列中的每个单通道频域的离散语音信号作为目标语音信号;估计每个单通道的目标语音信号的瞬时频率,根据瞬时频率提取瞬时频率特征;根据每个单通道的目标语音信号提取Mel特征;组合Mel特征和瞬时频率特征,得到目标特征;将目标特征输入预设的声学模型,获得语音识别结果。通过瞬时频率提取瞬时频率特征,并将瞬时频率特征和Mel特征组合进行语音识别,丰富了语音信号的特征,提升了语音识别的准确度。度。度。


技术研发人员:陈亮
受保护的技术使用者:广州科慧健远医疗科技有限公司
技术研发日:2022.02.25
技术公布日:2022/5/31
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献