一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

方言口音普通话的语音识别优化方法及系统与流程

2021-11-15 18:53:00 来源:中国专利 TAG:

技术特征:
1.一种方言口音普通话的语音识别优化方法,其特征在于,所述方法包括以下步骤:s1将标准普通话音频作为模型输入普通话增强模块,利用卷积神经网络对音频内容进行卷积提取特征;s2将提取的特征反卷积生成原始音频,并通过神经网络学习标准普通话的特征;s3生成标准普通话音频,再次卷积提取特征,添加在中间特征作为偏移量,进行强化普通话种的内容以及语音语调相关特征;s4将普通话特征以及每一步卷积的结果作为特征,增加到方言处理模块对应的卷积层结尾作为偏移量,进行卷积处理;s5通过卷积层后将获得的参数进行反卷积,放大原有信息,生成目标音频,最后将目标音频输入语音识别功能中进行识别。2.根据权利要求1所述的一种方言口音普通话的语音识别优化方法,其特征在于,所述方法中,普通话增强模块使用自编码的模型结构,其包括卷积部分和反卷积部分。3.根据权利要求1所述的一种方言口音普通话的语音识别优化方法,其特征在于,所述方法中,对普通话增强模块的自编码模型部分特征提取进行单独训练,其基础输入为非单纯白噪音。4.根据权利要求1所述的一种方言口音普通话的语音识别优化方法,其特征在于,所述方法中,方言处理模块基于自编码的模型框架,在每一层卷积的结尾添加来自标准普通话模块的卷积结果参数。5.根据权利要求4所述的一种方言口音普通话的语音识别优化方法,其特征在于,所述方法中,方言处理模块携带的卷积参数包括普通话语义以及语调、含义的相关信息。6.根据权利要求1所述的一种方言口音普通话的语音识别优化方法,其特征在于,所述方法基于卷积神经网络,训练样本为同样文字阅读音频,每一段方言口音音频对应有一段标准普通话音频。7.一种方言口音普通话的语音识别优化系统,所述系统用于实现如权利要求1

6任一项所述的一种方言口音普通话的语音识别优化方法,其特征在于,包括方言口音处理模块和标准普通话语音增强模块。8.根据权利要求7所述的一种方言口音普通话的语音识别优化系统,其特征在于,所述方言模块用于对方言口音音频进行特征提取,同时获得标准普通话的增强特征,对方言口音进行再生成,生成一段标准的普通话音频。9.根据权利要求7所述的一种方言口音普通话的语音识别优化系统,其特征在于,所述标准普通话增强模块用于提取标准普通话的特征以及文本内容特征,用于强化语音过程中的内容,提升语音的识别能力。

技术总结
本发明涉及语音识别技术领域,具体涉及一种方言口音普通话的语音识别优化方法及系统,本发明利用卷积神经网络对音频内容进行卷积以及特征提取;并通过神经网络学习标准普通话的特征;生成标准普通话音频后,再次卷积提取特征,添加在中间特征作为偏移量,将普通话特征以及每一步卷积的结果作为特征,增加到方言处理模块对应的卷积层结尾作为偏移量,通过卷积层后将获得的参数进行反卷积,放大原有信息,生成目标音频,最后将目标音频输入语音识别功能中进行识别。本发明减少了定制化每种方言特殊模型的成本,同时利用了普通话鱼与方言口音特征叠加的方法对需要的标准普通话的特征进行放大,泛化模型难度的同时,进一步提升了语音识别的准确度。了语音识别的准确度。了语音识别的准确度。


技术研发人员:杨逸舟 陈海江
受保护的技术使用者:浙江力石科技股份有限公司
技术研发日:2021.09.08
技术公布日:2021/11/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献