语音识别信号预处理方法、装置、设备及计算机存储介质与流程

2021-10-29 20:24:00 来源：中国专利 TAG：预处理人工智能装置可读信号

技术特征：
1.一种语音识别信号预处理方法，其特征在于，所述方法包括：接收待识别语音信号，并提取所述待识别语音信号中各待识别语句的声纹特征，其中，所述待识别语音信号包括至少一个待识别语句；根据声纹模型库对所述各待识别语句的声纹特征进行识别，得到初始识别结果；其中，所述声纹模型库为根据所述待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到，所述识别结果为待识别语句与用户的对应关系；对所述待识别的语音信号的各待识别语句进行失真性分析，得到所述各待识别语句的失真度结果；根据所述失真度结果对所述声纹模型库及所述初始识别结果进行调整，得到目标声纹模型库及目标识别结果。2.根据权利要求1所述的方法，其特征在于，接收待识别语音信号，并提取所述待识别语音信号中各待识别语句的声纹特征，其中，所述待识别语音信号包括至少一个待识别语句，进一步包括：将所述待识别语音信号划分为多个语句；提取所述待识别语音信号中当前待识别语句之前的各待识别语句的身份特征和文本特征，融合得到声纹特征。3.根据权利要求1所述的方法，其特征在于，根据声纹模型库对所述各待识别语句的声纹特征进行识别，得到初始识别结果，其中，所述声纹模型库为根据所述待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到，进一步包括：将所述声纹特征与对应的用户标识关联存储，构建声纹模型库；将当前待识别语句与声纹模型库中存储的声纹特征进行比较，判断相似度，为当前待识别语音信号匹配对应的用户标识，并关联存储至声纹模型库。4.根据权利要求1所述的方法，其特征在于，对所述待识别的语音信号的各待识别语句进行失真性分析，得到所述各待识别语句的失真度结果，进一步包括：采用thd总谐波失真分析方法对所述待识别语音信号中的各待识别语句进行失真度分析，得到各个语句对应的失真度结果。5.根据权利要求4所述的方法，其特征在于，所述thd总谐波失真分析方法，进一步包括：采用thd总谐波失真分析公式进行失真度分析：其中，v
thd_r
表示指定n次全部谐波分量均方根值与总均方根值之比，v
h,rms
表示音量均方根,rms表示均方根，h表示指定阶数。6.根据权利要求1所述的方法，其特征在于，根据所述失真度结果对所述初始识别结果进行调整，得到目标识别结果，进一步包括：确定各待识别的语句的失真度结果是否在失真度阈值区间内；
在声纹模型库中将所述失真度结果不在所述失真度阈值区间内的待识别语句及对应的用户标识剔除，得到目标声纹模型库及目标识别结果。7.一种语音识别信号预处理装置，其特征在于，所述装置包括：声纹提取模块，用于接收待识别语音信号，并提取所述待识别语音信号中各待识别语句的声纹特征，其中，所述待识别语音信号包括至少一个待识别语句；声纹注册模块，用于根据声纹模型库对所述各待识别语句的声纹特征进行识别，得到初始识别结果；其中，所述声纹模型库为根据所述待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到，所述识别结果为待识别语句与用户的对应关系；失真度分析模块，用于对所述待识别的语音信号的各待识别语句进行失真性分析，得到所述各待识别语句的失真度结果；调整模块，用于根据所述失真度结果对所述声纹模型库及所述初始识别结果进行调整，得到目标声纹模型库及目标识别结果。8.根据权利要求7所述的装置，其特征在于，所述声纹注册模块根据声纹模型库对所述各待识别语句的声纹特征进行识别，得到初始识别结果，其中，所述声纹模型库为根据所述待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到，进一步包括：将所述声纹特征与对应的用户标识关联存储，构建声纹模型库；将当前待识别语句与声纹模型库中存储的声纹特征进行比较，判断相似度，为当前待识别语音信号匹配对应的用户标识，并关联存储至声纹模型库。9.一种语音识别信号预处理设备，其特征在于，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-6任意一项所述的方法的操作。10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一可执行指令，所述可执行指令在语音识别信号预处理设备上运行时，使得语音识别信号预处理设备执行如权利要求1-6任意一项所述的语音识别信号预处理方法的操作。

技术总结
本发明实施例涉及语音信号处理技术领域，公开了一种语音识别信号预处理方法，该方法包括：接收待识别语音信号，并提取待识别语音信号中各待识别语句的声纹特征，其中，待识别语音信号包括至少一个待识别语句；根据声纹模型库对各待识别语句的声纹特征进行识别，得到初始识别结果；其中，声纹模型库为根据待识别语音信号中当前待识别语句之前的各待识别语句进行短时注册构建得到；对待识别的语音信号的各待识别语句进行失真性分析，得到各待识别语句的失真度结果；根据失真度结果对声纹模型库及初始识别结果进行调整，得到目标声纹模型库及目标识别结果。通过上述方式，本发明实施例实现了语音识别的准确性的有益效果。实现了语音识别的准确性的有益效果。实现了语音识别的准确性的有益效果。

技术研发人员：陈润泽陈航任永华胡瑛王振志
受保护的技术使用者：中国移动通信集团有限公司
技术研发日：2020.04.28
技术公布日：2021/10/28

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种线性预测编码参数的编码方法和编码装置与流程

语音识别信号预处理方法、装置、设备及计算机存储介质与流程

相关文献

最热文献