语音纠正方法、装置及电子设备与流程

2021-09-18 03:29:00 来源：中国专利 TAG：人工智能电子设备纠正语音装置

技术特征：
1.一种语音纠正方法，其特征在于，所述方法包括：提取待处理语音的目标声音特征；基于所述目标声音特征确定所述待处理语音所属的目标地理区域；从预先训练的多个语音纠正模型中获取与所述目标地理区域对应的目标语音纠正模型，所述多个语音纠正模型分别与多个地理区域对应；基于所述目标语音纠正模型对所述待处理语音进行语音纠正，输出纠正后的语音。2.根据权利要求1所述的方法，其特征在于，所述从预先训练的多个语音纠正模型中获取与所述目标地理区域对应的目标语音纠正模型之前，所述方法还包括：获取所述多个地理区域各自对应的训练样本；将第一地理区域对应的训练样本输入所述第一地理区域对应的语音纠正模型，对所述第一地理区域对应的语音纠正模型进行训练，所述第一地理区域为所述多个地理区域中的任意一个地理区域。3.根据权利要求1所述的方法，其特征在于，所述提取待处理语音的目标声音特征之前，所述方法还包括：分别采集多个对象的语音样本；提取所述多个对象中每个对象的语音样本的声纹特征，并获取所述每个对象的语音样本与预设语音之间的差异声学特征；将所述每个对象的语音样本与所述预设语音之间的差异声学特征分别输入预先训练的区域语音识别模型，所述区域语音识别模型用于识别语音归属的地理区域；基于所述区域语音识别模型的输出结果确定所述多个对象对应的声纹特征与所述多个地理区域的对应关系；所述目标声音特征包括目标声纹特征，所述基于所述目标声音特征确定所述待处理语音所属的目标地理区域，包括：基于所述多个对象对应的声纹特征与所述多个地理区域的对应关系及所述目标声纹特征确定所述待处理语音所属的目标地理区域。4.根据权利要求3所述的方法，其特征在于，所述区域语音识别模型包括第一区域语音识别子模型和第二区域语音识别子模型；所述将所述每个对象的语音样本与所述预设语音之间的差异声学特征分别输入预先训练的区域语音识别模型，包括：将所述每个对象的语音样本与所述预设语音之间的差异声学特征分别输入所述第一区域语音识别子模型，确定语音归属的第一级地理区域；将所述每个对象的语音样本与所述预设语音之间的差异声学特征分别输入与所述第一级地理区域对应的第二区域语音识别子模型，确定语音归属的第二级地理区域；其中，所述多个对象对应的声纹特征与所述多个地理区域的对应关系包括所述多个对象对应的声纹特征与多个所述第二级地理区域的对应关系。5.根据权利要求1所述的方法，其特征在于，所述目标声音特征包括目标声纹特征，所述基于所述目标声音特征确定所述待处理语音所属的目标地理区域，包括：在预先存储的多个声纹特征中存在与所述目标声纹特征匹配的声纹特征的情况下，基于所述目标声纹特征确定所述待处理语音所属的目标地理区域。
6.根据权利要求1所述的方法，其特征在于，所述待处理语音包括第一子语音和第二子语音，所述第一子语音为待纠正的语音，所述第二子语音为所述待处理语音中所述第一子语音以外的语音；所述纠正后的语音包括所述第二子语音和第三子语音，所述第三子语音为具有与所述第二子语音对应的音色特征的纠正后的第一子语音。7.根据权利要求3所述的方法，其特征在于，所述分别采集多个对象的语音样本，包括：分别采集多个对象的语音样本和用户身份信息；所述提取所述多个对象中每个对象的语音样本的声纹特征之后，所述方法还包括：确定所述多个对象对应的声纹特征与所述用户身份信息的对应关系；所述输出纠正后的语音之后，所述方法还包括：存储所述目标声纹特征对应的用户身份信息与所述纠正后的语音的对应关系。8.一种语音纠正装置，其特征在于，所述语音纠正装置包括：提取模块，用于提取待处理语音的目标声音特征；第一确定模块，用于基于所述目标声音特征确定所述待处理语音所属的目标地理区域；第一获取模块，用于从预先训练的多个语音纠正模型中获取与所述目标地理区域对应的目标语音纠正模型，所述多个语音纠正模型分别与多个地理区域对应；纠正模块，用于基于所述目标语音纠正模型对所述待处理语音进行语音纠正，输出纠正后的语音。9.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序，所述程序被所述处理器执行时实现如权利要求1至7中任一项所述的语音纠正方法中的步骤。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语音纠正方法的步骤。

技术总结
本公开提供一种语音纠正方法、装置及电子设备，所述方法包括：提取待处理语音的目标声音特征；基于所述目标声音特征确定所述待处理语音所属的目标地理区域；从预先训练的多个语音纠正模型中获取与所述目标地理区域对应的目标语音纠正模型，所述多个语音纠正模型分别与多个地理区域对应；基于所述目标语音纠正模型对所述待处理语音进行语音纠正，输出纠正后的语音。本公开实施例能够提高语音纠正效果。本公开实施例能够提高语音纠正效果。本公开实施例能够提高语音纠正效果。

技术研发人员：曾亮常乐涂贤玲
受保护的技术使用者：北京声智科技有限公司
技术研发日：2021.07.20
技术公布日：2021/9/17

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种实现远程口语翻译服务的方法与流程

语音纠正方法、装置及电子设备与流程

相关文章

最热文献