一种发音纠正方法、装置、计算机设备及存储介质与流程

2022-06-08 22:58:18 来源：中国专利 TAG：

技术特征：
1.一种发音纠正方法，其特征在于，包括：响应于用户跟读预设语音的语音输入，获取用户跟读语音；根据所述预设语音和所述用户跟读语音的发音感知相似的分析，确定目标发音片段，所述目标发音片段为所述用户跟读语音中，发音准确度满足预设规则的片段；根据所述目标发音片段，以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音，所述发音纠正语音用于纠正所述用户跟读语音中的所述目标发音片段。2.根据权利要求1所述的发音纠正方法，其特征在于，所述根据所述预设语音和所述用户跟读语音的发音感知相似的分析，确定目标发音片段，包括：对所述用户跟读语音进行预处理，得到目标语音；获取所述预设语音中每个第一内容的发音的波形和所述目标语音中与每个第一内容对应的第二内容的发音的波形；根据每个第二内容的发音的波形和对应的第一内容的发音的波形的感知相似度，确定每个第二内容的发音准确度；将发音准确度小于预设阈值的第二内容的发音确定为所述目标发音片段。3.根据权利要求2所述的发音纠正方法，其特征在于，所述第一内容或所述第二内容为：词语、词组、音节中的任意一项。4.根据权利要求2或3所述的发音纠正方法，其特征在于，所述获取所述预设语音中每个第一内容的发音的波形和所述目标语音中对应的第二内容的发音的波形，包括：计算所述目标语音和所述预设语音的声音感知差距；根据所述声音感知差距和预存的时间对齐算法，将所述目标语音的发音的波形和所述预设语音的发音的波形对齐；根据所述预设语音中预先标注的声音起始信息，截取对齐的所述预设语音和所述目标语音的发音的波形，得到每个第一内容的发音的波形和对应的第二内容的发音的波形。5.根据权利要求1-3中任一项所述的发音纠正方法，其特征在于，所述目标发音片段为目标词语的发音片段，所述根据所述目标发音片段，以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音，包括：根据所述目标词语的发音片段和所述预设语音中与所述目标词语对应的词语的发音片段，生成第一纠正语音，所述第一纠正语音用于纠正所述目标词语的发音；确定所述目标词语的发音片段中的目标音节片段，所述目标音节片段为所述目标词语中发音准确度小于预设阈值的音节；根据所述目标音节片段和所述预设语音中与所述目标音节片段对应的片段生成第二纠正语音，所述第二纠正语音用于纠正所述目标音节片段的发音；所述发音纠正语音包括所述第一纠正语音和所述第二纠正语音。6.根据权利要求1-3中任一项所述的发音纠正方法，其特征在于，所述根据所述目标发音片段，以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音，包括：将所述目标发音片段和所述预设语音中与所述目标发音片段对应的片段以对比的方式添加至预存的语音模板中，生成所述发音纠正语音；或者，根据所述目标发音片段生成所述发音纠正语音；
或者，根据所述预设语音中与所述目标发音片段对应的片段生成所述发音纠正语音。7.根据权利要求2或3所述的发音纠正方法，其特征在于，所述发音纠正方法还包括：获取所述预设语音对应的目标内容；根据每个第二内容的发音准确度，确定所述目标内容中与每个第二内容对应的内容的发音评价参数；采用第一标记方式对发音评价参数大于预设值的内容进行标记，采用第二标记方式对发音评价参数小于或等于所述预设值的内容进行标记，所述第一标记方式与所述第二标记方式不同；显示标记后的目标内容，所述标记后的目标内容用于提示用户的所述用户跟读语音的发音准确度。8.根据权利要求7所述的发音纠正方法，其特征在于，所述发音纠正方法还包括：在所述目标内容的所有内容的发音评价参数的平均值小于预设参数的情况下，再次输出所述预设语音；或者，在所述目标内容中发音评价参数小于所述预设参数的内容数量在所述目标内容的内容总数中的占比小于预设占比的情况下，再次输出所述预设语音；或者，在所述目标内容的所有内容的发音评价参数的总和小于预设和值的情况下，再次输出所述预设语音。9.一种发音纠正装置，其特征在于，包括：获取模块，用于响应于用户跟读预设语音的语音输入，获取用户跟读语音；确定模块，用于根据所述预设语音和所述用户跟读语音的发音感知相似的分析，确定目标发音片段，所述目标发音片段为所述用户跟读语音中，发音准确度满足预设规则的片段；语音合成模块，用于根据所述目标发音片段，以及所述预设语音中与所述目标发音片段对应的片段生成发音纠正语音，所述发音纠正语音用于纠正所述用户跟读语音中的所述目标发音片段。10.根据权利要求9所述的发音纠正装置，其特征在于，所述确定模块具体用于：对所述用户跟读语音进行预处理，得到目标语音；获取所述预设语音中每个第一内容的发音的波形和所述目标语音中与每个第一内容对应的第二内容的发音的波形；根据每个第二内容的发音的波形和对应的第一内容的发音的波形的感知感知相似度，确定每个第二内容的发音准确度；将发音准确度小于预设阈值的第二内容的发音确定为所述目标发音片段。11.根据权利要求10所述的发音纠正装置，其特征在于，所述第一内容或所述第二内容为：词语、词组、音节中的任意一项。12.根据权利要求10或11所述的发音纠正装置，其特征在于，所述确定模块具体用于：计算所述目标语音和所述预设语音的声音感知差距；
根据所述声音感知差距和预存的时间对齐算法，将所述目标语音的发音的波形和所述预设语音的发音的波形对齐；根据所述预设语音中预先标注的声音起始信息，截取对齐的所述预设语音和所述目标语音的发音的波形，得到每个第一内容的发音的波形和对应的第二内容的发音的波形。13.根据权利要求9-11中任一项所述的发音纠正装置，其特征在于，所述目标发音片段为目标词语的发音片段，所述语音合成模块具体用于：根据所述目标词语的发音片段和所述预设语音中与所述目标词语对应的词语的发音片段，生成第一纠正语音，所述第一纠正语音用于纠正所述目标词语的发音；确定所述目标词语的发音片段中的目标音节片段，所述目标音节片段为所述目标词语中发音准确度小于预设阈值的音节；根据所述目标音节片段和所述预设语音中与所述目标音节片段对应的片段生成第二纠正语音，所述第二纠正语音用于纠正所述目标音节片段的发音；所述发音纠正语音包括所述第一纠正语音和所述第二纠正语音。14.根据权利要求9-11中任一项所述的发音纠正装置，其特征在于，所述语音合成模块具体用于：将所述目标发音片段和所述预设语音中与所述目标发音片段对应的片段以对比的方式添加至预存的语音模板中，生成所述发音纠正语音；或者，根据所述目标发音片段生成所述发音纠正语音；或者，根据所述预设语音中与所述目标发音片段对应的片段生成所述发音纠正语音。15.根据权利要求10或11所述的发音纠正装置，其特征在于，所述发音纠正装置还包括评价模块和显示模块；所述获取模块，还用于获取所述预设语音对应的目标内容；所述确定模块，还用于根据每个第二内容的发音准确度，确定所述目标内容中与每个第二内容对应的内容的发音评价参数；所述评价模块，用于采用第一标记方式对发音评价参数大于预设值的内容进行标记，采用第二标记方式对发音评价参数小于或等于所述预设值的内容进行标记，所述第一标记方式与所述第二标记方式不同；所述显示模块，用于显示标记后的目标内容，所述标记后的目标内容用于提示用户的所述用户跟读语音的发音准确度。16.根据权利要求15所述的发音纠正装置，其特征在于，所述发音纠正装置还包括输出模块，所述输出模块用于：在所述目标内容的所有内容的发音评价参数的平均值小于预设参数的情况下，再次输出所述预设语音；或者，在所述目标内容中发音评价参数小于所述预设参数的内容数量在所述目标内容的内容总数中的占比小于预设占比的情况下，再次输出所述预设语音；或者，
在所述目标内容的所有内容的发音评价参数的总和小于预设和值的情况下，再次输出所述预设语音。17.一种计算机设备，其特征在于，所述计算机设备包括：处理器和存储器；所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令；当所述处理器执行所述计算机指令时，所述计算机设备执行如权利要求1-8中任意一项所述的发音纠正方法。18.一种计算机可读存储介质，其特征在于，包括计算机指令，当所述计算机指令在计算机设备上运行时，使得所述计算机设备执行如权利要求1-8中任意一项所述的发音纠正方法。

技术总结
本发明公开一种发音纠正方法、装置、计算机设备及存储介质，涉及人工智能技术领域。具体方案包括：计算机设备响应于用户跟读预设语音的语音输入，获取用户跟读语音，并根据预设语音和用户跟读语音的发音感知相似的分析，确定目标发音片段，目标发音片段为用户跟读语音中，发音准确度满足预设规则的片段，且根据目标发音片段，以及预设语音中与目标发音片段对应的片段生成发音纠正语音，发音纠正语音用于纠正用户跟读语音中的目标发音片段。本发明通过对比的方式同时呈现目标发音片段和预设语音中与目标发音片段对应的片段，同时辅助以自然语言的引导，能够主动有效引导学习者对发音不准确的地方进行发音纠正，提升了发音纠正的效率。效率。效率。

技术研发人员：朱奇峰
受保护的技术使用者：苏州清睿智能科技股份有限公司
技术研发日：2021.12.30
技术公布日：2022/6/7

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种发音纠正方法、装置、计算机设备及存储介质与流程

相关文献

最热文献