一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于方言口音的语音转译方法、系统和可读存储介质与流程

2021-09-04 07:28:00 来源:中国专利 TAG:语音 口音 方言 可读 方法

技术特征:
1.一种基于方言口音的语音转译方法,其特征在于,包括以下步骤:通过预设口音识别神经网络识别目标音频的初始口音;依据所述初始口音进行转译作业以获取目标译文;通过预设算法提取所述目标音频的音频人语速与音调;依据所述音频人语速与音调获取所述音频人的情绪结果并记录。2.根据权利要求1所述的一种基于方言口音的语音转译方法,其特征在于,所述通过预设口音识别神经网络识别目标音频的初始口音,具体为:截取所述目标音频在第一预设时间范围类的第一音频内容;提取所述第一音频内容的口音因子作为所述口音识别神经网络的实验输入值进行口音预识别,得到回归概率值递减的第一口音归属数据组;截取所述目标音频在第二预设时间范围类的第二音频内容;提取所述第二音频内容的口音因子作为所述口音识别神经网络的验证输入值进行口音再识别,得到回归概率值递减的第二口音归属数据组;比较所述第一口音归属数据组与所述第二口音归属数据组的内容以得到所述初始口音。3.根据权利要求2所述的一种基于方言口音的语音转译方法,其特征在于,所述比较所述第一口音归属数据组与所述第二口音归属数据组的内容以得到所述初始口音,具体为:从所述第一口音归属数据组中提取排序为前三位的口音数据库,记为、以及;从所述第二口音归属数据组中提取排序为前三位的口音数据库,记为、以及;识别数据组中相同的所述口音数据库并提取对应的所述回归概率值;计算每组相同所述口音数据库的不同所述回归概率值的总和并降序排列,选择和值最大的所述口音数据库作为所述初始口音。4.根据权利要求3所述的一种基于方言口音的语音转译方法,其特征在于,所述依据所述初始口音进行转译作业以获取目标译文,具体为:分别判断两组口音数据库中所述初始口音的回归概率值与预设阈值的大小,其中,若两组所述回归概率值均大于或等于预设阈值,则选择所述初始口音的口音数据库作为目标口音进行转译作业所述目标译文;否则,则重新选择所述数据组中相同所述口音数据库的所述回归概率值差值最小的数据库作为所述目标口音进行转译作业得到所述目标译文。5.根据权利要求1所述的一种基于方言口音的语音转译方法,其特征在于,所述口音识别神经网络的训练方法,具体为:获取历史时间的口音因子和口音类型信息;将所述历史时间的口音因子和口音类型信息进行预处理,得到训练样本集;将所述训练样本集输入至初始化的所述口音识别神经网络中训练;获取输出结果的准确率;若所述准确率大于预设的准确率阈值,则停止训练,得到所述口音识别神经网络。6.根据权利要求1所述的一种基于方言口音的语音转译方法,其特征在于,所述依据所
述音频人语速与音调获取所述音频人的情绪结果并记录,具体为:获取当前所述音频人的所属方言标准语速与音调并进行加权;判断当前所述音频人语速与音调与加权后的方言标准语速与音调的关系;其中,若所述音频人语速与音调均大于所述加权后的方言标准语速与音调,则所述音频人的情绪结果判断为第一情绪;若所述音频人语速与音调均小于等于所述加权后的方言标准语速与音调,则所述音频人的情绪结果判断为第二情绪;否则,所述音频人的情绪结果判断为第三情绪。7.一种基于方言口音的语音转译系统,其特征在于,包括存储器和处理器,所述存储器中包括基于方言口音的语音转译方法程序,所述基于方言口音的语音转译方法程序被所述处理器执行时实现如下步骤:通过预设口音识别神经网络识别目标音频的初始口音;依据所述初始口音进行转译作业以获取目标译文;通过预设算法提取所述目标音频的音频人语速与音调;依据所述音频人语速与音调获取所述音频人的情绪结果并记录。8.根据权利要求7所述的一种基于方言口音的语音转译系统,其特征在于,所述通过预设口音识别神经网络识别目标音频的初始口音,具体为:截取所述目标音频在第一预设时间范围类的第一音频内容;提取所述第一音频内容的口音因子作为所述口音识别神经网络的实验输入值进行口音预识别,得到回归概率值递减的第一口音归属数据组;截取所述目标音频在第二预设时间范围类的第二音频内容;提取所述第二音频内容的口音因子作为所述口音识别神经网络的验证输入值进行口音再识别,得到回归概率值递减的第二口音归属数据组;比较所述第一口音归属数据组与所述第二口音归属数据组的内容以得到所述初始口音。9.根据权利要求8所述的一种基于方言口音的语音转译系统,其特征在于,所述比较所述第一口音归属数据组与所述第二口音归属数据组的内容以得到所述初始口音,具体为:从所述第一口音归属数据组中提取排序为前三位的口音数据库,记为、以及;从所述第二口音归属数据组中提取排序为前三位的口音数据库,记为、以及;识别数据组中相同的所述口音数据库并提取对应的所述回归概率值;计算每组相同所述口音数据库的不同所述回归概率值的总和并降序排列,选择和值最大的所述口音数据库作为所述初始口音。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基于方言口音的语音转译方法程序,所述基于方言口音的语音转译方法程序被处理器执行时,实现如权利要求1至6中任一项所述的一种基于方言口音的语音转译方法的步骤。

技术总结
本发明公开的一种基于方言口音的语音转译方法、系统和可读存储介质,其中方法包括:通过预设口音识别神经网络识别目标音频的初始口音;依据所述初始口音进行转译作业以获取目标译文;通过预设算法提取所述目标音频的音频人语速与音调;依据所述音频人语速与音调获取所述音频人的情绪结果并记录。本发明通过设置实验数据实验与验证数据验证得到初始口音,再根据设置的回归概率值的大小选择目标口音进行转译作业,保证了方言口音识别的准确率,进而保证了转译的正确率;同时可以实时采取客户的语速和音调,进而得到客户的情绪等级,便于客服人员采取针对性措施,提升客户满意度,降低投诉率。低投诉率。低投诉率。


技术研发人员:赵泰龙 黄蔚 王圣竹 杨倩 张旭
受保护的技术使用者:广西电网有限责任公司
技术研发日:2021.06.30
技术公布日:2021/9/3
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜