一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音测评方法、装置、电子设备及计算机可读介质与流程

2021-06-04 13:32:00 来源:中国专利 TAG:电子设备 介质 计算机信息 测评 语音

技术特征:
1.一种语音测评方法,其特征在于,包括:获取待测评的语音数据和其对应的文本数据;将所述语音数据分别输入第一声学模型和第二声学模型中,得到第一声学数据和第二声学数据;将所述文本数据输入文本网络中,生成辅助数据;基于所述第一声学数据、所述第二声学数据、所述辅助数据进行解码得到第一发音质量评分和第二发音质量评分;基于所述第一发音质量评分和所述第二发音质量评分确定所述待测评的语音数据的测评结果。2.如权利要求1所述的方法,其特征在于,还包括:通过语音训练数据对深度神经网络模型进行训练,以生成所述第一声学模型;其中,所述第一声学模型用于对语音数据中音素的变化进行测评。3.如权利要求2所述的方法,其特征在于,还包括:基于交叉熵准则对深度神经网络模型进行训练。4.如权利要求1所述的方法,其特征在于,还包括:通过语音训练数据对时间延迟深度神经网络模型进行训练,以生成所述第二声学模型;其中,所述第二声学模型用于对语音数据中音素的区分度进行测评。5.如权利要求4所述的方法,其特征在于,还包括:基于最大互信息量准则对时间延迟深度神经网络模型进行训练。6.如权利要求1所述的方法,其特征在于,将所述语音数据分别输入第一声学模型和第二声学模型中,得到第一声学数据和第二声学数据,包括:对所述语音数据进行特征提取,生成语音特征数据;将所述语音特征数据分别输入所述第一声学模型和所述第二声学模型中以得到所述第一声学数据和所述第二声学数据。7.如权利要求1所述的方法,其特征在于,基于所述第一声学数据、所述第二声学数据、所述辅助数据进行解码得到第一发音质量评分和第二发音质量评分,包括:获取预设发音词典;基于所述发音词典、所述第一声学数据、所述第二声学数据、所述辅助数据和发音质量算法生成所述第一发音质量评分和所述第二发音质量评分。8.如权利要求7所述的方法,其特征在于,基于所述发音词典、所述第一声学数据、所述第二声学数据、所述辅助数据和发音质量算法生成所述第一发音质量评分和所述第二发音质量评分,包括:基于所述发音质量算法、所述发音词典、所述辅助数据对所述第一声学数据进行解码得到所述第一发音质量评分;基于所述发音质量算法、所述发音词典、所述辅助数据对所述第二声学数据进行解码得到所述第二发音质量评分。9.如权利要求1所述的方法,其特征在于,基于所述第一发音质量评分和所述第二发音质量评分确定所述待测评的语音数据的测评结果,包括:
对所述第一发音质量评分和所述第二发音质量评分进行融合以确定所述待测评的语音数据的测评结果。10.如权利要求9所述的方法,其特征在于,对所述第一发音质量评分和所述第二发音质量评分进行融合以确定所述待测评的语音数据的测评结果,包括:对所述第一发音质量评分和所述第二发音质量评分进行线性加权以确定所述待测评的语音数据的测评结果;或基于阈值对所述第一发音质量评分和所述第二发音质量评分进行判断以确定所述待测评的语音数据的测评结果。11.一种语音测评装置,其特征在于,包括:数据模块,用于获取待测评的语音数据和其对应的文本数据;模型计算模块,用于将所述语音数据分别输入第一声学模型和第二声学模型中,得到第一声学数据和第二声学数据;网络计算模块,用于将所述文本数据输入文本网络中,生成辅助数据;解码模块,用于基于所述第一声学数据、所述第二声学数据、所述辅助数据进行解码得到第一发音质量评分和第二发音质量评分;测评模块,用于基于所述第一发音质量评分和所述第二发音质量评分确定所述待测评的语音数据的测评结果。12.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1

10中任一所述的方法。13.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1

10中任一所述的方法。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜