一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频测评方法及装置与流程

2021-06-29 21:25:00 来源:中国专利 TAG:测评 音频处理 装置 音频 申请

技术特征:
1.一种音频测评方法,其特征在于,所述方法包括:获取第一音频和第二音频,所述第一音频为待测评音频,所述第二音频为所述第一音频的标准音频,所述第一音频和所述第二音频均对应预设文本;根据所述第一音频和所述第二音频,确定音频关联矩阵;根据所述音频关联矩阵预测所述预设文本的读音;根据所述预设文本的读音对所述第一音频进行评分,得到评分结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一音频和所述第二音频,确定音频关联矩阵,包括:获取第一矩阵和第二矩阵,所述第一矩阵为所述第一音频的特征矩阵,所述第二矩阵为所述第二音频的特征矩阵;根据所述第一矩阵和所述第二矩阵,确定第三矩阵;将所述第三矩阵乘以所述第一矩阵,得到所述音频关联矩阵。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一矩阵和所述第二矩阵,确定第三矩阵,包括:将所述第一矩阵和所述第二矩阵分别输入音频特征时序提取模型,得到第一时序矩阵和第二时序矩阵,所述第一时序矩阵用于表示所述第一矩阵中的音频特征在时序上的关联,所述第二时序矩阵用于表示所述第二矩阵中的音频特征在时序上的关联;根据所述第一时序矩阵和所述第二时序特征的转置矩阵,得到所述第三矩阵。4.根据权利要求1

3任一项所述的方法,其特征在于,所述根据所述音频关联矩阵预测所述预设文本的读音,包括:将所述音频关联矩阵中行向量进行相加,得到第一向量;根据所述第一向量,分别预测所述预设文本中每个文字的目标声、目标韵和目标调;将所述每个文字所述目标声、所述目标韵和所述目标调进行组合,得到所述预设文本的读音。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一向量,分别预测所述预设文本中每个文字的目标声、目标韵和目标调,包括:将所述第一向量输入声全连接层,得到所述每个文字的所述目标声;将所述第一向量输入韵全连接层,得到所述每个文字的所述目标韵;以及将所述第一向量输入调全连接层,得到所述每个文字的所述目标调。6.根据权利要求5所述的方法,其特征在于,所述根据所述预设文本的读音对所述第一音频进行评分,得到评分结果,包括:获取所述第一音频中所述每个文字的发音识别结果;将所述每个文字的发音识别结果分别与所述预设文本中所述每个文字的读音进行匹配,得到匹配结果;根据所述匹配结果确定所述评分结果。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若第一文字的所述发音识别结果的第一部位与所述第一文字的所述预设文本的读音的第一部位不匹配时,标注所述第一文字和所述第一部位,所述第一部位包括声、韵、调中的至少一项,所述第一文字为所述预设文本中的任一文字;
显示所述第一文字和所述第一部位。8.一种音频测评装置,其特征在于,所述装置包括:获取单元,用于获取第一音频和第二音频,所述第一音频为待测评音频,所述第二音频为所述第一音频的标准音频,所述第一音频和所述第二音频均对应预设文本;确定单元,用于根据所述第一音频和所述第二音频,确定音频关联矩阵;预测单元,用于根据所述音频关联矩阵预测所述预设文本的读音;评分单元,用于根据所述预设文本的读音对所述第一音频进行评分,得到评分结果。9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1

7任一项所述的方法中的步骤的指令。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理执行如权利要求1

7任一项所述的方法中的步骤的指令。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜