一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

音频处理方法、装置、设备及可读存储介质与流程

2021-06-25 16:42:00 来源:中国专利 TAG:音频处理 装置 可读 方法 设备

技术特征:
1.一种音频处理方法,其特征在于,所述音频处理方法包括以下步骤:获取待处理音频,并将所述待处理音频转换为目标文本;对所述目标文本进行特征提取,以获得所述目标文本对应的文本特征数据;通过预设手语手势转换模型获取所述文本特征数据对应的目标手语手势图像,并显示所述目标手语手势图像。2.如权利要求1所述的音频处理方法,其特征在于,所述将所述待处理音频转换为目标文本的步骤包括:对所述待处理音频进行人声提取,以获得待处理音频中的目标人声音频;对所述目标人声音频进行语义识别,以获得目标文本。3.如权利要求2所述的音频处理方法,其特征在于,所述对所述待处理音频进行人声提取,以获得待处理音频中的目标人声音频的步骤包括:获取所述待处理音频的音频特征;将所述音频特征输入至预设音频分离模型,以通过所述预设音频分离模型获取所述音频特征对应的音频特征分离结果,其中,所述音频特征分离结果包括目标人声音频特征;基于所述目标人声音频特征获取待处理音频中的目标人声音频。4.如权利要求1所述的音频处理方法,其特征在于,所述通过预设手语手势转换模型获取所述文本特征数据对应的手语手势图像的步骤之前,还包括:获取初始模型及若干个文本训练数据;通过所述初始模型确定所述文本训练数据对应的手语手势预测结果;获取所述文本训练数据对应的手语手势真实结果,并基于所述手语手势预测结果和所述手语手势真实结果确定损失函数;通过梯度下降的方式更新所述初始模型的模型参数,并将所述损失函数收敛或模型训练轮次达到预设训练迭代轮次时对应的模型参数作为最终模型参数;根据所述最终模型参数确定预设手语手势转换模型。5.如权利要求1所述的音频处理方法,其特征在于,所述将所述待处理音频转换为目标文本的步骤之后,还包括:对所述目标文本进行分词处理,以获得所述目标文本对应的多组文本分词;分别对各组所述文本分词进行语义识别,以获得各组所述文本分词对应的语义识别结果;基于所述语义识别结果遍历预设手语手势文本词库,以获得预设手语手势文本词库中与所述语义识别结果匹配的目标手语手势文本;基于所述目标手语手势文本获取所述多组文本分词对应的多帧手语手势图像,并显示所述多帧手语手势图像。6.如权利要求5所述的音频处理方法,其特征在于,所述显示所述多帧手语手势图像的步骤包括:确定各帧所述手语手势图像对应的各组文本分词在所述目标文本中的位置信息;基于所述位置信息对所述多帧手语手势图像进行排序,以获得排序结果;根据所述排序结果将所述多帧手语手势图像转化为目标手语手势图像,并将显示所述目标手语手势图像。
7.如权利要求1至6任一项所述的音频处理方法,其特征在于,所述将显示所述目标手语手势图像的步骤包括:确定所述待处理音频的音频帧时间戳;基于所述音频帧时间戳确定所述目标手语手势图像的图像帧时间戳,以基于所述图像帧时间戳显示所述目标手语手势图像。8.一种音频处理装置,其特征在于,所述音频处理装置包括:获取模块,用于获取待处理音频,并将所述待处理音频转换为目标文本;提取模块,用于对所述目标文本进行特征提取,以获得所述目标文本对应的文本特征数据;输出模块,用于通过预设手语手势转换模型获取所述文本特征数据对应的目标手语手势图像,并显示所述目标手语手势图像。9.一种音频处理设备,其特征在于,所述音频处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的音频处理程序,所述音频处理程序被所述处理器执行时实现如权利要求1

7中任一项所述的音频处理方法的步骤。10.一种可读存储介质,其特征在于,所述可读存储介质上存储有音频处理程序,所述音频处理程序被处理器执行时实现如权利要求1

7中任一项所述的音频处理方法的步骤。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜