技术特征:
1.一种语音标注方法,其特征在于,所述方法包括:获取目标语音;基于第一声学模型对所述目标语音进行分析,得到所述目标语音对应的第一标注数据,其中,所述第一标注数据记录有所述第一声学模型对所述目标语音的第一标注结果;基于第二声学模型对所述目标语音进行分析,得到所述目标语音对应的第二标注数据,其中,所述第二标注数据记录有所述第二声学模型对所述目标语音的第二标注结果;根据所述目标语音对应的第一标注数据和第二标注数据确定出所述目标语音对应的最终标注数据,以完成对所述目标语音的标注,其中,所述最终标注数据记录有所述目标语音的最终标注结果。2.根据权利要求1所述的语音标注方法,其特征在于,所述第一声学模型为gmm
‑
hmm声学模型,所述第二声学模型为dnn声学模型。3.根据权利要求2所述的语音标注方法,其特征在于,所述dnn声学模型建立在从所述gmm
‑
hmm模型获得的对齐基础之上,采用时滞神经网络对语音信号进行建模。4.根据权利要求2所述的语音标注方法,其特征在于,所述dnn声学模型包括一个输入层、六个个隐藏层和一个输出层;所述输入层具有3500个神经元,并且一次处理九帧语音信号;每个所述隐藏层具有1200个神经元;所述输出层具有1200个神经元。5.根据权利要求2所述的语音标注方法,其特征在于,所述dnn声学模型模型训练总共经5代,初始学习率为0.015,终止学习率为0.00015。6.根据权利要求1
‑
5任一项所述的语音标注方法,其特征在于,所述获取目标语音,包括:获取原始的长语音;将所述长语音输入至基于pca分析方法的语音活动监测器进行分析,以将所述长语音自动切分成多个语音片段作为目标语音。7.根据权利要求1
‑
5任一项所述的语音标注方法,其特征在于,所述根据所述目标语音对应的第一标注数据和第二标注数据确定出所述目标语音对应的最终标注数据,包括:判断所述目标语音对应的第一标注数据和第二标注数据中是否存在相同的标注数据;当判断出所述目标语音对应的第一标注数据和第二标注数据中存在相同的标注数据时,将相同的标注数据作为所述目标语音对应的最终标注数据。8.一种语音标注装置,其特征在于,所述装置包括:获取模块,用于获取目标语音;第一标注模块,用于基于第一声学模型对所述目标语音进行分析,得到所述目标语音对应的第一标注数据,其中,所述第一标注数据记录有所述第一声学模型对所述目标语音的第一标注结果;第二标注模块,用于基于第二声学模型对所述目标语音进行分析,得到所述目标语音对应的第二标注数据,其中,所述第二标注数据记录有所述第二声学模型对所述目标语音的第二标注结果;最终标注模块,用于根据所述目标语音对应的第一标注数据和第二标注数据确定出所
述目标语音对应的最终标注数据,以完成对所述目标语音的标注,其中,所述最终标注数据记录有所述目标语音的最终标注结果。9.一种计算机设备,其特征在于,所述计算机设备包括:存储有可执行程序代码的存储器;与所述存储器连接的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1
‑
7任一项所述的语音标注方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1
‑
7任一项所述的语音标注方法。
技术总结
本发明公开了一种语音标注方法,包括:获取目标语音;基于第一声学模型对所述目标语音进行分析,得到所述目标语音对应的第一标注数据;基于第二声学模型对所述目标语音进行分析,得到所述目标语音对应的第二标注数据;根据所述目标语音对应的第一标注数据和第二标注数据确定出所述目标语音对应的最终标注数据,以完成对所述目标语音的标注。可见,本发明能够利用不同声学模型之间的互补特性,提高语音标注的标注准确率,还能够避免传统的单个声学模型的标注过程中复杂的实验操作,提高语音标注的标注效率。本发明还涉及区块链技术领域。域。域。
技术研发人员:苏雪琦 王健宗
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2021.06.30
技术公布日:2021/9/21
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。