一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据标注方法、装置、设备及可读存储介质与流程

2021-09-22 22:33:00 来源:中国专利 TAG:标注 装置 可读 特别 计算机

技术特征:
1.一种数据标注方法,其特征在于,包括:获取音频数据,以及所述音频数据对应的文本数据;确定所述音频数据对应的音频波形图和基频线图;基于所述音频波形图确定所述音频数据中的静音片段,基于所述基频线图确定所述音频数据中的音高重置片段;将所述静音片段在所述文本数据中对应的文本标注为语调短语,将所述音高重置片段在所述文本数据中对应的文本标注为韵律短语。2.根据权利要求1所述的方法,其特征在于,所述确定所述音频数据对应的音频波形图和基频线图,包括:将所述音频数据输入语音分析工具,以输出所述音频波形图和所述基频线图。3.根据权利要求1所述的方法,其特征在于,所述基于所述音频波形图确定所述音频数据中的静音片段,基于所述基频线图确定所述音频数据中的音高重置片段,包括:利用图像识别技术识别所述音频波形图中的静音区域,以及所述基频线图中的线中断区域;将所述静音区域在所述音频数据中对应的音频段确定为所述静音片段,将所述线中断区域在所述音频数据中对应的音频段确定为所述音高重置片段。4.根据权利要求3所述的方法,其特征在于,所述图像识别技术包括用于图像识别的机器学习模型、算法或图像库。5.根据权利要求1所述的方法,其特征在于,还包括:基于表示句尾位置的标点符号在所述文本数据中标注话段。6.根据权利要求5所述的方法,其特征在于,还包括:若所述文本数据中的任意文本段不属于所述语调短语、所述韵律短语或所述话段,则利用词典库标注所述文本段为韵律词。7.根据权利要求6所述的方法,其特征在于,所述语调短语、所述韵律短语和所述韵律词分别设有允许标注的最大连续字数。8.一种数据标注装置,其特征在于,包括:获取模块,用于获取音频数据,以及所述音频数据对应的文本数据;第一确定模块,用于确定所述音频数据对应的音频波形图和基频线图;第二确定模块,用于基于所述音频波形图确定所述音频数据中的静音片段,基于所述基频线图确定所述音频数据中的音高重置片段;标注模块,用于将所述静音片段在所述文本数据中对应的文本标注为语调短语,将所述音高重置片段在所述文本数据中对应的文本标注为韵律短语。9.一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的方法。10.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。

技术总结
本申请公开了一种数据标注方法、装置、设备及可读存储介质。本申请在获取到相互对应的音频数据和文本数据后,将音频数据用音频波形图和基频线图表示,然后识别音频数据中的静音片段和音高重置片段;最后将静音片段在文本数据中对应的文本标注为语调短语,将音高重置片段在文本数据中对应的文本标注为韵律短语,从而标注出了文本中的自然语感和韵律,据此训练TTS模型,可以使TTS模型学习人说话时的自然语感和韵律,避免TTS模型输出的语音机械感较重。相应地,本申请提供的一种数据标注装置、设备及可读存储介质,也同样具有上述技术效果。也同样具有上述技术效果。也同样具有上述技术效果。


技术研发人员:陈百灵 刘云峰 汶林丁
受保护的技术使用者:深圳追一科技有限公司
技术研发日:2021.06.30
技术公布日:2021/9/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜