一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音端点检测数据的标注方法、装置、设备和介质与流程

2022-09-01 10:58:42 来源:中国专利 TAG:

技术特征:
1.一种语音端点检测数据的标注方法,其特征在于,所述方法包括:获取语音数据,根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件;根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件;将所述标注合格文件输入至标注工具进行校验,得到校验完成文件;将所述校验完成文件进行拆分,得到语音端点检测数据标注文件。2.根据权利要求1所述的方法,其特征在于,所述获取语音数据,包括:获取音频数据,在所述音频数据中筛选得到包含预设语音场景的至少一个目标音频数据;将所述至少一个目标音频数据中静音时长超过预设静音时长和/或信噪比超过预设信噪比阈值的音频数据筛除,得到筛除后目标音频数据;将所述筛除后目标音频数据中语音时长小于预设时长阈值的音频数据筛除,得到所述语音数据。3.根据权利要求1所述的方法,其特征在于,所述根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件,包括:根据所述预设参数,确定所述脚本工具的语音指标,所述语音指标包括语音强度和静音段检测参数中至少一种;根据所述语音指标,获取所述语音数据中的语音、所述语音的时间戳、非语音和所述非语音的时间戳;根据所述语音的时间戳和非语音的时间戳,获取所述初始标注文件。4.根据权利要求1所述的方法,其特征在于,所述根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件,包括:确定所述初始标注文件是否符合预设标注格式;若所述初始标注文件符合预设标注格式,则检测所述初始标注文件的前端和末端是否为静音段;若所述初始标注文件的前端和末端为静音段,则检测所述初始标注文件中语音时长和静音时长的比率是否大于预设比率;若所述初始标注文件中语音时长和静音时长的比率大于预设比率,则确定所述初始标注文件为所述标注合格文件。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述初始标注文件不符合所述预设标注格式或前端和末端为非静音段或语音时长和静音时长的比率小于或等于所述预设比率,则确定所述初始标注文件为标注不合格文件;根据所述标注不合格文件,对语音指标的值进行调整更新。6.根据权利要求1所述的方法,其特征在于,所述将所述标注合格文件输入至标注工具进行校验,得到校验完成文件,包括:将所述语音数据输入至标注工具,获取语谱波形图和频谱图的音强、音高、共振峰曲线;根据所述语谱波形图和频谱图的音强、音高、共振峰曲线,确定所述语音数据的语音边
界和非语音边界;根据所述语音数据的语音边界和非语音边界,对所述标注合格文件进行校验,得到检验完成文件。7.根据权利要求1所述的方法,其特征在于,所述将所述校验完成文件进行拆分,得到语音端点检测数据标注文件,包括:获取所述校验完成文件中的语音段和非语音段;根据预设时间间隔,对所述语音段和非语音段进行切分得到所述语音端点检测数据标注文件。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:获取所述校验完成文件的总语音帧数;确定所述校验完成文件的总语音帧数是否与目标帧数相同,所述目标帧数为所述语音端点检测数据标注文件的语音帧数;若所述总语音帧数与所述目标帧数不同,则获取所述总语音帧数与所述目标帧数的差值;将所述校验完成文件末端的语音帧复制添加差值数量份,添加至所述校验完成文件的末端。9.一种语音端点检测数据的标注装置,其特征在于,包括:自动标注模块,用于获取语音数据,根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件;标注筛查模块,用于根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件;标注校验模块,用于将所述标注合格文件输入至标注工具进行校验,得到校验完成文件;文件生成模块,用于将所述校验完成文件进行拆分,得到语音端点检测数据标注文件。10.一种计算机设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-8中任一项所述的方法。11.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如权利要求1-8中任一项所述的方法。12.一种程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-8中任一项所述的方法。

技术总结
本申请提供一种语音端点检测数据的标注方法、装置、设备和介质,涉及智能客服技术领域,该方法包括:获取语音数据,根据预设参数和脚本工具对语音数据进行自动标注,得到初始标注文件,根据预设筛查准则,在初始标注文件中筛查得到标注合格文件,将标注合格文件输入至标注工具进行校验,得到校验完成文件,将校验完成文件进行拆分,得到语音端点检测数据标注文件。该技术方案中,通过脚本工具和参数对语音进行初步标注。然后用标注筛查模块对标注质量进行筛查,对标注筛查合格之后的标注进行校验完成后,进行标注数据帧级别标注结果转换。不需要人工边听音频边进行人工手动标注,提升了标注的效率和质量。了标注的效率和质量。了标注的效率和质量。


技术研发人员:王丽萍 杨辰雨 杨凯
受保护的技术使用者:建信金融科技有限责任公司
技术研发日:2022.05.18
技术公布日:2022/8/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献