一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于语音识别的文本处理方法、装置、电子设备及介质与流程

2021-06-29 22:10:00 来源:中国专利 TAG:自然语言 电子设备 介质 装置 文本

技术特征:
1.一种基于语音识别的文本处理方法,其特征在于,所述方法包括:将语音识别获取的初始文本序列切分为至少两个切分对象;其中所述切分对象包括单词或单字;确定所述至少两个切分对象中相邻两个切分对象之间的静音时长;依据各个相邻两个切分对象之间的静音时长,在至少两个切分对象中添加匹配的标点符号,得到带标点符号的目标文本序列。2.根据权利要求1所述的方法,其特征在于,确定所述至少两个切分对象中相邻两个切分对象之间的静音时长,包括:将所述至少两个切分对象中各个切分对象,顺序重组为相邻两个切分对象间存在候选静音片段识别的目标文本对齐语法;所述目标文本对齐语法指示的切分对象中头部切分对象前面与尾部切分对象后面分别添加必选静音片段识别;通过对目标文本对齐语法进行语法强制对齐,得到相邻两个切分对象之间的静音时长。3.根据权利要求2所述的方法,其特征在于,通过对目标文本对齐语法进行语法强制对齐,得到相邻两个切分对象之间的静音时长,包括:将所述目标文本对齐语法编译为基于语法的语法识别网络;解码器利用初始文本序列的原始语音,对基于语法的语法识别网络进行语法强制对齐解码得到所有候选静音片段的时间信息,并作为相邻两个切分对象之间的静音时长。4.根据权利要求1所述的方法,其特征在于,依据各个相邻两个切分对象之间的静音时长,在至少两个切分对象中添加匹配的标点符号,包括:依据各个相邻两个切分对象之间的静音时长,确定一当前静音时长平均值;依据相邻两个切分对象之间的静音时长和当前的静音时长阈值取值范围,确定在相邻两个切分对象之间添加匹配的标点符号;其中所述当前的静音时长阈值取值范围基于当前静音时长平均值与标点符号关联的放大系数确定。5.一种基于语音识别的文本处理装置,其特征在于,所述装置包括:文本切分模块,用于将语音识别获取的初始文本序列切分为至少两个切分对象;其中所述切分对象包括单词或单字;静音识别模块,用于确定所述至少两个切分对象中相邻两个切分对象之间的静音时长;标点添加模块,用于依据各个相邻两个切分对象之间的静音时长,在至少两个切分对象中添加匹配的标点符号,得到带标点符号的目标文本序列。6.根据权利要求5所述的装置,其特征在于,静音识别模块包括:文本对齐语法生成单元,用于将所述至少两个切分对象中各个切分对象,顺序重组为相邻两个切分对象间存在候选静音片段识别的目标文本对齐语法;所述目标文本对齐语法指示的切分对象中头部切分对象前面与尾部切分对象后面分别添加必选静音片段识别;静音时长识别单元,用于通过对目标文本对齐语法进行语法强制对齐,得到相邻两个切分对象之间的静音时长。7.根据权利要求6所述的装置,其特征在于,静音时长识别单元包括:将所述目标文本对齐语法编译为基于语法的语法识别网络;
解码器利用初始文本序列的原始语音,对基于语法的语法识别网络进行语法强制对齐解码得到所有候选静音片段的时间信息,并作为相邻两个切分对象之间的静音时长。8.根据权利要求5所述的装置,其特征在于,标点添加模块包括:依据各个相邻两个切分对象之间的静音时长,确定一当前静音时长平均值;依据相邻两个切分对象之间的静音时长和当前的静音时长阈值取值范围,确定在相邻两个切分对象之间添加匹配的标点符号;其中所述当前的静音时长阈值取值范围基于当前静音时长平均值与标点符号关联的放大系数确定。9.一种电子设备,其特征在于,包括:一个或多个处理装置;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现权利要求1

4中任一所述的基于语音识别的文本处理方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1

4中任一所述的基于语音识别的文本处理方法。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜