技术特征:
1.一种识别方法,包括:
获取语音识别系统识别出的待处理文本中每个词的词特征;
将所述词特征输入到标点预测模型,获得所述标点预测模型得到的所述词特征的第一上下文信息;
将所述词特征输入到语音识别纠错模型,获得所述语音识别纠错模型得到的所述词特征的第二上下文信息,所述语音识别纠错模型为利用训练数据训练得到的,所述训练数据包含对训练文本进行纠错的数据及所述标点预测模型基于所述训练样本,得到的上下文信息;
基于所述词特征的第一上下文信息和第二上下文信息,确定所述词特征的第三上下文信息;
将所述词特征以及所述词特征的第三上下文信息输入到所述语音识别纠错模型,获得所述语音识别纠错模型对所述待处理文本进行纠错处理后得到的文本。
2.根据权利要求1所述的方法,所述基于所述词特征的第一上下文信息和第二上下文信息,确定所述词特征的第三上下文信息,包括:
对所述词特征的第一上下文信息和第二上下文信息进行拼接处理,得到第三上下文信息。
3.根据权利要求1所述的方法,所述基于所述词特征的第一上下文信息和第二上下文信息,得到所述词特征的第三上下文信息,包括:
对所述词特征的第一上下文信息和第二上下文信息进行点积运算处理,得到第三上下文信息。
4.根据权利要求1所述的方法,所述基于所述词特征的第一上下文信息和第二上下文信息,得到所述词特征的第三上下文信息,包括:
将所述词特征的第一上下文信息和第二上下文信息输入到用于进行特征融合的第一机器学习模型中,得到所述第一机器学习模型输出的第三上下文信息。
5.根据权利要求1所述的方法,所述标点预测模型包含标点预测子模型和自编码器;
所述将所述词特征输入到标点预测模型,获得所述标点预测模型得到的所述词特征的第一上下文信息,包括:
将所述词特征输入到所述自编码器,获得所述自编码器的中间层对待处理词特征的第一子上下文信息进行处理时所使用的参数,所述待处理词特征为所述待处理文本中排列在所述词特征之前的第一个词特征;
基于所述自编码器的中间层对所述待处理词特征的第一子上下文信息进行处理时所使用的参数及所述词特征,得到待使用特征;
将所述待使用特征输入到所述标点预测子模型的中间层,获得所述标点预测子模型的中间层对所述待使用特征进行处理,得到的所述词特征的第一上下文信息。
6.根据权利要求5所述的方法,所述基于所述自编码器的中间层对所述待处理词特征的第一子上下文信息进行处理时所使用的参数及与所述词特征,得到待使用特征,包括:
将所述自编码器的中间层对所述待处理词特征的第一子上下文信息进行处理时所使用的参数与所述词特征进行相乘运算处理,得到待使用特征。
7.根据权利要求5所述的方法,所述基于所述自编码器的中间层对所述待处理词特征的第一子上下文信息进行处理时所使用的参数及与所述词特征,得到待使用特征,包括:
将所述自编码器的中间层对所述待处理词特征的第一子上下文信息进行处理时所使用的参数及所述词特征输入到用于进行特征融合的第二机器学习模型中,得到所述第二机器学习模型输出的待使用特征。
8.一种识别装置,包括:
获取模块,用于获取语音识别系统识别出的待处理文本中每个词的词特征;
第一获得模块,用于将所述词特征输入到标点预测模型,获得所述标点预测模型得到的所述词特征的第一上下文信息;
第二获得模块,用于将所述词特征输入到语音识别纠错模型,获得所述语音识别纠错模型得到的所述词特征的第二上下文信息,所述语音识别纠错模型为利用训练数据训练得到的,所述训练数据包含对训练文本进行纠错的数据及所述标点预测模型基于所述训练样本,得到的上下文信息;
确定模块,用于基于所述词特征的第一上下文信息和第二上下文信息,确定所述词特征的第三上下文信息;
第三获得模块,用于将所述词特征以及所述词特征的第三上下文信息输入到所述语音识别纠错模型,获得所述语音识别纠错模型对所述待处理文本进行纠错处理后得到的文本。
9.一种电子设备,包括:
存储器和处理器;
存储器,用于至少存储一组指令集;
处理器,用于调用并执行所述存储器中的所述指令集,通过执行所述指令集进行以下处理:
获取语音识别系统识别出的待处理文本中每个词的词特征;
将所述词特征输入到标点预测模型,获得所述标点预测模型得到的所述词特征的第一上下文信息;
将所述词特征输入到语音识别纠错模型,获得所述语音识别纠错模型得到的所述词特征的第二上下文信息,所述语音识别纠错模型为利用训练数据训练得到的,所述训练数据包含对训练文本进行纠错的数据及所述标点预测模型基于所述训练样本,得到的上下文信息;
基于所述词特征的第一上下文信息和第二上下文信息,确定所述词特征的第三上下文信息;
将所述词特征以及所述词特征的第三上下文信息输入到所述语音识别纠错模型,获得所述语音识别纠错模型对所述待处理文本进行纠错处理后得到的文本。
10.一种存储介质,存储有实现如权利要求1-7任意一项所述的识别方法的计算机程序,所述计算机程序被处理器执行,实现如权利要求1-7任意一项所述的识别方法的各步骤。
技术总结
本申请提供了一种识别方法、装置、电子设备及存储介质,该方法中利用训练数据训练得到语音识别纠错模型,训练数据包含对训练文本进行纠错的数据及标点预测模型基于训练样本,得到的上下文信息,可以使语音识别纠错模型的训练数据更加丰富,保证语音识别纠错模型能够学习到更丰富的上下文信息,提高语音识别纠错模型的精度。在此基础上,将基于词特征的第一上下文信息和第二上下文信息,确定的词特征以及词特征的第三上下文信息输入到语音识别纠错模型,可以提高语音识别纠错模型纠错的准确率。并且,在对识别结果进行纠错的准确率得到提高的基础上,标点预测模型对准确率更高的识别结果进行标点预测,可以提高标点预测的准确率。
技术研发人员:刘俊帅;夏光敏;王进
受保护的技术使用者:联想(北京)有限公司
技术研发日:2021.03.16
技术公布日:2021.06.22
本文用于企业家、创业者技术爱好者查询,结果仅供参考。