一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

认知检测方法及相关装置、电子设备和存储介质与流程

2022-07-23 11:01:54 来源:中国专利 TAG:

技术特征:
1.一种认知检测方法,其特征在于,包括:基于目标声学模型对目标对象的待测语音进行识别,得到所述待测语音的音素序列;其中,所述目标声学模型隐层所输出的特征表示基于所述目标对象的权重参数加权得到,且所述目标对象的权重参数基于预先对所述目标对象采集到的样本目标语音训练得到;基于所述音素序列进行解码,得到所述待测语音的识别文本;基于所述识别文本进行认知检测,得到所述目标对象的认知检测结果;其中,所述认知检测结果包括所述目标对象是否存在认知障碍。2.根据权利要求1所述的方法,其特征在于,所述目标声学模型在预先训练的参考声学模型中添加所述目标对象的权重参数得到,所述参考声学模型依次基于以下样本语音训练得到:第一样本对象的样本第一语音、第二样本对象的样本第二语音、第三样本对象的样本第三语音;其中,所述第二样本对象与所述目标对象具有相同对象属性且不存在认知障碍,所述第三样本对象与所述目标对象具有相同对象属性且存在认知障碍,且所述第一样本对象与所述第二样本对象、所述第三样本对象均不同。3.根据权利要求2所述的方法,其特征在于,所述样本目标语音标注有样本音素序列;所述权重参数的训练步骤包括:基于预先训练的参考声学模型对所述样本目标语音进行音素识别,得到第一预测序列;其中,预先训练的参考声学模型隐层所输出的第一样本特征基于所述权重参数加权得到,且所述第一预测序列基于所述第一样本特征预测得到;基于所述样本目标语音标注的样本音素序列与所述第一预测序列之间的差异,维持预先训练的参考声学模型的网络参数,并调整所述权重参数。4.根据权利要求2所述的方法,其特征在于,所述参考声学模型的训练步骤包括:基于所述样本第一语音训练所述参考声学模型;基于所述样本第二语音训练经所述样本第一语音训练收敛的参考声学模型;基于样本集合语音训练经所述样本第二语音训练收敛的参考声学模型;其中,所述样本集合语音来自样本集合,且所述样本集合由所述样本第二语音和所述样本第三语音合并得到。5.根据权利要求4所述的方法,其特征在于,所述样本集合语音标注有样本音素序列和所述样本集合语音所属的样本发言对象;所述基于样本集合语音训练经所述样本第二语音训练收敛的参考声学模型,包括:基于经所述样本第二语音训练收敛的参考声学模型对所述样本集合语音进行音素识别,得到第二预测序列;其中,所述第二预测序列基于第二样本特征预测得到,且所述第二样本特征为经所述样本第二语音训练收敛的参考声学模型隐层所输出的特征表示;基于所述第二样本特征进行对象预测,得到预测发言对象;基于所述样本集合语音所标注的样本音素序列与所述第二预测序列之间的第一差异,以及所述样本发言对象与所述预测发言对象之间的第二差异,得到总损失;其中,所述总损失与所述第一差异正相关,所述总损失与所述第二差异负相关;基于所述总损失,调整所述参考声学模型的网络参数。6.根据权利要求1所述的方法,其特征在于,在所述基于所述音素序列进行解码,得到
所述待测语音的识别文本之前,所述方法还包括:获取用户在若干解码策略中选择的目标解码策略;其中,所述若干解码策略包括一遍解码和二遍解码;所述基于所述音素序列进行解码,得到所述待测语音的识别文本,包括:基于所述目标解码策略对所述音素序列进行解码,得到所述识别文本;其中,在所述目标解码策略为所述一遍解码的情况下,基于n-gram语言模型对所述音素序列进行一遍解码,得到所述一遍解码的识别文本作为所述待测语音的识别文本,在所述目标解码策略为所述二遍解码的情况下,基于预训练语言模型对所述音素序列和所述一遍解码的识别文本进行二遍解码,得到所述二遍解码的识别文本作为所述待测语音的识别文本,且所述预训练语言模型为神经网络模型。7.根据权利要求6所述的方法,其特征在于,所述预训练语言模型依次基于以下样本文本训练得到:第一样本对象的样本第一文本、第二样本对象的样本第二文本、第三样本对象的样本第三文本;其中,所述第二样本对象与所述目标对象具有相同对象属性且不存在认知障碍,所述第三样本对象与所述目标对象具有相同对象属性且存在认知障碍,且所述第一样本对象与所述第二样本对象、所述第三样本对象均不同。8.根据权利要求6所述的方法,其特征在于,所述n-gram语言模型包括第一n-gram语言模型和第二n-gram语言模型,所述第一n-gram语言模型基于第一样本对象的样本第一文本建立得到,所述第二n-gram语言模型基于第二样本对象的样本第二文本、第三样本对象的样本第三文本中至少一者建立得到,且所述一遍解码的识别文本基于第一n-gram语言模型对所述音素序列的解码结果和所述第二n-gram语言模型对所述音素序列的解码结果加权得到;其中,所述第二样本对象与所述目标对象具有相同对象属性且不存在认知障碍,所述第三样本对象与所述目标对象具有相同对象属性且存在认知障碍,且所述第一样本对象与所述第二样本对象、所述第三样本对象均不同。9.根据权利要求1所述的方法,其特征在于,所述基于所述识别文本进行认知检测,得到所述目标对象的认知检测结果,包括:基于所述目标声学模型隐层所输出的特征表示,得到声学特征表示,并基于所述识别文本进行特征提取,得到语言特征表示;基于所述声学特征表示和所述语言特征表示进行认知检测,得到所述认知检测结果。10.根据权利要求9所述的方法,其特征在于,所述基于所述目标声学模型隐层所输出的特征表示,得到声学特征表示,包括:将所述目标声学模型隐层所输出的特征表示,作为第一声学特征,以及基于所述待测语音与参考语音在若干语音层次上关于声学参数的特征差异,得到第二声学特征;其中,所述若干语音层次包括以下至少一者:音帧层次、音节层次、短语层次、句子层次,且所述参考语音包括对与所述目标对象具有相同对象属性且不存在认知障碍的样本对象采集到的样本语音;基于所述第一声学特征和所述第二声学特征进行融合,得到所述声学特征表示。11.根据权利要求9所述的方法,其特征在于,所述基于所述识别文本进行特征提取,得
到语言特征表示,包括:基于所述识别文本提取文本特征,得到第一语言特征,并基于所述识别文本中各个分词的词典特征和注释特征,得到第二语言特征;其中,所述词典特征基于病理词典知识库得到,所述注释特征基于注意力约束机制的递归神经网络和长短期记忆网络得到;基于所述第一语言特征和所述第二语言特征进行融合,得到所述语言特征表示。12.根据权利要求11所述的方法,其特征在于,所述基于所述识别文本中各个分词的词典特征和注释特征,得到第二语言特征,包括:对于所述各个分词,基于所述分词的词典特征和注释特征进行拼接,得到所述分词的拼接特征;基于所述各个分词的拼接特征进行注意力处理,得到所述第二语言特征。13.一种认知检测装置,其特征在于,包括:识别模块,用于基于目标声学模型对目标对象的待测语音进行识别,得到所述待测语音的音素序列;其中,所述目标声学模型隐层所输出的特征表示基于所述目标对象的权重参数加权得到,且所述目标对象的权重参数基于预先对所述目标对象采集到的样本目标语音训练得到;解码模块,用于基于所述音素序列进行解码,得到所述待测语音的识别文本;检测模块,用于基于所述识别文本进行认知检测,得到所述目标对象的认知检测结果;其中,所述认知检测结果包括所述目标对象是否存在认知障碍。14.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至12任一项所述的认知检测方法。15.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至12任一项所述的认知检测方法。

技术总结
本申请公开了一种认知检测方法及相关装置、电子设备和存储介质,其中,认知检测方法包括:基于目标声学模型对目标对象的待测语音进行识别,得到待测语音的音素序列;其中,目标声学模型隐层所输出的特征表示基于目标对象的权重参数加权得到,且目标对象的权重参数基于预先对目标对象采集到的样本目标语音训练得到;并基于音素序列进行解码,得到待测语音的识别文本;再基于识别文本进行认知检测,得到目标对象的认知检测结果;其中,认知检测结果包括目标对象是否存在认知障碍。上述方案,能够在降低检测成本的同时提高认知检测的准确率。率。率。


技术研发人员:徐飞扬 杨琴 梁华东 李鑫 凌震华
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2022.04.27
技术公布日:2022/7/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献