一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音控制方法、装置、电子设备及存储介质与流程

2021-09-25 02:51:00 来源:中国专利 TAG:电子设备 语音 装置 语音识别 控制

技术特征:
1.一种语音控制方法,其特征在于,包括以下步骤:获取已知唤醒词的音节;确定与所述唤醒词对应的非唤醒词的音节;根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络,以根据所述唤醒词解码网络对输入的语音进行解码,并根据解码结果确定是否执行唤醒操作。2.根据权利要求1所述的方法,其特征在于,所述确定与所述唤醒词对应的非唤醒词的音节,包括:按照预设的拼读方法,将唤醒词的音节分为多个音节组成;确定与唤醒词的音节组成对应的非唤醒词的音节组成,其中,所述非唤醒词的音节组成为不是唤醒词的当前音节组成且属于当前音节组成所属类型的所有音节组成的集合;按照唤醒词的音节的拼合顺序,将所述非唤醒词的音节组成拼合为非唤醒词的音节。3.根据权利要求2所述的方法,其特征在于,所述音节组成所属类型包括声母和韵母,所述确定与唤醒词的音节组成对应的非唤醒词的音节组成,包括:对于唤醒词的音节中的声母,确定不是当前声母的所有声母的集合作为与所述唤醒词对应的非唤醒词的音节组成;对于唤醒词的音节中的韵母,确定不是当前韵母的所有韵母的集合作为与所述唤醒词对应的非唤醒词的音节组成,其中,所述韵母上标注声调。4.根据权利要求1所述的方法,其特征在于,所述根据所述唤醒词解码网络对输入的语音进行解码,包括:将输入的语音输入预先训练的语音唤醒模型,得到所述语音的音素后验概率;利用所述唤醒词解码网络对所述语音的音素后验概率进行解码,得到所述语音的解码得分;根据所述解码得分确定是否执行唤醒动作。5.根据权利要求4所述的方法,其特征在于,所述根据所述解码得分确定是否执行唤醒动作,包括:利用预先构建的分别用于测试唤醒率和误唤醒率的唤醒数据集确定唤醒得分阈值;判断所述解码得分是否在所述唤醒得分阈值内:当所述解码得分在所述唤醒得分阈值内时,执行唤醒动作。6.根据权利要求4所述的方法,其特征在于,所述语音唤醒模型通过以下步骤构建得到:对已知的带噪带混响的唤醒词语音以及带有文本标注的通用语音进行强制对齐,得到帧级别的对齐标签;以包括当前帧的多帧数据拼接而成的语音为输入,以当前帧的对齐标签为输出训练神经网络模型,训练得到语音唤醒模型。7.根据权利要求6所述的方法,其特征在于,所述包括当前帧的多帧数据为以当前帧为中心间隔采样得到的固定数量的多帧数据。8.一种语音控制装置,其特征在于,包括:获取模块,其用于获取已知唤醒词的音节;
确定模块,其用于确定与所述唤醒词对应的非唤醒词的音节;构建模块,其用于根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络;唤醒模块,其用于根据所述唤醒词解码网络对输入的语音进行解码,并根据解码结果确定是否执行唤醒操作。9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1

7任一项所述的语音控制方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1

7任一项所述的语音控制方法的步骤。

技术总结
本申请涉及一种语音控制方法、装置、电子设备及存储介质,所述语音控制方法,包括以下步骤:获取已知唤醒词的音节;确定与所述唤醒词对应的非唤醒词的音节;根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络,以根据所述唤醒词解码网络对输入的语音进行解码,并根据解码结果确定是否执行唤醒操作,本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词,能够降低非唤醒词引起的误唤醒率。唤醒词引起的误唤醒率。唤醒词引起的误唤醒率。


技术研发人员:聂帅 陶建华 梁山 易江燕 傅睿博
受保护的技术使用者:中国科学院自动化研究所
技术研发日:2021.08.27
技术公布日:2021/9/24
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜