一种语音唤醒方法、装置及设备与流程

2021-08-31 17:44:00 来源：中国专利 TAG：唤醒语音装置计算机方法

技术特征：

1.一种语音唤醒方法，其特征在于，所述方法包括：

获取待处理语音信号；

从所述待处理语音信号中获取待处理语音特征，并对所述待处理语音特征进行编码获得声学编码表示；

根据各所述声学编码表示以及所述声学编码表示对应的权重进行整合以获得文字序列；

根据所述文字序列以及关键词确定是否对设备进行唤醒，所述关键词用于唤醒设备。

2.根据权利要求1所述的方法，其特征在于，所述根据所述文字序列以及关键词确定是否进行唤醒，包括：

以所述关键词的长度在所述文字序列所形成的解码图上进行滑窗，确定每次滑窗内出现所述关键词的置信度；

在第i次滑窗内出现所述关键词的置信度大于预设置信度阈值时，对所述设备进行唤醒，所述i为大于等于1且小于n的正整数，所述n为滑动次数。

3.根据权利要求2所述的方法，其特征在于，所述以所述关键词的长度在所述文字序列所形成的解码图上进行滑窗，确定每次滑窗内出现所述关键词的置信度，包括：

针对任一次滑窗操作，获取滑窗内各个文字对应的后验概率，将所述各个文字对应的后验概率相乘获得每次滑窗内出现所述关键词的置信度。

4.根据权利要求2或3或所述的方法，其特征在于，所述n＝m-l 1，其中，m为所述文字序列的长度，l为所述关键词的长度，所述m和l均为大于等于1的正整数。

5.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

利用解码器对所述文字序列进行解码获得解码图，所述解码图的长度为文字序列的长度。

6.根据权利要求4所述的方法，其特征在于，所述解码器为非自回归的解码器。

7.根据权利要求5所述的方法，其特征在于，所述解码图为m*k的矩阵，所述k为词表的长度。

8.根据权利要求1所述的方法，其特征在于，所述根据各所述声学编码表示以及所述声学编码表示对应的权重进行整合以获得文字序列，包括：

根据各所述声学编码表示以及所述声学编码表示对应的权重进行整合获得目标声学编码表示，所述声学编码表示对应的权重在变化；

在所述声学编码表示对应的权重满足预设条件时，根据所述目标声学编码表示获得所述待处理语音信号所包括的文字序列。

9.一种语音唤醒装置，其特征在于，所述装置包括：

第一获取单元，用于获取待处理语音信号；

第二获取单元，用于从所述待处理语音信号中获取待处理语音特征，并对所述待处理语音特征进行编码获得声学编码表示；

第三获取单元，用于根据各所述声学编码表示以及所述声学编码表示对应的权重进行整合以获得文字序列；

判断单元，用于根据所述文字序列以及关键词确定是否对设备进行唤醒，所述关键词用于唤醒设备。

10.一种电子设备，所述设备包括：处理器和存储器；

所述存储器，用于存储指令或计算机程序；

所述处理器，用于执行所述存储器中的所述指令或计算机程序，以使得所述电子设备执行权利要求1-8任一项所述的方法。

11.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行权利要求1-8任一项所述的方法。

技术总结
本申请实施例公开了一种语音唤醒方法、装置及设备。对于获取的待处理语音信号，从该待处理语音信号中获取待处理语音特征，并对该待处理语音特征进行编码获得声学编码表示。在获取到待处理语音信号对应的声学编码表示后，根据各声学编码表示以及声学编码表示对应的权重进行整合，进而根据整合后的声学编码表示获取待处理语音信号所包括的文字序列。在获取到文字序列后，根据文字序列以及关键词确定是否对设备进行唤醒。也就是，本申请实施例从待处理语音信号中获取可能存在的文字，进而基于字级别判断是否唤醒，不再是基于语音帧进行判断，提高唤醒效率。

技术研发人员：梁镇麟;董林昊;蔡猛;马泽君
受保护的技术使用者：北京有竹居网络技术有限公司
技术研发日：2021.06.30
技术公布日：2021.08.31

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：语音合成方法、装置、可读介质及电子设备与流程
下一篇：一种基于字典学习的无监督异常声检测方法和装置与流程

一种语音唤醒方法、装置及设备与流程

相关文章

最热文献