基于遗传算法的智能语音助手唤醒词识别模型加固方法与流程

2022-03-16 04:22:45 来源：中国专利 TAG：

技术特征：
1.一种基于遗传算法的智能语音助手唤醒词识别模型加固方法，其特征在于，包括以下步骤：步骤s10：根据音箱类型，选取音素特征和特征取值范围，之后根据所述音素特征和特征取值范围，选取合适的特征数量并定义不同词语间的不相似度；步骤s20：以遗传算法为基础，设计用于误唤醒率与不相似度两目标同时优化的求解算法；步骤s30：使用树莓派与语音助手连接，部署误唤醒词挖掘平台，通过运行所述求解算法来进行高效误唤醒词挖掘，生成误唤醒样本集；步骤s40：对所述误唤醒样本集进行正确样本标记后，对唤醒词检测模型进行训练；步骤s50：重复进行步骤s20、步骤s30、步骤s40，反复加固所述唤醒词检测模型，直到挖掘误唤醒词数量在可接受范围内。2.如权利要求1所述的方法，其特征在于，所述根据音箱类型，选取音素特征和特征取值范围，包括：对于中文音箱，选取声母、韵母、音调作为音素特征，特征取值范围为汉语中使用的声母韵母以及四个声调；对于英文音箱，选取字母作为音素特征，特征取值范围为阿拉伯字母与占位符“/”。3.如权利要求2所述的方法，其特征在于，对于中文音箱，选取的特征数量为唤醒词汉字个数的3倍，分别对应每个汉字的声母、韵母、声调；对于中文音箱，两个中文单词间的不相似度表示为：其中，表示两个中文单词，c
i
表示对应位置的特征，表示预定义的两特征间的距离。4.如权利要求2所述的方法，其特征在于，对于英文音箱，选取的特征数量为单词字母个数的1.5倍，分别对应于该位置的字母或占位符；对于英文音箱，两个英文单词间的不相似度表示为：其中，表示两个英文单词，c
i
表示单词对应的音素，表示预定义的两音素间的不相似度，d,i,e分别是将单词w1转变为单词w2所需的删除、插入、替换操作集合。5.如权利要求1所述的方法，其特征在于，所述以遗传算法为基础，设计用于误唤醒率与不相似度两目标同时优化的求解算法，包括以下步骤：步骤s21：将唤醒词、与唤醒词接近的词，以及初始化的词作为初始样本，其中，通过计算所述唤醒词的不相似度，选取不相似度小于预设值的特征重新组合得到所述与唤醒词接近的词；
步骤s22：分别评估样本的误唤醒率和不相似度，其中，所述误唤醒率定义为播放样本；步骤s23：依照帕累托支配与拥挤度排序的方式对样本进行选择，得到保留样本；步骤s24：对所述保留样本集合进行变异操作，以得到下一代的样本集合，其中，所述变异操作包括：随机选择集合中的两个样本并随机交换一段特征，或将某个样本的某个特征随机更新为取值范围内的其他特征；步骤s25：重复步骤s22、步骤s23、步骤s24，直到达到算法最大迭代数，生成最终样本集合。6.如权利要求5所述的方法，其特征在于，所述依照帕累托支配与拥挤度排序的方式对样本进行选择，具体为：选择集合中的帕累托前沿作为被保留的样本，选择后在集合中删去被选择保留的样本，继续选择剩余样本的帕雷托前沿，若某次选择帕累托前沿的样本后，将使被选择的样本数超过了预设的保留样本数，则按照拥挤度对该次选择的样本进行降序排序，逐一保留样本直到选择的样本数达到预设的保留样本数。7.如权利要求1所述的方法，其特征在于，所述使用树莓派与语音助手连接，部署误唤醒词挖掘平台，通过运行所述求解算法来进行高效误唤醒词挖掘，生成误唤醒样本集，包括以下步骤：步骤s31：在电脑端运行所述求解算法，生成待测试的样本，通过扬声器向智能音箱播放生成的样本；步骤s32：通过光传感器与智能音箱连接，判断智能音箱的语音助手是否被激活，树莓派将激活结果返回电脑；步骤s33：在预设的算法迭代次数达到后，记录并保存测试过程中样本的不相似度与误唤醒率，保留具有一定误唤醒率的样本作为误唤醒样本集。8.如权利要求1所述的方法，其特征在于，所述对所述误唤醒样本集进行正确样本标记，具体为：将所述误唤醒样本集标记为负类后，在初次训练数据集中随机选取正样本，使得新的数据集中的正负样本比例与原有数据集的正负样本比例一致，采用交叉熵损失函数为目标训练所述唤醒词检测模型，其中，所述交叉熵损失函数表示为：其中，y
i
表示样本是否为正类，p
i
表示样本被预测为正类的概率。9.一种基于遗传算法的智能语音助手唤醒词识别模型加固装置，其特征在于，包括特征预处理模块、算法设计模块、误唤醒词挖掘模块、训练模块、重复模块，其中，所述特征预处理模块，用于根据音箱类型，选取音素特征和特征取值范围，之后根据所述音素特征和特征取值范围，选取合适的特征数量并定义不同词语间的不相似度；所述算法设计模块，用于以遗传算法为基础，设计用于误唤醒率与不相似度两目标同时优化的求解算法；所述误唤醒词挖掘模块，用于使用树莓派与语音助手连接，部署误唤醒词挖掘平台，通过运行所述求解算法来进行高效误唤醒词挖掘，生成误唤醒样本集；
所述训练模块，用于对所述误唤醒样本集进行正确样本标记后，对唤醒词检测模型进行训练；所述重复模块，用于重复调用所述算法设计模块、所述误唤醒词挖掘模块、所述训练模块，反复加固所述唤醒词检测模型，直到挖掘误唤醒词数量在可接受范围内。10.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8中任一所述的方法。

技术总结
本申请提出了一种基于遗传算法的智能语音助手唤醒词识别模型加固方法，包括：步骤S10：根据音箱类型确定音素特征和特征取值范围后，选取合适的特征数量并定义不同词语间的不相似度；步骤S20：设计用于误唤醒率与不相似度两目标同时优化的求解算法；步骤S30：使用树莓派与语音助手连接，部署误唤醒词挖掘平台，通过运行求解算法来进行高效误唤醒词挖掘，生成误唤醒样本集；步骤S40：对误唤醒样本集进行正确样本标记后，对唤醒词检测模型进行训练；步骤S50：重复进行步骤S20、步骤S30、步骤S40，反复加固唤醒词检测模型，直到挖掘误唤醒词数量在可接受范围内。本申请实现了对语音助手的误唤醒词挖掘，提供了一种高效低成本的语音助手模型加固方法。手模型加固方法。手模型加固方法。

技术研发人员：陈艳姣徐文渊白怡杰汪锴波
受保护的技术使用者：杭州涿溪脑与智能研究所
技术研发日：2021.11.04
技术公布日：2022/3/15

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

基于遗传算法的智能语音助手唤醒词识别模型加固方法与流程

相关文献

最热文献