一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种低资源婴儿哭声检测方法与流程

2022-05-08 06:45:00 来源:中国专利 TAG:

技术特征:
1.一种低资源婴儿哭声检测方法,其特征在于,包括如下步骤:使用1mixture的monophone单音子模型,状态数为为209,进行初步匹配和筛选;对单音子模型的viterbi匹配得分进行排序,选择得分最高的n个结果对应的音素模型进行进一步的精细匹配;使用3mixture的triphone三音子模型,状态数为358,进行精细匹配和筛选;对多个三音子模型的viterbi匹配得分进行排序,选择得分最高的模型所对应的序号作为最终识别结果。2.根据权利要求1所述的低资源婴儿哭声检测方法,其特征在于,所述的使用1mixture的monophone单音子模型,状态数为209,进行初步匹配和筛选包括如下步骤:初始单音子模型状态数为为1024;使用baum-welch参数重估方法,利用已标注的哭声训练数据库对初始单音子模型状态进行聚类,将有效状态数m由1024缩减为209;具体过程如下:假设s为hmm模型状态的集合,f为训练集,l(s)为对数似然值,假设绑定的状态共享高斯分布的均值和方差,且状态绑定不影响帧和状态的alignment,则其中r
s
(o
f
)是状态s产生特征的后验概率,假设输出概率密度函数为高斯分布,则公式中n为数据维度,且n=27;选择l(s)0作为l(s)的第一个数作为有效状态0的似然值,比较l(s)1至l(s)
m-1
中与l(s)0的差值小于5%的状态,将其合并为同一个状态;s104:重复上述步骤s103,得到l(s)1~l(s)
m-1
。3.根据权利要求1所述的低资源婴儿哭声检测方法,其特征在于,所述的使用3mixture的triphone三音子模型,状态数为358,进行精细匹配和筛选包括如下步骤:初始三音子模型状态数为为1500;使用baum-welch参数重估方法,利用已标注的哭声训练数据库对初始三音子模型状态进行聚类,将有效状态数t由1500缩减为358;具体过程如下:假设s为hmm模型状态的集合,f为训练集,l(s)为对数似然值,假设绑定的状态共享高斯分布的均值和方差,且状态绑定不影响帧和状态的alignment,则其中r
s
(o
f
)是状态s产生特征的后验概率,假设输出概率密度函数为高斯分布,则公式中n为数据维度,且n=27;选择l(s)0为l(s)的第一个数作为有效状态0的似然值,比较l(s)1至l(s)
t-1
中与l(s)0的差值小于5%的状态,将其合并为同一个状态;重复上述步骤s304,得到l(s)1~l(s)
t-1


技术总结
本发明涉及互联网技术领域,公开了一种低资源婴儿哭声检测方法,包括如下步骤:使用1mixture的monophone单音子模型,状态数为为209,进行初步匹配和筛选;对单音子模型的viterbi匹配得分进行排序,选择得分最高的N个结果对应的音素模型进行进一步的精细匹配;使用3mixture的triphone三音子模型,状态数为358,进行精细匹配和筛选;对多个三音子模型的viterbi匹配得分进行排序,选择得分最高的模型所对应的序号作为最终识别结果。本发明的技术方案通过采用基于低mixture数 多状态共享的模型降维方法和基于VAD触发的非实时计算方法,能够在保证识别算法准确率前提下,大幅度降低模型结构复杂度和计算复杂度,从而显著减少婴儿哭声检测算法所需的芯片硬件计算资源消耗。消耗。消耗。


技术研发人员:何宇新 肖溪 何海滨
受保护的技术使用者:深圳声联网科技有限公司
技术研发日:2022.01.26
技术公布日:2022/5/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献