一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人声的声音信号识别方法、装置及存储介质与流程

2022-11-09 23:15:26 来源:中国专利 TAG:

技术特征:
1.一种基于人声的声音信号识别方法,应用于助听器,其特征在于,包括:采集当前环境的声音信号;采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号;响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式;当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号,并基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类;当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号。2.根据权利要求1所述的方法,其特征在于,所述根据确定当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号,包括:确定当前环境对应的场景类型;从历史拾音数据中获取历史人声信号对应的历史拾音速度以及历史拾音音强;根据所述场景类型、历史拾音速度、历史拾音音强以及所述第一人声信号的音强,调整所述第一人声信号对应的拾音速度和拾音音强;基于所述第一人声信号的采集时间,按照拾音速度和拾音音强输出所述第一人声信号。3.根据权利要求2所述的方法,其特征在于,所述根据所述场景类型、历史拾音速度、历史拾音音强以及所述第一人声信号的音强,调整所述第一人声信号对应的拾音速度和拾音音强,包括:基于所述助听器的麦克风阵列以及所述第一人声信号的音强,构建所述当前环境对应的信号热度地图;根据所述信号热度地图,确定所述第一人声信号与所述助听器之间的相对位置关系;基于所述相对位置关系,获取拾音速度对应的第一调整参数和拾音音强对应的第二调整参数;计算所述历史人声信号与所述第一人声信号之间的人声相似度;当所述历史人声信号与所述第一人声信号之间的人声相似度大于或等于预设相似度时,则获取所述历史人声信号对应的历史拾音速度以及历史拾音音强,并计算所述场景类型对应的第三调参权重、第一调整参数以及历史拾音速度的乘积,得到所述第一人声信号对应的拾音速度,以及;计算所述场景类型对应的第三调参权重、第二调整参数以及历史拾音音强的乘积,得到所述第一人声信号对应的拾音音强;当所述历史人声信号与所述第一人声信号之间的人声相似度小于预设相似度时,获取所述助听器对应当前拾音速度和当前拾音音强,根据所述第三调参权重、第一调整参数、当前拾音速度以及历史拾音速度的乘积,得到所述第一人声信号对应的拾音速度,以及;计算所述第三调参权重、第二调整参数当前拾音音强以及历史拾音音强的乘积,得到所述第一
人声信号对应的拾音音强。4.根据权利要求3所述的方法,其特征在于,所述基于所述助听器的麦克风阵列以及所述第一人声信号的音强,构建所述当前环境对应的信号热度地图,包括:获取所述助听器的麦克风阵列中麦克风之间的互相关信息;基于所述互相关信息,确定麦克风采集的信号之间的信号时延;计算所述信号时延与声波传播速度之间的乘积,得到每个麦克风之间的相对位置间距;基于所述相对位置间距,确定所述第一人声信号与所述麦克风阵列的相对角度;根据所述相对角度以及相对位置间距,预估所述第一人声信号相对于所述麦克风阵列的相对位置;以所述麦克风阵列为基准,基于所述第一人声信号相对于所述麦克风阵列的相对位置,构建当前环境对应的信号地图,并将所述第一人声信号的音强添加至所述信号地图中,得到信号热度地图。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类,包括:获取所述目标人声信号的音频特征;基于所述音频特征的基频变化率,对所述目标人声信号进行分类。6.根据权利要求1所述的方法,其特征在于,所述当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号,包括:当所述目标人声信号为第二类型的人声信号时,获取历史人声信号的音色,并通过生成对抗网络将所述目标人声信号的音色转换为历史人声信号的音色;播放所述第一人声信号以及转换后的目标人声信号。7.根据权利要求1所述的方法,其特征在于,所述在所述第二人声信号中确定满足预设条件的目标人声信号,包括:将所述第二人声信号中音量大于预设音量的第二人声信号确定为目标人声信号,以及;将所述第二人声信号中最靠近所述助听器的第二人声信号确定为目标人声信号。8.一种基于人声的声音信号识别装置,应用于助听器,其特征在于,包括:采集模块,用于采集当前环境的声音信号;识别模块,用于采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号;第一确定模块,用于响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式;输出模块,用于当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;第二确定模块,用于当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号;分类模块,用于基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行
分类;播放模块,用于当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号。9.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1-7任一项所述声音信号识别方法的步骤。10.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1至7中任一项所述声音信号识别方法。

技术总结
本发明提供一种基于人声的声音信号识别方法、装置、电子设备及存储介质,该方法进行声音信号识别时,可以根据声纹校验结果区分声音信号中的第一人声信号和第二人声信号,并基于针对助听器触发的模式选择操作,确定相应的工作模式,随后根据工作模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号识别的灵活性,进而提升助听器用户对声音信息的辨识度。识度。识度。


技术研发人员:朱元玲 朱利翰 王强 伍朝文 杨贵 乐有为
受保护的技术使用者:深圳市婕妤达电子有限公司
技术研发日:2022.10.12
技术公布日:2022/11/8
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献