一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

声音数据降噪方法、装置、设备、存储介质及程序产品与流程

2021-09-07 21:52:00 来源:中国专利 TAG:计算机 智能 座舱 人工智能 数据处理

技术特征:
1.一种声音数据降噪方法,包括:接收传入的待播放的第一声音数据;响应于在所述第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除所述第一声音数据外的噪声数据。2.根据权利要求1所述的方法,还包括:响应于在所述第一声音数据的播放过程中检测到所述合成语音打断信号,接收基于所述合成语音打断信号传入的第二声音数据,并调用预设的第二降噪算法过滤掉除所述第二声音数据中的人声数据外的声音数据。3.根据权利要求1所述的方法,其中,所述调用预设的第一降噪算法过滤掉除所述第一声音数据外的噪声数据,包括:基于预设的车内常规噪声特征集,识别车内常规噪声;去除与所述第一声音数据混杂播放的车内常规噪声。4.根据权利要求2所述的方法,其中,所述调用预设的第二降噪算法过滤掉除第二声音数据中的人声数据外的声音数据,包括:基于预设的车内常规噪声特征集,识别车内常规噪声;将所述第一声音数据作为车内额外噪声;去除与所述第二声音数据混杂播放的车内常规噪声和车内额外噪声。5.根据权利要求2所述的方法,其中,所述调用预设的第二降噪算法过滤掉除所述第二声音数据中的人声数据外的声音数据,包括:利用自动增益控制技术对混合声音信号中的人声进行增益放大,得到人声增益后声音数据;其中,所述混合声音信号由所述第一声音数据、所述第二声音数据以及车内常规噪声混合形成;利用非线性失真技术对所述人声增益后声音数据中的非人声进行失真处理,得到过滤掉除所述第二声音数据中的人声数据外的声音数据。6.根据权利要求1所述的方法,还包括:控制所述合成语音打断信号的触发机制屏蔽所述第一声音数据中的人声数据;其中,所述触发机制包括为语音助手配置的预设唤醒机制。7.根据权利要求1所述的方法,其中,所述第一声音数据由智能后视镜、智能行车记录仪或智能车载播放器传入。8.根据权利要求1

7任一项所述的方法,还包括:响应于距上一次检测到所述合成语音打断信号的时长超过预设时长,重新调用所述第一降噪算法过滤掉除所述第一声音数据外的噪声数据。9.一种声音数据降噪装置,包括:第一声音数据接收单元,被配置成接收传入的待播放的第一声音数据;第一降噪单元,被配置成响应于在所述第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除所述第一声音数据外的噪声数据。10.根据权利要求8所述的装置,还包括:第二降噪单元,被配置成响应于在所述第一声音数据的播放过程中检测到所述合成语音打断信号,接收基于所述合成语音打断信号传入的第二声音数据,并调用预设的第二降
噪算法过滤掉除所述第二声音数据中的人声数据外的声音数据。11.根据权利要求9所述的装置,其中,所述第一降噪单元被进一步配置成:基于预设的车内常规噪声特征集,识别车内常规噪声;去除与所述第一声音数据混杂播放的车内常规噪声。12.根据权利要求10所述的装置,其中,所述第二降噪单元被进一步配置成:基于预设的车内常规噪声特征集,识别车内常规噪声;将所述第一声音数据作为车内额外噪声;去除与所述第二声音数据混杂播放的车内常规噪声和车内额外噪声。13.根据权利要求10所述的装置,其中,所述第二降噪单元被进一步配置成:利用自动增益控制技术对混合声音信号中的人声进行增益放大,得到人声增益后声音数据;其中,所述混合声音信号由所述第一声音数据、所述第二声音数据以及车内常规噪声混合形成;利用非线性失真技术对所述人声增益后声音数据中的非人声进行失真处理,得到过滤掉除所述第二声音数据中的人声数据外的声音数据。14.根据权利要求9所述的装置,还包括:异常触发项屏蔽单元,被配置成控制所述合成语音打断信号的触发机制屏蔽所述第一声音数据中的人声数据;其中,所述触发机制包括为语音助手配置的预设唤醒机制。15.根据权利要求9所述的装置,其中,所述第一声音数据由智能后视镜、智能行车记录仪或智能车载播放器传入。16.根据权利要求9

15任一项所述的装置,还包括:降噪算法切换单元,被配置成响应于距上一次检测到所述合成语音打断信号的时长超过预设时长,重新调用所述第一降噪算法过滤掉除所述第一声音数据外的噪声数据。17.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1

8中任一项所述的声音数据降噪方法。18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1

8中任一项所述的声音数据降噪方法。19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1

8中任一项所述的声音数据降噪方法。

技术总结
本公开提供了一种声音数据降噪方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及车联网、智能座舱、智能语音、语音识别等人工智能技术领域。该方法的一具体实施方式包括:接收传入的待播放的第一声音数据;响应于在第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。该实施方式针对车载终端播放其它电子设备传入的第一声音数据的场景,进一步的在播放过程中未检测到合成语音打断信号的时候,采用尽可能凸显第一声音数据的原声特征的降噪力度较低的降噪模式,以期通过此种降噪模式为当前场景带来更好的播放效果和更低的播放时延。的播放效果和更低的播放时延。的播放效果和更低的播放时延。


技术研发人员:刘嵘
受保护的技术使用者:阿波罗智联(北京)科技有限公司
技术研发日:2021.05.28
技术公布日:2021/9/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜