一种基于人工智能技术的语音降噪方法及系统

2022-09-03 19:34:42 来源：中国专利 TAG：

1.本发明属于语音处理技术领域，具体而言，涉及一种基于人工智能技术的语音降噪方法及系统。

背景技术：

2.在日常生活中，噪声是影响语音通话质量的重要因素之一。语音降噪技术通过消除噪声并提取干净语音，从而提高语音质量和可懂度，在移动通信、耳机、会议系统、语音交互等应用中具有巨大价值。在实际生活或生产场景中噪声又分为稳态噪声和非稳态噪声，例如，环境背景噪声，路边的汽车来来回回的噪声都属于稳态噪音；而鼠标点击声、键盘声、敲击声、空调声、厨房碗碟碰撞声等都属于非稳态噪音。但是相关现有技术中针对语音信号的非稳态断续噪声的降噪处理效率较低，无法实时有效地针对语音信号进行降噪处理，限制了降噪技术的发展。

技术实现要素：

3.本发明实施例提供了一种基于人工智能技术的语音降噪方法及系统，通过两级处理同时处理目标语音信号中的底层噪声和断续噪声，在保证目标语音不失真的情况下提高语音降噪处理的效率和效果。
4.鉴于上述问题，本发明提出的技术方案是：
5.本发明提供一种基于人工智能技术的语音降噪方法，包括以下步骤：
6.s1，麦克风获取目标语音信号，时钟获取目标语音信号录取的时间，gps定位仪获取目标语音录取的地理位置；
7.其中，所述目标语音信号包括干净声音信号和带噪声音信号，所述带噪声音信号包括底层噪音信号和断续噪音信号；
8.s2，对所述目标语音信号进行预处理，获得将所述底层噪音信号谱减后的语音信号；
9.s3，通过对比降噪模型提取所述断续噪音信号；
10.s4，将所述断续噪音信号与剩余的所述干净声音信号分别进行加权处理，得到降噪语音信号。
11.作为本发明的一种优选技术方案，所述步骤s2中，对所述目标语音信号进行预处理的方式包括：提取所述目标语音信号开头不包含所述干净声音信号的区间作为所述底层噪音信号，取所述底层噪音信号的平均幅值谱，然后根据所述底层噪音信号的谱幅值作为参照，将所述目标语音信号中相同谱幅值去除，得到谱减后的语音信号。
12.作为本发明的一种优选技术方案，所述步骤s3还包括：预先采集各环境点位标志性噪声信号，将所述噪声信号切片为同一时长的标准格式，并转换为标准频谱幅值得到所述降噪模型，然后按采集时间、采集场景进行划分归类，并建立降噪模型库。
13.作为本发明的一种优选技术方案，所述步骤s3中，提取所述断续噪音信号包括：首
先识别所述目标语音中包含的地理位置的场景类型和录取时间信息，然后在所述降噪模型库内调取对应场景和时间分类下所述标志性噪声信号的谱幅值，并检测所述谱减后的语音信号中与所述标志性噪声信号的谱幅值相等的区间，得到所述断续噪音信号。
14.作为本发明的一种优选技术方案，所述麦克风在获得用户权限后实时采集当前环境点位的噪声信号及对应的时间和地理位置，并上传至所述降噪模型库内处理、转换、分类，更新所述降噪模型。
15.作为本发明的一种优选技术方案，所述步骤s4中，对所述断续噪音信号的谱幅值加权0.5倍，对所述干净声音信号的谱幅值加权1.5倍，使所述干净声音信号更加突出明显。
16.另一方面，本发明提供一种基于人工智能技术的语音降噪系统，包括获取模块、预处理模块、二级处理模块、生成模块和降噪模型库，所述获取模块、所述预处理模块、所述二级处理模块和所述生成模块依次通信连接，所述降噪模型库与所述二级处理模块通信连接；
17.其中，所述获取模块用于获取目标语音信号；
18.所述预处理模块用于将所述目标语音信号中的底层噪音信号去除，获得谱减后的语音信号；
19.所述二级处理模块用于对比提取所述谱减后的语音信号中的断续噪音信号；
20.所述生成模块用于将所述断续噪音信号与剩余的干净声音信号分别进行加权处理后的到降噪语音信号；
21.所述降噪模型库用于储存不同场景、时间下的标志性噪声信号，形成降噪模型。
22.作为本发明的一种优选技术方案，所述获取模块包括麦克风、时钟和gps定位仪，分别用于获取目标语音信号及其录取的时间和地理位置。
23.作为本发明的一种优选技术方案，所述降噪模型库还包括采集单元和分类单元，所述采集单元用于采集各环境点位标志性噪声信号，所述分类单元用于将所述标志性噪声信号进行切统一时长切片处理后按采集时间和场景进行归类。
24.作为本发明的一种优选技术方案，所述降噪模型库与所述获取模块通信连接，用于实时采集当前环境点位的噪声信号，实时更新所述降噪模型。
25.相对于现有技术，本发明的有益效果是：首先将目标语音信号中的底层噪音预处理去除，然后通过降噪模型类比录取时间和场景提取出断续非稳态噪声，针对不同场景和时间录取的语音信号调取对应模型下的标志性噪声进行降噪对比，并将噪声与干净声音对应加权处理，保证目标语音不失真的同时起到良好的降噪效果，不影响降噪效率。
26.上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。
附图说明
27.图1是本发明所公开的一种基于人工智能技术的语音降噪方法的流程示意图；
28.图2是本发明所公开的一种基于人工智能技术的语音降噪系统的结构框图；
29.说明：100、获取模块；200、预处理模块；300、二级处理模块；400、生成模块；500、降噪模型库；501、采集单元；502、分类单元。
具体实施方式
30.为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。
31.因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。
32.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
33.在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
34.此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
35.实施例一
36.参照附图1所示，本发明提供一种技术方案：一种基于人工智能技术的语音降噪方法，包括以下步骤：
37.s1，麦克风获取目标语音信号，时钟获取目标语音信号录取的时间，gps定位仪获取目标语音录取的地理位置；
38.其中，目标语音信号包括干净声音信号和带噪声音信号，带噪声音信号包括底层噪音信号和断续噪音信号，底层噪音信号属于稳态噪声，如环境背景噪声、路边汽车噪声等，断续噪音信号属于非稳态噪声，如办公室鼠标键盘点击声、房间内空调声、地铁站广播声等；
39.s2，对目标语音信号进行预处理，获得将底层噪音信号谱减后的语音信号；
40.其中，对目标语音信号进行预处理的方式包括：提取目标语音信号开头不包含干净声音信号的区间作为底层噪音信号，取底层噪音信号的平均幅值谱，然后根据底层噪音信号的谱幅值作为参照，将目标语音信号中相同谱幅值去除，得到谱减后的语音信号，一般默认正常语音开头20毫秒内不会出现干净声音信号，将该部分作为底层噪音信号的本底，不容易产生偏差，保证语音信号降噪处理的效果；
41.s3，通过对比降噪模型提取断续噪音信号；
42.其中还包括：预先采集各环境点位标志性噪声信号，将噪声信号切片为同一时长的标准格式，并转换为标准频谱幅值得到降噪模型，然后按采集时间、采集场景进行划分归
类，并建立降噪模型库，日常生活中，不同场景出现的噪声类型不同，如开放空间会出现汽车鸣笛声，地铁站会出现广播声，生产车间会出现机器轰鸣声等，将不同场景区分开来，另外，同一场景不同时间段的噪声也存在不同，如马路边凌晨与早晚高峰时的噪声大小和声音会不同，办公室上班时间与下班时间的噪声会不同，降噪模型库充分采集并保存各类场景模式下的标志性噪音，充分发挥数据库的作用；
43.提取断续噪音信号包括：首先识别目标语音中包含的地理位置的场景类型和录取时间信息，然后在降噪模型库内调取对应场景和时间分类下标志性噪声信号的谱幅值，并检测谱减后的语音信号中与标志性噪声信号的谱幅值相等的区间，得到断续噪音信号，通过与降噪模型库内不同场景和时间的进行对应比较提取，方便提高降噪处理的效率和准确性；
44.s4，将断续噪音信号与剩余的干净声音信号分别进行加权处理，得到降噪语音信号；
45.其中，对断续噪音信号的谱幅值加权0.5倍，对干净声音信号的谱幅值加权1.5倍，使干净声音信号更加突出明显，加权处理不对断续噪音进行消除，防止干净声音信号播放失真，保留语音信号的降噪效果。
46.本发明实施例还通过以下技术方案进行实现。
47.在本发明的实施例中，麦克风在获得用户权限后实时采集当前环境点位的噪声信号及对应的时间和地理位置，并上传至降噪模型库内处理、转换、分类，更新降噪模型，降噪模型库通过大基数的用户实时持续更新，保证任意时间场景下调取的降噪模型均能符合当前降噪需求。
48.实施例二
49.参照附图2所示，一种基于人工智能技术的语音降噪系统，包括获取模块100、预处理模块200、二级处理模块300、生成模块400和降噪模型库500，获取模块100、预处理模块200、二级处理模块300和生成模块400依次通信连接，降噪模型库500与二级处理模块300通信连接；
50.其中，获取模块100用于获取目标语音信号，获取模块100包括麦克风、时钟和gps定位仪，分别用于获取目标语音信号及其录取的时间和地理位置；
51.预处理模块200用于将目标语音信号中的底层噪音信号去除，获得谱减后的语音信号；
52.二级处理模块300用于对比提取谱减后的语音信号中的断续噪音信号；
53.生成模块400用于将断续噪音信号与剩余的干净声音信号分别进行加权处理后的到降噪语音信号；
54.降噪模型库500用于储存不同场景、时间下的标志性噪声信号，形成降噪模型，降噪模型库500还包括采集单元501和分类单元502，采集单元501用于采集各环境点位标志性噪声信号，分类单元502用于将标志性噪声信号进行切统一时长切片处理后按采集时间和场景进行归类。
55.在本发明的实施例中，降噪模型库500与获取模块100通信连接，用于实时采集当前环境点位的噪声信号，实时更新降噪模型。
56.本实施例提供的一种基于人工智能技术的语音降噪系统，通过两级模块对目标语
音进行处理，分别去除底层噪音和提取出断续噪音，并通过生成模块400将干净声音和断续噪音加权优化，得到最终的降噪语音，系统处理效率高，降噪处理效果好。
57.需要说明的是，获取模块100、预处理模块200、二级处理模块300、生成模块400和降噪模型库500的具体型号规格需根据该装置的实际规格等进行选型确定，具体选型计算方法采用本领域现有技术，故不再详细赘述。
58.需要说明的是，获取模块100、预处理模块200、二级处理模块300、生成模块400和降噪模型库500的供电及其原理对本领域技术人员来说是清楚的，在此不予详细说明。
59.应该明白，公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好，应该理解，过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素，并且不是要限于所述的特定顺序或层次。
60.在上述的详细描述中，各种特征一起组合在单个的实施方案中，以简化本公开。不应该将这种公开方法解释为反映了这样的意图，即，所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反，如所附的权利要求书所反映的那样，本发明处于比所公开的单个实施方案的全部特征少的状态。因此，所附的权利要求书特此清楚地被并入详细描述中，其中每项权利要求独自作为本发明单独的优选实施方案。
61.本领域技术人员还应当理解，结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性，上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件，取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用，以变通的方式实现所描述的功能，但是，这种实现决策不应解释为背离本公开的保护范围。
62.结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、移动磁盘、cd-rom或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于asic中。该asic可以位于用户终端中。当然，处理器和存储介质也可以作为分立组件存在于用户终端中。
63.对于软件实现，本技术中描述的技术可用执行本技术所述功能的模块(例如，过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内，也可以实现在处理器外，在后一种情况下，它经由各种手段以通信方式耦合到处理器，这些都是本领域中所公知的。
64.上文的描述包括一个或多个实施例的举例。当然，为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的，但是本领域普通技术人员应该认识到，各个实施例可以做进一步的组合和排列。因此，本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外，就说明书或权利要求书中使用的术语“包含”，该词的涵盖方式类似于术语“包括”，就如同“包括，”在权利要求中用作衔接词所解释的那样。此外，使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性
的或者”。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：可穿戴式设备的控制方法、装置、终端设备及存储介质与流程

一种基于人工智能技术的语音降噪方法及系统

相关文献

最热文献