噪音去除的方法、装置、电子设备及介质与流程

2022-12-09 22:28:25 来源：中国专利 TAG：

1.本技术中涉及数据处理技术，尤其是一种噪音去除的方法、装置、电子设备及介质。

背景技术：

2.随着科技的发展，产品高质量化在整个国家的生产中的比重越来越多。无论是生产产品还是生活产品，随着产品的使用增加，产品必然会出现损耗，因此精准的故障诊断系统直接决定了产品的质量的优劣。
3.进一步的，相关技术中对许多产品的运行声音判断是对其故障诊断的一个重要方法。目前相关技术中通常存在利用软阈值化进行去噪的方法。其中，软阈值化函数(soft threshlding)作为一种经典的方法，尤其在信号降噪领域是非常实用的，软阈值天然的非线性的属性是很适合用作深度神经网络的计算和传导过程中的。
4.然而，如何能够更加精确的利用软阈值化函数来进行噪音去除，成为了本领域人员需要解决的问题。

技术实现要素：

5.本技术实施例提供一种噪音去除的方法、装置、电子设备及介质，本技术实施例用于解决相关技术中存在的如何利用软阈值化函数生成模型以进行噪音识别的问题。
6.其中，根据本技术实施例的一个方面，提供的一种噪音去除的方法，其特征在于，包括：
7.获取待识别语音数据；
8.将所述待识别语音数据输入至预设的编解码模型，得到噪音识别结果，所述编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；
9.基于所述噪音识别结果，去除所述待识别语音数据中的噪音数据。
10.可选地，在基于本技术上述方法的另一个实施例中，在所述获取待识别语音数据之前，还包括：
11.获取至少一个无噪音语音数据；
12.在每个无噪音语音数据中加入噪音信号，得到对应的噪音语音数据；
13.利用所述至少一个无噪音语音数据，以及所述至少一个对应的噪音语音数据训练所述目标深度残差收缩网络，以及训练所述特征还原网络，直至得到满足预设训练条件的所述编解码模型。
14.可选地，在基于本技术上述方法的另一个实施例中，在所述得到满足预设训练条件的所述编解码模型，包括：
15.将所述目标深度残差收缩网络作为所述编解码模型中的编码模块；以及，将所述特征还原网络作为所述编解码模型中的解码模块。
16.可选地，在基于本技术上述方法的另一个实施例中，所述得到满足预设训练条件
的所述编解码模型，包括：
17.将所述噪音语音数据输入至所述目标深度残差收缩网络，得到编码端输出结果；
18.将所述编码端输出结果输入至所述特征还原网络，得到解码端输出结果；
19.利用所述解码端输出结果与对应的无噪音语音数据构造损失函数；
20.检测到所述损失函数满足预设条件，确定训练所述编解码模型至满足所述预设训练条件。
21.可选地，在基于本技术上述方法的另一个实施例中，所述损失函数通过以下公式得到：
[0022][0023]
其中，n对应于所述无噪音语音数据的数量，xi对应于所述无噪音语音数据的第i个分量，yi对应于所述解码端输出结果的第i个分量。
[0024]
可选地，在基于本技术上述方法的另一个实施例中，所述将所述噪音语音数据输入至所述目标深度残差收缩网络，得到编码端输出结果，包括：
[0025]
将所述噪音语音数据输入到所述目标深度残差收缩网络，得到cxwx1维度的第四输出结果；
[0026]
利用所述目标软阈值化函数，去除所述第四输出结果的噪音冗余，得到第五输出结果；
[0027]
对所述第五输出结果执行批正则归一化操作，以及执行全局平均池化操作，以及执行线性整流函数化操作，得到所述编码端输出结果。
[0028]
可选地，在基于本技术上述方法的另一个实施例中，在所述得到所述编码端输出结果之后，还包括：
[0029]
利用所述特征还原网络，对所述编码端输出结果执行反卷积操作，得到第一还原特征；
[0030]
对所述第一还原特征执行多次卷积操作；以及对所述第一还原特征执行多次反卷积操作，直至得到cxwx1维度的解码端输出结果。
[0031]
可选地，在基于本技术上述方法的另一个实施例中，在所述获取待识别语音数据之前，还包括：
[0032]
获取第一输入特征，并对所述第一输入特征执行至少两次的卷积化操作，以及执行批正则归一化操作，以及执行线性整流函数化操作，得到第一输出结果；
[0033]
对所述第一输出结果执行绝对值算法，以及执行全局平均池化操作，得到第二输出结果；
[0034]
基于所述第二输出结果，获取所述目标软阈值化函数。
[0035]
可选地，在基于本技术上述方法的另一个实施例中，基于所述第二输出结果，获取所述目标软阈值化函数，包括：
[0036]
对所述第二输出结果执行卷积化操作，以及执行批正则归一化操作，以及执行全连接操作，以及执行线性整流函数化操作，得到第三输出结果；
[0037]
对所述第三输出结果进行sigmoid函数化，得到所述目标软阈值化函数。
[0038]
根据本技术实施例的另一个方面，提供的一种噪音去除的装置，包括：
[0039]
确定模块，被设置为获取待识别语音数据；
[0040]
生成模块，被设置为将所述待识别语音数据输入至预设的编解码模型，得到噪音识别结果，所述编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；
[0041]
清除模块，被设置为基于所述噪音识别结果，去除所述待识别语音数据中的噪音数据。
[0042]
根据本技术实施例的又一个方面，提供的一种电子设备，包括：
[0043]
存储器，用于存储可执行指令；以及
[0044]
显示器，用于与所述存储器显示以执行所述可执行指令从而完成上述任一所述噪音去除的方法的操作。
[0045]
根据本技术实施例的还一个方面，提供的一种计算机可读存储介质，用于存储计算机可读取的指令，所述指令被执行时执行上述任一所述噪音去除的方法的操作。
[0046]
本技术中，在获取待识别语音数据；将待识别语音数据输入至预设的编解码模型，得到噪音识别结果，编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；基于噪音识别结果，去除待识别语音数据中的噪音数据。通过应用本技术的技术方案，可以通过将噪音数据和无噪音数据训练由目标软阈值化函数生成的深度残差网络以及特征还原网络，直至得到满足训练条件的编码器网络。以使将该编码器网络网络部署到噪音识别设备上以实现噪音去除的目的。
[0047]
下面通过附图和实施例，对本技术的技术方案做进一步的详细描述。
附图说明
[0048]
构成说明书的一部分的附图描述了本技术的实施例，并且连同描述一起用于解释本技术的原理。
[0049]
参照附图，根据下面的详细描述，可以更加清楚地理解本技术，其中：
[0050]
图1为本技术提出的噪音去除的方法示意图；
[0051]
图2-3为本技术提出的目标软阈值化函数生成方法的示意图；
[0052]
图4为本技术提出的编解码模型的原理示意图；
[0053]
图5为本技术提出的编解码模型中，编码端的原理示意图；
[0054]
图6为本技术提出的编解码模型中，解码端的原理示意图；
[0055]
图7为本技术提出的噪音去除的总体流程示意图
[0056]
图8为本技术噪音去除的装置的结构示意图；
[0057]
图9为本技术噪音去除的电子设备结构示意图。
具体实施方式
[0058]
现在将参照附图来详细描述本技术的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本技术的范围。
[0059]
同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际
的比例关系绘制的。
[0060]
以下对至少一个示例性实施例的描述实际上仅仅是说明性的，不作为对本技术及其应用或使用的任何限制。
[0061]
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。
[0062]
应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。
[0063]
另外，本技术各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本技术要求的保护范围之内。
[0064]
需要说明的是，本技术实施例中所有方向性指示(诸如上、下、左、右、前、后
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。
[0065]
下面结合图1-图7来描述根据本技术示例性实施方式的用于进行噪音去除的方法。需要注意的是，下述应用场景仅是为了便于理解本技术的精神和原理而示出，本技术的实施方式在此方面不受任何限制。相反，本技术的实施方式可以应用于适用的任何场景。
[0066]
进一步的，本技术提出一种噪音去除的方法、装置、目标终端及介质。
[0067]
图1示意性地示出了根据本技术实施方式的一种噪音去除的方法的流程示意图。如图1所示，该方法包括：
[0068]
s101，获取待识别语音数据。
[0069]
进一步的，随着科技的发展，机械化和产品化在整个国家的生产中的比重也越来越多，无论是面向工业的产品还是面向生活的产品。高质量的产品就必然依托于高质量的生产工艺，必然推动机械生产工艺的提高不断提高，而无论是生产工具还是生活产品，随着产品的使用增加，产品必然会出现损耗，因此精准的故障诊断系统直接决定了产品的质量的优劣。
[0070]
举例来说，在很多机械制造或是一些人们日常生活的产品中，旋转轴承占据了相当多的比例，无论是在制造还是在日常的家电损耗中，轴承的磨损也是最普遍的现象。对轴承旋转声音的判断是故障诊断的一个重要方法，然后通常轴承的旋转无论在生产中还是生活中都会夹杂着大量的噪音和冗余的信号，因此直接通过声音来判断故障的损坏程度是带来很大的误差。
[0071]
目前通用的传统方法采用统计学习方法来对声音信号噪声进行分析，但是传统的方法通常带有很多参数需要人为设定，设定本身就是很复杂的决策，通常要经过大量的统计实验来得出，但是身处的环境的不同将决定着不同的参数，比如机器本身的内外部差别，轴承本身的材质，甚至是周围的温度和湿度都可能会影响到这些超参的设定，因此这些人为设定的参数将很难统一适配。软阈值化(soft threshlding)作为一种经典的方法，尤其在信号降噪领域是非常实用的，但是正如前面所陈述的，软阈值化函数中的阈值就是一个超参，如何设定合理的数值就是一个很棘手的问题。
[0072]
近几年物联网、大数据和移动设备的普及，特别是深度学习爆发式的发展，使得以深度学习为基础的智能检测识别技术实现成为可能。不像传统的方法，深度学习的方法可
以自动地学习扰动的信号的参数特征，自动推导出正确的合适的参数，因此有极高的实用和使用价值。而且软阈值天然的非线性的属性是很适合用作深度神经网络的计算和传导过程中的。深度残差网络(resnet)作为一种经典的深度学习网络已经被成功应用到很多领域当中。深度残差网络与非线性的软阈值化函数相结合的网络，即深度残差收缩网络(residual shrinkage network)，也已经证明了其在信号降噪领域的实用性。深度残差收缩网络采用了注意力机制(类似于squeeze-and-excitation network)自动设置阈值，避免了人工设置阈值的麻烦。
[0073]
进一步的，深度残差收缩网络(residual shrinkage network)对含有噪声的故障诊断中具有良好的表现，该网络所能提取的信息具有对噪声的免疫性。因此本技术可以对原有的深度残差收缩网络(residual shrinkage network)加以改造，将它变成特征提取网络，再接着利用反卷积构造特征还原网络，这样就构成了一套自动编解码器(auto encode-decode)。该网络可以有效地去除原始声音信号中的噪音，从而给语音识别模块提供更为清楚的声音信号，这将会大大提升语音识别的准确性和精准率。
[0074]
需要说明的是，本技术不对待识别语音数据进行具体限定，一种方式中，其可以是带有噪音音频的语音数据。对于该噪音音频来说，其可以包括语音源信号和背景噪声，其中，背景噪声可以是各种不同类型的噪声信号，例如，因业务所处环境不同而可能存在的不同环境噪声如车辆噪声、工业噪声、风声、海浪声等。
[0075]
s102，将待识别语音数据输入至预设的编解码模型，得到噪音识别结果，编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成。
[0076]
进一步的，本技术可以在获取到待识别语音数据之后，将该数据输入到预先训练得到的编解码模型中，进而得到对应的噪音识别结果。
[0077]
可选的，本技术中获取目标软阈值化函数，还包括：
[0078]
获取第一输入特征，并对所述第一输入特征执行至少两次的卷积化操作，以及执行批正则归一化操作，以及执行线性整流函数化操作，得到第一输出结果；
[0079]
对所述第一输出结果执行绝对值算法，以及执行全局平均池化操作，得到第二输出结果；
[0080]
基于所述第二输出结果，获取所述目标软阈值化函数。
[0081]
进一步的，本技术首先对获取目标软阈值化函数的过程进行说明如下:
[0082]
在深度残差收缩网络(residual shrinkage network)中，本技术可以通过注意力机制自动地推导出阈值，并据此构造软阈值化(soft threshlding)函数，该函数的数学表达为
[0083][0084]
其中，τ为阈值，x和y都是实数，分别代表输入和输出，该函数的形状如图2所示。它的导数为
[0085][0086]
在这里τ为阈值，导数的形状如图3所示。
[0087]
进一步，由于软阈值化(soft threshlding)函数在阈值范围内的数值是0，阈值以外保持斜率为1的线性函数。因此其可以压制阈值范围内的噪音干扰。另外，本技术可以将软阈值化函数其与残差网络(resnet)相结合的深度残差收缩网络(residual shrinkage network)，利用注意力机制自动地推导出阈值，可以达到很好的噪声抑制功能。我们利用该网络提取噪音压制的高阶语义信息，构成自动编解码器(auto encode-decode)网络，整个网络由编码模块和解码模块两部分构成。编码器就是一个基于深度残差收缩网络所构成的特征提取网络，解码器就是由一系列反卷积构成的特征还原网络，整个自动编解码器(auto encode-decode)网络的构造如图4所示。
[0088]
s103，基于噪音识别结果，去除待识别语音数据中的噪音数据。
[0089]
进一步的，本技术可以在确定噪音识别结果之后，将待识别语音数据中的噪音数据来去除识别语音数据中的噪音冗余。从而提升整个网络模型对外部噪音信号的响应，以及提高噪声故障诊断的准确性和精准率。
[0090]
本技术中，在获取待识别语音数据；将待识别语音数据输入至预设的编解码模型，得到噪音识别结果，编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；基于噪音识别结果，去除待识别语音数据中的噪音数据。通过应用本技术的技术方案，可以通过将噪音数据和无噪音数据训练由目标软阈值化函数生成的深度残差网络以及特征还原网络，直至得到满足训练条件的编码器网络。以使将该编码器网络网络部署到噪音识别设备上以实现噪音去除的目的。
[0091]
可选的，在本技术一种可能的实施方式中，在s102(在获取目标烹饪设备运行时的待识别烹饪数据)，包括：
[0092]
在所述获取待识别语音数据之前，还包括：
[0093]
获取至少一个无噪音语音数据；
[0094]
在每个无噪音语音数据中加入噪音信号，得到对应的噪音语音数据；
[0095]
利用所述至少一个无噪音语音数据，以及所述至少一个对应的噪音语音数据训练所述目标深度残差收缩网络，以及训练所述特征还原网络，直至得到满足预设训练条件的所述编解码模型。
[0096]
进一步的，本技术可以首先获取一个无噪音的信号集合，其中该集合中包括至少一个无噪音语音数据。然后需要对该每一个无噪音语音数据进行噪音添加，从而生成对应的多个有噪声的噪音语音数据集合。
[0097]
可以理解的，无噪音语音数据得数量需要与噪音语音数据相同。另外，本技术需要对各个无噪音语音数据与对应的噪音语音数据进行标记。以使后续能够分辨出每个无噪音语音数据与噪音语音数据的对应关系。
[0098]
更进一步的，本技术可以随机选取一组无噪声的信号和与之相对应的有噪声的信号，并将其输入到编解码网络中进而得到编解码网络的输出结果。以使后续将该输出结果
与对应的无噪声语音数据进行比较，构成损失函数。并在后续确定损失函数满足预设条件时，确定编解码模型已训练完毕。
[0099]
可选的，在本技术一种可能的实施方式中，在所述得到满足预设训练条件的所述编解码模型，包括：
[0100]
将所述目标深度残差收缩网络作为所述编解码模型中的编码模块；以及，将所述特征还原网络作为所述编解码模型中的解码模块。
[0101]
其中，该损失函数通过以下公式得到：
[0102][0103]
其中，n对应于所述无噪音语音数据的数量，xi对应于所述无噪音语音数据的第i个分量，yi对应于所述解码端输出结果的第i个分量。
[0104]
进一步的，本技术中的损失函数的作用为指导整个编解码网络，使得最终的输出和无噪音信号不断接近。其中本技术可以对数据的处理如下：其中无噪声语音数据，设为x；然后再加入噪声信号，这个有噪声的信号设为x，x即为编解码网络的输入；最终网络的最后输出设为y。因为x和y是维度完全相同的张量，因此本技术可以采用逐点的相减的方法来构造损失函数。这样经过训练以后，该网络的输出就可以不断逼近原始的无噪声信号。
[0105]
可选的，在本技术一种可能的实施方式中，所述得到满足预设训练条件的所述编解码模型，包括：
[0106]
将所述噪音语音数据输入至所述目标深度残差收缩网络，得到编码端输出结果；
[0107]
将所述编码端输出结果输入至所述特征还原网络，得到解码端输出结果；
[0108]
利用所述解码端输出结果与对应的无噪音语音数据构造损失函数；
[0109]
检测到所述损失函数满足预设条件，确定训练所述编解码模型至满足所述预设训练条件。
[0110]
进一步的，本技术在将所述噪音语音数据输入至所述目标深度残差收缩网络，得到编码端输出结果，包括：
[0111]
将所述噪音语音数据输入到所述目标深度残差收缩网络，得到cxwx1维度的第四输出结果；
[0112]
利用所述目标软阈值化函数，去除所述第四输出结果的噪音冗余，得到第五输出结果；
[0113]
对所述第五输出结果执行批正则归一化操作，以及执行全局平均池化操作，以及执行线性整流函数化操作，得到所述编码端输出结果。
[0114]
进一步的，以图5所示，本技术可以将原始的还有噪声的噪音语音数据输入到所述目标深度残差收缩网络(即模型的编码端)，维度为cxwx1。首先经过一次卷积操作提取一次语义信息，维度仍然是cxwx1。另外，再经过若干个之前获取的提到的目标软阈值化函数(rsbu)，用来去除噪音冗余。
[0115]
最后，还可以经过一个批正则归一化操作(batch normalization) relu(线性整流函数化操作) 全局平均池化(gap)的操作，得到编码端输出结果。可以理解的，这个输出本身由于经过若干软阈值化函数(rsbu)，已经移植了噪音的干扰，因此非常适合作为编码
器的特征输出。
[0116]
可选的，本技术在所述得到所述编码端输出结果之后，还包括：
[0117]
利用所述特征还原网络，对所述编码端输出结果执行反卷积操作，得到第一还原特征；
[0118]
对所述第一还原特征执行多次卷积操作；以及对所述第一还原特征执行多次反卷积操作，直至得到cxwx1维度的解码端输出结果。
[0119]
进一步的，对于模型的解码端来说，以图6所示，具体流程如下：
[0120]
首先，本技术可以将编码端输出的编码端输出结果作为解码器的网络输入，首先经过一次反卷积操作来还原一次特征。并在经过卷积和反卷积的操作，不断还原特征，直至最终得到和编码器输入信号完全相同的特征，即维度同样为cxwx1的解码输出结果。
[0121]
更进一步的，如图7所示，对本技术提出的噪音去除的方法进行说明：
[0122]
1:获取无噪音语音数据集合。
[0123]
2:对无噪音语音数据进行噪音添加构成噪音语音数据集合。
[0124]
3:随机选取一组无噪音语音数据和与之相对应的噪音语音数据。
[0125]
4：将该随机选取的有噪音语音数据输入到编解码模型中。
[0126]
5：得到编解码模型的输出结果。
[0127]
6：将该编解码模型的输出结果和第3步骤选取的无噪音语音数据进行比较，构成损失函数。
[0128]
7：判断损失函数是否满足终止条件。
[0129]
8：如不满足终止条件，则回到3继续迭代。
[0130]
9：如满足终止条件，则终止训练编解码模型。
[0131]
10：保存训练好的编解码模型。
[0132]
11：部署训练好的编解码模型到各个语音产品或模块中，以供后续语音识别模块使用。
[0133]
12：结束。
[0134]
通过应用本技术的技术方案，可以通过将噪音数据和无噪音数据训练由目标软阈值化函数生成的深度残差网络以及特征还原网络，直至得到满足训练条件的编码器网络。以使将该编码器网络网络部署到噪音识别设备上以实现噪音去除的目的。
[0135]
在本技术的另外一种实施方式中，如图8所示，本技术还提供一种噪音去除的装置。其中，该装置包括确定模块201，生成模块202，清除模块203，其中，
[0136]
确定模块201，被设置为获取待识别语音数据；
[0137]
生成模块202，被设置为将所述待识别语音数据输入至预设的编解码模型，得到噪音识别结果，所述编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；
[0138]
清除模块203，被设置为基于所述噪音识别结果，去除所述待识别语音数据中的噪音数据。
[0139]
本技术中，在获取待识别语音数据；将待识别语音数据输入至预设的编解码模型，得到噪音识别结果，编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；基于噪音识别结果，去除待识别语音数据中的噪音数据。通过应用
本技术的技术方案，可以通过将噪音数据和无噪音数据训练由目标软阈值化函数生成的深度残差网络以及特征还原网络，直至得到满足训练条件的编码器网络。以使将该编码器网络网络部署到噪音识别设备上以实现噪音去除的目的。
[0140]
在本技术的另一种实施方式中，确定模块201，还包括：
[0141]
确定模块201，被配置为获取至少一个无噪音语音数据；
[0142]
确定模块201，被配置为在每个无噪音语音数据中加入噪音信号，得到对应的噪音语音数据；
[0143]
确定模块201，被配置为利用所述至少一个无噪音语音数据，以及所述至少一个对应的噪音语音数据训练所述目标深度残差收缩网络，以及训练所述特征还原网络，直至得到满足预设训练条件的所述编解码模型。
[0144]
在本技术的另一种实施方式中，确定模块201，还包括：
[0145]
确定模块201，被配置为将所述目标深度残差收缩网络作为所述编解码模型中的编码模块；以及，将所述特征还原网络作为所述编解码模型中的解码模块。
[0146]
在本技术的另一种实施方式中，确定模块201，还包括：
[0147]
确定模块201，被配置为将所述噪音语音数据输入至所述目标深度残差收缩网络，得到编码端输出结果；
[0148]
确定模块201，被配置为将所述编码端输出结果输入至所述特征还原网络，得到解码端输出结果；
[0149]
确定模块201，被配置为利用所述解码端输出结果与对应的无噪音语音数据构造损失函数；
[0150]
确定模块201，被配置为检测到所述损失函数满足预设条件，确定训练所述编解码模型至满足所述预设训练条件。
[0151]
在本技术的另一种实施方式中，所述损失函数通过以下公式得到：
[0152][0153]
其中，n对应于所述无噪音语音数据的数量，xi对应于所述无噪音语音数据的第i个分量，yi对应于所述解码端输出结果的第i个分量。
[0154]
在本技术的另一种实施方式中，确定模块201，还包括：
[0155]
确定模块201，被配置为将所述噪音语音数据输入到所述目标深度残差收缩网络，得到cxwx1维度的第四输出结果；
[0156]
确定模块201，被配置为利用所述目标软阈值化函数，去除所述第四输出结果的噪音冗余，得到第五输出结果；
[0157]
确定模块201，被配置为对所述第五输出结果执行批正则归一化操作，以及执行全局平均池化操作，以及执行线性整流函数化操作，得到所述编码端输出结果。
[0158]
在本技术的另一种实施方式中，确定模块201，还包括：
[0159]
确定模块201，被配置为利用所述特征还原网络，对所述编码端输出结果执行反卷积操作，得到第一还原特征；
[0160]
确定模块201，被配置为对所述第一还原特征执行多次卷积操作；以及对所述第一
还原特征执行多次反卷积操作，直至得到cxwx1维度的解码端输出结果。
[0161]
在本技术的另一种实施方式中，确定模块201，还包括：
[0162]
确定模块201，被配置为获取第一输入特征，并对所述第一输入特征执行至少两次的卷积化操作，以及执行批正则归一化操作，以及执行线性整流函数化操作，得到第一输出结果；
[0163]
确定模块201，被配置为对所述第一输出结果执行绝对值算法，以及执行全局平均池化操作，得到第二输出结果；
[0164]
确定模块201，被配置为基于所述第二输出结果，获取所述目标软阈值化函数。
[0165]
在本技术的另一种实施方式中，确定模块201，还包括：
[0166]
确定模块201，被配置为对所述第二输出结果执行卷积化操作，以及执行批正则归一化操作，以及执行全连接操作，以及执行线性整流函数化操作，得到第三输出结果；
[0167]
确定模块201，被配置为对所述第三输出结果进行sigmoid函数化，得到所述目标软阈值化函数。
[0168]
图9是根据一示例性实施例示出的一种电子设备的逻辑结构框图。例如，电子设备300可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。
[0169]
参照图9，电子设备300可以包括以下一个或多个组件：处理器301和存储器302。
[0170]
处理器301可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器301可以采用dsp(digital signal processing，数字信号处理)、fpga(field－programmable gate array，现场可编程门阵列)、pla(programmable logic array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(central processing unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器301可以在集成有gpu(graphics processing unit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器301还可以包括ai(artificial intelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。
[0171]
存储器302可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器301所执行以实现本技术中方法实施例提供的互动特效标定方法。
[0172]
在一些实施例中，电子设备300还可选包括有：外围设备接口303和至少一个外围设备。处理器301、存储器302和外围设备接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口303相连。具体地，外围设备包括：射频电路304、触摸显示屏305、摄像头306、音频电路307、定位组件308和电源309中的至少一种。
[0173]
外围设备接口303可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。在一些实施例中，处理器301、存储器302和外围设备
based service，基于位置的服务)。定位组件308可以是基于美国的gps(global positioning system，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0179]
电源309用于为电子设备300中的各个组件进行供电。电源309可以是交流电、直流电、一次性电池或可充电电池。当电源309包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0180]
在一些实施例中，电子设备300还包括有一个或多个传感器410。该一个或多个传感器410包括但不限于：加速度传感器411、陀螺仪传感器412、压力传感器413、指纹传感器414、光学传感器415以及接近传感器416。
[0181]
加速度传感器411可以检测以电子设备300建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器411可以用于检测重力加速度在三个坐标轴上的分量。处理器301可以根据加速度传感器411采集的重力加速度信号，控制触摸显示屏305以横向视图或纵向视图进行用户界面的显示。加速度传感器411还可以用于游戏或者用户的运动数据的采集。
[0182]
陀螺仪传感器412可以检测电子设备300的机体方向及转动角度，陀螺仪传感器412可以与加速度传感器411协同采集用户对电子设备300的3d动作。处理器301根据陀螺仪传感器412采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0183]
压力传感器413可以设置在电子设备300的侧边框和/或触摸显示屏305的下层。当压力传感器413设置在电子设备300的侧边框时，可以检测用户对电子设备300的握持信号，由处理器301根据压力传感器413采集的握持信号进行左右手识别或快捷操作。当压力传感器413设置在触摸显示屏305的下层时，由处理器301根据用户对触摸显示屏305的压力操作，实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0184]
指纹传感器414用于采集用户的指纹，由处理器301根据指纹传感器414采集到的指纹识别用户的身份，或者，由指纹传感器414根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器301授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器414可以被设置电子设备300的正面、背面或侧面。当电子设备300上设置有物理按键或厂商logo时，指纹传感器414可以与物理按键或厂商logo集成在一起。
[0185]
光学传感器415用于采集环境光强度。在一个实施例中，处理器301可以根据光学传感器415采集的环境光强度，控制触摸显示屏305的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏305的显示亮度；当环境光强度较低时，调低触摸显示屏305的显示亮度。在另一个实施例中，处理器301还可以根据光学传感器415采集的环境光强度，动态调整摄像头组件306的拍摄参数。
[0186]
接近传感器416，也称距离传感器，通常设置在电子设备300的前面板。接近传感器416用于采集用户与电子设备300的正面之间的距离。在一个实施例中，当接近传感器416检测到用户与电子设备300的正面之间的距离逐渐变小时，由处理器301控制触摸显示屏305从亮屏状态切换为息屏状态；当接近传感器416检测到用户与电子设备300的正面之间的距
离逐渐变大时，由处理器301控制触摸显示屏305从息屏状态切换为亮屏状态。
[0187]
本领域技术人员可以理解，图9中示出的结构并不构成对电子设备300的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。
[0188]
在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器304，上述指令可由电子设备300的处理器420执行以完成上述噪音去除的方法，该方法包括：获取待识别语音数据；将所述待识别语音数据输入至预设的编解码模型，得到噪音识别结果，所述编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；基于所述噪音识别结果，去除所述待识别语音数据中的噪音数据。可选地，上述指令还可以由电子设备300的处理器420执行以完成上述示例性实施例中所涉及的其他步骤。例如，所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0189]
在示例性实施例中，还提供了一种应用程序/计算机程序产品，包括一条或多条指令，该一条或多条指令可以由电子设备300的处理器420执行，以完成上述噪音去除的方法，该方法包括：由电子设备300的处理器420执行以完成上述噪音去除的方法，该方法包括：获取待识别语音数据；将所述待识别语音数据输入至预设的编解码模型，得到噪音识别结果，所述编解码模型为基于目标软阈值化函数生成的目标深度残差收缩网络以及特征还原网络所构成；基于所述噪音识别结果，去除所述待识别语音数据中的噪音数据。可选地，上述指令还可以由电子设备300的处理器420执行以完成上述示例性实施例中所涉及的其他步骤。
[0190]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本技术的真正范围和精神由下面的权利要求指出。
[0191]
应当理解的是，本技术并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种语音识别方法、装置、电子设备及存储介质与流程

噪音去除的方法、装置、电子设备及介质与流程

相关文献

最热文献