农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

语音信号处理方法、装置、电子设备及存储介质与流程

2021-08-13 19:22:00 来源：中国专利 TAG：电子设备信号处理语音装置公开

本公开涉及电子设备技术领域，尤其涉及一种语音信号处理方法、装置、电子设备及存储介质。

背景技术：

在直播场景中，电子设备采集主播用户的语音信号，而后将语音信号上传至直播类应用程序，并提供至听众用户，如果主播用户在距离电子设备相对较远的位置进行直播，则上传的主播用户的语音信号可能并不够清晰，从而影响听众用户的收听体验。

相关技术中，在采集到语音信号后通常是对其进行自动的增益调整处理。

这种方式下，可能会增强其中的噪音信号成分，从而影响增益调整处理的效果，导致语音信号的处理效果不佳。

技术实现要素：

本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本公开的目的在于提出一种语音信号处理方法、装置、电子设备及存储介质，由于是在增益调整之前，即采用与噪音信号对应的目标降噪算法对语音信号进行了降噪处理，有效地消除语音信号中的噪音信号成分，实现在增益调整时不会增强噪音信号成分，从而能够有效地避免增强语音信号中的噪音信号成分，有效地辅助提升增益调整处理的效果，提升语音信号的质量，有效地提升语音信号的处理效果。

为达到上述目的，本公开第一方面实施例提出的语音信号处理方法，应用于客户端，包括：采集噪音信号；获取与所述噪音信号对应的目标降噪算法；采集语音信号，并采用所述目标降噪算法对所述语音信号进行降噪处理，以得到待调整语音信号；以及对所述待调整语音信号进行增益调整，以得到目标语音信号。

本公开第一方面实施例提出的语音信号处理方法，通过采集噪音信号，获取与噪音信号对应的目标降噪算法，采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，以及对待调整语音信号进行增益调整，以得到目标语音信号，由于是在增益调整之前，采用与噪音信号对应的目标降噪算法对语音信号进行了降噪处理，有效地消除语音信号中的噪音信号成分，实现在增益调整时不会增强噪音信号成分，从而能够有效地避免增强语音信号中的噪音信号成分，有效地辅助提升增益调整处理的效果，提升语音信号的质量，有效地提升语音信号的处理效果。

本公开第二方面实施例提出的语音信号处理方法，应用于服务端，包括：接收噪音信号；获取与所述噪音信号对应的目标降噪算法；将所述目标降噪算法发送至客户端，以供所述客户端根据所述目标降噪算法对所采集的语音信号进行降噪处理。

本公开第二方面实施例提出的语音信号处理方法，通过接收噪音信号，并获取与噪音信号对应的目标降噪算法，以及将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理，由于服务端依托大数据分析处理能力，能够具有更准确的噪音信号的分析效果，且服务端是共用的，由此服务端可以不断提供新的降噪算法，来适配不同的噪音信号，从而能够有效地满足语音处理的个性化应用场景需求。

本公开第三方面实施例提出的语音信号处理装置，应用于客户端，包括：第一采集模块，用于采集噪音信号；第一获取模块，用于获取与所述噪音信号对应的目标降噪算法；第二采集模块，用于采集语音信号，并采用所述目标降噪算法对所述语音信号进行降噪处理，以得到待调整语音信号；以及调整模块，用于对所述待调整语音信号进行增益调整，以得到目标语音信号。

本公开第四方面实施例提出的语音信号处理装置，应用于服务端，包括：接收模块，用于接收噪音信号；第二获取模块，用于获取与所述噪音信号对应的目标降噪算法；发送模块，用于将所述目标降噪算法发送至客户端，以供所述客户端根据所述目标降噪算法对所采集的语音信号进行降噪处理。

本公开第五方面实施例提出了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如本公开第一方面实施例提出的语音信号处理方法，或者执行如第二方面所述的语音信号处理方法。

本公开第六方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开第一方面实施例提出的语音信号处理方法，或者执行如第二方面所述的语音信号处理方法。

本公开第七方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令由处理器执行时，执行如本公开第一方面实施例提出的语音信号处理方法，或者执行如第二方面所述的语音信号处理方法。

本公开附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本公开的实践了解到。

附图说明

本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本公开一实施例提出的语音信号处理方法的流程示意图；

图2是本公开另一实施例提出的语音信号处理方法的流程示意图；

图3是本公开另一实施例提出的语音信号处理方法的流程示意图；

图4是本公开另一实施例提出的语音信号处理方法的流程示意图；

图5是本公开另一实施例提出的语音信号处理方法的流程示意图；

图6是本公开另一实施例提出的语音信号处理方法的流程示意图；

图7是本公开一实施例提出的语音信号处理装置的结构示意图；

图8是本公开另一实施例提出的语音信号处理装置的结构示意图；

图9是本公开另一实施例提出的语音信号处理装置的结构示意图；

图10是本公开另一实施例提出的语音信号处理装置的结构示意图；

图11是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

下面详细描述本公开的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本公开，而不能理解为对本公开的限制。相反，本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本公开一实施例提出的语音信号处理方法的流程示意图。

本实施例中语音信号处理方法可以被配置在语音信号处理装置中，本实施例以语音信号处理装置被配置在电子设备中为例，电子设备可以为手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、成像装置的硬件设备。

本实施例的执行主体，可以具体例如运行于电子设备上的采集语音信号类应用程序的客户端（即电子设备和客户端的关系是：客户端运行在电子设备中），客户端（client）或称为用户端，用于为用户提供本地服务的程序，对此不作限制。

本公开实施例中的一种可能的应用场景，可以例如为用户使用直播类应用程序进行视频直播的场景，也即是说，在该应用场景中，主播用户采用主播客户端（主播客户端是主播用户侧的客户端）向观众用户侧的客户端（有时也称为用户客户端）发送直播视频流，用户客户端相应的显示该直播视频流，主播客户端通常会采集主播用户的语音信号并上传至直播类应用程序。

当然，本公开实施例也可以应用在其它任意可能采集语音信号的应用场景之中，对此不做限制。

如图1所示，该语音信号处理方法，包括：

s101：采集噪音信号。

其中，可以在电子设备上配置一个后置麦克风（backmicrophone），在启动电子设备中的采集语音信号类应用程序的客户端时，可以首先调用该后置麦克风bm，来辅助捕获噪音信号，或者，也可以采用电子设备已有的麦克风捕获噪音信号，对此不做限制。

本公开实施例中的噪音信号，可以是采集真实的语音信号前，所采集到的环境中的噪音信号，从而可以采用该噪音信号来辅助后续对真实的语音信号进行降噪处理。

s102：获取与噪音信号对应的目标降噪算法。

本公开实施例中，上述捕获得到的噪音信号可以被用于确定适配的降噪算法，与噪音信号适配的降噪算法，可以被称为目标降噪算法。

由于不同的噪音信号可能会具有不同或者相同的信号特征，而为了保障降噪处理的针对性，保障针对信号的降噪处理能够满足噪音信号的个性化的信号特征，本公开实施例可以获取与噪音信号对应的目标降噪算法，以对后续采集的语音信号进行降噪。

另外，由于采集语音信号和采集噪音信号时，电子设备一般处于相同的环境中，从而后续采集的语音信号也会包含相同信号特征的噪音信号成分，从而能够辅助实现采用与噪音信号对应的目标降噪算法对语音信号进行针对性的降噪处理。

上述的与噪音信号对应的目标降噪算法可以是预先配置的，具体可以在服务端配置，从而可以有效地利用服务端的计算能力，并且有效地降低对电子设备的计算资源的消耗，降低电子设备的制造成本。

而在服务端配置与噪音信号对应的目标降噪算法的方法步骤，可以具体参见后续实施例，在此不再赘述。

一些实施例中，可以在采集到噪音信号后，可以通过第五代移动通信技术（5thgenerationmobilecommunicationtechnology，5g）通信网络上传至服务端，由服务端分析上传的噪音信号对应的信号特征，从而参考该信号特征从多个候选降噪算法中匹配最优的降噪算法作为目标降噪算法。

例如，服务端可以通过人工智能（artificialintelligence，ai）学习的方式，在云端进行匹配识别，对于接收的噪音信号参考信号特征进行噪音分类，服务端可以采用人工智能ai技术对所有类型的噪音信号对应的降噪算法进行学习，将降噪处理表现最优的降噪算法作为候选降噪算法，并且，由于预先学习分类多种噪音类型，从而可以学习出与各种噪音类型对应的候选降噪算法，对此不做限制。

可选地，获取与噪音信号对应的目标降噪算法，可以是获取本地的初始降噪算法，并确定与噪音信号对应的噪音类型，如果噪音类型与初始降噪算法匹配，则将初始降噪算法作为目标降噪算法，如果噪音类型与初始降噪算法不匹配，则从服务端获取与噪音信号对应的目标降噪算法，从而使得降噪算法获取的方式更为合理，在电子设备本地的初始降噪算法已与噪音类型匹配时，可以不从服务端下载降噪算法。

本公开实施例在确定与噪音信号对应的噪音类型时，可以对噪音信号进行语音特征分析，得到语音特征，例如，可以对噪音信号进行语音特征提取，以得到噪音信号的声纹特征、音调特征、音色特征等作为噪音信号的语音特征（该噪音信号的语音特征，即可以被称为噪音信号特征），而在提取噪音信号的语音特征时，可以是直接基于语音分析算法以提取语音特征，或者，也可以是将噪音信号输入至预训练的语音分析模型中，采用语音分析模型对噪音信号进行语音特征提取，对此不做限制。

本公开实施例中，还可以基于预置对应关系来确定该噪音信号的噪音类型，并确定该噪音类型是否与电子设备本地的初始降噪算法匹配，或者，也可以是将噪音信号发送至服务端，由服务端进行相应的分析处理，以确定噪音类型，对此不做限制。

可选地，噪音信号具有对应的噪音信号特征，确定与噪音信号对应的噪音类型，通过将噪音信号发送至服务端，由服务端进行相应的分析处理，以确定噪音类型，电子设备直接接收服务端发送的与噪音信号特征对应的噪音类型，能够进一步地节约电子设备的计算资源消耗，并且由于服务端依托大数据分析处理能力，能够具有更准确的噪音类型的分析效果。

举例而言，可以在采集语音信号之前，调用后置麦克风bm录音3秒钟的噪音信号，将3秒钟的噪音信号上传至服务端，而后获取服务端发送的与噪音信号对应的目标降噪算法之后，可以触发后续步骤。

本公开实施例中，可以采集设定时长（例如，3秒钟）的噪音信号，从而实现在保障后续对语音信号进行针对性的降噪处理效果的同时，避免产生过长的等待时间。

s103：采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号。

可以理解的是，由于采集的语音信号包括：用户的语音信号和噪音信号成分，如果直接对待调整语音信号进行增益调整，即把用户的语音信号和噪音信号成分同步放大，可能会增强语音信号中的噪音信号成分。

从而本公开实施例中，可以在对待调整语音信号进行增益调整之前，采用上述的目标降噪算法预先对语音信号进行降噪处理，其中，采用目标降噪算法对语音信号进行降噪处理得到的语音信号，可以被称为待调整语音信号，即实现预先消除语音信号中的噪音信号成分，并且由于是采用了与噪音信号适配的目标降噪算法来执行降噪处理任务，由此使得降噪处理逻辑更具有针对性，能够获得更好的降噪效果。

s104：对待调整语音信号进行增益调整，以得到目标语音信号。

上述采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号之后，可以对待调整语音信号进行增益调整，以得到目标语音信号。

其中，增益是指针对语音信号的放大倍数。

本公开实施例中，对待调整语音信号进行增益调整，即可以是获取需求的增益，而后参考需求的增益对语音信号进行放大处理，从而得到目标语音信号，其中，需求的增益可以是根据实际的语音信号处理的应用场景需求自适应配置，例如可以根据直播类应用程序的语音采集需求自适应配置，对此不做限制。

如图2所示，图2是本公开另一实施例提出的语音信号处理方法的流程示意图，其中，包括服务端和客户端，客户端在启动后置麦克风bm，来辅助捕获噪音信号之后，可以将噪音信号上传至服务端，由服务端来识别噪音类型，匹配出最优的降噪算法作为目标降噪算法，该目标降噪算法包括了一些降噪处理逻辑（可以是一些程序函数库文件，程序函数库文件可以例如so库文件），而后，将降噪处理逻辑涉及的程序函数库文件下发至客户端，由客户端加载降噪处理逻辑涉及的程序函数库文件以对采集的语音信号进行降噪处理，以及增益调整处理，得到目标语音信号（该目标语音信号的格式可以是脉冲编码调制（pulsecodemodulation，pcm）格式），后续可以基于该目标语音信号支持一些直播类应用程序的直播功能，对此不做限制。

本实施例中，通过采集噪音信号，获取与噪音信号对应的目标降噪算法，采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，以及对待调整语音信号进行增益调整，以得到目标语音信号，由于是在增益调整之前，即采用与噪音信号对应的目标降噪算法对语音信号进行了降噪处理，有效地消除语音信号中的噪音信号成分，实现在增益调整时不会增强噪音信号成分，从而能够有效地避免增强语音信号中的噪音信号成分，有效地辅助提升增益调整处理的效果，提升语音信号的质量，有效地提升语音信号的处理效果。

图3是本公开另一实施例提出的语音信号处理方法的流程示意图。

本实施例的执行主体，可以具体例如运行于电子设备上的采集语音信号类应用程序的客户端，客户端（client）或称为用户端，用于为用户提供本地服务的程序，对此不作限制。

如图3所示，该语音信号处理方，包括：

s301：采集噪音信号。

s301的描述说明可以具体参见上述实施例，在此不再赘述。

s302：将噪音信号发送至服务端，噪音信号具有对应的噪音信号特征。

上述采集到噪音信号时，可以实时地将噪音信号发送至服务端，由服务端从中解析出噪音信号特征，以确定适配的目标降噪算法。

s303：接收服务端发送的与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法，其中，服务端对噪音信号特征进行分析以得到对应的候选降噪算法。

举例而言，服务端在接收到噪音信号后，可以参考解析得到的噪音信号特征确定出噪音类型，可以预先配置多种候选噪音类型，不同的候选噪音类型对应不相同的候选噪音信号特征，从而可以确定与噪音信号特征匹配的候选噪音信号特征，将该匹配的候选噪音信号特征所对应的候选噪音类型作为噪音信号的噪音类型，而后，确定与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法。

其中，与噪音类型对应的候选降噪算法也可以是预先在服务端配置的，具体的配置方式可以参见后续实施例。

s304：采集语音信号。

s304的描述说明可以具体参见上述实施例，在此不再赘述。

s305：处理语音信号，以得到信号强度值。

例如，可以采用相关技术中的信号分析方法处理语音信号，以得到信号强度值，信号分析方法例如时域分析方法、频域分析方法等等，可以采用时域分析方法、频域分析方法分析得到用于描述语音信号的强度的值作为信号强度值，其中，语音信号的强度是语音信号的一种语音特征。

而在一些实际的应用场景中，信号强度值也可以参考其它的一些参数来体现，例如增益值，增益值与信号强度值呈现正相关的关系，例如，增益值越大，则表明信号强度值越大，相应的，增益值越小，则表明信号强度值越小，对此不做限制。

s306：如果信号强度值小于设定阈值，则采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号。

上述在处理语音信号，以得到信号强度值之后，可以将信号强度值与一个设定阈值（target）进行比对，该设定阈值（target）可以具体是根据实际的语音处理场景需求自适应配置的，或者也可以参考噪音信号的音调特征来配置，对此不做限制。

举例而言，可以预先设置一个设定阈值（target），如果输入的语音信号的信号强度值大于或者等于设定阈值（target），则可以直接触发减小语音信号强度的步骤，而如果输入的语音信号的信号强度值小于设定阈值（target），则直接放大语音信号时可能会同时放大其中的噪音信号成分，从而可以先对其进行针对性的降噪处理，而后再调节增益，对此不做限制。

也即是说，本公开实施例中，在需要对语音信号进行放大处理的应用场景中触发先对其进行针对性的降噪处理，而在不需要对语音信号进行放大处理的应用场景下，可以不触发对其进行针对性的降噪处理，能够有效地适配于实际的应用场景需求，使得针对语音信号的改进处理方法能够与已有的处理方式相兼容，使得语音信号处理方法更为合理，且不会占用过多的运算资源消耗。

可选地，另一些实施例中，也可以确定与语音信号对应的增益值，如果增益值小于增益阈值，则采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，从而能够有效地提升降噪处理的灵活性，扩展语音信号处理的应用场景。

也即是说，本公开实施例中也可以支持采用增益值来描述语音信号的强度，从而可以将输入信号对应的增益值与一个设定的增益阈值进行比对，如果增益值小于增益阈值，则采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，而如果增益值大于或者等于增益阈值，则可以直接触发将语音信号的增益值减小为增益阈值。

s307：对待调整语音信号进行增益调整，以得到目标语音信号。

如图4所示，图4是本公开另一实施例提出的语音信号处理方法的流程示意图，其中，在开始阶段，可以首选启动直播类应用程序进行直播，而后启动预配置的supressnoiseservice服务（也即是说，本公开实施例中的语音信号处理方法可以被集成至supressnoiseservice服务之中），而后，基于supressnoiseservice服务调用后置麦克风bm录音3秒钟的噪音信号，将3秒钟的噪音信号上传至服务端，由服务端分析出最优的目标降噪算法，将目标降噪算法相关的程序函数库文件下发至客户端，客户端在本地通过程序函数库文件加载目标降噪算法，此时采集语音信号，并判断语音信号的信号强度值是否小于设定阈值（target），如果小于设定阈值（target），则将本地的初始降噪算法切换为目标降噪算法，采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，而后，对待调整语音信号进行增益调整，将待调整语音信号的信号强度值调整至设定阈值（target），以得到目标语音信号，而后将目标语音信号上传至直播类应用程序进行直播，而如果输入的语音信号的信号强度值大于或者等于设定阈值（target），则可以直接触发减小语音信号强度的步骤。

从而本公开实施例中，由于根据不同环境中的噪音信号进行对应消噪的方案，可以极大提高远距离输入语音信号的信噪比，有效地提升直播的用户体验度，优化了一些场景中（例如直播场景）的语音处理效果，给主播用户带来收益，让拥有该功能的直播类应用程序的客户端能够产生更大的客户粘性。

图5是本公开另一实施例提出的语音信号处理方法的流程示意图。

本实施例的执行主体，可以具体例如服务端，服务端可以向运行于电子设备上的采集语音信号类应用程序的客户端提供相应的后台服务，该服务可以为大数据处理服务、语音处理服务等等，对此不作限制。

如图5所示，该语音信号处理方法，包括：

s501：接收噪音信号。

针对本实施例中的术语的解释可以一并参见上述实施例，在此不再赘述。

s502：获取与噪音信号对应的目标降噪算法。

本公开实施例中，服务端可以获取与噪音类型对应的候选降噪算法（该噪音类型可以是解析噪音信号的噪音信号特征，并根据噪音信号特征匹配得到的，对此不做限制），并将对应的候选降噪算法作为目标降噪算法，将目标降噪算法发送至客户端，以辅助客户端能够实现针对性的语音信号降噪，并且对应的候选降噪算法也可以是依据大数据分析处理能力建模学习得到的，从而能够具有较高的参考价值。

本公开实施例中，在接收噪音信号之前，还可以配置与各种噪音信号对应的降噪算法，而后，将与接收到的噪音信号对应的降噪算法作为目标降噪算法，从而保证目标降噪算法获取的时效性和准确性。

举例而言，服务端可基于大数据分析处理的能力，建模学习得到与不同噪音信号适配的降噪算法作为对应的降噪算法，该适配的降噪算法，指示采用适配的降噪算法处理对应噪音信号时，具有较优的降噪处理效果，对此不做限制。

本公开实施例中，采用把预先采集的噪音信号上传到服务端，进行最优的降噪算法（目标降噪算法）的匹配，而后将最优的降噪算法（目标降噪算法）相关的程序函数库文件下发至客户端，以使客户端所属的电子设备能够采用最优的降噪算法（目标降噪算法）进行降噪处理，从而获得针对性的较好的降噪效果。

另外，由于服务端提供的大数据处理服务可以支持多种电子设备共用，所以随着上传噪音信号越来越多，服务端还可以学习建模得到更多的最优的降噪算法，从而实现不断的自学习，全面地保障降噪效果。

s503：将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理。

上述服务端在获取与噪音信号对应的目标降噪算法后，可以将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理。

本实施例中，通过接收噪音信号，并获取与噪音信号对应的目标降噪算法，以及将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理，由于服务端依托大数据分析处理能力，能够具有更准确的噪音信号的分析效果，且服务端是共用的，由此服务端可以不断提供新的降噪算法，来适配不同的噪音信号，从而能够有效地满足语音处理的个性化应用场景需求。

图6是本公开另一实施例提出的语音信号处理方法的流程示意图。

如图6所示，该语音信号处理方法，包括：

s601：接收客户端发送的噪音信号。

s602：根据与噪音信号对应的噪音信号特征，确定与噪音信号对应的噪音类型。

本公开实施例中，在接收噪音信号之后，还可以分析噪音信号对应的噪音信号特征，而后根据噪音信号特征，确定与噪音信号对应的噪音类型，将噪音类型发送至客户端，以供所述客户端在确定未存储有所述噪音类型对应的目标降噪算法时，返回获取请求，服务端还支持根据所述获取请求获取与所述噪音信号对应的目标降噪算法。

噪音信号特征可以例如噪音信号的声纹特征、音调特征、音色特征等。

其中，服务端可以预先基于大数据处理能力对多种噪音信号特征进行学习分类，以得到多种候选噪音特征，以及与各种候选噪音特征对应的候选噪声类型，而后，可以直接基于已学习分类的结果，实现根据噪音信号特征，确定与噪音信号对应的噪音类型。

可选地，根据噪音信号特征，确定与噪音信号对应的噪音类型，可以是确定与噪音信号特征匹配的候选噪音特征，并将候选噪音特征对应的候选噪音类型作为与噪音信号对应的噪音类型，其中，候选噪音类型的数量为多个，候选噪音类型具有对应的候选噪音特征，从而实现快速准确地确定出与噪音信号对应的噪音类型，且由于候选噪音特征和候选噪音类型是预先基于大数据处理能力对多种噪音信号特征进行学习分类得到的，从而具有较高的可参考性。

s603：将噪音类型发送至客户端，以供所述客户端在确定未存储有所述噪音类型对应的目标降噪算法时，返回获取请求。

上述在确定与噪音信号对应的噪音类型之后，可以将噪音类型发送至客户端，以辅助客户端基于该噪音类型判断是否需要从服务端获取适配的降噪算法，具体可以结合上述实施例进行理解。如当客户端确定已存储噪音类型对应的目标降噪算法时，表明客户端不需要从服务端中获取目标降噪算法，可以直接采用已存储的目标降噪算法对所采集的语音信号进行降噪处理，此时，客户端可以发送通知消息给服务端，告知服务端不需要发送目标降噪算法给客户端，客户端也可以不返回任何消息给服务端。当客户端确定未存储噪音类型对应的目标降噪算法时，表明客户端需要从服务端中获取目标降噪算法，此时，客户端生成获取请求，并将获取请求发送给服务端，以供服务端根据该获取请求返回目标降噪算法。

s604：根据所述获取请求获取与所述噪音信号对应的目标降噪算法。

本公开实施例中，当服务端接收到获取请求后，服务端还可以获取与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法，将目标降噪算法发送至客户端，以辅助客户端能够实现针对性的语音信号降噪，并且对应的候选降噪算法也可以是依据大数据分析处理能力建模学习得到的，从而能够具有较高的参考价值。

本公开实施例中，在接收噪音信号之前，还配置与候选噪音类型对应的候选降噪算法，其中，候选降噪算法被作为与噪音类型对应的候选降噪算法，从而有效地辅助快速获取到与噪音类型对应的目标降噪算法，并且是基于类型维度进行目标降噪算法的匹配，有效地提升了匹配的效率，且使得匹配到的目标降噪算法具有较高的参考价值。

s605：将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理。

本实施例中，实现快速准确地确定出与噪音信号对应的噪音类型，且由于候选噪音特征和候选噪音类型是预先基于大数据处理能力对多种噪音信号特征进行学习分类得到的，从而具有较高的可参考性。如果客户端基于该噪音类型判定需要从服务端获取适配的降噪算法，则服务端还可以获取与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法，将目标降噪算法发送至客户端，以辅助客户端能够实现针对性的语音信号降噪，并且对应的候选降噪算法也可以是依据大数据分析处理能力建模学习得到的，从而能够具有较高的参考价值。

图7是本公开一实施例提出的语音信号处理装置的结构示意图。

如图7所示，该语音信号处理装置70，包括：

第一采集模块701，用于采集噪音信号；

第一获取模块702，用于获取与噪音信号对应的目标降噪算法；

第二采集模块703，用于采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号；以及

调整模块704，用于对待调整语音信号进行增益调整，以得到目标语音信号。

在本公开的一些实施例中，如图8所示，图8是本公开另一实施例提出的语音信号处理装置的结构示意图，第一获取模块702，包括：

获取子模块7021，用于获取本地的初始降噪算法；

确定子模块7022，用于确定与噪音信号对应的噪音类型；

第一处理子模块7023，用于在噪音类型与初始降噪算法匹配时，将初始降噪算法作为目标降噪算法；

第二处理子模块7024，用于在噪音类型与初始降噪算法不匹配时，从服务端获取与噪音信号对应的目标降噪算法。

在本公开的一些实施例中，噪音信号具有对应的噪音信号特征，其中，确定子模块7022，用于：

将噪音信号发送至服务端；

接收服务端发送的与噪音信号特征对应的噪音类型。

在本公开的一些实施例中，第一处理子模块7023，用于：

接收服务端发送的与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法。

在本公开的一些实施例中，第二采集模块703，用于：

理语音信号，以得到信号强度值；

如果信号强度值小于设定阈值，则采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号。

在本公开的一些实施例中，第二采集模块703，用于：

确定与语音信号对应的增益值；

如果增益值小于增益阈值，则采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号。

需要说明的是，前述对语音信号处理方法实施例的解释说明也适用于该实施例的语音信号处理装置，此处不再赘述。

本实施例中，通过采集噪音信号，获取与噪音信号对应的目标降噪算法，采集语音信号，并采用目标降噪算法对语音信号进行降噪处理，以得到待调整语音信号，以及对待调整语音信号进行增益调整，以得到目标语音信号，由于是在增益调整之前，即采用与噪音信号对应的目标降噪算法对语音信号进行了降噪处理，有效地消除语音信号中的噪音信号成分，实现在增益调整时不会增强噪音信号成分，从而能够有效地避免增强语音信号中的噪音信号成分，有效地辅助提升增益调整处理的效果，提升语音信号的质量，有效地提升语音信号的处理效果。

图9是本公开另一实施例提出的语音信号处理装置的结构示意图。

如图9所示，该语音信号处理装置90，包括：

接收模块901，用于接收噪音信号；

第二获取模块902，用于获取与噪音信号对应的目标降噪算法；

发送模块903，用于将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理。

在本公开的一些实施例中，噪音信号具有对应的噪音信号特征，如图10所示，图10是本公开另一实施例提出的语音信号处理装置的结构示意图，语音信号处理装置90，还包括：

确定模块904，用于根据噪音信号特征，确定与噪音信号对应的噪音类型；

其中，发送模块903，还用于将所述噪音类型发送至所述客户端，以供所述客户端在确定未存储有所述噪音类型对应的目标降噪算法时，返回获取请求；

所述第二获取模块902还用于根据所述获取请求获取与所述噪音信号对应的目标降噪算法。

在本公开的一些实施例中，第二获取模块902，用于获取与噪音类型对应的候选降噪算法，并将对应的候选降噪算法作为目标降噪算法。

在本公开的一些实施例中，确定模块904，用于：

确定与噪音信号特征匹配的候选噪音特征；

将候选噪音特征对应的候选噪音类型作为与噪音信号对应的噪音类型，其中，候选噪音类型的数量为多个，候选噪音类型具有对应的候选噪音特征。

在本公开的一些实施例中，如图10所示，语音信号处理装置90，还包括：

配置模块905，用于配置与候选噪音类型对应的候选降噪算法。

需要说明的是，前述对语音信号处理方法实施例的解释说明也适用于该实施例的语音信号处理装置，此处不再赘述。

本实施例中，通过接收噪音信号，并获取与噪音信号对应的目标降噪算法，以及将目标降噪算法发送至客户端，以供客户端根据目标降噪算法对所采集的语音信号进行降噪处理，由于服务端依托大数据分析处理能力，能够具有更准确的噪音信号的分析效果，且服务端是共用的，由此服务端可以不断提供新的降噪算法，来适配不同的噪音信号，从而能够有效地满足语音处理的个性化应用场景需求。

图11是本公开实施例提供的一种电子设备的结构示意图。

该电子设备包括：存储器1101、处理器1102及存储在存储器1101上并可在处理器1102上运行的计算机程序。

处理器1102执行程序时实现上述实施例中提供的语音信号处理方法。

在一种可能的实现方式中，电子设备还包括：

通信接口1103，用于存储器1101和处理器1102之间的通信。

存储器1101，用于存放可在处理器1102上运行的计算机程序。

存储器1101可能包含高速ram存储器，也可能还包括非易失性存储器（non-volatilememory），例如至少一个磁盘存储器。

处理器1102，用于执行程序时实现上述实施例的语音信号处理方法。

如果存储器1101、处理器1102和通信接口1103独立实现，则通信接口1103、存储器1101和处理器1102可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构（industrystandardarchitecture，简称为isa）总线、外部设备互连（peripheralcomponent，简称为pci）总线或扩展工业标准体系结构（extendedindustrystandardarchitecture，简称为eisa）总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器1101、处理器1102及通信接口1103，集成在一块芯片上实现，则存储器1101、处理器1102及通信接口1103可以通过内部接口完成相互间的通信。

处理器1102可能是一个中央处理器（centralprocessingunit，简称为cpu），或者是特定集成电路（applicationspecificintegratedcircuit，简称为asic），或者是被配置成实施本公开实施例的一个或多个集成电路。

本实施例还提供一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述的语音信号处理方法。

为了实现上述实施例，本公开还提出一种计算机程序产品，当计算机程序产品中的指令由处理器执行时，执行上述实施例示出的语音信号处理方法。

需要说明的是，在本公开的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本公开的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本公开的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本公开的实施例所属技术领域的技术人员所理解。

应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（pga），现场可编程门阵列（fpga）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本公开各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本公开的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本公开的限制，本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于神经网络的安全音频水印加注的制作方法

语音信号处理方法、装置、电子设备及存储介质与流程

相关文章

最热文献