数据处理方法、语音数据处理方法及电子设备与流程

2022-07-02 04:51:46 来源：中国专利 TAG：

1.本技术实施例涉及通信领域，尤其涉及一种数据处理方法、语音数据处理方法及电子设备。

背景技术：

2.在通信场景中，进行语音数据等传输时，通常会伴随多种干扰数据，如回声、噪声等，从而影响语音数据的传输质量。因此，为了提高语音数据的传输质量，会对干扰数据进行处理，如回声消除、语音增强等，从而提取较为纯净的语音数据。
3.传统方式中，在对多种干扰数据进行处理时，通常是依次对不同的干扰数据进行处理。然而，在对某一种干扰数据进行处理时，可能会对语音数据或者其它的干扰数据造成影响，从而改变语音数据或其它干扰数据自身的特性，最终影响纯净语音数据的提取，影响语音数据的传输质量。

技术实现要素：

4.本技术实施例提供一种数据处理方法、语音数据处理方法及电子设备，用以解决现有技术中数据处理质量不佳的问题。
5.第一方面，本技术实施例中提供了一种数据处理方法，包括：
6.将纯净样本数据按照第一处理概率与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据；
7.将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据；
8.将所述纯净样本数据或所述第一处理数据与所述第二类干扰样本数据进行混合，或者将所述纯净样本数据或所述第一处理数据与所述第二处理数据进行混合，获得目标样本数据；
9.利用所述目标样本数据及所述纯净样本数据，训练第二类干扰处理模型；所述第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除所述待处理数据中的第二类干扰数据。
10.第二方面，本技术实施例中提供了一种语音数据处理方法，包括：
11.将纯净语音样本数据按照第一处理概率与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据；
12.将噪声样本数据按照第二处理概率与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据；
13.将所述纯净语音样本数据或所述第一处理数据与所述噪声样本数据进行混合，或者将所述纯净语音样本数据或所述第一处理数据与所述第二处理数据进行混合，获得目标样本数据；
14.利用所述目标样本数据及所述纯净语音样本数据，训练噪声处理模型；所述第二
类干扰处理模型用以对进行回声消除处理之后的待处理语音数据进行语音增强处理以消除所述待处理语音数据中的噪声数据。
15.第三方面，本技术实施例中提供了一种数据处理方法，包括：
16.将纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据；
17.将第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据；
18.选择相应数量的纯净样本数据及第一处理数据，分别与相应数量的第二类干扰样本数据及第二处理数据进行混合，获得多个目标样本数据；
19.利用所述多个目标样本数据及各自对应的纯净样本数据，训练第二类干扰处理模型；所述第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除所述待处理数据中的第二类干扰数据。
20.第四方面，本技术实施例中提供了一种语音数据处理方法，包括：
21.将纯净语音样本数据与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据；
22.将噪声样本数据与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据；
23.选择相应数量的纯净语音样本数据及第一处理数据，分别与相应数量的噪声样本数据及第二处理数据进行混合，获得多个目标样本数据；
24.利用所述多个目标样本数据及各自对应的纯净语音样本数据，训练噪声处理模型；所述噪声处理模型用以对进行回声消除处理之后的待处理语音数据进行语音增强处理以消除所述待处理语音数据中的噪声数据。
25.第五方面，本技术实施例中提供了一种数据处理方法，包括：
26.将纯净样本数据按照第三处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得第三处理数据；
27.将所述纯净样本数据或所述第三处理数据与第二类干扰样本数据进行混合，获得目标样本数据；
28.利用所述目标样本数据及所述纯净样本数据，训练第二类干扰处理模型；所述第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除所述待处理数据中的第二类干扰数据。
29.第六方面，本技术实施例中提供了一种数据处理方法，包括：
30.将第二类干扰样本数据按照第四处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得第四处理数据；
31.将纯净样本数据与所述第二类干扰样本数据或所述第四处理数据进行混合，获得目标样本数据；
32.利用所述目标样本数据及所述纯净样本数据，训练第二类干扰处理模型；所述第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除所述待处理数据中的第二类干扰数据。
33.第七方面，本技术实施例中提供了一种数据处理方法，包括：
34.将待处理数据进行第一类干扰处理，获得预处理数据；
35.利用第二类干扰处理模型对所述预处理数据进行第二类干扰处理，以消除所述预处理数据中的第二类干扰数据，获得目标数据；
36.其中，所述第二类干扰处理模型利用目标样本数据及纯净样本数据训练获得；所述目标样本数据由所述纯净样本数据或第一处理数据与第二类干扰样本数据进行混合，或者由所述纯净样本数据或所述第一处理数据与第二处理数据进行混合获得；所述第一处理数据由纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理获得；所述第二处理数据由第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理获得。
37.第八方面，本技术实施例中提供了一种语音数据处理方法，包括：
38.获取用户语音数据；
39.对所述用户语音数据进行回声消除处理，获得预处理语音数据；
40.利用噪声处理模型对所述预处理语音数据进行语音增强处理，以消除所述预处理语音数据中的噪声数据，获得目标语音数据；其中，所述噪声处理模型利用目标样本数据及纯净语音样本数据训练获得；所述目标样本数据由所述纯净语音样本数据或第一处理数据与噪声样本数据进行混合，或者由所述纯净语音样本数据或所述第一处理数据与第二处理数据进行混合获得；所述第一处理数据由纯净语音样本数据与第一回声样本数据混合之后进行回声消除处理获得；所述第二处理数据由噪声样本数据与第二回声样本数据混合之后进行回声消除处理获得；
41.发送所述目标语音数据。
42.第九方面，本技术实施例中提供了一种电子设备，包括存储组件及处理组件，所述存储组件存储一条或多条计算机程序指令，所述一条或多条计算机程序指令以供所述处理组件调用执行，以实现如第一方面、第三方面、第五方面、第六方面、第七方面任一方面所述的数据处理方法，或者第二方面、第四方面、第八方面任一方面所述的语音数据处理方法。
43.本技术实施例中，通过按照处理概率对纯净样本数据及第二类干扰样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据及第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
44.本技术的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
45.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
46.图1a示出了本技术技术方案应用于其中的一种系统架构示意图；
47.图1b示出了本技术提供的一种数据处理方法一个实施例的流程图；
48.图2示出了本技术提供的一种数据处理方法另一个实施例的流程图；
49.图3示出了本技术提供的一种数据处理方法又一个实施例的流程图；
50.图4示出了本技术提供的一种数据处理方法又一个实施例的流程图；
51.图5示出了本技术提供的一种语音数据处理方法一个实施例的流程图；
52.图6示出了本技术提供的一种噪声处理模型一个实施例的结构示意图；
53.图7示出了本技术提供的一种语音数据处理方法另一个实施例的流程图；
54.图8示出了本技术提供的一种数据处理方法又一个实施例的流程图；
55.图9示出了本技术提供的一种语音数据处理方法又一个实施例的流程图；
56.图10示出了本技术提供的一种系统架构图一个实施例的结构示意图；
57.图11示出了本技术提供的一种数据处理装置一个实施例的结构示意图；
58.图12示出了本技术提供的一种语音数据处理装置一个实施例的结构示意图；
59.图13示出了本技术提供的一种电子设备一个实施例的结构示意图。
具体实施方式
60.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述。
61.在本技术的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。
62.实际应用中，在通信场景中进行数据传输，如语音数据传输时，通常会伴随多种干扰信号，如回声、噪声等，从而影响语音数据的传输质量。因此，为了提高语音数据的传输质量，会对干扰数据进行处理，如回声消除、语音增强等，从而提取较为纯净的语音数据，再进行传输，以提高通信质量。
63.传统方式中，在对多种干扰数据进行处理时，通常是依次对不同的干扰数据进行处理。然而，在对某一种干扰数据进行处理时，可能会对语音数据或者其它的干扰数据造成影响，从而改变语音数据或其它干扰数据自身的特性，最终影响纯净语音数据的提取，影响语音数据的传输质量。例如，对混合有回声及噪声的语音，依次进行回声消除及噪声消除时，进行回声消除处理时可能会对语音数据的特性进行扭曲，损伤语音数据，导致后续进行噪声消除时，可能将损伤后的语音数据识别为噪声数据并进行消除，导致语音数据缺失等，或者进行回声消除处理时可能会对噪声的形态进行扭曲，损伤噪声，导致后续进行噪声消除时，可能无法识别损伤后的噪声，导致噪声消除不彻底等。
64.为了解决上述技术问题，发明人发现，在进行后续干扰数据处理时，通常是无法对经前面干扰处理后的损伤数据进行识别，导致数据处理质量较差。因此，经过一系列思考及试验之后，提出了本技术的技术方案，提供了一种数据处理方法，包括将纯净样本数据按照第一处理概率与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据；将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行
第一类干扰处理，以获得第二处理数据；将所述纯净样本数据或所述第一处理数据与所述第二类干扰样本数据进行混合，或者将所述纯净样本数据或所述第一处理数据与所述第二处理数据进行混合，获得目标样本数据；利用所述目标样本数据及所述纯净样本数据，训练第二类干扰处理模型；所述第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除所述待处理数据中的第二类干扰数据。
65.本技术实施例中，通过按照处理概率对纯净样本数据及第二类干扰样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据及第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
66.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
67.本技术的技术方案应用于通信场景，在一个实际应用中，特别适用于基于rtc(real-time communication，实时通信)技术实现的通信场景中。
68.rtc技术是指能够实时发送和接收文本、音频和视频等的通信技术，适用于直播、点播、视频会议、在线课堂、在线聊天室、游戏互动等场景，以实现纯音频数据、视频数据等的实时传输。本技术的技术方案即可以具体应用于基于rtc实现的直播、点播、视频会议、在线课堂、在线聊天室、游戏互动等通信场景。
69.参见图1a，示出了本技术实施例的技术方案可以应用于其中的一种系统架构示意图，该系统可以包括服务端100以及多个客户端200。多个客户端200之间通过服务端100可以建立通信连接，在rtc场景中，服务端100即用来在多个客户端200之间提供rtc服务，多个客户端200可以分别作为发送端或接收端，通过服务端100实现实时通信。需要说明的是，图中所示客户端数目仅仅是示意性的，本技术不限定于此。
70.用户通过客户端200可与服务端100进行交互以接收其它客户端200发送的数据，或将数据发送至其它客户端200等。在rtc场景中，可以是用户通过客户端200向服务端100发布数据流，客户端200将该数据流推送至订阅该数据流的客户端中。数据流例如可以是音频流、视频流等媒体数据。如在直播场景中，主播用户通过客户端可以实时采集媒体数据，并发送至服务端，不同主播用户的媒体数据通过直播间进行区分，服务端可以将该主播用户的媒体数据推送至进入该主播用户对应直播间的观看用户的客户端。又如在会议场景中，参会用户通过客户端可以实时采集媒体数据并发送至服务端，服务端可以将每个客户端发送的媒体数据推送至其它参会用户的客户端等。
71.可以理解的是，客户端200所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端100，还可以按照本技术实施例提供的技术方案对数据进行干扰处理等，在下文会详细介绍。
72.其中，客户端200与服务端100之间通过网络建立连接。网络为客户端与服务端之间提供了通信链路的介质。网络可以包括各种连接类型，例如有线、无线通信链路或者光纤
电缆等等。
73.其中，客户端200可以为浏览器、app(application，应用程序)、或网页应用如h5(hypertext markup language5，超文本标记语言第5版)应用、或轻应用(也被称为小程序，一种轻量级应用程序)或云应用等，客户端200可以基于服务端提供的相应服务的sdk(software development kit，软件开发工具包)，如基于rtc sdk开发获得等。客户端200可以部署在电子设备中，需要依赖设备运行或者设备中的某些app而运行等。电子设备例如可以具有显示屏并支持信息浏览等，可以是个人移动终端如手机、平板电脑、个人计算机、智能穿戴设备等。在电子设备中通常还可以配置各种其它类应用，例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
74.服务端100可以包括提供各种服务的服务器，例如为多个客户端提供通信服务的服务器，又如为客户端上使用的模型提供支持的用于后台训练的服务器，又如对客户端发送的数据进行处理的服务器等。
75.需要说明的是，服务端100可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器或智能云主机等。
76.需要说明的是，本技术实施例中提供的数据处理方法及语音数据处理方法一般由服务端执行，相应的数据处理装置及语音数据处理装置一般设置于服务端中。但是，在本技术的其它实施例中，客户端也可以与服务端具有相似的功能，从而执行本技术实施例所提供的数据处理方法及语音数据处理方法。在其它实施例中，本技术实施例所提供的数据处理方法及语音数据处理方法还可以是由客户端与服务端共同执行等。
77.图1b为本技术实施例提供的一种数据处理方法一个实施例的流程图，该方法可以包括以下几个步骤：
78.101：将纯净样本数据按照处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得处理数据。
79.102：将纯净样本数据或处理数据与第二类干扰样本数据进行混合，获得目标样本数据。
80.103：利用目标样本数据及纯净样本数据，训练第二类干扰处理模型。
81.其中，第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
82.纯净数据可以指不包含干扰数据的单一数据，如语音数据，图像数据等，干扰数据可以指对纯净数据造成干扰的数据，以纯净数据是语音数据为例，干扰数据例如可以是噪声数据，回声数据等。实际应用中，纯净数据通常与多类干扰数据混合在一起，通过依次对不同的干扰数据进行处理，以从中获得纯净数据。
83.本实施例中，以两类干扰数据为例进行说明。为了便于描述，可以分别称为第一类干扰数据及第二类干扰数据，针对纯净数据中混合有第一类干扰数据及第二类干扰数据的混合数据，可以是先针对第一类干扰数据进行第一类干扰处理，再针对第二类干扰数据进
行第二类干扰处理，以获得纯净数据。例如，第一类干扰数据是回声数据，第二类干扰数据是噪声数据，对应的，第一类干扰数据可以是回声消除处理，第二类干扰处理可以是噪声消除处理，如语音增强处理等，不进行限制。
84.其中，可以是利用第二类干扰处理模型进行上述第二类干扰处理。第二类干扰处理模型可以采用神经网络模型，如卷积神经网络(convolutional neural networks，简称cnn)模型，全卷积神经网络(fully convolutional networks，简称fcn)模型等，可以根据实际应用场景进行设置。该第二类干扰处理模型可以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
85.考虑到进行第一类干扰处理时，该第一类干扰处理可能会对纯净数据造成一定程度的影响，从而影响后续第二类干扰处理的进行。以纯净数据是语音数据，第一类干扰数据是回声数据，第二类干扰数据是噪声数据为例，进行回声消除处理时可能会对语音数据的特性进行扭曲，损伤语音数据，导致后续进行噪声消除时，可能将损伤后的语音数据识别为噪声数据并进行消除，导致语音数据缺失等。因此，在利用样本数据对第二类干扰处理模型进行训练时，可以将经第一类干扰处理损伤的样本数据也作为训练样本，参与第二类干扰处理模型的训练。
86.具体的，针对纯净样本数据，可以将纯净样本数据按照处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得处理数据，该处理数据可以是损伤后的纯净样本数据。处理概率可以预先设置，如设置为5％～10％等，可以根据实际应用场景进行设置。可以将纯净样本数据或处理数据与第二类干扰样本数据进行混合，获得目标样本数据。其中，当纯净样本数据进行与第一类干扰样本数据混合以及第一类干扰处理时，可以是将处理数据与第二类干扰样本数据混合，获得目标样本数据；当纯净样本数据未进行与第一类干扰样本数据混合以及第一类干扰处理时，可以是将纯净样本数据与第二类干扰样本数据混合，获得目标样本数据。之后，可以将目标样本数据作为训练样本，将纯净样本数据作为训练标签，训练上述第二类干扰处理模型，具体的模型训练过程可以参考传统方案中的实现方式，不进行赘述。
87.可选的，纯净样本数据及第二类干扰样本数据可以从训练数据集中获取，第一类干扰样本数据可以预先设置。以第一类干扰样本数据是回声样本数据为例，该回声样本数据可以是预先设置的回声仿真样本，本技术对回声仿真样本的设置不进行限制。
88.本实施例中，通过按照处理概率对纯净样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
89.实际应用中，进行第一类干扰处理时，该第一类干扰处理也可能会对第二类干扰数据造成一定程度的影响，从而影响后续第二类干扰处理的进行。以纯净数据是语音数据，第一类干扰数据是回声数据，第二类干扰数据是噪声数据为例，进行回声消除处理时可能会对噪声数据的形态进行扭曲，损伤噪声数据，导致后续进行噪声消除时，可能无法识别损伤后的噪声数据，导致噪声消除不彻底等。图2为本技术实施例提供的一种数据处理方法另一个实施例的流程图，该方法可以包括以下几个步骤：
90.201：将第二类干扰样本数据按照处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得处理数据。
91.202：将纯净样本数据与第二类干扰样本数据或处理数据进行混合，获得目标样本数据。
92.203：利用目标样本数据及纯净样本数据，训练第二类干扰处理模型。
93.其中，第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
94.本实施例中，针对第二类干扰样本数据，可以将第二类干扰样本数据按照处理概率与第一类干扰样本数据混合之后进行第一类干扰处理，以获得处理数据，该处理数据可以是损伤后的第二类干扰样本数据。为了便于描述，可以将图1所示实施例中的处理概率称为第一处理概率，将获得的处理数据称为第一处理数据，以及将本实施例中的处理概率称为第二处理概率，将获得的处理数据称为第二处理数据。其中，第二处理概率与第一处理概率彼此独立，均可以根据实际应用场景进行设置，如第二处理概率设置为2％～4％等。
95.之后，可以将纯净样本数据与第二类干扰样本数据或第二处理数据进行混合，获得目标样本数据。其中，当第二类干扰样本数据进行与第一类干扰样本数据混合并进行第一类干扰处理时，可以是将纯净样本数据与第二处理数据混合，获得目标样本数据；当第二类干扰样本数据未进行与第一类干扰样本数据混合以及第一类干扰处理时，可以是将纯净样本数据与第二类干扰样本数据混合，获得目标样本数据。将目标样本数据作为训练样本，以及纯净样本数据作为训练标签，训练第二类干扰处理模型，不再进行赘述。
96.本实施例中，通过按照处理概率对第二类干扰样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
97.实际应用中，进行第一类干扰处理时，该第一类干扰处理可能会同时对纯净样本数据及第二类干扰数据造成影响，从而影响后续第二类干扰处理的进行。图3为本技术实施例提供的一种数据处理方法又一个实施例的流程图，该方法可以包括以下几个步骤：
98.301：将纯净样本数据按照第一处理概率与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据。
99.302：将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据。
100.本实施例中，针对纯净样本数据及第二类干扰样本数据，均可以按照各自的处理进行与第一类干扰样本数据混合以及第一类干扰处理。为了便于描述，可以将对纯净样本数据进行混合处理的第一类干扰样本数据称为第一类第一干扰样本数据，将对第二类干扰样本数据进行混合处理的第一类干扰样本数据称为第一类第二干扰样本数据。可选的，第一类第一干扰样本数据与第一类第二干扰样本数据可以相同，也可以不同。
101.303：将纯净样本数据或第一处理数据与第二类干扰样本数据进行混合，或者将纯净样本数据或第一处理数据与第二处理数据进行混合，获得目标样本数据。
102.其中，可以将纯净样本数据与第二类干扰样本数据进行混合，获得目标样本数据，还可以将第一处理数据与第二类干扰样本数据进行混合，获得目标样本数据，还可以将纯净样本数据与第二处理数据进行混合，获得目标样本数据，还可以将第一处理数据与第二处理数据进行混合，获得目标样本数据，可以获得四种不同的目标样本数据。
103.304：利用目标样本数据及纯净样本数据，训练第二类干扰处理模型。
104.其中，第二类干扰处理模型可以用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
105.利用四种不同的目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够从包含纯净样本数据与第二类干扰样本的混合数据中提取纯净数据，从包含第一处理数据与第二类干扰样本数据的混合数据中提取纯净数据，从包含纯净样本数据与第二处理数据的混合数据中提取纯净数据，以及从包括第一处理数据与第二处理数据的混合数据中提取纯净数据。
106.本实施例中，通过按照处理概率对纯净样本数据及第二类干扰样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据及第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
107.可选的，将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行第一类干扰处理时，可以将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据、纯净样本数据混合之后进行第一类干扰处理，以获得第二处理数据。以纯净样本数据是纯净语音样本数据，第一类干扰样本数据是回声样本数据，第二类干扰样本数据是噪声样本数据为例，可以将噪声样本数据按照第二处理概率与纯净语音样本数据及回声样本数据一同进行混合之后，进行回声消除处理，从而获得第二处理数据。其中，第二处理数据中可以包括带有损伤后噪声数据的语音数据。
108.实际应用中，该数据处理方法还可以包括：
109.从训练数据集中随机选择纯净样本数据以及第二类干扰样本数据。
110.其中，训练数据集中可以包括多种类型的纯净样本数据及第二类干扰样本数据。以纯净样本数据是纯净语音样本数据，第二类干扰样本数据是噪声样本数据为例，训练数据集中可以包括不同类型的纯净语音样本数据，如男性语音样本数据，女性语音样本数据，老人语音样本数据，儿童语音样本数据等，可以包括不同类型的噪声样本数据，如空调噪声样本数据，办公室噪声样本数据等。该训练数据集中的样本数据可以预先采集获得。从中随机选择一个纯净样本数据以及第二类干扰样本数据，进行上述处理。
111.在某些实施例中，将纯净样本数据按照第一处理概率与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据的方法可以包括：
112.按照第一处理概率确定是否对纯净样本数据进行第一类干扰处理；
113.若是，将纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据。
114.其中，针对某一纯净样本数据，可以按照第一处理概率对其进行是否与第一类干
扰样本数据混合及第一类干扰处理的判断。若判断结果为是，将纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据。
115.可选的，若判断结果为否，不进行上述处理，维持纯净样本数据不变。
116.对应的，将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据的方法可以包括：
117.按照第二处理概率确定是否对第二类干扰样本数据进行第一类干扰处理；
118.若是，将第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据。
119.针对某一第二类干扰样本数据，可以按照第二处理概率对其进行是否与第一类干扰样本数据混合及第一类干扰处理的判断。若判断结果为是，将第二类干扰样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据。
120.可选的，若判断结果为否，不进行上述处理，维持第二类干扰样本数据不变。
121.进一步的，将纯净样本数据或第一处理数据与第二类干扰样本数据进行混合，或者将纯净样本数据或第一处理数据与第二处理数据进行混合，获得目标样本数据的方法可以包括：
122.在确定纯净样本数据未进行第一类干扰处理，以及第二类干扰样本数据未进行第一类干扰处理的情况下，将纯净样本数据与第二类干扰样本数据进行混合，获得目标样本数据；
123.在确定纯净样本数据进行第一类干扰处理，以及第二类干扰样本数据未进行第一类干扰处理的情况下，将第一处理数据与第二类干扰样本数据进行混合，获得目标样本数据；
124.在确定纯净样本数据未进行第一类干扰处理，以及第二类干扰样本数据进行第一类干扰处理的情况下，将纯净样本数据与第二处理数据进行混合，获得目标样本数据；
125.在确定纯净样本数据进行第一类干扰处理，以及第二类干扰样本数据进行第一类干扰处理的情况下，将第一处理数据与第二处理数据进行混合，获得目标样本数据。
126.如图4所示，为本技术实施例提供的一种数据处理方法又一个实施例的流程图，该方法可以包括以下几个步骤：
127.401：将纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据。
128.本实施例中，针对训练数据集中的任一纯净样本数据，可以进行与第一类第一干扰样本数据混合以及第一类干扰处理，从而获得第一处理数据。
129.402：将第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据。
130.针对训练数据集中的任一第二类干扰样本数据，可以进行与第一类第二干扰样本数据混合以及第一类干扰处理，从而获得第二处理数据。
131.403：选择相应数量的纯净样本数据及第一处理数据，分别与相应数量的第二类干扰样本数据及第二处理数据进行混合，获得多个目标样本数据。
132.从训练数据集中选择相应数量的纯净样本数据及第一处理数据，分别与相应数量的第二类干扰样本数据及第二处理数据进行混合，获得多个目标样本数据，可以有多种实
现方式，将在后续实施例中进行说明，此处不赘述。
133.404：利用多个目标样本数据及各自对应的纯净样本数据，训练第二类干扰处理模型。
134.其中，第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
135.将多个目标样本数据作为训练数据，各自对应的纯净样本数据作为训练标签，训练第二类干扰处理模型。
136.本实施例中，通过对纯净样本数据及第二类干扰样本数据进行预先第一类干扰处理，并选择选择相应数量的处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据及第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
137.获得目标样本数据可以有多种实现方式，下面对此进行说明。
138.作为一种可选的实现方式，可以将第一数量的纯净样本数据与第一数量的第二类干扰样本数据一一对应混合、将第二数量的纯净样本数据与第二数量的第二处理数据一一对应混合、将第三数量的第一处理数据与第三数量的第二类干扰样本数据一一对应混合、以及将第四数量的第一处理数据与第四数量的第二处理数据一一对应混合；其中，第二数量、第三数量、第四数量小于第一数量。
139.例如，第一数量可以是100，可以从训练数据集中选择100个纯净样本数据以及100个第二类干扰样本数据，一一对应混合，获得100个目标样本数据；第二数量可以是50，可以从训练数据集中选择50个纯净样本数据以及50个第二处理数据，一一对应混合，获得50个目标样本数据；第三数量可以是30，训练数据集中选择30个第一处理数据以及30个第二类干扰样本数据，一一对应混合，获得30个目标样本数据；第四数量可以是20，训练数据集中选择20个第一处理数据以及20个第二处理数据，一一对应混合，获得20个目标样本数据。利用上述200个目标样本数据及各自对应的纯净样本数据，训练第二类干扰处理模型。
140.作为另一种可选的实现方式，可以将第五数量的纯净样本数据，分别与从第六数量的第二类干扰样本数据或第七数量的第二处理数据中随机选择的数据进行混合，获得多个目标样本数据；以及将第八数量的第一处理数据，分别与从第六数量的第二类干扰样本数据或第七数量的第二处理数据中随机选择的数据进行混合，获得多个目标样本数据；其中，第五数量大于第八数量，第六数量大于第七数量。
141.作为又一种可选的实现方式，可以将第九数量的纯净样本数据，分别与从第十数量的第二类干扰样本数据以及第十一数量的第二处理数据构成的集合中随机选择的数据进行混合，获得多个目标样本数据；以及将第十二数量的第一处理数据，分别与从第十数量的第二类干扰样本数据以及第十一数量的第二处理数据构成的集合中随机选择的数据进行混合，获得多个目标样本数据；其中，第九数量大于第十二数量，第十数量大于第十一数量。
142.获得目标样本数据还可以有其他实现方式，可以根据实际应用场景进行设置，不进行限制。
143.实际应用中，纯净样本数据可以包括纯净语音样本数据，第一类干扰样本数据可以包括回声样本数据、混响样本数据或啸叫样本数据；第二类干扰样本数据可以包括噪声样本数据。
144.下面以纯净样本数据为纯净语音样本数据，第一类干扰样本数据是回声样本数据，第二类干扰样本数据是噪声样本数据为例，对本技术的技术方案进行说明。如图5所示，为本技术实施例提供的一种语音数据处理方法一个实施例的流程图，该方法可以包括以下几个步骤：
145.501：将纯净语音样本数据按照第一处理概率与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据。
146.502：将噪声样本数据按照第二处理概率与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据。
147.503：将纯净语音样本数据或第一处理数据与噪声样本数据进行混合，或者将纯净语音样本数据或第一处理数据与第二处理数据进行混合，获得目标样本数据。
148.504：利用目标样本数据及纯净语音样本数据，训练噪声处理模型。
149.其中，噪声处理模型用以对进行回声消除处理之后的待处理语音数据进行语音增强处理以消除待处理语音数据中的噪声数据。
150.本实施例中，通过按照处理概率对纯净语音样本数据及噪声扰样本数据进行预先回声消除处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对噪声处理模型进行训练，可以实现噪声处理模型能够识别经回声消除处理后的数据，并对此进行语音增强处理以消除噪声数据，解决了现有技术中进行回声消除处理对纯净语音数据及噪声数据造成影响，导致影响语音增强效果的问题，提高了语音数据处理质量。
151.可选的，可以将噪声样本数据按照第二处理概率与第二回声样本数据、纯净语音样本数据混合之后进行回声消除处理，以获得第二处理数据。
152.可选的，可以优先从训练数据集中随机选择纯净语音样本数据以及噪声样本数据，再按照第一处理概率对纯净语音样本数据进行处理，以及按照第二处理概率对噪声样本数据进行处理。
153.具体的，按照第一处理概率确定是否对纯净语音样本数据进行回声消除处理，若是，将纯净语音样本数据与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据；若否，不进行回声消除处理，维持纯净语音样本数据不变。以及按照第二处理概率确定是否对噪声样本数据进行回声消除处理；若是，将噪声样本数据与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据；若否，不进行回声消除处理，维持噪声样本数据不变。
154.进一步的，在确定纯净语音样本数据未进行回声消除处理，以及噪声样本数据未进行回声消除处理的情况下，可以将纯净语音样本数据与噪声样本数据进行混合，获得目标样本数据；在确定纯净语音样本数据进行第一类干扰处理，以及噪声样本数据未进行回声消除处理的情况下，可以将第一处理数据与噪声样本数据进行混合，获得目标样本数据；在确定纯净语音样本数据未进行回声消除处理，以及噪声样本数据进行回声消除处理的情况下，可以将纯净语音样本数据与第二处理数据进行混合，获得目标样本数据；在确定纯净
语音样本数据进行回声消除处理，以及噪声样本数据进行回声消除处理的情况下，可以将第一处理数据与第二处理数据进行混合，获得目标样本数据。
155.为了便于理解，图6示出了一种噪声处理模型一个实施例的结构示意图。如图6所示，将纯净语音样本数据按照第一处理概率a与第一回声样本数据混合之后进行回声消除处理，获得第一处理数据。将噪声样本数据按照第二处理概率b与第二回声样本数据混合之后进行回声消除处理，获得第二处理数据。在确定纯净语音样本数据未进行回声消除处理，以及噪声样本数据未进行回声消除处理的情况下，将纯净语音样本数据与噪声样本数据进行混合，获得目标样本数据；在确定纯净语音样本数据进行第一类干扰处理，以及噪声样本数据未进行回声消除处理的情况下，将第一处理数据与噪声样本数据进行混合，获得目标样本数据；在确定纯净语音样本数据未进行回声消除处理，以及噪声样本数据进行回声消除处理的情况下，将纯净语音样本数据与第二处理数据进行混合，获得目标样本数据；在确定纯净语音样本数据进行回声消除处理，噪声样本数据进行回声消除处理的情况下，可以将第一处理数据与第二处理数据进行混合，获得目标样本数据。将目标样本数据作为训练样本，输入噪声处理模型，将纯净语音样本数据作为训练标签，对噪声处理模型进行训练。
156.实际应用中，图5所示实施例的技术方案由服务端执行时，在某些实施例中，上述方法还可以包括：将噪声处理模型下发至客户端，以供客户端对进行回声消除处理之后的待处理语音数据进行语音增强处理，具体实现方式将在后续实施例中进行说明。
157.如图7所示，为本技术实施例提供的一种语音数据处理方法一个实施例的流程图，该方法可以包括以下几个步骤：
158.701：将纯净语音样本数据与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据。
159.702：将噪声样本数据与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据。
160.703：选择相应数量的纯净语音样本数据及第一处理数据，分别与相应数量的噪声样本数据及第二处理数据进行混合，获得多个目标样本数据。
161.可选的，可以将第一数量的纯净语音样本数据与第一数量的噪声干扰样本数据一一对应混合、将第二数量的纯净语音样本数据与第二数量的第二处理数据一一对应混合、将第三数量的第一处理数据与第三数量的噪声样本数据一一对应混合、以及将第四数量的第一处理数据与第四数量的第二处理数据一一对应混合；其中，第二数量、第三数量、第四数量小于第一数量。
162.可选的，还可以将第五数量的纯净语音样本数据，分别与从第六数量的噪声样本数据或第七数量的第二处理数据中随机选择的数据进行混合，获得多个目标样本数据；以及将第八数量的第一处理数据，分别与从第六数量的噪声样本数据或第七数量的第二处理数据中随机选择的数据进行混合，获得多个目标样本数据；其中，第五数量大于第八数量，第六数量大于第七数量。
163.可选的，还可以将第九数量的纯净语音样本数据，分别与从第十数量的噪声样本数据以及第十一数量的第二处理数据构成的集合中随机选择的数据进行混合，获得多个目标样本数据；以及将第十二数量的第一处理数据，分别与从第十数量的噪声样本数据以及第十一数量的第二处理数据构成的集合中随机选择的数据进行混合，获得多个目标样本数
据；其中，第九数量大于第十二数量，第十数量大于第十一数量。
164.704：利用多个目标样本数据及各自对应的纯净语音样本数据，训练噪声处理模型。
165.其中，噪声处理模型用以对进行回声消除处理之后的待处理语音数据进行语音增强处理以消除待处理语音数据中的噪声数据。
166.本实施例中，通过对纯净语音样本数据及噪声样本数据进行预先第一类干扰处理，并选择选择相应数量的处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对噪声处理模型进行训练，可以实现噪声处理模型能够识别经回声消除处理后的数据，并对此进行语音增强处理以消除噪声数据，解决了现有技术中进行回声消除处理对纯净语音数据及噪声数据造成影响，导致影响语音增强效果的问题，提高了语音数据处理质量。
167.实际应用中，图7所示实施例的技术方案由服务端执行时，在某些实施例中，上述方法还可以包括：将噪声处理模型下发至客户端，以供客户端对进行回声消除处理之后的待处理语音数据进行语音增强处理，具体实现方式将在后续实施例中进行说明。
168.下面对利用第二类干扰处理模型进行数据处理的过程进行说明，该方法可以由客户端执行。图8是本技术实施例提供的一种数据处理方法又一个实施例的流程图，该方法可以包括以下几个步骤：
169.801：将待处理数据进行第一类干扰处理，获得预处理数据。
170.本实施例中，待处理数据可以指包含纯净数据、第一类干扰数据及第二类干扰数据的混合数据，可以由客户端采集获得。
171.802：利用第二类干扰处理模型对预处理数据进行第二类干扰处理，以消除预处理数据中的第二类干扰数据，获得目标数据。
172.其中，第二类干扰处理模型利用目标样本数据及纯净样本数据训练获得；目标样本数据由纯净样本数据或第一处理数据与第二类干扰样本数据进行混合，或者由纯净样本数据或第一处理数据与第二处理数据进行混合获得；第一处理数据由纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理获得；第二处理数据由第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理获得。
173.第二类干扰处理模型的生成过程在前述实施例已有详细说明，此处不再进行赘述。
174.本实施例中，第二类干扰处理模型在训练时，按照处理概率对纯净样本数据及第二类干扰样本数据进行预先第一类干扰处理，将处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对第二类干扰处理模型进行训练，可以实现第二类干扰处理模型能够识别经第一类干扰处理后的数据，并对此进行第二类干扰处理以消除第二类干扰数据，解决了现有技术中进行第一类干扰处理对纯净数据及第二类干扰数据造成影响，导致影响第二类干扰处理效果的问题，提高了数据处理质量。
175.下面以纯净数据为纯净语音数据，第一类干扰数据是回声数据，第二类干扰数据是噪声数据为例，对利用噪声处理模型进行语音数据处理的过程进行说明，该方法可以由客户端执行。图9是本技术实施例提供的一种语音数据处理方法另一个实施例的流程图，该方法可以包括以下几个步骤：
176.901：获取用户语音数据。
177.本实施例中，用户语音数据可以指包含纯净语音数据、回声数据及噪声数据的混合语音数据，可以由客户端采集获得。
178.902：对用户语音数据进行回声消除处理，获得预处理语音数据。
179.903：利用噪声处理模型对预处理语音数据进行语音增强处理，以消除预处理语音数据中的噪声数据，获得目标语音数据。
180.其中，噪声处理模型利用目标样本数据及纯净语音样本数据训练获得；目标样本数据由纯净语音样本数据或第一处理数据与噪声样本数据进行混合，或者由纯净语音样本数据或第一处理数据与第二处理数据进行混合获得；第一处理数据由纯净语音样本数据与第一回声样本数据混合之后进行回声消除处理获得；第二处理数据由噪声样本数据与第二回声样本数据混合之后进行回声消除处理获得。
181.噪声处理模型的具体训练方式可以详见前文详细实施例中所述，此处不再重复赘述，该噪声处理模型可以是由服务端训练获得并下发至客户端。
182.噪声处理模型的生成过程在前述实施例已有详细说明，此处不再进行赘述。
183.904：发送目标语音数据。
184.本实施例中，噪声处理模型在训练时，按照处理概率对纯净语音样本数据及噪声扰样本数据进行预先回声消除处理，处理后的数据也作为样本数据参与训练，获得目标样本数据，以此目标样本数据对噪声处理模型进行训练，可以实现噪声处理模型能够识别经回声消除处理后的数据，并对此进行语音增强处理以消除噪声数据，解决了现有技术中进行回声消除处理对纯净语音数据及噪声数据造成影响，导致影响语音增强效果的问题，提高了语音数据处理质量。
185.其中，目标语音数据可以是发送至服务端，并经由服务端发送至接收端。当然可以理解的是，为了方便和实现语音数据的传输，目标语音数据可能还需要进行编码、压缩等处理之后再进行传输，本技术对此不进行具体限定。
186.实际应用中，以直播场景为例，获取用户语音数据的方法可以包括：
187.采集直播现场的用户语音数据。该用户语音数据例如可以指主播的语音数据。
188.发送目标语音数据的方法可以包括：
189.将目标语音数据发送至服务端，以由服务端发送至接收端。
190.其中，接收端例如可以指直播场景中观看直播的客户端。
191.当然，本技术实施例的技术方案不仅可以适用于直播场景，也同样适用于其它通信场景，如会议、在线课堂等实时通信场景，用户语音数据可以是发送端采集的，并经过本技术实施例的技术方案进行处理之后获得目标语音数据，再将目标语音数据经由服务端发送至接收端。
192.为了便于理解，一个实际应用中，本技术实施例的技术方案可以应用于如图10所示的通信系统架构中，该通信系统可以为实时通信系统，如直播系统、会议系统、在线聊天室系统或在线课堂系统等，该系统架构的具体实现可以参加图1a中所示，为了便于理解，图10中以设备形象表示客户端和服务端。如图10所示，客户端a可以采集用户语音，并对用户语音数据进行回声消除处理，获得预处理语音数据，以及利用预先训练获得的噪声处理模型对预处理语音数据进行语音增强处理，以消除预处理语音数据中的噪声数据，获得目标
语音数据。之后，将目标语音数据发送至服务端b，以由服务端b发送至客户端c，供客户端c播放目标语音数据。客户端a对语音数据的具体处理方式可以详见前文所述，此处不再重复赘述。
193.此外，可以由服务端b预先训练获得该噪声处理模型，并下发至客户端a中等。
194.图11是本技术实施例提供的一种数据处理装置一个实施例的结构示意图，该装置可以包括以下几个模块：
195.第一处理模块1101，用于将纯净样本数据按照第一处理概率与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据；
196.第二处理模块1102，用于将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据；
197.第一混合模块1103，用于将纯净样本数据或第一处理数据与第二类干扰样本数据进行混合，或者将纯净样本数据或第一处理数据与第二处理数据进行混合，获得目标样本数据；
198.第一训练模块1104，用于利用目标样本数据及纯净样本数据，训练第二类干扰处理模型；第二类干扰处理模型用以对进行第一类干扰处理之后的待处理数据进行第二类干扰处理以消除待处理数据中的第二类干扰数据。
199.在某些实施例中，第二处理模块1102还可以用于将第二类干扰样本数据按照第二处理概率与第一类第二干扰样本数据、纯净样本数据混合之后进行第一类干扰处理，以获得第二处理数据。
200.在某些实施例中，该装置还可以包括：
201.选择模块，用于从训练数据集中随机选择纯净样本数据以及第二类干扰样本数据；
202.第一处理模块1101可以具体用于按照第一处理概率确定是否对纯净样本数据进行第一类干扰处理；若是，将纯净样本数据与第一类第一干扰样本数据混合之后进行第一类干扰处理，以获得第一处理数据；
203.第二处理模块1102可以具体用于按照第二处理概率确定是否对所述第二类干扰样本数据进行第一类干扰处理；若是，将第二类干扰样本数据与第一类第二干扰样本数据混合之后进行第一类干扰处理，以获得第二处理数据；
204.第一混合模块1103可以具体用于在确定纯净样本数据未进行第一类干扰处理，以及第二类干扰样本数据未进行第一类干扰处理的情况下，将纯净样本数据与第二类干扰样本数据进行混合，获得目标样本数据；在确定纯净样本数据进行第一类干扰处理，以及第二类干扰样本数据未进行第一类干扰处理的情况下，将第一处理数据与第二类干扰样本数据进行混合，获得目标样本数据；在确定纯净样本数据未进行第一类干扰处理，以及第二类干扰样本数据进行第一类干扰处理的情况下，将纯净样本数据与第二处理数据进行混合，获得目标样本数据；在确定纯净样本数据进行第一类干扰处理，以及第二类干扰样本数据进行第一类干扰处理的情况下，将第一处理数据与第二处理数据进行混合，获得目标样本数据。
205.图11所述的数据处理装置可以执行图3所示实施例所述的数据处理方法，其实现原理和技术效果不再赘述。对于上述实施例中的数据处理装置其中各个模块、单元执行操
作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
206.图12是本技术实施例提供的一种语音数据处理装置一个实施例的结构示意图，该装置可以包括以下几个模块：
207.第三处理模块1201，用于将纯净语音样本数据按照第一处理概率与第一回声样本数据混合之后进行回声消除处理，以获得第一处理数据；
208.第四处理模块1202，用于将噪声样本数据按照第二处理概率与第二回声样本数据混合之后进行回声消除处理，以获得第二处理数据；
209.第二混合模块1203，用于将纯净语音样本数据或第一处理数据与噪声样本数据进行混合，或者将纯净语音样本数据或第一处理数据与第二处理数据进行混合，获得目标样本数据；
210.第二训练模块1204，用于利用目标样本数据及纯净语音样本数据，训练噪声处理模型。
211.图12所述的语音数据处理装置可以执行图5所示实施例所述的语音数据处理方法，其实现原理和技术效果不再赘述。对于上述实施例中的语音数据处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
212.本技术实施例还提供了一种数据处理装置，该装置可以包括以下几个模块：
213.第五处理模块，用于将待处理数据进行第一类干扰处理，获得预处理数据；
214.第六处理模块，用于利用第二类干扰处理模型对预处理数据进行第二类干扰处理，以消除预处理数据中的第二类干扰数据，获得目标数据。
215.本实施例所述的数据处理装置可以执行图8所示实施例所述的数据处理方法，其实现原理和技术效果不再赘述。对于上述实施例中的数据处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
216.本技术实施例还提供了一种语音数据处理装置，该装置可以包括以下几个模块：
217.获取模块，用于获取用户语音数据；
218.回声处理模块，用于对用户语音数据进行回声消除处理，获得预处理语音数据；
219.语音增强处理模块，用于利用噪声处理模型对预处理语音数据进行语音增强处理，以消除预处理语音数据中的噪声数据，获得目标语音数据；
220.发送模块，用于发送目标语音数据。
221.本实施例所述的语音数据处理装置可以执行图9所示实施例所述的语音数据处理方法，其实现原理和技术效果不再赘述。对于上述实施例中的语音数据处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
222.本技术实施例还提供了一种计算设备，如图13所示，该设备可以包括存储组件1301及处理组件1302；
223.该存储组件1301存储一条或多条计算机程序指令，其中，一条或多条计算机程序指令供处理组件1302调用执行，以实现图1、图2、图3、图4、图8所示的数据处理方法，图5、图7、图9所示的语音数据处理方法。
224.其中，图10中的客户端可以配置在电子设备中。
225.其中，上述处理组件可以包括一个或多个处理器来执行计算机指令，以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。
226.存储组件被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(sram)，电可擦除可编程只读存储器(eeprom)，可擦除可编程只读存储器(eprom)，可编程只读存储器(prom)，只读存储器(rom)，磁存储器，快闪存储器，磁盘或光盘。
227.当然，上述电子设备必然还可以包括其他部件，例如输入/输出接口、通信组件等。
228.输入/输出接口为处理组件和外围接口模块之间提供接口，上述外围接口模块可以是输出设备、输入设备等。通信组件被配置为便于计算设备和其他设备之间有线或无线方式的通信等。
229.本技术实施例还提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被计算机执行时可以实现上述图1、图2、图3、图4、图8所示的数据处理方法，图5、图7、图9所示的语音数据处理方法。该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。
230.本技术实施例还提供了一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序被计算机执行时可以实现上述图1、图2、图3、图4、图8所示的数据处理方法，图5、图7、图9所示的语音数据处理方法。
231.在这样的实施例中，计算机程序可以是从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被处理器执行时，执行本技术的系统中限定的各种功能。
232.需要说明的是，上述电子设备可以为物理设备或者云计算平台提供的弹性计算主机等。其可以实现成多个服务器或终端设备组成的分布式集群，也可以实现成单个服务器或单个终端设备。
233.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
234.以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
235.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
236.最后应说明的是：以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管
参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：豪萨语声纹识别模型的训练方法、识别方法及装置与流程

数据处理方法、语音数据处理方法及电子设备与流程

相关文献

最热文献