一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于数据处理的数据分流方法及系统与流程

2022-02-22 19:16:27 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体而言,涉及一种基于数据处理的数据分流方法及系统。


背景技术:

2.数据处理技术有着诸多应用,如用于进行数据识别或审核等,例如,在一些应用场景中,需要进行监控,如图像监控和音频监控等。其中,音频监控可以是指,对音频数据进行采集,以进行审核识别等。并且,在进行审核识别之后,对于审核通过的音频数据还可以发送给其它设备进行处理以加以利用,或者,可以发送给其它设备进行存储等。但是,经发明人研究发现,在现有技术中,在将审核通过的音频数据发送给其它设备时,由于音频数据的量比较大,可能需要进行分流,其中,分流的方式为随机,如此,可能存在分流效果不佳的问题。


技术实现要素:

3.有鉴于此,本发明的目的在于提供一种基于数据处理的数据分流方法及系统,以改善现有技术中对于音频数据的分流效果不佳的问题。
4.为实现上述目的,本发明实施例采用如下技术方案:
5.一种基于数据处理的数据分流方法,应用于音频数据处理服务器,所述音频数据处理服务器通信连接有多个音频采集设备,所述基于数据处理的数据分流方法包括:
6.对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
7.在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息;
8.基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少一个音频数据集合,并分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备。
9.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息的步骤,包括:
10.统计所述目标音频数据的数量,得到对应的音频统计数量;
11.确定所述音频统计数量与预先配置的统计数量阈值之间的大小关系;
12.在所述音频统计数量大于或等于所述统计数量阈值时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息。
13.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述在所述音频统计数量大于或等于所述统计数量阈值时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息的步骤,包括:
14.在所述音频统计数量大于或等于所述统计数量阈值时,针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积;
15.针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个目标音频数据之间的区域相关性程度信息;
16.针对多个目标音频数据中的每两个目标音频数据,分别对该两个目标音频数据包括的每一帧待处理音频帧进行声源识别处理,得到该两个目标音频数据分别对应的声源标识信息集合,并确定该两个目标音频数据分别对应的声源标识信息集合之间的声源标识信息交集;
17.针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据分别对应的声源标识信息集合和该两个目标音频数据对应的声源标识信息交集,计算得到该两个目标音频数据之间的声源相关性程度信息;
18.针对多个目标音频数据中的每两个目标音频数据,对该两个目标音频数据之间的所述区域相关性程度信息和所述声源相关性程度信息进行相关性融合处理,得到该两个目标音频数据之间的数据相关性程度信。
19.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个目标音频数据之间的区域相关性程度信息的步骤,包括:
20.针对多个目标音频数据中的每两个目标音频数据,确定该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积中的最大面积,并计算该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积与该最大面积之间的面积比例值;
21.针对多个目标音频数据中的每两个目标音频数据,将该两个目标音频数据对应的所述面积比例值,确定为该两个目标音频数据之间的区域相关性程度信息。
22.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据分别对应的声源标识信息集合和该两个目标音频数据对应的声源标识信息交集,计算得到该两个目标音频数据之间的声源相关性程度信息的步骤,包括:
23.针对多个目标音频数据中的每两个目标音频数据,分别统计该两个目标音频数据分别对应的声源标识信息集合中包括的声源标识信息的数量,得到该两个目标音频数据分别对应的声源统计数量,并统计该两个目标音频数据对应的声源标识信息交集中包括的声源标识信息的数量,得到该两个目标音频数据对应的声源交集统计数量;
24.针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的所述声源交集统计数量与对应的两个所述声源统计数量中的较大值之间的数量比例值,并将该数量比例值确定为该两个目标音频数据之间的声源相关性程度信息。
25.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述针对多个目标音频数据中的每两个目标音频数据,对该两个目标音频数据之间的所述区域相关性程度信息和所述声源相关性程度信息进行相关性融合处理,得到该两个目标音频数据之间的数据相关性程度信息的步骤,包括:
26.针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的所述区域相关性程度信息和所述声源相关性程度信息的相关性程度加权和值,其中,所述区域相关性程度信息对应的加权系数小于所述声源相关性程度信息对应的加权系数;
27.针对多个目标音频数据中的每两个目标音频数据,将该两个目标音频数据对应的所述相关性程度加权和值,确定为该两个目标音频数据之间的数据相关性程度信息。
28.在一些优选的实施例中,在上述基于数据处理的数据分流方法中,所述基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少一个音频数据集合,并分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备的步骤,包括:
29.基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行聚类,得到所述多个目标音频数据对应的至少一个音频数据集合,其中,所述至少一个音频数据集合中的每一个所述音频数据集合包括至少一个目标音频数据;
30.分别为所述至少一个音频数据集合中的每一个音频数据集合确定对应的数据传输通道,并基于对应的所述数据传输通道将每一个所述音频数据集合包括的目标音频数据发送给目标音频处理设备。
31.本发明实施例还提供一种基于数据处理的数据分流系统,应用于音频数据处理服务器,所述音频数据处理服务器通信连接有多个音频采集设备,所述基于数据处理的数据分流系统包括:
32.音频数据审核处理模块,用于对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
33.音频数据相关性确定模块,用于在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息;
34.音频数据分流处理模块,用于基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少一个音频数据集合,并分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备。
35.在一些优选的实施例中,在上述基于数据处理的数据分流系统中,所述音频数据
相关性确定模块进一步用于:
36.统计所述目标音频数据的数量,得到对应的音频统计数量;
37.确定所述音频统计数量与预先配置的统计数量阈值之间的大小关系;
38.在所述音频统计数量大于或等于所述统计数量阈值时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息。
39.在一些优选的实施例中,在上述基于数据处理的数据分流系统中,所述音频数据分流处理模块进一步用于:
40.基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行聚类,得到所述多个目标音频数据对应的至少一个音频数据集合,其中,所述至少一个音频数据集合中的每一个所述音频数据集合包括至少一个目标音频数据;
41.分别为所述至少一个音频数据集合中的每一个音频数据集合确定对应的数据传输通道,并基于对应的所述数据传输通道将每一个所述音频数据集合包括的目标音频数据发送给目标音频处理设备。
42.本发明实施例提供的一种基于数据处理的数据分流方法及系统,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据之后,可以在目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息,然后,可以基于多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对多个目标音频数据进行分流处理,如此,由于进行分流处理的依据不再是现有技术中的随机,而是音频数据之间的数据相关性程度信息,使得分流处理的依据较为可靠,从而改善现有技术中对于音频数据的分流效果不佳的问题。
43.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
44.图1为本发明实施例提供的音频数据处理服务器的结构框图。
45.图2为本发明实施例提供的基于数据处理的数据分流方法包括的各步骤的流程示意图。
46.图3为本发明实施例提供的基于数据处理的数据分流系统包括的各功能模块的模块示意图。
具体实施方式
47.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
48.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通
技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
49.如图1所示,本发明实施例提供了一种音频数据处理服务器。其中,所述音频数据处理服务器可以包括存储器和处理器。
50.详细地,在一些示例性的实施例中,所述存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述存储器中可以存储有至少一个可以以软件或固件(firmware)的形式,存在的软件功能模块(计算机程序)。所述处理器可以用于执行所述存储器中存储的可执行的计算机程序,从而实现本发明实施例提供的基于数据处理的数据分流方法。
51.可选地,在一些示例性的实施例中,所述存储器可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。所述处理器可以是一种通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)、片上系统(system on chip,soc)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
52.可选地,在一些示例性的实施例中,图1所示的结构仅为示意,所述音频数据处理服务器还可包括比图1中所示更多或者更少的组件,或具有与图1所示不同的配置,例如,可以包括用于与其它设备(如音频采集设备)进行信息交互的通信单元或通信器件等。
53.结合图2,本发明实施例还提供一种基于数据处理的数据分流方法,可应用于上述音频数据处理服务器。其中,所述基于数据处理的数据分流方法有关的流程所定义的方法步骤,可以由所述音频数据处理服务器实现,所述音频数据处理服务器通信连接有多个音频采集设备。
54.下面将对图2所示的具体流程,进行详细阐述。
55.步骤s100,对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据。
56.在本发明实施例中,所述音频数据处理服务器可以先执行步骤s100,如此,可以对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据。其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧。
57.步骤s200,在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息。
58.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s100之后进一步执行步骤s200,如此,可以在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息。
59.步骤s300,基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少
一个音频数据集合,并分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备。
60.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s200之后进一步执行步骤s300,如此,可以基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少一个音频数据集合。然后,所述音频数据处理服务器可以分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备。
61.基于上述的数据分流方法,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据之后,可以在目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息,然后,可以基于多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对多个目标音频数据进行分流处理,如此,由于进行分流处理的依据不再是现有技术中的随机,而是音频数据之间的数据相关性程度信息,使得分流处理的依据较为可靠,从而改善现有技术中对于音频数据的分流效果不佳的问题。
62.可选地,在一些示例性的实施例中,上述实施例中的步骤s100可以包括以下的步骤s110、步骤s120和步骤s130,以进行审核处理。
63.步骤s110,分别获取多个音频采集设备中的每一个音频采集设备采集得到的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据。
64.在本发明实施例中,所述音频数据处理服务器可以先执行步骤s110,如此,可以分别获取多个音频采集设备中的每一个音频采集设备采集得到的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据。其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且每一个所述待处理音频数据包括多帧待处理音频帧。
65.步骤s120,对所述多个待处理音频数据进行筛选处理,得到所述多个待处理音频数据对应的多个筛选音频数据。
66.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s110之后进一步执行步骤s120,如此,可以对所述多个待处理音频数据进行筛选处理,得到所述多个待处理音频数据对应的多个筛选音频数据。其中,所述多个筛选音频数据中的每一个筛选音频数据包括多帧待处理音频帧。
67.步骤s130,对所述多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据。
68.在本发明实施例中,所述音频数据处理服务器可以再执行步骤s120之后进一步执行步骤s130,如此,可以对所述多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据,具体的审核内容如下。
69.基于上述的步骤s110、步骤s120和步骤s130,在获取到多个音频采集设备采集的多个待处理音频数据之后,可以先对多个待处理音频数据进行筛选处理得到对应的多个筛选音频数据,然后,再对多个筛选音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个筛选音频数据确定为目标音频数据,如此,由于在进行审核处理之后,增加了筛选机制,可以在一定程度上角度需要进行审核处理的待处理音频帧的数量,从而改善现有
技术中对于音频数据的审核存在资源浪费的问题。
70.可选地,在一些示例性的实施例中,上述实施例中的步骤s110可以包括以下步骤,以得到所述多个音频采集设备对应的多个待处理音频数据:
71.首先,判断是否接收到音频审核监控指令;
72.其次,若判定接收到所述音频审核监控指令,则生成所述音频审核监控指令对应的音频审核监控通知信息,并将所述音频审核监控通知信息发送给所述多个音频采集设备,其中,每一个所述音频采集设备用于基于接收到的所述音频审核监控通知信息对所在的音频采集区域进行音频数据采集,得到对应的待处理音频数据;
73.然后,获取每一个所述音频采集设备基于所述音频审核监控通知信息采集的所述待处理音频数据,得到对应的多个待处理音频数据。
74.可选地,在一些示例性的实施例中,所述若判定接收到所述音频审核监控指令,则生成所述音频审核监控指令对应的音频审核监控通知信息,并将所述音频审核监控通知信息发送给所述多个音频采集设备的步骤,可以包括以下步骤:
75.首先,若判定接收到所述音频审核监控指令,则对所述音频审核监控指令进行解析处理,得到所述多个音频采集设备的设备标识信息;
76.其次,若所述设备标识信息为所述音频采集设备的设备身份信息,则基于所述设备身份信息查找到所述多个音频采集设备的网络地址信息,并基于所述网络地址信息将生成的所述音频审核监控通知信息分别发送给所述多个音频采集设备中的每一个音频采集设备;
77.然后,若所述设备标识信息为所述音频采集设备的网络地址信息,则基于所述网络地址信息将生成的所述音频审核监控通知信息分别发送给所述多个音频采集设备中的每一个音频采集设备。
78.可选地,在一些示例性的实施例中,所述获取每一个所述音频采集设备基于所述音频审核监控通知信息采集的所述待处理音频数据,得到对应的多个待处理音频数据的步骤,可以包括以下步骤:
79.首先,获取每一个所述音频采集设备基于所述音频审核监控通知信息采集并发送的待处理音频数据,得到所述多个音频采集设备对应的多个待处理音频数据,其中,所述多个音频采集设备中的每一个所述音频采集设备用于在基于所述音频审核监控通知采集到时长为目标时长的待处理音频数据之后,发送给所述音频数据处理服务,即每间隔目标时长发送一次。
80.可选地,在一些示例性的实施例中,上述实施例中的步骤s120可以包括以下步骤,以得到所述多个待处理音频数据对应的多个筛选音频数据:
81.首先,针对所述多个待处理音频数据中的每一个待处理音频数据,检测该待处理音频数据包括的多帧待处理音频帧中是否存在静音数据;
82.其次,针对所述多个待处理音频数据中的每一个待处理音频数据,若该待处理音频数据包括的多帧待处理音频帧中存在静音数据,则将该待处理音频数据包括的多帧待处理音频帧中的静音数据筛除,得到该待处理音频数据对应的第一筛选音频数据;
83.然后,针对所述多个待处理音频数据中的每一个待处理音频数据,若该待处理音频数据包括的多帧待处理音频帧中不存在静音数据,则将该待处理音频数据确定为对应的
第一筛选音频数据;
84.最后,基于所述多个待处理音频数据对应的多个所述第一筛选音频数据,得到所述多个待处理音频数据对应的多个筛选音频数据。
85.可选地,在一些示例性的实施例中,所述针对所述多个待处理音频数据中的每一个待处理音频数据,检测该待处理音频数据包括的多帧待处理音频帧中是否存在静音数据的步骤,可以包括以下步骤:
86.首先,依次对所述多个待处理音频数据中的每一个待处理音频数据进行遍历,以依次确定出当前遍历的待处理音频数据,并针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于短时傅里叶变换算法对该待处理音频帧进行频域变化处理,得到该待处理音频帧对应的待处理音频频域帧;
87.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于预先训练得到音频帧识别模型对该待处理音频帧对应的待处理音频频域帧进行识别处理,以确定该待处理音频频域帧是否属于静音数据,并在该待处理音频频域帧属于静音数据时将该待处理音频帧的静音表征值赋值为第一数值,以及在该待处理音频频域帧不属于静音数据时将该待处理音频帧的静音表征值赋值为第二数值,其中,所述音频帧识别模型基于包括有静音数据和非静音数据的样本音频训练得到;
88.然后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述静音表征值和该待处理音频帧的多帧相邻待处理音频帧的所述静音表征值进行表征值融合处理,得到该待处理音频帧的代表静音表征值;
89.最后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据。
90.可选地,在一些示例性的实施例中,所述针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述静音表征值和该待处理音频帧的多帧相邻待处理音频帧的所述静音表征值进行表征值融合处理,得到该待处理音频帧的代表静音表征值的步骤,可以包括以下步骤:
91.首先,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于预先确定的目标音频数量,在所述多帧待处理音频帧中确定出该待处理音频帧的所述目标音频数量帧相邻待处理音频帧,并基于每一帧相邻待处理音频帧与该待处理音频帧之间的帧时序关系,确定该待处理音频帧和每一帧相邻待处理音频帧对应的权重系数,其中,该待处理音频帧对应的权重系数最大,每一帧相邻待处理音频帧对应的权重系数与该帧时序关系具有正相关关系,帧时序越近,权重系数越大,并且,全部的权重系数之和为1;
92.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于待处理音频帧和每一帧相邻待处理音频帧对应的权重系数,对该待处理音频帧的所述静音表征值和每一帧相邻待处理音频帧的所述静音表征值进行表征值进行加权求和计算,并将得到的加权求和指确定为该待处理音频帧的代表静音表征值。
93.可选地,在一些示例性的实施例中,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预
先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据的步骤,可以包括以下步骤:
94.首先,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,基于该待处理音频帧的所述代表静音表征值与预先配置的静音表征阈值之间的相对大小关系,确定待处理音频帧是否属于静音数据(如所述第一数值为1,所述第二数值为-1,所述静音表征阈值可以为0,如此,若所述代表静音表征值大于或等于所述静音表征阈值,可以确定待处理音频帧属于静音数据);
95.其次,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,若基于所述代表静音表征值确定该待处理音频帧不属于静音数据,则确定该待处理音频帧不属于静音数据;
96.然后,针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,若基于所述代表静音表征值确定该待处理音频帧属于静音数据,则针对当前遍历的待处理音频数据包括的多帧待处理音频帧中的每一帧待处理音频帧,计算该待处理音频帧的声音信号能量值(可以基于现有的相关能量值计算方式进行计算),并确定该声音信号能量值与预先配置的信号能量阈值之间的相对大小关系;
97.最后,针对当前遍历的待处理音频数据包括的每一帧待处理音频帧,若该待处理音频帧的声音信号能量值大于或等于所述信号能量阈值,则确定该待处理音频帧不属于静音数据,若该待处理音频帧的声音信号能量值小于所述信号能量阈值,则确定该待处理音频帧属于静音数据。
98.可选地,在一些示例性的实施例中,所述基于所述多个待处理音频数据对应的多个所述第一筛选音频数据,得到所述多个待处理音频数据对应的多个筛选音频数据的步骤,可以包括以下步骤:
99.首先,针对所述多个待处理音频数据对应的多个所述第一筛选音频数据中的每两个第一筛选音频数据,确定该两个第一筛选音频数据对应的两个音频采集设备之间的音频采集区域是否存在重合区域;
100.其次,针对所述多个待处理音频数据对应的多个所述第一筛选音频数据中的每两个第一筛选音频数据,若该两个第一筛选音频数据对应的两个音频采集设备之间的音频采集区域存在重合区域,则对该两个第一筛选音频数据进行对比处理,以确定该两个第一筛选音频数据的语音内容是否相同(如分别转换为文本数据,然后,比较文本数据是否相同),并在该两个第一筛选音频数据的语音内容相同时,筛除其中一个第一筛选音频数据,以及将未被筛除的每一个第一筛选音频数据确定为筛选音频数据。
101.可选地,在一些示例性的实施例中,上述实施例中的步骤s130可以包括以下步骤,以对所述筛选音频数据包括的待处理音频帧进行审核处理:
102.首先,针对所述多个筛选音频数据中的每一个筛选音频数据,对该筛选音频数据执行目标音频帧筛选操作,以在该筛选音频数据包括的待处理音频帧中筛选出至少一帧代表音频帧;
103.其次,针对所述多个筛选音频数据中的每一个筛选音频数据,对该筛选音频数据对应的所述至少一帧代表音频帧进行内容违规审核处理(如识别具有预先配置的违规词语或违规语句等),并将审核通过的每一个筛选音频数据确定为目标音频数据。
104.可选地,在一些示例性的实施例中,上述实施例中的所述目标音频帧筛选操作,可以包括以下步骤以筛选出代表音频帧:
105.第一步,对所述筛选音频数据包括的每一帧待处理音频帧进行声源识别处理(可以参照相关现有技术),确定每一帧待处理音频帧对应的至少一个声源标识信息,并为确定的每一个所述声源标识信息创建对应的一个音频帧初始集合,其中,每一个所述声源标识信息用于表征一个声音源,所述音频帧初始集合可以为空集合;
106.第二步,针对每一个所述声源标识信息,该声源标识信息对应的每一帧待处理音频帧分配至该声源标识信息对应的所述音频帧初始集合,得到该声源标识信息对应的待处理音频帧集合,并将包括的所述待处理音频帧对应的声源标识信息的数量最多的一个待处理音频帧集合确定为第一待处理音频帧集合,以及,将包括的所述待处理音频帧对应的声源标识信息的数量不属于最多的每一个待处理音频帧集合为第二待处理音频帧集合;
107.第三步,确定所述第一待处理音频帧集合中的每一帧待处理音频帧的音频采集时刻信息,得到所述第一待处理音频帧集合对应的多条条音频采集时刻信息,并基于该多条音频采集时刻信息确定出所述第一待处理音频帧集合对应的第一音频采集时间区间;
108.第四步,针对每一个所述第二待处理音频帧集合,确定该第二待处理音频帧集合中的每一帧待处理音频帧的音频采集时刻信息,得到该第二待处理音频帧集合对应的多条条音频采集时刻信息,并基于该多条音频采集时刻信息确定出该第二待处理音频帧集合对应的第二音频采集时间区间,以及,在该第二音频采集时间区间与所述第一音频采集时间区间之间存在交集时,将该第二音频采集时间区间确定为第三待处理音频帧集合;
109.第五步,统计所述第一待处理音频帧集合中包括的待处理音频帧的数量,得到所述第一待处理音频帧集合对应的第一音频帧统计帧数,并统计每一个所述第三待处理音频帧集合包括的所述待处理音频帧的数量,以及,将包括的所述待处理音频帧的数量大于或等于所述第一音频帧统计帧数的每一个所述第三待处理音频帧集合,确定为第四待处理音频帧集合;
110.第六步,针对每一个所述第四待处理音频帧集合,在该第四待处理音频帧集合中获取所述第一音频帧统计帧数帧待处理音频帧,并计算该第一音频帧统计帧数帧待处理音频帧与所述第一待处理音频帧集合之间每两帧待处理音频帧的声音信号能量值的差异值的平均值,得到该第四待处理音频帧集合对应的声音信号能量差异均值;
111.第七步,将所述第一待处理音频帧集合包括的每一帧待处理音频帧和对应的声音信号能量差异均值大于或等于预先配置的声音信号能量差异阈值的每一个第四待处理音频帧集合包括的每一帧待处理音频帧,确定为所述筛选音频数据的代表音频帧。
112.可选地,在一些示例性的实施例中,上述实施例中的步骤s200可以包括以下步骤,以确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息:
113.首先,统计所述目标音频数据的数量,得到对应的音频统计数量,并确定所述音频统计数量与预先配置的统计数量阈值之间的大小关系;
114.然后,在所述音频统计数量大于或等于所述统计数量阈值(所述统计数量阈值可以为2等数值)时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息。
115.可选地,在一些示例性的实施例中,所述在所述音频统计数量大于或等于所述统
计数量阈值时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息的步骤,可以包括以下步骤:
116.首先,在所述音频统计数量大于或等于所述统计数量阈值时,针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积;
117.其次,针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个目标音频数据之间的区域相关性程度信息;
118.然后,针对多个目标音频数据中的每两个目标音频数据,分别对该两个目标音频数据包括的每一帧待处理音频帧进行声源识别处理,得到该两个目标音频数据分别对应的声源标识信息集合,并确定该两个目标音频数据分别对应的声源标识信息集合之间的声源标识信息交集;
119.之后,针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据分别对应的声源标识信息集合和该两个目标音频数据对应的声源标识信息交集(即共同具有的声源标识信息),计算得到该两个目标音频数据之间的声源相关性程度信息;
120.最后,针对多个目标音频数据中的每两个目标音频数据,对该两个目标音频数据之间的所述区域相关性程度信息和所述声源相关性程度信息进行相关性融合处理,得到该两个目标音频数据之间的数据相关性程度信息。
121.可选地,在一些示例性的实施例中,所述针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积和该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积,计算得到该两个目标音频数据之间的区域相关性程度信息的步骤,可以包括以下步骤:
122.首先,针对多个目标音频数据中的每两个目标音频数据,确定该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域面积中的最大面积,并计算该两个目标音频数据对应的两个音频采集设备的音频采集区域的区域重合面积与该最大面积之间的面积比例值;
123.其次,针对多个目标音频数据中的每两个目标音频数据,将该两个目标音频数据对应的所述面积比例值,确定为该两个目标音频数据之间的区域相关性程度信息。
124.可选地,在一些示例性的实施例中,所述针对多个目标音频数据中的每两个目标音频数据,基于该两个目标音频数据分别对应的声源标识信息集合和该两个目标音频数据对应的声源标识信息交集,计算得到该两个目标音频数据之间的声源相关性程度信息的步骤,可以包括以下步骤:
125.首先,针对多个目标音频数据中的每两个目标音频数据,分别统计该两个目标音频数据分别对应的声源标识信息集合中包括的声源标识信息的数量,得到该两个目标音频数据分别对应的声源统计数量,并统计该两个目标音频数据对应的声源标识信息交集中包括的声源标识信息的数量,得到该两个目标音频数据对应的声源交集统计数量;
126.其次,针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的所述声源交集统计数量与对应的两个所述声源统计数量中的较大值之间的数量
比例值,并将该数量比例值确定为该两个目标音频数据之间的声源相关性程度信息。
127.可选地,在一些示例性的实施例中,所述针对多个目标音频数据中的每两个目标音频数据,对该两个目标音频数据之间的所述区域相关性程度信息和所述声源相关性程度信息进行相关性融合处理,得到该两个目标音频数据之间的数据相关性程度信息的步骤,可以包括以下步骤:
128.首先,针对多个目标音频数据中的每两个目标音频数据,计算该两个目标音频数据对应的所述区域相关性程度信息和所述声源相关性程度信息的相关性程度加权和值,其中,所述区域相关性程度信息对应的加权系数小于所述声源相关性程度信息对应的加权系数;
129.其次,针对多个目标音频数据中的每两个目标音频数据,将该两个目标音频数据对应的所述相关性程度加权和值,确定为该两个目标音频数据之间的数据相关性程度信息。
130.可选地,在一些示例性的实施例中,上述实施例中的步骤s300可以包括以下步骤,以对所述多个目标音频数据进行分流处理:
131.首先,基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行聚类(可以是现有的任意一种聚类算法),得到所述多个目标音频数据对应的至少一个音频数据集合,其中,所述至少一个音频数据集合中的每一个所述音频数据集合包括至少一个目标音频数据;
132.其次,分别为所述至少一个音频数据集合中的每一个音频数据集合确定对应的数据传输通道(可以是任意确定的一一对应关系),并基于对应的所述数据传输通道将每一个所述音频数据集合包括的目标音频数据发送给目标音频处理设备(进行存储等)。
133.结合图3,本发明实施例还提供一种基于数据处理的数据审核系统,可应用于上述音频数据处理服务器。其中,所述基于数据处理的数据审核系统可以包括以下的各功能模块:
134.音频数据审核处理模块,用于对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据,其中,所述多个音频采集设备中每两个音频采集设备之间的音频采集区域不完全相同,且所述多个待处理音频数据中的每一个所述待处理音频数据包括多帧待处理音频帧;
135.音频数据相关性确定模块,用于在所述目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息;
136.音频数据分流处理模块,用于基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行分流处理,以基于所述多个目标音频数据形成至少一个音频数据集合,并分别将每一个所述音频数据集合通过不同的数据传输通道发送给目标音频处理设备。
137.可选地,在一些示例性的实施例中,上述实施例中的所述音频数据相关性确定模块进一步用于:
138.统计所述目标音频数据的数量,得到对应的音频统计数量;确定所述音频统计数量与预先配置的统计数量阈值之间的大小关系;在所述音频统计数量大于或等于所述统计
数量阈值时,基于预先配置的相关性确定规则确定多个目标音频数据之间的数据相关性程度信息。
139.可选地,在一些示例性的实施例中,上述实施例中的所述音频数据分流处理模块进一步用于:
140.基于所述多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对所述多个目标音频数据进行聚类,得到所述多个目标音频数据对应的至少一个音频数据集合,其中,所述至少一个音频数据集合中的每一个所述音频数据集合包括至少一个目标音频数据;分别为所述至少一个音频数据集合中的每一个音频数据集合确定对应的数据传输通道,并基于对应的所述数据传输通道将每一个所述音频数据集合包括的目标音频数据发送给目标音频处理设备。
141.综上所述,本发明提供的一种基于数据处理的数据分流方法及系统,在对获取的多个音频采集设备采集得到的多个待处理音频数据包括的待处理音频帧进行审核处理,以将审核通过的每一个待处理音频数据确定为目标音频数据之后,可以在目标音频数据为多个时,确定多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息,然后,可以基于多个目标音频数据中每两个目标音频数据之间的数据相关性程度信息对多个目标音频数据进行分流处理,如此,由于进行分流处理的依据不再是现有技术中的随机,而是音频数据之间的数据相关性程度信息,使得分流处理的依据较为可靠,从而改善现有技术中对于音频数据的分流效果不佳的问题。
142.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献