声音事件定位方法、装置、家电设备及存储介质与流程

2023-10-26 18:38:10 来源：中国专利 TAG：

1.本公开涉及智能家居技术领域，尤其涉及一种声音事件定位方法、装置、家电设备及存储介质。

背景技术：

2.在智能家居技术领域，家电设备可捕获声音事件，并基于该声音事件做出响应处理，其中，声音事件，是指产生具有特定语义或内容声音的事件，声音例如，风声、走路声、说话声，以及汽车行驶声等，声音事件例如，刮风事件、走路事件、说话事件，以及汽车行驶事件。定位声音事件的产生位置，具有重要的意义。
3.相关技术中，在场景中产生声音时，家电设备会触发图像采集装置捕获场景图像，将该场景图像提供至用户，以基于场景图像定位声音事件的产生位置。
4.这种方式下，声音事件所产生位置的定位效率较低，导致定位效果不佳。

技术实现要素：

5.本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
6.为此，本公开提出一种声音事件定位方法、装置、家电设备及存储介质，能够实现结合声音采集装置的位置信息和目标声音事件的声音信息，对目标声音事件进行快速定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
7.本公开第一方面实施例提出的声音事件定位方法，包括：获取场景声音信号；确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号；根据场景声音信号，确定目标声音事件的声音信息；以及根据位置信息和声音信息，对目标声音事件进行定位。
8.本公开第一方面实施例提出的声音事件定位方法，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再根据场景声音信号，确定目标声音事件的声音信息，以及根据位置信息和声音信息，对目标声音事件进行定位。由此，能够实现结合声音采集装置的位置信息和目标声音事件的声音信息，对目标声音事件进行快速定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
9.本公开第二方面实施例提出的声音事件定位装置，包括：获取模块，用于获取场景声音信号；第一确定模块，用于确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号；第二确定模块，用于根据场景声音信号，确定目标声音事件的声音信息；以及定位模块，用于根据位置信息和声音信息，对目标声音事件进行定位。
10.本公开第二方面实施例提出的声音事件定位装置，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再根据场景声音信号，确定目标声音事件的声音信息，以及根据位置信息和声音信息，对目标声音事件进行定位。由此，能够实现结合声音采集装置的位置信息和目标声音事件的声音信息，
对目标声音事件进行快速定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
11.本公开第三方面实施例提出的家电设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现如本公开第一方面实施例提出的声音事件定位方法。
12.本公开第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开第一方面实施例提出的声音事件定位方法。
13.本公开第五方面实施例提出了一种计算机程序产品，当计算机程序产品中的指令由处理器执行时，执行如本公开第一方面实施例提出的声音事件定位方法。
14.本公开附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本公开的实践了解到。
附图说明
15.本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
16.图1是本公开一实施例提出的声音事件定位方法的流程示意图；
17.图2是本公开另一实施例提出的声音事件定位方法的流程示意图；
18.图3是本公开另一实施例提出的声音事件定位方法的流程示意图；
19.图4是本公开另一实施例提出的声音事件定位方法的流程示意图；
20.图5是本公开另一实施例提出的声音事件定位方法的流程示意图；
21.图6是本公开一实施例提出的声音事件定位装置的结构示意图；
22.图7是本公开另一实施例提出的声音事件定位装置的结构示意图；
23.图8示出了适于用来实现本公开实施方式的示例性家电设备的框图。
具体实施方式
24.下面详细描述本公开的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本公开，而不能理解为对本公开的限制。相反，本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
25.图1是本公开一实施例提出的声音事件定位方法的流程示意图。
26.本公开实施例以声音事件定位方法被配置为声音事件定位装置中来举例说明。
27.本公开实施例中声音事件定位方法可以被配置在声音事件定位装置中，该声音事件定位装置可以设置在服务器中，或者也可以设置在家电设备中，本公开实施例对此不作限制。
28.在本公开的一些实施例中，家电设备可以是任何适于实施的家电设备类型，例如冰箱、空调、智能音箱等家电设备等，本公开实施例对此不作限制。
29.需要说明的是，本公开实施例的执行主体，在硬件上可以例如为服务器或者家电设备中的中央处理器(central processing unit，cpu)，在软件上可以例如为服务器或者
家电设备中的相关的后台服务，对此不作限制。
30.如图1所示，该声音事件定位方法，包括：
31.s101：获取场景声音信号。
32.其中，场景声音信号是指在场景中所采集的声音，该场景声音信号可以是在场景中所采集的环境声音，具体可以例如场景中的雨声，风声等，或者，该场景声音信号还可以是针对家居场景中的某一个具体的人和/或物体采集的声音，具体可以例如为，家居场景中人的说话声音，家居场景中家电设备的警报声，对此不做限制。
33.本公开实施例中，获取场景声音信号，可以是在家居场景中预先设置相应的声音采集装置，并将声音采集装置采集得到的家居场景中的声音作为场景声音信号，或者，获取场景声音信号，还可以是对包含场景声音信号的视频流进行解析处理，以从该视频流中解析得到相应的声音信号，并将该声音信号作为场景声音信号，当然，也可以采用其他任意可能的方式，获取场景声音信号，对此不做限制。
34.s102：确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号。
35.其中，声音采集装置可以用于采集场景声音信号，该声音采集装置可以具体例如为麦克风，该声音采集装置也可以被配置在家电设备中，或者该声音采集装置也可以和家电设备集成设置，对此不做限制。
36.其中，用于对声音采集装置的位置进行描述的信息，即可以被称为位置信息，该位置信息可以具体例如为，某个声音采集装置相应多个声音采集装置的位置编码信息，声音采集装置在场景中的空间位置信息，具体可以例如为声音采集装置在场景中的空间位置坐标，对此不做限制。
37.本公开实施例中，确定声音采集装置的位置信息，可以是获取声音采集装置在场景中的空间位置坐标，例如，可以是采用飞行时间测距(time of flight，tof)相机采集该场景的点云数据，并根据前述采集得到点云数据，确定声音采集装置在场景中的空间位置坐标，并将该空间位置坐标作为声音采集装置的位置信息，对此不做限制。
38.另一些实施例中，声音采集装置的数量可以为多个，即可以由多个声音采集装置同时采集场景声音信号，由此，可以对多个声音采集装置进行编号处理，即可以按照多个声音采集装置的空间位置排列情况，依次对多个声音采集装置进行编号处理，并将各个声音采集装置对应的编号，作为声音采集装置的位置信息，对此不做限制。
39.s103：根据场景声音信号，确定目标声音事件的声音信息。
40.其中，声音事件是指产生具有特定语义或内容声音的事件，该声音事件可以具体例如为家电设备报警事件，小孩啼哭事件等，相应地，多个声音事件中，当前待对其进行定位处理的声音事件，即可以被称为目标声音事件。
41.其中，用于对目标声音事件进行描述的信息，即可以被称为声音信息，该声音信息可以具体例如为目标声音事件的语义信息，内容信息，特征信息，还可以是目标声音事件发生的时间信息等，对此不做限制。
42.一些实施例中，根据场景声音信号，确定目标声音事件的声音信息，可以是从场景声音信号中确定与目标声音事件对应的部分声音信号，而后，采用特征提取算法提取与该部分声音信号对应的特征信息，并将该特征信息作为目标声音事件的声音信息，对此不做
限制。
43.另一些实施例中，根据场景声音信号，确定目标声音事件的声音信息，还可以是在采用声音采集装置采集场景声音信号时，确定目标声音事件相应的声音信号的采集时间，并将该采集时间作为目标声音事件的声音信息，对此不做限制。
44.s104：根据位置信息和声音信息，对目标声音事件进行定位。
45.本公开实施例在确定声音采集装置的位置信息和目标声音事件的声音信息后，可以根据位置信息和声音信息，对目标声音事件进行定位。
46.一些实施例中，可以是基于预训练的深度学习模型，实现根据位置信息和声音信息，对目标声音事件进行定位，即可以是在确定位置信息和声音信息后，将前述确定的位置信息和声音信息共同输入至预训练的深度学习模型中，由预训练的深度学习模型对目标声音事件进行定位，以确定目标声音事件的发生位置，对此不做限制。
47.或者，根据位置信息和声音信息，对目标声音事件进行定位，还可以是在确定位置信息和声音信息后，对前述所确定的位置信息和声音信息进行解析处理，以得到相应的解析处理结果，并根据前述的解析处理结果，确定目标声音事件的发生位置，由此，实现对目标声音事件进行定位，对此不做限制。
48.本公开实施例中，事件定位方法可以具体例如是应用于智能家居场景中，即可以是在由智能家电设备采集其所在场景(例如，住宅，对此不做限制)的场景声音信号，并根据场景声音信号，确定用户需要定位的目标声音事件的声音信息，再将定位处理结果反馈至用户或者家电设备，从而便于用户或者家电设备可以根据定位处理结果快速作出响应举措。
49.举例而言，当智能家电设备采集到住宅内存在火灾警报的场景声音信号时，智能家电设备可以基于其采集得到的场景声音信号对该火灾事件进行定位，以火灾事件的发生位置，而后，可以将火灾事件的发生位置反馈至用户，用户可以基于其接收到的发生位置，作出灭火，报警等相应举措，还可以是将火灾事件的发生位置反馈至家电设备，家电设备可以在接收到该发生位置时，可以作出将火灾事件和发生位置反馈至云端网络平台，对此不做限制。
50.当将本公开实施例描述的声音事件定位方法用在上述智能家居场景时，使得家电设备智能实时对住宅内发生的声音事件进行检测定位，并能够基于定位处理结果，及时作出响应，从而使得家居设备可以具备更高的智能化程度。
51.本实施例中，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再根据场景声音信号，确定目标声音事件的声音信息，以及根据位置信息和声音信息，对目标声音事件进行定位。由此，能够实现结合声音采集装置的位置信息和目标声音事件的声音信息，对目标声音事件进行快速定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
52.图2是本公开另一实施例提出的声音事件定位方法的流程示意图。
53.如图2所示，该声音事件定位方法，包括：
54.s201：获取场景声音信号。
55.s202：确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号。
56.s201-s202的描述说明可以具体参见上述实施例，在此不再赘述。
57.s203：确定场景声音信号的场景声音特征。
58.其中，场景声音信号可以具有相应的特征信息，该特征信息即可以被称为场景声音特征，该场景声音特征可以具体例如为场景声音的语谱图，场景声音的梅尔频谱等，对此不做限制。
59.本公开实施例中，确定场景声音信号的场景声音特征，可以是在获取场景声音信号(s)后，对场景声音信号进行分帧处理，以得到多个场景声音信号帧，而后分别对多个场景声音信号进行加窗处理，并对加窗处理后的每一个场景声音信号帧进行傅里叶变换处理，并将前述傅里叶变换处理结果输入至梅尔滤波器中，以得到梅尔滤波器输出的梅尔频谱，并将该梅尔频谱作为场景声音信号的场景声音特征，对此不做限制。
60.s204：根据场景声音特征，确定预测声音事件。
61.本公开实施例在确定场景声音信号的场景声音信号的场景声音特征后，可以根据场景声音特征，对声音事件进行预测，以确定预测声音事件。
62.一些实施例中，根据场景声音特征，确定预测声音事件，可以是在确定场景声音后，对场景声音特征解析处理，例如，可以对场景声音特征的成分进行解析，并在确定场景声音特征中包含汽车鸣笛这一声音特征时，确定该场景声音特征对应的预测声音事件为汽车驾驶事件，或者，也可以采用其他任意可能的方式，实现根据场景声音特征，确定预测声音事件，例如，模型预测的方式，特征匹配的方式等，对此不做限制。
63.可选地，一些实施例中，根据场景声音特征，确定预测声音事件，可以是根据场景声音特征，确定候选声音事件，并确定与候选声音事件分别对应的事件概率值，再从事件概率值中，选取大于概率阈值的事件概率值所属候选声音事件作为预测声音事件，由于事件概率值能够用于对候选声音事件中包含事件内容的可靠性程度进行描述，从而能够在将大于概率阈值的事件概率值所属候选声音事件作为预测声音事件时，能够有效地滤除噪声信号等不包含事件内容的声音事件，避免无效处理事态的发生，进而能够有效地节约计算资源，有效地提升声音事件的定位效率。
64.可以理解的是，由于场景声音信号中可能包括不能用于对声音事件进行描述的声音信号(例如，噪声信号)，从而在根据场景声音信号对应的场景声音特征，确定与场景声音特征对应的声音事件时，确定得到的声音事件中可能包括与噪声信号对应的声音事件，该声音事件并不能对事件内容进行表征，此时，如果将与场景声音特征对应的全部声音事件(该声音事件即可以被称为候选声音事件)全部用于后续的声音事件定位过程，则会存在无效处理的情况。
65.为了解决上述无效处理的情况，可以引入与候选声音事件对应的事件概率值，以从候选声音事件中确定出包含事件内容的预测声音事件。
66.其中，事件概率值可以用于描述该候选声音事件中包含事件内容的概率，事件概率值越大，则表明该候选声音事件中包含事件内容的可靠性更高，反之，事件概率值越大，则表明该候选声音事件中包含事件内容的可靠性更低，即该候选声音事件有较大可能对应噪声信号。
67.其中，针对事件概率值预先设定的界限值，即可以被称为概率阈值，该概率阈值可以结合实际业务场景中的声音事件定位需求自适应配置，对此不做限制。
68.本公开实施例中，可以对场景声音特征进行解析处理，以确定与场景声音特征对应的候选声音事件，并确定与候选声音事件分别对应的事件概率值，而后，可以对事件概率值和概率阈值进行比对处理，并在事件概率值大于概率阈值时，将该事件概率值所属候选声音事件作为预测声音事件。
69.s205：如果预测声音事件与设定声音事件相匹配，则将预测声音事件作为目标声音事件。
70.其中，设定声音事件可以是在声音事件定位方法执行的初始阶段，用户预先确定的期望对其进行定位处理的声音事件，该设定声音事件可以具体例如为汽车行驶事件，说话事件等，对此不做限制。
71.本公开实施例在根据场景声音特征，确定预测声音事件后，可以对预测声音事件和设定声音事件进行匹配处理，并在预测声音事件与设定声音事件相匹配，则将预测声音事件作为目标声音事件。
72.本公开实施例中，通过确定场景声音信号的场景声音特征，并根据场景声音特征，确定预测声音事件，再在预测声音事件与设定声音事件相匹配时，将预测声音事件作为目标声音事件，由于是结合预先确定的设定声音事件确定目标声音事件，从而能够实现快速对目标声音事件进行定位，使得确定得到的目标声音事件能够有效地满足用户的声音事件定位需求。
73.s206：根据场景声音信号，确定目标声音事件的声音信息。
74.s207：根据位置信息和声音信息，对目标声音事件进行定位。
75.s206-s207的描述说明可以具体参见上述实施例，在此不再赘述。
76.本实施例中，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再通过确定场景声音信号的场景声音特征，并根据场景声音特征，确定预测声音事件，再在预测声音事件与设定声音事件相匹配时，将预测声音事件作为目标声音事件，由于是结合预先确定的设定声音事件确定目标声音事件，从而能够实现快速对目标声音事件进行定位，使得确定得到的目标声音事件能够有效地满足用户的声音事件定位需求，并根据场景声音信号，确定目标声音事件的声音信息，再根据位置信息和声音信息，对目标声音事件进行定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
77.图3是本公开另一实施例提出的声音事件定位方法的流程示意图。
78.如图3所示，该声音事件定位方法，包括：
79.s301：获取场景声音信号。
80.s302：确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号。
81.s301-s302的描述说明可以具体参见上述实施例，在此不再赘述。
82.s303：从场景声音信号中，提取目标声音事件的事件声音信号。
83.其中，场景声音信号中与目标声音事件对应的声音信号，即可以被称为事件声音信号。
84.本公开实施例中，从场景声音信号中，提取目标声音事件的事件声音信号，可以是根据目标声音事件对场景声音信号进行剪切处理，以从场景声音信号中剪切得到部分声音
信号，并将该部分声音信号作为目标声音事件的事件声音信号，对此不做限制。
85.s304：根据事件声音信号，确定声音信息。
86.其中，事件声音信号可以具有一些相关的信息，该信息即可以被称为声音信息，该声音信息可以具体例如为事件声音信号的内容信息，事件声音信号的采集时间信息等，对此不做限制。
87.也即是说，本公开实施例中，根据事件声音信号，确定声音信息，可以是确定事件声音信号的采集时间，并将该采集时间作为事件声音信号对应的声音信息，或者，根据事件声音信号，确定声音信息，还可以是在确定事件声音信号后，对前述确定事件声音信号进行特征提取，以得到事件声音信号相应的特征信息，并将该特征信息作为声音信息，对此不做限制。
88.本实施例中，由于是先从场景声音信号中，提取目标声音事件的事件声音信号，从而能够基于目标声音事件从场景声音信号中识别得到事件声音信号，有效地降低其他噪声信号对后续声音事件定位过程所产生的干扰，而后可以在根据事件声音信号，确定声音信息时，有效地保障声音信息可以与事件声音信号相适配，有效地提升声音信息的确定效果。
89.s305：根据位置信息和声音信息，对多个目标声音事件同时进行定位。
90.可以理解的是，本公开实施例中，在针对场景采集场景声音信号时，场景声音信号可以对应多个目标声音事件，即例如，在一个智能场景中可能同时存在音乐播放事件，家电设备报警事件等多个声音事件，对此不做限制。
91.由此，本公开实施例描述的声音事件定位方法，可以支持根据位置信息和声音信息，对多个目标声音事件信息同时进行定位，以高效地同时确定场景声音信号相应的多个目标声音事件相应的事件发生位置，并能够根据不同目标声音事件的定位处理结果，及时作出相应响应举措，从而有效地提升声音事件定位方法的适用性。
92.本实施例中，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再从场景声音信号中，提取目标声音事件的事件声音信号，从而能够基于目标声音事件从场景声音信号中识别得到事件声音信号，有效地降低其他噪声信号对后续声音事件定位过程所产生的干扰，而后可以在根据事件声音信号，确定声音信息时，有效地保障声音信息可以与事件声音信号相适配，有效地提升声音信息的确定效果，再根据位置信息和声音信息，对多个目标声音事件信息同时进行定位，以高效地同时确定场景声音信号相应的多个目标声音事件相应的事件发生位置，并能够根据不同目标声音事件的定位处理结果，及时作出相应响应举措，从而有效地提升声音事件定位方法的适用性。
93.图4是本公开另一实施例提出的声音事件定位方法的流程示意图。
94.如图4所示，该声音事件定位方法，包括：
95.s401：获取场景声音信号。
96.s402：确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号。
97.s403：从场景声音信号中，提取目标声音事件的事件声音信号。
98.s401-s403的描述说明可以具体参见上述实施例，在此不再赘述。
99.s404：对事件声音信号进行目标处理，得到目标声音信号。
100.本公开实施例在从场景声音信号中，提取目标声音事件的事件声音信号后，可以对声音事件信息进行目标处理，并将前述进行目标处理所得到的声音信号作为目标声音信号。
101.一些实施例中，对事件声音信号进行目标处理，可以是对事件声音信号进行拆分处理，以得到多个声音信号片段，并将该多个声音信号片段共同作为目标声音信号，或者，对事件声音信号进行目标处理，还可以是对事件声音信号进行标识处理(例如，可以在事件声音信号的起始两端增设相应的标识符)，并将前述进行标识处理所得到的声音信号作为目标声音信号，对此不做限制。
102.可选地，另一些实施例中，对事件声音信号进行目标处理，得到目标声音信号，可以是对事件声音信号进行降噪，得到目标声音信号，还可以是对事件声音信号进行增强，得到目标声音信号，由于是对事件声音信号进行降噪和/或增强处理，从而能够使得处理得到的目标声音信号可以具有更高的纯净度，从而能够更加有利于于后续的声音事件定位方法的实现，此外，当基于前述处理得到的目标声音信号，执行后续的声音事件定位方法时，能够在较大程度上有效地提升声音事件定位的准确度。
103.也即是说，本公开实施例中，可以是在获取事件声音信号后，将事件声音信号输入至支持对声音进行降噪处理的滤波器(例如，自适应滤波器(least mean square，lms))中，由该滤波器对事件声音信号进行降噪处理，以得到目标声音信号，或者，还可以是在获取事件声音信号后，将事件声音信号输入至支持对声音进行增强处理的滤波器(例如，卡尔曼滤波器)中，由该滤波器对事件声音信号进行增强处理，以得到目标声音信号，对此不做限制。
104.s405：确定事件声音信号相对于场景声音信号的特征分布信息。
105.其中，事件声音信号可以是场景声音中的部分声音信号片段，即事件声音信号可以是相对于场景声音信号分布的声音信号片段，相应的，用于对该分布情况进行描述的信息，即可以被称为特征分布信息，该特征分布信息可以具体例如为，事件声音信号在场景声音信号中的起止时间信息，事件声音信号在场景声音信号中的分布比例信息等，对此不做限制。
106.一些实施例中，确定事件声音信号相对于场景声音信号的特征分布信息，可以是在确定事件声音信号后，确定与该事件声音信号对应的发生时间，并确定与场景声音信号对应的发生时间，再根据前述两个发生时间，确定事件声音信号在场景声音信号中的分布比例，并将该分布比例作为事件声音信号相对于场景声音信号的特征分布信息，对此不做限制。
107.或者，还可以采用其他任意可能的方法，确定事件声音信号相对于场景声音信号的特征分布信息，例如可以是确定事件声音信号在场景声音信号中的起止时间信息，并将事件声音信号在场景声音信号中的起止时间信息，作为声音信号相对于场景声音信号的特征分布信息，对此不做限制。
108.可选地，一些实施例中，确定事件声音信号相对于场景声音信号的特征分布信息，可以是确定事件声音信号相对场景声音信号的起止时间特征，并将起止时间特征作为特征分布信息，由于是将事件声音信号相对场景声音信号的起止时间特征作为特征分布信息，从而使得特征能够准确地对场景声音信号的起止时间进行表征，从而能够在后续的声音事件定位方法的执行过程中，能够基于特征分布信息快速从对事件声音信号相对场景声音信
号的起止时间进行定位，进而能够有效地满足后续声音事件定位处理的处理需求。
109.其中，起止时间特征可以用于对事件声音信号在场景声音信号中的起始时间和结束时间进行描述，该起止时间特征可以具体例如为，事件声音信号在场景声音信号中的开始时间，事件声音信号在场景声音信号中的结束时间等，对此不做限制。
110.本公开实施例中，可以确定事件声音信号在场景声音信号中的开始时间和结束时间，并将该开始时间和结束时间作为起止时间特征。
111.举例而言，确定事件声音信号在场景声音信号中的开始时间和结束时间，可以是在确定事件声音信号后，将事件声音信号输入至预训练的深度学习模型之中，以得到该预训练的深度学习模型输出的事件声音信号在场景声音信号中的开始时间和结束时间，并将该开始时间和结束时间作为起止时间特征，对此不做限制。
112.s406：将目标声音信号和特征分布信息作为声音信息。
113.本公开实施例在确定目标声音信号和特征分布信息后，可以将目标声音信号和特征分布信息共同作为声音信息，由此，能够有效地提升声音信息的可参考性，从而能够基于声音信息有效地满足后续声音事件定位的处理需求。
114.s407：根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位。
115.本公开实施例中，在确定位置信息、目标声音信号及起止时间特征之后，可以根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位。
116.举例而言，假设前述确定得到的位置信息为m_k，则可以对位置信息进行量化和映射，具体可以表示为g(m_k)，并确定目标声音信号为s1_ik，以及起止时间特征为t_ik＝[s_ik，e_ik]后，可以引入映射函数fun2(x)，实现根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位，以确定目标声音事件的发生位置，该过程可以具体表示为：
[0117]
pos＝fun2([g(m_k)，t_ik,s_ik])；
[0118]
其中，pos为目标声音事件的发生位置，k和i为函数变量。
[0119]
本公开实施例中，由于是根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位，从而能够基于声音维度的数据，实现对声音事件进行定位处理，有效地避免因采集其他维度数据所带来的成本和时间的浪费，在有效地保障声音事件定位效果的同时，更加易于部署和操作，从而使得声音事件定位方法能够具有更佳的适用性。
[0120]
本实施例中，通过获取场景声音信号，再确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，并确定目标声音信号和特征分布信息，再将目标声音信号和特征分布信息共同作为声音信息，由此，能够有效地提升声音信息的可参考性，从而能够基于声音信息有效地满足后续声音事件定位的处理需求，再根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位，从而能够基于声音维度的数据，实现对声音事件进行定位处理，有效地避免因采集其他维度数据所带来的成本和时间的浪费，在有效地保障声音事件定位效果的同时，更加易于部署和操作，从而使得声音事件定位方法能够具有更佳的适用性。
[0121]
图5是本公开另一实施例提出的声音事件定位方法的流程示意图。
[0122]
如图5所示，该声音事件定位方法，包括：
[0123]
s501：获取场景声音信号。
[0124]
s502：确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景
声音信号。
[0125]
s503：根据场景声音信号，确定目标声音事件的声音信息。
[0126]
s501-s503的描述说明可以具体参见上述实施例，在此不再赘述
[0127]
s504：根据起止时间特征，确定信号差异信息。
[0128]
其中，不同目标声音信号之间可以存在差异，该差异可以具体例如为频率差异，内容差异等，对此不做限制。
[0129]
相应地，用于对该差异情况进行描述的信息，即可以被称为信号差异信息，该信号差异信息可以具体例如为频率差异信息，内容差异信息等，对此不做限制。
[0130]
一些实施例中，根据起止时间特征，确定信号差异信息，可以是在确定起止时间特征后，对起止时间特征进行特征解析处理，并根据前述特征解析处理结果，确定信号差异信息。
[0131]
举例而言，对起止时间特征进行特征解析处理，可以是采用特征解析算法对起止时间特征进行特征解析处理，或者，还可以是采用模型解析的方式对起止时间特征进行特征解析处理，对此不做限制。
[0132]
可选地，一些实施例中，根据起止时间特征，确定信号差异信息，可以是根据多个起止时间特征，分别确定对应多个采集时间特征，并确定多个采集时间特征之间的时间差异信息，再将时间差异信息作为信号差异信息。
[0133]
其中，多个目标声音信号可以对应不同的采集时间，与该采集时间相应的特征信息，即可以被称为采集时间特征。
[0134]
其中，用于对多个目标声音信号相应的采集时间之间的差异进行描述的信息，即可以被称为时间差异信息，该时间差异信息可以具体例如为，采集时间特征差异，对此不做限制。
[0135]
也即是说，本公开实施例中，可以是在确定多个目标声音信号后，确定与多个目标声音信号分别对应的采集时间，并提取得到相应的采集时间特征，而后，可以确定不同采集时间特征之间的采集时间特征差异，并将其作为时间差异信息，对此不做限制。
[0136]
可选地，另一些实施例中，根据起止时间特征，确定信号差异信息，还可以是根据采集时间特征，确定相应目标声音信号的信号相位信息，并确定多个信号相位信息之间的相位差信息，再将相位差信息作为信号差异信息。
[0137]
其中，用于对目标声音信号的信号相位进行描述的信息，即可以被称为信号相位信息，该信号相位信息可以具体例如为，目标声音信号的相位值，对此不做限制。
[0138]
相应地，用于对不同目标声音信号的信号相位之间的相位差异情况进行描述的信息，即可以被称为相位差信息，该相位差信息可以具体例如为，不同目标声音信号之间的相位差值，对此不做限制。
[0139]
也即是说，本公开实施例中，可以根据采集时间特征，计算相应目标声音信号的信号相位值，再确定多个相位值之间的相位差值，并将该相位差值作为信号差异信息，而后，可以结合相位差异信息，执行后续的声音事件定位方法，具体可以参见后续实施例。
[0140]
s505：根据位置信息和信号差异信息，对目标声音事件进行定位。
[0141]
本公开实施例在确定位置信息和信号差异信息后，可以是结合预训练的深度学习模型，对目标声音事件进行定位，即可以是将位置信息和信号差异信息输入至预训练的深
度学习模型中，由预训练的深度学习模型，根据位置信息和信号差异信息，对目标声音事件进行定位，并输出相应的定位处理结果。
[0142]
本公开实施例中，通过根据起止时间特征，确定信号差异信息，从而能够有效地提升信号差异信息的可参考性，且使得信号差异信息，能够对目标声音事件的起止时间特征进行表征，从而在根据位置信息和信号差异信息，对目标声音事件进行定位时，能够基于信号差异信息，确定与目标声音事件相应的定位策略，从而能够有效地满足不同用户的声音事件定位处理需求，有效地提升目标声音事件定位结果的准确性。
[0143]
本实施例中，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再根据场景声音信号，确定目标声音事件的声音信息，并根据起止时间特征，确定信号差异信息，从而能够有效地提升信号差异信息的可参考性，且使得信号差异信息，能够对目标声音事件的起止时间特征进行表征，从而在根据位置信息和信号差异信息，对目标声音事件进行定位时，能够基于信号差异信息，确定与目标声音事件相应的定位策略，从而能够有效地满足不同用户的声音事件定位处理需求，有效地提升目标声音事件定位结果的准确性。
[0144]
图6是本公开一实施例提出的声音事件定位装置的结构示意图。
[0145]
如图6所示，该声音事件定位装置60，包括：
[0146]
获取模块601，用于获取场景声音信号；
[0147]
第一确定模块602，用于确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号；
[0148]
第二确定模块603，用于根据场景声音信号，确定目标声音事件的声音信息；以及
[0149]
定位模块604，用于根据位置信息和声音信息，对目标声音事件进行定位。
[0150]
在本公开的一些实施例中，如图7所示，图7是本公开另一实施例提出的声音事件定位装置的结构示意图，声音事件定位装置60，还包括：
[0151]
第三确定模块605，用于确定场景声音信号的场景声音特征；
[0152]
第四确定模块606，用于根据场景声音特征，确定预测声音事件；
[0153]
处理模块607，用于在预测声音事件与设定声音事件相匹配时，将预测声音事件作为目标声音事件。
[0154]
在本公开的一些实施例中，第四确定模块606，
[0155]
还用于：根据场景声音特征，确定候选声音事件；
[0156]
确定与候选声音事件分别对应的事件概率值；
[0157]
从事件概率值中，选取大于概率阈值的事件概率值所属候选声音事件作为预测声音事件。
[0158]
在本公开的一些实施例中，第二确定模块603，包括：
[0159]
提取子模块6031，用于从场景声音信号中，提取目标声音事件的事件声音信号；
[0160]
确定子模块6032，用于根据事件声音信号，确定声音信息。
[0161]
在本公开的一些实施例中，确定子模块6032，还用于：
[0162]
对事件声音信号进行目标处理，得到目标声音信号；
[0163]
确定事件声音信号相对于场景声音信号的特征分布信息；
[0164]
将目标声音信号和特征分布信息作为声音信息。
[0165]
在本公开的一些实施例中，确定子模块6032，还用于：
[0166]
对事件声音信号进行降噪，得到目标声音信号；和/或
[0167]
对事件声音信号进行增强，得到目标声音信号。
[0168]
在本公开的一些实施例中，确定子模块6032，还用于：
[0169]
确定事件声音信号相对场景声音信号的起止时间特征；
[0170]
将起止时间特征作为特征分布信息。
[0171]
在本公开的一些实施例中，定位模块604，还用于：
[0172]
根据位置信息、目标声音信号、起止时间特征对目标声音事件进行定位。
[0173]
在本公开的一些实施例中，定位模块604，还用于：
[0174]
根据起止时间特征，确定信号差异信息；
[0175]
根据位置信息和信号差异信息，对目标声音事件进行定位。
[0176]
在本公开的一些实施例中，起止时间特征的数量是多个，多个起止时间特征分别对应多个目标声音信号，目标声音信号由相应场景声音信号解析得到；
[0177]
其中，定位模块604，还用于：
[0178]
根据多个起止时间特征，分别确定对应多个采集时间特征；
[0179]
确定多个采集时间特征之间的时间差异信息；
[0180]
将时间差异信息作为信号差异信息。
[0181]
在本公开的一些实施例中，定位模块604，还用于：
[0182]
根据采集时间特征，确定相应目标声音信号的信号相位信息；
[0183]
确定多个信号相位信息之间的相位差信息；
[0184]
将相位差信息作为信号差异信息。
[0185]
在本公开的一些实施例中，目标声音事件的数量是多个；
[0186]
其中，定位模块604，还用于：
[0187]
根据位置信息和声音信息，对多个目标声音事件同时进行定位。
[0188]
需要说明的是，前述对声音事件定位方法实施例的解释说明也适用于该实施例的声音事件定位装置，此处不再赘述。
[0189]
本实施例中，通过获取场景声音信号，并确定声音采集装置的位置信息，其中，声音采集装置基于位置信息采集场景声音信号，再根据场景声音信号，确定目标声音事件的声音信息，以及根据位置信息和声音信息，对目标声音事件进行定位。由此，能够实现结合声音采集装置的位置信息和目标声音事件的声音信息，对目标声音事件进行快速定位，从而能够有效地提升声音事件的定位效率，有效地提升声音事件的定位效果。
[0190]
为了实现上述的一些实施例，本公开还提出一种家电设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时，实现如本公开前述实施例提出的声音事件定位方法。
[0191]
为了实现上述的一些实施例，本公开还提出一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开前述实施例提出的声音事件定位方法。
[0192]
为了实现上述的一些实施例，本公开还提出一种计算机程序产品，当计算机程序产品中的指令处理器执行时，执行如本公开前述实施例提出的声音事件定位方法。
[0193]
图8示出了适于用来实现本公开实施方式的示例性家电设备的框图。图8显示的家电设备12仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。
[0194]
如图8所示，家电设备12以通用计算设备的形式表现。家电设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0195]
总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(industry standard architecture；以下简称：isa)总线，微通道体系结构(micro channel architecture；以下简称：mac)总线，增强型isa总线、视频电子标准协会(video electronics standards association；以下简称：vesa)局域总线以及外围组件互连(peripheral component interconnection；以下简称：pci)总线。
[0196]
家电设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被家电设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。
[0197]
存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(random access memory；以下简称：ram)30和/或高速缓存存储器32。家电设备12可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图8未显示，通常称为“硬盘驱动器”)。
[0198]
尽管图8中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如：光盘只读存储器(compact disc read only memory；以下简称：cd-rom)、数字多功能只读光盘(digital video disc read only memory；以下简称：dvd-rom)或者其他光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本公开各实施例的功能。
[0199]
具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
[0200]
家电设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该家电设备12交互的设备通信，和/或与使得该家电设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且，家电设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(local area network；以下简称：lan)，广域网(wide area network；以下简称：wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与家电设备12的其他模块通信。应当明白，尽管图中未示出，可以结合家电设备12使用其他硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0201]
处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现前述实施例中提及的声音事件定位方法。
[0202]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0203]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
[0204]
需要说明的是，在本公开的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本公开的描述中，除非另有说明，“多个”的含义是两个或两个以上。
[0205]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本公开的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本公开的实施例所属技术领域的技术人员所理解。
[0206]
应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0207]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。
[0208]
此外，在本公开各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。
[0209]
上述提到的存储介质可以是只读存储器，磁盘或光盘等。
[0210]
在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0211]
尽管上面已经示出和描述了本公开的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本公开的限制，本领域的普通技术人员在本公开的范围内可以对上述
实施例进行变化、修改、替换和变型。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种新型细胞外囊泡检测技术联合特异蛋白标志物的尿路上皮癌辅助诊断及应用

声音事件定位方法、装置、家电设备及存储介质与流程

最热文献