一种摄像机音频信号的输出方法、装置、存储介质及设备与流程

2021-10-23 00:10:00 来源：中国专利 TAG：摄像机识别装置输出信号

1.本技术实施例涉及图像识别技术领域，尤其涉及一种摄像机音频信号的输出方法、装置、存储介质及设备。

背景技术：

2.在人们的日常生活中，以视频作为信息的传播载体更加直观，人们可以通过观看视频，听取视频中的声音，来获取很多信息。然而，现有技术中，往往只关注摄像机的视频效果，图像的清晰度，视频码率以及传播速度等。而对于视频的音频质量，却没有得到过多的重视，这就导致了摄像机得到的视频的音频质量普遍不高。

技术实现要素：

3.本技术实施例提供一种摄像机音频信号的输出方法、装置、存储介质及设备，可以在多麦克风的情况下通过选择音频信号来源的形式，实现提高摄像机的音频信号的输出质量的效果。
4.第一方面，本技术实施例提供了一种摄像机音频信号的输出方法，所述摄像机包括至少两个音频获取装置，该方法包括：
5.获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；
6.若存在，则确定监控人员在监控范围内的所处区域；
7.根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；
8.若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
9.进一步的，在确定监控人员的所处区域对应的音频获取装置之后，所述方法还包括：
10.对监控人员、监控人员的所处区域以及对应的音频获取装置按照预设格式进行关联存储。
11.进一步的，在根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置之前，所述方法还包括：
12.确定视频图像中存在的监控人员的个数；
13.若所述监控人员的个数为至少两个，则确定各监控人员的基础特征以对各监控人员进行分别编号。
14.进一步的，确定各监控人员的基础特征以对各监控人员进行分别编号，包括：
15.获取各监控人员的人脸图像；
16.根据所述人脸图像构建各监控人员的基础特征；
17.根据所述基础特征对各监控人员进行分别编号。
18.进一步的，在获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控
人员之前，所述方法还包括：
19.根据摄像机的音频获取装置的数量和相对位置，确定视频图像的监控范围内各区域与音频获取装置的映射关系。
20.进一步的，在确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号之后，所述方法还包括：
21.若检测到目标监控人员的变更操作，确定变更后的目标监控人员所处区域关联的变更音频获取装置，并以所述变更音频获取装置的音频信号作为输出音频信号。
22.第二方面，本技术实施例提供了一种摄像机音频信号的输出装置，所述摄像机包括至少两个音频获取装置，该装置包括：
23.监控人员识别模块，用于获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；
24.所处区域确定模块，用于若存在监控人员，则确定监控人员在监控范围内的所处区域；
25.音频获取装置对应模块，用于根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；
26.输出音频信号确定模块，用于若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
27.进一步的，所述装置还包括：
28.关联存储模块，用于对监控人员、监控人员的所处区域以及对应的音频获取装置按照预设格式进行关联存储。
29.第三方面，本技术实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本技术实施例所述的摄像机音频信号的输出方法。
30.第四方面，本技术实施例提供了一种设备，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本技术实施例所述的摄像机音频信号的输出方法。
31.本技术实施例所提供的技术方案，获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；若存在，则确定监控人员在监控范围内的所处区域；根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。通过采用本技术所提供的技术方案，可以在多麦克风的情况下通过选择音频信号来源的形式，实现提高摄像机的音频信号的输出质量的效果。
附图说明
32.图1是本技术实施例提供的摄像机音频信号的输出方法的流程图；
33.图2是本技术实施例提供的摄像机的结构示意图；
34.图3是本技术实施例提供的视频图像的示意图；
35.图4是本技术实施例提供的摄像机音频信号的输出装置的结构示意图；
36.图5是本技术实施例提供的一种设备的结构示意图。
具体实施方式
37.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本技术，而非对本技术的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本技术相关的部分而非全部结构。
38.在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
39.图1是本技术实施例提供的摄像机音频信号的输出方法的流程图，本实施例可适用于摄像机录制视频后视频播放的情况，该方法可以由本技术实施例所提供的摄像机音频信号的输出装置执行，该装置可以由软件和/或硬件的方式来实现，并可集成于用于视频播放的智能终端等设备中。
40.如图1所示，所述摄像机音频信号的输出方法包括：
41.s110、获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员。
42.其中，摄像机可以是安装在固定位置的摄像机，例如可以是用于安防的摄像机，还可以是可以移动的摄像机，例如通过用户手持，或者固定在车辆上面，进行视频的拍摄。其中视频的拍摄图像可以是连续一定数量的图像，还可以是每隔一定帧数提取一帧的图像。
43.在本实施例中，可以通过图像识别，特征对比等技术确定视频图像中是否存在监控人员。例如安装在小区门口的摄像头，可能存在一定时间不会有人员经过，可能会有1个，2个或者更多人同时经过。在各种情况下，摄像机前端或者用于进行视频播放的后端可以采用相应的技术来识别视频图像中是否存在监控人员，以及所存在的监控人员的数量。
44.在本实施例中，所述摄像机包括至少两个音频获取装置，摄像机与音频获取装置的距离可以根据音频获取装置的设置位置来决定，例如可以在摄像机的左右两侧0.5米处分别设置一个麦克风。还可以是在上下左右0.3米处设置四个麦克风。其中音频获取装置，也就是麦克风的排布位置可以是根据用户的需求进行预先设置的。
45.在本实施例中，可选的，在获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员之前，所述方法还包括：根据摄像机的音频获取装置的数量和相对位置，确定视频图像的监控范围内各区域与音频获取装置的映射关系。
46.结合上述示例，如果音频获取装置的数量为2个，且相对位置为设置在摄像机镜头的左右各0.5米的位置，则可以确定视频图像的监控范围内包括两个区域，且两个区域是一图像的中间位置竖向切分开来的，左侧区域对应左侧的音频获取装置，右侧区域对应右侧的音频获取装置。本方案通过这样的设置，可以将监控范围内各个区域与该区域的音频获取更加清晰的音频获取装置之间形成绑定关系。例如，当监控范围内左半区域存在监控人员，当该监控人员发声时，则设置在左侧的音频获取装置能够更加清晰的获取到音频信息。本方案通过这样的映射关系的建立，可以为后续的输出音频信号提供数据基础，确保所输出的音频信号更具针对性，提升拍摄视频的音频质量。
47.s120、若存在，则确定监控人员在监控范围内的所处区域。
48.其中，所处区域可以是预先根据音频获取装置的设置数量和设置位置来进行划分的，还可以是工作人员根据预先确定的关联关系直接得到的。由于人在视频图像中的大小是受到透视原理影响的，距离近的话人在被监控范围中的图像更大，因此，可以更加具体的根据人脸的位置确定监控人员的位置。
49.s130、根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置。
50.在确定了监控人员的所处区域之后，可以根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置。例如监控人员当前在视频图像的左侧，则确定该区域对应的音频获取装置为设置在左侧的音频获取装置。
51.本实施例中，可选的，在根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置之前，所述方法还包括：
52.确定视频图像中存在的监控人员的个数；
53.若所述监控人员的个数为至少两个，则确定各监控人员的基础特征以对各监控人员进行分别编号。
54.其中，由于监控范围内监控人员的个数是不确定的，因此在不同的时刻，可能视频图像中存在两个监控人员或者更多的监控人员，则在这种情况下，可以根据各个监控人员的基础特征，例如各个监控人员的人脸特征的不同，确定各个监控人员的编号，并针对不同编号的监控人员分别确定所在区域以及对应的音频获取装置。本方案通过这样的设置，可以直接将多个监控人员的情况进行分别确定音频获取装置，从而确定实际采用的音频信号的来源，以达到针对监控范围内每个监控人员都能够输出的清晰的音频的效果。
55.s140、若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
56.可以是在web界面或者应用程序或是小程序中选择监控人员的人脸信息，可以确定为检测到目标监控人员的选择操作。根据用户选择的人脸信息，就可以确定该监控人员在视频图像中的所处区域，进一步可以确定与该所处区域关联的目标音频获取装置。
57.在确定目标音频获取装置之后，例如是摄像机的左侧的那个麦克风，则可以将该目标音频获取装置的音频信号作为输出音频信号。也就是说，当用户点击了监控目标之后，可以根据监控目标的位置，确定音频输出的麦克风。本方案通过这样的设置，可以充分利用到摄像机的音频获取装置资源，实现提高拍摄视频的音频质量的效果。
58.本技术实施例所提供的技术方案，获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；若存在，则确定监控人员在监控范围内的所处区域；根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。通过采用本技术所提供的技术方案，可以在多麦克风的情况下通过选择音频信号来源的形式，实现提高摄像机的音频信号的输出质量的效果。
59.图2是本技术实施例提供的摄像机的结构示意图。如图2所示，摄像机可以是采用鱼眼专用镜头，可以实现180
°
全景监控。当采用多麦克风拾取声音，包含但不限于双麦克风
的方案。此处以双麦克风为例进行说明，麦克风1和麦克风2分别设置在摄像机镜头的左侧和右侧，且呈水平方向设置。其中的虚线所示进行划分，在sensor感光面的光学中心划分成两个区域，例如可以分别为区域1和区域2，其中区域1更靠近麦克风1，区域2更靠近麦克风2。
60.图3是本技术实施例提供的视频图像的示意图。如图3所示，区域1中存在一号监控人员，区域2中存在二号监控人员，则可以在将视频数据进行存储时，分别确定各个监控人员的编号，并在播放时根据监控人员的所处区域，确定实际播放的音频信息来自于哪一个麦克风。
61.在上述各技术方案中，可选的，确定各监控人员的基础特征以对各监控人员进行分别编号，包括：获取各监控人员的人脸图像；根据所述人脸图像构建各监控人员的基础特征；根据所述基础特征对各监控人员进行分别编号。
62.其中，可以采用图像识别技术，通过对各监控人员的人脸图像构建基础特征，得到不同的监控人员，并对不同的监控人员进行编号。其中编号的顺序可以是递增的，可以每隔一定时间进行一次更新，例如每天0点从1开始编号。本方案通过这样的设置，有利于简化信息存储的复杂性，并且可以简化观看视频的用户的操作，无需过多的确定各个人脸特征，直接根据编号来确定目标监控人员。
63.在上述各技术方案中，可选的，在确定监控人员的所处区域对应的音频获取装置之后，所述方法还包括：对监控人员、监控人员的所处区域以及对应的音频获取装置按照预设格式进行关联存储。
64.其中，预设格式可以是关联表格的形式，如上所示划分区域1及区域2，标记进入监控范围内的一号及二号监控人员，可以按照下述表格的方式进行关联存储：
[0065][0066][0067]
通过这样的设置，可以清楚的确定各个监控人员的所处区域以及对应的麦克风编号。这样可以根据一张表格就能体现对监控目标的声音信息录制最佳的麦克风，从而提高录制视频的音频质量。
[0068]
在上述各技术方案中，可选的，在确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号之后，所述方法还包括：若检测到目标监控人员的变更操作，确定变更后的目标监控人员所处区域关联的变更音频获取装置，并以所述变更音频获取装置的音频信号作为输出音频信号。
[0069]
其中，当视频的监控范围内出现多个监控人员的情况下，可以在视频显示界面的侧面显示监控人员的编号，用户可以在播放过程中选择和变更目标监控人员，例如由监控
人员1变成监控人员2，可以通过点击监控人员2的编号来实现切换，则可以根据监控人员2的所处区域，确定变更后的音频获取装置。可以理解的，如果监控人员2和监控人员1在同一个区域，则变更后的音频获取装置可以和原来的音频获取装置相同。本方案通过这样的设置，可以在视频展示的过程中，根据用户的需求来对不同的目标提供最佳的音频数据进行输出。
[0070]
图4是本技术实施例提供的摄像机音频信号的输出装置的结构示意图。如图4所示，所述摄像机音频信号的输出装置，所述摄像机包括至少两个音频获取装置，所述装置包括：
[0071]
监控人员识别模块410，用于获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；
[0072]
所处区域确定模块420，用于若存在监控人员，则确定监控人员在监控范围内的所处区域；
[0073]
音频获取装置对应模块430，用于根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；
[0074]
输出音频信号确定模块440，用于若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
[0075]
可选的，所述装置还包括：
[0076]
关联存储模块，用于对监控人员、监控人员的所处区域以及对应的音频获取装置按照预设格式进行关联存储。
[0077]
本技术实施例所提供的技术方案，可以在多麦克风的情况下通过选择音频信号来源的形式，实现提高摄像机的音频信号的输出质量的效果。
[0078]
上述产品可执行本技术实施例所提供的方法，具备执行方法相应的功能模块和有益效果。
[0079]
本技术实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种摄像机音频信号的输出方法，该方法包括：
[0080]
获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；
[0081]
若存在，则确定监控人员在监控范围内的所处区域；
[0082]
根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；
[0083]
若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
[0084]
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如cd-rom、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如dram、ddr ram、sram、edo ram，兰巴斯(rambus)ram等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可
以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
[0085]
当然，本技术实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的摄像机音频信号的输出操作，还可以执行本技术任意实施例所提供的摄像机音频信号的输出方法中的相关操作。
[0086]
本技术实施例提供了一种设备，该设备中可集成本技术实施例提供的摄像机音频信号的输出装置。图5是本技术实施例提供的一种设备的结构示意图。如图5所示，本实施例提供了一种设备500，其包括：一个或多个处理器520；存储装置510，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器520执行，使得所述一个或多个处理器520实现本技术实施例所提供的摄像机音频信号的输出方法，该方法包括：
[0087]
获取由摄像机拍摄的视频图像，确定所述视频图像中是否存在监控人员；
[0088]
若存在，则确定监控人员在监控范围内的所处区域；
[0089]
根据预设的各区域与音频获取装置的映射关系，确定监控人员的所处区域对应的音频获取装置；
[0090]
若检测到目标监控人员的选择操作，确定目标监控人员所处区域关联的目标音频获取装置，并以所述目标音频获取装置的音频信号作为输出音频信号。
[0091]
当然，本领域技术人员可以理解，处理器520还实现本技术任意实施例所提供的摄像机音频信号的输出方法的技术方案。
[0092]
图5显示的设备500仅仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
[0093]
如图5所示，该设备500包括处理器520、存储装置510、输入装置530和输出装置540；设备中处理器520的数量可以是一个或多个，图5中以一个处理器520为例；设备中的处理器520、存储装置510、输入装置530和输出装置540可以通过总线或其他方式连接，图5中以通过总线550连接为例。
[0094]
存储装置510作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块单元，如本技术实施例中的摄像机音频信号的输出方法对应的程序指令。
[0095]
存储装置510可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储装置510可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置510可进一步包括相对于处理器520远程设置的存储器，这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0096]
输入装置530可用于接收输入的数字、字符信息或语音信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏、扬声器等设备。
[0097]
本技术实施例提供的设备，可以在多麦克风的情况下通过选择音频信号来源的形式，实现提高摄像机的音频信号的输出质量的效果。
[0098]
上述实施例中提供的摄像机音频信号的输出装置、存储介质及设备可执行本技术任意实施例所提供的摄像机音频信号的输出方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本技术任意实施例所提供的摄像机
音频信号的输出方法。
[0099]
注意，上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解，本技术不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此，虽然通过以上实施例对本技术进行了较为详细的说明，但是本技术不仅仅限于以上实施例，在不脱离本技术构思的情况下，还可以包括更多其他等效实施例，而本技术的范围由所附的权利要求范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：采样装置、采样方法以及用于存储采样程序的存储介质与流程

一种摄像机音频信号的输出方法、装置、存储介质及设备与流程

相关文献

最热文献