基于图像识别的电视声音调节方法、装置、电视机与流程

2022-03-09 01:07:37 来源：中国专利 TAG：

1.本发明涉及电视机领域，具体而言，涉及一种基于图像识别的电视声音调节方法、装置、电视机。

背景技术：

2.电视是人们客厅休闲娱乐的重要设备之一，其可以为通过提供不同的节目来满足家庭中不同年龄段的用户使用。
3.然而，由于不同年龄段的用户的听力情况是不同的，因此其对电视的音响系统也有不同的要求，因此电视机的音箱系统需要考虑到不同年龄阶段用户使用。
4.传统的电视厂商一般预先根据内置扬声器的频响表现以及布置，对整个音响系统的听音表现调节出三到五种声音模式固定在电视菜单中，让用户主动对声音模式进行切换。这样会给用户带来诸多不便，例如操作前需要对各声音模式有所理解，但有些老年人或者小年龄阶段的用户可能没办法对声音模式有正确的认知，另外一旦更换了观看电视的人群，还需要手动进行声音模式的调节，操作繁琐，用户使用体验不佳。

技术实现要素：

5.有鉴于此，本发明的目的在于提供一种基于图像识别的电视声音调节方法、装置、电视机，以改善上述问题。
6.本发明实施例提供了一种基于图像识别的电视声音调节方法，包括：
7.获取当前观看电视机的用户的图像，并基于所述图像获取用户信息；
8.根据所述用户信息，确定所述电视机的声音系统的目标声音参数；
9.根据所述目标声音参数对所述声音系统相应的声音参数进行调节。
10.优选地，所述用户信息包括用户总人数以及每个用户的位置信息；所述位置信息通过一坐标表示，所述坐标所在坐标系的原点为所述图像的中心点，所述坐标系的横轴沿所述图像的宽度方向，所述坐标系的纵轴沿所述图像的高度方向；
11.则根据所述用户信息，确定所述电视机的声音系统的目标声音参数，具体包括：
12.根据各个用户的位置信息以及所述电视机的声音系统的声道平衡值的调节范围，确定所述声音系统的目标声道平衡值；
13.根据所述目标声道平衡值确定所述声音系统的左声道增益和右声道增益。
14.优选地，所述目标声道平衡值s的计算公式为：
[0015][0016]
其中：
[0017]
n为用户总人数，w为所述图像分辨率宽度的一半；x1，x2…
xn为各个用户的坐标的横坐标值。
[0018]
优选地，每个目标声道平衡值对应一组左声道增益和右声道增益，且当目标声道平衡值大于0时，右声道增益大于左声道增益，当目标声道平衡值小于0时，右声道增益小于左声道增益。
[0019]
优选地，所述用户信息还包括每个用户的年龄段；
[0020]
则根据所述用户信息，确定所述电视机的声音系统的目标声音参数，还包括：
[0021]
根据每个用户的年龄段，获取各个年龄段的比例；
[0022]
根据各个年龄段的比例，确定所述声音系统的在高音、中音和低音的增益。
[0023]
优选地，所述年龄段包括老年段、中青年段以及儿童段；
[0024]
则根据各个年龄段的比例，确定所述声音系统的在高音、中音和低音的增益，具体包括：
[0025]
根据各个年龄段的比例，确定当前处于主导的年龄段；
[0026]
获取处于主导的年龄段所对应的调节值；
[0027]
根据所述调节值确定声音系统在高音、中音和低音的增益。
[0028]
优选地，当处于主导的年龄段为老年段时，高音增益大于中音增益大于低音增益；
[0029]
当处于主导的年龄段为儿童段时，高音增益小于中音增益小于低音增益。
[0030]
本发明实施例还提供了一种基于图像识别的电视声音调节装置，其包括：
[0031]
用户信息获取单元，用于获取当前观看电视机的用户的图像，并基于所述图像获取用户信息；
[0032]
目标声音参数确定单元，用于根据所述用户信息，确定所述电视机的声音系统目标声音参数；
[0033]
调节单元，用于根据所述目标声音参数对所述声音系统相应的声音参数进行调节。
[0034]
本发明实施例还提供了一种电视机，其包括：
[0035]
图像摄录模块，捕获正在观看电视的用户的图像；
[0036]
处理器，配置为：
[0037]
基于所述图像获取用户信息；
[0038]
根据所述用户信息，确定所述电视机的声音系统的目标声音参数；
[0039]
根据所述目标声音参数对所述声音系统相应的声音参数进行调节。
[0040]
优选地，所述用户信息包括用户总人数以及每个用户的位置信息；所述位置信息通过一坐标表示，所述坐标所在坐标系的原点为所述图像的中心点，所述坐标系的横轴沿所述图像的宽度方向，所述坐标系的纵轴沿所述图像的高度方向；
[0041]
则根据所述用户信息，确定所述电视机的声音系统的目标声音参数，具体包括：
[0042]
根据各个用户的位置信息以及所述电视机的声音系统的声道平衡值的调节范围，确定所述声音系统的目标声道平衡值；
[0043]
根据所述目标声道平衡值确定所述声音系统的左声道增益和右声道增益；其中，所述目标声道平衡值s的计算公式为：
[0044]
[0045]
其中：
[0046]
n为用户总人数，w为所述图像分辨率宽度的一半；x1，x2…
xn为各个用户的坐标的横坐标值。
[0047]
上述一个实施例中，在通过电视机前的用户的图像获得用户信息后，即根据用户信息来确定与当前观看电视的用户相应的目标声音参数，并根据目标声音参数自动调节电视机的声音系统，如此使得调节后的声音参数能够更符合当前观看电视的用户的需求或者更符合当前观看电视的大部分用户的需求。由于本实施例在不断的获取用户信息，因此可以根据当前观看电视的用户的人数、位置等变化来实时自动的调节声音参数，而不需要用户的手动调节，因而可以简化用户的操作，提高了用户的使用体验。
附图说明
[0048]
为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
[0049]
图1是本发明第一实施例提供的基于图像识别的电视声音调节方法的流程示意图。
[0050]
图2为本发明实施例提供的摄像机拍摄的图像的一种示意图。
[0051]
图3是本发明第二实施例提供的基于图像识别的电视声音调节装置的结构示意图。
具体实施方式
[0052]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0053]
为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。
[0054]
应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0055]
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。
[0056]
下面结合附图与具体实施方式对本发明作进一步详细描述：
[0057]
请参阅图1，本发明第一实施例提供了一种基于图像识别的电视声音调节方法，其包括如下步骤：
[0058]
s101，获取当前观看电视机的用户的图像，并基于所述图像获取用户信息。
[0059]
在本实施例中，当前观看电视机的用户的图像可以通过摄像模块(如摄像头)来捕
获，所述摄像模块可以是所述电视机内置的摄像模块，也可以是外置的摄像模块，本实施例不做具体限定。
[0060]
在本实施例中，摄像模块负责实时检测与拍摄其视野范围内的画面，并生成相应的图像，以基于所述图像来获得当前观看电视机的用户信息。
[0061]
其中，通过图像来获得用户信息可以由电视机处理，也可以由摄像模块处理。
[0062]
当由所述电视机处理时，所述摄像头拍摄的图像可通过uvc协议传输给电视后，由所述电视机通过执行对应的图像识别算法来获得用户信息。
[0063]
其中，uvc全称为usb video class，即：usb视频类，是一种为usb视频捕获设备定义的协议标准。是microsoft与另外几家设备厂商联合推出的为usb视频捕获设备定义的协议标准，已成为usb org标准之一。
[0064]
当由摄像模块处理时，所述摄像模块在拍摄图像后，通过自身内置的算法对所述图像进行运算后，获得用户信息，再把用户信息传给电视机再处理。
[0065]
当然，也可以是一部分由电视机处理，一部分由摄像头处理，本发明不做具体限定。此外，在对图像进行处理时，可以对每帧图像进行处理，也可以是每隔预定的时间周期进行一次处理，这些方案均在本发明的保护范围之内。
[0066]
在本实施例中，用户信息可以包括用户总人数、用户的位置信息、性别信息、年龄段等，这都可以通过现有的图像处理算法来实现，本发明在此不做赘述。
[0067]
s102，根据所述用户信息，确定所述电视机的声音系统的目标声音参数。
[0068]
s103，根据所述目标声音参数对所述声音系统的相应的声音参数进行调节。
[0069]
在本实施例中，所述声音系统可以是电视机内嵌的声音系统，也可以是电视机外接的音响系统，本发明不做具体限定。
[0070]
在本实施例中，声音参数例如包括音量大小、左声道增益、右声道增益、高音增益、中音增益和低音增益等，具体视实际情况而定，本发明不做具体限定。
[0071]
在本实施例中，在获得用户信息后，所述电视机即根据用户信息来确定与当前观看电视的用户相应的目标声音参数，并根据目标声音参数自动调节电视机的声音系统，如此使得调节后的声音参数能够更符合当前观看电视的用户的需求或者更符合当前观看电视的大部分用户的需求。由于本实施例在不断的获取用户信息，因此可以根据当前观看电视的用户的人数、位置等变化来实时自动的调节声音参数，而不需要用户的手动调节，因而可以简化用户的操作，提高了用户的使用体验。
[0072]
为便于对本发明的理解，下面对本发明的一些优选实施例做更进一步的描述。
[0073]
在一个优选实施例中，所述用户信息包括用户总人数以及每个用户的位置信息；则步骤s102具体包括：
[0074]
s1021，根据各个用户的位置信息以及所述电视机的声道平衡值的调节范围，确定所述电视机的目标声道平衡值；
[0075]
s1022,根据所述目标声道平衡值确定所述电视机的左声道增益和右声道增益。
[0076]
在本实施例中，用户总人数可以通过人脸识别算法来实现，为了获得每个用户的位置信息，如图2所示，在所述图像中以所述图像的中心点为原点建立坐标系，所述坐标系的横轴沿所述图像的宽度方向(朝右为正，朝左为负)，所述坐标系的纵轴沿所述图像的高度方向(朝上为正，朝下为负)。
[0077]
如图2中，假设图像的分辨率为1080*720(1080为在宽度方向的宽度，表示宽度方向有1080个像素，720为在高度方向上的高度，表示高度方向有720个像素)，则根据该图像可以得知图像上包括a、b、c三个用户，且用户a的位置信息为(-500,180)，用户b的位置信息为(-280,180)，用户c的位置信息为(280,-60)，其中，用户的位置信息可以由其头部的指定参考点代表，例如，该指定参考点可以选取为两只眼睛的连接线的中点，具体视实际情况而定。
[0078]
从图2可以看出，现有的三个人中，有两个人在偏向电视机的左边，而有一个人在偏向电视机的右边，因此为了使得大多数的用户可以获得更好的声音体验，可以通过声道平衡度的调节来调整声音的方向。
[0079]
具体地，声道平衡度s表示立体播音系统中左、右声道增益的差异，如果不平衡度过大，播放的立体声的声像定位将产生偏移。一般高品质音响系统的立体声平衡度应小于1db。而本实施例正是利用这种差别所产生的偏移，使声音偏移到更多用户所在的位置。
[0080]
在本实施例中，声音系统的声道平衡值的调节范围(-s，s)与声音系统的实际能力相关，如果范围过大会产生破音等问题。例如，s可取50。
[0081]
那么声道平衡度s可以通过以下算法计算：
[0082][0083]
其中：n为用户总人数，w为所述图像分辨率宽度的一半；x1，x2…
xn为各个用户的坐标的横坐标值。每个目标声道平衡值对应一组左声道增益和右声道增益，且当目标声道平衡值大于0时，右声道增益大于左声道增益，当目标声道平衡值小于0时，右声道增益小于左声道增益。
[0084]
根据图2的数值，可以计算出当前的声道平衡度s＝-15.43。s为负代表处于左边的用户占据主导地位，因此可以适当的让声音偏移到左边，例如可设置左声道增益为15db，右边声道增益为0db，那么，最后声音叠加后，将往左边偏移，用户的感知是声音从左边出来。当然具体声道平衡度s与左右两个声道的增益值是由具体电视的功放能力，喇叭材质来决定的，这里不做赘述。
[0085]
综上所述，本实施例中，通过根据用户的位置信息以及总人数来确定声道平衡度，再根据声道平衡度来确定左右两个声道的增益进而调整声音系统的声音的传播方向，使声音偏移到更多用户所在的位置，提高了用户的体验度。
[0086]
优选地，所述用户信息还包括每个用户的年龄段；
[0087]
则步骤s102还包括：
[0088]
s1023，根据每个用户的年龄段，获取各个年龄段的比例；
[0089]
s1024，根据各个年龄段的比例，确定电视机在高音、中音和低音的增益。
[0090]
在本实施例中，一般高品质声音系统的高、中、低音三频的增益相对均衡，针对中青年无需过大调节，但受限于用户的年龄，均衡的主观感受出现了参差不齐，尤其是老年人和儿童。老年人对高音不灵敏，甚至有些已听不到12khz-20khz的声音。而儿童则反之。所以需要依据用户信息调整符合用户的声音模式。
[0091]
在本实施例中，例如可以将所述年龄段分为老年段、中青年段以及儿童段三个阶
段。则步骤s1024具体包括：
[0092]
首先，根据各个年龄段的比例，确定当前处于主导的年龄段。
[0093]
表1
[0094]
z儿童中年老年人n(z)/nhjk
[0095]
如表1所示，z代表识别用户年龄段，n(z)/n代表各个年龄段用户的占比。
[0096]
其次，获取处于主导的年龄段所对应的调节值。
[0097]
表2
[0098][0099]
如表2所示，根据各个年龄段的比例，本实施例可以确定处于主导地位的年龄段，并获取与该处于主导地位的年龄段所对应的调节值(即g值)。
[0100]
其中，这里的处于主导地位可以仅仅是占比最高的年龄段，也可以要求其占比大于其他年龄段的占比之和，具体视实际情况而定，本发明不做具体限定。
[0101]
同样可以理解的是，该调节值也可以根据实际需要设定，上述的-10，0，10仅仅是一种示例，不能理解为对本发明的限制。
[0102]
最后，根据所述调节值确定电视机在高音、中音和低音的增益。
[0103]
在本实施例中，每个调节值g对应的一组高、中、低音的增益为(fa(g)，fb(g)，fc(g))。举例：当计算得到g为 10时，则可设置声道高、中、低音增益 3db,1db,-2db，那么，最后声音叠加后，中高音相对提升，效果明亮，适合老年用户观影的声音模式。当计算得到g为-10时，则可设置声道高、中、低音增益-2db，1db， 3db，那么，最后声音叠加后，低音相对提升，适合儿童用户观影。当计算得到g为0时，则可设置声道高、中、低音增益均相同(如均为0)，那么，可以达到比较均衡的音响效果。
[0104]
需要说明的是，调节值g预设不局限于固定值，也可为以n(z)/n为因数的函数值，在此不做赘述。
[0105]
需要说明的是，调节值g与高、中、低音增益的关系可以是预设的映射关系，也可以是函数关系，函数的预设不局限于线性函数，也可为其他函数，在此不做赘述。
[0106]
为便于对本发明的理解，下面以一实际的例子来说明本发明实施例的应用。
[0107]
假设有3人正位于平齐电视水平线的角度观影，分别是2位老年人和1位儿童，2位老年人位于屏幕中轴线偏右2m，儿童位于屏幕中轴线偏左1m。通过摄像头可采集3人的用户信息并打包数据，其关键数据格式为：(3,n1(2,0,老年段),n2(2,0,老年段),n3(-1,0,儿童
段)。其中，3代表用户总人数，n1(2,0,老年人)表示第一个用户的用户信息为坐标(2，0)，年龄段为老年段。
[0108]
通过声道平衡度的公式计算出s＝1w；w为图像分辨率宽度的一半，此时得知多数用户位于电视的右侧，因此声音模式调节模块调大右通道增益，调小左声道增益，使得更大声音集中在多人的右侧，右声道比左声道具体大多少可事先预设。依据用户的年龄段信息，可得h＝1/3，k＝0,j＝2/3；j》＝h k；g值为 10，因此调整高、中、低音增益为：fa(g)、fb(g)、fc(g)，如对应 3db，1db，-2db，从而提升中高音段的效果，弥补老年人耳朵的中高音灵敏的缺失。
[0109]
请参阅图3，本发明第二实施例还提供了一种基于图像识别的电视声音调节装置，其包括：
[0110]
用户信息获取单元210，用于通过摄像头拍摄的图像，获取当前观看电视机的用户信息；
[0111]
目标声音参数确定单元220，用于根据所述用户信息，确定所述电视机的目标声音参数；
[0112]
调节单元230，用于根据所述目标声音参数对所述电视机相应的声音参数进行调节，使得调节后的声音参数能够满足当前观看电视机的大多数用户的听力需求。
[0113]
本发明第三实施例还提供了一种电视机，其包括：
[0114]
摄像模块，捕获正在观看电视的用户的图像；
[0115]
处理器，与所述摄像模块连接，并配置为：
[0116]
基于所述图像获取用户信息；
[0117]
根据所述用户信息，确定所述电视机的声音系统的目标声音参数；
[0118]
根据所述目标声音参数对所述声音系统相应的声音参数进行调节。
[0119]
优选地，所述用户信息包括用户总人数以及每个用户的位置信息；所述位置信息通过一坐标表示，所述坐标所在坐标系的原点为所述图像的中心点，所述坐标系的横轴沿所述图像的宽度方向，所述坐标系的纵轴沿所述图像的高度方向；
[0120]
则根据所述用户信息，确定所述电视机的声音系统的目标声音参数，具体包括：
[0121]
根据各个用户的位置信息以及所述电视机的声音系统的声道平衡值的调节范围，确定所述声音系统的目标声道平衡值；
[0122]
根据所述目标声道平衡值确定所述声音系统的左声道增益和右声道增益；其中，所述目标声道平衡值s的计算公式为：
[0123][0124]
其中：
[0125]
n为用户总人数，w为所述图像分辨率宽度的一半；x1，x2…
xn为各个用户的坐标的横坐标值。
[0126]
本发明第四实施例还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序能够被所述可读存储介质所在设备的处理器执行，以实现如上述的基于图像识别的电视声音调节方法。
[0127]
在本发明实施例所提供的几个实施例中，应该理解到，所揭露的方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0128]
另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。
[0129]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0130]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：小区无线信号强度预测方法和装置、计算机可读存储介质与流程

基于图像识别的电视声音调节方法、装置、电视机与流程

相关文献

最热文献