一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种声音定向传输方法、系统、电子设备及存储介质与流程

2021-06-22 17:08:00 来源:中国专利 TAG:人工智能 定向 电子设备 传输 声音
一种声音定向传输方法、系统、电子设备及存储介质与流程

本发明涉及人工智能技术领域,尤其涉及一种声音定向传输方法、系统、电子设备及存储介质。



背景技术:

声波(20hz-20khz)的定向传播可通过指向性换能器或换能器阵列实现,换能器辐射面的最大尺度与发射的声波波长决定了所发射的声束的指向性开角的大小,即换能器尺寸越大,声波频率越高,则指向性越好,实现定向声传播的效果也越好,而在可听声范围内实现声音的定向传输需要的扬声器尺寸很大,波束开角很宽甚至呈半球形,且在波束开角范围外仍然存在旁瓣带来的声波泄露问题,无法满足现今对高指向性扬声器的需求。因此,利用高频声波的高指向性和非线性声学的自解调原理来实现可听声定向传播,此时高频扬声器发射高指向性超声波,声波在空气中传播时的非线性效应可使声场中产生差频、和频、倍频声波。由于高频声波的高吸收特性,最终传播一段距离后只剩下频率较低的差频声波,该差频即是待发射的高指向性可听声。

定向声技术的发展逐渐成熟,在传媒广告领域中的应用也越来越多,尤其像博览馆展览馆企业展厅等文化科博项目、大型展会,商场超市,汽车等场合中得到广泛应用。但目前实现定向声播放的条件还存在着一定局限性,在声音播放过程中只能够对固定的区域进行定向播放,而不能智能的判断周围环境,根据环境中特定对象的移动而达到完全的定点定向音源播放效果。



技术实现要素:

本发明的目的在于提供一种声音定向传输方法、系统、电子设备及存储介质,通过结合人脸识别的人工智能判断技术,定位需要播放音源的人群,从而实现声音定向传输的方法。

第一方面,本发明实施例提供了一种声音定向传输方法,所述声音定向传输方法包括以下步骤:

调用摄像头获取预定范围内声音接收端的图像;

预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;

调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。

可选地,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。

可选地,声音预处理包括;

通过相位控制阵列方法将音频进行合成;

以波源为圆心,取相同的半径画半圆,得到各波的波前;

根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。

第二方面,本发明实施例提供了一种声音定向传输系统,其特征在于,所述声音定向传输系统包括:

图像获取子系统,用于调用摄像头获取预定范围内声音接收端的图像;

位置坐标确定子系统,用于对所述图像进行人脸识别以实时确定接收端的位置坐标;

调整子系统,用于调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。

可选地,所述调整子系统包括,声音预处理模块,所述声音预处理模块具体包括:

音频合成单元,通过相位控制阵列方法将音频进行合成;

波前获取单元,用于以波源为圆心,取相同的半径画半圆,得到各波的波前;

主波传输单元,用于根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。

可选地,所述声音传输端包括多个固定播放地点的音箱,其中每个音箱均配置有摄像头。

可选地,控制具体位置的音箱进行主增益方向的播放。

可选地,固定播放地点的音箱分为两排,两排音箱面向接收端且呈锐角排列。

第三方面,本发明提供了一种电子设备,包括:

处理器;用于存储处理器可执行指令的存储器;

其中,所述处理器通过运行所述可执行指令以实现上述的方法。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述方法的步骤。

有益效果

本发明提出了一种声音定向传输方法、系统、电子设备及存储介质,所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;其中,所述声音是经过预处理的,可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向;可在多音源环境中,对特定群组,分组进行音源定向播放。

附图说明

图1为本发明实施例的一种声音定向传输方法的流程图;

图2为本发明实施例的声音预处理方法的流程图;

图3为本发明实施例的声音定向传输系统的结构框图;

图4为本发明实施例的声音预处理模块的结构框图;

图5为本发明实施例的音箱排列方式示意图;

图6为本发明实施例的一种电子设备的结构框图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的在于提供一种声音定向传输方法、系统、电子设备及存储介质,通过结合人脸识别的人工智能判断技术,定位需要播放音源的人群,从而实现声音定向传输的方法。

下面结合附图说明和具体实施例对本发明作进一步描述:

图1示出了本发明实施例的一种声音定向传输方法的流程图,如图1所示,所述声音定向传输方法包括以下步骤:

s20、调用摄像头获取预定范围内声音接收端的图像;

s40、预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;

s60、调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。

本实施例提出了一种声音定向传输方法所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;其中,所述声音是经过预处理的;可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向。

在一些实施例中,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。

具体地,如图2所示,声音预处理包括;

s601、通过相位控制阵列方法将音频进行合成;

s602、以波源为圆心,取相同的半径画半圆,得到各波的波前;

s603、根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。

本实施例通过相位控制阵列方法将音频进行合成,基于惠更斯原理,当有很多波源并且每个点波源产生波的频率一致时相当于各个点波源为子波的波源,点波源以平面排列,则产生波面;以波源为圆心,取相同的半径画半圆,得到各波的波前,根据接收端的位置坐标确定的一个主波,将主波对位置坐标方向输送,实现可控制的定向音源播放方法。

在一些实施例中,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置(例如摄像头),将多个传输端进行分组,根据距离每组传输端最近的位置坐标,进行声音传输端的方向调整。可在多音源环境中,对特定群组,分组进行音源定向播放。

基于同一发明构思,本申请实施例还提供了一种声音定向传输系统,可以用于实现上述实施例中所描述的方法,如下面实施例所述。由于该声音定向传输系统解决问题的原理与一种声音定向传输方法相似,因此声音定向传输系统的实施可以参见一种声音定向传输方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

如图3所示,本发明实施例提供了一种声音定向传输系统,所述声音定向传输系统包括:

图像获取子系统20,用于调用摄像头获取预定范围内声音接收端的图像;

位置坐标确定子系统40,用于对所述图像进行人脸识别以实时确定接收端的位置坐标;

调整子系统60,用于调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。

本实施例提出了一种声音定向传输系统,所述声音定向传输系统通过图像获取子系统20调用摄像头获取预定范围内声音接收端的图像;位置坐标确定子系统40对所述图像进行人脸识别以实时确定接收端的位置坐标;调整子系统60,调整声音传输端向所述位置坐标进行声音播放;其中,所述声音是经过预处理的;可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向。

具体地,如图4所示,所述调整子系统60包括,声音预处理模块,所述声音预处理模块具体包括:

音频合成单元601,通过相位控制阵列方法将音频进行合成;

波前获取单元602,用于以波源为圆心,取相同的半径画半圆,得到各波的波前;

主波传输单元603,用于根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。

本实施例通过相位控制阵列方法将音频进行合成,基于惠更斯原理,当有很多波源并且每个点波源产生波的频率一致时相当于各个点波源为子波的波源,点波源以平面排列,则产生波面;以波源为圆心,取相同的半径画半圆,得到各波的波前,根据接收端的位置坐标确定的一个主波,将主波对位置坐标方向输送,实现可控制的定向音源播放方法。

具体地,所述声音传输端包括多个固定播放地点的音箱,其中每个音箱均配置有摄像头。

具体地,控制具体位置的音箱进行主增益方向的播放。

在一些实施例中,如图5所示,固定播放地点的音箱分为两排,两排音箱面向接收端且呈锐角排列。本实施例以音箱为10个为例,音箱分为两排,两排音箱面向接收端且呈锐角排列。调用摄像头获取预定范围内声音接收端的图像;对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放,可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向;

在一些实施例中,可在多音源环境中,对特定群组,分组进行音源定向播放。所述声音传输端(例如音箱)为多个,其中每个声音传输端均配置图像获取装置(例如摄像头),将多个传输端进行分组,根据距离每组传输端最近的位置坐标,进行声音传输端的方向调整。可在多音源环境中,对特定群组,分组进行音源定向播放。

本申请实施例还提供了一种电子设备,图6示出了可以应用本申请实施例的电子设备的结构示意图,如图6所示,该计算机电子设备包括,中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中一种声音定向传输系统中所包含的计算机可读存储介质;也可以是单独存在,未装配入电子设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的一种声音定向传输方法。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜