声音处理电路、电声器件和声音处理系统的制作方法

2021-09-18 01:59:00 来源：中国专利 TAG：电声器件声音电路系统

1.本技术涉及电声器件技术领域，特别是涉及一种声音处理电路、电声器件和声音处理系统。

背景技术：

2.蓝牙耳机适应不同环境的噪声处理，主要包括主动降噪、被动降噪，而被动降噪主要依靠蓝牙耳机设置的外壳结构决定，如入耳式、耳塞式、头戴式；蓝牙耳机的被动降噪性能均不统一，通过消噪扬声器等产生与噪声同幅度、相位相反的波形进行抵消，在嘈杂的环境下，近乎滤除外界音频信号；
3.在实现过程中，发明人发现传统技术中至少存在如下问题：蓝牙耳机的降噪模式包括通透模式或降噪模式，会抵消部分语音信号，若需要听到特定声纹的语音段时，通常需要用户摘下耳机，适用性差。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种能够提高适用性的声音处理电路、电声器件和声音处理系统。
5.为了实现上述目的，一方面，本实用新型实施例提供了一种声音处理电路，包括：
6.语音采集模块，语音采集模块用于采集外部语音信号并输出；
7.声纹识别模块，声纹识别模块连接语音采集模块；声纹识别模块包括依次连接的语音信号分离器、声纹比较模块和声纹存储模块；语音信号分离器与语音采集模块连接，输出语音信号分离出的多个声纹信号；声纹比较模块用于比较各声纹信号的声纹特征与声纹存储模块中存储的声纹特征，输出目标声纹信号；其中，声纹识别模块设有用于切换声纹比较模块的声纹信号处理优先级顺序的按键模块；
8.声音补偿器，声音补偿器连接声纹比较模块，输出目标声纹信号经补偿处理后的完整音频信号；
9.功率放大模块；功率放大模块的输入端与声音补偿器相连，输出端用于连接电声器件的音频输出模块。
10.在其中一个实施例中，声纹比较模块包含一个或多个声纹处理器。
11.在其中一个实施例中，还包括连接在声纹识别模块与语音采集模块之间的语音降噪处理模块。
12.在其中一个实施例中，语音采集模块包括麦克风阵列。
13.在其中一个实施例中，声纹存储模块用于连接远程服务器。
14.一种电声器件，包括音频输出模块，以及连接音频输出模块的如上述的声音处理电路。
15.在其中一个实施例中，还包括入耳检测模块；入耳检测模块分别连接语音采集模块、声纹识别模块。
16.在其中一个实施例中，电声器件为耳机。
17.在其中一个实施例中，耳机为无线蓝牙耳机。
18.一种声音处理系统，包括主耳机和从耳机；
19.其中，从耳机包括上述的声音处理电路。
20.上述技术方案中的一个技术方案具有如下优点和有益效果：
21.本技术声音处理电路包括依次连接的语音采集模块、声纹识别模块、声音补偿器和功率放大模块；其中，声纹识别模块包括语音信号分离器、声纹比较模块和声纹存储模块，进而语音信号分离器可以对外部语音信号中的不同声纹信号进行分离处理，并根据声纹存储模块预存的声纹特征，由声纹比较模块确定出目标声纹信号(例如，最高优先级的声纹信号)，并且，该声纹识别模块设有用于切换声纹比较模块的声纹信号处理优先级顺序的按键模块；然后，声音补偿器可以对该目标声纹信号中降噪后的丢失的语音数据进行补偿，以确定其经功率放大模块放大的声纹信号的完整性。本技术能够使目标声纹的音频信号放大，提高耳机适用性，同时声纹信号可以分为多个优先级适用不同场合，鲁棒性更强。
附图说明
22.为了更清楚地说明本技术实施例或传统技术中的技术方案，下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
23.图1为一个实施例中声音处理电路的应用环境图；
24.图2为一个实施例中声音处理电路的结构示意图；
25.图3为一个实施例中声纹识别模块的结构示意图；
26.图4为另一个实施例中声纹识别模块的结构示意图；
27.图5为另一个实施例中声音处理电路的结构示意图；
28.图6为一个实施例中电声器件的内部结构图；
29.图7为一个实施例中声音处理系统的结构示意图。
具体实施方式
30.为了便于理解本技术，下面将参照相关附图对本技术进行更全面的描述。附图中给出了本技术的实施例。但是，本技术可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使本技术的公开内容更加透彻全面。
31.除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本技术。
32.可以理解，本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种元件，但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
33.空间关系术语例如“在...下”、“在...下面”、“下面的”、“在...之下”、“在...之上”、“上面的”等，在这里可以用于描述图中所示的一个元件或特征与其它元件或特征的关系。应当明白，除了图中所示的取向以外，空间关系术语还包括使用和操作中的器件的不同
取向。例如，如果附图中的器件翻转，描述为“在其它元件下面”或“在其之下”或“在其下”元件或特征将取向为在其它元件或特征“上”。因此，示例性术语“在...下面”和“在...下”可包括上和下两个取向。此外，器件也可以包括另外地取向(譬如，旋转90度或其它取向)，并且在此使用的空间描述语相应地被解释。
34.需要说明的是，当一个元件被认为是“连接”另一个元件时，它可以是直接连接到另一个元件，或者通过居中元件连接另一个元件。此外，以下实施例中的“连接”，如果被连接的对象之间具有电信号或数据的传递，则应理解为“电连接”、“通信连接”等。
35.在此使用时，单数形式的“一”、“一个”和“所述/该”也可以包括复数形式，除非上下文清楚指出另外的方式。还应当理解的是，术语“包括/包含”或“具有”等指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在，但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。同时，在本说明书中使用的术语“和/或”包括相关所列项目的任何及所有组合。
36.人们经常处在不同强度的环境噪声中，而在不同强度的环境噪声中，用户能够听到的蓝牙耳机音量高低并不相同；例如在家、在办公室、在健身房、在工地等等场景，需要听到特定声纹的语音段，即指定用户的语音，基于传统技术，通常需要用户摘下耳机，让指定用户重新复述一遍语音段；又或者，需要用户将耳机佩戴松一些，或者调节耳机当前播放音量降低，避免错过特定用户的说话内容。
37.传统技术方案至少存在以下弊端：
①
让用户重新复述一遍话语，会给用户较差的交流体验；
②
考虑蓝牙耳机的结构密封性，通过耳机介质传输的音频大大削弱，用户很难正确识别外界音频信息，同时音量调节过低会降低蓝牙耳机用户的使用体验。
38.基于主动降噪性能以及耳机物理结构密封性，通过耳机介质传输的音频大大削弱，而通过本技术可以识别特定声纹特征的音频信号进行放大处理，有效地识别不同环境下的外界语音信息。为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
39.本技术提供的声音处理电路，可以应用于如图1所示的应用环境中。其中，声音处理电路102可以内置于电声器件104中，进一步的，声音处理电路102和/或电声器件104可以通过网络与远程服务器交互。其中，电声器件(electroacoustic device)104可以指电和声相互转换的器件，例如，利用电磁感应、静电感应或压电效应等来完成电声转换，可以采用包括扬声器，耳机，传声器，唱头等予以实现。进一步的，耳机可以为无线蓝牙耳机，而在一个示例中，该从耳机可以为从耳机。
40.此外，远程服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。而电声器件(例如，耳机)也可以与终端进行交互，终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
41.在一个实施例中，如图2所示，提供了一种声音处理电路，以该方法应用于图1中的电声器件为例进行说明，包括：
42.语音采集模块210，语音采集模块210用于采集外部语音信号并输出；
43.声纹识别模块220，声纹识别模块220连接语音采集模块210；声纹识别模块220包括依次连接的语音信号分离器、声纹比较模块和声纹存储模块；语音信号分离器与语音采
集模块210连接，输出语音信号分离出的多个声纹信号；声纹比较模块用于比较各声纹信号的声纹特征与声纹存储模块中存储的声纹特征，输出目标声纹信号；其中，声纹识别模块220设有用于切换声纹比较模块的声纹信号处理优先级顺序的按键模块；
44.声音补偿器230，声音补偿器230连接声纹比较模块，输出目标声纹信号经补偿处理后的完整音频信号；
45.功率放大模块240；功率放大模块240的输入端与声音补偿器230相连，输出端用于连接电声器件的音频输出模块。
46.具体而言，本技术声音处理电路可以包括依次连接的语音采集模块210、声纹识别模块220、声音补偿器230和功率放大模块240；其中，声纹识别模块220可以包括语音信号分离器、声纹比较模块和声纹存储模块，进而语音信号分离器可以对外部语音信号中的不同声纹信号进行分离处理，并根据声纹存储模块预存的声纹特征，由声纹比较模块确定出目标声纹信号。同时，声纹识别模块设有用于切换声纹比较模块的声纹信号处理优先级顺序的按键模块，进而使得目标声纹信号可以为相应优先级的声纹信号。
47.可以明确，本技术能够识别与预存声纹特征一致的外界环境的声纹信号，即目标声纹信号，同时声音补偿器230可以通过神经网络训练的方式对目标声纹信号进行数据恢复的补偿，最后通过功率放大模块240进行目标声纹信号的放大。相较于传统技术，本技术可以提取语音信号，声纹分离处理得到不同声纹信号，分别与预存声纹信息比较，当匹配上预设声纹信息，还可以暂停播放当前音频数据，同时放大外界目标声纹对应的音频。
48.本技术中的声纹识别模块220，可以包括依次连接的语音信号分离器、声纹比较模块和声纹存储模块。其中，声纹存储模块可以采用相应的存储器予以实现，用于存储预设声纹的声纹数据库。该存储器可以包括非易失性存储介质、内存储器。该数据库用于存储声纹特征或声纹数据等。
49.在其中一个实施例中，声纹存储模块可以用于连接远程服务器。
50.具体而言，声纹存储模块可以接收从远程服务器发送的目标声纹特征(例如，特定声纹特征)，改变当前声纹特征，或者通过语音采集模块预先记录的声纹特征，从相应的声纹配置系统改变控制指令提取新配置参数，将新配置设置存储在声纹存储模块，以及根据新设置修改声纹识别模块的识别配置参数；
51.进一步的，如图3所示，本技术中的语音分离器可以在多人对话场景中进行声纹识别，分离出单个说话人音频，进而可以识别出每个人的说话内容。该语音分离器可以采用相应的语音分离系统予以实现，例如，拥有n个说话人的语料被分离成n对应的输出。在一个示例中，语音分离器可以采用相应的声纹分离模块予以实现，该声纹分离模块可以配置在声纹比较模块中。例如，当前语音信号可以包括多个声纹数据，通过声纹分离模块，分离多个不同的声纹数据。
52.在一些实施例中，本技术中的语音分离器(声纹分离模块)可以实现声纹分离处理，例如，通过神经网络的输入为对应的短时声纹特征和语义特征，分离得到多个声纹得到各声纹特征向量，当满足预设阈值时，即与预存声纹信息相匹配；进一步的，还可以根据预设的不同声纹处理的优先级，优先处理最高优先级的声纹信号。其中，本技术中的声纹特征向量可以依据传统算法lpc(在线性预测系数)值与mfcc(梅尔倒谱系数)值计算得到。
53.需要说明的是，本技术中的语音分离器、声纹分离模块等分离功能，均可以采用现
有技术予以实现，例如可以运行基于深度学习的聚类模型，吸引子模型和不变量置换训练方法等程序的控制器、芯片等，本技术对此并无限定。
54.进一步的，如图3所示，本技术中的声纹识别模块220可以包括声纹存储模块和声纹比较模块(该声纹比较模块中可以设置有用于实现上述语音分离器的相关功能的声纹分离模块)。
55.该声纹比较模块，可以获取当前声纹信号的特征向量和以及特征向量的维度，与声纹存储模块预存的声纹信息匹配度达到预设阈值，声纹比较模块输出比较结果，若达到预设阈值，则输出该声纹的音频数据，进行音频数据放大处理，若未达到预设阈值，则不进行音频数据放大处理。在一个示例中，该预设阈值可以指相似度，例如，相似度可以为90％。
56.其中，本技术中，声纹比较模块可以将采集的声纹信号的信号特征和预设的声纹特征比较，从不同声纹对象提取的不同特征向量的区分度(具体可以与预设的声纹库进行频谱图对比)，以及从相同声纹对象的声音在不同时间提取的特征向量之间相似度，当满足预设阈值，例如相似度达到90％，则可认为达到预设阈值，以进行后续音频数据放大；本技术只针对目标声纹信号(即特定声纹)进行放大，其他外界音频视为非重要信息，不做音频放大处理。
57.本技术中，声纹比较模块获取的声纹特征还可以是声音频谱及包络、声音共振峰的出现频率及其轨迹，与预设的包括和共振峰频率轨迹进行匹配，确认是否在预设阈值内。需要说明的是，本技术中声纹比较模块提取声纹特征，并与预存的声纹特征进行比较，以确定目标声纹信号的过程，均可以采用现有的器件予以实现，例如，采用相应的声纹识别芯片；又如，采用相应的音频编解码电路，音频编解码电路将声音转换成电信号并进行处理。再如，声纹比较模块可以包括相应的频谱比较模块，若干ad转换以及相应的频谱生成模块。
58.在一些实施例中，本技术的声纹比较模块，还可以执行相应人声检测功能，通过vad(voice activity detection，语音端点检测)检测人声，利用归一化的当前子带能量进行分离噪声信号和人声信号，进一步提取不同的声纹信号，与预设的声纹库进行并行匹配，确认较高优先级的人声。
59.可以明确，本技术对声纹信号处理(提取并分离)，是与预设频率匹配的单一声纹信号进行放大处理，并不依赖于相应频段的设置。本技术可以识别目标声纹特征的音频信号进行放大处理，有效地识别不同环境下的外界语音信息。
60.在其中一个实施例中，声纹识别模块设有用于切换声纹比较模块的声纹信号处理优先级顺序的按键模块。
61.具体而言，声纹识别模块还可以包括按键模块，设置按键模块可以用于切换声纹识别模块的预设声纹放大优先级顺序，例如，声纹识别模块中包括多个优先级声纹数据库，如父母、妻儿、领导、健身朋友、工厂施工员等等，通过按键模块改变最高优先级声纹。
62.其中，语音信号经过声纹比较模块的处理，可能存在多个声纹信号与预存的声纹数据匹配；进而基于本技术，可以通过应用场景的不同，切换不同声纹的优先级序列，例如在家、在办公室、在健身房、在工地等等场景声纹优先级会不同。
63.需要说明的是，除了采用按键进行优先级选取的方式，本技术还可以采用其它方式实现声纹识别场景模式的转换。例如，可以通过关键词识别切换优先级，具体可以包括hi，哒哒，家庭模式/工作模式/健身模式/好友模式等。
64.此外，如图4所示，在其中一个实施例中，声纹比较模块可以包含一个或多个声纹处理器。
65.具体而言，本技术声纹比较模块，可以包含用于定制所述至少一个声纹处理器的匹配声纹信息，也可以通过多个声纹处理器，并行处理声纹识声纹的匹配，实现高效地声纹识别处理。
66.本技术采用包含语音分离器的声纹识别模块，可以对不同声纹信号进行分离处理，进而可以针对最高优先级的声纹信号进行放大处理；即本技术中的声纹分离模块，可以执行分离处理，把分离得到多组声纹信号输入声纹比较模块中，判别决策出满足阈值的较高优先级声纹信号，以便对该声纹信号进行放大处理。本技术能够使目标声纹的音频信号放大，同时声纹信号分为多个优先级适用不同场合，鲁棒性更强。
67.进一步的，本技术中的语音采集模块210可以用于采集外部语音信号，并通过模数转换得到数字信号，即模拟信号映射为时域或频域中离散信号值。在一个示例中，本技术语音采集模块210可以包括模数转换器，进而实现上述将语音信号转换为数字信号的功能。
68.在其中一个实施例中，如图5所示，本技术声音处理电路还可以包括连接在声纹识别模块与语音采集模块之间的语音降噪处理模块。
69.具体而言，语音采集模块210将采集到的外部语音信号，通过模数转换得到数字信号；该数字信号可以传输至语音降噪处理模块，对采集到的外部语音信号进行降噪处理。
70.进一步的，该语音降噪处理模块，可以包括主动降噪装置，通过消噪扬声器等产生与噪声同幅度、相位相反的波形进行抵消。
71.在其中一个实施例中，语音采集模块可以包括麦克风阵列。
72.具体地，本技术中的语音采集模块可以采用麦克风阵列予以实现，麦克风阵列可以实现多通道语音增强，进而能够充分利用语音信号的时域与空域信息，具有灵活的波束形成控制、能够消除非平稳信号且抗干扰能力强。
73.在一个实施例中，针对本技术中的声音补偿器230；该声音补偿器230可以连接声纹比较模块，进而可以输出目标声纹信号经补偿处理后的完整音频信号。
74.经过前述的声纹识别模块220的处理后，可以识别出语音信号中与预存声纹特征一致的外界环境特定的声纹信号，同时，可以由本技术中的声音补偿器对该特定声纹信号通过神经网络训练的方式进行数据恢复的补偿，使得后续可以进行该特定声纹信号的放大。
75.其中，本技术中的声音补偿器可以采用相应的补偿模块予以实现，例如，获取目标声纹的语音信号起始位置和结束位置，补偿音频信号降噪误处理的语音信号。
76.在一些实施例中，声音补偿器可以同步采集到的音频和神经网络修复的语音信号，进行一定补偿，使得音频信号完整。需要说明的是，本技术中的声音补偿器(即补偿模块)可以采用现有的同步方式实现上述语音信号的修复与补偿，例如，通过神经网络模型，在时域上根据后面的语音帧来修复前面的语音帧，即本技术中的补偿模块，可以通过神经网络模型，在时域上根据后面的语音帧来修复前面的语音帧，补偿的是语音信号。
77.其中，补偿信号是置于噪声剔除或人声识别处理之后，只需要获取语音信号起始位置和结束位置，修复当前外界音频干扰覆盖的语音信号，或在噪声剔除阶段损失的语音信号。
78.以上，本技术中的补偿模块，可以通过计算最高优先级的声纹信号的起始位置和结束位置，对降噪后的丢失的语音数据进行补偿，确定其放大的声纹信号完整性。
79.针对本技术中的功率放大模块240，该功率放大模块240的输入端可以与声音补偿器230相连，输出端可以用于连接电声器件的音频输出模块。
80.具体而言，功率放大模块240可以依据补偿模块(即声音补偿器)输出的特定频率的音频(即目标声纹信号的完整音频信号)，进行功率放大，同时用于调节耳机输出音频大小。以本技术声音处理电路应用于蓝牙耳机为例，当未匹配到特定声纹的特征向量以及其维度时，可以通过蓝牙芯片控制蓝牙耳机的内部音量恢复正常值，使用户继续收听耳机配对设备所提供的音频。而当匹配上与预设声纹信息，则暂停播放当前音频数据，同时放大外界特定声纹对应的音频。
81.以上，本技术声音处理电路包括依次连接的语音采集模块、声纹识别模块、声音补偿器和功率放大模块；其中，声纹识别模块包括语音信号分离器、声纹比较模块和声纹存储模块，进而语音信号分离器可以对外部语音信号中的不同声纹信号进行分离处理，并根据声纹存储模块预存的声纹特征，由声纹比较模块确定出目标声纹信号(例如，最高优先级的声纹信号)，然后，声音补偿器可以对该目标声纹信号中降噪后的丢失的语音数据进行补偿，以确定其经功率放大模块放大的声纹信号的完整性。本技术能够使目标声纹的音频信号放大，提高耳机适用性，同时声纹信号可以分为多个优先级适用不同场合，鲁棒性更强。
82.需要说明的是，本技术声音处理电路中的各个模块可通过相应硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电声器件中的处理器中，以便于处理器调用执行以上各个模块对应的操作。
83.在一个实施例中，如图6所示，提供了一种电声器件，包括音频输出模块，以及连接音频输出模块的如上述的声音处理电路。
84.在其中一个实施例中，还包括入耳检测模块；入耳检测模块分别连接语音采集模块、声纹识别模块。
85.在其中一个实施例中，电声器件为耳机。
86.在其中一个实施例中，耳机为无线蓝牙耳机。
87.具体而言，以电声器件为蓝牙耳机为例进行说明，如图6所示，蓝牙耳机整体结构可以包括：入耳检测模块、语音采集模块、语音降噪模块、声纹识别模块、补偿模块(即声音补偿器)、功率放大模块和音频输出模块。
88.其中，基于入耳检测模块的检测结果，可以确认当前是否需要开启语音采集模块、声纹识别模块、补偿模块和/或功率放大模块。在一个示例中，入耳检测模块，可以检测当前蓝牙耳机是否处于佩戴状态，当蓝牙耳机处于佩戴状态，开启语音采集模块和声纹识别模块，以便实时识别语音，同时降低声纹识别装置的功耗。
89.进一步的，音频输出模块，可以输出与预设声纹匹配的外界音频数据或维持耳机播放手机端的数据。
90.以上，本技术的电声器件(例如，蓝牙耳机)能够使目标声纹的音频信号放大，同时声纹信号分为多个优先级适用不同场合，鲁棒性更强。通过本技术识别特定声纹特征的音频信号进行放大处理，可以有效地识别不同环境下的外界语音信息。
91.在一个实施例中，如图7所示，提供了一种声音处理系统，包括主耳机和从耳机；
92.其中，从耳机包括上述的声音处理电路。
93.具体而言，本技术声音处理电路可以应用于从耳机，进而主耳机可以作为音频源输出端，从耳机作为一个识别外界特定音频信号放大端，从而防止产生正在收听音频播放的中断或停止。进一步的，如图7所示，以声音处理系统中主从机均为蓝牙耳机为例，其中，蓝牙左耳机可以为主耳机，而蓝牙右耳机可以为从耳机。进而，主从机的播放过程中，主机保持播放数据源的音频，从机当收到特定声纹的音频时进行放大。
94.本领域技术人员可以理解，图1至图7中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的硬件或元器件的限定，具体的设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
95.在本说明书的描述中，参考术语“有些实施例”、“其他实施例”、“理想实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特征包含于本实用新型的至少一个实施例或示例中。在本说明书中，对上述术语的示意性描述不一定指的是相同的实施例或示例。
96.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
97.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对实用新型专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于反正切函数的零吸引回声消除方法与流程

声音处理电路、电声器件和声音处理系统的制作方法

相关文章

最热文献