用于车辆音频系统的具有空间言语分离的语音闪避的制作方法

2021-07-16 18:30:00 来源：中国专利 TAG：申请闪避语音言语音频系统

用于车辆音频系统的具有空间言语分离的语音闪避
1.相关申请的交叉引用
2.本申请要求2019年12月30日提交的美国临时申请序列号62/954,991的权益，所述临时申请的公开内容据此以引用的方式整体并入本文。
技术领域
3.本公开涉及一种用于车辆音频系统的具有空间言语分离的语音闪避的系统。

背景技术：

4.当前的车辆车厢声学假设在车厢中发生的任何声音通常都将被感知为一种噪声刺激。干扰源的常见实例包括道路噪声、风噪声、乘客言语和多媒体内容。这些噪声源的存在通过降低言语清晰度、信噪比和主观通话质量而使言语感知复杂化。语音闪避可用于提高车辆内驾驶员的质量和满意度。然而，用于确定音频信号是否包括人类言语的算法通常繁琐且不准确。

技术实现要素：

5.一种车辆扩音器系统包括：至少两个传声器，所述至少两个传声器形成传声器阵列；至少一个扩音器，所述至少一个扩音器被配置来发出非人类声音；处理器，所述处理器被编程来从所述传声器阵列接收传入音频信号。所述处理器进一步被编程来：对所述传入音频信号应用波束成形；确定是否在所述音频信号内检测到人类产生的声音；以及响应于检测到人类产生的声音而指示所述扩音器调整所述非人类声音。
6.一种非暂时性计算机可读介质包括用于在车辆中产生音频的扩音器系统的指令，所述介质包括：从车辆传声器阵列接收传入音频信号；对所述传入音频信号应用波束成形；确定是否在所述音频信号内检测到人类产生的声音；以及响应于检测到人类产生的声音而指示扩音器调整所述非人类声音。
7.一种用于通过车辆中的扩音器系统产生音频的方法包括：从车辆传声器阵列接收传入音频信号；对所述传入音频信号应用波束成形；确定是否在所述音频信号内检测到人类产生的声音；以及响应于检测到人类产生的声音而指示扩音器调整所述非人类声音。
附图说明
8.图1示出根据本公开的一个或多个实施方案的用于促进车辆中的近端参与者与位于车辆外部的远程远端参与者之间的电信的电信网络；
9.图2是根据本公开的一个或多个实施方案的用于远端电信的车厢内噪声消除系统的框图；
10.图3是描绘根据本公开的一个或多个实施方案的用于远端电信的噪声消除方法300的简化示例性流程图；
11.图4示出根据本公开的一个或多个实施方案的示例性传声器布局；
12.图5示出根据本公开的一个或多个实施方案的用于车辆的基于头枕的电信系统的示例性设置；
13.图6示出根据本公开的一个或多个实施方案的用于车辆的基于头枕的电信系统的另一示例性设置；
14.图7是根据本公开的一个或多个实施方案的车辆的平面图，所述车辆包括用于在车厢内噪声消除系统中使用的至少一个头枕传声器阵列；
15.图8是根据本公开的一个或多个实施方案的车辆的另一平面图，所述车辆包括用于在车厢内噪声消除系统中使用的至少一个头枕传声器阵列；
16.图9是根据本公开的一个或多个实施方案的车辆的又一平面图，所述车辆包括用于在车内噪声消除系统中使用的至少一个头枕传声器阵列和后视镜组件传声器阵列；
17.图10是根据本公开的一个或多个实施方案的车辆的再又一平面图，所述车辆包括用于在车内噪声消除系统中使用的多个各种头枕传声器阵列；
18.图11示出语音闪避系统的框图；并且
19.图12示出图11的系统的示例性过程。
具体实施方式
20.按照要求，本文公开了本发明的详细实施方案；然而，应当理解，所公开的实施方案仅仅是可以各种和替代形式来体现的本发明的示例。附图不一定按比例绘制；一些特征可能被放大或最小化以示出特定部件的细节。因此，本文中公开的特定结构细节和功能细节不应当被解释为是限制性的，而是仅仅应当解释为是教导本领域技术人员以不同方式体现本发明的代表性基础。
21.本文描述一种用于语音闪避的波束成形方法。当用户试图对话时，语音闪避系统可帮助自动调整让人分心的媒体信号的音量。当言语完成时，媒体可自动调整以恢复较高音量。传声器阵列和波束成形过程可用于接收和标识来自用户的头部和嘴巴周围的狭窄感兴趣空间区域的言语信号。这允许将来自那个感兴趣区域的任何和所有声音立即路由到语音闪避引擎中。
22.语音闪避是促进清晰通信的常用方法。当出现语音信号时，媒体的音量被无缝地“闪避”或衰减以使得更易于通信。许多现有系统使用确定传声器的传入言语信号何时包含人类言语的算法。这些算法繁琐、庞大，并且在可将传入信号确认为言语信号之前可能需要给定时延。这意味着用户语句的开头可能不被路由到闪避引擎中。另外，诸如“嗯”、“呸”或“嘘”之类的非言语话语可能不被分类为言语信号，因此将不被路由到闪避引擎。
23.由于本文公开的概念依赖于感兴趣空间区域，因此来自那个感兴趣区域的任何和所有声音都将自动并立即路由到闪避引擎中。这包括非言语话语，并且不需要任何时延，因为已经通过波束成形限定和定位了感兴趣区域。因此，避免了定向传声器和繁琐的信号处理。
24.本公开还描述一种用于优化远端用户体验的车内噪声消除系统。所述噪声消除系统可提高近端言语在通信交换的远端处的清晰度，所述通信交换包括与虚拟个人助理的电信交换或对话等。所述噪声消除系统可包括来自车辆以及来自电信装置的传声器的实时声学输入。此外，可处理来自安装在汽车中的小型嵌入式传声器的音频信号并将其混合到传
出电信信号中，以有效地消除来自车辆中一个或多个所不想要的源的声能。除了嵌入式传声器捕获的所不想要的噪声(例如，孩子叫喊声和背景对话)之外，从车辆信息娱乐系统中的已知音频流(例如，音乐、声音效果和来自电影音频的对话)播放的音频可用作到噪声消除系统的直接输入。因此，可将作为直接输入的这些流从传出电信信号中消除，从而为用户的远端通信员提供高得多的信噪比、通话质量和言语清晰度。
25.图1示出用于通过蜂窝基站108促进车辆104中的近端参与者102与位于车辆外部的远程远端参与者106之间的电信交换的电信网络100。车辆104可包括电信系统110，其用于处理传入和传出电信信号(在图1中统称为电信信号112)。电信系统110可包括数字信号处理器(dsp)114，其用于处理音频电信信号，如下面将更详细描述的。根据另一实施方案，dsp 114可以是与电信系统110分离的模块。车辆信息娱乐系统116可连接到电信系统110。第一换能器118或扬声器可将传入电信信号发射到车辆车厢120内部的电信交换的近端参与者。因此，第一换能器118可位于近端参与者附近，或者可产生定位在近端参与者所占据的特定座位位置处的声场。第二换能器122可发射来自车辆的信息娱乐系统116的音频(例如，音乐、声音效果和来自电影音频的对话)。
26.第一传声器阵列124可定位在车辆车厢120中以接收电信中的近端参与者(即，源车辆的驾驶员或另一乘员)的言语。第二传声器阵列126可定位在车辆车厢120中以检测所不想要的音频源(例如，道路噪声、风噪声、背景言语和多媒体内容)，这些音频源统称为噪声。电信系统110、dsp 114、信息娱乐系统116、换能器118、122和传声器阵列124、126可共同形成用于远端电信的车厢内噪声消除系统128。
27.图2是图1所描绘的噪声消除系统128的框图。如图2所示，来自远端参与者(未示出)的传入电信信号112a可由dsp 114接收。dsp 114可以是可特定于本文公开的音频应用的基于硬件的装置，诸如专用微处理器和/或针对数字信号处理的操作需求优化的集成电路的组合。传入电信信号112a可在自动增益控制器(agc)202处经历自动增益控制。agc 202可在其输出端处提供受控信号幅度，而不管输入信号中的幅度是否变化。平均或峰值输出信号电平用于将输入到输出增益动态调整到合适的值，使得电路能够在更大范围的输入信号电平下令人满意地工作。然后，来自agc 202的输出可由损耗控制器204接收以经历损耗控制，然后传递到均衡器206以均衡传入电信信号112a。均衡是调整电子信号内的频率分量之间的平衡的过程。均衡器增强(增加)或减弱(削减)特定频带或“频率范围”的能量。
28.均衡器206的输出可由限制器208接收。限制器是允许低于指定输入功率或电平的信号不受影响地通过同时衰减超过此阈值的较强信号的峰值的电路。限制是一种类型的动态范围压缩；它是借以防止装置的输出的指定特性(通常是幅度)超过预定值的任何过程。限制器通常在现场声音和广播应用中用作安全装置以防止出现突然音量峰值。然后，经过数字处理的传入电信信号112a'可由第一换能器118接收，以便以可听方式发射到电信交换的近端参与者。
29.同样如图2所示，噪声消除系统128可包括第一传声器阵列124和第二传声器阵列126。第一传声器阵列124可包括多个小型嵌入式传声器，所述多个小型嵌入式传声器策略性地定位在车辆车厢中以接收来自电信交换的近端参与者(即，源车辆的驾驶员或另一乘员)的言语。第一传声器阵列124可尽可能靠近近端参与者同时尽可能远离反射表面定位。例如，第一传声器阵列124可嵌入在头枕或车顶篷内衬等中，如图4所示。第二传声器阵列
126可包括多个小型嵌入式传声器，所述多个小型嵌入式传声器策略性地定位在车辆车厢中以检测所不想要的音频源(例如，道路噪声、风噪声、背景言语和多媒体内容)，这些音频源统称为噪声。
30.到第一传声器阵列和第二传声器阵列的输入两者(分别为近端言语和噪声)可使用dsp 114进行处理。来自第一传声器阵列124的一组第一音频信号209(即，其指示近端言语)可馈送到第一波束成形器210中以进行波束成形，而一组第二音频信号211(即，其指示噪声)可馈送到第二波束成形器212中。波束成形或空间滤波是在传感器阵列中用于定向信号发射或接收的信号处理技术。这是通过以处于特定角度的信号经历相长干涉而其他信号经历相消干涉的这种方式组合阵列中的元件来实现的。可在发射端和接收端两者处使用波束成形以实现空间选择性。与全向接收/发射相比的改进称为阵列的方向性。为了在发射时改变阵列的方向性，波束成形器控制信号在每个发射器处的相位和相对幅度，以在波前中产生相长干涉和相消干涉图案。当接收时，来自不同传感器的信息以优先观察到预期辐射图案的方式进行组合。
31.第一波束成形器210可输出指示由第一传声器阵列124检测到的近端言语的近端言语信号213。替代地，dsp 114可直接从第一传声器阵列124或第一传声器阵列中的单独传声器接收近端言语信号213。第二波束成形器212可输出指示由第二传声器阵列126检测到的不可预测的背景噪声的噪声信号218。替代地，dsp 114可直接从第二传声器阵列126或第二传声器阵列中的单独传声器接收噪声信号218。
32.近端言语信号213可与经过数字处理的来自远端参与者106的传入电信信号112a'一起由回声消除器214接收。回声消除是电话学中用于通过在已经存在回声之后消除回声来改善语音质量的方法。除了改善主观质量外，此过程还通过防止回声在网络中传播来提高通过静音抑制获得的容量。存在各种类型和原因的具有独特特性的回声，包括声学回声(传声器反射和记录的来自扩音器的声音，其可随时间推移显著变化)和线路回声(通过例如发送线与接收线之间的耦接、阻抗不匹配、电反射等引起的电脉冲，其变化远小于声学回声)。然而，实际上，使用相同的技术来处理所有类型的回声，因此声回声消除器可消除线路回声和声学回声。回声消除包括首先识别在发射或接收的信号中以一定延迟重复出现的最初发射的信号。一旦识别到回声，就可通过从发射或接收的信号中减去回声来将其去除。尽管此技术通常使用数字信号处理器或软件以数字方式实现，但也可在模拟电路中实现。
33.回声消除器214的输出可在噪声抑制器216处与来自第二波束成形器212的噪声信号218(即，不可预测的噪声)和来自信息娱乐系统116的信息娱乐音频信号220(即，可预测的噪声)混合。在噪声抑制器216处将近端言语信号213与噪声信号218和/或信息娱乐音频信号220混合可有效地消除来自车辆104中一个或多个所不想要的源的声能。从车辆的信息娱乐系统116中的已知音频流(例如，音乐、声音效果和电影音频的对话)播放的音频可被认为是可预测的噪声，并且可用作到噪声消除系统128的直接输入并从近端言语信号213中消除或抑制。此外，由嵌入式传声器捕获的另外的所不想要的且不可预测的噪声(例如，孩子叫喊声和背景对话)也可用作到噪声消除系统128的直接输入。噪声抑制器216可基于噪声信号218和信息娱乐音频信号220从近端言语信号213中消除或抑制所不想要的噪声，然后将近端言语信号213作为传出电信信号112b传达给远端参与者。噪声抑制是从所捕获信号中去除背景噪声的音频预处理器。
34.经过噪声抑制的近端言语信号213'可从噪声抑制器216输出，并且可在回声抑制器222处与经处理的来自远端参与者的传入电信信号112a'混合。与回声消除一样，回声抑制是电话学中用于通过防止产生回声或在已经存在回声之后去除回声来提高语音质量。回声抑制器的工作方式是：检测电路中在一个方向上行进的语音信号，然后在另一方向上插入大量损耗。通常，电路远端处的回声抑制器在检测到来自电路近端的语音时增大此损耗。此增大的损耗阻止说话者听到他们自己的语音。
35.然后，来自回声抑制器222的输出可在自动增益控制器(agc)224处经历自动增益控制。agc 224可在其输出端处提供受控信号幅度，而不管输入信号中的幅度是否变化。平均或峰值输出信号电平用于将输入到输出增益动态调整到合适的值，使得电路能够在更大范围的输入信号电平下令人满意地工作。然后，来自agc 224的输出可由均衡器226接收以均衡近端言语信号。均衡是调整电子信号内的频率分量之间的平衡的过程。均衡器增强(增加)或减弱(削减)特定频带或“频率范围”的能量。
36.来自均衡器226的输出可发送到损耗控制器228以经历损耗控制。然后输出可传递通过舒适噪声发生器(cng)230。cng 230是在没有接收到信号的时段期间插入舒适噪声的模块。cng可与不连续发射(dtx)结合使用。dtx意指在静音时段期间切断发射器。因此，在接收端(例如，远端)处，背景声学噪声突然消失。对于接收方(例如，远端参与者)而言，这可能非常烦人。如果静音时段很长，接收方甚至可能认为线路不通。为了克服这些问题，每当发射切断时，可在接收端(即，远端)处生成“舒适噪声”。舒适噪声由cng生成。如果舒适噪声与在言语时段期间所发射的背景声学噪声的噪声匹配良好，则可以接收方在对话期间未注意到切换的这种方式填充言语时段之间的间隙。由于噪声不断变化，因此舒适噪声发生器230可定期更新。
37.然后来自cng 230的输出可由电信系统作为传出电信信号112b发射到电信交换的远端参与者。通过直接从传出电信信号中消除噪声输入，可为用户的远端通信员提供高得多的信噪比、通话质量和言语清晰度。
38.尽管被示出并描述为提高近端言语在电信交换的远端参与者处的清晰度，但是噪声消除系统128可用于提高近端言语在任何通信交换的远端处的清晰度。例如，噪声消除系统128可与虚拟个人助理(vpa)应用程序结合使用以优化远端(即，虚拟个人助理)处的言语识别。因此，可类似地从与vpa的通信交换的近端言语中抑制或消除背景(所不想要的)噪声。
39.图3是描绘用于远端电信的噪声消除方法300的简化示例性流程图。在步骤305处，可在噪声消除系统128处通过传声器阵列诸如第一传声器阵列124接收近端言语。同时，噪声消除系统128可接收来自所不想要的源的音频输入流(诸如来自第二传声器阵列126的不可预测的噪声和/或来自信息娱乐系统116的可预测的噪声)，如步骤310处所提供。可将近端言语处理成传出电信信号112b以供电信交换的远端参与者接收。因此，在步骤315处，近端言语信号可经历回声消除操作，以通过在已经存在回声之后去除回声来提高语音质量。如先前所描述的，回声消除包括首先识别在发射或接收的信号中以一定延迟重复出现的最初发射的信号。一旦识别到回声，就可通过从发射或接收的信号中减去回声来将其去除。
40.可在噪声抑制器处与在步骤310处接收的噪声输入和远端参与者的传入电信信号(步骤320)一起接收近端言语信号。在噪声消除期间，可从近端言语信号中消除或抑制噪
声，如步骤325处所提供。在步骤330处，可通过减轻或消除外来声音的掩蔽效应来恢复近端言语信号中的言语的清晰度。然后，近端言语信号可使用传入电信信号经历回声抑制，如步骤335处所提供。如先前所描述的，与回声消除一样，回声抑制是电话学中用于通过防止产生回声或在已经存在回声之后去除回声来提高语音质量。近端言语信号可在步骤340处经历另外的音频滤波，然后作为传出电信信号通过电信网络发射到远端参与者(步骤345)。同时，可通过扬声器在车辆车厢中播放传入电信信号(步骤350)。
41.图4示出根据本公开的一个或多个实施方案的车辆104的车厢120内的示例性传声器布局。例如，来自第一传声器阵列124的用于拾取近端言语的第一传声器124a可嵌入一个或多个头枕410中。来自第二传声器阵列126的用于拾取噪声的第二传声器126a也可嵌入一个或多个头枕410、车顶篷内衬(未示出)等中。如图所示，与相对于车辆车厢120定位到乘客外部的传声器相比，相对于车辆车厢朝向乘客内部尽可能靠近使用者的嘴巴定位的传声器可使信号中的反射能量最小化。这是因为相对于车辆车厢定位到乘客外部的传声器可接收更多的来自包围车辆车厢120的反射表面412(诸如，玻璃)的反射能量。使近端言语信号中的反射能量最小化可提高电信远端处的言语清晰度。图4所示的传声器的布局和/或位置仅是实例。传声器阵列的确切位置将取决于车辆内部的边界和覆盖范围。
42.图5示出用于车辆的基于头枕的电信系统的示例性设置。第一面向前的传声器阵列502可放置在前排乘客头枕506的前部504附近，以用于接收电信交换的近端言语。第二面向后的传声器阵列508可放置在前排乘客头枕506的后部510附近，以用于接收包括背景言语的噪声。图6示出用于车辆的基于头枕的电信系统的另一示例性设置。第一面向前的传声器阵列602可放置在前排乘客头枕606的前部604附近，以用于接收电信交换的近端言语。第二面向前的传声器阵列608可放置在后排乘客头枕612的前部610附近，以用于接收包括背景言语的噪声。如同图4一样，图5和图6所示的传声器阵列的确切位置将取决于车辆内部的边界和覆盖区域。
43.图7至图10描绘用于车辆(诸如，车辆104)的车厢120内的噪声消除系统128(未示出)的样品传声器配置的各种平面图。如同结合图1和图2所描述的传声器和传声器阵列一样，图7至图10所示的各种传声器阵列和/或单独传声器可与数字信号处理器114通信以与车辆通信系统诸如车内通信系统或电信系统110结合工作。例如，图7是根据本公开的一个或多个实施方案的车辆104的平面图，其描绘第一样品传声器配置。如图所示，噪声消除系统128(未示出)可包括至少一个传声器阵列710，所述至少一个传声器阵列710包括至少两个传声器—第一传声器710a和第二传声器710b。第一传声器和第二传声器可安装到第一头枕714的外表面712的间隔开的位置处。第一头枕714可以是驾驶员侧头枕。
44.第一头枕714的外表面712可包括内侧侧表面716和外侧侧表面718。内侧侧表面716可比外侧侧表面718更靠近车辆车厢120的中心，所述外侧侧表面718更靠近车辆104的包括反射表面412(见图4)的一侧。如图7所示，第一传声器710a和第二传声器710b可齐平地定位在第一头枕714的内侧侧表面716上。第一传声器710a和第二传声器710b可相对于车辆104至少在纵向方向上间隔开。因此，将第一传声器和第二传声器分开的距离可包括至少纵向距离x，以产生至少在纵向方向上定向的第一听音区域720和第二听音区域722。传声器阵列710的中两个传声器之间的纵向距离x可给出传入声音的方向(总体上是前部或后部)的指示。因此，第一听音区域720可包括乘客车厢120的前部区域，诸如涵盖前排座椅的区域，
而第二听音区域722可包括定向在第一听音区域720后方的区域，诸如涵盖后排乘客座位的区域。在一个实施方案中，第一传声器710a与第二传声器710b之间的纵向距离x可为大约一英寸，尽管可采用传声器之间的其他距离给出传入声音的方向(前方或后方)的指示。
45.数字信号处理器114可被编程来从传声器阵列710接收指示声音的传声器信号，如图2所示，并且基于传声器信号来标识声音是从第一听音区域720还是第二听音区域722的方向接收的。例如，数字信号处理器114可比较来自第一传声器710a和第二传声器710b的传声器信号，并基于传声器信号到达两个传声器中的每一者处的时间差来定位来自第一听音区域或第二听音区域的声音的方向。此外，数字信号处理器114可抑制或消除指示来自第二听音区域722(的方向)的声音的传声器信号，所述声音可等同于所不想要的或干扰的背景噪声。另一方面，数字信号处理器114可向通信交换中的远端参与者发射指示来自第一听音区域720(的方向)的声音的传声器信号，所述声音可等同于想要的近端言语。
46.根据一个实施方案，第一传声器710a和第二传声器710b可以是全向传声器。根据另一实施方案，第一传声器710a和第二传声器710b可以是在对应听音区域的方向上具有方向性的定向传声器。因此，可基于传声器的方向性来衰减传入声音，使得可将来自第一听音区域720的声音发射给远端参与者，同时可抑制来自第二听音区域722的声音。
47.图8是根据本公开的一个或多个实施方案的车辆104的平面图，其描绘另一样品传声器配置。如图所示，噪声消除系统128(未示出)可包括至少第一传声器阵列810，所述第一传声器阵列810包括安装到第一头枕814的外表面812的底表面811的至少两个传声器——第一传声器810a和第二传声器810b。类似于图7，第一传声器810a和第二传声器810b可相对于车辆104在纵向方向上间隔开。因此，将第一传声器810a和第二传声器810b分开的距离可包括至少纵向距离x，以产生至少在纵向方向上定向的第一听音区域820和第二听音区域822。如关于图7所描述的，数字信号处理器114可被编程来从传声器阵列810接收指示声音的传声器信号，如图2所示，并且基于传声器信号来标识声音是从第一听音区域820的方向还是第二听音区域822的方向接收的。此外，数字信号处理器114可抑制或消除指示来自第二听音区域822(的方向)的声音的传声器信号，所述声音可等同于所不想要的或干扰的背景噪声。另一方面，数字信号处理器114可向通信交换中的远端参与者发射指示来自第一听音区域820(的方向)的声音的传声器信号，所述声音可等同于想要的近端言语。
48.如图8所示，第一传声器810a和第二传声器810b也可相对于车辆104在横向方向上间隔开。因此，将第一传声器810a和第二传声器810b分开的距离还可包括横向距离y，使得第一听音区域820包括相对于车辆104在横向方向上定向的两个听音子区域。例如，第一听音子区域820a可涵盖围绕驾驶员座位824的区域，而第二听音子区域820b可涵盖围绕前排乘客座位826的区域。第一传声器阵列810中的两个传声器810a、810b之间的横向距离y可给出传入声音的方向(总体上是左或右)的指示，使得数字信号处理器114可进一步基于传声器信号来标识声音是从第一听音分区820a的方向还是第二听音分区820b的方向接收的。此外，数字信号处理器114可被编程来抑制或消除指示来自第二听音子区域820b(的方向)的声音的传声器信号，所述声音也可等同于所不想要的或干扰的背景噪声。另一方面，数字信号处理器114可向通信交换中的远端参与者发射指示来自第一听音子区域820a(的方向)的声音的传声器信号，所述声音可等同于想要的近端言语。
49.如图8进一步所示，噪声消除系统可包括第二传声器阵列828，所述第二传声器阵
列828包括安装到在横向上与第一头枕814相邻的第二头枕832的底表面830的至少两个传声器——第一传声器828a和第二传声器828b。第二传声器阵列的配置可以是第一传声器阵列的配置的镜像。因此，第二传声器阵列828中的第一传声器828a和第二传声器828b也可在纵向方向和横向方向上都间隔开，以给出传入声音的方向(总体上是左或右)的进一步指示，使得数字信号处理器114可进一步基于传声器信号来标识声音是从第一听音子区域820a的方向还是第二听音子区域820b的方向接收的。第一传声器阵列和/或第二传声器阵列中的传声器可以是全向或定向传声器中。
50.图9描绘与图8所示的三区域配置类似的另一样品传声器配置。如图所示，第一传声器阵列910可安装到头枕914的内侧侧表面916，诸如图7所示的传声器阵列。类似于图7，第一传声器阵列910可包括定位在内侧侧表面916上的间隔开的位置处的第一传声器910a和第二传声器910b，所述第一传声器910a和所述第二传声器910b在纵向方向上分开一定距离以给出传入声音的方向(前方或后方)的指示。因此，如先前所描述的，第一传声器910a和第二传声器910b的纵向分开可产生在纵向方向上定向的第一听音区域920和第二听音区域922。包括第一传声器934a和第二传声器934b的第二传声器阵列934设置在后视镜组件936中而不是设置在第二头枕中(如图8中)，以给出传入声音的方向(左或右)的指示，使得数字信号处理器114可进一步基于传声器信号来标识声音是从第一听音子区域920a的方向还是第二听音子区域920b的方向接收的。第一传声器阵列910中的第一传声器910a和第二传声器910b可以是全向传声器。此外，第二传声器阵列934中的第一传声器934a和第二传声器934b可以是定向传声器。
51.图10是根据本公开的一个或多个实施方案的车辆1004的平面图，其描绘又一样品传声器配置。如图所示，车辆1004可包括三排座椅。图10所示的传声器配置可采用以上关于图7至图9描述的各种配置的组合。例如，第一排座椅1040可包括在第一头枕1014中的第一传声器阵列1010和在第二头枕1030中的第二传声器阵列1028，诸如图8所示。因此，第一传声器阵列1010和第二传声器阵列1028中的每一者中的传声器可安装到每个对应头枕的底表面1011，并且在纵向方向和横向方向上都间隔开。如先前所描述的，横向间隔可产生包括具有横向取向的第一听音子区域1020a和第二听音子区域1020b的第一听音区域1020。此外，纵向间隔可产生在第一听音区域1020后方的第二听音区域1022。
52.第二排座椅1044中的至少一个头枕1042可包括与图7中描绘的传声器阵列710类似的第三传声器阵列1046。因此，第三传声器阵列1046中的传声器可安装到头枕1042的内侧侧表面1016，并且在至少纵向方向上间隔开以产生在第二听音区域1022后方的涵盖第三排座椅1052的第三听音区域1050。车辆1004可包括总体上沿着车辆的中心线定位在车辆的天花板或车顶篷内衬(未示出)中的另外的传声器阵列1054。这些另外的传声器阵列1054可包括三个或四个(如图所示)传声器，它们可以是全向的。图10所示的所有各种传声器阵列都可形成噪声消除系统128的一部分，并且可以与结合图7至图9所描述类似的方式与数字信号处理器114协作。另外，图10所示的头枕中的一个或多个还可包括至少一个扬声器1056。安装在头枕上的扬声器1056可用于发射来自通信交换的远端参与者的声音。
53.图11示出示例性闪避系统800。闪避系统800可包括被配置来拾取和接收传入音频信号804的传声器阵列802。阵列802可类似于先前所描述的阵列并且可包括多个小型嵌入式传声器，所述多个小型嵌入式传声器策略性地定位在车辆车厢中以接收来自电信交换的
近端参与者(即，源车辆的驾驶员或另一乘员)的言语。阵列802的布置和位置可例如如本文关于图5至图10所描述的那样布置。阵列802在图11中被示出为包括4个传声器，但可包括更多或更少的传声器。传入音频信号804可包括人类言语以及其他噪声信号，包括音乐、背景噪声、道路噪声等。尽管阵列802被示出为包括两个传声器，但是阵列802可包括多于两个传声器，包括四个传声器的阵列。传声器可以是定向传声器。
54.系统800可包括实时言语清洗算法或与上述波束成形器(诸如第一波束成形器210和第二波束成形器212)类似的波束成形器806。尽管如此描述波束成形器806，但是此框也可包括其他处理，诸如噪声抑制、回声消除等。波束成形或空间滤波是在传感器阵列中用于定向信号发射或接收的信号处理技术。这是通过以处于特定角度的信号经历相长干涉而其他信号经历相消干涉的这种方式组合阵列中的元件来实现的。可在发射端和接收端两者处使用波束成形以实现空间选择性。与全向接收/发射相比的改进被称为阵列的方向性。为了在发射时改变阵列的方向性，波束成形器控制信号在每个发射器处的相位和相对幅度，以在波前中产生相长干涉和相消干涉图案。当接收时，将以优先观察预期辐射图案的方式对来自不同传感器的信息进行组合。
55.波束成形器806可输出言语信号810。言语信号810可包括从传入音频信号804中清洗出来的人类语音信号。也就是说，可去除噪声，从而仅留下人类言语。这可帮助识别传入音频信号是否包括人类言语。言语信号810还可包括任何类型的人类产生的声音，并且不限于言语，诸如嗡嗡声、咔嚓声、拍手声等。确定是否包括人类言语的传统方法通常需要大的存储器和高处理能力。另外，由于需要大量处理以确定是否存在人类言语，因此现有系统在可将传入信号确认为言语信号之前需要时延。这可导致对话的开头不被路由到闪避站。另外，诸如“嗯”、“呸”或“嘘”的非言语但人类的噪声可能不被分类为言语信号，因此也不被适当地路由到闪避引擎。
56.由于波束成形器依赖于感兴趣空间区域，因此来自那个区域的任何和所有声音都被立即路由到闪避站。这包括非言语话语，并且由于使用波束成形来检测言语，因此避免了时延问题，因为已经限定并定位了感兴趣区域。
57.在车辆使用期间可能播放从车辆扬声器发出的非人类产生的声音(诸如，音乐和其他媒体)。但是，在对话期间，乘员可能希望降低非言语声音以使收听和听音更容易。语音闪避可自动实现这一点，而无需人与音量控件进行交互。在图11中，可在框814处手动控制这些非言语声音812，或者在框816处自动闪避这些非言语声音。可将经过闪避的言语信号发射到车辆音频系统。
58.图12示出用于图11的系统800的示例性过程1200。过程1200开始于框1205，在框1205处，处理器114可从阵列802接收传入音频信号。
59.在框1210处，处理器114可应用波束成形器806。波束成形器806可在空间上过滤出人类言语声音。
60.在框1215处，处理器114可根据框1210确定是否检测到感兴趣空间区域，例如，是否检测到来自乘员的声学信号。也就是说，来自感兴趣区域的任何声学输入是否高于阈值。如果是，则使用阈值来调整非言语媒体水平。这可以可视化为超声每个乘员的头部/嘴巴区域照射的聚光灯。如果是，则过程1200前进至框1220，如果不是，则过程返回到框1205。
61.在框1220处，处理器114可调整车辆音频系统正在播放的非言语或非人类声音的
音量。可调整音量以减小到预定义水平。也就是说，音量可减小，但是乘员仍然可听到。可使音量可完全静默。可完全暂停播放。另外地或替代地，可将音量逐渐减小至静默，或逐渐减小至预定水平。音量水平可由用户、用户偏好等预定义。
62.在框1225处，处理器114可监视波束成形的音频信号以确定是否仍然存在人类言语。如果在预定义时间量内不存在人类言语，则对话可能已经停止。在这种情况下，非言语声音可恢复以其正常音量水平进行播放。如果不再检测到言语，则过程1200前进至框1230。
63.在框1230处，处理器114可指示调整非言语音频的回放。这可包括指示非言语音频的回放以先前在闪避之前建立的音量水平恢复。与闪避期间的调整类似，逐渐减弱、静默等也可以是回放音量的调整形式。
64.然后过程1200可结束。
65.因此，公开一种用于检测人类产生的声音并且闪避从车辆扬声器发出的非人类声音的系统。因为使用了局部传声器和/或波束成形技术，所以高于阈值的任何声学声音都可被认为是人类产生的。因此，可避免用于确定声音是否是由人类产生的繁琐的信号处理。此外，定向传声器不是必需的。本文所描述的波束成形过程可与噪声抑制、回声消除和其他信号处理一起使用，以提高人类产生的声音的活力。
66.本文所描述的控制器或装置中的任一者或多者包括计算机可执行指令，所述计算机可执行指令可根据使用多种编程语言和/或技术创建的计算机程序编译或解释。通常，处理器(诸如微处理器)从例如存储器、计算机可读介质等接收指令，并执行指令。处理单元包括能够执行软件程序的指令的非暂时性计算机可读存储介质。计算机可读存储介质可以是但不限于电子存储装置、磁存储装置、光存储装置、电磁存储装置、半导体存储装置或它们的任何合适的组合。
67.虽然以上描述示例性实施方案，但这些实施方案并不意图描述本发明的所有可能形式。实际上，在说明书中使用的字词是描述性而非限制性字词，并且应理解，可在不脱离本发明的精神和范围的情况下做出各种改变。另外，各种实现实施方案的特征可加以组合以形成本发明的其他实施方案。

再多了解一些

1/3 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于U型网络和音频指纹的音乐与人声分离方法与流程

用于车辆音频系统的具有空间言语分离的语音闪避的制作方法

相关文章

最热文献