App客户端

一种残膜回收机防缠绕挑膜装置的制一种秧草收获机用电力驱动行走机构

首页 > 电子通信装置的制造及其应用技术 > 正文

声音处理系统和声音处理装置的制作方法

2022-04-27 03:59:04 来源：中国专利 TAG：

1.本公开涉及声音处理系统和声音处理装置。

背景技术：

2.关于车载用的声音识别装置、免提通话，已知有用于去除周边的声音而仅识别说话者的声音的、回波消除器。在专利文献1中，公开了根据声源数来切换进行动作的自适应滤波器的数量、抽头数的回波消除器。
3.现有技术文献
4.专利文献
5.专利文献1：日本专利第4889810号公报

技术实现要素：

6.在使用自适应滤波器来进行回波消除的情况下，周边的声音被作为参照信号输入到自适应滤波器。在周边的声音包含不相关噪声的情况下，去除周边的声音来获得目标声音是有益的。
7.本公开的一个方式提供一种即使在周边的声音包含不相关噪声的情况下也能够高精度地获得目标声音的声音处理系统。
8.本公开所涉及的声音处理系统具备第一麦克风、一个以上的麦克风、一个以上的自适应滤波器、判断部、控制部以及加法部。第一麦克风获取包含第一声音成分的第一声音信号，输出基于所述第一声音信号的第一信号。一个以上的麦克风分别获取包含与所述第一声音成分不同的声音成分的声音信号，输出该所述声音信号的麦克风信号。一个以上的自适应滤波器从所述一个以上的麦克风分别被输入所述麦克风信号，分别输出基于所述麦克风信号的通过信号。判断部判断所述麦克风信号是否包含不相关噪声，所述不相关噪声是与声音信号之间没有相关性的噪声。控制部对所述一个以上的自适应滤波器的滤波器系数进行控制。加法部从所述第一信号减去基于所述通过信号的减法信号。所述一个以上的麦克风包括第二麦克风，所述第二麦克风获取包含与所述第一声音成分不同的第二声音成分的第二声音信号，输出基于所述第二声音信号的第二信号。在所述判断部判断为所述第二信号包含所述不相关噪声的情况下，所述控制部将向所述自适应滤波器输入的所述第二信号的电平设为零。
9.此外，这些总括的或具体的方式可以由系统、方法、集成电路、计算机程序或者记录介质实现，也可以由系统、装置、方法、集成电路、计算机程序以及记录介质的任意组合实现。
10.根据本公开的一个方式，提供一种即使在周边的声音包含不相关噪声的情况下也能够高精度地获得目标声音的声音处理系统。
附图说明
11.图1是示出第一实施方式中的声音处理系统的概要结构的一例的图。
12.图2是示出第一实施方式中的声音处理装置的结构的框图。
13.图3是示出第一实施方式中的声音处理装置的动作过程的流程图。
14.图4是示出声音处理装置的输出结果的图。
15.图5是示出第二实施方式中的声音处理系统的概要结构的一例的图。
16.图6是示出第二实施方式中的声音处理装置的结构的框图。
17.图7是示出第二实施方式中的声音处理装置的动作过程的流程图。
具体实施方式
18.(成为本公开的基础的见解)
19.在周边的声音包含不相关噪声的情况下，即使使用周边的声音来进行回波消除，有时也难以去除周边的声音而获得目标声音。
20.以下，一边适当参照附图一边详细地说明本公开的实施方式。但是，有时省略超出必要的详细的说明。此外，提供附图和以下的说明以供本领域技术人员充分地理解本公开，并非意图通过它们来限定权利要求书所记载的主题。
21.(第一实施方式)
22.图1是示出第一实施方式中的声音处理系统5的概要结构的一例的图。声音处理系统5例如搭载于车辆10。以下，说明声音处理系统5搭载于车辆10的例子。在车辆10的车厢内设置有多个座位。多个座位例如是驾驶座、副驾驶座以及左右的后部座位这四个座位。座位的数量不限于此。声音处理系统5包括麦克风mc1、麦克风mc2、麦克风mc3、麦克风mc4以及声音处理装置20。在该例子中座位的数量与麦克风的数量一致，但是麦克风的数量与座位的数量也可以不一致。声音处理装置20的输出被输入到未图示的声音识别引擎。声音识别引擎的声音识别结果被输入到电子设备50。
23.麦克风mc1对驾驶员hm1说话的声音进行收集。换言之，麦克风mc1获取包含驾驶员hm1说话的声音成分的声音信号。麦克风mc1例如配置于驾驶座的右侧的扶手。麦克风mc2对乘员hm2说话的声音进行收集。换言之，麦克风mc2获取包含乘员hm2说话的声音成分的声音信号。麦克风mc2例如配置于副驾驶座的左侧的扶手。麦克风mc3对乘员hm3说话的声音进行收集。换言之，麦克风mc3获取包含乘员hm3说话的声音成分的声音信号。麦克风mc3例如配置于后部座位的左侧的扶手。麦克风mc4对乘员hm4说话的声音进行收集。换言之，麦克风mc4获取包含乘员hm4说话的声音成分的声音信号。麦克风mc4例如配置于后部座位的右侧的扶手。
24.麦克风mc1、麦克风mc2、麦克风mc3、麦克风mc4的配置位置不限于所说明的例子。例如，麦克风mc1也可以配置于仪表盘的右侧前表面。麦克风mc2也可以配置于仪表盘的左侧前表面。麦克风mc3也可以配置于副驾驶座的靠背部。麦克风mc4也可以配置于驾驶座的靠背部。
25.各麦克风可以是指向性麦克风，也可以是无指向性麦克风。各麦克风可以是小型的mems(micro electro mechanical systems：微机电系统)，也可以是ecm(electret condenser microphone：驻极体电容式麦克风)。各麦克风也可以是能够进行波束形成的麦
克风。例如，各麦克风也可以是沿各座位的方向具有指向性且能够对指向方法的声音进行收集的麦克风阵列。
26.在本实施方式中，声音处理系统5具备与各麦克风对应的多个声音处理装置20。具体地说，声音处理系统5具备声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24。声音处理装置21对应于麦克风mc1。声音处理装置22对应于麦克风mc2。声音处理装置23对应于麦克风mc3。声音处理装置24对应于麦克风mc4。以下，有时将声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24统称为声音处理装置20。
27.在图1所示的结构中，例示了声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24分别由不同的硬件构成，但是也可以由一个声音处理装置20实现声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24的功能。或者，也可以是，声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24中的一部分由共同的硬件构成，剩余部分分别由不同的硬件构成。
28.在本实施方式中，各声音处理装置20配置于对应的各麦克风附近的各座位内。各声音处理装置20也可以配置于仪表盘内。
29.图2是示出声音系统5的结构以及声音处理装置21的结构的框图。如图2所示，声音系统5除了具备声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24之外还具备声音识别引擎40以及电子设备50。声音处理装置20的输出被输入到声音识别引擎40。声音识别引擎40对来自至少一个声音处理装置20的输出信号中包含的声音进行识别，并输出声音识别结果。声音识别引擎40生成声音识别结果、基于声音识别结果的信号。基于声音识别结果的信号例如为电子设备50的操作信号。声音识别引擎40的声音识别结果被输入到电子设备50。声音识别引擎40也可以是与声音处理装置20分开的装置。声音识别引擎40例如配置于仪表盘的内部。声音识别引擎40也可以以被收容到座位的内部的方式进行配置。或者，声音识别引擎40也可以为被组装到声音处理装置20中的一体型的装置。
30.向电子设备50输入从声音识别引擎40输出的信号。电子设备50例如进行与操作信号对应的动作。电子设备50例如配置于车辆10的仪表盘。电子设备50例如为车辆导航装置。电子设备50也可以为面板仪表、电视机或者便携式终端。
31.在图1中示出了车辆中乘有四人的情况，但是乘车的人数不限于此。乘车人数只要是车辆的最大乘车定员以下即可。例如，在车辆的最大乘车定员为六人的情况下，乘车人数可以是六人，也可以是五人以下。
32.声音处理装置21、声音处理装置22、声音处理装置23以及声音处理装置24除了后述的滤波器部的一部分的结构之外均具有同样的结构和功能。在此，说明声音处理装置21。声音处理装置21将驾驶员hm1说话的声音设为目标成分。在此，设为目标成分与设为获取目标的声音信号同义。声音处理装置21将从由麦克风mc1收集的声音信号抑制串扰成分得到的声音信号作为输出信号输出。在此，串扰成分为包含除发出被设为目标成分的声音的乘员以外的乘员的声音的噪声成分。
33.如图2所示，声音处理装置21具备声音输入部29、噪声探测部30、包括多个自适应滤波器的滤波器部f1、对多个自适应滤波器的滤波器系数进行控制的控制部28以及加法部27。
34.向声音输入部29输入由麦克风mc1、麦克风mc2、麦克风mc3以及麦克风mc4收集到
的声音的声音信号。换言之，麦克风mc1、麦克风mc2、麦克风mc3以及麦克风mc4分别将基于所收集到的声音的声音信号的信号输出到声音输入部29。麦克风mc1将声音信号a输出到声音输入部29。声音信号a是包含驾驶员hm1的声音和噪声的信号，该噪声包含驾驶员hm1以外的乘员的声音。在此，在声音处理装置21中，驾驶员hm1的声音为目标成分，包含驾驶员hm1以外的乘员的声音的噪声为串扰成分。麦克风mc1相当于第一麦克风。由麦克风mc1收集到的声音相当于第一声音信号。驾驶员hm1的声音相当于第一声音成分。驾驶员hm1以外的乘员的声音相当于第二声音成分。声音信号a相当于第一信号。麦克风mc2将声音信号b输出到声音输入部29。声音信号b是包含乘员hm2的声音和噪声的信号，该噪声包含乘员hm2以外的乘员的声音。麦克风mc3将声音信号c输出到声音输入部29。声音信号c是包含乘员hm3的声音和噪声的信号，该噪声包含乘员hm3以外的乘员的声音。麦克风mc4将声音信号d输出到声音输入部29。声音信号d是包含乘员hm4的声音和噪声的信号，该噪声包含乘员hm4以外的乘员的声音。麦克风mc2、麦克风mc3及麦克风mc4相当于第二麦克风。由麦克风mc2、麦克风mc3及麦克风mc4收集到的声音相当于第二声音信号。声音信号b、声音信号c及声音信号d相当于第二信号。声音输入部29输出声音信号a、声音信号b、声音信号c以及声音信号d。声音输入部29相当于接收部。
35.在本实施方式中，声音处理装置21具备被输入来自所有麦克风的声音信号的一个声音输入部29，但是也可以按每个麦克风配置被输入对应的声音信号的声音输入部29。例如，也可以是如下的结构：由麦克风mc1收集到的声音的声音信号被输入到与麦克风mc1对应的声音输入部，由麦克风mc2收集到的声音的声音信号被输入到与麦克风mc2对应的另外的声音输入部，由麦克风mc3收集到的声音的声音信号被输入到与麦克风mc3对应的另外的声音输入部，由麦克风mc4收集到的声音的声音信号被输入到与麦克风mc4对应的另外的声音输入部。
36.向噪声探测部30输入从声音输入部29输出的声音信号a、声音信号b、声音信号c以及声音信号d。噪声探测部30判断各声音信号是否包含不相关噪声。不相关噪声是与声音信号之间没有相关性的噪声。不相关噪声例如是风引起的噪声、因电路引起的噪声、与麦克风接触引起的触摸噪声。不相关噪声也被称为非声学噪声。例如，在某个声音信号的强度为规定值以上的情况下，噪声探测部30判断为该声音信号包含不相关噪声。或者，也可以是，噪声探测部30将某个声音信号的强度与另外的声音信号的强度进行比较，在某个声音信号的强度比另外的声音信号的强度大规定值以上的情况下，判断为该声音信号包含不相关噪声。另外，噪声探测部30也可以基于车辆信息来判断某个声音信号是否包含不相关噪声。例如，噪声探测部30也可以接收与车速及窗的开闭状态有关的信息作为车辆信息，在车速为固定速度以上且后部座位的窗打开的情况下，判断为声音信号c以及声音信号d包含不相关噪声。噪声探测部30将各声音信号是否包含不相关噪声的判断结果输出到控制部28。噪声探测部30将各声音信号是否包含不相关噪声的判断结果例如设为标志输出到控制部28。对于各声音信号，标志示出“1”或者“0”的值。“1”意味着声音信号包含不相关噪声，“0”意味着声音信号不包含不相关噪声。例如，在判断为声音信号a以及声音信号b不包含不相关噪声、声音信号c以及声音信号d包含不相关噪声的情况下，噪声探测部30将标志“0、0、1、1”作为判断结果输出到控制部28。在判断是否包含不相关噪声之后，噪声探测部30将声音信号a输出到加法部27，将声音信号b、声音信号c以及声音信号d输出到滤波器部f1。在此，噪声探测
部30相当于判断部。
37.在本实施方式中，声音处理装置21具备被输入所有声音信号的一个噪声探测部30，但是也可以按每个声音信号配置被输入对应的声音信号的噪声探测部30。例如，也可以是如下的结构：声音信号a被输入到噪声探测部301，声音信号b被输入到噪声探测部302，声音信号c被输入到噪声探测部303，声音信号d被输入到噪声探测部304。
38.滤波器部f1包括自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c。自适应滤波器是具备在信号处理的过程中使特性发生变化的功能的滤波器。滤波器部f1用于对由麦克风mc1收集到的声音中包含的、驾驶员hm1的声音以外的串扰成分进行抑制的处理。在本实施方式中，滤波器部f1包括三个自适应滤波器，但是自适应滤波器的数量是基于被输入的声音信号的数量及串扰抑制处理的处理量来适当设定的。关于抑制串扰的处理，在后文描述详情。在此，滤波器部f1相当于第一滤波器部。
39.向自适应滤波器f1a输入声音信号b来作为参照信号。自适应滤波器f1a输出基于滤波器系数cb及声音信号b的通过信号pb。向自适应滤波器f1b输入声音信号c来作为参照信号。自适应滤波器f1b输出基于滤波器系数cc及声音信号c的通过信号pc。向自适应滤波器f1c输入声音信号d来作为参照信号。自适应滤波器f1c输出基于滤波器系数cd及声音信号d的通过信号pd。滤波器部f1将通过信号pb、通过信号pc以及通过信号pd相加并输出。在本实施方式中，自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c通过处理器执行存储器中保存的程序来实现。自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c也可以是物理上分离的、单独的硬件结构。
40.在此，说明自适应滤波器的动作的概要。自适应滤波器是用于抑制串扰成分的滤波器。例如，在作为滤波器系数的更新算法而使用lms(least mean square：最小均方)的情况下，自适应滤波器为使由误差信号的均方定义的代价函数为最小的滤波器。在此所说的误差信号为输出信号与目标成分之差。
41.在此，作为自适应滤波器而例示fir(finite impulse response：有限冲激响应)滤波器。也可以使用其它种类的自适应滤波器。例如，也可以使用iir(infinite impulse response：无限冲激响应)滤波器。
42.在声音处理装置21使用一个fir滤波器作为自适应滤波器的情况下，作为声音处理装置21的输出信号与目标成分之差的误差信号由以下的式(1)表示。
43.[数1]
[0044][0045]
在此，n为时刻，e(n)为误差信号，d(n)为目标成分，wi为滤波器系数，x(n)为参照信号，l为抽头长度。抽头长度l越大，则自适应滤波器越能够忠实地再现声音信号的声学特性。在不存在混响的情况下，抽头长度l也可以设为1。例如，抽头长度l被设定为固定值。例如，在目标成分为驾驶员hm1的声音的情况下，参照信号x(n)为声音信号b、声音信号c以及声音信号d。
[0046]
加法部27通过从自声音输入部29输出的目标声音信号减去减法信号，来生成输出信号。在本实施方式中，减法信号是将从滤波器部f1输出的通过信号pb、通过信号pc以及通过信号pd相加得到的信号。加法部27将输出信号输出到控制部28。
[0047]
控制部28输出从加法部27输出的输出信号。控制部28的输出信号被输入到声音识别引擎40。或者，也可以从控制部28直接向电子设备50输入输出信号。在从控制部28直接向电子设备50输入输出信号的情况下，控制部28与电子设备50可以通过有线连接，也可以通过无线连接。例如，电子设备50是便携式终端，也可以从控制部28经由无线通信网直接向便携式终端输入输出信号。向便携式终端输入的输出信号也可以作为声音被从便携式终端所具有的扬声器输出。
[0048]
另外，控制部28参照从加法部27输出的输出信号以及从噪声探测部30输出的作为判断结果的标志，来更新各自适应滤波器的滤波器系数。
[0049]
首先，控制部28基于判断结果来决定作为滤波器系数的更新对象的自适应滤波器。具体地说，控制部28将被输入在噪声探测部30中判断为不包含不相关噪声的声音信号的自适应滤波器作为滤波器系数的更新对象。另外，控制部28不将被输入在噪声探测部30中判断为包含不相关噪声的声音信号的自适应滤波器作为滤波器系数的更新对象。例如，在从噪声探测部30接收到标志“0、0、1、1”的情况下，控制部28判断为声音信号a及声音信号b不包含不相关噪声，声音信号c及声音信号d包含不相关噪声。然后，控制部28将自适应滤波器f1a作为滤波器系数的更新对象，不将自适应滤波器f1b及自适应滤波器f1c作为滤波器系数的更新对象。在该情况下，自适应滤波器f1a相当于第二自适应滤波器，自适应滤波器f1b及自适应滤波器f1c相当于第一自适应滤波器。
[0050]
然后，控制部28对作为滤波器系数的更新对象的自适应滤波器更新滤波器系数，以使式(1)中的误差信号的值接近0。
[0051]
说明将lms用作更新算法的情况下的、滤波器系数的更新。在将时刻n处的滤波器系数w(n)进行更新来作为时刻n 1处的滤波器系数w(n 1)的情况下，w(n 1)与w(n)之间的关系由以下的式(2)表示。
[0052]
[数2]
[0053]
w(n 1)＝w(n)-αx(n)e(n)
…
(2)
[0054]
在此，α为滤波器系数的校正系数。项αx(n)e(n)相当于更新量。
[0055]
此外，更新滤波器系数时的算法不限于lms，也可以使用其它算法。例如，也可以使用ica(independent component analysis：独立成分分析)、nlms(normalized least mean square：归一化最小均方)等算法。
[0056]
在更新滤波器系数时，对于未作为滤波器系数的更新对象的自适应滤波器，控制部28将输入的参照信号的强度设定为零。例如，控制部28在从噪声探测部30接收到标志“0、0、1、1”的情况下，设定为作为参照信号向自适应滤波器f1a输入的声音信号b以保持从噪声探测部30输出的强度的状态被输入，并将作为参照信号向自适应滤波器f1b输入的声音信号c以及作为参照信号向自适应滤波器f1c输入的声音信号d的强度设定为零。在此，“将向自适应滤波器输入的参照信号的强度设定为零”包括将向自适应滤波器输入的参照信号的强度抑制到零附近。另外，“将向自适应滤波器输入的参照信号的强度设定为零”还包括设定为不向自适应滤波器输入参照信号。在不将被作为参照信号输入的声音信号的强度设定为零的情况下，向未作为滤波器系数的更新对象的自适应滤波器输入包含不相关噪声的声音信号。例如，若将包含大音量的风噪声作为不相关噪声的声音信号用作参照信号，有时难以高精度地求出目标成分。关于包含不相关噪声的声音信号，将向自适应滤波器输入的强
度设定为零等效于不将该信号用作参照信号。其结果，即使在串扰成分包含不相关噪声的情况下，也能够高精度地求出目标成分。在输入的参照信号的强度被设定为零的自适应滤波器中，也可以不进行自适应滤波。由此，能够减少使用自适应滤波器进行的串扰抑制处理的处理量。
[0057]
然后，控制部28仅对作为滤波器系数的更新对象的自适应滤波器更新滤波器系数，不对未作为滤波器系数的更新对象的自适应滤波器更新滤波器系数。由此，能够减少使用自适应滤波器进行的串扰抑制处理的处理量。
[0058]
例如，考虑将目标座位设为驾驶座的情况且驾驶员hm1没有说话、且乘员hm2、乘员hm3以及乘员hm4说话的情况。此时，驾驶员hm1以外的乘员的说话声音泄漏到由麦克风mc1收集的声音的声音信号中。换言之，在声音信号a中包含串扰成分。声音处理装置21也可以消除串扰成分，更新自适应滤波器以使误差信号最小化。在该情况下，由于在驾驶座没有说话，因此误差信号理想上为无声信号。另外，在上述的情况下驾驶员hm1说话的情况下，驾驶员hm1的说话声音泄漏到麦克风mc1以外的麦克风中。在该情况下，通过声音处理装置21的处理也不会消除驾驶员hm1的说话声音。这是因为，声音信号a中包含的驾驶员hm1的说话声音在时间上比其它声音信号中包含的、驾驶员hm1的说话声音更早。这是因果定律引起的。因而，声音处理装置21不管包含或不包含目标成分的声音信号，都更新自适应滤波器以使误差信号最小化，由此能够减少声音信号a中包含的串扰成分。
[0059]
在本实施方式中，声音输入部29、噪声探测部30、滤波器部f1、控制部28以及加法部27通过处理器执行存储器中保持的程序来实现它们的功能。或者，声音输入部29、噪声探测部30、滤波器部f1、控制部28以及加法部27也可以由单独的硬件构成。
[0060]
说明了声音处理装置21，关于声音处理装置22、声音处理装置23以及声音处理装置24，除了滤波器部以外也具有大致同样的结构。声音处理装置22将乘员hm2说话的声音作为目标成分。声音处理装置22将从由麦克风mc2收集的声音信号抑制串扰成分得到的声音信号作为输出信号输出。因而，声音处理装置22在如下方面与声音处理装置21不同：具有被输入声音信号a、声音信号c以及声音信号d的滤波器部。同样地，声音处理装置23将乘员hm3说话的声音作为目标成分。声音处理装置23将从由麦克风mc3收集的声音信号抑制串扰成分得到的声音信号作为输出信号输出。因而，声音处理装置23在如下方面与声音处理装置21不同：具有被输入声音信号a、声音信号b以及声音信号d的滤波器部。声音处理装置24将乘员hm4说话的声音作为目标成分。声音处理装置24将从由麦克风mc4收集的声音信号抑制串扰成分得到的声音信号作为输出信号输出。因而，声音处理装置24在如下方面与声音处理装置21不同：具有被输入声音信号a、声音信号b以及声音信号c的滤波器部。
[0061]
图3是示出声音处理装置21的动作过程的流程图。首先，向声音输入部29输入声音信号a、声音信号b、声音信号c以及声音信号d(s1)。接着，噪声探测部30判断各声音信号是否包含不相关噪声(s2)。噪声探测部30将其判断结果设为标志输出到控制部28。在各声音信号均不包含不相关噪声的情况下，滤波器部f1如以下那样生成减法信号(s3)。自适应滤波器f1a使声音信号b通过并输出通过信号pb。自适应滤波器f1b使声音信号c通过并输出通过信号pc。自适应滤波器f1c使声音信号d通过并输出通过信号pd。滤波器部f1将通过信号pb、通过信号pc以及通过信号pd相加后作为减法信号输出。加法部27从声音信号a减去减法信号来生成输出信号并输出(s4)。输出信号被输入到控制部28后被从控制部28输出。接着，
控制部28参照从噪声探测部30输出的作为判断结果的标志，基于输出信号来更新自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c的滤波器系数，以使输出信号中包含的目标成分最大(s5)。然后，声音处理装置21再次进行工序s1。
[0062]
在工序s2中，在判断为各声音信号中的某一者包含不相关噪声的情况下，噪声探测部30判断包含不相关噪声的声音信号是否为目标成分(s6)。具体地说，判断包含不相关噪声的声音信号是否为声音信号a。在包含不相关噪声的声音信号为目标成分的情况下，控制部28将声音信号a的强度设为零，并将声音信号a作为输出信号输出(s7)。此时，控制部28不更新自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c的滤波器系数。然后，声音处理装置21再次进行工序s1。
[0063]
在工序s6中，在包含不相关噪声的声音信号不为目标成分的情况下，控制部28将向滤波器部f1输入的、包含不相关噪声的声音信号的强度设为零。例如，考虑声音信号c以及声音信号d包含不相关噪声、且声音信号b不包含不相关噪声的情况。在该情况下，控制部28将向滤波器部f1输入的、声音信号c以及声音信号d的强度设为零，不变更声音信号b的强度。然后，滤波器部f1通过与工序s3同样的动作来生成减法信号(s8)。加法部27与工序s4同样地从声音信号a减去减法信号来生成输出信号并输出(s9)。接着，控制部28基于输出信号来更新被输入不包含不相关噪声的信号的自适应滤波器的滤波器系数，以使输出信号中包含的目标成分最大(s10)。例如，考虑声音信号c以及声音信号d包含不相关噪声、且声音信号b不包含不相关噪声的情况。在该情况下，控制部28更新自适应滤波器f1a的滤波器系数，不更新自适应滤波器f1b以及自适应滤波器f1c的滤波器系数。然后，声音处理装置21再次进行工序s1。
[0064]
这样，在第一实施方式中的声音处理系统5中，利用多个麦克风获取多个声音信号，从某个声音信号减去以其它声音信号为参照信号使用自适应滤波器生成的减法信号，由此高精度地求出特定的说话者的声音。在第一实施方式中，在使用自适应滤波器生成减法信号时，将向自适应滤波器输入的、包含不相关噪声的声音信号的强度设为零。例如，有时风吹入到后部座位而后部座位附近的麦克风收集到大音量的风噪声。此时，若将在后部座位获得的声音信号用作参照信号，则有可能难以求出特定的说话者的声音。另一方面，在本实施方式中，由于将向自适应滤波器输入的、包含不相关噪声的声音信号的强度设为零，因此，即使在目标座位以外产生了不相关噪声的情况下，也能够高精度地求出目标成分的声音信号。另外，在第一实施方式中，不对被输入包含不相关噪声的声音信号的自适应滤波器更新滤波器系数。由此，能够减少用于将串扰成分消除的处理的量。
[0065]
此外，也可以是，在各麦克风为麦克风阵列的情况下，在收集时麦克风阵列朝向对应的乘员具有指向性，获取该声音也就是进行波束形成。由此，被输入到各麦克风的声音信号的s/n比提高。由此，能够提高由声音处理系统5进行的串扰成分的抑制处理的精度。
[0066]
在图4中示出声音处理装置20的输出结果。图4所示的是在驾驶员hm1、乘员hm2、乘员hm3及乘员hm4说话的状态下由麦克风mc3和麦克风mc4收集了大音量的风噪声的情况下的、各声音处理装置20的输出结果。图4的(a)、图4的(b)、图4的(c)以及图4的(d)是没有将声音信号c及声音信号d的输入强度设为零且没有停止自适应滤波器f1b及自适应滤波器f1c的更新的情况下的各声音处理装置20的输出结果。图4的(a)对应于声音处理装置21的输出结果，图4的(b)对应于声音处理装置22的输出结果，图4的(c)对应于声音处理装置23
的输出结果，图4的(d)对应于声音处理装置24的输出结果。图4的(e)、图4的(f)、图4的(g)以及图4的(h)是将声音信号c及声音信号d的输入强度设为零且停止了自适应滤波器f1b及自适应滤波器f1c的更新的情况下的各声音处理装置20的输出结果。图4的(e)对应于声音处理装置21的输出结果，图4的(f)对应于声音处理装置22的输出结果，图4的(g)对应于声音处理装置23的输出结果，图4的(h)对应于声音处理装置24的输出结果。
[0067]
根据图4的(a)、图4的(b)、图4的(c)以及图4的(d)，将包含不相关噪声的声音信号设为参照信号，由此声音处理装置21以及声音处理装置22的输出信号为包含非常多噪声的信号。在该情况下，认为即使将声音处理装置21以及声音处理装置22的输出信号用于声音识别，识别精度也变低。另一方面，可知在图4的(e)以及图4的(f)所示的声音处理装置21以及声音处理装置22的输出信号中，与图4的(a)以及图4的(b)所示的该输出信号相比包含的噪声少。因而，在该情况下，能够高精度地对声音处理装置21以及声音处理装置22的输出信号进行声音识别。另外，如图4的(g)以及图4的(h)所示，声音处理装置23以及声音处理装置24的输出信号的强度为零。
[0068]
(第二实施方式)
[0069]
图5是示出第二实施方式中的声音处理系统5a的概要结构的一例的图。第二实施方式所涉及的声音处理系统5a在如下方面与第一实施方式所涉及的声音处理系统5不同：具备声音处理装置20a来代替声音处理装置20。第二实施方式所涉及的声音处理装置20a在如下方面与第一实施方式所涉及的声音处理装置20不同：具有追加的滤波器部。在本实施方式中，声音处理系统5a具有与各麦克风对应的多个声音处理装置20a。具体地说，声音处理系统5a具有声音处理装置21a、声音处理装置22a、声音处理装置23a以及声音处理装置24a。以下，使用图6以及图7来说明声音处理装置20a。对与在第一实施方式中说明的结构、动作相同的结构、动作，使用相同的附图标记，由此省略或简化其说明。
[0070]
图6是示出声音处理装置21a的结构的框图。声音处理装置21a、声音处理装置22a、声音处理装置23a以及声音处理装置24a除了后述的滤波器部的一部分的结构之外均具有同样的结构和功能。在此，说明声音处理装置21a。声音处理装置21a将驾驶员hm1说话的声音作为目标。声音处理装置21a将从由麦克风mc1收集的声音信号抑制串扰成分得到的声音信号作为输出信号输出。
[0071]
声音处理装置21a具备声音输入部29、噪声探测部30a、包括多个自适应滤波器的滤波器部f1、包括一个以上的自适应滤波器的滤波器部f2、对滤波器部f1的自适应滤波器的滤波器系数进行控制的控制部28a以及加法部27a。
[0072]
滤波器部f2包含一个以上的自适应滤波器。在本实施方式中，滤波器部f2包括自适应滤波器f2a。滤波器部f2用于对由麦克风mc1收集到的声音中包含的、驾驶员hm1的声音以外的串扰成分进行抑制的处理。滤波器部f2所包括的自适应滤波器的数量小于滤波器部f1所包括的自适应滤波器的数量。在本实施方式中，滤波器部f2包括一个自适应滤波器，但是滤波器部f2的自适应滤波器的数量是基于被输入的声音信号的数量及串扰抑制处理的处理量来适当设定的。关于抑制串扰的处理，在后文描述详情。在此，滤波器部f2相当于第二滤波器部。
[0073]
向自适应滤波器f2a输入声音信号b来作为参照信号。自适应滤波器f2a输出基于特有的滤波器系数cb2以及声音信号b的通过信号pb2。在本实施方式中，自适应滤波器f2a
通过软件处理来实现其功能。自适应滤波器f2a也可以是与滤波器部f1中的各自适应滤波器物理上分离的、单独的硬件结构。在此，自适应滤波器f1a相当于第二自适应滤波器，自适应滤波器f1b及自适应滤波器f1c相当于第一自适应滤波器，自适应滤波器f2a相当于第三自适应滤波器。另外，声音信号b相当于第三信号。
[0074]
自适应滤波器f2a可以是fir滤波器，也可以是iir滤波器，也可以是其它种类的自适应滤波器。自适应滤波器f2a若为与自适应滤波器f1a、自适应滤波器f1b及自适应滤波器f1c相同种类的自适应滤波器，则与使用不同种类的自适应滤波器的情况相比能够减少处理量，因此是优选的。在此，说明将fir滤波器用作自适应滤波器f2a的情况。
[0075]
加法部27a通过从自声音输入部29输出的目标声音信号减去减法信号，来生成输出信号。在本实施方式中，减法信号是将从滤波器部f1输出的通过信号pb、通过信号pc以及通过信号pd相加得到的信号、或者是从滤波器部f2输出的通过信号pb2。加法部27a将输出信号输出到控制部28a。
[0076]
控制部28a输出从加法部27a输出的输出信号。控制部28a的输出信号被输入到声音识别引擎40。或者，也可以从控制部28a直接向电子设备50输入输出信号。在从控制部28a直接向电子设备50输入输出信号的情况下，控制部28a与电子设备50可以通过有线连接，也可以通过无线连接。例如，电子设备50是便携式终端，也可以从控制部28a经由无线通信网直接向便携式终端输入输出信号。向便携式终端输入的输出信号也可以作为声音被从便携式终端所具有的扬声器输出。
[0077]
噪声探测部30a控制部除了噪声探测部30的功能之外还进行各声音信号是否包含基于说话的声音成分的判断。噪声探测部30a将各声音信号是否包含基于说话的声音成分的判断结果输出到控制部28。噪声探测部30a将各声音信号是否包含基于说话的声音成分的判断结果例如设为标志输出到控制部28。对于各声音信号，标志示出“1”或者“0”的值。“1”意味着声音信号包含基于说话的声音成分，“0”意味着声音信号不包含基于说话的声音成分。例如，在判断为声音信号a以及声音信号b包含基于说话的声音成分、声音信号c以及声音信号d不包含基于说话的声音成分的情况下，噪声探测部30将标志“1、1、0、0”作为判断结果输出到控制部28a。在此，基于说话的声音成分相当于源自说话的第一成分。然后，控制部28a基于各声音信号是否包含基于说话的声音成分的判断结果探测部，来决定使用滤波器部f1和滤波器部f2中的哪个来生成减法信号。例如，存在滤波器部f1具有被输入判断为不包含基于控制部说话的声音成分的声音信号的自适应滤波器，而滤波器部f2不具有该自适应滤波器的情况。在该情况下，控制部28a决定使用滤波器部f2来生成减法信号。在声音处理装置21a中，也可以与噪声探测部30a分开地具备进行各声音信号是否包含基于说话的声音成分的判断的说话判断部。在该情况下，说话判断部被连接在声音输入部29与噪声探测部30a之间、或者被连接在噪声探测部30a与滤波器部f1及滤波器部f2之间。说话判断部例如通过处理器执行存储器中保持的程序来实现其功能。说话判断部也可以通过硬件来实现其功能。
[0078]
例如，考虑声音信号b包含基于乘员hm2的说话的声音成分、声音信号c不包含基于乘员hm3的说话的声音成分、且声音信号d不包含基于乘员hm4的说话的声音成分的情况。此时，滤波器部f1具有被输入声音信号c及声音信号d的自适应滤波器，而滤波器部f2不具有该自适应滤波器。例如在向所有自适应滤波器分别输入参照信号的情况下，更新滤波器部
f1中包含的各自适应滤波器的滤波器系数，以使误差信号最小。另一方面，滤波器部f2中包含的自适应滤波器f2a的滤波器系数是以仅将声音信号b用作参照信号的情况为前提的特有的值。因而，当将作为参照信号仅将声音信号b输入到各滤波器部的情况进行比较时，使用滤波器部f2更有可能能够使误差信号小于使用滤波器部f1的情况下的该误差信号。
[0079]
在滤波器部f2中包括的自适应滤波器的数量小于滤波器部f1中包括的自适应滤波器的数量的情况下，与使用滤波器部f1来生成减法信号相比，通过使用滤波器部f2来生成减法信号，能够减少处理量。
[0080]
或者，存在滤波器部f1具有被输入在噪声探测部30中判断为包含不相关噪声的声音信号的自适应滤波器、而滤波器部f2不具有该自适应滤波器的情况。在该情况下，控制部28a也决定使用滤波器部f2来生成减法信号。
[0081]
例如在向所有自适应滤波器分别输入参照信号的情况下，更新滤波器部f1中包括的各自适应滤波器的滤波器系数，以使误差信号最小。另一方面，滤波器部f2中包含的自适应滤波器f2a的滤波器系数是以仅将声音信号b用作参照信号的情况为前提的特有的值。在声音信号c以及声音信号d包含不相关噪声的情况下，向滤波器部f1输入的声音信号c以及声音信号d的强度被设定为零。在该情况下，与以将声音信号b、声音信号c及声音信号d全部用作参照信号为前提的滤波器部f1相比，使用仅将声音信号b用作参照信号的滤波器部f2有时更能够减小误差信号。
[0082]
另外，控制部28a基于从加法部27a输出的输出信号以及从噪声探测部30输出的判断结果来使用滤波器部f1生成减法信号的情况下，更新滤波器部f1的各自适应滤波器的滤波器系数。关于滤波器系数的更新方法，与第一实施方式相同。
[0083]
在本实施方式中，声音输入部29、噪声探测部30、滤波器部f1、滤波器部f2、控制部28a以及加法部27a通过处理器执行存储器中保持的程序来实现它们的功能。声音输入部29、噪声探测部30、滤波器部f1、滤波器部f2、控制部28a以及加法部27a也可以由单独的硬件构成。
[0084]
图7是示出声音处理装置21a的动作过程的流程图。首先，向声音输入部29输入声音信号a、声音信号b、声音信号c以及声音信号d(s11)。接着，噪声探测部30判断各声音信号是否包含不相关噪声(s12)。在各声音信号均不包含不相关噪声的情况下，控制部28a判断使用哪个滤波器部来生成减法信号(s13)。在控制部28a判断为使用滤波器部f1的情况下，滤波器部f1与实施方式1的工序s3同样地生成减法信号并输出(s14)。加法部27a从声音信号a减去减法信号来生成输出信号并输出(s15)。输出信号被输入到控制部28后被从控制部28输出。接着，控制部28基于输出信号来更新自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c的滤波器系数，以使输出信号中包含的目标成分最大(s16)。然后，声音处理装置21a再次进行工序s11。
[0085]
在工序s13中，在控制部28a判断为使用滤波器部f2的情况下，滤波器部f2如以下那样生成减法信号(s17)。自适应滤波器f2a使声音信号b通过来输出通过信号pb2。滤波器部f2将通过信号pb2作为减法信号输出。加法部27a从声音信号a减去减法信号来生成输出信号并输出(s18)。输出信号被输入到控制部28后被从控制部28输出。然后，声音处理装置21再次进行工序s11。
[0086]
在工序s2中，在判断为各声音信号中的某一者包含不相关噪声的情况下，噪声探
测部30判断包含不相关噪声的声音信号是否为目标成分(s19)。具体地说，判断包含不相关噪声的声音信号是否为声音信号a。在包含不相关噪声的声音信号为目标成分的情况下，控制部28将声音信号a的强度设为零，并将声音信号a作为输出信号输出(s20)。此时，控制部28不更新自适应滤波器f1a、自适应滤波器f1b以及自适应滤波器f1c的滤波器系数。然后，声音处理装置21a再次进行工序s11。
[0087]
在工序s19中，在包含不相关噪声的声音信号不为目标成分的情况下，控制部28a判断使用哪个滤波器部生成减法信号(s21)。在控制部28a判断为使用滤波器部f1的情况下，控制部28将向滤波器部f1输入的、包含不相关噪声的声音信号的强度设为零。例如，考虑声音信号b包含不相关噪声、且声音信号c以及声音信号d不包含不相关噪声的情况。在该情况下，控制部28使向滤波器部f1输入的声音信号b的强度为零，不变更声音信号c以及声音信号d的强度。然后，滤波器部f1通过与实施方式1的工序s3同样的动作来生成减法信号(s22)。加法部27a与实施方式1的工序s4同样地从声音信号a减去减法信号来生成输出信号并输出(s23)。接着，控制部28a基于输出信号来更新被输入不包含不相关噪声的信号的自适应滤波器的滤波器系数，以使输出信号中包含的目标成分最大(s24)。例如，考虑声音信号b包含不相关噪声、且声音信号c以及声音信号d不包含不相关噪声的情况。在该情况下，控制部28更新自适应滤波器f1b以及自适应滤波器f1c的滤波器系数，不更新自适应滤波器f1a的滤波器系数。然后，声音处理装置21a再次进行工序s11。
[0088]
在工序s21中，在控制部28a判断为使用滤波器部f2的情况下，滤波器部f2与工序s17同样地生成减法信号(s25)。加法部27a从声音信号a减去减法信号来生成输出信号并输出(s26)。输出信号被输入到控制部28后被从控制部28输出。然后，声音处理装置21a再次进行工序s11。
[0089]
这样，在第二实施方式中的声音处理系统5a中，也与声音处理系统5同样地，即使在目标座位以外发生了不相关噪声的情况下，也能够高精度地求出目标成分的声音信号。另外，在第一实施方式中，不对被输入包含不相关噪声的声音信号的自适应滤波器更新滤波器系数。由此，能够减少用于消除串扰成分的处理的量。
[0090]
另外，在声音处理系统5a中，具备追加的与滤波器部f1相比所包括的自适应滤波器的数量小的滤波器部f2，控制部28a判断使用滤波器部f1以及滤波器部f2中的哪个。由此，与总是使用滤波器部f1来生成减法信号的情况相比，能够减小处理量。
[0091]
此外，在本实施方式中，说明了滤波器部f2包括具有特有的滤波器系数的一个自适应滤波器的情况，但是滤波器部f2也可以具备两个以上的自适应滤波器。另外，滤波器部f2所包括的自适应滤波器的系数可以能够由控制部28a进行控制，而不是特有的。在滤波器部f2包括可控制滤波器系数的自适应滤波器的情况下，控制部28a也可以在工序s18之后或者工序s26之后更新被输入不包含不相关噪声的声音信号的自适应滤波器的滤波器系数。
[0092]
附图标记说明
[0093]
5：声音处理系统；10：车辆；20、21、22、23、24：声音处理装置；27：加法部；28：控制部；29：声音输入部；30：噪声探测部；f1：滤波器部；f1a、f1b、f1c：自适应滤波器；40：声音识别引擎；50：电子设备。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：人体姿态迁移方法、装置、系统、电子设备以及存储介质与流程

相关文献