通话回声处理方法、系统、存储介质及电子设备与流程

2022-06-11 22:01:19 来源：中国专利 TAG：

1.本发明属于语音通讯技术领域，涉及一种通话回声处理方法，特别是涉及一种通话回声处理方法、系统、存储介质及电子设备。

背景技术：

2.目前的双工通信系统中，由于麦克风与扬声器的相互作用，远端用户的声音传输至近端扬声器播放时，又被近端麦克风采集并传入至通信设备，经过无线或有线传输之后又返回至远端用户的通信设备，从而远端用户听到了自己的回声。在现有的通话处理技术中，可以通过回声消除对声音信号进行处理，从而使得远端用户基本听不到自己讲话的回声。
3.然而，在通话的过程中，音量改变或通话环境发生变化时破坏了通话开始建立起来的回声路径或使得回声大小发生变化，导致通话质量明显下降，且在短时间内无法快速恢复，因而影响了双方用户的通话体验。
4.因此，如何提供一种通话回声处理方法、系统、存储介质及电子设备，以解决现有技术无法在回声发生变化的情况下快速维持通话质量的稳定等缺陷，成为本领域技术人员亟待解决的技术问题。

技术实现要素：

5.鉴于以上所述现有技术的缺点，本发明的目的在于提供一种通话回声处理方法、系统、存储介质及电子设备，其优势在于，可以在回声发生变化的情况下快速维持通话质量的稳定。
6.本发明的另一目的在于提供一种通话回声处理方法、系统、存储介质及电子设备，其优势在于，通过设定的触发条件调整回声信号的预估过程，以加快回声处理的滤波器的收敛速度，进而在较短时间内提高通话质量。
7.本发明的另一目的在于提供一种通话回声处理方法、系统、存储介质及电子设备，其优势在于，通过给滤波器增加一个针对异常情况的触发条件，使得回声消除算法重新学习收敛，从而减小自学习收敛的时间。
8.本发明的另一目的在于提供一种通话回声处理方法、系统、存储介质及电子设备，其优势在于，根据车机音量变化和车内通话环境的变化触发回声消除的滤波器进行重新学习收敛，进而快速地提高用户于车内的通话质量。
9.为实现上述目的及其他相关目的，本发明一方面提供一种通话回声处理方法，所述通话回声处理方法包括以下步骤：设定触发条件；若满足所述触发条件，利用第一通话端的声音输入信号获得预估回声信号；根据所述预估回声信号获得目标语音信号，将所述目标语音信号返回至第一通话端。
10.为实现上述目的及其他相关目的，本发明另一方面提供一种通话回声处理系统，所述通话回声处理系统包括：监控模块、回声预估模块和回声处理模块，所述监控模块与回
声预估模块通信连接，所述回声预估模块与回声处理模块通信连接；所述监控模块用于监听是否满足触发条件，若满足所述触发条件，则对所述回声预估模块发送回声预估指令；所述回声预估模块用于在接收到所述回声预估指令后，根据第一通话端的声音输入信号获得预估回声信号，并将所述预估回声信号发送至所述回声处理模块；所述回声处理模块用于在接收到所述预估回声信号后，根据所述预估回声信号获得目标语音信号，并将所述目标语音信号返回至第一通话端。
11.为实现上述目的及其他相关目的，本发明另一方面提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的通话回声处理方法。
12.为实现上述目的及其他相关目的，本发明另一方面提供一种电子设备，包括：处理器及存储器；所述存储器用于存储计算机程序，所述处理器用于执行所述存储器存储的计算机程序，以使所述电子设备执行所述的通话回声处理方法。
附图说明
13.图1显示为本发明的通话回声处理方法于一实施例中的应用场景示意图。
14.图2显示为本发明的通话回声处理方法于一实施例中的声音信号混合示意图。
15.图3显示为本发明的通话回声处理方法于一实施例中的声音信号处理示意图。
16.图4显示为本发明的通话回声处理方法于一实施例中的原理流程图。
17.图5显示为本发明的通话回声处理方法于一实施例中的回声消除原理图。
18.图6显示为本发明的通话回声处理系统于一实施例中的结构原理图。
19.图7显示为本发明的电子设备于一实施例中的结构连接示意图。
20.元件标号说明
[0021]6ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
通话回声处理系统
[0022]
61
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
监控模块
[0023]
62
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
回声预估模块
[0024]
63
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
回声处理模块
[0025]7ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
电子设备
[0026]
71
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理器
[0027]
72
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储器
[0028]
s41～s43
ꢀꢀꢀꢀꢀꢀꢀꢀ
步骤
具体实施方式
[0029]
以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。
[0030]
需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也
mean square，最小二乘)准则、最大信噪比准则和统计检测准则等。
[0043]
请参阅图5，显示为本发明的通话回声处理方法于一实施例中的回声消除原理图。如图5所示，x(n)为第一通话端的声音输入信号，经过未知的回声路径w(n)得到y(n)＝x(n)*w(n)，再加上观测噪声v(n)，即为期望信号d(n)＝y(n) v(n)。其中，观测噪声v(n)可以是环境中掺杂的噪声等与被测量x(n)无关的杂乱干扰信号。x(n)通过自适应滤波器得到估计的回声信号，并与期望信号d(n)相减得到误差信号e(n)，即误差信号的值越小说明自适应滤波算法所估计的回声路径就越接近实际的回声路径。由此，滤波器采用特定的自适应算法不停地调整权值向量，使估计的回声路径逐渐趋近于真实回声路径w(n)。
[0044]
具体地，自适应滤波器包括训练和工作两个过程。
[0045]
(1)自适应滤波器的训练过程：如图5所示，进行不断的收敛学习过程，目的是使得误差信号e(n)越来越小，并在误差信号小到可以满足预设的误差需求时，确定自适应滤波器的权值向量，即滤波系数。
[0046]
(2)自适应滤波器的工作过程：在权值向量确定后，自适应滤波器开始工作，对后续第一通话端传输过来的声音输入信号进行滤波，以通过回声消除使得第二通话端反馈至第一通话端的声音信号中几乎不存在第一通话端用户自己声音的回声。
[0047]
(3)自适应滤波器的重新收敛学习过程：在自适应滤波器工作过程中，若回声路径或回声大小发生变化，则w(n)发生变化，自适应滤波器在原本的权重向量基础上估计出来的预估回声信号与期望信号相减后所得误差e(n)已经不能满足预设的误差需求，由此，自适应滤波器开启重新收敛自学习的过程，以通过调整权值向量，使得误差e(n)再次满足预设的误差需求。
[0048]
s43，根据所述预估回声信号获得目标语音信号，将所述目标语音信号返回至第一通话端。
[0049]
于一实施例中，获取第二通话端的声音输入信号，将所述第二通话端的声音输入信号减去所述预估回声信号，获得目标语音信号。
[0050]
根据上述过程(1)至过程(3)，将过程(1)自适应滤波器训练开始时的权重向量进行初始化，并定义为权重向量a，将训练结束后确定的权值向量定义为权值向量b，若过程(2)未发生变化，则始终利用权值向量b进行回声消除，当回声发生变化时，则需要重新收敛学习，确定出再次满足预设的误差需求的权值向量c。因收敛学习是基于上一次误差信号结果进行逐轮迭代的过程，现有技术中是基于当前的或上一轮迭代后的权值向量b进行收敛，逐轮迭代后确定权值向量c，本发明基于自适应滤波器训练之前初始化的权值向量a进行收敛，由此，最大程度地降低了自适应滤波器收敛学习的时间，与之相关的，最大程度地缩短了自适应滤波器再次训练完成的时间，从而可以尽快将训练完成、稳定后的自适应滤波器应用于第二通话端声音输入信号的滤波处理中。
[0051]
本发明所述的通话回声处理方法的保护范围不限于本实施例列举的步骤执行顺序，凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0052]
以下将结合图示对本实施例所提供的通话回声处理系统进行详细描述。需要说明
的是，应理解以下系统的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现，也可以全部以硬件的形式实现，还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如：某一模块可以为单独设立的处理元件，也可以集成在下述系统的某一个芯片中实现。此外，某一模块也可以以程序代码的形式存储于下述系统的存储器中，由下述系统的某一个处理元件调用并执行以下某一模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以下各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
[0053]
以下这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specific integrated circuit，简称asic)，一个或多个数字信号处理器(digital signal processor，简称dsp)，一个或者多个现场可编程门阵列(field programmable gate array，简称fpga)等。当以下某个模块通过处理元件调用程序代码的形式实现时，该处理元件可以是通用处理器，如中央处理器(central processing unit，简称cpu)或其它可以调用程序代码的处理器。这些模块可以集成在一起，以片上系统(system-on-a-chip，简称soc)的形式实现。
[0054]
请参阅图6，显示为本发明的通话回声处理系统于一实施例中的结构原理图。如图6所示，所述通话回声处理系统6包括：监控模块61、回声预估模块62和回声处理模块63。所述监控模块61与回声预估模块62通信连接，所述回声预估模块62与回声处理模块63通信连接.
[0055]
所述监控模块61用于监听是否满足触发条件，若满足所述触发条件，则对所述回声预估模块发送回声预估指令。
[0056]
所述回声预估模块62用于在接收到所述回声预估指令后，根据第一通话端的声音输入信号获得预估回声信号，并将所述预估回声信号发送至所述回声处理模块。
[0057]
于一实施例中，所述回声预估模块62具体用于初始化回声处理滤波器，利用所述回声处理滤波器处理所述第一通话端的声音输入信号，获得预估回声信号。
[0058]
所述回声处理模块63用于在接收到所述预估回声信号后，根据所述预估回声信号获得目标语音信号，并将所述目标语音信号返回至第一通话端。
[0059]
于一实施例中，所述回声处理模块63具体用于获取第二通话端的声音输入信号，将所述第二通话端的声音输入信号减去所述预估回声信号，获得目标语音信号。
[0060]
本发明所述的通话回声处理系统可以实现本发明所述的通话回声处理方法，但本发明所述的通话回声处理方法的实现装置包括但不限于本实施例列举的通话回声处理系统的结构，凡是根据本发明的原理所做的现有技术的结构变形和替换，都包括在本发明的保护范围内。
[0061]
本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述通话回声处理方法。
[0062]
本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质
中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的计算机可读存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的计算机存储介质。
[0063]
请参阅图7，显示为本发明的电子设备于一实施例中的结构连接示意图。如图7所示，本实施例提供一种电子设备7，具体包括：处理器71及存储器72；所述存储器72用于存储计算机程序，所述处理器71用于执行所述存储72器存储的计算机程序，以使所述电子设备7执行所述通话回声处理方法的各个步骤。
[0064]
上述的处理器71可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(digital signal processing，简称dsp)、专用集成电路(alication specific integrated circuit，简称asic)、现场可编程门阵列(field programmable gatearray，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0065]
上述的存储器72可能包含随机存取存储器(random access memory，简称ram)，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。
[0066]
于实际应用中，所述电子设备可以是包括存储器、存储控制器、一个或多个处理单元(cpu)、外设接口、rf电路、音频电路、扬声器、麦克风、输入/输出(i/o)子系统、显示屏、其他输出或控制设备，以及外部端口等组件的计算机通信设备；所述计算机通信设备包括但不限于如台式电脑、笔记本电脑、平板电脑、智能手机、智能电视、个人数字助理(personal digital assistant，简称pda)等个人电脑，所述电子设备还可以是车机端或是智能眼镜、智能手表或其他可穿戴设备，还可以是会议电话机、家用座机等设备。
[0067]
于一实施例中，所述电子设备为车机通信设备；所述车机通信设备包括车载麦克风与车载扬声器。
[0068]
当所述电子设备为车机通信设备时，所述触发条件至少包括：车门的开关操作、车窗的开关操作、天窗的开关操作和车机音量调整操作中的一种。
[0069]
假设有车外人员a与车内人员b通话，在回声削除算法作用下，车外人员基本不会听到车内喇叭播放出的车外人员返回的自己说话的声音。但是在通话的过程中，突然改变音量、开/关车门，开/关车窗等异常动作，则车外人员a听到自己回声则会特别明显，且持续的时间较长。因为这些动作破坏了通话开始建立起来的回声路径w(n)，改变通话的音量则破坏了回声大小，滤波器因为这些异常动作会有一个重新收敛自学习的过程，在这个过程中a将会听到自己的回声，在现有技术中恢复通话质量时间长一点的可能会持续10秒以上，这大大影响了通话体验。
[0070]
具体地，利用aec算法从初始状态开始收敛都会很快，中间状态会在收敛后的条件下一直工作，如果想在这样的条件下切换到一个新的状态并稳定下来，需要花费非常大的资源和时间。
[0071]
于实际应用中，假设aec初始工作状态为0，利用时间的长短衡量迭代收敛多少次可以满足预设的误差需求，其中满足预设的误差需求则判定为收敛至最佳状态。将当前通话状态稳定的情况记为0时刻，关门情况下收敛到最佳状态需要5秒，记为5，开门情况下收敛到最佳状态是与关门时收敛方向相反，从初始0时刻收敛至最佳状态也需要5秒，但收敛方向相反，记为-5，由此，从初始状态到开/关门的收敛状态都是5秒，但是，若从关门状态收敛到开门状态，现有技术的回声处理方法需要从5到-5，即需要10秒。本发明的通话回声处
理方法通过触发条件，使得自适应滤波器首先进行初始化，进而以初始0时刻为收敛起点进行收敛，实现了针对开门、关门或开关窗等操作时都只需要5秒，较大地缩短了收敛至最佳状态的时间。
[0072]
综上所述，本发明所述通话回声处理方法、系统、存储介质及电子设备可以在回声发生变化的情况下快速维持通话质量的稳定。通过设定的触发条件调整回声信号的预估过程，以加快回声处理的滤波器的收敛速度，进而在较短时间内提高通话质量。通过给滤波器增加一个针对异常情况的触发条件，使得回声消除算法重新学习收敛，从而减小自学习收敛的时间。根据车机音量变化和车内通话环境的变化触发回声消除的滤波器进行重新学习收敛，进而快速地提高用户于车内的通话质量。本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0073]
上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于小样本的波前编码场景数据集增强方法

通话回声处理方法、系统、存储介质及电子设备与流程

相关文献

最热文献