一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

家用电器及其语音识别方法与流程

2021-08-20 20:37:00 来源:中国专利 TAG:噪声 方法 估计 语音识别 识别率
家用电器及其语音识别方法与流程

与本公开一致的装置和方法涉及一种家用电器及其语音识别方法,并且更具体地,涉及一种使用关于在另一家用电器中出现的噪声的信息来估计噪声并且降低估计的噪声以提高语音识别率的家用电器及其语音识别方法。



背景技术:

家用电器可以根据来自用户的控制命令来执行各种功能。最近,家用电器采用语音识别功能来通过用户语音接收控制命令,以及经由输入设备(诸如键盘、远程控制器等)接收控制命令。

具体地,已经越来越多地采用了在用户说出特定启动命令时基于特定启动命令(例如bixby)来激活语音识别功能的方法的家用电器。

最近,具有并使用多个家用电器对于住户而言是常见的。此处,如果在家用电器中产生大幅度的噪声,则另一家用电器的语音识别功能可能会由于噪声而无法平稳地操作。



技术实现要素:

技术问题

本公开的实施例克服了以上缺点和上文未描述的其它缺点。此外,本公开不是必须克服上文所描述的缺点,并且本公开的实施例可以不克服上文所描述的问题中的任何一个。

本公开提供一种家用电器及其语音识别方法,该家用电器使用关于在另一家用电器中产生的噪声的信息来估计噪声并且降低估计的噪声以提高语音识别率。

问题的解决方案

根据本公开的实施例,一种家用电器包括:通信设备,被配置为与另一家用电器进行通信;麦克风,被配置为接收来自用户的语音;以及处理器,被配置为对从麦克风获得的第一语音数据执行信号处理并使用经信号处理的第一语音数据来执行语音识别,其中,处理器使用从另一家用电器接收到的第二语音数据来生成噪声数据并使用所生成的噪声数据对第一语音数据执行信号处理。

根据本公开的另一实施例,一种用于家用电器的语音识别的方法包括:从麦克风获得第一语音数据;对所获得的第一语音数据执行信号处理;以及使用经信号处理的第一语音数据来执行语音识别,其中,执行信号处理包括:从另一家用电器接收第二语音数据;使用接收到的第二语音数据来生成噪声数据;以及使用所生成的噪声数据对第一语音数据执行信号处理。

根据本公开的另一实施例,一种存储用于执行用于语音识别的方法的程序的记录介质,其中该方法包括:从第一家用电器和第二家用电器请求语音数据;接收基于请求分别从第一家用电器和第二家用电器获得的第一语音数据和第二语音数据;使用接收到的第二语音数据来生成噪声数据;使用所生成的噪声数据对第一语音数据执行信号处理;以及将经信号处理的第一语音数据发送到第一家用电器。

本公开的附加方面和/或其它方面以及优点将在以下描述中部分地阐述,并且部分地,将根据描述而变得明显,或可以通过本公开的实践而获知。

附图说明

本公开的以上方面和/或其它方面将通过参考附图描述本公开的某些实施例而变得更加清晰,在附图中:

图1是根据本公开的实施例的语音识别系统的框图;

图2是图示了根据本公开的实施例的第一家用电器的简单配置的框图;

图3是图示了根据本公开的实施例的第一家用电器的特定配置的框图;

图4是图示了根据本公开的实施例的第二家用电器的简单配置的框图;

图5是图示了根据本公开的实施例的服务器的简单配置的框图;

图6是图示了根据第一实施例的噪声去除方法的图;

图7是图示了根据第一实施例的噪声去除方法的图;

图8是图示了根据第二实施例的噪声去除方法的图;

图9是图示了根据第二实施例的噪声去除方法的图;

图10是图示了根据第二实施例的噪声去除方法的图;

图11是图示了根据第三实施例的噪声去除方法的图;

图12是图示了根据第三实施例的噪声去除方法的图;

图13是图示了根据第三实施例的噪声去除方法的图;

图14是图示了根据第一实施例的语音识别方法的序列图;

图15是图示了根据第一实施例的语音识别方法的序列图;

图16是图示了根据第一实施例的语音识别方法的序列图;

图17是图示了根据第二实施例的语音识别方法的流程图;

图18是图示了根据第二实施例的语音识别方法的流程图;

图19是图示了根据本公开的实施例的第一家用电器的语音识别方法的流程图;

图20是图示了根据本公开的实施例的第二家用电器的语音识别方法的流程图;以及

图21是图示了根据本公开的实施例的服务器的语音识别方法的流程图。

具体实施方式

在进行以下详细描述之前,阐述贯穿本专利文献使用的某些词和短语的定义可以是有利的:术语“包括(include)”和“包括(comprise)”及其派生词意指包括但不限于;术语“或”是包括性的,意指和/或;短语“与……相关联”和“与之相关联”及其派生词可以意指包括、被包括在……内、与……互连、包含、被包含在……内、连接到或与……连接、耦合到或与......耦合、与……可通信、与……协作、交错、并置、接近于、绑定到或与......绑定、具有、具有......的特性等;并且术语“控制器”意指控制至少一个操作的任何设备、系统或其部分,这种设备可以利用硬件、固件或软件,或它们中的至少两个的某种组合来实现。应注意,与任何特定控制器相关联的功能性可以是集中式的或分布式的,无论是本地地还是远程地。

而且,下文所描述的各种功能可以由一个或多个计算机程序实现或支持,该一个或多个计算机程序中的每一个由计算机可读程序代码形成并且体现在计算机可读介质中。术语“应用”和“程序”是指适用于以合适的计算机可读程序代码实现的一个或多个计算机程序、软件组件、指令集、过程、功能、对象、类别、实例、相关数据或其一部分。短语“计算机可读程序代码”包括任何类型的计算机代码,包括源代码、目标代码以及可执行代码。短语“计算机可读介质”包括能够由计算机访问的任何类型的介质,诸如只读存储器(rom)、随机存取存储器(ram)、硬盘驱动器、光盘(cd)、数字视频光盘(dvd)或任何其它类型的存储器。“非暂时性”计算机可读介质排除了传送暂时性电信号或其它信号的有线、无线、光学或其它通信链路。非暂时性计算机可读介质包括可以永久地存储数据的介质、以及可以存储并且稍后覆写数据的介质,诸如可重写光盘或可擦除存储器设备。

贯穿本专利文献提供了某些词和短语的定义,本领域的普通技术人员应理解,在许多(即使不是大多数)实例中,此类定义适用于此类定义的词和短语的先前使用以及未来使用。

下文所讨论的图1到图21以及用于描述本专利文献中的本公开的原理的各种实施例仅作为说明,并且不应以任何方式解释为限制本公开的范围。本领域的技术人员将理解,本公开的原理可以在任何合适布置的系统或设备中实现。

简要地描述了本公开的各种实施例的描述中所使用的术语,然后将更详细地描述本公开的各种示例实施例。

在本公开的示例实施例中所使用的术语是现在广泛使用的并且考虑到本公开的功能而选择的通用术语。然而,术语可以取决于本领域的技术人员的意图、先例或新技术的出现而改变。此外,在指定情况下,可以任意地选择术语。在这种情况下,将在对应描述中解释术语的含义。因此,本公开中所使用的术语可以基于本公开中所描述的术语和内容的含义来定义,而非简单地基于术语的名称来定义。

在下文中,参考附图描述了本公开的各种实施例。然而,应理解,本公开不限于特定实施例,并且本公开的所有修改、等同物和/或替代方案也属于本公开的范围。可以省略对并入本文中的熟知功能和结构的描述以避免混淆本公开的主题。

在本公开中,可以使用包括诸如“第一”、“第二”等的序数词的术语来描述各种组件,但组件不应被解释为限制于这些术语。所述术语仅用于区分一个组件与其它组件。

在描述中,除非上下文另外明确指示,否则单数形式也旨在包括复数形式。将理解,术语“包括(comprising)”、“包括(including)”、“具有(having)”及其变型指定阐述的特征、数目、步骤、操作、元件、组件和/或其群组的存在,但不排除一个或多个其它特征、数目、步骤、操作、元件、组件和/或其群组的存在或添加。

在下文中,将参考随附表格和附图详细地描述实施例,使得本公开所属领域的技术人员能够容易地实践这些实施例。如本领域的技术人员将会认识到的,在全部不脱离本公开的精神或范围的情况下,可以以各种不同方式修改所描述的实施例。在附图中,为了清楚起见,将省略与本公开的描述无关的部分。相似附图标记始终指相似元件。

在下文中,将参考附图详细描述本公开。

图1是图示了根据本公开的实施例的语音识别系统的图。

参考图1,语音识别系统1000包括第一家用电器100、第二家用电器200以及服务器300。

第一家用电器100和第二家用电器200是家庭使用的电气机器工具,并且包括清洁机器人、真空吸尘器、电灶、燃气灶、电波炉、抽油烟机、洗衣机、烘干机、冰箱、洗碗机、空调等。

第一家用电器100和第二家用电器200可以执行语音识别功能并根据语音识别结果来执行功能。此处,语音识别是指将输入言语(inputspeech)的声学信号转换为词或句子的技术。

此外,第一家用电器100和第二家用电器200可以检测用户说出的语音并且对检测到的语音执行语音识别。具体地,当检测到作为用于激活语音识别功能的触发语音命令的唤醒词(wuw)时,第一家用电器100和第二家用电器200激活语音识别功能并使用此后输入的语音的语音数据来执行语音识别。

在下文中,为了便于说明,假设第一家用电器100执行语音识别功能。此处,第二家用电器200可以是产生大幅度的噪声的家用电器。具体地,第二家用电器200可能由于包括在其中的电机、风扇等而产生大幅度的噪声。

此外,由于在第二家用电器200中产生的大幅度的噪声,第一家用电器100的语音识别功能可能会无法正常运行。因此,第一家用电器100可以使用关于在第二家用电器200中产生的大幅度的噪声的信息来估计噪声并且降低估计的噪声以提高语音识别率。

为此,第一家用电器100可以将录音请求信号发送到第二家用电器200。此外,第一家用电器100可以从第二家用电器200接收基于录音请求信号而获得的第二语音数据。此处,第二语音数据是关于在第二家用电器200中产生的噪声的语音数据。

此外,第一家用电器100可以基于录音请求信号来获得第一语音数据。

因此,第一家用电器100可以获得同时检测到的语音的第一语音数据和第二语音数据。

此外,第一家用电器100可以使用第二语音数据来生成噪声数据。此处,噪声数据是指与噪声源的纯噪声对应的声音数据。具体地,第一家用电器100可以通过将第二语音数据应用于噪声路径估计滤波器来生成噪声数据。稍后将参考图6到图10描述生成噪声数据的具体操作。

此外,第一家用电器100可以使用所生成的噪声数据对第一语音数据进行信号处理。具体地,第一家用电器100可以使用所生成的噪声数据来去除第一语音数据中所包括的噪声。

此外,第一家用电器100可以使用第一经信号处理的语音数据来执行语音识别。

第二家用电器200可以通过有线或无线通信连接到第一家用电器100。第二家用电器200可以从第一家用电器100接收录音请求信号。

此外,第二家用电器200可以基于接收到的录音请求信号来获得第二语音数据。获得的第二语音数据可以被发送到第一家用电器100。

同时,对第一家用电器100的第一语音数据的录音请求信号发送操作和信号处理操作也可以由服务器300执行。

具体地,服务器300可以通过有线或无线通信连接到第一家用电器100和第二家用电器200。服务器300可以将录音请求信号发送到第一家用电器100和第二家用电器200。

此外,服务器300可以从第一家用电器100接收基于录音请求信号而获得的第一语音数据。服务器300可以从第二家用电器200接收基于录音请求信号而获得的第二语音数据。

此外,服务器300可以使用第二语音数据来生成噪声数据。具体地,服务器300可以通过将第二语音数据应用于噪声路径估计滤波器来生成噪声数据。

服务器300可以使用所生成的噪声数据对第一语音数据进行信号处理。服务器300可以将经信号处理的第一语音数据发送到第一家用电器100。

同时,在图1中,图示并描述了第一家用电器100连接到一个第二家用电器200,但是它还可以被实现为使得第一家用电器100连接到多个家用电器并且使用关于在多个家用电器中产生的噪声的信息来执行信号处理。

此外,在图1中,图示并描述了服务器300连接到两个家用电器,但是它还可以被实现为使得服务器300连接到三个或更多个家用电器。

此外,在图1中,图示并描述了服务器300被包括在语音识别系统1000中,但是可以仅实现第一家用电器100和第二家用电器200,而没有服务器300。

图2是图示了根据本公开的实施例的第一家用电器的简单配置的框图。

参考图2,第一家用电器100可以包括麦克风110、通信设备120以及处理器130。

麦克风110,将声音转换为声音信号的设备,可以输出用户的说出的语音和周围声音作为语音数据。麦克风110可以将输出语音数据递送给处理器130。

麦克风110可以被设置在壳体的表面上。具体地,麦克风110可以被设置在壳体的表面上以生成与第一家用电器100附近的声音对应的第一语音数据,以便收集用户的说出的语音。此外,麦克风110的布置位置不限于上文所描述的示例。

此外,在本公开中,图示并描述了第一家用电器100包括一个麦克风,但在实现时,第一家用电器100可以包括两个或更多个麦克风。

通信设备120可以连接到外部设备并且可以从外部设备接收各种数据。具体地,通信设备120可以通过局域网(lan)和因特网、以及通过通用串行总线(usb)端口或无线通信(例如,wi-fi802.11a/b/g/n、nfc、蓝牙)连接到外部设备。此处,外部设备可以是pc、笔记本、智能电话、服务器等。

此外,通信设备120可以连接到语音识别系统1000中的第二家用电器200或服务器300。例如,通信设备120可以通过蓝牙通信与语音识别系统1000中的第二家用电器200进行通信,并且通过wi-fi通信与语音识别系统1000中的服务器300进行通信。同时,用于第一家用电器100与第二家用电器200或服务器300进行通信的方法不限于上文所描述的示例。

处理器130控制第一家用电器100。具体地,处理器130可以根据用户的控制命令来控制第一家用电器100的每个组件。例如,当第一家用电器100是冰箱时,处理器130可以基于接收到制冷命令来控制压缩机的操作以向包含食物的制冷室提供制冷空气。

此外,处理器130可以使用通过麦克风110获得的第一语音数据来执行语音识别。同时,第一语音数据可以包括噪声以及用户的语音,并且语音识别率可以因所包含的噪声而降低。

因此,处理器130可以对第一语音数据执行预处理。此处,预处理是在语音识别之前执行的一系列信号处理并且可以去除语音数据中所包括的噪声。此外,处理器130可以使用经预处理的第一语音数据来执行语音识别。

同时,第一语音数据中所包括的噪声可能是由于设置在第一家用电器100附近并产生大幅度的噪声的第二家用电器200而引起的。因此,处理器130从第二家用电器200获得关于在第二家用电器200中产生的噪声的信息并且使用所获得的关于噪声的信息来对第一语音数据进行预处理。

在下文中,将详细描述使用关于在第二家用电器200中产生的噪声的信息来对第一语音数据执行预处理的操作。

首先,处理器130可以控制通信设备120以检测另一可连接的家用电器。具体地,处理器130可以控制通信设备120以检测通过短距离无线通信可连接的第二家用电器或连接到第一家用电器100所连接的接入点(ap)的第二家用电器200。

此处,对于与第一家用电器100的短距离无线通信可得的或连接到第一家用电器100所连接的ap的第二家用电器200预期被设置在第一家用电器100附近。因此,可以推断在第二家用电器200中产生的噪声可以影响第一家用电器100的语音识别功能。

此外,处理器130可以控制通信设备120以从第二家用电器200请求发送语音数据。具体地,处理器130可以控制通信设备120以将用于请求生成和发送第二语音数据的录音请求信号发送到第二家用电器200,该第二语音数据是在第二家用电器200中产生的噪声的语音数据。

此处,录音请求信号可以包括关于预定时间的信息。第二家用电器200可以基于接收到的录音请求信号而在预定时间使用麦克风检测噪声并且生成第二语音数据。例如,当录音请求信号中所包括的关于预定时间的信息是下午3:00:30时,第二家用电器200可以在下午3:00:30使用麦克风检测噪声并且生成第二语音数据。

同时,关于预定时间的信息可以被实现为包括如上文所描述的示例中的绝对时间信息,并且可以被实现为包括诸如“在接收到录音请求信号之后x秒”的相对时间信息。

此外,录音请求信号可以包括关于第二语音数据的预定时间长度的信息。第二家用电器200可以基于接收到的录音请求信号来生成具有预定时间长度的第二语音数据。例如,当录音请求信号中所包括的关于预定时间长度的信息是3秒时,第二家用电器200可以生成长度为3秒的第二语音数据。

同时,可以被包括在录音请求信号中的信息不限于上文所描述的示例。

此外,处理器130可以从第二家用电器200接收基于发送到第二家用电器200的请求而生成的第二语音数据。具体地,处理器130可以从第二家用电器200接收基于录音请求信号中所包括的预定时间信息和预定时间长度信息而生成的第二语音数据。

例如,当录音请求信号中所包括的预定时间信息是下午3:00:30并且预定时间长度信息为2秒时,处理器130可以接收关于从下午3:00:30到下午3:00:32通过第二家用电器200的麦克风检测到的语音的第二语音数据。

此外,处理器130可以基于发送到第二家用电器200的请求来获得第一语音数据。具体地,处理器130可以基于发送到第二家用电器200的录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第一语音数据。

例如,当录音请求信号中所包括的预定时间信息是下午3:00:30并且预定时间长度信息为2秒时,处理器130可以获得关于从下午3:00:30到下午3:00:32通过麦克风110检测到的语音的第一语音数据。

此处,获得的第一语音数据和第二语音数据是基于录音请求信号而生成的,因此分别与由第一家用电器100和第二家用电器200同时检测到的语音数据对应。第二语音数据是在第二家用电器200中直接检测到的噪声的语音数据,因此可以包括幅度大于第一语音数据中所包括的幅度的噪声。

因此,在使用第二语音数据时,可以比在仅使用第一语音数据时更准确地提取第一语音数据中所包括的噪声。

此外,处理器130可以使用第二语音数据来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

处理器130可以使用噪声路径估计滤波器来生成噪声数据。此处,噪声路径估计滤波器是指用于对除了第二语音数据中所包括的噪声源的噪声之外的分量进行滤波的滤波器。此处,噪声路径估计滤波器可以被称为滤波算法。

例如,当第二语音数据被输入到噪声路径估计滤波器时,可以对第二语音数据中所包括的用户的言语分量进行滤波以输出噪声数据。同时,稍后将参考图6到图10描述使用噪声路径估计滤波器来生成噪声数据的具体操作。

此外,处理器130可以使用预先存储的噪声路径估计滤波器或从外部设备接收噪声路径估计滤波器,并且使用接收到的噪声路径估计滤波器生成噪声数据。同时,稍后将参考图11到图13描述从外部接收噪声路径估计滤波器并且生成噪声数据的具体操作。

处理器130可以使用噪声数据对第一语音数据执行预处理。具体地,处理器130可以通过使用经由噪声路径估计滤波器生成的噪声数据从第一语音数据中去除与噪声源的噪声对应的分量来对第一语音数据执行预处理。

处理器130的操作可以根据预定周期重复执行。具体地,处理器130可以根据预定周期执行以下序列操作:从第二家用电器200请求语音数据;从第二家用电器200接收基于该请求而获得的第二语音数据;获得与该请求对应的第一语音数据;使用接收到的第二语音数据来生成噪声数据;以及使用所生成的噪声数据对第一语音数据执行预处理。

同时,处理器130可以根据目前是否在第二家用电器200中产生了噪声来改变用于第一语音数据的预处理方法。

例如,假设在第二家用电器200中所生成的声音是由第二家用电器200中所包括的电机产生的。在这种情况下,处理器130可以根据第二家用电器200的电机是否被驱动来改变用于第一语音数据的预处理方法。

具体地,处理器130可以控制通信设备120以确定第二家用电器200的电机是否被驱动。如果第二家用电器200的电机被驱动,则在第二家用电器200中产生的噪声的幅度是大的,因此,可以根据上文所描述的方法使用第二语音数据对第一语音数据执行预处理。

同时,当第二家用电器200的电机未被驱动时,不存在第二家用电器200自身中产生的噪声,因此可以使用第一语音数据,而不使用第二语音数据,立即执行语音识别,或可以根据相关技术方法对第一语音数据执行预处理。

同时,甚至在第二家用电器200的噪声源是风扇等而不是电机时,处理器130可以根据噪声源是否被驱动来改变用于第一语音数据的预处理方法。

处理器130可以使用经预处理的第一语音数据来执行语音识别。

同时,在图2中,图示并描述了第一家用电器执行将录音请求信号发送到第二家用电器200、从第二家用电器200接收第二语音数据、以及对第一语音数据执行预处理的操作,但是它可以被实现为使得服务器300,而不是第一家用电器100,执行上文所描述的操作,并且第一家用电器100仅从服务器300接收经预处理的第一语音数据并且执行语音识别。稍后将参考图5描述其具体操作。

此外,尽管上文仅图示和描述了配置第一家用电器的简单组件,但是在实现时可以进一步提供各种组件。下文将参考图3对此进行描述。

图3是图示了根据本公开的实施例的第一家用电器的具体配置的框图。

参考图3,根据本公开的实施例的第一家用电器100可以包括麦克风110、通信设备120、处理器130、输入设备140、存储器150和显示器160。

麦克风110和通信设备120执行与图2的麦克风和通信设备相同的功能,因此将省略对其的赘述。此外,上文已经参考图2描述了处理器130,因此,不再重复对图2的描述,且下文将仅描述与添加到图3的组件相关的内容。

输入设备140可以包括多个功能键,以供用户设置或选择第一家用电器100所支持的各种功能。通过这样,用户可以输入用于第一家用电器100的各种控制命令。例如,当第一家用电器100是洗衣机时,用户可以通过输入设备140输入洗衣机的甩干(spin-dry)命令。

存储器150存储用于第一家用电器100的整体操作的各种数据,诸如用于处理或控制处理器130的程序。具体地,存储器150可以存储在第一家用电器100中运行的多个应用程序以及用于操作第一家用电器100的数据和指令。

存储器150可以由处理器130访问,并且可以由处理器130执行数据读取/写入/修改/删除/更新。存储器150不仅可以被实现为第一家用电器100中的存储介质,而且还可以被实现为外部存储介质、包括usb存储器的可移除盘、经由网络的网络服务器等。

存储器150可以存储生成噪声数据所需的噪声路径估计滤波器。

显示器160可以显示由第一家用电器100提供的各种类型的信息。具体地,显示器160可以显示第一家用电器100的操作状态或可以显示用于选择由用户选择的功能和选项的用户界面窗口。

例如,当第一家用电器100是洗衣机时,显示器160可以显示洗衣机正在执行甩干操作或显示允许用户选择甩干功能将要操作多少分钟的界面窗口。可替选地,显示器160可以显示执行语音识别功能的结果,或可以显示界面窗口,使得用户可以改变语音识别功能的设置。

在相关技术中,针对预处理,使用通过多个麦克风获得包括语音和噪声的多个语音信号并使用语音和噪声在不同方向上传入以及其频谱不同的特征将语音和噪声分离的波束成形技术来去除噪声。

然而,如果在实际环境中噪声的幅度大于语音的幅度,则难以识别预期的方向差异或频谱差异,从而导致在相关技术方法中难以区分语音和噪声的问题。例如,当从在附近布置的其它家用电器产生大幅度的噪声时,仅通过相关技术难以充分地去除用于语音识别的噪声。

同时,如上文所描述,根据本实施例的第一家用电器从产生大幅度的噪声的另一家用电器获得关于对应噪声的第二语音数据,并且使用所获得的第二语音数据来执行预处理,由此即使从外部产生的噪声的幅度是大的,也可以准确地去除语音数据中所包括的噪声。

图4是图示了根据本公开的实施例的第二家用电器的简单配置的框图。

参考图4,根据本公开的实施例的第二家用电器200可以包括麦克风210、通信设备220、处理器240、电机230、加速度计250、输入设备260以及存储器270。

麦克风210是将声音转换为声音信号的设备并且可以输出用户的说出的语音和周围声音作为语音数据。麦克风210可以将输出语音数据递送给处理器240。

麦克风210可以被设置在壳体的表面上。具体地,为了收集用户的说出的语音,麦克风210可以被设置在壳体的表面上以生成与第二家用电器200周围的声音对应的第二语音数据。

可替选地,麦克风210可以被设置在壳体中。具体地,为了收集第二家用电器200自身所产生的噪声声音,麦克风210可以被设置在壳体内部(具体地,在产生噪声的噪声源(诸如电机)附近)以生成与由第二家用电器200生成的声音对应的第二语音数据。

同时,麦克风210的布置位置不限于上文所描述的示例。此外,在本公开中,尽管图示并描述了第二家用电器200包括一个麦克风,但是在实现时,第二家用电器200可以包括两个或更多个麦克风。

通信设备220可以连接到外部设备并且从外部设备接收各种数据。具体地,通信设备220可以通过局域网(lan)和因特网、以及通过通用串行总线(usb)端口或无线通信(wi-fi802.11a/b/g/n、nfc、蓝牙)端口连接到外部设备。外部设备可以是pc、笔记本、智能电话、服务器等。

此外,通信设备220可以连接到语音识别系统1000中的第一家用电器100或服务器300。例如,通信设备220可以通过蓝牙通信与语音识别系统1000中的第一家用电器100进行通信,并且通过wi-fi通信与语音识别系统1000中的服务器300进行通信。同时,用于第二家用电器200与第一家用电器100或服务器300进行通信的方法不限于上文所描述的示例。

电机230被设置在第二家用电器200中以驱动与执行第二家用电器200的功能相关的组件。例如,当第二家用电器200是洗衣机时,电机230可以高速地旋转包含衣物的滚筒以将衣物甩干。此处,在电机230启动滚筒时可能会出现振动和噪声。

作为另一示例,当第二家用电器200是冰箱时,电机230可以启动生成制冷剂的制冷剂压缩机。此处,在电机230启动制冷剂压缩机时可能会生成振动和噪声。

如上文所描述,当第二家用电器200自身产生大幅度的噪声时,电机230可以是噪声源。因此,麦克风210可以被设置在电机230附近,并且检测由电机230产生的声音并生成与该声音对应的第二语音数据。

处理器240控制第二家用电器200。具体地,处理器240可以根据用户的控制命令来控制第二家用电器200的每个组件。例如,当第二家用电器200是洗衣机时,处理器240可以在接收到甩干命令时控制电机的操作以向包含衣物的滚筒提供旋转力。

处理器240可以接收对发送第二语音数据的请求。具体地,处理器240可以从连接到第二家用电器200的第一家用电器100或服务器300接收请求生成和发送第二语音数据的录音请求信号,该第二语音数据是关于在第二家用电器200中产生的噪声的语音数据。

此外,处理器240可以基于接收到的请求来获得第二语音数据。具体地,处理器240可以基于接收到的录音请求信号使用麦克风210检测噪声,并且获得第二语音数据。更具体地,处理器240可以基于在接收到的录音请求信号中所包括的关于预定时间的信息和预定时间长度信息来获得第二语音数据。

此外,处理器240可以控制通信设备220以发送获得的第二语音数据。具体地,处理器240可以将获得的第二语音数据发送到连接到第二家用电器200的第一家用电器100或服务器300。

如此,发送到第一家用电器100或服务器300的第二语音数据是关于在第二家用电器200中产生的噪声的语音数据,因此,可以用于执行预处理以去除在第一家用电器100中获得的第一语音数据中所包括的噪声。

例如,当第二家用电器200的噪声源是电机230时,第一家用电器100或服务器300可以生成噪声数据(该噪声数据是关于第二家用电器200的电机的纯电机噪声数据)并且使用所生成的电机噪声数据执行预处理以从第一语音数据去除电机噪声。

同时,如上文所描述,除了处理器240在每次接收到录音请求信号时获得第二语音数据并发送所获得的第二语音数据的方法之外,处理器240还可以在接收到录音请求信号的每个预定周期获得第二语音数据,并且如上文所描述发送所获得的第二语音数据。

同时,除了通过检测在第二家用电器200中产生的噪声而生成的第二语音数据之外,处理器240还可以向第一家用电器100或服务器300提供关于噪声的其它类型的参考数据。

此处,参考数据可以是包括噪声源的信息的数据。噪声源的信息可以包括从噪声源产生的振动的幅度和相位、从噪声源产生的噪声的幅度和相位、主频率信息等。

例如,处理器240可以通过经由加速度计250获得参考数据或通过经由输入设备260输入的控制命令获得参考数据来生成噪声数据。下文将描述其具体操作。

加速度计250是用于测量物体的加速度的设备。此外,加速度计250可以被设置在电机230附近以测量电机230的加速度并且生成关于所测量的加速度的信息。

处理器240可以从所获得的加速度信息提取电机230的操作频率并且使用提取的操作频率生成参考数据。

例如,当从自加速度计250获得的加速度信息提取50hz作为电机230的操作频率时,处理器240可以使用50hz生成由具有特定大小和相位的三角函数表示的参考数据。

输入设备260可以包括允许用户设置或选择第二家用电器200中所支持的各种功能的多个功能键。通过这样,用户可以输入关于第二家用电器200的各种控制命令。

同时,通过输入设备260输入的控制命令可以与电机230的驱动相关。在这种情况下,可以检查与通过输入设备260输入的控制命令对应的电机230的操作频率。

例如,当第二家用电器200是洗衣机并且输入甩干命令时,电机230可以旋转洗衣机的滚筒以执行甩干功能。在这种情况下,可以检查与甩干命令对应的电机230的操作频率是50hz。

处理器240可以使用与控制命令对应的电机230的操作频率来生成参考数据。

这可以以相同方式应用于由处理器240本身根据情况确定而生成的控制命令。

以这种方式,处理器240可以将通过麦克风210获得的第二语音数据、以及使用从控制命令或加速度计250的加速度信息辨识(identify)的驱动频率生成的参考数据中的至少一个发送到第一家用电器100或服务器300。此外,第一家用电器100或服务器300可以使用接收到的参考数据来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

同时,处理器240可以不将上述第二语音数据和参考数据发送到第一家用电器100或服务器300,并且替代地,处理器240可以使用第二语音数据和参考数据来生成噪声数据并且将所生成的噪声数据发送到第一家用电器100或服务器300。为此,可以将噪声路径估计滤波器预先存储在第二家用电器200中。

在这种情况下,第一家用电器100或服务器300可以接收噪声数据并且使用接收到的噪声数据执行预处理以去除第一语音数据中所包括的噪声。

存储器270存储用于第二家用电器200的整体操作的各种数据,诸如用于处理或控制处理器240的程序。具体地,存储器270可以存储在第二家用电器200中驱动的多个应用程序以及用于第二家用电器200的操作的数据和指令。

例如,存储器270可以存储与通过输入设备260输入的控制命令对应的电机230的驱动频率信息。处理器240可以辨识与输入的控制命令对应的驱动频率并且使用所辨识的驱动频率来生成参考数据。

同时,尽管在图4中将噪声源图示并描述为电机230,但是在实现时,噪声源可以是风扇或另一组件,而非电机230。

此外,在图4中,图示并描述了单个电机,但是在实现时,可以提供多个电机,可以提供多个电机并且可以使用多个电机中的每一个的参考数据来估计噪声。

此外,在图4中,图示并描述了第二家用电器包括麦克风和加速度计两者,但是在实现时可以仅提供加速度计,并且可以通过加速度计获得参考数据。可替选地,可以仅提供麦克风,并且可以通过麦克风获得第二语音数据。可替选地,可以不提供第二麦克风和加速度计,并且可以通过输入设备获得参考数据。

此外,在图4中,图示并描述了使用电机的工作频率来生成参考数据的操作由处理器执行,但是在实现时,可以提供在接收到操作频率信息时生成正弦波信号的正弦波信号发生器。在这种情况下,可以将由正弦波信号发生器生成的信号用作参考数据。

此外,在图4中,图示并描述了第二家用电器200是具有与第一家用电器100的配置不同的配置的家用电器,但是在实现时,第二家用电器200可以是具有与第一家用电器100相同的配置的家用电器。

如上文所描述,第二家用电器生成关于内部噪声源的噪声的参考数据并且向第一家用电器或服务器提供所生成的参考数据,使得第一家用电器或服务器可以通过使用参考数据执行预处理以去除语音数据(其包括用户的言语)中所包括的噪声。

图5是图示了根据本公开的实施例的服务器的简单配置的框图。

参考图5,服务器300可以包括通信设备310、存储器320和处理器330。

服务器300是指通过网络向客户端提供信息或服务的计算机或程序。

通信设备310可以连接到外部设备并且可以从外部设备接收各种数据。具体地,通信设备310可以通过局域网(lan)和因特网、以及通过通用串行总线(usb)端口或无线通信(wi-fi802.11a/b/g/n、nfc、蓝牙)端口连接到外部设备。外部设备可以是pc、笔记本、智能电话、服务器等。

此外,通信设备310可以连接到语音识别系统1000中的第一家用电器100或第二家用电器200。例如,通信设备310可以通过wi-fi通信执行与语音识别系统1000中的第一家用电器100或第二家用电器200的通信。同时,用于服务器300与第一家用电器100或第二家用电器200进行通信的方法不限于上文所描述的示例。

存储器320存储用于服务器300的整体操作的各种数据,诸如用于处理或控制处理器330的程序。具体地,存储器320可以存储在服务器300中运行的多个应用程序以及用于服务器300的操作的数据和指令。

存储器320可以由处理器330访问,并且可以由处理器330执行数据读取/写入/修改/删除/更新。存储器320不仅可以被实现为服务器300中的存储介质,而且还可以被实现为外部存储介质、包括usb存储器的可移除盘、经由网络的网络服务器等。

存储器320可以存储多个家用电器的设备信息。具体地,存储器320可以存储连接到服务器300的多个家用电器或具有至服务器的连接历史的多个家用电器的设备信息。家用电器的设备信息可以包括序列号或通用唯一标识符(uuid)信息,并且所包括的信息不限于上文所描述的示例。

存储器320可以存储生成噪声数据所需的噪声路径估计滤波器。可替选地,存储器320可以存储生成噪声路径估计滤波器的人工智能模型。同时,稍后将参考图11描述使用人工智能模型来生成噪声路径估计滤波器的具体操作。

处理器330控制服务器300。具体地,处理器330可以根据用户的控制命令来控制服务器300的每个组件。

此外,代替第一家用电器100,处理器330可以对由第一家用电器100获得的语音数据执行预处理。具体地,处理器330可以从第一家用电器100接收与第一家用电器100附近的声音对应的第一语音数据。此外,可以对接收到的第一语音数据执行预处理。

同时,当第二家用电器200被设置在第一家用电器100附近并且产生大幅度的噪声时,处理器330可以使用关于在第二家用电器200中产生的噪声的信息对接收到的第一语音数据执行预处理。

在下文中,将描述使用关于在第二家用电器200中产生的噪声的信息来对第一语音数据执行预处理的具体操作。

首先,处理器330可以从第一家用电器100接收关于连接到第一家用电器100的第二家用电器200的信息。具体地,处理器330可以从第一家用电器100接收关于可以通过短距离无线通信连接到第一家用电器100的第二家用电器200或连接到第一家用电器100所连接的接入点(ap)的第二家用电器200的信息。

处理器330可以连接到第二家用电器200。具体地,处理器330可以使用从第一家用电器100接收到的第二家用电器200的信息连接到第二家用电器200。

处理器330可以控制通信设备310以从第一家用电器100和第二家用电器200请求语音数据。具体地,处理器330可以控制通信设备310以将用于请求生成和发送语音数据的录音请求信号发生到第一家用电器100和第二家用电器200。

录音请求信号可以包括关于预定时间的信息和关于预定时间长度的信息。录音请求信号中所包括的信息不限于上文所描述的示例。

处理器330可以接收基于请求而生成的语音数据。具体地,处理器330可以从第一家用电器100接收基于录音请求信号而获得的第一语音数据。处理器330可以从第二家用电器200接收基于录音请求信号而获得的第二语音数据。

处理器330可以使用接收到的第二语音数据来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

此外,除了通过检测在第二家用电器200中产生的噪声而生成的第二语音数据之外,处理器330还可以接收关于噪声的其它类型的参考数据。

例如,处理器330可以接收通过第二家用电器200的加速度计获得的参考数据或通过输入到第二家用电器200的控制命令获得的参考数据。此处,参考数据可以基于噪声源信息来生成,该噪声源信息包括从噪声源产生的振动的幅度和相位、从噪声源产生的噪声的幅度和相位、以及主频率信息。

处理器330可以使用接收到的参考数据来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

处理器330可以使用噪声路径估计滤波器来生成噪声数据。同时,稍后将参考图6到图10描述使用噪声路径估计滤波器来生成噪声数据的具体操作。

处理器330还可以被实现为接收在第二家用电器200中生成的其自身的噪声数据,而不从第二家用电器200接收第二语音数据或参考数据。

处理器330可以使用噪声数据对第一语音数据执行预处理。具体地,处理器330可以通过使用经由噪声路径估计滤波器生成的噪声数据从第一语音数据去除与噪声源的噪声对应的分量来对第一语音数据执行预处理。

此外,处理器330可以将经预处理的第一语音数据发送到第一家用电器100。此外,第一家用电器100可以使用从服务器300接收到的经预处理的第一语音数据来执行语音识别。

以这种方式,服务器300从将执行语音识别功能的第一家用电器接收第一语音数据,从产生大幅度的噪声的第二家用电器获得关于噪声的第二语音数据或参考数据,并且使用所获得的第二语音数据或参考数据对第一语音数据执行预处理,由此即使噪声的幅度是大的,也可以准确地去除语音数据中所包括的噪声。

图6和图7是图示了根据第一实施例的噪声去除方法的图。

图6是图示了根据第一实施例的噪声去除方法的简单框图。

参考图6,使用参考数据r、语音数据d以及噪声估计算法来生成噪声数据y,并且使用所生成的噪声数据y来去除语音数据d的噪声。

此处,参考数据r可以是通过第二家用电器200的麦克风210获得的第二语音数据、第二家用电器200的加速度计250的加速度信息、或使用从控制命令检查的驱动频率生成的参考数据中的至少一个。

语音数据d可以与由第一家用电器100的麦克风110获得的第一语音数据对应。

第一家用电器100的处理器130或服务器300的处理器330可以使用噪声估计算法和参考数据r来生成噪声数据y。具体地,处理器130和330可以使用噪声估计算法中所包括的噪声路径估计滤波器信息来从参考数据r提取噪声数据y,该噪声数据y是与源噪声的噪声对应的声音数据。

噪声路径估计滤波器可以被实现为时域中的有限脉冲响应(fir)滤波器或无限脉冲响应(iir)滤波器。可替选地,噪声路径估计滤波器可以以针对频域中的每个频带预定的传递函数的形式来实现。

噪声路径估计滤波器可以具有如上文所描述的示例中的线性结构,但不限于此,并且可以具有非线性结构。

噪声路径估计滤波器可以是固定的并且用作一个噪声路径估计滤波器,并且在预先存储了多个噪声路径估计滤波器信息的情况下,可以根据情况选择并使用噪声路径估计滤波器中的一个来生成噪声数据y。

处理器130和330可以通过使用所生成的噪声数据y去除与语音数据d中所包括的噪声源的噪声对应的分量来对语音数据d执行预处理。

服务器300的处理器330可以执行预处理并且将去除噪声的语音数据e发送到第一家用电器100。此外,第一家用电器100的处理器130可以使用通过执行预处理从其去除了噪声的语音数据e来执行语音识别。

同时,处理器130或330可以更新使用语音数据d来生成噪声数据y的方法,使得即使在噪声源的噪声改变或周围环境改变时也可以生成准确的噪声数据y。

具体地,在执行预处理之后,处理器130和330可以使用包括噪声的语音数据d来更新噪声路径估计滤波器。下文将参考图7对其细节进行描述。

图7是图示了根据第一实施例的去除频域中的噪声的方法的框图。

参考图7,可以辨识使用频域中的噪声路径估计滤波器h和利用包括噪声的语音数据d执行更新的噪声估计算法。

处理器130和330可以使用快速傅立叶变换(fft)将参考数据r转换到频域中。处理器130和330可以通过将转换后的参考数据r应用于噪声路径估计滤波器h来获得转换到频域中的噪声数据y(y=r·h)。此外,处理器130和330可以使用快速傅立叶逆变换(ifft)将噪声数据y转换到时域中。处理器130和330可以使用转换后的噪声数据y来去除语音数据d的噪声。

同时,在执行预处理之后,处理器130和330可以使用其中混合有噪声的语音数据d来更新噪声路径估计滤波器h。具体地,处理器130或330可以使用通过fft从包括噪声的语音数据d转换到频域中的语音数据d与转换后的参考数据r之间的相关性来更新噪声路径估计滤波器h。

例如,可以假设第k-1噪声路径估计滤波器为h(k-1),包括后续第k噪声的语音数据为d(k),第k参考数据为r(k),转换到第k频域中的语音数据为d(k),并且转换到第k频域中的参考数据为r(k)。在这种情况下,可以通过将作为第k转换后的参考数据r(k)的自相关值的grr(k)的逆矩阵与作为第k参考数据r(k)与语音数据d(k)的互相关值的gdr(k)相乘来生成新噪声路径估计滤波器h(k)(h(k)=grr(k)·gdr(k)(-1))。

此处,grr(k)是(r(k)h是参考数据(r(k))的厄密矩阵)和

此外,作为λ值,可以使用根据系统确定的常数,或为了算法的稳定性,可以可变地使用λ值。例如,当以可变方式使用时,第k个λ值可以是λ(k)=α·(ef(k)/(1 ef(k))。此外,m(k)=(1-γ)·m(k-1) γ·d(k)、(α、β以及γ是常数)。

当获得第k 1参考数据(r(k 1))和语音数据(d(k 1))时,处理器130和330使用更新后的新噪声路径估计滤波器h(k)从下一参考数据生成噪声数据y(k 1),并且使用所生成的噪声数据y(k 1)从语音数据d(k 1)去除噪声。

同时,更新噪声路径估计滤波器h的方法不限于上文所描述的示例。例如,在上文所描述的示例中,每当获得包括噪声的语音数据和参考数据时执行更新,但是它也可以被实现为使得在获得包括预定数量的噪声的语音数据和参考数据时执行更新。在这种情况下,可以一起使用包括预定数量的噪声的语音数据和参考数据来执行更新。

在图6和图7中,图示并描述了处理器130和330在对包括噪声的语音数据d执行预处理之后更新噪声路径估计滤波器,但是它也可以被实现为使得首先可以更新噪声路径估计滤波器,此后可以对包括噪声的语音数据d执行预处理。

图8到图10是图示了根据第二实施例的噪声去除方法的图。

图8是图示了根据第二实施例的噪声去除方法的简单框图。

参考图8,可以看出,使用参考数据r、去除噪声的语音数据e以及噪声估计算法来生成噪声数据y,并且使用所生成的噪声数据y来去除语音数据d的噪声。

此处,参考数据r可以是通过第二家用电器200的麦克风210获得的第二语音数据和使用从控制命令辨识的驱动频率生成的参考数据、或第二家用电器200的加速度计250的加速度信息中的至少一个。

语音数据d可以与从第一家用电器100的麦克风110获得的第一语音数据对应。

处理器130和330可以使用噪声估计算法中所包括的噪声路径估计滤波器信息从参考数据r提取噪声数据y,该噪声数据y是与噪声源的噪声对应的声音数据。此处,噪声估计滤波器的配置与图7的配置相同,因此将省略对其的赘述。

处理器130和330可以通过使用所生成的噪声数据y去除与语音数据d中所包括的噪声源的噪声对应的分量来对语音数据d执行预处理。

服务器300的处理器330可以执行预处理以将去除噪声的语音数据e发送到第一家用电器100。此外,第一家用电器100的处理器130可以通过执行预处理使用去除噪声的语音数据e来执行语音识别。

图8的第二实施例与图6的第一实施例之间的差异在于更新噪声路径估计滤波器的方法。具体地,在第二实施例中,处理器130和330可以更新使用去除噪声的语音数据而非包括噪声的语音数据来生成噪声数据的方法。下文将参考图9和图10对其细节进行描述。

图9是图示了根据第二实施例的去除时域中的噪声的方法的框图。

参考图9,可以辨识使用时域中的噪声路径估计滤波器(其为fir滤波器)和利用去除噪声的语音数据执行更新的噪声估计算法。

处理器130和330可以通过将参考数据r应用于时域中的噪声路径估计滤波器h来获得噪声数据y(y=h*r)。此外,处理器130和330可以通过使用噪声数据y去除语音数据d的噪声来获得去除噪声的语音数据e。

同时,处理器130和330可以使用去除噪声的语音数据e来更新噪声路径估计滤波器h。具体地,在执行预处理之后,处理器130和330可以使用去除噪声的语音数据e与参考数据r之间的相关性来更新噪声路径估计滤波器h。

例如,可以假设第k-1噪声路径估计滤波器是h(k-1),第k去除噪声的语音数据是e(k),并且第k参考数据是r(k)。在这种情况下,可以将第k参考数据r(k)存储到缓冲器r(k),其长度与噪声路径估计滤波器h(k-1)的长度一样多,并且可以使用缓冲器r(k)和第k去除噪声的语音数据e(k)来生成新噪声路径估计滤波器h(k)(h(k)=h(k-1) μ·e(k)·r(k))。

此处,作为μ,可以使用根据系统确定的常数,或为了算法的稳定性,可以可变地使用μ。例如,当以可变方式使用时,μ可以是μ(k)=α/p(k)。此外,p(k)=(1-γ)·p(k-1) γ·r(k)t·r(k)(α和γ是常数)。

当处理器130和330获得下一个参考数据r'和语音数据d'时,处理器130和330使用更新后的新噪声路径估计滤波器h'从下一个参考数据生成噪声数据y'并且使用噪声数据y'去除语音数据d'的噪声,因此获得去除噪声的语音数据e'。

同时,更新时域中的噪声路径估计滤波器h的方法不限于上文所描述的示例。例如,在上文所描述的示例中,每当获得去除噪声的语音数据和参考数据时执行更新,但是它也可以被实现为使得在获得从其去除了预定数量的噪声的语音数据和参考数据时执行更新。在这种情况下,可以一起使用从其去除了预定数量的噪声的语音数据和参考数据来执行更新。

同时,噪声路径估计滤波器h可以是以针对频域中的每个频带的预定传递函数的形式实现的滤波器,而非时域中的fir滤波器,并且可以使用去除噪声的语音信号e来更新噪声路径估计滤波器h。稍后将参考图10对其细节进行描述。

图10是图示了根据第二实施例的去除频域中的噪声的方法的框图。

参考图10,可以辨识使用频域中的噪声路径估计滤波器和利用去除噪声的语音数据执行更新的噪声估计算法。

处理器130和330可以使用fft将参考数据r转换到频域中。处理器130和330可以通过将转换后的参考数据r应用于噪声路径估计滤波器h来获得转换到频域中的噪声数据y(y=r·h)。此外,处理器130和330可以使用ifft将噪声数据y转换到时域中。处理器130可以使用转换后的噪声数据y来去除语音数据d的噪声。

同时,处理器130和330可以使用去除噪声的语音数据e更新频域中的噪声路径估计滤波器h。具体地,处理器130和330可以使用通过fft从语音数据e转换到频域中的语音数据e与转换后的参考数据r之间的相关性来更新噪声路径估计滤波器h。

例如,可以假设第k-1噪声路径估计滤波器是h(k-1),第k转换后的去除噪声的语音数据是e(k),并且转换到频域中的第k参考数据是r(k)。此处,可以通过将下述分量添加到第k-1噪声路径估计滤波器h(k-1)来生成新噪声路径估计滤波器h(k)(h(k)=h(k-1) μ·r(k)h·e(k)):该分量通过将转换到频域中的第k参考数据r(k)的厄密矩阵与第k去除噪声的语音数据e(k)相乘而获得。

此处,作为μ,可以使用根据系统确定的常数,或为了算法的稳定性,可以可变地使用μ。例如,在以可变方式使用μ的情况下,第k个μ可以是μ(k)=α·(ef(k)/(1 ef(k))。此外,可以实现m(k)=(1-γ)·m(k-1) γ·d(k)、(α、β以及γ是常数)。

当获得下一个参考数据r(k 1)和语音数据d(k 1)时,处理器130和330可以使用更新后的新噪声路径估计滤波器h(k)从下一个参考数据生成噪声数据y(k 1),并且可以使用所生成的噪声数据y(k 1)从语音数据d(k 1)中去除噪声。

同时,更新噪声路径估计滤波器h的方法不限于上文所描述的示例。例如,在上文所描述的示例中,每当获得去除噪声的语音数据和参考数据时执行更新,但是也可以在获得去除预定数量的噪声的语音数据和参考数据时执行更新。在这种情况下,可以一起使用去除预定数量的噪声的语音数据和参考数据来执行更新。

此外,在图8到图10中,图示并描述了处理器130和330在对包括噪声的语音数据d执行预处理之后更新噪声路径估计滤波器,但是它也可以被实现为使得首先更新噪声路径估计滤波器并且对包括噪声的语音数据d执行预处理。

图11到图13是图示了根据第三实施例的噪声去除方法的图。

可以将关于噪声路径估计滤波器的信息预先存储在第一家用电器100或服务器300中,并且使用该信息来生成如上文所描述的噪声数据。然而,噪声路径估计滤波器可以不在第一家用电器100的制造阶段预先存储,而可以在第一家用电器100安装在家中之后通过人工智能模型生成。可替选地,服务器300可以生成适合于通过人工智能模型连接的家用电器的噪声路径估计滤波器。

此外,第一家用电器100或服务器300可以使用所生成的噪声路径估计滤波器来执行噪声去除。

在以下描述中,假设第一家用电器100从包括人工智能模型的外部设备400获得噪声路径估计滤波器。

图11是图示了由第一家用电器100获得噪声路径估计滤波器的方法的序列图。

参考图11,首先,第一家用电器100可以在不存在用户的言语的时间获得语音数据和参考数据(s1110)。具体地,为了生成噪声路径估计滤波器,需要语音数据和其中不存在用户的说出的语音且仅检测到噪声源的噪声的参考数据。因此,当将被确定为不具有用户的言语的语音数据确定为执行语音识别的结果时,可以检查在与对应语音数据的时间点相同的时间点获得的参考数据。

在操作s1120中,第一家用电器100可以将所获得的语音数据和参考数据发送到外部设备400。具体地,第一家用电器100可以将所获得的语音数据和参考数据作为时域中的信号进行发送,或将其转换到频域中并将其发送到外部设备400。

同时,当第一家用电器100在不存在用户的言语的时间仅具有语音数据时,外部设备400或第一家用电器100可以在对应时间从第二家用电器200请求参考数据并且获得参考数据。

此外,第二家用电器200的噪声源的噪声可以根据第二家用电器200的操作模式或环境的改变而不同。因此,需要生成适用于每种情况的噪声路径估计滤波器。为此,当将信息发送到外部设备400时,第一家用电器100可以一起发送关于第二家用电器200的操作模式的信息或关于周围环境的信息。

例如,当第二家用电器200是洗衣机时,洗衣机中所包括的电机的旋转速度可以根据操作模式而变化。因此,噪声源(电机)的噪声的幅度或特性可以根据操作模式而变化。

因此,关于第二家用电器200的每种操作模式的信息以及第二家用电器200在每种操作模式下操作时获得的语音数据和参考数据可以一起发送,使得外部设备400可以生成可适用于每种操作模式的噪声路径估计滤波器。

外部设备400可以使用接收到的语音数据和参考数据来计算噪声路径估计滤波器(s1130)。具体地,外部设备400可以使用人工智能模型来获得噪声路径估计滤波器,该人工智能模型接收语音数据和参考数据并且输出与其对应的噪声路径估计滤波器。人工智能模型可以是线性回归模型。

外部设备400可以将计算出的噪声路径估计滤波器信息发送到第一家用电器100(s1140)。同时,当第二家用电器200以获得第二语音数据并且使用所获得的第二语音数据生成噪声数据的方式来实现时,可以将噪声路径估计滤波器发送到第二家用电器200。

第一家用电器100可以存储接收到的噪声路径估计滤波器的信息(s1150)。

此外,第一家用电器100可以使用所获得的参考数据和噪声路径估计滤波器信息来生成噪声数据,并且使用所生成的噪声数据来去除包括用户的说出的语音的语音数据的噪声。第一家用电器100可以使用去除噪声的语音数据来执行语音识别功能。

同时,在图11中,图示并描述了外部设备是除了语音识别系统之外的设备,但其可以被实现为语音识别系统中的服务器。

此外,在图11中,图示并描述了将语音数据和参考数据发送到外部设备并且从外部设备接收由人工智能模式生成的噪声路径估计滤波器,但是在实现时,第一家用电器可以使用先前存储的人工智能模型来生成噪声路径估计滤波器。

可替选地,家用电器中与处理器区分开的单独设备可以使用预先存储的人工智能模型来生成噪声路径估计滤波器,并且处理器可以使用所生成的噪声路径估计滤波器。同时,生成噪声路径估计滤波器的方法不限于上文所描述的示例。

在下文中,将描述使用噪声路径估计滤波器(使用人工智能模型来生成)去除噪声的具体操作。

图12是图示了根据第三实施例的去除时域中的噪声的方法的框图。

参考图12,可以辨识使用时域中的噪声路径估计滤波器h的噪声去除方法。

第一家用电器100的处理器130可以使用从外部设备400接收到的噪声路径估计滤波器h来去除噪声。可替选地,当服务器300使用人工智能模型来生成噪声路径估计滤波器时,服务器300的处理器330可以使用所生成的噪声路径估计滤波器h来执行噪声去除。

具体地,处理器130和330可以通过将参考数据r应用于噪声路径估计滤波器h来获得噪声数据y(y=h*r)。此外,处理器130和330可以通过使用噪声数据y去除语音数据d的噪声来获得去除噪声的语音数据e。

图13是图示了根据第三实施例的去除频域中的噪声的方法的框图。

参考图13,可以辨识使用频域中的噪声路径估计滤波器h的噪声去除方法。

处理器130和330可以使用fft将参考数据r转换到频域中。处理器130和330可以通过将转换后的参考数据r应用于噪声路径估计滤波器h来获得转换到频域中的噪声数据y(y=r·h)。

此外,处理器130和330可以使用噪声数据y去除通过fft进行的转换后的语音数据d的噪声。此外,处理器130和330可以通过使用ifft将去除噪声的语音数据e转换到时域中来获得去除噪声的语音数据e。

在图12和图13中,图示并描述了未对噪声路径估计滤波器执行更新,但是在实现时,可以根据上文所描述的更新方法对噪声路径估计滤波器执行更新。

图14到图16是图示了在没有服务器的干预的情况下执行的语音识别方法的序列图。

图14是图示了根据本公开的第一实施例的在没有服务器的干预的情况下执行的语音识别方法的序列图。

参考图14,首先,第一家用电器100可以将录音请求信号发送到第二家用电器200(s1410)。在这种情况下,录音请求信号可以包括关于预定时间的信息和关于预定时间长度的信息。

第一家用电器100可以获得与录音请求信号对应的第一语音数据(s1420)。具体地,第一家用电器100可以基于录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第一语音数据。

第二家用电器200可以获得与录音请求信号对应的第二语音数据(s1425)。具体地,第二家用电器200可以基于录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第二语音数据。

第二家用电器200可以将所获得的第二语音数据发送到第一家用电器100(s1430)。

第一家用电器100可以使用接收到的第二语音数据来生成噪声数据(s1440)。具体地,第一家用电器100可以通过将接收到的第二语音数据应用于噪声路径估计滤波器来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

第一家用电器100可以使用噪声数据对第一语音数据执行预处理(s1450)。

第一家用电器100可以更新噪声路径估计滤波器(s1460)。具体地,第一家用电器100可以使用第二语音数据和第一语音数据来更新噪声路径估计滤波器,或可以使用第二语音数据和经预处理的第一语音数据来更新噪声路径估计滤波器。同时,上文已经描述了更新噪声路径估计滤波器的方法,因此将省略对其的赘述。

第一家用电器100可以使用经预处理的第一语音数据来执行语音识别(s1470)。

图15是图示了根据本公开的第二实施例的在没有服务器的干预的情况下执行的语音识别方法的序列图。

参考图15,首先,第一家用电器100可以将录音请求信号发送到第二家用电器200(s1510)。

第一家用电器100可以获得与录音请求信号对应的第一语音数据(s1520)。

第二家用电器200可以获得与录音请求信号对应的第二语音数据(s1525)。

第二家用电器200可以将所获得的第二语音数据发送到第一家用电器100(s1530)。

第一家用电器100可以在对第一语音数据执行预处理之前更新噪声路径估计滤波器(s1540)。

例如,如图7中所示,当通过grr(其为参考数据的自相关值)和gdr(其为参考数据与语音数据的互相关值)来确定噪声路径估计滤波器(h(k)=grr(k)·gdr(k)(-1))时,可以通过更新grr和gdr来更新噪声路径估计滤波器。

作为另一示例,如图9中所示出,当通过参考数据r和去除噪声的语音数据的缓冲器来确定噪声路径估计滤波器(h(k)=h(k-1) μ(k)·e(k)·r(k)、e(k)=h(k-1)*d(k)、μ(k)=α/p(k)、p(k)=(1-γ)·p(k-1) γ·r(k)τ·r(k))时,可以通过更新缓冲器的参考数据r和p(k)来更新噪声路径估计滤波器。

在另一示例中,如图10中所示出,当通过参考数据和去除噪声的语音数据的厄密矩阵来确定噪声路径估计滤波器(h(k)=h(k-1) μ·r(k)h·e(k),e(k)=d(k)-r(k)·h(k-1))时,可以通过更新参考数据的厄密矩阵来更新噪声路径估计滤波器。

第一家用电器100可以使用接收到的第二语音数据来生成噪声数据(s1550)。具体地,第一家用电器100可以通过将接收到的第二语音数据应用于更新后的噪声路径估计滤波器来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

第一家用电器100可以使用噪声数据对第一语音数据执行预处理(s1560)。

第一家用电器100可以使用经预处理的第一语音数据来执行语音识别(s1570)。

图16是图示了根据本公开的第三实施例的在没有服务器的干预的情况下执行的语音识别方法的序列图。

参考图16,首先,第一家用电器100可以将录音请求信号发送到第二家用电器200(s1610)。

在操作s1620中,第一家用电器100可以获得与录音请求信号对应的第一语音数据。具体地,第一家用电器100可以基于录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第一语音数据。

第二家用电器200可以获得与录音请求信号对应的第二语音数据(s1625)。

第二家用电器200可以使用第二语音数据来生成噪声数据(s1630)。具体地,第二家用电器200可以通过将第二语音数据应用于噪声路径估计滤波器来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。噪声路径估计滤波器可以是预先存储在第二家用电器200中或由服务器300、或外部设备400的人工智能模型生成并发送到第二家用电器200的滤波器。

第二家用电器200可以将所生成的噪声数据发送到第一家用电器100(s1640)。

第一家用电器100可以使用接收到的噪声数据对第一语音数据执行预处理(s1650)。

第一家用电器100可以使用经预处理的第一语音数据来执行语音识别(s1660)。

如上文所描述,第一家用电器100可以在没有服务器的干预的情况下以各种方式使用关于在另一家用电器中产生的噪声的信息来估计噪声,并且降低估计的噪声。

图17和图18是图示了根据服务器的干预执行的语音识别方法的序列图。

图17是图示了根据本公开的第一实施例的根据服务器的干预执行的语音识别方法的序列图。

参考图17,首先,服务器300可以将录音请求信号发送到第一家用电器100(s1710)。服务器300可以将录音请求信号发送到第二家用电器200(s1715)。在这种情况下,录音请求信号可以包括关于预定时间的信息和关于预定时间长度的信息。

第一家用电器100可以获得与录音请求信号对应的第一语音数据(s1720)。具体地,第一家用电器100可以基于录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第一语音数据。

第二家用电器200可以获得与录音请求信号对应的第二语音数据(s1725)。具体地,第二家用电器200可以基于录音请求信号中所包括的预定时间信息和预定时间长度信息来获得第二语音数据。

第一家用电器100可以将所获得的第一语音数据发送到服务器300(s1730)。第二家用电器200可以将所获得的第二语音数据发送到服务器300(s1735)。

服务器300可以使用接收到的第二语音数据来生成噪声数据(s1740)。具体地,服务器300可以通过将接收到的第二语音数据应用于噪声路径估计滤波器来生成噪声数据,该噪声数据是与第二家用电器200中的噪声源的纯噪声对应的声音数据。

服务器300可以使用噪声数据对第一语音数据执行预处理(s1750)。服务器300可以将经预处理的第一语音数据发送到第一家用电器100(s1760)。

服务器300可以更新噪声路径估计滤波器(s1770)。具体地,服务器300可以使用第二语音数据和第一语音数据来更新噪声路径估计滤波器,或使用第二语音数据和经预处理的第一语音数据来更新噪声路径估计滤波器。同时,上文已经描述了更新噪声路径估计滤波器的方法,因此将省略对其的赘述。

第一家用电器100可以使用经预处理的第一语音数据来执行语音识别(s1780)。

图18是图示了根据本公开的第二实施例的在服务器的干预下执行的语音识别方法的序列图。

参考图18,首先,服务器300可以将录音请求信号发送到第一家用电器100(s1810)。服务器300可以将录音请求信号发送到第二家用电器200(s1815)。

第一家用电器100可以获得与录音请求信号对应的第一语音数据(s1820)。第二家用电器200可以基于录音请求信号来获得第二语音数据(s1825)。

第一家用电器100可以将所获得的第一语音数据发送到服务器300(s1830)。第二家用电器200可以将所获得的第二语音数据发送到服务器300(s1835)。

服务器300可以在对第一语音数据执行预处理之前更新噪声路径估计滤波器(s1840)。上文已经参考图15描述了在执行预处理之前更新噪声路径估计滤波器的操作,因此将省略对其的赘述。

服务器300可以使用接收到的第二语音数据来生成噪声数据(s1850)。具体地,服务器300可以通过将接收到的第二语音数据应用于更新后的噪声路径估计滤波器来生成噪声数据,该噪声数据与第二家用电器200中的噪声源的纯噪声对应。

服务器300可以使用噪声数据对第一语音数据执行预处理(s1860)。服务器300可以将经预处理的第一语音数据发送到第一家用电器100(s1870)。

第一家用电器100可以使用经预处理的第一语音数据来执行语音识别(s1880)。

如上文所描述,服务器可以以各种方式使用关于在第二家用电器中产生的噪声的信息来估计噪声并且从第一家用电器的语音数据中降低估计的噪声。

在图17和图18中,图示并描述了服务器300连接到两个家用电器,但是在实现时,服务器可以连接到两个或更多个家用电器并且使用关于在两个或更多个家用电器中产生的噪声的信息来估计噪声。

图19是图示了根据本公开的实施例的第一家用电器的语音识别方法的流程图。

参考图19,首先,通过第一家用电器的麦克风获得第一语音数据(s1910)。

此外,可以检测可以连接到第一家用电器的其它家用电器。具体地,可以检测可以通过短距离无线通信连接到第一家用电器的第二家用电器或连接到第一家用电器所连接的接入点ap的第二家用电器。

第一家用电器可以从第二家用电器请求发送语音数据。具体地,可以将用于请求生成和发送第二语音数据的录音请求信号发送到第二家用电器,该第二语音数据是关于在第二家用电器中产生的噪声的语音数据。

此处,录音请求信号可以包括关于预定时间的信息或关于预定时间长度的信息。同时,可以被包括在录音请求信号中的信息不限于上文所描述的示例。

从第二家用电器接收第二语音数据(s1920)。具体地,可以从第二家用电器接收基于录音请求信号中所包括的预定时间信息和预定时间长度信息生成的第二语音数据。

可以基于发送到第二家用电器的请求来获得第一语音数据。具体地,可以基于发送到第二家用电器的录音请求信号中所包括的预定时间信息和预定时间长度信息通过第一家用电器的麦克风获得第一语音数据。

使用接收到的第二语音数据来生成噪声数据(s1930)。此处,噪声数据是指与噪声源的噪声对应的声音数据。

可以通过从第二语音数据仅提取与噪声源的噪声对应的分量或对除了与噪声源的噪声对应的分量之外的剩余分量进行滤波来获得噪声数据。

可以通过使用时域中的有限脉冲响应(fir)滤波器或无限脉冲响应(iir)滤波器中的至少一个对除了与第二语音数据中所包括的噪声源对应的分量之外的剩余分量进行滤波来生成噪声数据。

可替选地,噪声数据可以使用针对频域上的每个频带预先确定的传递函数从第二语音数据提取与噪声源的噪声对应的分量。

关于上文所描述的滤波器或传递函数的信息可以在制造阶段预先存储在家用电器中并且用于生成噪声数据,但不限于此。

例如,当与外部设备的通信是可能的时,可以通过与外部设备的通信接收关于滤波器或传递函数的信息,并且可以使用关于接收到的滤波器或传递函数的信息来生成噪声数据。

在这种情况下,从外部设备接收到的关于滤波器或传递函数的信息可以是使用外部设备中所包括的人工智能模型获得的信息。

使用所生成的噪声数据对第一语音数据执行信号处理(s1940)。具体地,可以使用噪声数据来执行用于去除与第一语音数据中所包括的噪声源的噪声对应的分量的信号处理。

同时,第二家用电器的噪声源可以是设置在第二家用电器的壳体中以执行第二家用电器的预定功能的电机。在这种情况下,第二语音数据可以是从第二家用电器的麦克风获得的语音数据。噪声数据可以是第二家用电器的电机的电机噪声数据,并且可以通过从第一语音数据去除电机噪声来执行对第一语音数据的预处理。

可以根据在第二家用电器中是否产生了噪声来改变用于第一语音数据的信号处理方法。

例如,假设在第二家用电器中产生的声音是由第二家用电器中所包括的电机产生的。在这种情况下,可以取决于第二家用电器的电机是否被驱动来改变关于第一语音数据的预处理方法。

具体地,可以确定第二家用电器的电机是否被驱动。如果第二家用电器的电机被驱动,则在第二家用电器中产生的噪声的幅度是大的,因此,可以根据上文所描述的方法使用第二语音数据来执行对第一语音数据的预处理。

同时,当第二家用电器的电机未被驱动时,不存在第二家用电器自身中产生的噪声,因此可以使用第一语音数据,而不使用第二语音数据,直接执行语音识别,或可以根据相关技术方法对第一语音数据执行预处理。

同时,即使在第二家用电器的噪声源是风扇等而非电机时,也可以根据噪声源是否被驱动来改变对第一语音数据的预处理的方法。

使用经信号处理的第一语音数据来执行语音识别(s1950)。

此外,即使在噪声源的噪声改变或周围环境改变时,也可以使用包括噪声的第一语音数据、经信号处理的第一语音数据、或第二语音数据中的至少一个来更新生成噪声数据的方法,以生成准确的噪声数据。

具体地,可以使用第一语音数据和经信号处理的第一语音数据中的至少一个与第二语音数据之间的相关性来更新生成噪声数据的方法。

同时,如上文所描述,可以在对第一语音数据执行信号处理之后执行更新生成噪声数据的方法的操作,但是可替选地,首先可以在对第一语音数据执行信号处理之前执行更新生成噪声数据的方法的操作。

因此,在本公开的家用电器的语音识别方法中,从产生大幅度的噪声的另一家用电器获得噪声的语音数据,并且使用语音数据对所获得的噪声执行预处理,由此即使从外部产生的噪声的幅度是大的,也可以准确地去除通过麦克风获得的语音数据中所包括的噪声。如图19中所示出的语音识别方法也可以在具有图2或图3的配置的家用电器上执行,或可以在具有另一配置的家用电器上执行。

此外,如上文所描述的语音识别方法可以由用于执行如上文所描述的语音识别方法的至少一个可执行程序来实现,并且可以将这种可执行程序存储在非暂时性可读介质中。

非暂时性可读介质是指半永久性地存储数据并且设备可读取的介质,而非在短时间内存储数据的介质,诸如寄存器、高速缓存、存储器等。具体地,可以在非暂时性可读介质(诸如cd、dvd、硬盘、蓝光光盘、usb、存储卡、rom等)中存储和提供各种应用或程序。

图20是图示了根据本公开的实施例的第二家用电器的语音识别方法的流程图。

参考图20,首先,可以接收语音数据请求信号(s2010)。具体地,可以从连接到第二家用电器的服务器或第一家用电器接收请求生成和发送第二语音数据的录音请求信号,该第二语音数据是在第二家用电器中产生的噪声的语音数据。

可以通过第二家用电器的麦克风获得第二语音数据(s2020)。具体地,可以使用第二家用电器的麦克风来检测噪声,并且可以基于接收到的录音请求信号来获得第二语音数据。更具体地,可以基于在接收到的录音请求信号中所包括的关于预定时间的信息和预定时间长度信息来获得第二语音数据。

可以发送所获得的第二语音数据(s2030)。具体地,可以将所获得的第二语音数据发送到连接到第二家用电器的服务器或第一家用电器。

同时,可以不将第二语音数据发送到连接到第二家用电器的服务器或第一家用电器,并且可以使用第二语音数据来生成噪声数据并且可以将所生成的噪声数据发送到第一家用电器或服务器。

因此,在根据本公开的家用电器的语音识别方法中,因为生成了关于内部噪声源的噪声的参考数据并且将其提供给将要执行语音识别功能的家用电器或服务器,家用电器或服务器可以准确地去除包括用户的言语的语音数据中所包括的噪声。如图20中所示出的语音识别方法也可以在具有图4的配置的家用电器上执行,或可以在具有另一配置的家用电器上执行。

此外,如上文所描述的语音识别方法可以由用于执行如上文所描述的语音识别方法的至少一个可执行程序来实现,并且可以将这种可执行程序存储在非暂时性可读介质中。

图21是图示了根据本公开的实施例的服务器的语音识别方法的流程图。

参考图21,首先,可以从第一家用电器和第二家用电器请求语音数据(s2110)。具体地,可以将用于请求生成和发送语音数据的录音请求信号发送到第一家用电器和第二家用电器。

此外,录音请求信号可以包括关于预定时间的信息和关于预定时间长度的信息。录音请求信号中所包括的信息不限于上文所描述的示例。

可以接收第一语音数据和第二语音数据(s2120)。具体地,可以从第一家用电器接收基于录音请求信号而获得的第一语音数据。可以从第二家用电器接收基于录音请求信号而获得的第二语音数据。

可以使用第二语音数据来生成噪声数据(s2130)。此处,噪声数据是指与第二家用电器中的噪声源的纯噪声对应的声音数据。

同时,上文已经描述了生成噪声数据的方法,因此将省略对其的赘述。

可以使用噪声数据对第一语音数据执行信号处理(s2140)。具体地,可以使用噪声数据执行用于去除与第一语音数据中所包括的噪声源的噪声对应的分量的信号处理。

可以将经信号处理的第一语音数据发送到第一家用电器(s2150)。

因此,在本公开的服务器的语音识别方法中,从将执行语音识别功能的第一家用电器接收第一语音数据,从产生大幅度的噪声的第二家用电器获得关于噪声的第二语音数据或参考数据,并且使用所获得的第二语音数据或参考数据对第一语音数据执行预处理,使得即使噪声的幅度是大的,也可以准确地去除语音数据中所包括的噪声。如图21中所示出的语音识别方法也可以在具有图5的配置的服务器上执行,或可以在具有另一配置的服务器上执行。

此外,如上文所描述的语音识别方法可以利用用于执行如上文所描述的语音识别方法的至少一个可执行程序来实现,并且可以将这种可执行程序存储在非暂时性可读介质中。

虽然已经参考附图描述了本公开,但应理解,本公开的范围由在下文中所描述的权利要求书限定并且不应被解释为限制于上文所描述的实施例和/或图。应清楚地理解,对本领域的技术人员而言明显的改进、改变以及修改也在如权利要求书中所限定的本公开的范围内。

尽管已经用各种实施例描述了本公开,但是本领域的技术人员可以提出各种改变和修改。旨在本公开涵盖落入所附权利要求书的范围内的此类改变和修改。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜