控制装置及音频处理方法与流程

2022-06-08 08:51:41 来源：中国专利 TAG：

1.本技术涉及音频处理技术领域，具体而言，尤其涉及一种控制装置及音频处理方法。

背景技术：

2.伴随着人工智能技术的发展,交互模式也在不断的发生着变化,从简单的交互到多种交互模式共同发展，其中，语音交互功能所起的作用越来越明显，例如，在显示设备场景中，用户可以通过向遥控器输入语音指令(如“播放电视剧aaa”)，遥控器将语音指令传输至显示设备，显示设备响应用户输入的语音指令，进而播放用户想要观看的电视剧。
3.电子设备上通常会安装的多个应用程序，且大部分应用程序支持语音交互功能，目前，电子设备中的多个应用程序使用语音交互功能时通常建立互斥的通信机制，新的使用方需要使用时需要通知在用方关闭语音拾取功能，停止语音交互，在用方关闭完成后，再次通知新的使用方可以使用语音拾取功能开始语音交互，新的使用方再打开语音拾取功能。
4.采用上述方式，多个使用方采用互斥通信机制时，一组互斥机制的实现耗费时间较长，严重影响用户使用语音交互功能的体验。

技术实现要素：

5.为了解决上述技术问题，本技术提供了一种控制装置及音频处理方法。
6.第一方面，本技术提供了一种控制装置，包括：多个音频采集单元、第一控制器，所述多个音频采集单元与所述第一控制器电连接；
7.所述第一控制器，被配置为：在所述控制装置为唤醒状态时，分别向所述多个音频采集单元发送第一时钟信号，并获取所述多个音频采集单元根据所述第一时钟信号分别采集的单声道音频信号；
8.将所述多个音频采集单元分别采集单声道音频信号转换为多声道音频信号，以使所述控制装置中安装的目标应用程序从所述多声道音频信号中获取相应声道的音频信号。
9.作为一种可能的实施方式，所述第一控制器具体被配置为：
10.按照所述多个音频采集单元与声道位置之间的对应关系，将所述多个音频采集单元分别采集的单声道音频信号以及与所述多个音频采集单元分别对应的回采信号进行合并，获得所述多声道音频信号。
11.作为一种可能的实施方式，所述控制装置还包括第二控制器，所述第二控制器与所述多个音频采集单元电连接；
12.所述第二控制器被配置为：在所述控制装置为休眠状态时，向所述多个音频采集单元分别发送第二时钟信号，控制所述多个音频采集单元分别根据所述第二时钟信号采集单声道音频信号；
13.且检测所述多个音频采集单元分别采集的单声道音频信号是否包括预设语音唤
醒内容。
14.作为一种可能的实施方式，所述第二控制器还被配置为：
15.在根据所述多个音频采集单元分别采集的单声道音频信号检测到所述预设语音唤醒内容时，向所述第一控制器发送唤醒指令，以唤醒所述第一控制器。
16.作为一种可能的实施方式，所述第一控制器，具体被配置为：
17.根据所述唤醒指令，控制所述控制装置由休眠状态切换为唤醒状态；
18.在所述控制装置切换为唤醒状态后，切断所述第二控制器的电源，且分别向所述多个音频采集单元发送第一时钟信号。
19.作为一种可能的实施方式，若所述目标应用程序为远场语音服务，则所述目标应用程序循环获取所述多声道音频信号中的各所述音频采集单元对应的信号以进行唤醒词检测；
20.若所述目标应用程序为近场语音服务，则所述目标应用程序对所述多声道音频信号进行声道分离，提取目标声道的音频信号，且根据所述目标声道的音频信号识别获得语音指令，并响应所述语音指令。
21.作为一种可能的实施方式，所述多声道音频信号为脉冲编码调制pcm格式的音频信号。
22.第二方面，本技术提供了一种音频处理方法，应用于第一方面任一项所述的控制装置，所述控制装置包括多个音频采集单元；所述方法包括：
23.向多个音频采集单元分别发送第一时钟信号；
24.获取所述多个音频采集单元分别根据所述第一时钟信号采集的单声道音频信号；
25.将所述多个音频采集单元分别采集的单声道音频信号转换为多声道音频信号，以使所述控制装置上安装的目标应用程序从所述多声道音频信号中获取相应声道的音频信号。
26.作为一种可能的实施方式，所述将所述多个音频采集单元分别采集的单声道音频信号转换为多声道音频信号，包括：
27.按照所述多个音频采集单元与声道位置之间的对应关系，将所述多个音频采集单元分别采集的单声道音频信号以及与所述多个音频采集单元分别对应的回采信号进行合并，获得所述多声道音频信号。
28.第三方面，本技术提供一种可读存储介质，包括：计算机程序指令；
29.当电子设备的至少一个处理器执行所述计算机程序指令，使得所述电子设备实现如第二方面所示的人眼保护控制方法。
30.第四方面，本技术提供一种计算机程序产品，当所述计算机程序产品被电子设备执行时，使得所述电子设备实现如第二方面所示的音频处理方法。
31.第五方面，本技术提供一种电子设备，包括：存储器和处理器；
32.所述存储器被配置为存储计算机程序指令；
33.所述处理器被配置为执行所述计算机程序指令，使得所述电子设备实现如第二方面所示的音频处理方法。
34.第六方面，本技术还提供一种芯片系统，其中，芯片系统包括：处理器；当处理器执行存储器中存储的计算机程序指令时，电子设备执行第二方面所示的音频处理方法。
35.本技术实施例提供一种控制装置及音频处理方法，其中，通过在控制装置中设置多个音频采集单元，且将多个音频采集单元分别采集的音频信号合并为多声道音频信号，将多声道音频信号作为共享音频信号提供给控制装置中的有语音拾取需求的应用程序，使得有语音需求的各应用程序从共享音频信号中提取所需声道的音频信号，从而解决了采用互斥通信机制进行语音交互服务时，耗时较长，用户体验较差的问题。
附图说明
36.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。
37.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
38.图1为根据本技术一个或多个实施例的显示设备与控制装置之间操作场景的示意图；
39.图2为根据本技术一个或多个实施例的控制装置100的硬件配置框图；
40.图3为根据本技术一个或多个实施例的控制装置100的软件配置框图；
41.图4为根据本技术一个或多个实施例进行音频处理的系统框架图；
42.图5为在图4所示实施例的基础上进行音频处理的流程示意图；
43.图6a和图6b分别为根据本技术一个或多个实施例进行音频处理的获得的多声道音频信号的数据结构示意图；
44.图7为根据本技术一个或多个实施例进行音频处理的系统框架图；
45.图8为在图7所示实施例的基础上进行音频处理的流程示意图。
具体实施方式
46.为使本技术的目的、实施方式和优点更加清楚，下面将结合本技术示例性实施例中的附图，对本技术示例性实施方式进行清楚、完整地描述，显然，所描述的示例性实施例仅是本技术一部分实施例，而不是全部的实施例。
47.基于本技术描述的示例性实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术所附权利要求保护的范围。此外，虽然本技术中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。需要说明的是，本技术中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本技术的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。
48.目前，多个应用程序采用互斥通信机制实现语音交互时，互斥机制的实现耗费时间较长，严重影响用户使用语音交互功能的体验，为了解决该问题，本技术提供一种音频数据共享的方案，支持多应用程序根据各自的语音拾取需求可同时采集音频数据，且相互之间不会产生干扰，从而解决了采用互斥通信机制导致的耗时问题，进而提升用户使用语音交互功能的体验。
49.图1为根据本技术一个或多个实施例的显示设备与控制装置之间操作场景的示意
图，如图1所示，用户可通过移动终端300和控制装置100操作显示设备200。控制装置100可以是遥控器，遥控器和显示设备的通信包括红外协议通信、蓝牙协议通信，无线或其他有线方式来控制显示设备200。用户可以通过遥控器上按键，语音输入、控制面板输入等输入用户指令，来控制显示设备200，或者，用户也可以通过输入唤醒指令，在唤醒语音交互功能之后，通过语音输入的方式输入用户指令，来控制显示设备200。在一些实施例中，也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制显示设备200，用户可以通过语音输入、触摸智能设备的显示屏幕的方式向智能设备输入用户指令，来控制显示设备200。
50.在一些实施例中，移动终端300可与显示设备200安装软件应用，通过网络通信协议实现连接通信，实现一对一控制操作的和数据通信的目的。也可以将移动终端300上显示音视频内容传输到显示设备200上，实现同步显示功能显示设备200还与服务器500通过多种通信方式进行数据通信。可允许显示设备200通过局域网(lan)、无线局域网(wlan)和其他网络进行通信连接。服务器500可以向显示设备200提供各种内容和互动。显示设备200，可以液晶显示器、oled显示器、投影显示设备。显示设备200除了提供广播接收电视功能之外，还可以附加提供计算机支持功能的智能网络电视功能。
51.图2示例性示出了根据示例性实施例中控制装置100的配置框图。如图2所示，控制装置100包括控制器110、通信接口130、用户输入/输出接口150、存储器、供电电源。控制装置100可接收用户的输入操作指令，且将操作指令转换为显示设备200可识别和响应的指令，起到用户与显示设备200之间交互中介作用，如前所述，用户输入的操作指令可以是通过语音的方式输入。通信接口130用于和外部通信，包含wifi芯片，蓝牙模块，nfc或可替代模块中的至少一种。
52.用户输入/输出接口150包含麦克风，触摸板，传感器，按键或可替代模块中的至少一种。其中，本技术提供的控制装置100包括多个麦克风，即控制装置100可以包括2个或者2个以上麦克风，多个麦克风均用于采集环境音以及多路回采信号，控制器110可将多个麦克风分别采集的环境音以及多路回采信号合并为多声道音频数据，控制装置中安装的多个应用程序可以同步从多声道音频数据中提取所需的音频数据。
53.图3为根据本技术一个或多个实施例的控制装置100的软件配置框图。如图3所示，将系统分为四层，从上至下分别为应用程序(applications)层(简称“应用层”)，应用程序框架(application framework)层(简称“框架层”)，安卓运行时(androidruntime)和系统库层(简称“系统运行库层”)，以及内核层。
54.内核层至少包含以下驱动中的至少一种：音频驱动、显示驱动、蓝牙驱动、摄像头驱动、wifi驱动、usb驱动、hdmi驱动、传感器驱动(如指纹传感器，温度传感器，压力传感器等)、以及电源驱动等。
55.应用层至少包含以下应用中的至少一种：远场语音服务、近场语音服务、以及遥控语音服务等等。其中，远场语音服务为无需用户按压控制装置上的按键，通过语音唤醒的方式进行语音交互的语音服务；近场语音为用户通过按压控制装置上的按键触发进行语音交互的语音服务；遥控语音服务为控制装置将用户输入的语音内容传输至显示设备，由显示设备针对语音内容进行音频处理的功能。
56.参照图3所示的控制装置的软件框架，若控制装置的操作系统为安卓(android)系
统时，控制装置可以采用android系统中的alsa(advanced linux sound architecture，高级linux声音架构)标准音频架构，为控制装置的应用层中包括的各有语音拾取需求的应用程序提供音频采集方案，则无需额外开发实现音频采集方案的应用软件。
57.需要说明的是，本技术提供的音频处理方法并不限于应用于图1和图3实施例所示出的场景，例如，还可以应用于能够提供语音服务的其他类型的设备，如具有语音功能的显示设备、智能手机、ipad、笔记本电脑等等。
58.在下述实施例中，以控制装置为例，并结合图1至图3所示实施例，举例介绍本技术提供的音频处理方法。
59.图4为根据本技术一个或多个实施例进行音频处理的系统框架图。本实施例中，以控制装置包括2个麦克风，分别为麦克风1和麦克风2，控制装置包括的第一控制器用于控制麦克风1和麦克风2分别采集环境音以及针对麦克风1和麦克风1传输的环境音进行合并等处理为例进行举例说明。
60.参照图4所示，麦克风1和麦克风2可以通过pdm接口与第一控制器电连接，第一控制器可以通过pdm接口向麦克风1和麦克风2传输时钟(clock)信号，麦克风1和麦克风2可以分别根据第一控制器发送的时钟信号的上升沿和下降沿采集环境音，麦克风1和麦克风2分别采集到的环境音均为单声道的音频信号。
61.第一控制器能够读取麦克风1和麦克风2采集的环境音以及获得两路回采信号，并将两个单声道的环境音以及两路回采信号合并为4声道音频信号。
62.其中，两路回采信号分别与麦克风1和麦克风2分别采集的环境音之间一一对应，回采信号可以用于回音消除处理，保证目标应用程序能够得到消除了噪音的音频数据，进而保证后续语音指令识别的准确性。
63.第一控制器在对两个单声道环境音以及两路回采信号进行合并时，可以预先设定各路信号与声道位置之间的对应关系，并按照预先设定的对应关系对各路信号进行合并。例如，前两个声道与两路回采信号对应，后两个声道与麦克风1和麦克风2分别采集的环境音对应；或者，前两个声道与麦克风1和麦克风2分别采集的环境音对应，后两个声道与两路回采信号对应；或者，前两个声道与麦克风1采集的环境音和麦克风1对应的回采信号对应，后两个声道与麦克风2采集的环境音和麦克风2对应的回采信号对应；需要说明的是，各路信号与声道位置之间的对应关系并不限于此示例。
64.第一控制器将多个单声道的音频信号以及回采信号进行合并，获得的多声道音频信号，即4声道音频信号，可传输至用户空间包括的指定的服务节点中。
65.作为一种可能的实施方式，可在控制装置的应用层中部署音频共享服务节点作为中间节点，音频共享服务节点即为前文提及的用户空间中的指定的服务节点，音频共享服务节点可以承载多声道音频信号用户空间中的各应用程序可以访问音频共享服务节点，从音频共享服务节点中获得所需的音频信号；此外，音频共享服务节点还可以基于具有语音拾取需求的目标应用程序对于音频信号的要求，执行对多声道音频信号进行声道分离、回声消除、增益控制等滤波降噪处理，保证目标应用程序能够得到音频质量较高的音频信号。
66.需要说明的是，采用音频共享服务节点的方式实现，音频共享服务节点可以理解为服务端(server)，目标应用程序则可以理解为客户端(client)，目标应用程序与音频共享服务节点之间可以通过进程间通信的方式实现音频信号的传输。当音频共享服务节点启
动后，可以检测应用程序的语音拾取需求，当检测到应用程序有语音拾取需求时，则通过第一控制器启动音频采集单元进行语音拾取，并将有语音拾取需求的应用程序的相关信息添加到激活应用列表中，并为该应用程序分配数据缓冲区，数据缓冲区用于针对应用程序缓存采集的音频信号，以回传给应用程序，使得应用程序根据音频信号进行唤醒内容检测、语音指令识别、语音指令响应等等。
67.需要说明的是，此处提及的有录制需求的应用程序的相关信息可以包括：应用程序的名称、采样率、声道、位深等等信息，可结合android录音实现(audiorecord)接口参数的需求确定有语音拾取需求的应用程序的相关信息。其中，位深可以理解为音频采集单元采集的音频信号所占用的比特位数量或者占用的字节长数量。采样率可以理解为音频采集单元采集音频信号的频率。
68.请继续参照图4所示，假设，控制装置的应用层中具有语音需求的服务包括远场语音服务以及近场语音服务，应用层中还可以包括其他语音服务，本公开对此不做限定；当远场语音服务有语音拾取需求，为远场语音服务分配数据缓冲区a，远场语音服务可以采用循环的方式从音频共享服务节点获得的音频信号中读取麦克风1和麦克风2分别采集的环境音，并将读取的数据复制到数据缓冲区a中，再基于数据缓冲区a中的数据，对麦克风1采集的环境音以及麦克风2采集的环境音分别进行唤醒内容检测，即检测麦克风1采集的环境音以及麦克风2采集的环境音中是否包括预设唤醒内容。当检测到唤醒内容，则远场语音服务可以进一步获取用户的语音指令，并响应用户的语音指令。
69.当近场语音服务有语音拾取需求，为近场语音服务分配数据缓冲区b，近场语音服务可以从音频共享服务节点获得的音频信号中读取所需麦克风对应的音频数据，并将读取的数据复制到数据缓冲区b，近场语音服务基于数据缓冲区b中的音频数据进行语音交互，例如，近场语音服务需要获取麦克风1采集的环境音，则近场语音服务可以从数据缓冲区b中获取第2个声道以及第4个声道的音频信号，进行回声消除、增益控制等等滤波降噪处理，之后，近场语音服务可以识别语音指令，并响应语音指令，如，近场语音服务可以将语音指令通过控制装置传输至显示设备，显示设备响应语音指令。
70.若控制装置中用户空间的其他应用程序有语音拾取需求，则可以按照类似的方式处理。
71.此外，还需要说明的是，若目标应用程序在通过alsa标准语音架构进行语音拾取的过程中发生异常，如，异常退出，共享音频服务节点可以基于异常信息，从激活应用列表中删除目标应用程序。
72.之后，控制装置可以采用其他音频采集方案实现语音交互。
73.图5为在图4所示实施例的基础上进行音频处理的流程示意图。参照图5所示，本实施例所示的方法包括：
74.s501、在唤醒状态时，第一控制器分别向多个音频采集单元发送第一时钟信号。
75.结合图4所示，多个音频采集单元可以通过pdm接口与第一控制器第一控制器电连接，则第一控制器可以通过pdm接口向多个音频采集单元分别发送第一时钟信号。
76.相应地，多个音频采集单元分别接受第一控制器发送的第一时钟信号。
77.此处提及的唤醒状态是指控制装置处于正常工作的状态，在控制装置为正常工作状态时，控制装置包括的第一控制器以及各音频采集单元均为正常工作状态。
78.第一时钟信号为第一控制器配置的用于控制多个音频采集单元采集环境音的控制信号。本技术对于第一时钟信号的周期、信号的占空比、信号电平等参数不做限定。例如，第一时钟信号可以采用50％占空比的方波信号，音频采集单元可以根据方波信号的上升沿和下降沿采集环境音。
79.假设，控制装置包括2个音频采集单元(麦克风)，则麦克风1可以根据第一时钟信号的上升沿采集环境音，麦克风2可以根据第一时钟信号的下降沿采集环境音，当然，也可以麦克风1根据第一时钟信号的下降沿采集环境音，麦克风2根据第一时钟信号的上升沿采集环境音。
80.若控制装置包括更多数量的音频采集单元，可将多个音频采集单元分为两组，则第一控制器分别向多个音频采集单元发送第一时钟信号，多个音频采集单元分别根据各自所属的音频采集单元组，确定是根据第一时钟信号的上升沿采集环境音或者根据下降沿采集环境音；例如控制装置包括4个音频采集单元，其中，音频采集单元1和音频采集单元2为一组，音频采集单元3和音频采集单元4为一组，音频采集单元1和音频采集单元2根据第一时钟信号的上升沿采集环境音，音频采集单元3和音频采集单元4根据第一时钟信号的下降沿采集环境音。
81.s502、多个音频采集单元分别将根据第一时钟信号采集的单声道音频信号发送至第一控制器。
82.相应地，第一控制器接收各音频采集单元分别采集的单声道音频信号。此处的单声道音频信号即为环境音。
83.s503、第一控制器将多个音频采集单元分别采集单声道音频信号转换为多声道音频信号。
84.第一控制器可以按照多个音频采集单元与声道位置之间的对应关系，将多个单声道音频信号以及每个音频采集单元对应的回采信号进行合并，获得多声道音频信号。本技术对于合并的实现方式不作限定。
85.假设，采样位深为16(即16位代表一个采样点)，即一个采样点占用2个字节，在进行声道合并时按照预先设定的顺序向采样点写入相应的音频信号即可。结合图4所示实施例，控制装置包括2个麦克风时，可将麦克风1采集的单声道音频信号1、麦克风2采集的单声道音频信号2、麦克风1对应的回采信号1以及麦克风2对应的回采信号2，按照前两路为回采信号，后两路为环境音的方式，进行合并，获得4声道音频信号。
86.示例性地，参照图6a所示，合并之后的4声道音频信号的数据格式可以为：aabbaabb，其中，aa代表麦克风1对应的一个采样点，两个字节；bb代表麦克风2对应的一个采样点，也占用两个字节；第1个采样点用于写入麦克风1对应的回采信号，第2个采样点用于写入麦克风2对应的回采信号，第3个采样点用于写入麦克风1对应的环境音，第4个采样点用于写入麦克风2对应的环境音；当一时刻对应的环境音以及回采信号写入完成之后，继续写入下一时刻的麦克风1对应的采样点和麦克风2对应的采样点，直至语音拾取结束。
87.在图6a所示实施例的基础上，第1个采样点也可以用于写入麦克风1对应的环境音，第2个采样点用于写入麦克风2对应的环境音，第3个采样点用于写入麦克风1对应的回采信号，第4个采样点用于写入麦克风2对应的回采信号。
88.又如，参照图6b所示实施例，合并之后的4声道音频信号的数据格式可以为：
aaaabbbb，其中，第1个采样点用于写入麦克风1对应的回采信号，第2个采样点用于写入麦克风1采集的环境音，第3个采样点用于写入麦克风2对应的回采信号，第4个采样点用于写入麦克风2对应的环境音；当一时刻对应的环境音以及回采信号写入完成之后，继续写入下一时刻的麦克风1对应的采样点和麦克风2对应的采样点，直至语音拾取结束。
89.在图6b所示实施例的基础上，第1个采样点也可以用于写入麦克风1对应的环境音，第2个采样点用于写入麦克风1对应的回采信号，第3个采样点用于写入麦克风2对应的环境音，第4个采样点用于写入麦克风2对应的回采信号。
90.按照上述任意方式进行合并获得4声道音频信号后，如果应用程序需要提取麦克风1的音频信号，只需要每4个字节提取前两个字节的数据即可获得麦克风1采集的环境音以及回采信号。
91.需要说明的是，也可以调整各麦克风对应的环境音和回采信号在合并之后的多声道音频信号中的位置，并不限于上述图6a以及图6b实施例所示的方式；此外，若控制装置包括更多麦克风，也可以按照类似的方式进行合并，例如，按照麦克风组的顺序，写入各麦克风分别采集的环境音和回采信号。
92.s504、目标应用程序从多声道音频信号中获取相应声道的音频信号。
93.目标应用程序可以包括控制装置的用户空间中的一个或者多个应用程序，如结合图4所示实施例，目标应用程序可以包括远场语音服务和/或近场语音服务。当然，目标应用程序还可以包括其他应用程序，例如，遥控语音功能，其中，遥控语音功能是指控制装置将采集到的音频数据传输至相连接的电子设备(如显示设备)的功能。
94.目标应用程序包括多个应用程序时，各应用程序可根据自身的需求从多声道音频信号中读取所需的声道对应的音频信号，如结合图4所示实施例，目标应用程序包括远场语音服务和近场语音服务，远场语音服务可循环从4声道音频信号中提取麦克风1对应的音频信号以及麦克风2对应的音频信号进行唤醒内容检测，近场服务可以从4声道音频信号中提取麦克风1对应的音频信号，识别音频信号中的语音指令。
95.需要说明的是，上述目标应用程序包括多个应用程序时，各应用程序从多声道音频信号中提取所需的音频信号可以同时执行，也可以按照触发应用程序的先后顺序执行。
96.作为一种可能的实现方式，控制装置可以将多声道音频信号存储至音频共享服务节点中，目标应用程序通过进程间通信的方式访问音频共享服务节点获取所需的声道对应的音频信号。
97.本实施例提供的方法，通过在控制装置中设置多个音频采集单元，且将多个音频采集单元分别采集的音频信号合并为多声道音频信号，作为共享音频信号提供给控制装置中的有录音需求的应用程序，使得有录音需求的各应用程序从共享音频信号中提取所需声道的音频信号，解决了采用互斥通信机制进行语音交互服务时，耗时较长，用户体验较差的问题。
98.由于语音交互功能是由控制装置的用户空间的应用程序实现，为了能够实现语音交互功能，需要控制装置一直处于唤醒状态，该状态下，控制装置的功耗较大，在通过电池向控制装置供电时，控制装置的工作时间大大减少，如果停止用户空间的工作，则语音交互功能将无法实现。
99.为解决该问题，本技术通过将用户空间以及控制装置的内核空间休眠，设置一芯
片挂载在第一控制器上，用于检测唤醒内容，当检测到唤醒内容时，通过向第一控制器发送信号，使得控制装置从休眠状态切换为唤醒状态，在通过第一控制器实现语音交互功能。
100.下面通过图7以及图8所示实施例详细介绍设置挂载芯片时控制装置的系统框架以及音频处理流程。
101.其中，图7为根据本技术一个或多个实施例进行音频处理的系统框架图。图7所示实施例在图4所示实施例的基础上，还包括：第二控制器。本技术对于第二控制器的类型不做限定，例如，第二控制器可以为数字信号处理dsp芯片。
102.第二控制器通过第二pdm接口与麦克风1和麦克风2连接。其中，第二控制器能够在控制装置处于休眠状态时，通过第二pdm接口向麦克风1和麦克风2发送时钟信号，使得麦克风1和麦克风2根据第二控制器发送的时钟信号采集环境音。此外，第二控制器还用于根据麦克风1和麦克风2采集的环境音进行唤醒内容检测。其中，第二控制器可以采用循环的方式根据麦克风1和麦克风2采集的音频信号检测唤醒内容。
103.当第二控制器检测到采集的音频信号中包含预设唤醒内容时，第二控制器可以向第一控制器发送信号，触发第一控制器以及用户空间中的语音交互服务正常工作。
104.之后，第一控制器实现语音交互功能的方式与图4、图5、图6a以及图6b所示实施例中类似，可参照前述图4、图5、图6a以及图6b所示实施例的描述，简明起见，此处不再赘述。
105.图8为在图7所示实施例的基础上进行音频处理的流程示意图。参照图8所示，本实施例提供的方法包括：
106.s801、第二控制器向多个音频采集单元发送第二时钟信号。
107.控制装置为第二控制器上电，并由第一控制器给第二控制器加载第二控制器相对应的固件程序(firmwave)，将多个音频采集单元配置为由第二控制器控制，之后，第一控制器可以进入休眠状态，即控制装置进入休眠状态，第二控制器进入唤醒内容检测模式。
108.第二控制器可以向多个音频采集单元发送第二时钟信号，本公开对于第二时钟信号不做限定，例如，第二时钟信号可以为与第一时钟信号类似的方波信号。
109.s802、多个音频采集单元根据第二时钟信号分别采集单声道音频信号。
110.s803、多个音频采集单元向第二控制器发送采集的单声道音频信号。
111.即多个音频采集单元采集的音频信号送入第二控制器。
112.s804、第二控制器根据各音频采集单元发送的单声道音频信号进行唤醒内容检测。
113.当检测到预设唤醒内容时，执行步骤s805。
114.s805、第二控制器向第一控制器发送唤醒指令。
115.示例性地，唤醒指令可以通过中断信号的方式传输至第一控制器，即第二控制器可以向第一控制器发送中断信号，以向第一控制器传输唤醒指令。
116.s806、第一控制器响应唤醒指令，使得控制装置由休眠状态切换为唤醒状态。
117.即第一控制器检测到中断信号，则响应中断信号，将多个音频采集单元的时钟信号配置至第一控制器，以此关闭多个音频采集单元采集的音频信号输入至第二控制器的功能，将多个音频采集单元分别采集的音频信号输入至第一控制器。
118.s807、第一控制器向多个音频采集单元分别发送第一时钟信号。
119.s808、多个音频采集单元分别将根据第一时钟信号采集的单声道音频信号发送至
第一控制器。
120.s809、第一控制器将多个音频采集单元分别采集单声道音频信号转换为多声道音频信号。
121.s810、目标应用程序从多声道音频信号中获取相应声道的音频信号。
122.其中，本实施例步骤s807至步骤s810分别与图5所示实施例中步骤s501至步骤s504类似，可参照图5所示实施例中的详细描述，简明起见，此处不再赘述。
123.本实施例中，通过设置挂载芯片(即第二控制器)进行唤醒内容检测，在由挂载芯片进行唤醒内容检测的过程中，控制装置处于休眠状态，整体功耗较小，能够提升控制装置的使用时长。
124.此外，在控制装置切换为唤醒状态后，若第二控制器与第一控制器同时工作，则功耗较大，因此，还可以为第二控制器断电，以进一步减小整体功耗。
125.此外，本方案中，控制装置可以通过alsa标准音频架构实现音频采集，用于进行音频采集的软件应用无需定制化，可以实现通用，普适性较高。
126.本公开实施例还提供一种可读存储介质，包括：计算机程序指令；计算机程序指令被电子设备的处理器执行时，实现上述任一方法实施例所示的音频处理方法。
127.本公开实施例还提供一种计算机程序产品，所述计算机程序产品被计算机执行时，使得所述计算机实现上述任一方法实施例所示的音频处理方法。
128.为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述在一些实施例中讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音识别方法、装置、设备及计算机可读存储介质与流程

控制装置及音频处理方法与流程

相关文献

最热文献