农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

语音识别装置、语音识别方法及可读存储介质与流程

2021-07-23 21:35:00 来源：中国专利 TAG：语音识别装置可读方法存储介质

本发明涉及语音识别领域，尤其涉及语音识别装置、语音识别方法及可读存储介质。

背景技术：

语音交互是大部分智能设备的基础应用，为了保证语音交互应用的正常使用，智能设备始终运行着语音识别模块，以实时进行语音活性检测(voiceactivitydetection，vad)以及唤醒(wakeup)检测，从而及时响应语音命令。而由于语音识别模块功耗较高，使得智能设备的一直保持着较高的电力消耗，从而降低了智能设备的续航时间。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

技术实现要素：

本发明的主要目的在于提供一种语音识别方法、语音识别装置及可读存储介质，旨在延长语音识别装置的续航时间。

为实现上述目的，本发明提供一种语音识别方法，所述语音识别方法包括以下步骤：

通过智能麦克风检测到语音唤醒词时，启动语音识别模块；

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果；

执行所述识别结果对应的控制指令；

控制所述语音识别模块休眠。

可选地，所述执行所述识别结果对应的控制指令的步骤包括：

比对所述识别结果与预设命令词，所述识别结果为所述语音信号对应的语义信息；

在存在与所述识别结果匹配的预设命令词时，获取所述预设命令词对应的控制指令；

执行所述控制指令。

可选地，所述控制所述语音识别模块休眠的步骤包括：

在不存在与所述识别结果匹配的预设命令词时，获取未获取到所述识别结果的持续时长；

在所述持续时长达到预设时长时，控制所述语音识别模块休眠。

可选地，所述比对所述识别结果与预设命令词的步骤之后，还包括：

在不存在与所述识别结果匹配的预设命令词时，输出提示信息，以使用户根据所述提示信息确定是否更新预设命令词；

接收到命令词设置指令时，获取用户输入的命令词以及控制指令；

将所述命令词作为所述预设命令词，并与所述控制指令关联保存。

可选地，所述控制所述语音识别模块休眠的步骤包括：

通过智能麦克风检测到关闭命令词时，控制所述语音识别模块休眠。

可选地，所述控制所述语音识别模块休眠的步骤包括：

接收到用户输入的关闭指令时，控制所述语音识别模块休眠。

此外，为实现上述目的，本发明还提出了一种语音识别装置，所述语音识别装置包括：智能麦克风、语音识别模块、电源模块、开关模块以及控制器；其中：所述智能麦克风与所述语音识别模块连接，用于检测语音信号，在识别到语音唤醒词时，向所述语音识别模块发送所述智能麦克风获取的语音信号；所述电源模块与所述语音识别模块之间通过开关模块电性连接，所述控制器与所述开关模块电性连接，以控制所述开关模块的导通以及断开；所述语音识别模块与所述控制器电性连接，用于识别所述智能麦克风发送的语音信号的语义信息，并向所述控制器发送所述语义信息；所述控制器用于获取所述语义信息对应的控制指令，并执行；所述智能麦克风与所述控制器电性连接，用于向所述控制器发送所述语音识别模块的启动指令或休眠指令。

此外，为实现上述目的，本发明还提出了一种语音识别装置，所述语音识别装置包括：存储器、控制器及存储在所述存储器上并可在所述控制器上运行的语音识别程序，所述语音识别程序在被控制器执行时实现如上述的语音识别方法的步骤。

此外，为实现上述目的，本发明还提出一种可读存储介质，所述可读存储介质上存储有语音识别程序，所述语音识别程序被控制器执行时实现如上所述的语音识别方法的步骤。

本发明实施例提出的一种语音识别方法、语音识别装置及可读存储介质，通过智能麦克风检测到语音唤醒词时，启动语音识别模块；获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果；执行所述识别结果对应的控制指令；控制所述语音识别模块休眠，延长了语音识别装置的续航时间。

附图说明

图1是本发明实施例方案涉及的语音识别装置的硬件架构示意图；

图2为本发明语音识别方法的第一实施例的流程示意图；

图3为本发明语音识别方法的第二实施例的流程示意图；

图4为本发明语音识别方法的第三实施例的流程示意图；

图5为本发明语音识别方法的第四实施例的流程示意图；

图6为本发明语音识别方法的第五实施例的流程示意图；

图7是本发明实施例方案涉及的语音识别装置的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

语音交互是大部分智能设备的基础应用，为了保证语音交互应用的正常使用，智能设备始终运行着语音识别模块，以实时进行语音活性检测(voiceactivitydetection，vad)以及唤醒(wakeup)检测，从而及时响应语音命令。而由于语音识别模块功耗较高，使得智能设备的一直保持着较高的电力消耗，从而降低了智能设备的续航时间。

为解决上述缺陷，本发明实施例提出一种语音识别方法、语音识别装置及可读存储介质，其中，所述语音识别方法主要包括以下步骤：

通过智能麦克风检测到语音唤醒词时，启动语音识别模块；

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果；

执行所述识别结果对应的控制指令；

控制所述语音识别模块休眠。

由于智能麦克风检测到唤醒词时，才启动语音识别模块，并在语音信号对应的控制指令执行结束后，控制语音识别模块休眠，避免了语音识别模块长期运行而造成的高电力消耗，且由于智能麦克风功耗较低，在保证语音识别装置正常运行的情况下，延长了语音识别装置的续航时间。

如图1所示，图1是本发明实施例方案涉及的语音识别装置的硬件架构示意图。

本发明实施例的语音识别装置可以是智能手机、平板电脑、智能手表等终端设备。

如图1所示，该语音识别装置可以包括：控制器1001，例如cpu，用户接口1003，网络接口1004，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如智能麦克风等，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述控制器1001的存储装置。

本领域技术人员可以理解，图1中示出的语音识别装置的硬件架构并不构成对语音识别装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音识别程序。

在图1所示的语音识别装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；控制器1001可以用于调用存储器1005中存储的语音识别程序，并执行以下操作：

通过智能麦克风检测到语音唤醒词时，启动语音识别模块；

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果；

执行所述识别结果对应的控制指令；

控制所述语音识别模块休眠。