一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音识别装置、语音识别方法及可读存储介质与流程

2021-07-23 21:35:00 来源:中国专利 TAG:语音识别 装置 可读 方法 存储介质
语音识别装置、语音识别方法及可读存储介质与流程

本发明涉及语音识别领域,尤其涉及语音识别装置、语音识别方法及可读存储介质。



背景技术:

语音交互是大部分智能设备的基础应用,为了保证语音交互应用的正常使用,智能设备始终运行着语音识别模块,以实时进行语音活性检测(voiceactivitydetection,vad)以及唤醒(wakeup)检测,从而及时响应语音命令。而由于语音识别模块功耗较高,使得智能设备的一直保持着较高的电力消耗,从而降低了智能设备的续航时间。

上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。



技术实现要素:

本发明的主要目的在于提供一种语音识别方法、语音识别装置及可读存储介质,旨在延长语音识别装置的续航时间。

为实现上述目的,本发明提供一种语音识别方法,所述语音识别方法包括以下步骤:

通过智能麦克风检测到语音唤醒词时,启动语音识别模块;

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果;

执行所述识别结果对应的控制指令;

控制所述语音识别模块休眠。

可选地,所述执行所述识别结果对应的控制指令的步骤包括:

比对所述识别结果与预设命令词,所述识别结果为所述语音信号对应的语义信息;

在存在与所述识别结果匹配的预设命令词时,获取所述预设命令词对应的控制指令;

执行所述控制指令。

可选地,所述控制所述语音识别模块休眠的步骤包括:

在不存在与所述识别结果匹配的预设命令词时,获取未获取到所述识别结果的持续时长;

在所述持续时长达到预设时长时,控制所述语音识别模块休眠。

可选地,所述比对所述识别结果与预设命令词的步骤之后,还包括:

在不存在与所述识别结果匹配的预设命令词时,输出提示信息,以使用户根据所述提示信息确定是否更新预设命令词;

接收到命令词设置指令时,获取用户输入的命令词以及控制指令;

将所述命令词作为所述预设命令词,并与所述控制指令关联保存。

可选地,所述控制所述语音识别模块休眠的步骤包括:

通过智能麦克风检测到关闭命令词时,控制所述语音识别模块休眠。

可选地,所述控制所述语音识别模块休眠的步骤包括:

接收到用户输入的关闭指令时,控制所述语音识别模块休眠。

此外,为实现上述目的,本发明还提出了一种语音识别装置,所述语音识别装置包括:智能麦克风、语音识别模块、电源模块、开关模块以及控制器;其中:所述智能麦克风与所述语音识别模块连接,用于检测语音信号,在识别到语音唤醒词时,向所述语音识别模块发送所述智能麦克风获取的语音信号;所述电源模块与所述语音识别模块之间通过开关模块电性连接,所述控制器与所述开关模块电性连接,以控制所述开关模块的导通以及断开;所述语音识别模块与所述控制器电性连接,用于识别所述智能麦克风发送的语音信号的语义信息,并向所述控制器发送所述语义信息;所述控制器用于获取所述语义信息对应的控制指令,并执行;所述智能麦克风与所述控制器电性连接,用于向所述控制器发送所述语音识别模块的启动指令或休眠指令。

此外,为实现上述目的,本发明还提出了一种语音识别装置,所述语音识别装置包括:存储器、控制器及存储在所述存储器上并可在所述控制器上运行的语音识别程序,所述语音识别程序在被控制器执行时实现如上述的语音识别方法的步骤。

此外,为实现上述目的,本发明还提出一种可读存储介质,所述可读存储介质上存储有语音识别程序,所述语音识别程序被控制器执行时实现如上所述的语音识别方法的步骤。

本发明实施例提出的一种语音识别方法、语音识别装置及可读存储介质,通过智能麦克风检测到语音唤醒词时,启动语音识别模块;获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果;执行所述识别结果对应的控制指令;控制所述语音识别模块休眠,延长了语音识别装置的续航时间。

附图说明

图1是本发明实施例方案涉及的语音识别装置的硬件架构示意图;

图2为本发明语音识别方法的第一实施例的流程示意图;

图3为本发明语音识别方法的第二实施例的流程示意图;

图4为本发明语音识别方法的第三实施例的流程示意图;

图5为本发明语音识别方法的第四实施例的流程示意图;

图6为本发明语音识别方法的第五实施例的流程示意图;

图7是本发明实施例方案涉及的语音识别装置的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

语音交互是大部分智能设备的基础应用,为了保证语音交互应用的正常使用,智能设备始终运行着语音识别模块,以实时进行语音活性检测(voiceactivitydetection,vad)以及唤醒(wakeup)检测,从而及时响应语音命令。而由于语音识别模块功耗较高,使得智能设备的一直保持着较高的电力消耗,从而降低了智能设备的续航时间。

为解决上述缺陷,本发明实施例提出一种语音识别方法、语音识别装置及可读存储介质,其中,所述语音识别方法主要包括以下步骤:

通过智能麦克风检测到语音唤醒词时,启动语音识别模块;

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果;

执行所述识别结果对应的控制指令;

控制所述语音识别模块休眠。

由于智能麦克风检测到唤醒词时,才启动语音识别模块,并在语音信号对应的控制指令执行结束后,控制语音识别模块休眠,避免了语音识别模块长期运行而造成的高电力消耗,且由于智能麦克风功耗较低,在保证语音识别装置正常运行的情况下,延长了语音识别装置的续航时间。

如图1所示,图1是本发明实施例方案涉及的语音识别装置的硬件架构示意图。

本发明实施例的语音识别装置可以是智能手机、平板电脑、智能手表等终端设备。

如图1所示,该语音识别装置可以包括:控制器1001,例如cpu,用户接口1003,网络接口1004,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如智能麦克风等,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述控制器1001的存储装置。

本领域技术人员可以理解,图1中示出的语音识别装置的硬件架构并不构成对语音识别装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音识别程序。

在图1所示的语音识别装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;控制器1001可以用于调用存储器1005中存储的语音识别程序,并执行以下操作:

通过智能麦克风检测到语音唤醒词时,启动语音识别模块;

获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果;

执行所述识别结果对应的控制指令;

控制所述语音识别模块休眠。

进一步地,控制器1001可以用于调用存储器1005中存储的语音识别程序,还执行以下操作:

比对所述识别结果与预设命令词,所述识别结果为所述语音信号对应的语义信息;

在存在与所述识别结果匹配的预设命令词时,获取所述预设命令词对应的控制指令;

执行所述控制指令。

进一步地,控制器1001可以用于调用存储器1005中存储的语音识别程序,还执行以下操作:

在不存在与所述识别结果匹配的预设命令词时,获取未获取到所述识别结果的持续时长;

在所述持续时长达到预设时长时,控制所述语音识别模块休眠。

进一步地,控制器1001可以用于调用存储器1005中存储的语音识别程序,还执行以下操作:

在不存在与所述识别结果匹配的预设命令词时,输出提示信息,以使用户根据所述提示信息确定是否更新预设命令词;

接收到命令词设置指令时,获取用户输入的命令词以及控制指令;

将所述命令词作为所述预设命令词,并与所述控制指令关联保存。

进一步地,控制器1001可以用于调用存储器1005中存储的语音识别程序,还执行以下操作:

通过智能麦克风检测到关闭命令词时,控制所述语音识别模块休眠。

进一步地,控制器1001可以用于调用存储器1005中存储的语音识别程序,还执行以下操作:

接收到用户输入的关闭指令时,控制所述语音识别模块休眠。

如图2所示,在本发明语音识别方法的第一实施例中,所述语音识别方法包括以下步骤:

步骤s10、通过智能麦克风检测到语音唤醒词时,启动语音识别模块;

步骤s20、获取所述语音识别模块对所述智能麦克风获取的语音信号的识别结果;

步骤s30、执行所述识别结果对应的控制指令;

步骤s40、控制所述语音识别模块休眠。

在本实施例中,所述智能麦克风为超低功耗的拾音装置,具有语音活性检测(voiceactivitydetection,vad)功能以及唤醒(wakeup)检测功能,可以识别少量语音命令词,比如语音唤醒词、关闭命令词等,且可以用户自己预设语音命令词;具体地,所述语音活性检测是检测语音信号是否存在;所述唤醒检测是检测语音信号中是否存在语音唤醒词,并在检测到语音唤醒词时,唤醒/启动相关装置。所述语音识别模块用于识别语音信号,以获取语音信号对应的语义信息。

本实施例中的语音识别装置至少包括智能麦克风、语音识别模块以及控制器。

语音识别装置启动后,智能麦克风启动,并长期处于开启状态。智能麦克风监测到存在语音信号时,获取当前的语音信号,并识别当前的语音信号,在当前的语音信号中检测到语音唤醒词时,向控制器发送唤醒信息,然后持续采集语音信号,并将采集后的语音信号发送给语音识别模块。

控制器接收到唤醒信息时,启动语音识别模块。

语音识别模块接收到智能麦克风发送的语音信号后,识别接收到的语音信号,以获取语音信号对应的语义信息,其中,所述语义信息为文字信息,即语音识别模块将音频数据转化为文字数据。

控制器获取语音识别模块对智能麦克风获取的语音信号的识别结果,即语音信号对应的语义信息,然后根据语义信息获取控制指令,并执行获取的控制指令。处理器在控制指令执行结束后,或在控制指令执行结束的一定时长后,控制语音识别模块休眠,以停止语音识别模块的电力消耗。

在本实施例公开的技术方案中,由于智能麦克风检测到唤醒词时,才启动语音识别模块,并在语音信号对应的控制指令执行结束后,控制语音识别模块休眠,避免了语音识别模块长期运行而造成的高电力消耗,且由于智能麦克风功耗较低,在保证语音识别装置正常运行的情况下,延长了语音识别装置的续航时间。

可选地,如图3所示,基于第一实施例,在本发明语音识别方法的第二实施例中,所述步骤s30进一步包括:

步骤s31、比对所述识别结果与预设命令词,所述识别结果为所述语音信号对应的语义信息;

步骤s32、在存在与所述识别结果匹配的预设命令词时,获取所述预设命令词对应的控制指令;

步骤s33、执行所述控制指令。

在本实施例中,所述识别结果为语音信号对应的语义信息,所述预设命令词存储为文字信息;所述语音识别装置的存储器中存储有预设命令词与控制指令的映射关系。

控制器在获取语音识别模块的识别结果后,比对识别结果与存储器中的预设命令词,在存储器中存储有与识别结果匹配的预设命令词时,获取与识别结果匹配的预设命令词对应的控制指令,然后执行获取的控制指令。

在本实施例公开的技术方案中,通过设置预设命令词与控制指令之间的映射关系,以达到通过语音控制语音识别装置的技术效果。

可选地,所述步骤s40进一步包括:

步骤s41、在不存在与所述识别结果匹配的预设命令词时,获取未获取到所述识别结果的持续时长;

步骤s42、在所述持续时长达到预设时长时,控制所述语音识别模块休眠。

在本实施例中,控制器在存储器中不存在与识别结果匹配的预设命令词时,获取未获取到识别结果的持续时长,即语音识别模块在识别麦克风获取的语音信号时,未获取到该语音信号对应的语义信息,则对应的,控制器无法获取语音识别模块的识别结果。控制器在持续时长达到预设时长时,控制语音识别模块休眠。

在本实施例公开的技术方案中,在未获取到有效的语音信号时,通过控制语音识别模块休眠,停止语音识别模块的电力消耗,延长了语音识别装置的续航时间。

可选地,如图4所示,基于第二实施例,在本发明语音识别方法的第三实施例中,所述步骤s31之后,还包括:

步骤s34、在不存在与所述识别结果匹配的预设命令词时,输出提示信息,以使用户根据所述提示信息确定是否更新预设命令词;

步骤s35、接收到命令词设置指令时,获取用户输入的命令词以及控制指令;

步骤s36、将所述命令词作为所述预设命令词,并与所述控制指令关联保存。

在本实施例中,控制器在不存在与识别结果匹配的预设命令词时,输出提示信息,所述提示信息用于提示用户是否更新预设命令词,示例性地,用户可以基于输出提示信息的弹窗触发命令词设置指令;控制器接收命令词设置指令时,获取用户输入的命令词以及控制指令,然后将命令词作为预设命令词,并与控制指令关联保存。

在本实施例公开的技术方案中,通过输出提示信息,以更新预设命令词,提高语音识别装置的可用性。

可选地,如图5所示,基于第一实施例,在本发明语音识别方法的第四实施例中,所述步骤s40进一步包括:

步骤s43、通过智能麦克风检测到关闭命令词时,控制所述语音识别模块休眠。

在本实施例中,所述智能麦克风检测到关闭命令词时,向控制器发送关闭指令。控制器接收到关闭指令时,控制语音识别模块休眠。

在本实施例公开的技术方案中,在智能麦克风检测到关闭命令词时,通过控制语音识别模块休眠,停止语音识别模块的电力消耗,延长了语音识别装置的续航时间。

可选地,如图6所示,基于第一实施例,在本发明语音识别方法的第五实施例中,所述步骤s40进一步包括:

步骤s44、接收到用户输入的关闭指令时,控制所述语音识别模块休眠。

在本实施例中,用户可以基于语音识别模块的操作界面触发关闭指令,控制器接收到关闭命令时,控制语音识别模块休眠。

在本实施例公开的技术方案中,在用户触发关闭命令时,通过控制语音识别模块休眠,停止语音识别模块的电力消耗,延长了语音识别装置的续航时间。

此外,如图7所示,本发明实施例还提出一种语音识别装置,所述语音识别装置包括智能麦克风101、语音识别模块102、电源模块103、开关模块104以及控制器105。

在本实施例中,所述智能麦克风101与所述语音识别模块102连接,用于检测语音信号,在识别到语音唤醒词时,向所述语音识别模块102发送所述智能麦克风101获取的语音信号;所述电源模块103与所述语音识别模块102之间通过开关模块104电性连接,所述控制器105与所述开关模块104电性连接,以控制所述开关模块104的导通以及断开;所述语音识别模块102与所述控制器105电性连接,用于识别所述智能麦克风101发送的语音信号的语义信息,并向所述控制器105发送所述语义信息;所述控制器105用于获取所述语义信息对应的控制指令,并执行;所述智能麦克风101与所述控制器105电性连接,用于向所述控制器105发送所述语音识别模块102的启动指令或休眠指令。

此外,本发明实施例还提出一种语音识别装置,所述语音识别装置包括存储器、控制器及存储在所述存储器上并可在所述控制器上运行的语音识别程序,所述语音识别程序被所述控制器执行时实现如上述各个实施例所述的语音识别方法的步骤。

此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有语音识别程序,所述语音识别程序被控制器执行时实现如上述各个实施例所述的语音识别方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台语音识别装置(可以是智能手机等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜