农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

一种语音设备的控制方法、装置、存储介质及语音设备与流程

2021-08-03 14:28:00 来源：中国专利 TAG：语音控制设备装置方法

本发明涉及控制领域，尤其涉及一种语音设备的控制方法、装置、存储介质及语音设备。

背景技术：

为了保证语音智能设备的高识别率和低误识别率，目前已有的语音智能设备基本都是采用单轮交互的语音识别模式。一方面，采用单轮交互可以避免识别到其他的非语音控制数据。另一方面，采用单轮交互能够很大程度的保证用户的隐私要求，只在用户唤醒语音设备后才开始采集用户的语音数据，进行语音识别。

但是单轮交互模式的语音智能设备，用户在每一次使用语音功能时，都需要唤醒语音智能设备，然后语音智能设备才能开始识别用户的后续语音指令，这无疑会给用户带来很大的操作不便。例如：在控制语音空调的情况下，大多数用户都渴望能够连续控制。但实际上用户在使用语音空调的语音功能时，每次操控空调都需要唤醒一次空调，然后才可以控制空调。

技术实现要素：

本发明的主要目的在于克服上述现有技术的缺陷，提供一种语音设备的控制方法、装置、存储介质及语音设备，以解决现有技术中每次使用语音功能时语音设备都需要唤醒后才开始识别后续语音指令，带来操作不便的问题。

本发明一方面提供了一种音设备的控制方法，包括：当所属语音设备被唤醒后，接收当前用户发出的语音指令；根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景；若确定当前的语音控制场景为联动控制场景，则进入多轮语音对话交互模式；若确定当前的语音控制场景为本机控制场景，则进入语音连续识别交互模式。

可选地，所述多轮语音对话交互模式，包括：识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备；和/或，所述语音连续识别交互模式，包括：在接收到一条语音指令后，执行接收到的语音指令，并在预设时间内接收下一条语音指令；若在预设时间内接收到下一条语音指令，则执行接收到的语音指令并继续在预设时间内接收下一条语音指令；若在预设时间内未接收到下一条语音指令，则退出所述语音连续识别交互模式。

可选地，根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景，包括：判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令；其中，所述其他指定设备，包括：能够与所属语音设备进行通信的设备；若判断为所属语音设备对应的语音指令，则确定当前的语音控制场景为本机控制场景；若判断为控制其他指定设备对应的语音指令，则判断所述语音指令是否具有联动控制意图；若判断所述语音指令具有联动控制意图，则确定当前的语音控制场景为联动控制场景。

可选地，所述其他指定设备，包括：与所属语音设备处于同一无线局域网下的至少一台设备；和/或，所述其他指定设备，包括：与所属语音设备通过服务器进行通信的至少一台设备；和/或，所述其他指定设备，包括：与所属语音设备通过近距离无线通信方式进行通信连接的至少一台设备。

可选地，还包括：在进入语音连续识别交互模式后，若接收到具有联动控制意图的语音指令，则进入多轮语音对话交互模式；和/或，若根据接收到的语音指令确定当前的语音控制场景不是联动控制场景或本机控制场景，则进入单轮语音识别交互模式；在进入单轮语音识别交互模式后，根据当前用户的使用习惯数据获取当前用户在当前语音控制场景下对应的语音交互模式；进入获取的所述当前用户在当前语音控制场景下对应的语音交互模式。

本发明另一方面提供了一种语音设备的控制装置，包括：接收单元，用于当所属语音设备被唤醒后，接收当前用户发出的语音指令；确定单元，用于根据所述接收单元接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景；控制单元，用于若所述确定单元当前的语音控制场景为联动控制场景，则进入多轮语音对话交互模式；若所述确定单元确定当前的语音控制场景为本机控制场景，则进入语音连续识别交互模式。

可选地，所述多轮语音对话交互模式，包括：识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备；和/或，所述语音连续识别交互模式，包括：在接收到一条语音指令后，执行接收到的语音指令，并在预设时间内接收下一条语音指令；若在预设时间内接收到下一条语音指令，则执行接收到的语音指令并继续在预设时间内接收下一条语音指令；若在预设时间内未接收到下一条语音指令，则退出所述语音连续识别交互模式。

可选地，所述确定单元，根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景，包括：判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令；其中，所述其他指定设备，包括：能够与所属语音设备进行通信的设备；若判断为所属语音设备对应的语音指令，则确定当前的语音控制场景为本机控制场景；若判断为控制其他指定设备对应的语音指令，则判断所述语音指令是否具有联动控制意图；若判断所述语音指令具有联动控制意图，则确定当前的语音控制场景为联动控制场景。

可选地，所述其他指定设备，包括：与所属语音设备处于同一无线局域网下的至少一台设备；和/或，所述其他指定设备，包括：与所属语音设备通过服务器进行通信的至少一台设备；和/或，所述其他指定设备，包括：与所属语音设备通过近距离无线通信方式进行通信连接的至少一台设备。

可选地，还包括：所述控制单元，还用于在进入语音连续识别交互模式后，若接收到具有联动控制意图的语音指令，则进入多轮语音对话交互模式；和/或，所述控制单元，还用于：若根据接收到的语音指令确定当前的语音控制场景不是联动控制场景或本机控制场景，则进入单轮语音识别交互模式；所述装置，还包括：获取单元，用于在进入单轮语音识别交互模式后，根据当前用户的使用习惯数据获取当前用户在当前语音控制场景下对应的语音交互模式；所述控制单元，还用于：进入获取的所述当前用户在当前语音控制场景下对应的语音交互模式。

本发明又一方面提供了一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现前述任一所述方法的步骤。

本发明再一方面提供了一种语音设备，包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前述任一所述方法的步骤。

本发明再一方面提供了一种语音设备，包括前述任一所述的语音设备的控制装置。

根据本发明的技术方案，在不同语音控制场景下，采用不同的语音交互模式，提高了使用语音设备时进行语音控制的效率，提升了用户的使用体验，增加了用户与语音设备的交互多样性，为用户在不同领域下提供多种语音识别模式选择，提高用户的语音交互控制体验，使语音控制交互更加人性化。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明提供的语音设备的控制方法的一实施例的方法示意图；

图2是本发明提供的语音设备的控制方法的另一实施例的方法示意图；

图3是本发明提供的语音设备的控制方法在不同语音交互场景下的一具体实施例的方法示意图；

图4是本发明提供的语音设备的控制方法在语音连续识别交互模式下的一具体实施例的方法示意图；

图5是本发明提供的语音设备的控制方法在多轮对话识别交互模式下的一具体实施例的方法示意图；

图6是本发明提供的语音设备的控制装置的一实施例的结构框图；

图7是本发明提供的语音设备的控制装置的另一实施例的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1是本发明提供的语音设备的控制方法的一实施例的方法示意图。所述语音设备包括具有语音交互功能的设备，例如包括语音空调和/或语音冰箱。

如图1所示，根据本发明的一个实施例，所述语音设备的控制方法至少包括步骤s110、步骤s120、步骤s130和步骤s140。

步骤s110，当所属语音设备被唤醒后，接收当前用户发出的语音指令。

例如，所属语音设备为语音空调，唤醒词为“空调”，当语音空调接收到语音唤醒指令“空调”时唤醒语音空调，语音空调被唤醒后应答用户，例如语音空调应答“请吩咐”，并等待接收用户发出的语音指令。

步骤s120，根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景。

在一些具体实施方式中，根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景，包括：判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令；若判断为所属语音设备对应的语音指令，则确定当前的语音控制场景为本机控制场景；若判断为控制其他指定设备对应的语音指令，则判断所述语音指令是否具有联动控制意图；若判断所述语音指令具有联动控制意图，则确定当前的语音控制场景为联动控制场景。

可选地，所述其他指定设备，包括：预先指定的至少一台能够与所属语音设备进行通信的设备。也就是说，所属语音设备与所述其他指定设备进行通信连接，从而所属语音设备能够对与其进行通信连接的其他指定设备进行控制。其中，所属语音设备是指所述控制方法所实施的语音设备，即所述控制方法在任一语音设备上实施时，该语音设备称为所述控制方法的所属语音设备。

在一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备处于同一无线局域网下的至少一台设备。具体地，当至少两台设备处于同一无线局域网下时，所述至少两台设备中任意两台设备均能够互相通信，所属语音设备可以为所述至少两台设备中的任意一台设备。例如，通过手机app对至少两台设备进行配网，使所述至少两台设备配网在同一无线局域网。

在另一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备通过服务器进行通信的至少一台设备。所属语音设备可通过互联网与服务器通信。具体地，所属语音设备和所述其他指定设备均与同一用户账号绑定。可选地，同一用户账号下绑定的任一设备均可以通过服务器控制该用户账号下绑定的其他设备。所属语音设备能够通过服务器控制同一用户账号下绑定的任一其他设备。

在另一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备通过近距离无线通信方式进行通信连接的至少一台设备。所述近距离无线通信方式例如包括蓝牙、wifi和/或zigbee。可选地，所述其他指定设备包括与所属语音设备处于同一无线网格网络下的至少一台设备，其中，所述无线网格网络中包括至少两台设备，所述至少两台设备中的任意两台设备均可通过近距离无线通信方式进行通信。具体地，所述至少两台设备通过无线通信方式(例如wifi通信方式或蓝牙通信方式)两两连接组成无线网格网络，任意两台设备均能够通过近距离无线通信方式进行通信。例如，所述至少两台设备通过蓝牙通信方式组成无线网格网络。

可选地，判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令，具体可以包括：识别接收到的所述语音指令中的关键词，判断所述关键词为所属语音设备对应的关键词，还是其他指定设备对应的关键词，若判断为所属语音设备对应关键词，则确定所述语音指令为控制所属语音设备的语音指令，若判断为其他指定设备对应的关键词，则确定所述语音指令为控制其他指定设备的语音指令。

例如，所属语音设备为语音空调，唤醒词为“空调”，当语音空调接收到语音唤醒指令“空调”时唤醒语音空调，语音空调被唤醒后应答用户，例如语音空调应答“请吩咐”，并等待接收用户发出的语音指令，接收到用户发出的语音指令后，若识别用户的语音指令为“帮我打开除湿机”，则确定该语音指令为除湿机对应的语音指令，则进一步确定该语音指令是否具有联动控制意图，例如，发现该语音指令的控制目标设备具有多个相同设备或者对该控制目标设备还可以有其他控制意图的扩展(例如，若该语音指令的控制目标设备具有对应的可联动控制设备，则确定该语音指令具有联动控制意图)，则确定当前的语音控制场景为联动控制场景；若识别用户的语音指令为“打开空调”，则确定该语音指令为空调对应的语音指令，进而确定当前的控制场景为所述语音设备控制场景。

步骤s130，若确定当前的语音控制场景为联动控制场景，则进入多轮对话识别交互模式。

在一些具体实施方式中，所述多轮语音对话交互模式，包括：识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备。

可选地，所述多轮对话交互模式，可以由云端服务器执行，即，所属语音设备每次接收到用户的语音指令后，将接收到的语音指令发送到云端服务器，云端服务器识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则返回对话内容或对话语音，(所属语音设备)根据云端服务器返回的对话内容或对话语音与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备。

例如，语音空调接收到用户的语音指令后，例如“帮我打开除湿机”，此时该用户的用户账户下已经绑定了多台很多其他智能家居产品。空调识别到用户的控制意图后，发现该用户下有多个相同设备或者对该设备还可以有其他控制意图扩展，此时进入空调的联动控制，云端自动触发多轮对话识别交互模式。或者，当空调检测到云端对除湿机设备有其他联动功能(即，控制目标设备具有对应的可联动控制设备)推送时，空调询问用户“除湿机搭配香薰机一起使用更好哦，是否打开香薰机？”此时用户无需重新唤醒语音空调，直接补充语音指令“帮我打开客厅的(除湿机)”等语言命令词即可，语音空调执行语音指令成功和/或多轮对话结束后，退出多轮对话识别交互模式。

步骤s140，若确定当前的语音控制场景为本机控制场景，则进入语音连续识别交互模式。

在一些具体实施方式中，所述语音连续识别交互模式，包括：在接收到一条语音指令后，执行接收到的语音指令，并在预设时间内接收下一条语音指令；若在预设时间内接收到下一条语音指令，则执行接收到的语音指令并继续在预设时间内接收下一条语音指令，以此类推；若在预设时间内未接收到下一条语音指令或者在预设时间内接收到预设的结束指令，则退出所述语音连续识别交互模式。语音连续识别交互模式对应的识别时长(即所述预设时间)大于单轮语音识别交互模式的识别时长，例如，单轮语音识别交互模式的识别时长为10秒～20秒，语音连续识别交互模式的识别时长(即所述预设时间)可以设置为30秒～40秒。

例如，语音空调接收到用户的语音指令后，例如“打开空调”，进行识别后判断进入空调的本机控制场景，进入语音连续识别交互模式，此时空调调整原本的识别时长，例如，原本的时长为10秒～20秒，增加识别时长以满足用户可能的其他控制指令，例如增加至30秒～40秒，并在每一次识别响应后重新开始识别状态倒计时，此时用户无需重新唤醒语音空调，可以直接说其他的空调控制语音指令，例如“制冷模式”、“18度”等。若倒计时的时间到了之后仍未接收到下一条语音指令，则退出识别状态。当其他意图命令词识别后空调进行一个兜底答复(预设的结束指令)后退出识别状态，下次识别需要重新唤醒空调。

可选地，在进入语音连续识别交互模式后，若接收到具有联动控制意图的语音指令，则进入多轮语音对话交互模式。例如，当处于语音连续识别交互模式下，只在空调本机控制场景下保持语音连续识别状态，若接收到控制其他设备的语音指令，则确定该语音指令具有联动控制意图，则进入多轮语音对话交互模式，多轮语音对话交互模式的具体实现方式，可以参照前述步骤s130中的相关具体实施方式，此处不加赘述。

图2是本发明提供的语音设备的控制方法的另一实施例的方法示意图。

如图2所示，根据本发明的另一个实施例，所述语音设备的控制方法还包括步骤s150、步骤s160和步骤s170。

步骤s150，若根据接收到的语音指令确定当前的语音控制领域属于所属设备的特定功能控制领域，则进入单轮语音识别交互模式。

例如，当空调对用户的语音指令进行识别判断后落入非空调功能的其他领域，例如，音乐播放领域，则最开始交互保持原始的单轮语音识别交互模式，唤醒一次，识别一次。当音乐播放后，用户还需对音乐的音量大小进行调节时，则还需要再次唤醒空调。

步骤s160，在进入单轮语音识别交互模式后，根据当前用户的使用习惯数据获取当前用户在当前的语音控制领域下对应的语音交互模式。

例如，通过云端对当前用户的使用习惯数据进行大数据分析，综合得出适合当前用户的语音交互模式。例如根据用户的使用习惯数据训练得出预测所述用户在当前的语音控制领域下进行的连续控制行为的神经网络模型，根据该神经网络模型能够预测用户当前控制行为的下一控制行为。例如，当云端发现该用户在音乐播放领域下，很大概率会再次唤醒设备，进行二次语音控制，此时云端自动对该用户在音乐播放领域的识别模式进行调整，定制关于此领域的最佳识别交互模式。

步骤s170，进入获取的所述当前用户在当前语音控制场景下对应的语音交互模式。

例如，空调端在进行每一次云端请求时会带上该设备的唯一设备代码、语音模块的mac、和语音固件版本信息，使得云端在处理每一条语音请求数据时候都能够知道具体的是哪一个设备发起的请求。云端语义平台将该设备用户的使用数据导出，在云端进行分析(例如，通过运行神经网络模型进行分析)，得出适用于该用户的识别交互模式。例如：播放音乐时，用户总会再次唤醒语音空调，对空调进行再次控制，此时云端会觉得语音连续识别交互模式会比单轮语音识别交互模式更加适合该用户。

为清楚说明本发明技术方案，下面再以一些具体实施例对本发明提供的语音设备的控制方法在不同场景下的执行流程进行描述。

图3是本发明提供的语音设备的控制方法在不同语音交互场景下的一具体实施例的方法示意图。如图3所示，以语音空调为例，语音空调确定当前的语音控制场景为本机控制场景、联动控制场景还是其他场景(特定功能控制领域)，若为本机控制场景，则进入语音连续识别交互模式，若为联动控制场景，则进入多轮对话语音交互模式，若为其他场景(特定功能控制领域)，则采用单轮语音识别交互模式或者获取定制的语音交互模式。

图4是本发明提供的语音设备的控制方法在连续语音识别交互模式下的一具体实施例的方法示意图。如图4所示，以语音空调为例，用户唤醒语音空调后，语音空调进入连续语音识别交互模式，语音空调连续识别用户的语音指令，每识别到一条语音指令后执行对应的控制指令，并在预设的时间内接收下一条语音指令，若在预设时间内接收到下一条语音指令，则执行对应的控制命令，并继续在预设的时间内接收下一条语音指令，若在预设时间内未接收到下一条语音指令，则退出连续识别交互模式。

图5是本发明提供的语音设备的控制方法在多轮对话识别交互模式下的一具体实施例的方法示意图。如图5所示，以语音空调为例，用户唤醒语音空调后，语音空调进入多轮语音对话交互模式，语音空调识别用户的语音指令，并执行该语音指令，同时根据识别的语音指令判断是否需要用户进一步补充语音指令；若判断需要用户补充语音指令，则主动发起语音问话，例如“请问需要控制客厅还是卧室的设备？”，并执行用户补充的语音指令。

图6是本发明提供的语音设备的控制装置的一实施例的结构框图。所述语音设备包括具有语音交互功能的设备，例如包括语音空调和/或语音冰箱。

如图6所示，所述控制装置100包括接收单元110、确定单元120和控制单元130。

接收单元110用于当所属语音设备被唤醒后，接收当前用户发出的语音指令。

例如，所属语音设备为语音空调，唤醒词为“空调”，当语音空调接收到语音唤醒指令“空调”时唤醒语音空调，语音空调被唤醒后应答用户，例如语音空调应答“请吩咐”，并等待接收用户发出的语音指令。

确定单元120用于根据所述接收单元110接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景。

在一些具体实施方式中，确定单元110根据接收到的语音指令确定当前的语音控制场景是否为联动控制场景或本机控制场景，包括：判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令；若判断为所属语音设备对应的语音指令，则确定当前的语音控制场景为本机控制场景；若判断为控制其他指定设备对应的语音指令，则判断所述语音指令是否具有联动控制意图；若判断所述语音指令具有联动控制意图，则确定当前的语音控制场景为联动控制场景。

可选地，所述其他指定设备，包括：预先指定的至少一台能够与所属语音设备进行通信的语音设备。也就是说，所属语音设备与所述其他指定设备进行通信连接，从而所属语音设备能够对与其进行通信连接的其他指定设备进行控制。其中，所属语音设备是指所述控制方法所实施的语音设备，即所述控制方法在任一语音设备上实施时，该语音设备称为所述控制方法的所属语音设备。

在一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备处于同一无线局域网下的至少一台设备。具体地，当至少两台设备处于同一无线局域网下时，所述至少两台设备中任意两台设备均能够互相通信，所属语音设备可以为所述至少两台设备中的任意一台设备。例如，通过手机app对至少两台设备进行配网，使所述至少两台设备配网在同一无线局域网。

在另一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备通过服务器进行通信的至少一台设备。所属语音设备可通过互联网与服务器通信。具体地，所属语音设备和所述其他指定设备均与同一用户账号绑定。可选地，同一用户账号下绑定的任一设备均可以通过服务器控制该用户账号下绑定的其他设备。所属语音设备能够通过服务器控制同一用户账号下绑定的任一其他设备。

在另一些具体实施方式中，所述其他指定设备，包括：预先指定的与所属语音设备通过近距离无线通信方式进行通信连接的至少一台设备。所述近距离无线通信方式例如包括蓝牙、wifi和/或zigbee。可选地，所述其他指定设备包括与所属语音设备处于同一无线网格网络下的至少一台设备，其中，所述无线网格网络中包括至少两台设备，所述至少两台设备中的任意两台设备均可通过近距离无线通信方式进行通信。具体地，所述至少两台设备通过无线通信方式(例如wifi通信方式或蓝牙通信方式)两两连接组成无线网格网络，任意两台设备均能够通过近距离无线通信方式进行通信。例如，所述至少两台设备通过蓝牙通信方式组成无线网格网络。

可选地，判断接收到的所述语音指令是否为控制所属语音设备的语音指令或控制其他指定设备的语音指令，具体可以包括：识别接收到的所述语音指令中的关键词，判断所述关键词为所属语音设备对应的关键词，还是其他指定设备对应的关键词，若判断为所属语音设备对应关键词，则确定所述语音指令为控制所属语音设备的语音指令，若判断为其他指定设备对应的关键词，则确定所述语音指令为控制其他指定设备的语音指令。

例如，所属语音设备为语音空调，唤醒词为“空调”，当语音空调接收到语音唤醒指令“空调”时唤醒语音空调，语音空调被唤醒后应答用户，例如语音空调应答“请吩咐”，并等待接收用户发出的语音指令，接收到用户发出的语音指令后，若识别用户的语音指令为“帮我打开除湿机”，则确定该语音指令为除湿机对应的语音指令，则进一步确定该语音指令是否具有联动控制意图，例如，发现该语音指令的控制目标设备具有多个相同设备或者对该控制目标设备还可以有其他控制意图的扩展(例如，若该语音指令的控制目标设备具有对应的可联动控制设备，则确定该语音指令具有联动控制意图)，则确定当前的语音控制场景为联动控制场景；若识别用户的语音指令为“打开空调”，则确定该语音指令为空调对应的语音指令，进而确定当前的控制场景为所述语音设备控制场景。

控制单元130用于若所述确定单元120当前的语音控制场景为联动控制场景，则进入多轮语音对话交互模式；若所述确定单元120确定当前的语音控制场景为本机控制场景，则进入语音连续识别交互模式。

在一些具体实施方式中，所述多轮语音对话交互模式，包括：识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备。

可选地，所述多轮对话交互模式，可以由云端服务器执行，即，所属语音设备每次接收到用户的语音指令后，将接收到的语音指令发送到云端服务器，云端服务器识别所述当前用户发出的所述语音指令的联动控制意图；根据识别的所述联动控制意图按照预设的多轮语音对话规则返回对话内容或对话语音，(所属语音设备)根据云端服务器返回的对话内容或对话语音与当前用户进行多轮语音对话交互；根据进行的所述多轮语音对话交互中所述当前用户的应答语音指令控制相应的语音设备。

例如，语音空调接收到用户的语音指令后，例如“帮我打开除湿机”，此时该用户的用户账户下已经绑定了多台很多其他智能家居产品。空调识别到用户的控制意图后，发现该用户下有多个相同设备或者对该设备还可以有其他控制意图扩展，此时进入空调的联动控制，云端自动触发多轮对话识别交互模式。或者，当空调检测到云端对除湿机设备有其他联动功能(即，控制目标设备具有对应的可联动控制设备)推送时，空调询问用户“除湿机搭配香薰机一起使用更好哦，是否打开香薰机？”此时用户无需重新唤醒语音空调，直接补充语音指令“帮我打开客厅的(除湿机)”等语言命令词即可，语音空调执行语音指令成功和/或多轮对话结束后，退出多轮对话识别交互模式。

控制单元130用于若所述确定单元当前的语音控制场景为联动控制场景，则进入多轮语音对话交互模式；若确定当前的语音控制场景为本机控制场景，则进入语音连续识别交互模式。

在一些具体实施方式中，所述语音连续识别交互模式，包括：在接收到一条语音指令后，执行接收到的语音指令，并在预设时间内接收下一条语音指令；若在预设时间内接收到下一条语音指令，则执行接收到的语音指令并继续在预设时间内接收下一条语音指令，以此类推；若在预设时间内未接收到下一条语音指令或者在预设时间内接收到预设的结束指令，则退出所述语音连续识别交互模式。语音连续识别交互模式对应的识别时长(即所述预设时间)大于单轮语音识别交互模式的识别时长，例如，单轮语音识别交互模式的识别时长为10秒～20秒，语音连续识别交互模式的识别时长(即所述预设时间)可以设置为30秒～40秒。

例如，语音空调接收到用户的语音指令后，例如“打开空调”，进行识别后判断进入空调的本机控制场景，进入语音连续识别交互模式，此时空调调整原本的识别时长，例如，原本的时长为10秒～20秒，增加识别时长以满足用户可能的其他控制指令，例如增加至30秒～40秒，并在每一次识别响应后重新开始识别状态倒计时，此时用户无需重新唤醒语音空调，可以直接说其他的空调控制语音指令，例如“制冷模式”、“18度”等。若倒计时的时间到了之后仍未接收到下一条语音指令，则退出识别状态。当其他意图命令词识别后空调进行一个兜底答复(预设的结束指令)后退出识别状态，下次识别需要重新唤醒空调。

可选地，所述控制单元130还用于：在进入语音连续识别交互模式后，若接收到具有联动控制意图的语音指令，则进入多轮语音对话交互模式。例如，当处于语音连续识别交互模式下，只在空调本机控制场景下保持语音连续识别状态，若接收到控制其他设备的语音指令，则确定该语音指令具有联动控制意图，则进入多轮语音对话交互模式，多轮语音对话交互模式的具体实现方式，可以参照前述步骤s120中的相关具体实施方式，此处不加赘述。

图7是本发明提供的语音设备的控制装置的另一实施例的结构框图。如图7所示，所述控制装置100还包括获取单元140。

所述控制单元130还用于：若根据接收到的语音指令确定当前的语音控制场景不是联动控制场景或本机控制场景，则进入单轮语音识别交互模式；所述获取单元140，用于在进入单轮语音识别交互模式后，根据当前用户的使用习惯数据获取当前用户在当前语音控制场景下对应的语音交互模式；所述控制单元130还用于：进入获取的所述当前用户在当前语音控制场景下对应的语音交互模式。

例如，当空调对用户的语音指令进行识别判断后落入非空调功能的其他领域，例如，音乐播放领域，则最开始交互保持原始的单轮对话模式，唤醒一次，识别一次。当音乐播放后，用户还需对音乐的音量大小进行调节时，则还需要再次唤醒空调。

所述获取单元140例如通过云端对当前用户的使用习惯数据进行大数据分析，综合得出适合当前用户的语音交互模式。例如根据用户的使用习惯数据训练得出预测所述用户在当前的语音控制领域下进行的连续控制行为的神经网络模型，根据该神经网络模型能够预测用户当前控制行为的下一控制行为。例如，当云端发现该用户在音乐播放领域下，很大概率会再次唤醒设备，进行二次语音控制，此时云端自动对该用户在音乐播放领域的识别模式进行调整，定制关于此领域的最佳识别交互模式。

例如，空调端在进行每一次云端请求时会带上该设备的唯一设备代码、语音模块的mac、和语音固件版本信息，使得云端在处理每一条语音请求数据时候都能够知道具体的是哪一个设备发起的请求。云端语义平台将该设备用户的使用数据导出，在云端进行分析(例如，通过运行神经网络模型进行分析)，得出适用于该用户的识别交互模式。例如：播放音乐时，用户总会再次唤醒语音空调，对空调进行再次控制，此时云端会觉得语音连续识别交互模式会比单轮语音交互模式更加适合该用户。

本发明还提供对应于所述语音设备的控制方法的一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现前述任一所述方法的步骤。

本发明还提供对应于所述语音设备的控制方法的一种语音设备，包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序，所述处理器执行所述程序时实现前述任一所述方法的步骤。

本发明还提供对应于所述语音设备的控制装置的一种语音设备，包括前述任一所述的语音设备的控制装置。

据此，本发明提供的方案，在不同语音控制场景下，采用不同的语音交互模式，提高了使用语音设备时进行语音控制的效率，提升了用户的使用体验，增加了用户与语音设备的交互多样性，为用户在不同领域下提供多种语音识别模式选择，提高用户的语音交互控制体验，使语音控制交互更加人性化。

本文中所描述的功能可在硬件、由处理器执行的软件、固件或其任何组合中实施。如果在由处理器执行的软件中实施，那么可将功能作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体予以传输。其它实例及实施方案在本发明及所附权利要求书的范围及精神内。举例来说，归因于软件的性质，上文所描述的功能可使用由处理器、硬件、固件、硬连线或这些中的任何者的组合执行的软件实施。此外，各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为控制装置的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：可调节大小的纺织机械罩壳的制作方法

一种语音设备的控制方法、装置、存储介质及语音设备与流程

相关文章

最热文献