基于语音控制的控制方法、装置和系统与流程

2021-06-08 14:11:00 来源：中国专利 TAG：控制语音装置无线传输方法

1.本申请涉及无线传输技术领域，尤其涉及一种基于语音控制的控制方法、装置和系统。

背景技术：

2.随着物联网时代的来临，无线通信技术日趋重要。当前智能设备(例如：智能手表、智能手环、智能音箱、移动电话等)都可通过无线通信技术(例如：wi
‑
fi、蓝牙、zigbee)与其他智能设备进行无线通信，且智能设备在使用时通常会处于一对多的配对模式。
3.由于现有技术的设备配对方式需用户手动设置，使得当任一智能设备欲和多台智能设备切换连接时，存在快速切换连接不方便的问题。此外，无屏幕显示的智能设备之间进行配对时，存在配对操作不便的问题。

技术实现要素：

4.本申请的主要目的在于提供一种基于语音控制的控制方法、装置和系统，解决现有技术中，任一智能设备欲和多台智能设备切换连接时，存在快速切换连接不方便的问题，及无屏幕显示的智能设备之间进行配对时，存在配对操作不便的问题。
5.为了实现上述目的，本申请是这样实现的：
6.第一方面，提供一种基于语音控制的控制方法，应用于穿戴装置，并包括以下步骤：接收用户语音；通过语音文字识别技术将用户语音进行识别得到对应的文字信息；判断文字信息是否包含有预设信息；当判断文字信息未包含有预设信息时，使无线连接的电子设备显示对话框，并接收来自电子设备的输入信息，输入信息包含预设信息；根据预设信息执行预设动作；当判断文字信息未包含有预设信息时，还配对用户语音的特征参数和预设信息，以产生并存储校正后的特征参数。
7.第二方面，提供一种基于语音控制的控制装置，设置于穿戴装置，并包括：接收模块、语音转换模块、连接模块、处理模块和存储模块。其中，接收模块用于接收用户语音；语音转换模块连接接收模块，并用于通过语音文字识别技术将用户语音进行识别得到对应的文字信息；连接模块用于无线连接电子设备；处理模块连接语音转换模块和连接模块，并用于判断文字信息是否包含有预设信息；当判断文字信息未包含有预设信息时，通过连接模块使无线连接的电子设备显示对话框，并接收来自电子设备的输入信息，输入信息包含有预设信息；根据预设信息执行预设动作；及当判断文字信息未包含有预设信息时，还配对用户语音的特征参数和预设信息，以产生校正后的特征参数；存储模块用于存储校正后的特征参数。
8.第三方面，提供一种基于语音控制的控制系统，包括：电子设备和穿戴装置，穿戴装置无线连接电子设备。其中，电子设备具有显示屏；穿戴装置包括本申请实施例的基于语音控制的控制装置。
9.在本申请实施例中，可通过用户语音或来自电子设备的输入信息所对应包含的预
设信息执行预设动作，使得应用于和多台智能设备切换连接时，可实现快速切换连接的功效，且应用于无屏幕显示的智能设备之间进行配对时，配对操作不会存在不便的问题。此外，本申请实施例还会在判断文字信息未包含有预设信息时，通过对用户语音进行特征参数校正，可解决因用户发音不准确导致无法识别语音命令的问题，并提高后续的语音识别率，有利于提高用户体验。
附图说明
10.此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：
11.图1为依据本申请的基于语音控制的控制系统的一实施例示意图；
12.图2为依据本申请的基于语音控制的控制方法的一实施例方法流程图；以及
13.图3为依据本申请的基于语音控制的控制方法的另一实施例方法流程图。
具体实施方式
14.以下将配合相关附图来说明本发明的实施例。在这些附图中，相同的标号表示相同或类似的组件或方法流程。
15.必须了解的是，使用在本说明书中的“包含”、“包括”等词，是用于表示存在特定的技术特征、数值、方法步骤、作业处理、组件和/或组件，但并不排除可加上更多的技术特征、数值、方法步骤、作业处理、组件、组件，或以上的任意组合。
16.必须了解的是，当组件描述为“连接”或“耦接”至另一组件时，可以是直接连结、或耦接至其他组件，可能出现中间组件。相反地，当组件描述为“直接连接”或“直接耦接”至另一组件时，其中不存在任何中间组件。
17.请参阅图1，其为依据本申请的基于语音控制的控制系统的一实施例示意图。如图1所示，基于语音控制的控制系统100包括：电子设备110和穿戴装置120，穿戴装置120无线连接电子设备110。其中，电子设备110具有显示屏112；穿戴装置120包括基于语音控制的控制装置200。在本实施例中，穿戴装置120可为具有显示屏的移动智能设备，也可为不具有显示屏的移动智能设备；在具体实施中，电子设备110可为但不限于智能电话、平板计算机或膝上型计算机，穿戴装置120可为但不限于智能帽、智能眼镜、无线耳机、智能耳机、智能手表、智能手环或智能戒指，可依据实际需求进行调整。
18.在本实施例中，基于语音控制的控制装置200设置于穿戴装置120，并包括：接收模块210、语音转换模块220、连接模块230、处理模块240和存储模块250，其中，语音转换模块220连接接收模块210，处理模块240连接语音转换模块220和连接模块230，存储模块250连接处理模块240。接收模块210、语音转换模块220、连接模块230、处理模块240和存储模块250可以利用各种方式来实现，包括软件、硬件、固件或其任意组合。在实施中提出的技术使用软件或固件可以被存储在机器可读存储介质上，例如：只读存储器(rom)、随机存储器(ram)、磁盘存储介质、光存储介质、闪存等等，并且可以由一个或多个通用或专用的可编程微处理器执行。语音转换模块220和接收模块210之间、处理模块240和语音转换模块220之间、处理模块240和连接模块230之间及存储模块250和处理模块240之间可通过无线或有线方式进行信号和/或数据的传递。
19.在本实施例中，接收模块210用于接收用户语音。在具体实施中，接收模块210可包括但不限于麦克风单元。
20.在本实施例中，语音转换模块220用于通过语音文字识别技术将接收模块210所接收的用户语音进行识别得到对应的文字信息。在一实施例中，语音转换模块220可先对所述用户语音进行噪声消除等预处理；接着，对经过预处理后的所述用户语音进行特征参数提取，以获得所述用户语音中的语音特征；然后，通过预先构建的声学模型与语言模型对所获得的语音特征进行识别，进而获得并输出对应的文字信息。
21.在本实施例中，连接模块230用于无线连接电子设备110。其中，连接模块230与电子设备110之间的无线连接方式可为但不限于wifi连接、数据网络连接及蓝牙连接中的一种或多种。
22.在本实施例中，处理模块240用于判断所述文字信息是否包含有预设信息；当判断所述文字信息未包含有预设信息时，通过连接模块230使无线连接的电子设备110显示对话框，并接收来自电子设备110的输入信息，所述输入信息包含有所述预设信息；根据所述预设信息执行预设动作；及当判断所述文字信息未包含有预设信息时，处理模块240还配对用户语音(其对应的文字信息未包含有预设信息)的特征参数和所述预设信息，以产生校正后的特征参数。
23.更详细地说，处理模块240包含有数据库242，数据库242用于存储多个预设信息及其对应的预设动作，所述预设信息可包含但不限于设备或终端的名称、拨打电话、接听电话、调高音量或调低音量，其中，所述预设信息“设备或终端的名称”的预设动作可为但不限于“传送指令让穿戴装置切换连线至所述设备或终端”；所述预设信息“拨打电话”的预设动作可为但不限于“传送指令让穿戴装置拨打电话”；所述预设信息“接听电话”的预设动作可为但不限于“传送指令让穿戴装置接听电话”；所述预设信息“调高音量”的预设动作可为但不限于“传送指令调高穿戴装置的音量”；所述预设信息“调低音量”的预设动作可为但不限于“传送指令调低穿戴装置的音量”。当处理模块240接收所述文字信息且基于所述数据库242判断所述文字信息未包含有所述预设信息时，通过连接模块230使无线连接的电子设备110的显示屏112显示对话框，所述对话框的内容可包括但不限于“请输入/点选欲操作指令”，以使用户通过电子设备110的输入设备(未绘制)输入或点选其欲使穿戴装置120执行的动作而产生输入信息，所述输入信息包含有所述预设信息。电子设备110通过连接模块230将所述输入信息传输至处理模块240，使得处理模块240基于数据库242和所述输入信息所包含的所述预设信息执行所述预设信息对应的预设动作。
24.根据上述可知，所述用户语音所对应的文字信息应包含有所述预设信息，但由于利用语音文字识别技术对所述用户语音的识别结果有误，使得基于语音控制的控制装置200无法通过用户语音直接执行预设动作，因此，为提高后续的语音识别率，处理模块240还会在判断所述文字信息未包含有预设信息时，基于所述预设信息对用户语音的特征参数进行校正(即配对用户语音的特征参数和所述预设信息，以产生校正后的特征参数)。也就是说，当处理模块240无法由用户语音中识别出数据库242中所存储的预设信息，用户可通过电子设备110输入对应的文字信息，处理模块240会依据文字信息所对应的预设信息，对前次无法识别的用户语音进行处理，以校正用户语音的特征参数，如此可适应用户的特定发音，让下次语音识别时可提高识别率。
25.在一实施例中，当处理模块240判断所述文字信息未包含有所述预设信息时，缓存所述用户语音的所述特征参数，并删除所述文字信息，等待新用户语音，以重新判断所述文字信息是否包含有所述预设信息；当处理模块240连续n次判断所述文字信息未包含有所述预设信息时，通过连接模块230使无线连接的电子设备110显示所述对话框，接收来自电子设备110的所述输入信息，并根据所述预设信息执行所述预设动作，且基于所述预设信息对所述用户语音的特征参数进行校正，n为大于或等于2的整数。换句话说，在这个实施例中，处理模块240需先缓存所述用户语音(其对应的文字信息未包含有预设信息)的所述特征参数，当处理模块240连续n次判断所述文字信息未包含有所述预设信息时，才会通过电子设备110显示所述对话框，并接收所述输入信息，再依据所述预设信息执行所述预设动作及基于所述预设信息校正缓存的所述特征参数。其中，n的大小可依据实际需求进行调整。
26.在本实施例中，存储模块250用于存储校正后的特征参数，以供后续的语音识别使用。
27.在本申请实施例中，基于语音控制的控制装置200可通过连接模块230连接的电子设备110建立人机交互对话的交互接口，让用户容易通过电子设备110的输入设备手动输入或点选其欲使穿戴装置120执行的动作。
28.在一实施例中，基于语音控制的控制装置200还包括播放模块260，当处理模块240判断所述文字信息包含有所述预设信息时，处理模块240通过连接模块230使无线连接的电子设备110显示所述文字信息或通过播放模块260播放所述文字信息，并通过接收模块210接收回馈语音；及处理模块240根据所述回馈语音执行所述预设动作；或者根据所述回馈语音删除所述文字信息，并等待新用户语音；或者通过连接模块230使无线连接的电子设备110显示所述对话框，接收来自电子设备110的所述输入信息，并根据所述预设信息执行所述预设动作，且基于所述预设信息对所述用户语音(其对应的文字信息包含有预设信息，但并非用户真正想要输入或执行的文字信息或预设信息)的特征参数进行校正。在具体实施中，播放模块260可包括但不限于扬声器。
29.换句话说，当处理模块240判断所述文字信息包含有所述预设信息时，处理模块240通过电子设备110显示所述文字信息或通过播放模块260播放所述文字信息，使得用户可判断通过语音文字识别技术所产生的识别结果(即所述文字信息)是否有误，并以所述回馈语音给予回应，所述回馈语音的内容可为但不限于“正确”或“错误”。
30.在一实施例中，当所述回馈语音的内容为“正确”时，处理模块240根据所述回馈语音执行所述预设动作。
31.在一实施例中，当所述回馈语音的内容为“错误”时，处理模块240根据所述回馈语音删除所述文字信息，并等待新用户语音。
32.在另一实施例中，当所述回馈语音的内容为“错误”时，处理模块240通过无线连接的电子设备110显示所述对话框，所述对话框的内容可包括但不限于“请输入/点选欲操作指令”，以使用户通过电子设备110的输入设备(未绘制)输入或点选其欲使穿戴装置120执行的动作而产生输入信息，所述输入信息包含有所述预设信息。电子设备110通过连接模块230将所述输入信息传输至处理模块240，使得处理模块240基于数据库242和所述输入信息所包含的所述预设信息执行所述预设信息对应的预设动作。根据上述可知，利用语音文字识别技术对所述用户语音的识别结果有误时，处理模块240还基于所述预设信息对所述用
户语音(其对应的文字信息包含有预设信息，但并非用户真正想要输入或执行的文字信息或预设信息)的特征参数进行校正，以提高后续的语音识别率。
33.在一实施例中，当处理模块240连续n次根据所述回馈语音删除所述文字信息，并等待所述新用户语音时，通过连接模块230使无线连接的电子设备110显示所述对话框，接收来自电子设备110的所述输入信息，并根据所述预设信息执行所述预设动作，且基于所述预设信息对其所述用户语音的特征参数进行校正，n为大于或等于2的整数。换句话说，在这个实施例中，处理模块240需连续n次接收到内容为“错误”的所述回馈语音才会通过电子设备110显示所述对话框，并接收所述输入信息，再依据所述预设信息执行所述预设动作及校正所述特征参数。其中，n的大小可依据实际需求进行调整。详细描述已于上述段落加以说明，于此不再赘述。
34.在一实施例中，当接收模块210接收新用户语音时，语音转换模块220可通过所述校正后的特征参数及所述语音文字识别技术将所述新用户语音进行识别，以得到对应的新文字信息。处理模块240可判断所述新文字信息是否包含有预设信息；当判断所述新文字信息未包含有预设信息时，通过连接模块230使无线连接的电子设备110显示对话框，并接收来自电子设备110的输入信息，所述输入信息包含有所述预设信息；根据所述预设信息执行预设动作；及配对用户语音的特征参数和所述预设信息，以产生校正后的特征参数。
35.请参阅图2，其为依据本申请的基于语音控制的控制方法的一实施例方法流程图。基于语音控制的控制方法应用于穿戴装置，并包括以下步骤：接收用户语音(步骤310)；通过语音文字识别技术将用户语音进行识别得到对应的文字信息(步骤320)；判断文字信息是否包含有预设信息(步骤330)；当判断文字信息未包含有预设信息时，使无线连接的电子设备显示对话框，并接收来自电子设备的输入信息，输入信息包含预设信息(步骤340)；根据预设信息执行预设动作(步骤350)；当判断文字信息未包含有预设信息时，还配对用户语音的特征参数和预设信息，以产生并存储校正后的特征参数(步骤360)。
36.透过上述步骤，即可通过用户语音或来自电子设备的输入信息所对应包含的预设信息执行预设动作，使得应用于和多台智能设备切换连接时，可实现快速切换连接的功效，且应用于无屏幕显示的智能设备之间进行配对时，配对操作不会存在不便的问题。此外，本申请实施例还通过对用户语音进行特征参数校正，可解决因用户发音不准确导致无法识别语音命令的问题，并提高后续的语音识别率，有利于提高用户体验。详细描述已于上述段落加以说明，于此不再赘述。
37.在一实施例中，步骤340包括：当判断所述文字信息未包含有所述预设信息时，缓存所述用户语音的所述特征参数，并删除所述文字信息，等待新用户语音，以重新执行所述判断所述文字信息是否包含有所述预设信息；当连续n次判断所述文字信息未包含有所述预设信息时，使无线连接的所述电子设备显示所述对话框，并接收来自所述电子设备的所述输入信息，n为大于或等于2的整数。详细描述已于上述段落加以说明，于此不再赘述。
38.在一实施例中，请参阅图3，其为依据本申请的基于语音控制的控制方法的另一实施例方法流程图。基于语音控制的控制方法除了包括步骤310至步骤330以外，还包括以下步骤：当判断文字信息包含有预设信息时，呈现文字信息，并接收回馈语音(步骤370)；根据回馈语音执行预设动作(步骤380a)；或者根据回馈语音删除文字信息，并等待新用户语音(步骤380b)；或者根据回馈语音使无线连接的电子设备显示对话框，接收来自电子设备的
输入信息，并根据预设信息执行预设动作，且基于预设信息对用户语音的特征参数进行校正后存储(步骤380c)。详细描述已于上述段落加以说明，于此不再赘述。
39.在一实施例中，步骤370中所述呈现文字信息，包括：通过无线连接的电子设备显示文字信息；或通过语音方式呈现文字信息。
40.在一实施例中，所述基于语音控制的控制方法在步骤380b之后还包括以下步骤：当连续n次根据所述回馈语音删除所述文字信息，并等待所述新用户语音时，使无线连接的所述电子设备显示所述对话框，接收来自所述电子设备的所述输入信息，并根据所述预设信息执行所述预设动作，且基于所述预设信息对所述用户语音的特征参数进行校正后存储，n为大于或等于2的整数。详细描述已于上述段落加以说明，于此不再赘述。
41.在一实施例中，所述基于语音控制的控制方法在步骤380b之后还包括以下步骤：当接收新用户语音时，通过所述校正后的特征参数及所述语音文字识别技术将所述新用户语音进行识别，以得到对应的新文字信息；及基于所述新文字信息重新执行步骤330。详细描述已于上述段落加以说明，于此不再赘述。
42.本申请实施例的基于语音控制的控制方法、装置和系统，可通过用户语音或来自电子设备的输入信息所对应包含的预设信息执行预设动作，使得应用于和多台智能设备切换连接时，可实现快速切换连接的功效，且应用于无屏幕显示的智能设备之间进行配对时，配对操作不会存在不便的问题。此外，本申请实施例还会在判断文字信息未包含有预设信息时或在判断文字信息包含有不是用户希望输入的预设信息时，通过对用户语音进行特征参数校正，可解决因用户发音不准确导致无法识别语音命令的问题，并提高后续的语音识别率，有利于提高用户体验。
43.虽然在本申请的图式中包含了以上描述的组件，但不排除在不违反发明的精神下，使用更多其他的附加组件，已达成更佳的技术效果。
44.虽然本发明使用以上实施例进行说明，但需要注意的是，这些描述并非用于限缩本发明。相反地，此发明涵盖了所属技术领域中的技术人员显而易见的修改与相似设置。所以，权利要求范围须以最宽广的方式解释来包含所有显而易见的修改与相似设置。

再多了解一些

1/3 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音识别方法、装置、设备及存储介质与流程

基于语音控制的控制方法、装置和系统与流程

相关文章

最热文献