设备控制方法、装置、存储介质及电子装置与流程

2021-09-28 22:58:00 来源：中国专利 TAG：装置人工智能实施控制方法

1.本发明实施例涉及人工智能领域，具体而言，涉及一种设备控制方法、装置、存储介质及电子装置。

背景技术：

2.当今日常家用电器很多都带有锁定功能，设备锁定后必须通过解锁才能使用和操作，目前常用的解锁方法有输入密码、输入指纹、扫描人脸、滑动屏幕、输入手势及语音控制等，其中，语音控制技术作为一种交互性很强的智能控制技术，近年来备受青睐，语音控制解锁因为不需要操作设备，远程就能实现，用户体验较好，在解锁方案中得到了越来越多的应用,一般用于语音解锁的方案就是使用语音识别技术采集用户发出的语音，语音识别后判断是否是解锁指令，如果是就执行解锁。但是，普通的语音控制只要口令正确，任何人声都能实现对家电设备的解锁，在某些场景下存在严重的安全性问题。
3.针对现有技术中存在的控制设备解锁的安全性不足的问题，目前尚未提出有效的解决方案。

技术实现要素：

4.本发明实施例提供了一种设备控制方法、装置、存储介质及电子装置，以至少解决相关技术中存在的控制设备解锁的安全性不足的问题。
5.根据本发明的一个实施例，提供了一种设备控制方法，包括：接收第一设备发送的第一请求信息，以及其他设备发送的其他请求信息，其中，所述第一请求信息中包含所述第一设备接收到的目标语音，以及所述第一设备与发出所述目标语音的目标对象的第一距离信息，所述第一距离信息是由所述第一设备所确定出的,所述其他请求信息中包含所述其他设备接收到的所述目标语音，以及所述其他设备与所述目标对象的其他距离信息,所述其他距离信息是由所述其他设备所确定出的；识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备；基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
6.在一个示例性实施例中，识别所述目标语音，以得到第一识别结果包括：对所述目标语音进行语意识别，以确定出所述第一识别信息；获取所述目标语音的目标声纹特征；将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果，其中，所述比对结果用于指示所述目标声纹特征与预先存储的所述标准声纹特征库中所包括的任一声纹特征的相似度，所述标准声纹特征库中还包括与其中包括的标准声纹特征对应的对象的标识；基于所述比对结果得到所述第二识别信息。
7.在一个示例性实施例中，基于所述比对结果得到所述第二识别信息包括：在基于
所述比对结果确定出所述标准声纹特征库中包括有与所述目标声纹特征相似度超过预定阈值的标准声纹特征的情况下，将确定出的所述标准声纹特征对应的对象的标识确定为所述目标对象的标识，以得到所述第二识别信息。
8.在一个示例性实施例中，在将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果之前，所述方法还包括：获取多个标准语音的标准声纹特征，以及，发出所述标准语音的对象的标识；将所述标准声纹特征与所述标识对应存储在所述标准声纹特征库中。
9.在一个示例性实施例中，基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备包括：基于所述第二识别信息确定出所述第一设备和所述其他设备中包括的允许由所述目标对象控制的执行设备；基于所述第一距离信息以及所述其他距离信息从所述执行设备中确定出距离所述目标对象最近的所述目标设备。
10.在一个示例性实施例中，在确定所述目标设备为所述第一设备的情况下，基于所述第一识别信息控制所述第一设备执行所述目标指令所指示的操作包括：在确定所述第一设备处于休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第一控制指令，以控制所述第一设备执行唤醒操作，并在唤醒之后执行所述目标指令所指示的操作；在确定所述第一设备处于非休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第二控制指令，以控制所述第一设备直接执行所述目标指令所指示的操作。
11.根据本发明的另一个实施例，还提供了一种设备控制方法，包括：在第一设备接收到目标语音的情况下，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息；将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端，以指示所述服务端执行如下操作：识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行所述目标指令的目标设备，并基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
12.在一个示例性实施例中，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息包括：按照预定算法对所述第一设备中包括的麦克风阵列中的各个麦克风所接收到的语音信号进行计算，以确定出所述第一设备与所述目标对象的第一距离信息。
13.在一个示例性实施例中，所述预定算法包括以下方法至少之一：基于波束形成的方法；基于高分辨率谱估计的方法；基于时间差进行定位的方法。
14.在一个示例性实施例中，在将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端之后，所述方法还包括：接收所述服务端发送的第一控制指令，其中，所述第一控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；基于所述第一控制指令执行唤醒操作，以及，在唤醒之后执行所述目标指令所指示的操作；或者，接收所述服务端发送的第二控制指令，其中，所述第二控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；基于所述第二控制指令直接执行所述目标指令所指示的操作。
15.根据本发明的又一个实施例，还提供了一种设备控制装置，包括：第一接收模块，用于接收第一设备发送的第一请求信息，以及其他设备发送的其他请求信息，其中，所述第一请求信息中包含所述第一设备接收到的目标语音，以及所述第一设备与发出所述目标语音的目标对象的第一距离信息，所述第一距离信息是由所述第一设备所确定出的,所述其他请求信息中包含所述其他设备接收到的所述目标语音，以及所述其他设备与所述目标对象的其他距离信息,所述其他距离信息是由所述其他设备所确定出的；识别模块，用于识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；第一确定模块，用于基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备；控制模块，用于基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
16.根据本发明的又一个实施例，还提供了一种设备控制装置，包括：第二确定模块，用于在第一设备接收到目标语音的情况下，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息；发送模块，用于将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端，以指示所述服务端执行如下操作：识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行所述目标指令的目标设备，并基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
17.根据本发明的又一个实施例，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
18.根据本发明的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
19.通过本发明，通过接收第一设备发送的第一请求信息以及其他设备发送的其他请求信息，其中，第一请求信息中包含第一设备接收到的目标语音以及第一设备所确定出的第一设备与发出目标语音的目标对象的第一距离信息，其他请求信息中包含其他设备接收到的目标语音，以及其他设备所确定出的其他设备与目标对象的其他距离信息；再识别目标语音，以得到第一识别结果，其中，第一识别结果中包括目标语音中所包含的目标指令以及发出所述目标语音的目标对象的标识；然后，基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备，进而基于所述第一识别信息控制目标设备执行所述目标指令所指示的操作。实现了通过识别目标语音中的目标指令和发出目标语音的目标对象的标识以确定执行目标指令的目标设备的目的，解决了相关技术中存在的控制设备解锁的安全性不足的问题，进而达到了提高设备解锁的安全性的效果。
附图说明
20.图1是本发明实施例的设备控制方法的移动终端硬件结构框图；
21.图2是根据本发明实施例的设备控制方法的流程图一；
22.图3是根据本发明实施例的设备控制方法的流程图二；
23.图4是根据本发明实施例的声源定位算法原理图一；
24.图5是根据本发明实施例的声源定位算法原理图二；
25.图6是根据本发明实施例的声源定位算法原理图三；
26.图7是根据本发明具体实施例的设备控制方法的流程图一；
27.图8是根据本发明具体实施例的设备控制方法的流程图二；
28.图9是根据本发明实施例的设备控制装置的结构框图一；
29.图10是根据本发明实施例的设备控制装置的结构框图二。
具体实施方式
30.下文中将参考附图并结合实施例来详细说明本发明的实施例。
31.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。
32.本技术实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的设备控制方法的移动终端硬件结构框图。如图1所示，移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104，其中，上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述移动终端的结构造成限定。例如，移动终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。
33.存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的设备控制方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
34.传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(network interface controller，简称为nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(radio frequency，简称为rf)模块，其用于通过无线方式与互联网进行通讯。
35.在本实施例中提供了一种设备控制方法，图2是根据本发明实施例的设备控制方法的流程图一，如图2所示，该流程包括如下步骤：
36.步骤s202，接收第一设备发送的第一请求信息，以及其他设备发送的其他请求信
息，其中，所述第一请求信息中包含所述第一设备接收到的目标语音，以及所述第一设备与发出所述目标语音的目标对象的第一距离信息，所述第一距离信息是由所述第一设备所确定出的,所述其他请求信息中包含所述其他设备接收到的所述目标语音，以及所述其他设备与所述目标对象的其他距离信息,所述其他距离信息是由所述其他设备所确定出的；
37.步骤s204，识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；
38.步骤s206，基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备；
39.步骤s208，基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
40.通过上述步骤，通过接收第一设备发送的第一请求信息以及其他设备发送的其他请求信息，其中，第一请求信息中包含第一设备接收到的目标语音以及第一设备所确定出的第一设备与发出目标语音的目标对象的第一距离信息，其他请求信息中包含其他设备接收到的目标语音，以及其他设备所确定出的其他设备与目标对象的其他距离信息；再识别目标语音，以得到第一识别结果，其中，第一识别结果中包括目标语音中所包含的目标指令以及发出所述目标语音的目标对象的标识；然后，基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备，进而基于所述第一识别信息控制目标设备执行所述目标指令所指示的操作。实现了通过识别目标语音中的目标指令和发出目标语音的目标对象的标识以确定执行目标指令的目标设备的目的，解决了相关技术中存在的控制设备解锁的安全性不足的问题，进而达到了提高设备解锁的安全性的效果。
41.其中，上述步骤的执行主体可以为服务端或云端服务器，或者为配置在存储设备上的具备人机交互能力的处理器，或者为具备类似处理能力的处理设备或处理单元等，但不限于此。下面以服务端执行上述操作为例(仅是一种示例性说明，在实际操作中还可以是其他的设备或模块来执行上述操作)进行说明：
42.在上述实施例中，服务端接收第一设备发送的第一请求信息以及其他设备(例如第二设备)发送的其他请求信息(例如第二请求信息)，其中，第一请求信息中包含第一设备接收到的目标语音以及第一设备所确定出的第一设备与发出目标语音的目标对象的第一距离信息，其他请求信息(如上述第二请求信息)中包含其他设备(如上述第二设备)接收到的目标语音，以及其他设备所确定出的其他设备与目标对象的其他距离信息(例如第二距离信息)，服务端基于所述第一请求信息和所述第二请求信息识别目标语音，并得到第一识别结果，第一识别结果中包括目标语音中所包含的目标指令以及发出所述目标语音的目标对象的标识，在实际应用中，服务端可对目标语音进行语意识别，以确定出目标语音中所包含的目标指令，以及服务端可通过获取目标语音的声纹特征以确定出发出所述目标语音的目标对象的标识，即可实现对目标对象的身份的识别；然后，服务端再基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备，进而基于所述第一识别信息控制目标设备执行所述目标指令所指示的操作。通过本实施例，实现了通过识别目标语音中的目标指令和发出目标语音的目标对象的标识以确定执行
目标指令的目标设备的目的，解决了相关技术中存在的控制设备解锁的安全性不足的问题，进而达到了提高设备解锁的安全性的效果。
43.在一个可选的实施例中，识别所述目标语音，以得到第一识别结果包括：对所述目标语音进行语意识别，以确定出所述第一识别信息；获取所述目标语音的目标声纹特征；将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果，其中，所述比对结果用于指示所述目标声纹特征与预先存储的所述标准声纹特征库中所包括的任一声纹特征的相似度，所述标准声纹特征库中还包括与其中包括的标准声纹特征对应的对象的标识；基于所述比对结果得到所述第二识别信息。在本实施例中，识别所述目标语音，以得到第一识别结果包括：服务端对所述目标语音进行语意识别，以确定出所述第一识别信息；服务端获取所述目标语音的目标声纹特征，并将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果，在实际应用中，服务端预先存储了标准声纹特征库，例如，目标对象a的声纹特征，可选地，可提前采集目标对象a的多个声纹特征，例如，目标对象a发出的不同音量大小语音的声纹特征，或者目标对象a从不同角度发出的语音的声纹特征，当然，根据实际需要也可提前采集多个目标对象的多个声纹特征，并将所述声纹特征存储至标准声纹特征库，在实际应用中，标准声纹特征库中还包括与声纹特征相对应的对象的标识；在服务端获取所述目标语音的目标声纹特征之后，可将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果，该比对结果用于指示目标声纹特征与标准声纹特征库中所包括的任一声纹特征的相似度，服务端基于比对结果可得到所述第二识别信息，例如，在所述相似度达到90％(或85％，或其他值)以上的情况下，可判定出上述目标语音的声纹特征符合标准要求，在实际应用中，可确定发出该目标语音的目标对象具备操作控制上述目标设备的权限。通过本实施例，实现了对发出目标语音的目标对象的身份进行识别的目的，达到了提高设备操作的安全性的效果。
44.在一个可选的实施例中，基于所述比对结果得到所述第二识别信息包括：在基于所述比对结果确定出所述标准声纹特征库中包括有与所述目标声纹特征相似度超过预定阈值的标准声纹特征的情况下，将确定出的所述标准声纹特征对应的对象的标识确定为所述目标对象的标识，以得到所述第二识别信息。在本实施例中，基于所述比对结果得到所述第二识别信息包括：在基于比对结果确定出所述标准声纹特征库中包括有与所述目标声纹特征相似度超过预定阈值的标准声纹特征的情况下，例如，根据比对结果确定出目标声纹特征与标准声纹库中所包括的标准声纹特征的相似度超过预定阈值(如90％，或85％，或其他值)的情况下，将确定出的所述标准声纹特征对应的对象的标识确定为所述目标对象的标识，这样即可得到所述第二识别信息。通过本实施例，实现了通过目标语音的声纹特征确定出目标对象的标识的目的。
45.在一个可选的实施例中，在将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果之前，所述方法还包括：获取多个标准语音的标准声纹特征，以及，发出所述标准语音的对象的标识；将所述标准声纹特征与所述标识对应存储在所述标准声纹特征库中。在本实施例中，在将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果之前，服务端先获取多个标准语音的标准声纹特征，以及，发出所述标准语音的对象的标识，例如，标准声纹特征
可以是目标对象a发出的不同音量大小语音的声纹特征，或者目标对象a从不同角度发出的语音的声纹特征，当然，根据实际需要也可获取多个目标对象的多个声纹特征，以及每个声纹特征所对应的对象的标识；然后将所述标准声纹特征与所述标识对应存储在所述标准声纹特征库中。
46.在上述实施例中，通过声纹特征可识别目标对象的标识，声纹识别类似于指纹识别，是生物识别技术中的一种，也称为说话人识别，是一种通过声音判别说话人身份的技术。声纹识别的理论基础是每一个声音都具有独特的特征，通过该特征能将不同人的声音进行有效的区分。具体就是基音频谱及包络、基音帧的能量、基音共振峰的出现频率及其轨迹等。表1为人体不同特征的特点，如表1所示。
47.表1
[0048][0049]
从表1中可看出，声纹识别具有诸多优点。声纹识别可分为两类：即说话人确认技术和说话人辨认技术，说话人确认技术是用于判断未知说话人是否为某个指定人；说话人辨认技术则是用于辨认未知说话人是已记录说话人中的哪一位。通常理解的都是说话人辨认技术，常常应用于刑侦破案、罪犯跟踪、国防监听、个性化应用等等，说话人确认技术常常应用于证券交易、银行交易、公安取证、个人电脑声控锁、汽车声控锁、身份证、信用卡的识别等。如上述实施例中，采用的是说话人辨认技术，即从用户发出的控制语音中辨识出是哪个用户。
[0050]
在一个可选的实施例中，基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备包括：基于所述第二识别信息确定出所述第一设备和所述其他设备中包括的允许由所述目标对象控制的执行设备；基于所述第一距离信息以及所述其他距离信息从所述执行设备中确定出距离所述目标对象最近的所述目标设备。在本实施例中，服务端基于所述第二识别信息、所述第一距离信息以及所述其他请求信息(如上述第二请求信息)中所包含的其他距离信息(如上述第二距离信息)来确定用于执行所述目标指令的目标设备包括：基于第一识别结果中包括的第二识别信息确定出所述第一设备和所述其他设备中包括的允许由目标对象控制的执行设备，即根据第二识别信息所指示的目标对象的标识确定出允许由该目标对象控制的执行设备，然后，基于所述第一距离信息以及其他距离信息从所述执行设备中确定出距离所述目标对象最近的所述目标设备，可选地，在实际应用中，结合设备与目标对象的距离信息以判断目标对象是否需要执行指令，可实现减少误操作的目的。
[0051]
在一个可选的实施例中，在确定所述目标设备为所述第一设备的情况下，基于所述第一识别信息控制所述第一设备执行所述目标指令所指示的操作包括：在确定所述第一设备处于休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第一控制指令，
以控制所述第一设备执行唤醒操作，并在唤醒之后执行所述目标指令所指示的操作；在确定所述第一设备处于非休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第二控制指令，以控制所述第一设备直接执行所述目标指令所指示的操作。在本实施例中，在确定所述目标设备为所述第一设备的情况下，且在确定所述第一设备处于休眠状态的情况下，服务端基于所述第一识别信息向所述第一设备发送第一控制指令，以控制所述第一设备执行唤醒操作，并在唤醒之后执行所述目标指令所指示的操作，即在目标设备处于休眠状态的情况下，上述第一控制指令可控制第一设备先执行唤醒再执行与目标指令相对应的响应操作；而当确定所述第一设备处于非休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第二控制指令，以控制所述第一设备直接执行所述目标指令所指示的操作；通过本实施例，实现了对目标设备进行控制的目的。
[0052]
在本实施例中还提供了一种设备控制方法，图3是根据本发明实施例的设备控制方法的流程图二，如图3所示，该流程包括如下步骤：
[0053]
步骤s302，在第一设备接收到目标语音的情况下，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息；
[0054]
步骤s304，将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端，以指示所述服务端执行如下操作：识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行所述目标指令的目标设备，并基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
[0055]
通过上述步骤，在第一设备接收到目标语音的情况下，确定出第一设备与发出目标语音的目标对象的第一距离信息，再将包含目标语音及第一距离信息的第一请求信息发送给服务端，以指示服务端执行如下操作：识别目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示目标语音中包含的目标指令，所述第二识别信息用于指示目标对象的标识；然后，基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行目标指令的目标设备，并基于所述第一识别信息控制目标设备执行目标指令所指示的操作。实现了通过对目标语音中的目标指令和发出目标语音的目标对象进行识别以确定第一设备是否为目标设备的目的，解决了相关技术中存在的控制设备解锁的安全性不足的问题，进而达到了提高设备解锁的安全性的效果。
[0056]
其中，上述步骤的执行主体可以为设备，例如，智能设备，或其他终端设备，或者为配置在存储设备上的具备人机交互能力的处理器，或者为具备类似处理能力的处理设备或处理单元等，但不限于此。下面以智能设备执行上述操作为例(仅是一种示例性说明，在实际操作中还可以是其他的设备或模块来执行上述操作)进行说明：
[0057]
在上述实施例中，在第一设备(例如智能设备a)接收到目标语音的情况下，确定出第一设备与发出目标语音的目标对象的第一距离信息，在实际应用中，第一设备可通过在设备中设置麦克风阵列并按照预定算法对麦克风阵列中的各个麦克风所接收到的语音信号进行计算，以确定出第一设备与发出目标语音的目标对象的第一距离信息，第一设备再
将包含目标语音及第一距离信息的第一请求信息发送给服务端，以指示服务端执行如下操作：识别目标语音，以得到第一识别结果，其中，第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示目标语音中包含的目标指令，所述第二识别信息用于指示目标对象的标识；然后，基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行目标指令的目标设备，并基于所述第一识别信息控制目标设备执行目标指令所指示的操作。通过本实施例，实现了通过对目标语音中的目标指令和发出目标语音的目标对象的标识进行识别从而确定出第一设备是否为目标设备的目的，解决了相关技术中存在的控制设备解锁的安全性不足的问题，进而达到了提高设备解锁的安全性的效果。
[0058]
在一个可选的实施例中，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息包括：按照预定算法对所述第一设备中包括的麦克风阵列中的各个麦克风所接收到的语音信号进行计算，以确定出所述第一设备与所述目标对象的第一距离信息。在本实施例中，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息包括：按照预定算法对所述第一设备中包括的麦克风阵列中的各个麦克风所接收到的语音信号进行计算，以确定出所述第一设备与所述目标对象的第一距离信息，例如，基于麦克风阵列的声源定位算法进行计算，以确定出第一设备与目标对象的第一距离信息，通过本实施例，可实现对发出目标语音的目标对象的位置信息进行确定的目的。
[0059]
在一个可选的实施例中，所述预定算法包括以下方法至少之一：基于波束形成的方法；基于高分辨率谱估计的方法；基于时间差进行定位的方法。在实际应用中，基于麦克风阵列的声源定位算法划分为三类：一是基于波束形成的方法；二是基于高分辨率谱估计的方法；三是基于时间差进行定位(tdoa)的方法。
[0060]
其中，基于波束形成的方法是应用最广泛的，基于最大输出功率的可控波束形成技术就是将各阵元采集到的信号进行加权求和形成波束，再通过搜索声源的可能位置来引导该波束，修改权值使得传声器阵列的输出信号功率最大，该方法既能在时域中使用，也能在频域中使用。它在时域中的时间平移等价于在频域中的相位延迟，在频域处理中，首先使用一个包含自谱和互谱的矩阵，称之为互谱矩阵(cross
‑
spectral matrix，csm)，在每个感兴趣频率之处，阵列信号的处理给出了在每个给定的空间扫描网格点上或每个信号到达方向(direction of arrival，doa)的能量水平。因此，阵列表示了一种与声源分布相关联的响应求和后的数量。这种方法适用于大型麦克风阵列，对测试环境适应性强，图4是根据本发明实施例的声源定位算法原理图一，如图4所示，使用波束形成算法，先决条件是远场声源(近场声源用tdoa)，这样可以假设入射声波都是平行的，平行的声场，如果入射角度与麦克风平面垂直，则能同时到达各个麦克风，如果不垂直，则出现如图4所示的现象，声场到达每个麦克风都会有延时，这个延时大小是由入射角度而定。
[0061]
图5是根据本发明实施例的声源定位算法原理图二，如图5所示，从图5中可看出：不同的入射角度，叠加出来的最终波形强度是不一样的，如θ＝
‑
45度，几乎没有信号，θ＝0度，微微有点信号，θ＝45度，信号达到最强。这说明把原来没有极性的单支麦克风组装成一个阵列后，整个阵列是有极性的，可以引出下一个极性图。图6是根据本发明实施例的声源定位算法原理图三，如图6所示，每个麦克风阵列都是一个方向阵，这个方向阵的指向性可通过时域算法delay&sum简单实现，控制不同的delay，实现不同方向的指向，这个方向阵指
向可控相当于给了一个空间滤波器，可以先把定位区域进行网格划分，再通过每个网格点的delay时间对各个麦进行时域delay，并最终把它sum起来，就可以算出每个网格的声压，最终得到每个网格的相对声压，就可以出噪声源定位的全息彩图了。
[0062]
在一个可选的实施例中，在将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端之后，所述方法还包括：接收所述服务端发送的第一控制指令，其中，所述第一控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；基于所述第一控制指令执行唤醒操作，以及，在唤醒之后执行所述目标指令所指示的操作；或者，接收所述服务端发送的第二控制指令，其中，所述第二控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；基于所述第二控制指令直接执行所述目标指令所指示的操作。在本实施例中，上述第一设备在将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端之后，接收服务端发送的第一控制指令，例如，在实际应用中，当第一设备处于休眠状态时，第一控制指令为服务端在确定第一设备为目标设备的情况下发送给第一设备的，然后，第一设备基于所述第一控制指令执行唤醒操作，以及，在唤醒之后执行所述目标指令所指示的操作；或者，上述第一设备在将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端之后，接收所述服务端发送的第二控制指令，其中，所述第二控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的，基于所述第二控制指令直接执行所述目标指令所指示的操作，例如，当第一设备处于已唤醒状态的情况下，基于第二控制指令直接执行与目标指令相对应的响应操作。通过本实施例，实现了对第一设备进行控制的目的。
[0063]
显然，上述所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。
[0064]
下面结合实施例对本发明进行具体说明：
[0065]
图7是根据本发明具体实施例的设备控制方法的流程图一，如图7所示，该流程包括如下步骤：
[0066]
s702，智能设备(对应于前述第一设备)利用麦克风阵列采集用户输入语音控制指令(对应于前述目标语音)；
[0067]
s704，智能设备发送语音信号到控制服务器(对应于前述服务端)；
[0068]
s706，智能设备发送位置信息到控制服务器；
[0069]
需要说明的是，智能设备在采集到用户输入的语音控制指令后，利用麦克风阵列定位算法计算出用户的位置信息，再将位置信息发送给控制服务器；
[0070]
s708，控制服务器用语音识别技术识别指令信息；
[0071]
s710，同时控制服务器通过声纹识别技术识别出上述语音的声纹特征；
[0072]
s712，基于语音的声纹特征确定出对应的发出语音的用户(对应于前述目标对象)的标识；
[0073]
s714，根据确定出的用户的标识判断用户是否具有执行权限；
[0074]
s716，同时控制服务器根据用户的位置信息判断是否响应指令，例如，用户到智能设备的距离小于2米则响应指令；
[0075]
需要说明的是，上述步骤s708，s710，s716的执行不分先后顺序，可同时执行，也可不同时执行；
[0076]
s718，结合上述步骤s708，s714，s716中执行情况确定响应动作，即在确定目标对
象(即上述用户)具有执行权限及位置信息满足要求的情况下，确定出与语音中的指令相对应的响应动作，并返回相应的结果给智能设备，以控制智能设备执行相应的操作。
[0077]
在上述步骤中，智能设备根据上述步骤s714的结果做出交互响应，前提是上述步骤s714的结果为用户具有执行权限；智能设备根据上述步骤s708，s714，s716的结果，执行相应的动作，前提是确定用户具有执行权限以及位置信息满足要求。
[0078]
需要说明的是，上述控制服务器通常提前进行声纹注册，即采集用户的声音数据，根据声纹识别算法计算出对应的声纹特征，并建立数据库存放声纹特征数据。图8是根据本发明具体实施例的设备控制方法的流程图二，如图8所示，该流程包括如下步骤：
[0079]
s802，采集每个用户的声纹，在实际应用中，可采集多个用户的声纹；
[0080]
s804，智能设备上传每个用户的声纹特征到控制服务器数据库；
[0081]
s806，设定智能设备的解锁口令；
[0082]
s808，智能设备上传口令到控制服务器。
[0083]
通过上述步骤，实现了对用户的声纹进行注册及对智能设备的解锁口令进行设备的目的。
[0084]
通过上述实施例，使用声纹识别技术减少语音唤醒步骤，达到了提高用户体验的效果，使用声纹识别技术达到了增加语音唤醒的安全性的效果，使用麦克风阵列定位技术获取用户的位置信息，达到了减少误操作的可能性的效果。
[0085]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。
[0086]
在本实施例中还提供了一种设备控制装置，图9是根据本发明实施例的设备控制装置的结构框图一，如图9所示，该装置包括：
[0087]
第一接收模块902，用于接收第一设备发送的第一请求信息，以及其他设备发送的其他请求信息，其中，所述第一请求信息中包含所述第一设备接收到的目标语音，以及所述第一设备与发出所述目标语音的目标对象的第一距离信息，所述第一距离信息是由所述第一设备所确定出的,所述其他请求信息中包含所述其他设备接收到的所述目标语音，以及所述其他设备与所述目标对象的其他距离信息,所述其他距离信息是由所述其他设备所确定出的；
[0088]
识别模块904，用于识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；
[0089]
第一确定模块906，用于基于所述第二识别信息、所述第一距离信息以及所述其他距离信息来确定用于执行所述目标指令的目标设备；
[0090]
控制模块908，用于基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
[0091]
在一个可选的实施例中，上述识别模块904包括：识别单元，用于对所述目标语音
进行语意识别，以确定出所述第一识别信息；获取单元，用于获取所述目标语音的目标声纹特征；比对单元，用于将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果，其中，所述比对结果用于指示所述目标声纹特征与预先存储的所述标准声纹特征库中所包括的任一声纹特征的相似度，所述标准声纹特征库中还包括与其中包括的标准声纹特征对应的对象的标识；获得单元，用于基于所述比对结果得到所述第二识别信息。
[0092]
在一个可选的实施例中，上述获得单元包括：获得子单元，用于在基于所述比对结果确定出所述标准声纹特征库中包括有与所述目标声纹特征相似度超过预定阈值的标准声纹特征的情况下，将确定出的所述标准声纹特征对应的对象的标识确定为所述目标对象的标识，以得到所述第二识别信息。
[0093]
在一个可选的实施例中，上述装置还包括：获取模块，用于在将所述目标声纹特征与预先存储的标准声纹特征库中包括的标准声纹特征进行比对，以得到比对结果之前，获取多个标准语音的标准声纹特征，以及，发出所述标准语音的对象的标识；存储模块，用于将所述标准声纹特征与所述标识对应存储在所述标准声纹特征库中。
[0094]
在一个可选的实施例中，上述第一确定模块906包括：第一确定单元，用于基于所述第二识别信息确定出所述第一设备和所述其他设备中包括的允许由所述目标对象控制的执行设备；第二确定单元，用于基于所述第一距离信息以及所述其他距离信息从所述执行设备中确定出距离所述目标对象最近的所述目标设备。
[0095]
在一个可选的实施例中，上述控制模块908包括：第一控制单元，用于在确定所述目标设备为所述第一设备的情况下，且在确定所述第一设备处于休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第一控制指令，以控制所述第一设备执行唤醒操作，并在唤醒之后执行所述目标指令所指示的操作；第二控制单元，用于在确定所述第一设备处于非休眠状态的情况下，基于所述第一识别信息向所述第一设备发送第二控制指令，以控制所述第一设备直接执行所述目标指令所指示的操作。
[0096]
在本实施例中还提供了一种设备控制装置，图10是根据本发明实施例的设备控制装置的结构框图二，如图10所示，该装置包括：
[0097]
第二确定模块1002，用于在第一设备接收到目标语音的情况下，确定出所述第一设备与发出所述目标语音的目标对象的第一距离信息；
[0098]
发送模块1004，用于将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端，以指示所述服务端执行如下操作：识别所述目标语音，以得到第一识别结果，其中，所述第一识别结果中包括第一识别信息和第二识别信息，所述第一识别信息用于指示所述目标语音中包含的目标指令，所述第二识别信息用于指示所述目标对象的标识；基于所述第二识别信息、所述第一距离信息以及来自其他设备的其他请求信息中所包含的其他距离信息来确定用于执行所述目标指令的目标设备，并基于所述第一识别信息控制所述目标设备执行所述目标指令所指示的操作。
[0099]
在一个可选的实施例中，上述第二确定模块1002包括：第三确定单元，用于按照预定算法对所述第一设备中包括的麦克风阵列中的各个麦克风所接收到的语音信号进行计算，以确定出所述第一设备与所述目标对象的第一距离信息。
[0100]
在一个可选的实施例中，上述预定算法包括以下方法至少之一：基于波束形成的
方法；基于高分辨率谱估计的方法；基于时间差进行定位的方法。
[0101]
在一个可选的实施例中，上述装置还包括：第二接收模块，用于在将包含所述目标语音及所述第一距离信息的第一请求信息发送给服务端之后，接收所述服务端发送的第一控制指令，其中，所述第一控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；执行模块，用于基于所述第一控制指令执行唤醒操作，以及，在唤醒之后执行所述目标指令所指示的操作；或者，用于接收所述服务端发送的第二控制指令，其中，所述第二控制指令为所述服务端在确定所述目标设备为所述第一设备的情况下所发送的；基于所述第二控制指令直接执行所述目标指令所指示的操作。
[0102]
需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。
[0103]
本发明的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0104]
在一个示例性实施例中，上述计算机可读存储介质可以包括但不限于：u盘、只读存储器(read
‑
only memory，简称为rom)、随机存取存储器(random access memory，简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
[0105]
本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0106]
在一个示例性实施例中，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。
[0107]
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。
[0108]
显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。
[0109]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音识别测试方法、装置、测试设备及存储介质与流程

设备控制方法、装置、存储介质及电子装置与流程

相关文章

最热文献