语音控制设备的确定方法、装置、电子设备及存储介质与流程

2022-10-29 02:11:45 来源：中国专利 TAG：

1.本技术涉及电器智能语音交互系统领域，尤其涉及一种语音控制设备的确定方法、装置、电子设备及存储介质。

背景技术：

2.随着智能化席卷家电行业，各种智能电器陆续进行了语音交互功能的上线，各个品牌纷纷也创造了自己的语音交互虚拟网际互连协议(internet protocol，ip)及语音交互系统，而用户家中往往存在着多个同品牌的语音交互设备，这些设备的语音唤醒词相同，因此需要精确的判断用户当前想要使用语音控制的设备。
3.然而当家中的不同位置存在多个语音交互设备时，由于唤醒词相同，会同时对用户指令进行拾取，而用户的语音指令往往十分模糊，难以对用户实时想要语音控制的设备进行区分，若判断错误可能会给用户带来较差的语音交互体验甚至及其的误触发可能造成电器使用的安全隐患，如何能够通过系统方案设计判断用户当前想要控制的语音设备十分重要。

技术实现要素：

4.有鉴于此，本技术的主要目的在于提供一种语音控制设备的确定方法、装置、电子设备及存储介质。
5.本技术实施例的技术方案是这样实现的：
6.本技术实施例提供了一种语音控制设备的确定方法，所述方法包括：
7.基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；
8.根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；
9.基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。
10.上述方案中，所述多个设备均具备语音交互功能；所述方法还包括：
11.在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息；所述第一设备为所述多个设备中任一设备；所述第二设备为所述多个设备中除所述第一设备以外的任一设备。
12.上述方案中，所述根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
13.根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户在所述每个设备所属空间内的位置信息；
14.基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述
声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息。
15.上述方案中，所述声源特征信息包括声源朝向信息；所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
16.基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源朝向信息。
17.上述方案中，所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源朝向信息，包括：
18.基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位；
19.基于所述每个设备相对于所述用户的面部朝向的方位和所述用户在所述每个设备所属空间内的位置信息，确定所述用户发出的声音指令对应的声源朝向信息。
20.上述方案中，所述语音特征信息至少包括声音的强度和频率；所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位，包括：
21.基于所述每个设备接收所述声音指令对应的声音的强度和频率，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
22.上述方案中，所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位，包括：
23.获取所述每个设备接收所述声音指令对应的样本语音特征信息，以及在所述用户发出声音指令状态的情况下所述每个设备相对于所述用户的面部朝向的样本方位；
24.基于所述每个设备接收所述声音指令对应的样本语音特征信息和所述每个设备相对于所述用户的面部朝向的样本方位，训练得到目标模型；
25.基于所述目标模型、所述每个设备接收所述声音指令对应的语音特征信息，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
26.上述方案中，所述声源特征信息包括声源移动信息，所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
27.获取所述用户发出的声音指令对应的声源移动方向；
28.基于所述用户发出的声音指令对应的声源特征信息和声源移动方向，确定所述用户发出的声音指令对应的声源移动信息。
29.上述方案中，所述基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备，包括：
30.基于预设角度阈值和所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的至少一个目标设备；
31.基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
32.上述方案中，所述基于预设方式，在所述至少一个目标设备中确定与所述声音指
令匹配的目标设备，包括：
33.基于所述用户与所述至少一个目标设备的距离，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
34.上述方案中，所述基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备，包括：
35.对所述用户发出的声音指令进行语音识别，得到所述用户的控制信息；其中，所述控制信息至少包括所述用户需要的功能；
36.基于所述控制信息，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
37.本技术实施例还提供了一种语音控制设备的确定装置，包括：
38.获取模块，用于基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；
39.第一确定模块，用于根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；
40.第二确定模块，用于基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。
41.本技术实施例还提供了一种电子设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现本技术实施例提供的语音控制设备的确定方法。
42.本技术实施例还提供了一种存储介质，所述存储介质存储有可执行指令，当所述可执行指令被至少一个处理器执行时，实现本技术实施例提供的语音控制设备的确定方法。
43.本技术实施例提供的语音控制设备的确定方法、装置、电子设备及存储介质，所述确定方法包括：基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。通过多个设备中的每个设备接收所述声音指令对应的语音特征信息和所述每个设备的位置信息，确定所述用户发出的声音指令对应的声源特征信息，以所述声源特征信息为依据对多个设备进行筛选，实现更加精准地在多个设备同时接收所述声音指令的情况下，在所述多个设备中确定与所述声音指令匹配的目标设备。
附图说明
44.图1为本技术实施例语音控制设备的确定方法流程示意图；
45.图2为本技术实施例用户与各个语音控制设备的信息交互示意图；
46.图3为本技术实施例语音控制设备的确定方法工作流程示意图；
47.图4为本技术实施例语音控制设备的确定装置结构示意图；
48.图5为本技术实施例语音控制设备的确定装置连接示意图；
49.图6为本技术实施例语音控制设备的确定装置部件示意图；
50.图7为本技术实施例电子设备的组成结构示意图。
具体实施方式
51.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对发明的具体技术方案做进一步详细描述。以下实施例用于说明本技术，但不用来限制本技术的范围。
52.精确的判断用户语音控制指令的使用意图，选择正确的机器进行指令的应答的反应十分重要，相关技术中，对于厨房中多个同品牌语音设备的唤醒及用户当前使用意图的判断，一般有两种方案思路，一种是通过计算不同设备接收用户声音所需时间计算用户与不同设备间的距离，以用户距离想要控制的机器最近为前提条件下进行播报或被控制设备的选择；另一类是通过对于用户的指令进行语义解析，解析出用户在表达控制指令过程中所蕴含的设备选择信息，以达到响应设备精确选择的效果。
53.相关技术中，基于用户距离设备距离的方法虽然能够在大部分条件下实现机器的精确语音控制交互，但用户在部分情况下距离想要控制的设备较远就会使该类方式失效，不具有普适性；而基于用户指令语义解析的方式存粹依靠用户表达的语音交互指令，在大部分情况下能够实现机器的精确控制，但在部分情况下，用户所表达的控制指令对于特定机器的语义指向性并不明显，导致用户有图语义解析失败造成机器误触发，同样不具有普适性和鲁棒性。
54.基于此，在本技术的各种实施例中，通过不同语音控制设备的信息共享获取设备与用户声源的空间相对位置关系，并通过不同语音控制设备采集的用户声音指令特征的区别分析出用户的发声朝向及动态移动方向向量信息，根据用户在进行电器语音控制时会习惯朝向目标电器的现象，通过朝向信息进行电器筛选以缩小候选响应电器的决策范围，辅助进行用户语音控制意图判，扩大现有两种方案的适用范围，增强整体决策系统的普适性。
55.本技术实施例提供了一种语音控制设备的确定方法，图1为本技术实施例语音控制设备的确定方法流程示意图，如图1所示，所述方法包括：
56.步骤101：基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；
57.步骤102：根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；
58.步骤103：基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。
59.所述语音控制设备可以根据实际情况确定，在此不做限定。作为一种示例，所述语音控制设备可以是家中各种厨房电器、生活电器以及语音中控设备。其中，所述厨房电器可以是微波、蒸、烤箱，料理机、智能灶、冰箱等；所述生活电器可以是扫地机、电风扇、空调、智能开关等；所述语音中控设备可以是各种智能音箱、中控平台等。
60.所述语音控制设备可以具备对所述用户发出的声音指令进行采集的功能，所述语音控制设备可以包括语音交互模块，所述语音交互模块包括声音采集单元，所述声音采集单元用于对所述用户发出的声音指令进行获取，其中，设置在不同位置的语音控制设备可以对所述用户发出的声音指令进行不同的方位的获取。
61.所述接收所述声音指令对应的语音特征信息的语音控制设备的个数可以根据实际情况确定，在此不做限定。作为一种示例，所述语音控制设备的个数可以是3个或3个以上。
62.本技术实施例提供一种语音控制设备的确定方法，基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。通过多个设备中的每个设备接收所述声音指令对应的语音特征信息和所述每个设备的位置信息，确定所述用户发出的声音指令对应的声源特征信息，以所述声源特征信息为依据对多个设备进行筛选，实现更加精准地在多个设备同时接收所述声音指令的情况下，在所述多个设备中确定与所述声音指令匹配的目标设备。
63.在本技术的一种可选实施例中，所述多个设备均具备语音交互功能；所述方法还包括：
64.在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息；所述第一设备为所述多个设备中任一设备；所述第二设备为所述多个设备中除所述第一设备以外的任一设备。
65.在本实施例中，所述语音控制设备具备语音交互功能可以是，所述语音控制设备具备与除自身设备以外的设备进行语音交互的功能，所述语音控制设备可以包括语音交互模块，所述语音交互模块可以包括声波交互单元，所述声波交互单元用于向除自身设备以外的设备发射声波，以及接收除自身设备以外的设备发射的声波。
66.所述声波信号可以根据实际情况确定，在此不做限定。作为一种示例，所述声波信号可以包括所述声波信号从发出至被接收经过的时间，以及所述声波辛哈在空气中传播的速度。所述在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息可以为，在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号的时间和速度确定所述第一设备和所述第二设备之间的距离，基于所述第一设备和所述第二设备之间的距离确定每个设备的位置信息。
67.所述声波信号可以根据实际情况确定，在此不做限定。作为一种示例，所述声波信号还包括所述声波信号的发出设备信息和所述声波信号的接收设备信息。所述在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息可以为，在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述第一设备信息和所述第二设备信息，基于所述第一设备信息和所述第二设备信息确定每个设备的位置信息。
68.所述基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息之后，可以根据所述每个设备的相对位置，确定所述每个设备所在的空间相对位置网。
69.在一些实施例中，可以预先设置所述每个设备的空间位置模型，基于所述空间位置模型确定所述每个设备的相对位置，从而确定所述每个设备所属空间内的空间相对位置网。
70.在一些实施例中，所述基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息的设备可以根据实际情况确定，所述设备可以是家电中控设备，所述家电中控设备包括中央处理模块，所述中央处理模块用于基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息。作为一种示例，所述家电中控设备可以是所述多个设备中的任一个设备，所述家电中控设备也可以是除所述多个设备以外的基站设备。
71.在本技术的一种可选实施例中，所述根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
72.根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户在所述每个设备所属空间内的位置信息；
73.基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息。
74.在本实施例中，所述每个设备接收所述声音指令对应的语音特征信息可以包括所述每个设备与所述声音指令之间的距离信息。所述根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户在所述每个设备所属空间内的位置信息可以为，所述根据所述每个设备的位置信息和所述每个设备与所述声音指令之间的距离信息，确定所述用户在所述每个设备所属空间内的位置信息。
75.所述确定所述用户在所述每个设备所属空间内的位置信息可以为，确定所述用户在所述每个设备所属空间内的空间相对位置网内的位置信息。
76.在本技术的一种可选实施例中，所述声源特征信息包括声源朝向信息；所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
77.基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源朝向信息。
78.在本技术的一种可选实施例中，所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源朝向信息，包括：
79.基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位；
80.基于所述每个设备相对于所述用户的面部朝向的方位和所述用户在所述每个设备所属空间内的位置信息，确定所述用户发出的声音指令对应的声源朝向信息。
81.在本实施例中，所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位可以为，基于处于所述用户不同方位的多个设备接收的用户声音指令所包含的语音特征信息的差异，确定所述每个设备相对于所述用户的面部朝向的方位。
82.所述确定所述每个设备相对于所述用户的面部朝向的方位可以为，在当前所述用户的面部朝向的情况下，确定所述用户前方、后方和侧方的设备，从而确定所述每个设备相对于所述用户的面部朝向的方位。
83.所述基于所述每个设备相对于所述用户的面部朝向的方位和所述用户在所述每个设备所属空间内的位置信息，确定所述用户发出的声音指令对应的声源朝向信息可以为，在同一时刻下，基于在当前所述用户的面部朝向的情况下所述用户前方、后方和侧方的设备和所述用户在所述每个设备所属空间内的位置信息，确定所述用户发出的声音指令对应的声源朝向信息。
84.在本技术的一种可选实施例中，所述语音特征信息至少包括声音的强度和频率；所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位，包括：
85.基于所述每个设备接收所述声音指令对应的声音的强度和频率，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
86.在本实施例中，所述声音指令对应的声音的强度具有衰减的特征，且在所述用户的面部朝向的不同方位每个设备接收到的所述声音指令对应的声音的强度衰减的程度不同，例如，在所述用户的面部朝向后方的设备接收到的所述声音指令对应的声音的强度衰减的程度最快；在所述用户的面部朝向左右两侧的设备接收到的所述声音指令对应的声音的强度衰减的程度稍快；在所述用户的面部朝向前方的设备接收到的所述声音指令对应的声音的强度衰减的程度最慢。所述声音指令对应的声音的频率可以用来确定所述声音的强度衰减的程度。
87.所述基于所述每个设备接收所述声音指令对应的声音的强度和频率，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位可以为，基于所述声音指令对应的声音的频率确定的所述声音的强度衰减的程度，基于所述每个设备接收到的所述声音指令对应的声音的强度与所述声音指令对应的声音的频率确定的所述声音的强度衰减的程度，确定所述每个设备相对于所述用户的面部朝向的方位。
88.在本技术的一种可选实施例中，所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位，包括：
89.获取所述每个设备接收所述声音指令对应的样本语音特征信息，以及在所述用户发出声音指令状态的情况下所述每个设备相对于所述用户的面部朝向的样本方位；
90.基于所述每个设备接收所述声音指令对应的样本语音特征信息和所述每个设备相对于所述用户的面部朝向的样本方位，训练得到目标模型；
91.基于所述目标模型、所述每个设备接收所述声音指令对应的语音特征信息，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
92.在本实施例中，获取所述每个设备接收所述声音指令对应的样本语音特征信息，以及在所述用户发出声音指令状态的情况下所述每个设备相对于所述用户的面部朝向的样本方位可以是，在所述用户发出声音指令状态的情况下，确定所述每个设备相对于所述用户的面部朝向的样本方位，基于所述每个设备相对于所述用户的面部朝向的样本方位，确定所述每个设备接收所述声音指令对应的样本语音特征信息。
93.基于所述每个设备接收所述声音指令对应的样本语音特征信息和所述每个设备
相对于所述用户的面部朝向的样本方位，训练得到目标模型可以为，基于预设模型、所述每个设备接收所述声音指令对应的样本语音特征信息和所述每个设备相对于所述用户的面部朝向的样本方位，训练得到目标模型。
94.所述预设模型可以是深度学习网络模型，所述深度学习网络模型通过学习样本的内在规律和表示层次，得到目标模型，实现让机器能够像人一样具有分析学习能力。
95.在本技术的一种可选实施例中，所述声源特征信息包括声源移动信息，所述基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息，包括：
96.获取所述用户发出的声音指令对应的声源移动方向；
97.基于所述用户发出的声音指令对应的声源特征信息和声源移动方向，确定所述用户发出的声音指令对应的声源移动信息。
98.在本实施例中，所述获取所述用户发出的声音指令对应的声源移动方向可以是，在不同时刻下，基于所述用户的位置改变，获取所述用户发出的声音指令对应的声源移动方向。
99.所述声源移动信息可以实际情况确定，在此不做限定。作为一种示例，所述声源移动信息可以是移动向量。所述确定所述用户发出的声音指令对应的声源移动信息可以是，确定所述用户发出的声音指令对应的声源移动向量。
100.在本技术的一种可选实施例中，所述基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备，包括：
101.基于预设角度阈值和所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的至少一个目标设备；
102.基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
103.在本实施例中，图2为本技术实施例用户与各个语音控制设备的信息交互示意图。如图2所示，所述预设角度阈值可以是所述用户面部朝向的角度范围，所述预设角度阈值的大小可以根据实际情况确定，在此不做限定。
104.所述声源特征信息可以是声源朝向信息，所述声源朝向信息可以用来表征所述用户处于静止状态的情况下，所述用户发出的声源朝向。所述基于预设角度阈值和所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的至少一个目标设备可以是，基于预设角度阈值和所述用户发出的声音指令对应的声源朝向信息，在所述多个设备中确定与所述声音指令的声源朝向匹配的至少一个目标设备。
105.所述声源特征信息可以是声源移动信息，所述声源移动信息可以用来表征所述用户处于运动状态的情况下，所述用户的运动方向。所述基于预设角度阈值和所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的至少一个目标设备可以是，基于预设角度阈值和所述用户发出的声音指令对应的声源朝向信息和声源移动信息，在所述多个设备中确定与所述声音指令的声源朝向和用户运动方向匹配的至少一个目标设备。
106.在本技术的一种可选实施例中，所述基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备，包括：
107.基于所述用户与所述至少一个目标设备的距离，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
108.在本实施例中，所述基于所述用户与所述至少一个目标设备的距离，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备可以是，基于每个设备接收用户声音指令所需时间，确定所述用户与每个设备间的距离，将与所述用户距离最近的设备确定为与所述声音指令匹配的目标设备。
109.在本技术的一种可选实施例中，所述基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备，包括：
110.对所述用户发出的声音指令进行语音识别，得到所述用户的控制信息；其中，所述控制信息至少包括所述用户需要的功能；
111.基于所述控制信息，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
112.在本实施例中，所述对所述用户发出的声音指令进行语音识别，得到所述用户的控制信息可以是，对所述用户声音指令进行语义解析的语音识别，得到所述用户的控制信息，基于用户表达的语音交互指令中的控制信息，实现在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
113.在一些实施例中，所述语音控制设备可以包括响应模块，即所述目标设备可以包括响应模块。所述在所述至少一个目标设备中确定与所述声音指令匹配的目标设备之后，所述目标设备通过所述响应模块对所述声音指令进行分析，并对所述声音指令做出应答。
114.为了理解本技术实施例，以下示例说明。
115.图3为本技术实施例语音控制设备的确定方法工作流程示意图，如图3所示，语音控制设备的确定方法主要包括以下步骤：
116.第一步，使用室内的多个具有语音交互模块的语音控制设备对用户声音指令进行采集。
117.使用室内的3个或3个以上具有语音交互模块的语音控制设备对用户声音指令进行采集，基于3个或3个以上所述语音控制设备中的所述声音采集单元对所述用户发出的声音指令进行获取。
118.第二步，不同语音控制设备相互之间进行信号传递，确定各个语音控制设备在家中的相对空间位置，并结合不同语音控制设备获取的用户声音指令确定用户在设备空间内的空间相对位置网中的位置信息。
119.一方面，不同语音控制设备间进行声波信息交互，通过相互发射及接收声波，并将声波信号发送至所述家电中控设备的中央处理器，以确定彼此语音控制设备实时的相对位置并连接成空间相对位置网；另一方面，通过所述家电中控设备的中央处理器处理不同语音控制设备所采集到的用户声音指令，将用户映射入语音控制设备的空间相对位置网中。
120.第三步，根据不同方位的语音控制设备采集到的用户声音指令的语音特征信息的差异，确定用户声音指令的声源朝向信息及声源移动向量。
121.一方面，在同一时刻下，分析不同方位的语音控制设备所接收的用户声音指令的语音特征信息的差异，以区分用户当前状态前方、后方和侧方的语音控制设备，从而确定用户发出的声音指令对应的声源朝向信息；另一方面，在不同时刻根据用户发出的声音指令
对应的声源移动方向和声源朝向信息确定声源移动向量。
122.第四步，通过用户发出的声音指令对应的声源朝向信息及声源移动向量进行响应设备的筛选辅助决策，并确定最终的响应设备。
123.获取各种语音控制设备与用户相对空间位置以及用户发出的声音指令对应的声源朝向信息后，设置用户朝向的角度阈值，选择角度阈值范围内的电器作为备选响应设备；然后，结合用户当前控制意图精确决策系统从备选响应设备中进行精确判断。
124.第五步，对用户各种声音指令进行响应。
125.本技术实施例的优点在于通过确定不同语音控制设备与用户声源的空间相对位置，并通过不同语音控制设备获取的用户声音声强、频率信息分析识别用户发出指令时的面部朝向与动态移动方向，以此为依据对全屋语音控制设备进行筛选，大大缩小候选响应语音设备的范围，从而辅助进行更加精准的进行多语音控制设备存在情况下的基于用户意图的当前响应设备决策，该方法可做为辅助方法配合其他决策判断方法使用以达到更强的普适性效果。
126.本技术实施例利用用户在发出语音控制时习惯性朝向想要控制设备的特点，利用屋内多个语音控制设备在不同方位采集的用户指令信息构建语音控制设备与用户的相对空间位置网，并分析不同方位语音控制设备获取用户声音的特征信息判断用户发出指令时的面部朝向及移动方向向量，并以此为条件对室内的所有语音控制设备进行筛选，选出若干候选语音控制设备，并结合精确决策方法判断在候选语音控制设备中选择最佳的语音控制设备进行用户当前指令响应。
127.在确定了用户当前想要控制的语音控制设备后，通过相应语音控制设备的响应模块分析用户声音指令，并做出响应的应答。
128.为了实现本技术实施例的语音控制设备的确定方法，本技术实施例还提供一种语音控制设备的确定装置，设置在电子设备上，图4为本技术实施例语音控制设备的确定装置结构示意图，如图4所示，所述装置400包括：
129.获取模块401，用于基于用户发出的声音指令获取多个设备中的每个设备接收所述声音指令对应的语音特征信息；
130.第一确定模块402，用于根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征信息；
131.第二确定模块403，用于基于所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的目标设备。
132.在其他的实施例中，所述多个设备均具备语音交互功能；
133.所述装置400还包括接收模块，用于在所述多个设备中的第一设备向第二设备发送声波信号的情况下，基于所述第一设备接收所述第二设备反馈的声波信号确定所述每个设备的位置信息；所述第一设备为所述多个设备中任一设备；所述第二设备为所述多个设备中除所述第一设备以外的任一设备。
134.在其他的实施例中，所述第一确定模块402，还用于根据所述每个设备的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户在所述每个设备所属空间内的位置信息；基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源特征
信息。
135.在其他的实施例中，所述声源特征信息包括声源朝向信息；所述第一确定模块402，还用于基于所述用户在所述每个设备所属空间内的位置信息和所述每个设备接收所述声音指令对应的语音特征信息，确定所述用户发出的声音指令对应的声源朝向信息。
136.在其他的实施例中，所述第一确定模块402，还用于基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位；基于所述每个设备相对于所述用户的面部朝向的方位和所述用户在所述每个设备所属空间内的位置信息，确定所述用户发出的声音指令对应的声源朝向信息。
137.在其他的实施例中，所述语音特征信息至少包括声音的强度和频率；所述基于所述每个设备接收所述声音指令对应的语音特征信息，确定所述每个设备相对于所述用户的面部朝向的方位，包括：
138.基于所述每个设备接收所述声音指令对应的声音的强度和频率，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
139.在其他的实施例中，所述第一确定模块402，还用于获取所述每个设备接收所述声音指令对应的样本语音特征信息，以及在所述用户发出声音指令状态的情况下所述每个设备相对于所述用户的面部朝向的样本方位；基于所述每个设备接收所述声音指令对应的样本语音特征信息和所述每个设备相对于所述用户的面部朝向的样本方位，训练得到目标模型；基于所述目标模型、所述每个设备接收所述声音指令对应的语音特征信息，在所述用户发出声音指令状态的情况下确定所述每个设备相对于所述用户的面部朝向的方位。
140.在其他的实施例中，所述声源特征信息包括声源移动信息，所述第一确定模块402，还用于获取所述用户发出的声音指令对应的声源移动方向；基于所述用户发出的声音指令对应的声源特征信息和声源移动方向，确定所述用户发出的声音指令对应的声源移动信息。
141.在其他的实施例中，所述第二确定模块403，还用于基于预设角度阈值和所述用户发出的声音指令对应的声源特征信息，在所述多个设备中确定与所述声音指令匹配的至少一个目标设备；基于预设方式，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
142.在其他的实施例中，所述第二确定模块403，还用于基于所述用户与所述至少一个目标设备的距离，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
143.在其他的实施例中，所述第二确定模块403，还用于对所述用户发出的声音指令进行语音识别，得到所述用户的控制信息；其中，所述控制信息至少包括所述用户需要的功能；基于所述控制信息，在所述至少一个目标设备中确定与所述声音指令匹配的目标设备。
144.在实际应用场景中，图5为本技术实施例语音控制设备的确定装置连接示意图，如图5所示，所述装置包括语音交互模块、响应模块和中央处理模块，其中，所述中央处理模块分别与语音交互模块和响应模块连接。所述语音交互模块和响应模块设置在不同的语音控制设备上，所述中央处理模块设置在家电中控设备上。
145.所述语音交互模块包括声音采集单元和声波交互单元，所述声音采集单元用于对所述用户发出的声音指令进行获取；所述声波交互单元用于向除自身设备以外的设备发射声波，以及接收除自身设备以外的设备发射的声波。所述响应模块用于对所述声音指令进
行分析，并对所述声音指令做出应答。
146.图6为本技术实施例语音控制设备的确定装置部件示意图，如图6所示，所述家电中控设备的中央处理模块包括输入组件、分析组件、生成组件和决策组件。所述输入单元用于获取多个设备中的每个设备接收所述声音指令对应的语音特征信息，以及获取所述第一设备接收所述第二设备反馈的声波信号等；所述分析组件用于确定所述用户发出的声音指令对应的声源特征信息，以及确定所述每个设备的位置信息等；所述生成组件用于确定所述用户发出的声音指令对应的声源特征信息等；所述决策组件用于在所述多个设备中确定与所述声音指令匹配的目标设备。
147.需要说明的是：上述实施例提供的语音控制设备的确定装置在进行语音控制设备确定时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的语音控制设备的确定装置与语音控制设备的确定方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
148.基于上述程序模块的硬件实现，且为了实现本技术实施例的方法，本技术实施例还提供一种电子设备700，所述电子设备700包括存储器701和处理器702，所述存储器701存储有可在处理器上运行的计算机程序，所述处理器702执行所述程序时，实现本技术实施例提供的语音控制设备的确定方法。
149.实际应用时，图7为本技术实施例电子设备的组成结构示意图，如图7所示，所述电子设备700中的各个组件通过总线系统703耦合在一起。可理解，总线系统703用于实现这些组件之间的连接通信。总线系统703除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图7中将各种总线都标为总线系统703。
150.本技术实施例还提供一种存储介质，所述存储介质存储有可执行指令，当所述可执行指令被至少一个处理器执行时，实现本技术实施例提供的标定方法、或实现本技术实施例提供的定位方法。
151.在一些实施例中，存储介质可以是磁性随机存取存储器(fram，ferromagnetic random access memory)、只读存储器(rom，read only memory)、可编程只读存储器(prom，programmable read-only memory)、可擦除可编程只读存储器(eprom，erasable programmable read-only memory)、电可擦除可编程只读存储器(eeprom，electrically erasable programmable read-only memory)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(cd-rom，compact disc read-only memory)等存储器；也可以是包括上述存储器之一或任意组合的各种设备。
152.在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
153.作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(html，hyper text markup language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。
154.作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。
155.需要说明的是：“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。
156.另外，本技术实施例所记载的技术方案之间，在不冲突的情况下，可以任意组合。
157.以上所述，仅为本技术的较佳实施例而已，并非用于限定本技术的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于人工智能和物联网的音频数据加密方法及解密方法与流程

语音控制设备的确定方法、装置、电子设备及存储介质与流程

相关文献

最热文献