一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音唤醒方法、电子设备及芯片系统与流程

2022-03-01 18:06:12 来源:中国专利 TAG:


1.本技术实施例涉及多设备交互领域,尤其涉及一种多设备的语音唤醒方法、电子设备及 芯片系统。


背景技术:

2.随着电子设备的智能化程度越来越高,越来越多的电子设备支持人机交互功能,而语音 唤醒作为用户和电子设备进行人机交互的入口非常重要。
3.通常,同一品牌的电子设备的语音唤醒词相同,甚至一些不同品牌的电子设备的语音唤 醒词也可能相同。当一个应用场景中存在多个具有相同语音唤醒词的电子设备时,例如,家 居环境中多个电子设备的唤醒指令对应的语音唤醒词均为“小e小e”时,用户说出唤醒指 令对应的语音唤醒词“小e小e”,该场景下可能多个电子设备均会被唤醒;当用户继续说出 动作指令对应的语音唤醒词“播放音乐”时,可能该场景下的多个电子设备均会对语音唤醒 词做出响应。


技术实现要素:

4.本技术实施例提供一种语音唤醒方法、电子设备及芯片系统,解决多设备的场景中,多 个电子设备均会被用户的语音信息唤醒,且多个电子设备均会对用户的语音信息做出响应的 问题。
5.为达到上述目的,本技术采用如下技术方案:
6.第一方面,本技术实施例提供一种语音唤醒方法,包括:
7.响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行匹配;若语 音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设备对语音信息的竞价 值,并监听第二设备发送的信息,其中,第一设备对语音信息的竞价值为第一设备对语音信 息对应的唤醒操作的支持能力;响应于监听到的第二设备发送的信息,第一设备基于第二设 备发送的信息确定第一设备是否为唤醒设备;若第一设备为唤醒设备,则第一设备执行与语 音信息对应的唤醒操作。
8.本技术实施例中,为每个电子设备设置该电子设备对语音信息的竞价值,并设置电子设 备之间(第一设备和第二设备之间)通过竞价值交互的过程确定出唤醒设备,通过确定出的 唤醒设备执行与语音信息对应的唤醒操作,从而避免了多个电子设备的应用场景中,多个电 子设备均会被用户的语音信息唤醒,且多个电子设备均会对用户的语音信息做出响应的问题。
9.在第一方面的一种可能的实现方式中,第二设备为与第一设备位于同一网络中的电子设 备,第二设备发送的信息包括第二设备对语音信息的竞价值;
10.相应的,第一设备基于第二设备发送的信息确定第一设备是否为唤醒设备包括:若第一 设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,存在至少一个第二设备 对语音信息的竞价值高于第一设备对语音信息的竞价值,则确定第一设备不
为唤醒设备;若 第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低于第一设备对语音 信息的竞价值,则确定第一设备为唤醒设备。
11.在第一方面的一种可能的实现方式中,第一设备基于第二设备发送的信息确定第一设备 是否为唤醒设备还包括:
12.若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,不存在高于 第一设备对语音信息的竞价值、且存在等于第一设备对语音信息的竞价值,则将竞价值等于 第一设备对语音信息的竞价值的第二设备记为第三设备,并获取第三设备的状态信息;第一 设备基于第一设备的状态信息和第三设备的状态信息,确定第一设备是否为唤醒设备,其中, 状态信息包括以下至少一项状态参数:第二预设时间之内的开机状态总时长、设备位置、剩 余电量和是否处于使用状态。
13.在本技术实施例中,第一设备作为多设备应用场景中的一个电子设备,第一设备接收到 第二设备的竞价值后,通过分析第二设备的竞价值和第一设备竞价值之间的多种关系,从而 确定第一设备是否为唤醒设备;并且分析第二设备的竞价值和第一设备的竞价值之间的多种 关系从而确定第一设备是否为唤醒设备的过程均基于将竞价值最高的电子设备作为唤醒设 备,竞价值不是最高的电子设备不为唤醒设备的原则。从而保证确定的唤醒设备为最佳的执 行语音信息对应的唤醒操作的设备。
14.在第一方面的一种可能的实现方式中,若第一设备在第一预设时间之内接收到的第二设 备对语音信息的竞价值均低于第一设备对语音信息的竞价值,则确定第一设备为唤醒设备, 包括:
15.若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低于第一设备 对语音信息的竞价值,则第一设备确定第一设备对语音信息的竞价值是否高于预设值;若第 一设备对语音信息的竞价值高于预设值,则确定第一设备为唤醒设备。
16.本技术实施例中,将用户的语音信息对应的唤醒操作超出了竞价值最高的电子设备的执 行能力的情况进行分析,从而保证确定为唤醒设备的电子设备具有执行语音信息对应的唤醒 操作的能力。
17.在第一方面的一种可能的实现方式中,第一设备确定第一设备对语音信息的竞价值是否 高于预设值之后,还包括:
18.若第一设备对语音信息的竞价值低于或等于预设值,则第一设备确定第一设备所在的网 络中是否存在第四设备,其中,第四设备为第一设备在第一预设时间之内未监听到竞价值的 第二设备中,声纹信息与语音信息匹配的电子设备;若第一设备所在的网络中存在第四设备, 则第一设备向第四设备发送语音信息对应的唤醒指令,以指示第四设备在第四设备对语音信 息的竞价值高于预设值的情况下执行与语音信息对应的唤醒操作。
19.在本技术实施例中,综合考虑应用场景中,监听到用户的语音信息的电子设备对语音信 息对应的唤醒操作无执行能力、由于距离较远未监听到用户的语音信息的电子设备反而对语 音信息的唤醒操作具有执行能力的情况下,描述如何通过未监听到用户的语音信息、而对语 音信息的唤醒操作具有执行能力的电子设备执行语音信息的唤醒操作;从而扩大了本技术实 施例的应用场景,提高用户的体验度。
20.在第一方面的一种可能的实现方式中,第二设备为与第一设备位于同一网络中的电子设 备,方法还包括:
21.若第一设备在第一预设时间之内未接收到第二设备发送的信息,则第一设备确定第一设 备对语音信息的竞价值是否高于预设值;若第一设备对语音信息的竞价值高于预设值,则第 一设备确定第一设备为唤醒设备;若第一设备对语音信息的竞价值低于或等于预设值,则第 一设备确定第一设备所在的网络中是否存在第四设备,其中,第四设备为第一设备在第一预 设时间之内未监听到竞价值的第二设备中,声纹信息与语音信息匹配的电子设备;若第一设 备所在的网络中存在第四设备,则第一设备向第四设备发送语音信息对应的唤醒指令,以指 示第四设备在第四设备对语音信息的竞价值高于预设值的情况下执行与语音信息对应的唤醒 操作。
22.本实现方式扩大了本技术实施例的应用场景,当能够监听到用户的语音信息的电子设备 只有一个,且该电子设备对语音信息的竞价值小于预设值时,不存在多个电子设备的竞价值 比较大小的过程。然而,这种情况下,需要按照上一实现方式中的描述,可以发现是否存在 由于距离较远未监听到用户的语音信息、而对语音信息的唤醒操作具有执行能力的电子设备。 通过该电子设备执行语音信息对应的唤醒操作。从而扩大本技术实施例的应用场景,提高用 户的体验度。
23.在第一方面的一种可能的实现方式中,在第一设备确定第一设备所在的网络中是否存在 第四设备之前,还包括:
24.第一设备获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒声纹。
25.在第一方面的一种可能的实现方式中,第一设备获取第一设备在第一预设时间之内未监 听到竞价值的第二设备的唤醒声纹包括:
26.第一设备为预设的声纹汇总设备时,第一设备接收第一设备所在网络中除第一设备以外 的其他电子设备的唤醒声纹;第一设备基于第一设备的唤醒声纹和接收到的其他电子设备的 唤醒声纹生成声纹特性汇总,并向其他电子设备发送声纹特性汇总;第一设备从声纹特性汇 总中获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒声纹;
27.第一设备不为预设的声纹汇总设备时,第一设备向预设的声纹汇总设备发送第一设备的 唤醒声纹,以指示声纹汇总设备生成声纹汇总设备所在网络中各电子设备的声纹特性汇总; 第一设备接收声纹汇总设备发送的声纹特性汇总;第一设备从声纹特性汇总中获取第一设备 在第一预设时间之内未监听到竞价值的第二设备的唤醒声纹。
28.在本技术实施例中,为了保证第一设备不具有执行语音信息对应的唤醒操作的能力时, 能够发现未监听到用户的语音信息、且唤醒声纹和语音信息匹配的第四设备,第一设备需要 预先获取各个电子设备的唤醒声纹,从而发现是否存在第四设备。为本技术实施例的实施提 供了前期保障。
29.在第一方面的一种可能的实现方式中,第二设备为预设的决策设备,决策设备用于接收 决策设备所在网络中各电子设备发送的各电子设备对语音信息的竞价值,并向竞价值最高的 电子设备发送第一消息,向竞价值不为最高的电子设备发送第二消息;
30.相应的,第一设备基于第二设备发送的信息确定第一设备是否为唤醒设备包括:若第一 设备接收到的第二设备发送的信息为第一消息,则第一设备确定第一设备为唤醒设备;若第 一设备接收到的第二设备发送的信息为第二消息,则第一设备确定第一设备不
为唤醒设备。
31.在本技术实施例中,还提供了另一种多个电子设备的竞价过程,即预先设置决策设备, 多个电子设备均向决策设备发送各自的竞价值;决策设备通过比对接收到的多个电子设备的 竞价值,将竞价值最高的电子设备确定为唤醒设备。通过一种设置决策设备的方式从另一个 角度描述了确定唤醒设备的过程,提高了本技术实施例提供的语音唤醒方法在实施时的灵活 性。
32.在第一方面的一种可能的实现方式中,第一设备向第二设备发送第一设备对语音信息的 竞价值包括:
33.第一设备获取语音信息对应的唤醒模式,其中,唤醒模式包括:唤醒场景;第一设备获 取第一设备在唤醒模式下的竞价值,并将该竞价值作为第一设备对语音信息的竞价值;第一 设备向第二设备发送第一设备对语音信息的竞价值。
34.在本技术实施例中,可以根据语音信息的语义将语音信息归为多个唤醒场景,根据电子 设备在不同唤醒场景下的竞价值确定电子设备对语音信息的竞价值,从而避免了需要用户采 用特定的语音信息唤醒电子设备,电子设备才能获取对语音信息的竞价值的问题。
35.在第一方面的一种可能的实现方式中,第一设备获取第一设备在唤醒模式下的竞价值包 括:
36.第一设备获取预设的第一设备在唤醒模式下的竞价值;
37.或,第一设备获取第一设备的设备参数和唤醒模式对设备参数的依赖度;第一设备基于 第一设备的设备参数和唤醒模式对设备参数的依赖度,生成第一设备在唤醒模式下的竞价值。
38.本技术实施例提供了两种获得第一设备对语音信息的竞价值的过程,可以预先设置,也 可以通过各个电子设备的设备参数和不同唤醒模式对电子设备的依赖度计算各个电子设备在 不同唤醒模式下的竞价值。预先设置的方式简单方便,效率高。通过计算的方式更容易适应 不同的应用场景,且更精确。通过两种方式提高了本技术实施例提供的语音唤醒方法实施时 的灵活性。
39.在第一方面的一种可能的实现方式中,唤醒模式还包括:唤醒地点;第一设备获取语音 信息对应的唤醒模式包括:第一设备基于第一设备当前连接的网络确定语音信息对应的唤醒 地点。
40.在本技术实施例中,为了满足不同的应用场景,还可以增加唤醒地点作为唤醒模式中的 一个因素。从而使得本技术实施例提供的语音唤醒方法在实施时能够适应更多的场景。
41.第二方面,本技术实施例提供一种电子设备,包括:
42.声纹匹配单元,用于响应于监听到的语音信息,将语音信息与电子设备的唤醒声纹进行 匹配;
43.信息交互单元,用于若语音信息与电子设备的唤醒声纹匹配,则向第二设备发送电子设 备对语音信息的竞价值,并监听第二设备发送的信息,其中,电子设备对语音信息的竞价值 为电子设备对语音信息对应的唤醒操作的支持能力;
44.竞价单元,用于响应于监听到的第二设备发送的信息,基于第二设备发送的信息
确定电 子设备是否为唤醒设备;
45.唤醒单元,用于若电子设备为唤醒设备,则执行与语音信息对应的唤醒操作。
46.第三方面,提供一种电子设备,包括处理器,处理器用于运行存储器中存储的计算机程 序,实现本技术第一方面任一项的方法。
47.第四方面,提供一种芯片系统,包括处理器,处理器与存储器耦合,处理器执行存储器 中存储的计算机程序,以实现本技术第一方面任一项的方法。
48.第五方面,提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计 算机程序被一个或多个处理器执行时实现本技术第一方面任一项的方法。
49.第六方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在设备上运行 时,使得设备执行上述第一方面中任一项方法。
50.可以理解的是,上述第二方面至第六方面的有益效果可以参见上述第一方面中的相关描 述,在此不再赘述。
附图说明
51.图1为本技术实施例提供的语音唤醒方法的一种应用场景示意图;
52.图2为本技术实施例提供的执行语音唤醒方法的一种电子设备的硬件结构示意图;
53.图3为本技术实施例提供的一种语音唤醒方法的流程示意图;
54.图4为本技术实施例提供的一种为不同电子设备设置不同唤醒模式的竞价值的界面示意 图;
55.图5为本技术实施例提供的另一种为不同电子设备设置不同唤醒模式的竞价值的界面示 意图;
56.图6为本技术实施例提供的一种语音唤醒方法的流程示意图;
57.图7为本技术实施例提供的一种语音唤醒方法的流程示意图;
58.图8为图7提供的一种语音唤醒方法基于的应用框架示意图;
59.图9为图6所示实施例提供的语音唤醒方法的一种应用场景示意图;
60.图10为本技术实施例提供的一种语音唤醒方法的流程示意图;
61.图11为图10所示实施例提供的语音唤醒方法的一种应用场景示意图;
62.图12为本技术实施例提供的一种语音唤醒方法的流程示意图;
63.图13为图12所示实施例提供的语音唤醒方法的一种应用场景示意图;
64.图14为图12所示实施例提供的语音唤醒方法中电子设备获得其他电子设备的唤醒声纹 的交互示意图;
65.图15为本技术实施例提供的一种语音唤醒方法的流程示意图;
66.图16为图15所示实施例提供的语音唤醒方法的一种应用场景示意图;
67.图17为本技术实施例提供的执行语音唤醒方法的一种电子设备的功能架构模块的示意 框图。
具体实施方式
68.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具
体细 节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节 的其它实施例中也可以实现本技术。
69.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特 征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步 骤、操作、元素、组件和/或其集合的存在或添加。
70.还应当理解,在本技术实施例中,“一个或多个”是指一个、两个或两个以上;“和/或”, 描述关联对象的关联关系,表示可以存在三种关系;例如,a和/或b,可以表示:单独存在 a,同时存在a和b,单独存在b的情况,其中a、b可以是单数或者复数。字符“/”一般 表示前后关联对象是一种“或”的关系。
71.另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等 仅用于区分描述,而不能理解为指示或暗示相对重要性。
72.在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一 个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的 不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在 另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有 的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形 都意味着“包括但不限于”,除非是以其他方式另外特别强调。
73.本技术实施例提供的语音唤醒方法可以应用在多设备的场景中,如图1所示,图1为本 申请实施例提供的一种语音唤醒方法的应用场景。在该应用场景中,存在多个电子设备,分 别为:用户a的手机1、用户b的手机2、智慧屏、智能音箱和无线路由器。其中,无线路 由器将宽带网络信号转化成无线信号,提供无线网络。手机1、手机2、智慧屏和智能音箱均 连接在无线路由器提供的无线网络中。用户a预先在手机1、智慧屏和智能音箱中录入用户a的声纹信息作为手机1、智慧屏和智能音箱的唤醒声纹,用户b预先在手机2、智慧屏中录 入用户b的声纹信息作为手机2、智慧屏的唤醒声纹。其中,智慧屏的唤醒声纹包括用户a 的声纹信息和用户b的声纹信息。
74.用户a在该应用场景中发出语音信息,例如“小e、小e,给我放个歌”。该应用场景中 的手机1、手机2、智慧屏和智能音箱均能监听到用户a发出的语音信息,手机1、手机2、 智慧屏和智能音箱分别将监听到的语音信息与各自的唤醒声纹进行匹配。
75.需要说明,此时电子设备执行的匹配操作并不是确定电子设备的唤醒声纹与监听到的语 音信息在语义上是否匹配,而是确定电子设备的唤醒声纹与监听到的语音信息在音色上是否 匹配,即确定发出当前语音信息的用户是否具有唤醒电子设备的能力。
76.如前,手机1、智慧屏和智能音箱的唤醒声纹为用户a的声纹信息,即手机1、智慧屏 和智能音箱的唤醒声纹和当前监听到的语音信息匹配,则手机1、智慧屏和智能音箱分别确 定各自对语音信息的竞价值,手机1、智慧屏和智能音箱之间通过各自竞价值的数据交互, 确定出手机1、智慧屏和智能音箱中的一个作为唤醒设备,唤醒设备执行与语音信息对应的 唤醒操作。其中,应用场景中的各个电子设备对语音信息的竞价值可以预先设置。
77.本技术实施例提供了一种语音唤醒方法,该方法可以适用于电子设备中。电子设备可以 为:手机、平板电脑、智慧屏、可穿戴设备、车载设备、智能音箱、智慧屏、增强现实(augmentedreality,ar)/虚拟现实(virtual reality,vr)设备、笔记本电脑、超级移动个
人计算机(ultra-mobilepersonal computer,umpc)、上网本、个人数字助理(personal digital assistant,pda)等电子 设备。本技术实施例对电子设备的具体类型不作限定。
78.图2示出了一种电子设备的结构示意图。电子设备200可以包括处理器210,外部存储 器接口220,内部存储器221,通用串行总线(universal serial bus,usb)接口230,充电管理模 块240,电源管理模块241,电池242,天线1,天线2,移动通信模块250,无线通信模块 260,音频模块270,扬声器270a,受话器270b,麦克风270c,耳机接口270d,传感器模 块280,按键290,马达291,指示器292,摄像头293,显示屏294,以及用户标识模块(subscriberidentification module,sim)卡接口295等。其中传感器模块280可以包括压力传感器280a, 陀螺仪传感器280b,气压传感器280c,磁传感器280d,加速度传感器280e,距离传感器 280f,接近光传感器280g,指纹传感器280h,温度传感器280j,触摸传感器280k,环境光 传感器280l,骨传导传感器280m等。
79.可以理解的是,本技术实施例示意的结构并不构成对电子设备200的具体限定。在本申 请另一些实施例中,电子设备200可以包括比图示更多或更少的部件,或者组合某些部件, 或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组 合实现。
80.处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器 (application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu), 图像信号处理器(image signal processor,isp),控制器,存储器,视频编解码器,数字信号处 理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-networkprocessing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多 个处理器中。例如,处理器210用于执行本技术实施例中的语音唤醒方法,例如,下述步骤 301~步骤304。
81.其中,控制器可以是电子设备200的神经中枢和指挥中心。控制器可以根据指令操作码 和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
82.处理器210中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器210 中的存储器为高速缓冲存储器。该存储器可以保存处理器210刚用过或循环使用的指令或数 据。如果处理器210需要再次使用该指令或数据,可从存储器中直接调用。避免了重复存取, 减少了处理器210的等待时间,因而提高了系统的效率。
83.在一些实施例中,处理器210可以包括一个或多个接口。接口可以包括集成电路 (inter-integrated circuit,i2c)接口,集成电路内置音频(inter-integrated circuit sound,i2s)接口, 脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronousreceiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface, mipi),通用输入输出(general-purpose input/output,gpio)接口,用户标识模块(subscriberidentity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。
84.i2c接口是一种双向同步串行总线,包括一根串行数据线(serial data line,sda)和一根串 行时钟线(derail clock line,scl)。在一些实施例中,处理器210可以包含多组i2c总线。处 理器210可以通过不同的i2c总线接口分别耦合触摸传感器280k,充电器,闪光灯,摄像头 293等。例如:处理器210可以通过i2c接口耦合触摸传感器280k,使处理器
210与触摸传 感器280k通过i2c总线接口通信,实现电子设备200的触摸功能。
85.i2s接口可以用于音频通信。在一些实施例中,处理器210可以包含多组i2s总线。处理 器210可以通过i2s总线与音频模块270耦合,实现处理器210与音频模块270之间的通信。 在一些实施例中,音频模块270可以通过i2s接口向无线通信模块260传递音频信号。
86.pcm接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频 模块270与无线通信模块260可以通过pcm总线接口耦合。
87.在一些实施例中,音频模块270也可以通过pcm接口向无线通信模块260传递音频信号, 实现通过蓝牙耳机接听电话的功能。i2s接口和pcm接口都可以用于音频通信。
88.uart接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它 将要传输的数据在串行通信与并行通信之间转换。
89.在一些实施例中,uart接口通常被用于连接处理器210与无线通信模块260。例如: 处理器210通过uart接口与无线通信模块260中的蓝牙模块通信,实现蓝牙功能。在一些 实施例中,音频模块270可以通过uart接口向无线通信模块260传递音频信号。
90.mipi接口可以被用于连接处理器210与显示屏294,摄像头293等外围器件。mipi接口 包括摄像头串行接口(camera serial interface,csi),显示屏串行接口(display serial interface, dsi)等。在一些实施例中,处理器210和摄像头293通过csi接口通信,实现电子设备200 的拍摄功能。处理器210和显示屏294通过dsi接口通信,实现电子设备200的显示功能。
91.gpio接口可以通过软件配置。gpio接口可以被配置为控制信号,也可被配置为数据信 号。在一些实施例中,gpio接口可以用于连接处理器210与摄像头293,显示屏294,无线 通信模块260,音频模块270,传感器模块280等。gpio接口还可以被配置为i2c接口,i2s 接口,uart接口,mipi接口等。
92.usb接口230是符合usb标准规范的接口,具体可以是mini usb接口,micro usb接 口,usb type c接口等。usb接口230可以用于连接充电器为电子设备200充电,也可以用 于电子设备200与外围设备之间传输数据。
93.可以理解的是,本技术实施例示意的各模块间的接口连接关系,只是示意性说明,并不 构成对电子设备200的结构限定。在本技术另一些实施例中,电子设备200也可以采用上述 实施例中不同的接口连接方式,或多种接口连接方式的组合。
94.充电管理模块240用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可 以是有线充电器。在一些有线充电的实施例中,充电管理模块240可以通过usb接口230接 收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块240可以通过电子设 备200的无线充电线圈接收无线充电输入。充电管理模块240为电池242充电的同时,还可 以通过电源管理模块241为电子设备供电。
95.电源管理模块241用于连接电池242,充电管理模块240与处理器210。电源管理模块 241接收电池242和/或充电管理模块240的输入,为处理器210,内部存储器221,外部存储 器,显示屏294,摄像头293,和无线通信模块260等供电。电源管理模块241还可以用于监 测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。
96.在其他一些实施例中,电源管理模块241也可以设置于处理器210中。在另一些实施例 中,电源管理模块241和充电管理模块240也可以设置于同一个器件中。
97.电子设备200的无线通信功能可以通过天线1,天线2,移动通信模块250,无线通信模 块260,调制解调处理器以及基带处理器等实现。
98.天线1和天线2用于发射和接收电磁波信号。电子设备200中的每个天线可用于覆盖单 个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复 用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
99.移动通信模块250可以提供应用在电子设备200上的包括2g/3g/4g/5g等无线通信的解 决方案。移动通信模块250可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(lownoise amplifier,lna)等。移动通信模块250可以由天线1接收电磁波,并对接收的电磁波进 行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块250还可以对经调制 解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。
100.在一些实施例中,移动通信模块250的至少部分功能模块可以被设置于处理器210中。 在一些实施例中,移动通信模块250的至少部分功能模块可以与处理器210的至少部分模块 被设置在同一个器件中。
101.调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号 调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解 调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递 给应用处理器。应用处理器通过音频设备(不限于扬声器270a,受话器270b等)输出声音信 号,或通过显示屏294显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器 件。在另一些实施例中,调制解调处理器可以独立于处理器210,与移动通信模块250或其 他功能模块设置在同一个器件中。
102.无线通信模块260可以提供应用在电子设备200上的包括无线局域网(wireless local areanetworks,wlan)(如无线保真(wireless fidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导 航卫星系统(global navigation satellite system,gnss),调频(frequency modulation,fm),近距 离无线通信技术(near field communication,nfc),红外技术(infrared,ir)等无线通信的解决 方案。无线通信模块260可以是集成至少一个通信处理模块的一个或多个器件。无线通信模 块260经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处 理器210。无线通信模块260还可以从处理器210接收待发送的信号,对其进行调频,放大, 经天线2转为电磁波辐射出去。
103.在一些实施例中,电子设备200的天线1和移动通信模块250耦合,天线2和无线通信 模块260耦合,使得电子设备200可以通过无线通信技术与网络以及其他设备通信。无线通 信技术可以包括全球移动通讯系统(global system for mobile communications,gsm),通用分 组无线服务(general packet radio service,gprs),码分多址接入(code division multiple access, cdma),宽带码分多址(wideband code division multiple access,wcdma),时分码分多址 (time-division code division multiple access,td-scdma),长期演进(long term evolution,lte), bt,gnss,wlan,nfc,fm,和/或ir技术等。gnss可以包括全球卫星定位系统(globalpositioning system,gps),全球导航卫星系统(global navigation satellite system,glonass), 北斗卫星导航系统(beidou navigation satellite system,bds),准天顶卫星系统(quasi-zenithsatellite system,qzss)和/或星基增强系统(satellite based augmentation systems,sbas)。
104.电子设备200通过gpu,显示屏294,以及应用处理器等实现显示功能。gpu为图像处 理的微处理器,连接显示屏294和应用处理器。gpu用于执行数学和几何计算,用于图形渲 染。处理器210可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。
105.显示屏294用于显示图像,视频等。显示屏294包括显示面板。显示面板可以采用液晶 显示屏(liquid crystal display,lcd),有机发光二极管(organic light-emitting diode,oled), 有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emittingdiode的,amoled),柔性发光二极管(flex light-emitting diode,fled),miniled,microled, micro-oled,量子点发光二极管(quantum dot light emitting diodes,qled)等。在一些实施 例中,电子设备200可以包括1个或n个显示屏294,n为大于1的正整数。
106.电子设备200可以通过isp,摄像头293,视频编解码器,gpu,显示屏294以及应用处 理器等实现拍摄功能。
107.isp用于处理摄像头293反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递 到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将电信号传递给isp处理,转 化为肉眼可见的图像。isp还可以对图像的噪点,亮度,肤色进行算法优化。isp还可以对拍 摄场景的曝光,色温等参数优化。在一些实施例中,isp可以设置在摄像头293中。
108.摄像头293用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感 光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体 (complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成 电信号,之后将电信号传递给isp转换成数字图像信号。isp将数字图像信号输出到dsp加 工处理。dsp将数字图像信号转换成标准的rgb,yuv等格式的图像信号。在一些实施例 中,电子设备200可以包括1个或n个摄像头293,n为大于1的正整数。
109.数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字 信号。
110.视频编解码器用于对数字视频压缩或解压缩。电子设备200可以支持一种或多种视频编 解码器。这样,电子设备200可以播放或录制多种编码格式的视频,例如:动态图像专家组 (moving picture experts group,mpeg)1,mpeg2,mpeg3,mpeg4等。
111.npu为神经网络(neural-network,nn)计算处理器,通过借鉴生物神经网络结构,例 如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过npu可 以实现电子设备200的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解 等。
112.在本技术实施例中,npu或其他处理器可以用于对电子设备200存储的视频中的人脸图 像进行人脸检测、人脸跟踪、人脸特征提取和图像聚类等操作;对电子设备200存储的图片 中的人脸图像进行人脸检测、人脸特征提取等操作,并根据图片的人脸特征以及视频中人脸 图像的聚类结果,对电子设备200存储的图片进行聚类。
113.外部存储器接口220可以用于连接外部存储卡,例如micro sd卡,实现扩展电子设备 200的存储能力。外部存储卡通过外部存储器接口220与处理器210通信,实现数据存储功 能。例如将音乐,视频等文件保存在外部存储卡中。
114.内部存储器221可以用于存储计算机可执行程序代码,可执行程序代码包括指令。
处理 器210通过运行存储在内部存储器221的指令,从而执行电子设备200的各种功能应用以及 数据处理。内部存储器221可以包括存储程序区和存储数据区。其中,存储程序区可存储操 作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)。存储数据区 可存储电子设备200使用过程中所创建的数据(比如竞价值,唤醒声纹等)。
115.此外,内部存储器221可以包括高速随机存取存储器,还可以包括非易失性存储器,例 如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。
116.电子设备200可以通过音频模块270,扬声器270a,受话器270b,麦克风270c,耳机 接口270d,以及应用处理器等实现音频功能。例如音乐播放,录音等。
117.音频模块270用于将数字音频信号转换成模拟音频信号输出,也用于将模拟音频输入转 换为数字音频信号。音频模块270还可以用于对音频信号编码和解码。在一些实施例中,音 频模块270可以设置于处理器210中,或将音频模块270的部分功能模块设置于处理器210 中。
118.扬声器270a,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备200可以通过 扬声器270a收听音乐,或收听免提通话。
119.受话器270b,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备200接听电 话或语音信息时,可以通过将受话器270b靠近人耳接听语音。
120.麦克风270c,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发 送语音信息时,用户可以通过人嘴靠近麦克风270c发声,将声音信号输入到麦克风270c。 电子设备200可以设置至少一个麦克风270c。在另一些实施例中,电子设备200可以设置两 个麦克风270c,除了监听语音信息,还可以实现降噪功能。在另一些实施例中,电子设备 200还可以设置三个,四个或更多麦克风270c,实现采集声音信号,降噪,还可以识别声音 来源,实现定向录音功能等。例如,麦克风270c可以用于采集本技术实施例涉及到的语音 信息。
121.耳机接口270d用于连接有线耳机。耳机接口270d可以是usb接口230,也可以是3.5mm 的开放移动电子设备平台(open mobile terminal platform,omtp)标准接口,美国蜂窝电信 工业协会(cellular telecommunications industry association of the usa,ctia)标准接口。
122.压力传感器280a用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中, 压力传感器280a可以设置于显示屏294。压力传感器280a的种类很多,如电阻式压力传感 器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有 导电材料的平行板。当有力作用于压力传感器280a,电极之间的电容改变。电子设备200根 据电容的变化确定压力的强度。当有触摸操作作用于显示屏294,电子设备200根据压力传 感器280a检测触摸操作强度。电子设备200也可以根据压力传感器280a的检测信号计算触 摸的位置。
123.在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不 同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图 标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用 于短消息应用图标时,执行新建短消息的指令。
124.陀螺仪传感器280b可以用于确定电子设备200的运动姿态。在一些实施例中,可以通 过陀螺仪传感器280b确定电子设备200围绕三个轴(即,x,y和z轴)的角速度。陀螺仪 传感器280b可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器280b检测电子设备 200抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子 设备200的抖动,实现防抖。陀螺仪传感器280b还可以用于导航,体感游戏场景。
125.气压传感器280c用于测量气压。在一些实施例中,电子设备200通过气压传感器280c 测得的气压值计算海拔高度,辅助定位和导航。
126.磁传感器280d包括霍尔传感器。电子设备200可以利用磁传感器280d检测翻盖皮套的 开合。在一些实施例中,当电子设备200是翻盖机时,电子设备200可以根据磁传感器280d 检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁 等特性。
127.加速度传感器280e可检测电子设备200在各个方向上(一般为三轴)加速度的大小。当 电子设备200静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横 竖屏切换,计步器等应用。
128.距离传感器280f,用于测量距离。电子设备200可以通过红外或激光测量距离。在一些 实施例中,拍摄场景,电子设备200可以利用距离传感器280f测距以实现快速对焦。
129.接近光传感器280g可以包括例如发光二极管(led)和光检测器,例如光电二极管。 发光二极管可以是红外发光二极管。电子设备200通过发光二极管向外发射红外光。电子设 备200使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确 定电子设备200附近有物体。当检测到不充分的反射光时,电子设备200可以确定电子设备 200附近没有物体。电子设备200可以利用接近光传感器280g检测用户手持电子设备200贴 近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器280g也可用于皮套模式, 口袋模式自动解锁与锁屏。
130.环境光传感器280l用于感知环境光亮度。电子设备200可以根据感知的环境光亮度自适 应调节显示屏294亮度。环境光传感器280l也可用于拍照时自动调节白平衡。环境光传感器 280l还可以与接近光传感器280g配合,检测电子设备200是否在口袋里,以防误触。
131.指纹传感器280h用于采集指纹。电子设备200可以利用采集的指纹特性实现指纹解锁, 访问应用锁,指纹拍照,指纹接听来电等。
132.温度传感器280j用于检测温度。在一些实施例中,电子设备200利用温度传感器280j 检测的温度,执行温度处理策略。例如,当温度传感器280j上报的温度超过阈值,电子设备 200执行降低位于温度传感器280j附近的处理器的性能,以便降低功耗实施热保护。在另一 些实施例中,当温度低于另一阈值时,电子设备200对电池242加热,以避免低温导致电子 设备200异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备200对电池242 的输出电压执行升压,以避免低温导致的异常关机。
133.触摸传感器280k,也称“触控面板”。触摸传感器280k可以设置于显示屏294,由触摸 传感器280k与显示屏294组成触摸屏,也称“触控屏”。触摸传感器280k用于检测作用于其 上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸 事件类型。可以通过显示屏294提供与触摸操作相关的视觉输出。在另一些实施例中,
触摸 传感器280k也可以设置于电子设备200的表面,与显示屏294所处的位置不同。
134.骨传导传感器280m可以获取振动信号。在一些实施例中,骨传导传感器280m可以获 取人体声部振动骨块的振动信号。骨传导传感器280m也可以接触人体脉搏,接收血压跳动 信号。
135.在一些实施例中,骨传导传感器280m也可以设置于耳机中,结合成骨传导耳机。音频 模块270可以基于骨传导传感器280m获取的声部振动骨块的振动信号,解析出语音信号, 实现语音功能。应用处理器可以基于骨传导传感器280m获取的血压跳动信号解析心率信息, 实现心率检测功能。
136.按键290包括开机键,音量键等。按键290可以是机械按键。也可以是触摸式按键。电 子设备200可以接收按键输入,产生与电子设备200的用户设置以及功能控制有关的键信号 输入。
137.马达291可以产生振动提示。马达291可以用于来电振动提示,也可以用于触摸振动反 馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反 馈效果。作用于显示屏294不同区域的触摸操作,马达291也可对应不同的振动反馈效果。 不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈 效果。触摸振动反馈效果还可以支持自定义。
138.指示器292可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息, 未接来电,通知等。
139.sim卡接口295用于连接sim卡。sim卡可以通过插入sim卡接口295,或从sim卡接 口295拔出,实现和电子设备200的接触和分离。电子设备200可以支持1个或n个sim卡 接口,n为大于1的正整数。sim卡接口295可以支持nano sim卡,micro sim卡,sim卡 等。同一个sim卡接口295可以同时插入多张卡。多张卡的类型可以相同,也可以不同。sim 卡接口295也可以兼容不同类型的sim卡。sim卡接口295也可以兼容外部存储卡。电子设 备200通过sim卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备 200采用esim,即:嵌入式sim卡。esim卡可以嵌在电子设备200中,不能和电子设备200 分离。
140.本技术实施例并未特别限定一种语音唤醒方法的执行主体的具体结构,只要可以通过运 行记录有本技术实施例提供的一种语音唤醒方法的代码的程序,以根据本技术实施例提供的 一种语音唤醒方法进行通信即可。例如,本技术实施例提供的一种语音唤醒方法的执行主体 可以是电子设备中能够调用程序并执行程序的功能模块,或者为应用于电子设备中的通信装 置,例如,芯片。
141.参见图3,图3为本技术实施例提供的一种语音唤醒方法的流程示意图,如图所示,该 方法包括:
142.步骤301、响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行 匹配。
143.本技术实施例应用于多设备的应用场景中,多设备的应用场景中存在多个电子设备,本 申请实施例以其中任一个电子设备作为执行主体进行描述。另外,为了便于描述,将作为执 行主体描述的电子设备记为第一设备。
144.作为举例,图1所示的应用场景中,如果无线路由器不存在唤醒声纹,无线路由器不存 在对语音信息的竞价值,即无线路由器不会作为唤醒设备的角色,而是作为提供其他
电子设 备之间通信的无线网络的角色,则提供无线网络的无线路由器不为第一设备,然而,提供无 线网络的无线路由器可以作为第一设备所在网络中的第二设备的角色。具体参照图13所示实 施例的描述。
145.图1所示应用场景中的手机1、手机2、智慧屏和智能音箱均可以称为第一设备。以手机 1、手机2、智慧屏和智能音箱中的智能音箱作为第一设备举例,用户发出语音信息后,智能 音箱监听到用户发出的语音信息,可以将语音信息与智能音箱的唤醒声纹匹配,以确定发出 当前语音信息的用户是否具有唤醒智能音箱的能力。
146.需要说明,上述示例仅以智能音箱作为第一设备进行描述,实际应用中,手机1、手机2 和智慧屏也在作为第一设备执行步骤301描述的操作。
147.另外,如图1所示应用场景中的描述,第一设备将语音信息与第一设备的唤醒声纹进行 匹配并非是指将语音信息与第一设备的唤醒声纹在语义上进行匹配,而是在音色上进行匹配。
148.作为举例,用户a可以预先在智能音箱中录入语音信息“我爱我家”作为智能音箱的唤 醒声纹,用户b可以预先在智能音箱中录入语音信息“勇往直前”也作为智能音箱的唤醒声 纹。当用户a在智能音箱所在的空间中说出“小e、小e,给我放个歌”之后,虽然用户a 说出的“小e、小e,给我放个歌”和智能音箱的唤醒声纹“我爱我家”和“勇往直前”在 语义上均不匹配,然而,用户a说出的“小e、小e,给我放个歌”和智能音箱的唤醒声纹
ꢀ“
我爱我家”在音色上是匹配的。此种情况下表示语音信息和智能音箱的唤醒声纹匹配。当 然,一个电子设备可以具有多个唤醒声纹。另外,为了提高匹配速度,也可以预先规定录入 用户的语音信息作为电子设备的唤醒声纹时,可以规定用户说出的语音信息需要为特定的语 音信息,例如,用户设置电子设备的唤醒声纹时均需要说出特定的语音信息“小e,小e”。
149.步骤302、若语音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设 备对语音信息的竞价值,并监听第二设备发送的信息,其中,第一设备对语音信息的竞价值 为第一设备对语音信息对应的唤醒操作的支持能力。
150.在本技术实施例中,第二设备是相对于第一设备而言的,作为举例,图1所示应用场景 中智能音箱可以作为第一设备,则无线路由器、手机1、手机2、智慧屏中的一个或多个则为 智能音箱的第二设备。当智慧屏作为第一设备时,无线路由器、手机1、手机2和智能音箱 中的一个或多个则为智慧屏的第二设备。
151.由于用户希望电子设备执行某项操作(例如、播放电影)时,可能会说出多种语音信息 (放个电影、播放电影、看电影、),为了便于设置电子设备对各个语音信息的竞价值,可以 对语音信息进行分类,分成多个唤醒场景,将电子设备对唤醒场景的竞价值作为电子设备对 属于该唤醒场景的语音信息的竞价值。各个电子设备在不同唤醒场景下的竞价值可以在出厂 时已经设置好;当然,也可以由用户在电子设备出厂后重新为电子设备设置各个唤醒场景下 的竞价值;还可以由电子设备基于各自的设备参数和不同唤醒场景对设备参数的依赖度,计 算各个电子设备在不同唤醒场景下的竞价值。
152.参见表1,表1为本技术实施例提供的多个电子设备在不同唤醒场景下的竞价值。如表1 所示,唤醒场景包括:仅唤醒、即使通信、音乐、视频、讲故事、导航、通话等。若第一设 备接收到的语音信息与第一设备的唤醒声纹在音色上匹配,第一设备可以基于语音信息的语 义确定语音信息表示的唤醒场景。
153.作为举例,语音信息为“小e,小e,放歌”,则该语音信息表示的唤醒场景为音乐;语 音信息为“小e,小e,给妈妈打电话”,则该语音信息表示的唤醒场景为通话。当然,上述 唤醒场景、语音信息和唤醒场景的对应关系仅用于举例,实际应用中,还可以设置其他唤醒 场景、其他对应关系,本技术实施例对此不做限制。
154.表1中的竞价值越大,表示该电子设备对唤醒场景下的语音信息对应唤醒操作的执行能 力越大。竞价值越大的电子设备越容易作为最终的唤醒设备执行与语音信息对应的唤醒操作。 表1中竞价值为0表示该电子设备对该唤醒场景下的语音信息对应的唤醒操作无执行能力。 例如,语音信息为“小e,小e,播放电影”,则语音信息表示的唤醒场景为视频,该语音信 息对应唤醒操作为:打开视频播放软件或打开视频播放软件并播放列表中的第一个电影。显 然,智能音箱不具有播放电影的能力,因此,智能音箱对唤醒场景“视频”无响应能力,智 能音箱对唤醒场景“视频”对应的语音信息的竞价值为0。
155.表1多个唤醒场景下各个电子设备的竞价值
156.唤醒场景手机1手机2智慧屏智能音箱仅唤醒3322即使通信3321音乐2213视频2230讲故事2213导航3321通话3321
…………………………
157.需要说明,表1中竞价值越高,则表示该电子设备对语音信息对应的唤醒操作的执行能 力越强。实际应用中,也可以设置为竞价值越低,表示该电子设备对语音信息对应的唤醒操 作的执行能力越强。本技术实施例后续将以竞价值越高表示该电子设备对语音信息对应的唤 醒操作的执行能力越强作为示例进行描述。另外,表1中竞价值的具体数值仅用于示例,实 际应用中,还可以是其他数值或其他表示能力强弱的等级,本技术实施例对此不做限定。
158.第一设备确定监听到的语音信息与第一设备的唤醒声纹匹配后,还需要监听第二设备发 送的信息。第二设备为与第一设备位于同一网络中的电子设备时,第二设备发送的信息包括 第二设备对语音信息的竞价值。第二设备为预设的决策设备时,决策设备用于接收决策设备 所在网络中各电子设备发送的各电子设备对语音信息的竞价值,并向竞价值最高的电子设备 发送第一消息,向竞价值不为最高的电子设备发送第二消息;第二设备发送的信息包括第一 消息和第二消息。
159.步骤303、响应于监听到的第二设备发送的信息,第一设备基于第二设备发送的信息确 定第一设备是否为唤醒设备。
160.在本技术实施例中,如步骤302所示,第二设备可能是第一设备所在网络中除第一设备 以外的电子设备,也可以为预先设置的决策设备。同理,第二设备作为两种角色时,第二设 备发送的信息也可以不能。第二设备作为两种角色时,第一设备基于第二设备发送的信息确 定第一设备是否为唤醒设备的具体步骤也可能不同,第一设备基于第二设备发送
的信息确定 第一设备是否为唤醒设备的具体步骤可参照后续实施例的描述。
161.唤醒设备可以是由各个电子设备对语音信息的竞价值确定,例如可以将当前应用场景中 竞价值最高的一个电子设备确定为唤醒设备。
162.步骤304、若第一设备为唤醒设备,则第一设备执行与语音信息对应的唤醒操作。
163.在本技术实施例中,与语音信息对应的唤醒操作可以预先设置,例如,语音信息为电子 设备的唤醒名称“小e,小e”时,对应的唤醒场景为纯唤醒,对应的唤醒操作为唤醒电子 设备;语音信息为“小e,小e,打电话”时,对应的唤醒场景为通话;对应的唤醒操作为 进入电子设备拨打电话的显示界面。
164.在实际应用中,唤醒场景、语音信息、唤醒操作三者之间的关系可以有如下表示:
165.唤醒场景:通话,语音信息:小e,小e,打电话,唤醒操作:进入拨打电话的显示界 面;
166.唤醒场景:通话,语音信息:小e,小e,打个电话,唤醒操作:进入拨打电话的显示 界面;
167.唤醒场景:通话,语音信息:小e,小e,给妈妈打电话,唤醒操作:向通信录中“妈 妈”指示的电话号码拨号。
168.通过上述示例可以理解,多个语音信息可以对应一个唤醒场景,且多个语音信息中可以 有两个或两个以上的语音信息分别对应不同的唤醒操作,多个语音信息中可以存在两个或两 个以上的语音信息对应相同的唤醒操作。
169.本技术实施例中,为每个电子设备设置该电子设备对语音信息的竞价值,并设置电子设 备之间(第一设备和第二设备之间)通过竞价值交互的过程确定出唤醒设备,通过确定出的 唤醒设备执行与语音信息对应的唤醒操作,从而避免了多个电子设备的应用场景中,多个电 子设备均会被用户的语音信息唤醒,且多个电子设备均会对用户的语音信息做出响应的问题。
170.作为本技术另一实施例,图3所示的语音唤醒方法中,步骤302包括:
171.第一设备获取语音信息对应的唤醒模式,其中,唤醒模式包括:唤醒场景;
172.第一设备获取第一设备在唤醒模式下的竞价值,并将该竞价值作为第一设备对语音信息 的竞价值;
173.第一设备向第二设备发送第一设备对语音信息的竞价值。
174.相应的,第一设备执行与语音信息对应的唤醒操作的过程包括:
175.第一设备根据语音信息的语义确定语音信息对应的唤醒操作;第一设备执行与语音信息 对应的唤醒操作。
176.在本技术实施例中,如表1描述,第一设备对语音信息的竞价值为第一设备对该语音信 息表示的唤醒场景下的竞价值。因此,第一设备需要首先根据语音信息的语义确定该语音信 息对应的唤醒场景。第一设备通过查找第一设备在该语音信息对应的唤醒场景下的竞价值确 定第一设备对语音信息的竞价值。当然,本实施例用唤醒场景作为举例,实际应用中,唤醒 模式还可以包括:唤醒地点。关于唤醒地点的具体描述可参照后续图5所示示意图对应的描 述。
177.作为本技术另一实施例,第一设备获取第一设备在唤醒模式下的竞价值包括:
178.第一种方式,第一设备获取预设的第一设备在唤醒模式下的竞价值。
179.或,
180.第二种方式,第一设备获取第一设备的设备参数和唤醒模式对设备参数的依赖度。
181.第一设备基于第一设备的设备参数和唤醒模式对设备参数的依赖度,生成第一设备在唤 醒模式下的竞价值。
182.在本技术实施例中,第一种方式为预先为各个电子设备设置各个电子设备在不同唤醒模 式(例如唤醒场景)下的竞价值。设置竞价值的过程可以是由开发人员在电子设备的开发阶 段完成;也可以在电子设备出厂前的任意阶段完成;当然,在电子设备出厂后用户使用过程 中通过从预设的服务器获取各自在不同唤醒模式下的竞价值从而完成设置过程也是可以的; 在使用电子设备的过程中,用户在电子设备的竞价值设置界面中为不同的电子设备设置在不 同唤醒模式下的竞价值完成设置过程也是可以的。
183.作为第一种方式的示例,第一设备设置各电子设备在不同唤醒场景下的竞价值的过程包 括:
184.响应于用户的设置指令,第一设备显示包括至少一个唤醒场景的第一界面,以指示用户 在第一界面中选择一个唤醒场景;响应于用户选中的唤醒场景,第一设备显示包括至少一个 电子设备以及该电子设备在被选中的唤醒场景的竞价值框的第二界面,以指示用户为第二界 面中的电子设备设置该电子设备在被选中的唤醒场景下的竞价值,其中,第二界面中显示的 电子设备为第一设备所在网络中的电子设备。
185.作为该实施例的一个示例,参见图4,图4为本技术实施例提供的一种设置电子设备在 不同唤醒场景下的竞价值的示意图。以在图1所示应用场景中的手机1上设置为例,用户可 以在手机1上输入竞价值的设置指令,例如可以点击手机1显示的界面中的某个虚拟按钮实 现;手机1在接收到设置指令后,可以显示如图4中的(a)所示的第一界面,第一界面中显 示多个不同的唤醒场景,用户可以在第一界面中选择任一个唤醒场景作为待设置的唤醒场景。 例如,用户可以选择其中的视频场景,手机1接收到用户选中视频场景的消息或指令后,手 机1显示如图4中的(b)所示的第二界面,第二界面中显示多个电子设备(例如手机1、手 机2、智能音箱和智慧屏)以及多个电子设备的竞价值框,用户可以通过调节每个电子设备 对应的调整轴设置每个电子设备在视频场景下的竞价值。例如,用户采用手指点击调整轴中 的圆形钮,然后左右滑动,以控制调整轴中的圆形钮在该调整轴中左右移动,从而使得竞价 值框中的数字发生变化;待竞价值框中的数字为用户想要设置的目标数字时,用户的手指停 止滑动,并抬起。手机1的第二界面中显示了多个电子设备,当用户对其中一个电子设备在 视频场景下的竞价值设置完成后,可以继续为其他电子设备设置其他电子设备在视频场景下 的竞价值。
186.需要说明,通过第二界面设置电子设备的竞价值时的多个电子设备(集合a)和本技术 实施例提供的语音唤醒方法中第一设备和第二设备组成的多个电子设备(集合b)可能完全 相同,还可能存在部分相同部分不同。作为举例,用户在通过第一设备设置多个电子设备在 不同唤醒场景下的竞价值时,第一设备所在的网络中可能存在手机1、智慧屏1,即通过第二 界面设置竞价值时的电子设备集合a包括手机1和智慧屏1。在设置完成后,用户实验阶段, 手机1所在的网络中依然存在智慧屏1。此时,用户发出语音信息,手机1为第一设备时, 智慧屏1为第二设备,智慧屏为第一设备时,手机1为第二设备,即参与本技术实
施例提供 的语音唤醒方法中第一设备和第二设备组成的多个电子设备集合b为手机1和智慧屏。此种 情况下,集合a中的电子设备和集合b中的电子设备完全相同。也许,经过一段时间(例如, 一个月)后,智慧屏1由于故障无法使用,家居场景中新购入了智慧屏2,以及新购入了智 能音箱,同时有朋友携带手机2到家中做客。用户发出语音信息后,手机1作为第一设备, 则手机2、智慧屏2和智能音箱作为手机1的第二设备。集合b中的电子设备则包括:手机 1、智慧屏2、智能音箱、手机2。此种情况下,集合a中的电子设备和集合b中的电子设备 部分相同部分不同。当然,在语音唤醒竞价阶段,手机1对语音信息的竞价值为用户在设置 阶段设置的竞价值,而手机2、智慧屏2和智能音箱对语音信息的竞价值可以为出厂默认的 竞价值。
187.作为第二种方式的实施例,可以设置每个唤醒模式对电子设备的设备参数的依赖度。唤 醒模式为唤醒场景时,表2为不同唤醒场景对电子设备的设备参数的依赖度。表2中以极高、 高、中和无表示唤醒场景对设备参数的依赖度,表2中的设备参数包括:屏幕大小、分辨率、 音频解码能力、拍照能力、芯片规格、扬声器、存储空间、用户使用概率等。
188.当然,实际应用中,设备参数还可以包括表2中未列出的其他设备参数,或者包括表2 中列出的设备参数中的部分参数。不同唤醒场景对设备参数的依赖度也可以由其他表示不同 依赖程度的词表示,还可以由其他数值表示不同的依赖程度。表2仅用于表示一种示例,并 不对本技术实施例造成任何限制。
189.表2不同唤醒场景对电子设备的设备参数的依赖度
[0190][0191]
作为示例,第一设备基于第一设备的设备参数和唤醒模式对设备参数的依赖度,生成第 一设备在唤醒模式下的竞价值的过程可以按照如下方式:
[0192]
第一设备的设备参数也可以设置几个等级,例如屏幕大小在第一预设范围内的为第一等 级,设置分数为100;屏幕大小在第二预设范围内的为第二等级,设置分数为80;屏幕大小 在第三预设范围内的为第三等级,设置分数为60;屏幕大小在第四预设范围内的为第四等级, 设置分数为0。将依赖度中的无、中、高和极高代表的数值表示权重,例如,极高表示权重1, 高表示权重0.5,中表示权重0.3,无表示权重0。通过第一设备的设备参数对应的分数以及 相应的权重获得第一设备在该唤醒场景下的竞价值。需要说明,该示例仅用于举例,具体计 算过程还可以为其他计算方式,本技术实施例对此不做限制。
[0193]
作为本技术另一实施例,唤醒模式还包括:唤醒地点;第一设备获取语音信息对应的唤 醒模式包括:
[0194]
第一设备基于第一设备当前连接的网络确定语音信息对应的唤醒地点。
[0195]
在本技术实施例中,如前所述,唤醒模式除了可以包括唤醒场景,还可以包括唤醒地点。 唤醒地点可以包括:车内、公司和家庭等。第一设备可以基于第一设备当前连接的网络确定 当前的唤醒地点。例如,第一设备连接家庭中的wi-fi(wireless fidelity)时,表示唤醒地点 为家庭,第一设备连接车载wi-fi(wireless fidelity)时,表示唤醒地点为车内。
[0196]
当唤醒模式还包括唤醒地点的情况下,上述第一种方式中设置电子设备在不同唤醒模式 下的竞价值可参照图5所示,图5相比于图4所示的设置过程增加一个显示界面,如图5中 的(b)所示的界面,该界面记为第三界面。图5中的(a)所示的第一界面与图4中的(a) 所示的第一界面可以相同,用户通过图5中的(a)所示的第一界面选择任一个唤醒场景后, 进入图5中的(b)所示的第三界面,第三界面显示一个或多个唤醒地点,用户在第三界面中 选择其中一个唤醒地点后,进入图5中的(c)所示的第二界面,图5中的(c)所示的第二 界面和图4所示的第二界面可以相同。图5中的(a)所示的第一界面和图5中的(c)所示 的第二界面的描述可参照图4所示应用场景中关于图4中的(a)和图4中的(b)的描述, 在此不再赘述。
[0197]
当然,实际应用中,也可以首先显示图5中的(b)所示的第三界面,由用户首先选择其 中一个唤醒地点,然后进入图5中的(a)所示的第一界面,用户选择其中一个唤醒场景后, 再进入图5中的(c)所示的第二界面。
[0198]
当唤醒模式还包括唤醒地点的情况下,可以将表2所示的不同唤醒场景对电子设备的设 备参数的依赖度表示其中一个唤醒地点,然后为每个唤醒地点设置一个如表2所示的该唤醒 地点下不同唤醒场景对电子设备的设备参数的依赖度。或者,设置多个表格,每个表格表示 一个唤醒场景下,不同唤醒地点对设备参数的依赖度。最后通过查找确定特定唤醒场景、特 定唤醒地点对设备参数的依赖度,基于查找获得的依赖度以及第一设备的设备参数计算获得 第一设备在该唤醒模式下的竞价值。
[0199]
为了对本技术实施例提供的语音唤醒方法的多种实现方式具有更清晰的理解,后续实施 例将重点描述不同应用场景下,基于各个电子设备的竞价值确定唤醒设备的过程。
[0200]
参见图6,图6为本技术实施例提供的另一种语音唤醒方法的流程示意图,如图所示, 该方法包括:
[0201]
步骤601、响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行 匹配。
[0202]
步骤602、若语音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设 备对语音信息的竞价值,并监听第二设备发送的第二设备对语音信息的竞价值,其中,第一 设备对语音信息的竞价值为第一设备对语音信息对应的唤醒操作的支持能力。
[0203]
步骤601至步骤602的内容和步骤301至步骤302内容一致,具体可参照步骤301至步 骤302的描述,在此不再赘述。
[0204]
步骤6031、若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中, 存在至少一个第二设备对语音信息的竞价值高于第一设备对语音信息的竞价值,则确定第一 设备不为唤醒设备。
[0205]
步骤6032、若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低 于第一设备对语音信息的竞价值,则确定第一设备为唤醒设备。
[0206]
步骤6033、若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中, 不存在高于第一设备对语音信息的竞价值、且存在等于第一设备对语音信息的竞价值,则将 竞价值等于第一设备对语音信息的竞价值的第二设备记为第三设备,并获取第三设备的状态 信息。
[0207]
步骤604、第一设备基于第一设备的状态信息和第三设备的状态信息,确定第一设备是 否为唤醒设备,其中,状态信息包括以下至少一项状态参数:第二预设时间之内的开机状态 总时长、设备位置、剩余电量和是否处于使用状态。
[0208]
步骤605、若第一设备为唤醒设备,则第一设备执行与语音信息对应的唤醒操作。
[0209]
在本技术实施例中,若预先设置的电子设备的竞价值不存在相等的情况下,第一设备接 收到的第二设备发送的第二设备的竞价值可能存在如下几种情况:
[0210]
情况1-1、第二设备发送的竞价值全部高于第一设备的竞价值。
[0211]
情况1-2、第二设备发送的竞价值全部低于第一设备的竞价值。
[0212]
情况1-3、第二设备发送的竞价值一部分高于第一设备的竞价值,另一部分低于第一设备 的竞价值。
[0213]
由于最终确定的唤醒设备为竞价值最高的电子设备,因此,对于情况1-1,则第一设备不 为唤醒设备,对于情况1-2,则第一设备为唤醒设备,对于情况1-3,则第一设备不为唤醒设 备。
[0214]
为了对上述过程具有更清晰的理解,参照图7,图7为本技术实施例提供的语音唤醒方 法的流程图,如图所示,通过第一设备的dsp模块监听环境中的声音,当监听到语音信息, 匹配监听到的语音信息和本身的唤醒声纹,若语音信息和唤醒声纹不匹配,则不会对语音信 息进行响应。若语音信息和唤醒声纹匹配,则获取本身对语音信息的竞价值,则第一设备的 套接字客户端(socket client)向第二设备的套接字服务端(socket server)发送本身的竞价 值,同时第一设备的socket server监听第二设备发送的第二设备的竞价值,在规定时间之内, 若有高于自己竞价值的第二设备,则第一设备的socket server退出不再监听第二设备发送的 第二设备的竞价值,若当前接受到的第二设备的竞价值低于自己竞价值,则第一设备的socketserver保持监听;若规定时间之内监听到的竞价值均低于本身的竞价值,则规定时间到之后, 确定本身为唤醒设备,则做出响应。规定时间可以为预先设置的时间,例如0.3s,0.5s,0.8s 等,本技术对此不做限制。其中,socket client和socket server位于图8所示的框架结构的电 话管理(telephony manager)中。另外,需要说明,图8所示实施例仅用于举例,实际应用 中,第一设备的应用层还可能包括其他应用软件,应用框架层还可以包括其他服务或管理。
[0215]
当然,若电子设备的竞价值有可能存在相等的情况下,则可能存在如下几种情况:
[0216]
情况2-1、第二设备发送的竞价值全部高于第一设备的竞价值。
[0217]
情况2-2、第二设备发送的竞价值全部低于第一设备的竞价值。
[0218]
情况2-3,第二设备发送的竞价值中,有一部分高于第一设备的竞价值,一部分低于第一 设备的竞价值,另一部分等于第一设备的竞价值。
[0219]
情况2-4、第二设备发送的竞价值中,有一部分高于第一设备的竞价值,一部分等于第一 设备的竞价值。
[0220]
情况2-5、第二设备发送的竞价值中,有一部分低于第一设备的竞价值,一部分等
于第一 设备的竞价值。
[0221]
对于情况2-1,则第一设备不为唤醒设备,对于情况2-2,则第一设备为唤醒设备,对于 情况2-3,则第一设备不为唤醒设备,对于情况2-4,第一设备不为唤醒设备,情况2-5,可 以将第一设备以及竞价值等于第一设备的竞价值的第二设备均作为唤醒设备,也可以从二者 中选择一个作为唤醒设备。如果以第一设备以及竞价值等于第一设备的竞价值的第二设备中 的一个作为唤醒设备,则可以参照后续实施例的描述。
[0222]
综上,若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,存在 至少一个第二设备对语音信息的竞价值高于第一设备对语音信息的竞价值,则确定第一设备 不为唤醒设备,例如,上述情况2-1、情况2-3、情况2-4。
[0223]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低于第一设备 对语音信息的竞价值,则确定第一设备为唤醒设备,例如,上述情况2-2。
[0224]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,不存在高于 第一设备对语音信息的竞价值、且存在等于第一设备对语音信息的竞价值,则将竞价值等于 第一设备对语音信息的竞价值的第二设备记为第三设备,并获取第三设备的状态信息;第一 设备基于第一设备的状态信息和第三设备的状态信息,确定第一设备是否为唤醒设备,其中, 状态信息包括以下至少一项状态参数:第二预设时间之内的开机状态总时长、设备位置、剩 余电量和是否处于使用状态,例如上述情况2-5。
[0225]
在该示例中,当一个应用场景中存在至少两个电子设备对语音信息的竞价值相等时,可 以基于竞价值相等的电子设备中第二预设时间内开机状态总时长最长的一个作为唤醒设备、 或者剩余电量最多的一个电子设备作为唤醒设备,或者当前处于使用状态的电子设备作为唤 醒设备,或者设备位置与用户的距离最近的一个电子设备作为唤醒设备。当然,设备位置与 用户的距离最近的一个电子设备可以通过监听到的语音信息的响度确定,监听到语音信息的 响度最高的一个电子设备表示与用户的距离最近的一个电子设备。另外,第二预设时间内开 机状态总时长表示:该电子设备在第二预设时间之内保持开机状态的总的时间,例如,第二 预设时间可以设置为一周,该状态参数用于表示用户最近是否经常使用该电子设备。
[0226]
当然,实际应用中,第三设备的状态信息可以随着第三设备发送竞价值的同时发送给第 一设备,第一设备向第二设备发送第一设备的竞价值的同时将第一设备的状态信息发送给第 二设备。
[0227]
参见图9,图9作为图6所示实施例的一个应用场景,该应用场景中包括位于同一网络 下的多个电子设备,分别为:手机1、手机2、智慧屏和智能音箱。用户a预先在手机1、智 慧屏和智能音箱中录入用户a的声纹信息作为手机1、智慧屏和智能音箱的唤醒声纹。
[0228]
用户a在该应用场景中发出语音信息,例如“小e,小e,给我放个歌”,该应用场景 中,手机1、智慧屏和智能音箱的唤醒声纹为用户a的声纹信息,因此,手机1、智慧屏和 智能音箱的唤醒声纹和用户a的语音信息“小e,小e,给我放个歌”匹配,因此,手机1、 智慧屏和智能音箱执行步骤602的操作,而手机2执行步骤601的操作之后,由于手机2的 唤醒声纹和用户a的语音信息“小e,小e,给我放个歌”不匹配,不再继续执行后续的步 骤。
[0229]
作为举例,语音信息“小e,小e,给我放个歌”的唤醒场景为音乐,而预先为手机1 设置的在音乐场景下的竞价值为5,预先为智慧屏设置的在音乐场景下的竞价值为3,预先
为 智能音箱设置的在音乐场景下的竞价值为8。则手机1作为第一设备,向智慧屏、手机2和 智能音箱发送手机1的竞价值5;智慧屏作为第一设备,向手机1、手机2、和智能音箱发送 智慧屏的竞价值3;智能音箱作为第一设备,向手机1、智慧屏和手机2发送智能音箱的竞价 值8;手机2作为第一设备,执行步骤601之后结束。手机1作为第一设备,接收到的竞价 值中,存在智能音箱的竞价值8高于本身的竞价值5,因此,手机1执行步骤6031;智慧屏 作为第一设备,接收到的竞价值中,存在智能音箱的竞价值高于本身的竞价值5,因此,智 慧屏执行步骤6031;智能音箱作为第一设备,接收到的竞价值中,均低于本身的竞价值8, 因此,智能音箱执行步骤6032。
[0230]
如果该应用场景中,还存在另一个与智能音箱的竞价值相等的电子设备a,则在发送竞 价值的过程中,各个电子设备作为第一设备,向第二设备发送各自的竞价值的过程中还可以 发送各自的状态信息,以状态信息为第二预设时间之内的开机总时长为例,若智能音箱作为 第一设备接收到的电子设备a的开机总时长大于智能音箱的开机总时长,则智能音箱不为唤 醒设备,若电子设备a作为第一设备接收到的智能音箱的开机总时长大于电子设备a的开机 总时长,则电子设备a为唤醒设备。
[0231]
参见图10,图10为本技术实施例提供的另一语音唤醒方法的流程示意图,如图所示, 该方法包括:
[0232]
步骤1001、响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行 匹配。
[0233]
步骤1002、若语音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设 备对语音信息的竞价值,并监听第二设备发送的第二设备对语音信息的竞价值。
[0234]
步骤1001至步骤1002的内容和步骤301至步骤302内容一致,具体可参照步骤301至 步骤302的描述,在此不再赘述。
[0235]
步骤1003、若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低 于第一设备对语音信息的竞价值,则第一设备确定第一设备对语音信息的竞价值是否高于预 设值。
[0236]
在本技术实施例中,有可能出现一种情况,应用场景中监听到语音信息、与语音信息匹 配、且对语音信息的竞价值最高的电子设备也不具有执行语音信息对应的唤醒操作的能力。
[0237]
作为举例,参见图11所示应用场景,该应用场景中的手机1、智慧屏和智能音箱的唤醒 声纹包括用户a的声纹信息。用户在客厅说出“小e,小e,打电话”,然而,客厅中的能够 监听到用户的语音信息的智慧屏和智能音箱,均无法执行语音信息“打电话”对应的唤醒操 作:进入拨打电话的界面。所以,无论智慧屏和智能音箱中哪一个的竞价值高,竞价值高的 一个也是无法执行语音信息对应的唤醒操作的。因此,竞价值最高的第一设备还需要确定第 一设备对语音信息的竞价值是否高于预设值,只有在高于预设值的情况下,第一设备才为唤 醒设备。预设值为预先为每个唤醒模式设置的能够执行相应唤醒操作的临界值。
[0238]
步骤10041、若第一设备对语音信息的竞价值高于预设值,则确定第一设备为唤醒设备, 第一设备执行与语音信息对应的唤醒操作。
[0239]
步骤10042、若第一设备对语音信息的竞价值低于或等于预设值,则第一设备确定第一 设备所在的网络中是否存在第四设备,其中,第四设备为第一设备在第一预设时间之
内未监 听到竞价值的第二设备中,声纹信息与语音信息匹配的电子设备。
[0240]
步骤1005、若第一设备所在的网络中存在第四设备,则第一设备向第四设备发送语音信 息对应的唤醒指令,以指示第四设备在第四设备对语音信息的竞价值高于预设值的情况下执 行与语音信息对应的唤醒操作。
[0241]
在本技术实施例中,如图11所示应用场景,用户在房间2发出语音信息后,此时位于房 间1中的手机1和手机2可能由于距离较远未监听到用户的语音信息。此种情况下,房间2 中竞价值最高的智慧屏可以发现所在的网络中是否存在第四设备。第四设备为竞价值最高的 电子设备作为第一设备时,第二设备中未接收到竞价值的第二设备中的电子设备。作为举例, 智慧屏为竞价值最高的电子设备,智慧屏为第一设备,则第二设备为与智慧屏位于同一网络 中的智能音箱、手机1和手机2。由于智慧屏接收到智能音箱的竞价值,因此,第四设备为 手机1和手机2中的电子设备。即第四设备为手机1和手机2中,唤醒声纹与语音信息匹配 的电子设备。通过比对,手机1的唤醒声纹和语音信息匹配,则手机1为第四设备,则竞价 值最高的智慧屏向手机1发送唤醒指令,手机1接收到唤醒指令后,判断本身对语音信息的 竞价值是否高于预设值,在高于预设值的情况下执行与语音信息对应的唤醒操作。需要说明, 竞价值最高的电子设备向第四设备发送唤醒指令的同时,还可以发送语音信息或语音信息对 应文字信息,以便于第四设备确定第四设备对语音信息的竞价值是否高于预设值。
[0242]
需要说明,可以将第一设备监听到的竞价值对应的第二设备记为第二竞价设备,将第二 设备中除所述第二竞价设备之外的其他第二设备记为候选第四设备。所以,第四设备为候选 第四设备中,声纹信息与语音信息匹配的电子设备,其中,候选第四设备为第二设备中除所 述第二竞价设备之外的其他第二设备,第二竞价设备为第一设备监听到的竞价值对应的第二 设备。
[0243]
参见图12,图12为本技术实施例提供的另一种语音唤醒方法的流程示意图,如图所示, 该方法包括:
[0244]
步骤1201、响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行 匹配。
[0245]
步骤1202、若语音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设 备对语音信息的竞价值,并监听第二设备发送的第二设备对语音信息的竞价值。
[0246]
步骤1201至步骤1202和步骤301至步骤302内容一致,具体可参照步骤301至步骤302 的描述,在此不再赘述。
[0247]
步骤1203、若第一设备在第一预设时间之内未接收到第二设备发送的信息,则第一设备 确定第一设备对语音信息的竞价值是否高于预设值。
[0248]
参见图13,为图12所示实施例的一个应用场景,图13所示应用场景和图11所示应用 场景不同的地方在于,图13所示应用场景中,能够监听到用户的语音信息、且与语音信息匹 配的电子设备仅有一个,图11所示应用场景中能够监听到用户语音信息、且与语音信息匹配 的电子设备存在至少两个。能够监听到用户语音信息、且与语音信息匹配的电子设备存在两 个或两个以上时,能够监听到用户语音信息、且与语音信息匹配的电子设备之间需要进行竞 价值的比较过程。而能够监听到用户语音信息、且与语音信息匹配的电子设备只有一个的情 况下,则不会接收到其他电子设备发送的竞价值,因此,不存在竞价值比较
的过程,而是直 接判断第一设备对语音信息的竞价值是否高于预设值。
[0249]
步骤12041、若第一设备对语音信息的竞价值高于预设值,则第一设备确定第一设备为 唤醒设备。
[0250]
步骤12042、若第一设备对语音信息的竞价值低于或等于预设值,则第一设备确定第一 设备所在的网络中是否存在第四设备,其中,第四设备为第一设备在第一预设时间之内未监 听到竞价值的第二设备中,声纹信息与语音信息匹配的电子设备。
[0251]
步骤1205、若第一设备所在的网络中存在第四设备,则第一设备向第四设备发送语音信 息对应的唤醒指令,以指示第四设备在第四设备对语音信息的竞价值高于预设值的情况下执 行与语音信息对应的唤醒操作。
[0252]
步骤1241至步骤1205的内容与步骤10041至步骤1005内容一致,具体可参照步骤10041 至步骤1005的描述,在此不再赘述。
[0253]
图10和图12所示实施例中,第一设备在确定第二设备中是否存在第四设备的过程中, 由于第四设备为唤醒声纹和语音信息匹配的设备,因此,第一设备需要预先存储各个电子设 备的唤醒声纹。
[0254]
作为本技术另一实施例,在第一设备确定第一设备所在的网络中是否存在第四设备之前, 还包括:
[0255]
第一设备获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒声纹。
[0256]
作为本技术另一实施例,第一设备获取第一设备在第一预设时间之内未监听到竞价值的 第二设备的唤醒声纹包括:
[0257]
第一设备为预设的声纹汇总设备时,第一设备接收第一设备所在网络中除第一设备以外 的其他电子设备的唤醒声纹;
[0258]
第一设备基于第一设备的唤醒声纹和接收到的其他电子设备的唤醒声纹生成声纹特性汇 总,并向其他电子设备发送声纹特性汇总;
[0259]
第一设备从声纹特性汇总中获取第一设备在第一预设时间之内未监听到竞价值的第二设 备的唤醒声纹;
[0260]
第一设备不为预设的声纹汇总设备时,第一设备向预设的声纹汇总设备发送第一设备的 唤醒声纹,以指示声纹汇总设备生成声纹汇总设备所在网络中各电子设备的声纹特性汇总;
[0261]
第一设备接收声纹汇总设备发送的声纹特性汇总;
[0262]
第一设备从声纹特性汇总中获取第一设备在第一预设时间之内未监听到竞价值的第二设 备的唤醒声纹。
[0263]
在本技术实施例中,可以参照图14所示应用场景使得各个电子设备获取其他电子设备的 唤醒声纹,该应用场景中,需要预先设置声纹汇总设备,可以设置常停留在应用场景中的电 子设备为声纹汇总设备,例如无线路由器。
[0264]
该应用场景中,与声纹汇总设备位于同一网络中的各个电子设备可以向声纹汇总设备发 送各自的唤醒声纹,声纹汇总设备收集各个电子设备的唤醒声纹后,将收集的各个电子设备 的唤醒声纹发送至网络中的各个电子设备,当然,如果声纹汇总设备本身也有唤醒声纹,则 可以将收集的各个电子设备的唤醒声纹以及自己的唤醒声纹发送至网络中各
个电子设备。
[0265]
参见图15,图15为本技术实施例提供的另一语音唤醒方法的流程示意图,如图所示, 该方法包括:
[0266]
步骤1501、响应于监听到的语音信息,第一设备将语音信息与第一设备的唤醒声纹进行 匹配。
[0267]
步骤1502、若语音信息与第一设备的唤醒声纹匹配,则第一设备向第二设备发送第一设 备对语音信息的竞价值,并监听第二设备发送的信息,其中,第一设备对语音信息的竞价值 为第一设备对语音信息对应的唤醒操作的支持能力,第二设备为预设的决策设备。
[0268]
步骤1501至步骤1502的内容和步骤301至步骤302内容一致,具体可参照步骤301至 步骤302的描述,在此不再赘述。
[0269]
步骤15031、若第一设备接收到的第二设备发送的信息为第一消息,则第一设备确定第 一设备为唤醒设备。
[0270]
步骤15041、若第一设备为唤醒设备,则第一设备执行与语音信息对应的唤醒操作。
[0271]
步骤15032、若第一设备接收到的第二设备发送的信息为第二消息,则第一设备确定第 一设备不为唤醒设备。
[0272]
步骤15042、若第一设备不为唤醒设备,则第一设备放弃对语音信息的响应。
[0273]
在本技术实施例中,第二设备为决策设备时,第二设备所在网络中的其他电子设备均向 决策设备发送各自对语音信息的竞价值,决策设备接收到决策设备所在网络中各电子设备发 送的各电子设备对语音信息的竞价值后,决策设备比较在第三预设时间之内接收到的各电子 设备发送的各电子设备对语音信息的竞价值,从中选择竞价值最高的电子设备作为唤醒设备, 并向竞价值最高的电子设备发送第一消息,以指示竞价值最高的电子设备作为唤醒设备,执 行与语音信息对应的唤醒操作,向竞价值不是最高的电子设备发送第二消息,以指示竞价值 不是最高的电子设备放弃此次唤醒以及对应的响应。
[0274]
第一设备为决策设备所在网络中的其他电子设备中的任一个,第一设备接收到第二设备 发送的第一消息,表示第一设备为唤醒设备,第一设备执行与语音信息对应的唤醒操作。第 一设备接收到第二设备发送的第二消息,表示第一设备不为唤醒设备,第一设备放弃此次唤 醒以及对应的响应。
[0275]
当然,该实施例中,若竞价值最高的电子设备的个数为两个或两个以上,则可以按照如 图6所示实施例中根据各电子设备的状态信息确定第三设备作为唤醒设备。
[0276]
当然,实际应用中,可以设置多个决策设备,然而,需要为多个决策设备分别预先设置 优先级,位于同一网络中的多个决策设备可以通过相互之间的信息交互确定出决策优先级最 高的一个作为最终的决策设备。
[0277]
为了对图15所示实施例提供的语音唤醒方法具有更清晰的理解,通过图16所示的应用 场景进一步解释。
[0278]
图16所示的应用场景中,无线路由器为预先设置的决策设备,且无线路由器不会作为唤 醒设备。该应用场景中还存在手机1、手机2、智慧屏和智能音箱。手机1、手机2、智慧屏、 智能音箱和无线路由器在同一无线网络下,或手机1、手机2、智慧屏和智能音箱均连接
无线 路由器的无线网络下。其中,手机1的唤醒声纹包括:用户a的声纹信息;手机2的唤醒声 纹包括:用户b的声纹信息;智慧屏和智能音箱的唤醒声纹均包括:用户a的声纹信息和用 户b的声纹信息。
[0279]
该应用场景中,用户a说出“小e,小e,给我放个电影”,手机2的唤醒声纹中不包括 用户a的声纹信息,而此时,语音信息“小e,小e,给我放个电影”为用户a说出的,所 以语音信息和手机2的唤醒声纹不匹配,手机2放弃此轮响应。
[0280]
手机1、智慧屏和智能音箱也均将语音信息“小e,小e,给我放个电影”与各自的唤醒 声纹进行匹配。手机1、智慧屏和智能音箱中的唤醒声纹中存在与用户a的语音信息匹配的 唤醒声纹,即语音信息与手机1、智慧屏和智能音箱的唤醒声纹匹配。则手机1、智慧屏和智 能音箱分别向无线路由器发送各自对语音信息“小e,小e,给我放个电影”的竞价值,并 监听决策设备发送的信息。
[0281]
决策设备接收到手机1、智慧屏和智能音箱发送的各自对语音信息“小e,小e,给我放 个电影”的竞价值后,通过比较,智慧屏对语音信息“小e,小e,给我放个电影”的竞价 值最高,此时,决策设备向智慧屏发送第一消息,向手机1和智能音箱发送第二消息。
[0282]
智慧屏接收到第一消息后,确定智慧屏为唤醒设备,则执行与语音信息“小e,小e, 给我放个电影”对应的唤醒操作:播放电影播放列表中的第一个电影。
[0283]
手机1和智能音箱接收到第二消息后,放弃此轮响应。
[0284]
通过该应用场景的描述,可以理解智慧屏作为第一设备执行的为:步骤1501、步骤1502、 步骤15031和步骤15041。手机1和智能音箱作为第一设备执行的为:步骤1501、步骤1502、 步骤15032和步骤15042。
[0285]
按照图15所示实施例和图16所示应用场景可以理解,决策设备在该应用场景中比较的 是决策设备所在网络中除决策设备以外的其他电子设备对语音信息的竞价值。实际应用中, 决策设备比较的竞价值中也可以包括自己对语音信息的竞价值。
[0286]
作为举例,决策设备接收到决策设备所在网络中除决策设备以外的其他电子设备发送的 各电子设备对语音信息的竞价值后,决策设备比较在第二预设时间之内接收到的其他电子设 备发送的各电子设备对语音信息的竞价值以及决策设备对语音信息的竞价值,从中选择竞价 值最高的电子设备作为唤醒设备。若决策设备对语音信息的竞价值最高,则决策设备为唤醒 设备,执行与语音信息对应的唤醒操作;向决策设备所在网络中除决策设备以外的其他电子 设备发送第二消息,以指示其他电子设备放弃此次响应。若决策设备对语音信息的竞价值不 是最高,则决策设备放弃此次响应,并向其他电子设备中竞价值最高的电子设备发送第一消 息,以指示其他电子设备中竞价值最高的电子设备作为唤醒设备,执行与语音信息对应的唤 醒操作,向其他电子设备中竞价值不是最高的电子设备发送第二消息,以指示其他电子设备 中竞价值不是最高的电子设备放弃此次响应。
[0287]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行 顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0288]
本技术实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应 每一个功能划分每一个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。 上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式
实现。需要说 明的是,本技术实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时 可以有另外的划分方式。下面以采用对应每一个功能划分每一个功能单元为例进行说明:
[0289]
参照图17,该电子设备1700作为执行主体记为第一设备,该第一设备包括:
[0290]
声纹匹配单元1701,用于响应于监听到的语音信息,将语音信息与第一设备的唤醒声纹 进行匹配;
[0291]
信息交互单元1702,用于若语音信息与第一设备的唤醒声纹匹配,则向第二设备发送第 一设备对语音信息的竞价值,并监听第二设备发送的信息,其中,第一设备对语音信息的竞 价值为第一设备对语音信息对应的唤醒操作的支持能力;
[0292]
竞价单元1703,用于响应于监听到的第二设备发送的信息,基于第二设备发送的信息确 定第一设备是否为唤醒设备;
[0293]
唤醒单元1704,用于若第一设备为唤醒设备,则执行与语音信息对应的唤醒操作。
[0294]
作为本技术另一实施例,第二设备为与第一设备位于同一网络中的电子设备,第二设备 发送的信息包括第二设备对语音信息的竞价值;
[0295]
相应的,竞价单元1703还用于:
[0296]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,存在至少一 个第二设备对语音信息的竞价值高于第一设备对语音信息的竞价值,则确定第一设备不为唤 醒设备;
[0297]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低于第一设备 对语音信息的竞价值,则确定第一设备为唤醒设备。
[0298]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值中,不存在高于 第一设备对语音信息的竞价值、且存在等于第一设备对语音信息的竞价值,则将竞价值等于 第一设备对语音信息的竞价值的第二设备记为第三设备,并获取第三设备的状态信息;
[0299]
基于第一设备的状态信息和第三设备的状态信息,确定第一设备是否为唤醒设备,其中, 状态信息包括以下至少一项状态参数:第二预设时间之内的开机状态总时长、设备位置、剩 余电量和是否处于使用状态。
[0300]
作为本技术另一实施例,竞价单元1703还用于:
[0301]
若第一设备在第一预设时间之内接收到的第二设备对语音信息的竞价值均低于第一设备 对语音信息的竞价值,则确定第一设备对语音信息的竞价值是否高于预设值;
[0302]
若第一设备对语音信息的竞价值高于预设值,则确定第一设备为唤醒设备。
[0303]
作为本技术另一实施例,竞价单元1703还用于:
[0304]
若第一设备对语音信息的竞价值低于或等于预设值,则确定第一设备所在的网络中是否 存在第四设备,其中,第四设备为第一设备在第一预设时间之内未监听到竞价值的第二设备 中,声纹信息与语音信息匹配的电子设备;
[0305]
若第一设备所在的网络中存在第四设备,则向第四设备发送语音信息对应的唤醒指令, 以指示第四设备在第四设备对语音信息的竞价值高于预设值的情况下执行与语音信息对应的 唤醒操作。
[0306]
作为本技术另一实施例,第二设备为与第一设备位于同一网络中的电子设备。
[0307]
相应的,竞价单元1703还用于:
[0308]
若在第一预设时间之内未接收到第二设备发送的信息,则确定第一设备对语音信息的竞 价值是否高于预设值;
[0309]
若第一设备对语音信息的竞价值高于预设值,则确定第一设备为唤醒设备;
[0310]
若第一设备对语音信息的竞价值低于或等于预设值,则确定第一设备所在的网络中是否 存在第四设备,其中,第四设备为第一设备在第一预设时间之内未监听到竞价值的第二设备 中,声纹信息与语音信息匹配的电子设备;
[0311]
若第一设备所在的网络中存在第四设备,则向第四设备发送语音信息对应的唤醒指令, 以指示第四设备在第四设备对语音信息的竞价值高于预设值的情况下执行与语音信息对应的 唤醒操作。
[0312]
作为本技术另一实施例,竞价单元1703还用于:
[0313]
获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒声纹。
[0314]
作为本技术另一实施例,竞价单元还用于:
[0315]
第一设备为预设的声纹汇总设备时,接收第一设备所在网络中除第一设备以外的其他电 子设备的唤醒声纹;
[0316]
基于第一设备的唤醒声纹和接收到的其他电子设备的唤醒声纹生成声纹特性汇总,并向 其他电子设备发送声纹特性汇总;
[0317]
从声纹特性汇总中获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒 声纹;
[0318]
第一设备不为预设的声纹汇总设备时,向预设的声纹汇总设备发送第一设备的唤醒声纹, 以指示声纹汇总设备生成声纹汇总设备所在网络中各电子设备的声纹特性汇总;
[0319]
接收声纹汇总设备发送的声纹特性汇总;
[0320]
从声纹特性汇总中获取第一设备在第一预设时间之内未监听到竞价值的第二设备的唤醒 声纹。
[0321]
作为本技术另一实施例,第二设备为预设的决策设备,决策设备用于接收决策设备所在 网络中各电子设备发送的各电子设备对语音信息的竞价值,并向竞价值最高的电子设备发送 第一消息,向竞价值不为最高的电子设备发送第二消息;
[0322]
竞价单元1703还用于:
[0323]
若接收到的第二设备发送的信息为第一消息,则确定第一设备为唤醒设备;
[0324]
若接收到的第二设备发送的信息为第二消息,则确定第一设备不为唤醒设备。
[0325]
作为本技术另一实施例,信息交互单元1702还用于:
[0326]
获取语音信息对应的唤醒模式,其中,唤醒模式包括:唤醒场景;
[0327]
获取第一设备在唤醒模式下的竞价值,并将该竞价值作为第一设备对语音信息的竞价值;
[0328]
向第二设备发送第一设备对语音信息的竞价值。
[0329]
作为本技术另一实施例,信息交互单元1702还用于:
[0330]
获取预设的第一设备在唤醒模式下的竞价值;
[0331]
或,
[0332]
获取第一设备的设备参数和唤醒模式对设备参数的依赖度;
[0333]
基于第一设备的设备参数和唤醒模式对设备参数的依赖度,生成第一设备在唤醒模式下 的竞价值。
[0334]
作为本技术另一实施例,唤醒模式还包括:唤醒地点;
[0335]
信息交互单元1702还用于:
[0336]
基于第一设备当前连接的网络确定语音信息对应的唤醒地点。
[0337]
需要说明的是,上述第一设备中各单元之间的信息交互、执行过程等内容,由于与本申 请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分, 此处不再赘述。
[0338]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元 的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成, 即将第一设备的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。实 施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以 两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可 以采用软件功能单元的形式实现。另外,各功能单元的具体名称也只是为了便于相互区分, 并不用于限制本技术的保护范围。上述电子设备中各单元的具体工作过程,可以参考前述方 法实施例中的对应过程,在此不再赘述。
[0339]
本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程 序,计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
[0340]
本技术实施例还提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时, 使得电子设备可实现上述各个方法实施例中的步骤。
[0341]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储 在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或 部分流程,可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机 可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其 中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、 可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够将计算机程序代码携带 到第一设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及 软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专 利实践,计算机可读介质不可以是电载波信号和电信信号。
[0342]
本技术实施例还提供了一种芯片系统,芯片系统包括处理器,处理器与存储器耦合,处 理器执行存储器中存储的计算机程序,以实现本技术任一方法实施例的步骤。芯片系统可以 为单个芯片,或者多个芯片组成的芯片模组。
[0343]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部 分,可以参见其它实施例的相关描述。
[0344]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方 法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件 还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每 个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为
超出本技术的范 围。
[0345]
以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本申 请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载 的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不 使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保 护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献