一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音交互方法、装置、电子设备及存储介质与流程

2021-11-24 23:55:00 来源:中国专利 TAG:


1.本公开涉及通信领域,尤其涉及一种语音交互方法、装置、电子设备及存储介质。


背景技术:

2.随着物联网技术的发展,人们的生活日渐智能化和科技化。物联网是在互联网基础上延伸和扩展的网络,可将多种设备与互联网结合起来,实现信息交换和通信。物联网技术常应用于家庭生活中的智能家居,利用手机端就可远程控制家庭中的多种智能电器,为人们的生活带来极大便利。而智能音频设备在智能家居中必不可少,用户可通过智能音频设备控制其他智能设备。
3.相关技术中,智能音频设备需要由用户唤起,应用局限性较大。


技术实现要素:

4.为克服相关技术中存在的问题,本公开提供一种语音交互方法、装置、电子设备及存储介质。
5.根据本公开实施例的第一方面,提出了一种语音交互方法,应用于音频设备,所述音频设备与中控模组通信连接,方法包括:
6.接收所述中控模组发送的当前场景标识,其中,所述当前场景标识为:所述中控模组根据触发信息当前触发信息确定的,所述当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息;
7.根据所述当前场景标识,确定语音应答策略;
8.根据所述语音应答策略,发起语音交互。
9.在一些实施例中,所述根据所述当前场景标识,确定语音应答策略,包括:
10.获取第一配置信息,所述第一配置信息包括应用场景标识与语音应答策略的对应关系;
11.根据所述当前场景标识,确定所述第一配置信息中对应的语音应答策略。
12.在一些实施例中,所述语音应答策略包括:与所述当前场景标识关联的多个交互内容;所述根据所述语音应答策略,发起语音交互,包括:
13.根据所述当前场景标识,确定初始交互内容并播放;
14.接收用户的反馈应答;
15.根据所述反馈应答中的关键词,确定与所述关键词对应的目标交互内容并播放。
16.在一些实施例中,所述方法还包括:
17.响应于触发语音终止条件,停止语音交互;
18.其中,所述语音终止条件包括:接收所述反馈应答的时长超过预设时长,或者所述反馈应答中包含预设终止关键词,或者接收到终止指令。
19.在一些实施例中,所述根据所述反馈应答中的关键词,确定与所述关键词对应的目标交互内容并播放,包括:
20.响应于所述反馈应答中包括:控制指令和智能设备关键词,发送所述控制指令至所述中控模组,并播放所述目标交互内容;
21.其中,所述目标交互内容包括:已执行所述控制指令的提示消息。
22.根据本公开实施例的第二方面,提出了一种语音交互方法,应用于中控模组,所述中控模组与当前环境中的音频设备和监测设备通信连接,其中,所述监测设备包括设置于当前环境中的传感器和/或图像采集设备;方法包括:
23.接收监测设备发送的当前触发信息,其中,所述当前触发信息用于表征:所述监测设备采集的且达到触发阈值的环境信息;
24.根据所述当前触发信息,确定对应的当前场景标识;
25.发送所述当前场景标识至所述音频设备。
26.在一些实施例中,所述根据所述当前触发信息,确定对应的当前场景标识,包括:
27.调用第二配置信息,所述第二配置信息包括触发信息与应用场景标识的对应关系;
28.根据所述当前触发信息,确定所述第二配置信息中与对应的所述当前场景标识。
29.在一些实施例中,所述方法还包括:
30.接收所述音频设备发送的控制指令;
31.根据所述控制指令,控制对应的智能设备按所述控制指令运行。
32.根据本公开实施例的第三方面,提出了一种语音交互装置,应用于音频设备,所述音频设备与中控模组通信连接,装置包括:
33.第一接收模块,用于接收所述中控模组发送的当前场景标识,其中,所述当前场景标识为:所述中控模组根据触发信息当前触发信息确定的,所述当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息;
34.第一确定模块,用于根据所述当前场景标识,确定语音应答策略;
35.语音交互模块,用于根据所述语音应答策略,发起语音交互。
36.在一些实施例中,所述第一确定模块用于:
37.获取第一配置信息,所述第一配置信息包括应用场景标识与语音应答策略的对应关系;
38.根据所述当前场景标识,确定所述第一配置信息中对应的语音应答策略。
39.在一些实施例中,所述语音应答策略包括:与所述当前场景标识关联的多个交互内容;所述语音交互模块,用于:
40.根据所述当前场景标识,确定初始交互内容并播放;
41.接收用户的反馈应答;
42.根据所述反馈应答中的关键词,确定与所述关键词对应的目标交互内容并播放。
43.在一些实施例中,所述装置还包括:第一控制模块,用于响应于触发语音终止条件,停止语音交互;
44.其中,所述语音终止条件包括:接收所述反馈应答的时长超过预设时长,或者所述反馈应答中包含预设终止关键词,或者接收到终止指令。
45.在一些实施例中,所述语音交互模块还用于:
46.响应于所述反馈应答中包括:控制指令和智能设备关键词,发送所述控制指令至
所述中控模组,并播放所述目标交互内容;
47.其中,所述目标交互内容包括:已执行所述控制指令的提示消息。
48.根据本公开实施例的第四方面,提出了一种语音交互装置,应用于中控模组,所述中控模组与当前环境中的音频设备和监测设备通信连接,其中,所述监测设备包括设置于当前环境中的传感器和/或图像采集设备;装置包括:
49.第二接收模块,用于接收监测设备发送的当前触发信息,其中,所述当前触发信息用于表征:所述监测设备采集的且达到触发阈值的环境信息;
50.第二确定模块,用于根据所述当前触发信息,确定对应的当前场景标识;
51.发送模块,用于发送所述当前场景标识至所述音频设备。
52.在一些实施例中,所述第二确定模块用于:
53.调用第二配置信息,所述第二配置信息包括触发信息与应用场景标识的对应关系;
54.根据所述当前触发信息,确定所述第二配置信息中与对应的所述当前场景标识。
55.在一些实施例中,所述装置还包括:第二控制模块,用于
56.接收所述音频设备发送的控制指令;
57.根据所述控制指令,控制对应的智能设备按所述控制指令运行。
58.根据本公开实施例的第五方面,提出了一种电子设备,包括:
59.处理器;
60.用于存储处理器的可执行指令的存储器;
61.其中,所述处理器被配置为执行如上任一项所述的语音交互方法。
62.根据本公开实施例的第六方面,提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上任一项所述的语音交互方法。
63.本公开的实施例提供的技术方案可以包括以下有益效果:本公开的方法中,中控模组根据触发信息当前触发信息确定当前场景标识。音频设备可根据当前场景标识并结合语音应答策略主动发起语音交互,主动性和适用性更强,更适用于零售或展厅环境中,扩展了音频设备的使用场景。
64.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
65.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
66.图1是根据一示例性实施例示出的语音交互系统的示意图。
67.图2是根据一示例性实施例示出的方法的流程图。
68.图3是根据一示例性实施例示出的方法的流程图。
69.图4是根据一示例性实施例示出的方法的流程图。
70.图5是根据一示例性实施例示出的方法的交互示意图。
71.图6是根据一示例性实施例示出的装置的框图。
72.图7是根据一示例性实施例示出的装置的框图。
73.图8是根据一示例性实施例示出的电子设备的框图。
具体实施方式
74.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
75.相关技术中,智能音频设备的交互方式比较单一,需要人工唤起后,根据用户明确的指令实现对应的控制功能。语音交互的灵活性和适用性差,仅能实现单轮对话。对于存在访客的环境,如展厅或零售环境中,智能音频设备还不能实现接待或导购的功能,限制了物联网的互联应用。
76.本公开提出了一种语音交互方法,应用于音频设备,音频设备与中控模组通信连接,方法包括:接收中控模组发送的当前场景标识,其中,当前场景标识为中控模组根据触发信息当前触发信息确定的,当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息。根据当前场景标识,确定语音应答策略。根据语音应答策略,发起语音交互。本公开的方法中,中控模组根据触发信息当前触发信息确定当前场景标识。音频设备可根据当前场景标识并结合语音应答策略主动发起语音交互,主动性和适用性更强,更适用于零售或展厅环境中,扩展了音频设备的使用场景。
77.在一个示例性的实施例中,本实施例提出了一种语音交互方法,应用于音频设备,音频设备与中控模组通信连接。其中,音频设备比如为智能音箱、智能屏等智能影音设备。中控模组比如为中央控制系统或者服务器。
78.如图1所示,本实施例中的语音交互系统包括中控模组10、音频设备20、智能设备30、应用程序40以及监测设备50。其中,中控模组10分别与音频设备20、智能设备30、应用程序40以及监测设备50通信连接。智能设备30比如为智能空调、智能冰箱、空气净化器等智能家电设备。应用程序40比如是零售助手app,可安装于手机、平板电脑等移动终端中。监测设备50比如包括多种传感器及图像采集设备,多种传感器比如可以包括红外传感器、激光扫描器、射频识别器、烟雾探测器、温度传感器、光线传感器等传感器;图像采集设备可以是摄像模组等监控设备。
79.本实施例中,中控模组10中设置有:设备绑定模块101、状态机模块102、场景模块103以及ito(物联网)控制模块104。设备绑定模块101与应用程序40通信,根据应用程序40发送的指令,将登录的账户信息、多种智能设备30均与中控模组10绑定。状态机模块102中设置有适用于不同场景的多种状态机模板,状态机模板与场景标识存在对应关系;根据不同场景或相同场景下的不同输入,可输出不同结果。场景模块103中配置不同场景下的技能、指令或含语音应答策略的配置表,音频设备20可获取场景模块103中的不同语音应答策略。ito控制模块104支持多种智能设备30的控制协议,实现不同场景下智能设备30的控制。
80.如图2所示,本实施例的方法可以包括如下步骤:
81.s110、接收中控模组发送的当前场景标识。
82.s120、根据当前场景标识,确定语音应答策略。
83.s130、根据语音应答策略,发起语音交互。
84.其中,在步骤s110中,当前场景标识为中控模组根据触发信息当前触发信息确定的,当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息。
85.结合图4对应的实施例,监测设备可实时采集不同应用场景下的环境信息,环境信息比如包括图像信息或红外信息。当采集的环境信息达到触发阈值,表明当前应用场景存在语音交互请求;监测设备可将此时采集的环境信息作为当前触发信息,上报至中控模组。
86.中控模组中可以通过设置不同的场景标识表征不同的应用场景。在当前环境或当前场景中,结合监测设备的采集结果,中控模组可确定对应的当前场景标识,并将当前场景标识发送至音频设备。音频设备接收当前场景标识。
87.在步骤s120中,音频设备可以获知当前场景标识所表征的应用场景,从而确定语音应答策略。
88.音频设备的存储位置中可存储不同应用场景下的语音应答策略,音频设备从存储位置获取对应的语音应答策略。或者,结合图1所示,音频设备从场景模块103中获取语音应答策略。
89.不同的应用场景可以对应不同的语音应答策略。比如,零售场景中,语音应答策略包括零售产品的相关问答信息。展览场景中,语音应答策略包括展览产品性能的相关问答信息。智能家居场景中,语音应答策略包括室内环境以及智能设备控制的相关问答信息。
90.在步骤s130中,根据当前应用场景所对应的语音应答策略,音频设备可主动发起与用户的语音交互。比如,对于零售场景而言,本步骤中音频设备可主动与用户交互,并接收用户的应答信息。
91.在一个示例性的实施例中,本实施例中步骤s120可以包括如下步骤:
92.s1201、获取第一配置信息。
93.s1202、根据当前场景标识,确定第一配置信息中对应的语音应答策略。
94.其中,在步骤s1201中,第一配置信息包括应用场景标识与语音应答策略的对应关系,语音应答策略可以是与应用场景相关的多伦对话的语料集合。第一配置信息可以是在中控模组的场景模块中配置并存储的。本实施例中音频设备获取中控模组中场景模块的第一配置信息。
95.在步骤s1202中,音频设备在获取第一配置信息后,根据当前场景标识,可以以遍历查询的方式确定第一配置信息中与当前场景标识对应的语音应答策略。
96.在一个示例性的实施例中,语音应答策略包括:多个与当前场景标识关联的多个交互内容。
97.如图3所示,本实施例中,步骤s130可以包括如下步骤:
98.s1301、根据当前场景标识,确定初始交互内容并播放。
99.s1302、接收用户的反馈应答。
100.s1303、根据反馈应答中的关键词,确定与关键词对应的目标交互内容并播放。
101.其中,在步骤s1301中,音频设备根据当前场景标识表征的应用场景,确定的语音应答策略中包含当前应用场景下的多个交互内容,即多伦对话的语料库。多个交互内容之间还可预设播放规则,本实施例中,根据应用场景及用户的反馈应答,确定待播放的交互内容。
102.比如,音频设备在对应的语音应答策略中确定初始交互内容。根据当前触发信息确定的场景表明语音交互刚开始,初始交互内容可以是问候语。例如,当前场景标识表征的应用场景为:零售场景,初始交互内容可以是“您好,欢迎光临”。
103.在步骤s1302中,用户基于初始交互内容应答,音频设备可以接收用户基于初始交互内容的反馈应答。
104.在步骤s1303中,基于语义识别算法,音频设备可对反馈应答进行解析。提取反馈应答中的关键词,确定关键词关联的目标交互内容。比如,反馈应答中包含“益智类游戏”的关键词,结合上述步骤的零售场景,目标交互内容可以是包含益智类游戏用品的位置以及产品介绍。
105.在一个示例中,目标交互内容至少包括第一交互内容和第二交互内容。步骤s1303可以包括如下步骤:
106.s1303

1、确定反馈应答中的关键词,确定第一交互内容。该步骤中,音频设备在解析出关键词后,可在语料库中确定多种该关键词关联的交互内容。第一交互内容可以是播放关于该关键词进一步细化信息的交互内容。比如,关键词为“玩具”,第一交互内容可以是“您好,店里有一些儿童玩具,可以试玩一下”。
107.s1303

2、播放第一交互内容,并接收用户基于第一交互内容的应答。该步骤中,比如,第一交互内容可以是“您好,店里有一些儿童玩具,可以试玩一下”。音频设备接收基于这一内容的应答,比如用户应答为“好的,有没有益智类玩具”。
108.s1303

3、确定基于第一交互内容的应答中的次关键词,确定第二交互内容。该步骤中,音频设备基于上述应答,进一步确定次关键词为“益智类玩具”。则第二交互内容可以是与次关键词相关的内容,比如包括“益智类玩具”的种类及位置。
109.本示例中,根据用户对交互内容的反馈,音频设备还可以保持语音交互。例如,用户继续询问“玩具玩法”。音频设备根据用户语音,继续解析确定新的交互内容,比如介绍玩具玩法。
110.在另一个示例中,步骤s1303还可以包括如下步骤:
111.s1303

5、响应于反馈应答中包括:控制指令和智能设备关键词,发送控制指令至中控模组,并播放目标交互内容。该步骤中,目标交互内容包括:已执行控制指令的提示消息。
112.比如,反馈应答中包括:“打开”这一控制指令关键词,以及“空调”这一智能设备关键词,音频设备根据反馈应答,可将空调打开的控制指令发送至中控模组。中控模组根据控制指令控制空调打开,并发送指令已执行的反馈信息。音频设备收到反馈信息后,为用户语音播放目标交互内容,比如:播放“已打开空调”的提示消息。
113.在一个示例性的实施例中,在步骤s130之后,本实施例的方法还可以包括如下步骤:
114.s140、响应于触发语音终止条件,停止语音交互。
115.本步骤中,当音频设备与用户交互过程中触发语音终止条件,音频设备将会停止与用户的语音交互。
116.在第一个示例中,语音终止条件包括:接收反馈应答的时长超过预设时长。预设时长可以是预先设置于音频设备中的,如设置为5秒。当音频设备播放交互内容后,预设时长
之后仍为收到用户的反馈应答,音频设备可以停止语音交互。
117.在第二个示例中,语音终止条件包括:反馈应答中包含预设终止关键词。预设终止关键词比如包括“已了解”,“谢谢”,“好的”等结束某一场景的关键词。音频设备接收到包含预设终止关键词的反馈应答后,停止语音交互。
118.在第三个示例中,语音终止条件包括:接收到终止指令。终止指令可以是访客用户发出的,也可以是管理员用户发出的。音频设备接收到终止指令后,可停止语音交互。
119.在一个示例性的实施例中,本公开实施例还提出了一种语音交互方法,应用于中控模组,中控模组与当前环境中的音频设备和监测设备通信连接。
120.其中,监测设备包括设置于当前环境中的传感器和/或图像采集设备,监测设备可以设置于当前环境的入口处。例如,在零售场景中,监测设备设置在门口。传感器比如可以包括红外传感器、激光扫描器、射频识别器、烟雾探测器、温度传感器、光线传感器等传感器;图像采集设备可以是摄像模组等监控设备。
121.本实施例中,结合图1所示,中控模组10包括:设备绑定模块101、状态机模块102、场景模块103以及ito(物联网)控制模块104。设备绑定模块101与应用程序40通信,根据应用程序40发送的指令,将登录的账户信息、多种智能设备30均与中控模组10绑定。状态机模块102中设置有适用于不同场景的多种状态机模板,状态机模板与场景标识存在对应关系;根据不同场景或相同场景下的不同输入,可输出不同结果。场景模块103中配置不同场景下的技能、指令或含语音应答策略的配置表,音频设备20可获取场景模块103中的不同语音应答策略。ito控制模块104支持多种智能设备30的控制协议,实现不同场景下智能设备30的控制。
122.如图4所示,本实施例中的方法可以包括如下步骤:
123.s210、接收监测设备发送的当前触发信息。
124.s220、根据当前触发信息,确定对应的当前场景标识。
125.s230、发送当前场景标识至音频设备。
126.其中,在步骤s210中,当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息。环境信息比如包括图像信息或红外信息。当采集的环境信息达到触发阈值,表明当前应用场景存在语音交互请求;监测设备可将此时采集的环境信息作为当前触发信息,上报至中控模组。本步骤中可以是基于状态机模块进行的。
127.比如,监测设备为红外传感器,红外传感器采集到红外信息。当红外信息达到设定的红外阈值时,表明有访客通过。监测设备将达到红外阈值的红外信息上报至中控模组,中控模组确定存在语音交互请求。
128.再比如,监测设备为摄像模组,摄像模组采集图像信息。当图像信息达到设定的图像数据阈值时,如采集到人物或采集到人物开锁,表明存在访客或存在开锁事件。监测设备将图像信息上报至中控模组,中控模组确定存在语音交互请求。
129.在步骤s220中,中控模组接收到当前触发信息后,确定存在语音交互请求。中控模组可首先对语音交互请求进行解析,即对当前触发信息进行解析,确定当前触发信息对应的当前场景标识或当前应用场景。场景标识可以是中控模组中自行设置的标识或编号,用于表征对应的应用场景。
130.比如,本步骤中可以包括如下步骤:
131.s2201、调用第二配置信息。该步骤中,第二配置信息可以是预先存储在中控模组中的配置表。第二配置信息包括触发信息与应用场景标识的对应关系。触发信息与应用场景标识可以是一一对应的,即一种触发信息对应一种应用场景标识。也可以是多种触发信息对应同一种应用场景标识。
132.s2202、根据当前触发信息,确定第二配置信息中与对应的当前场景标识。该步骤中,中控模组可以采用查表或遍历查询的方式,确定第一配置信息中当前触发信息对应的当前场景标识。
133.本步骤中,不同的监测设备还可以是采集不同场景下的数据。比如,红外设备采集是否有访客。摄像模组采集访客的类型,访客类型可以是儿童、新客、老客等。不同传感器的采集结果,可以对应不同的场景标识。
134.在步骤s230中,中控模组和音频设备可基于相同的网络通信连接,进行信息交互。比如,中控模组将确定的当前场景标识发送至音频设备,及时沟通应用场景。
135.本步骤中,中控模组根据场景标识,还可以确定场景模块中场景标识所对应的配置表。比如,当前场景标识对应的配置表为第一配置信息。
136.中控模组可以在发送当前场景标识的同时,发送第一配置信息。也可以是在收到音频设备的获取请求时,再发送第一配置信息。
137.此外,中控模组与语音交互系统中的其他设备均存在通信连接,因此可以清楚的获知每次语音交互的结果、智能设备的实时状况或销售状况。结合访客或用户的行为分析,可以分析出产品的热度,利于定制合理的零售策略。
138.在一个示例性的实施例中,本实施例中的方法还可以包括如下步骤:
139.s240、接收音频设备发送的控制指令。
140.s250、根据控制指令,控制对应的智能设备按控制指令运行。
141.其中,在步骤s240中,音频设备与用户进行语音交互的过程中,可实时反馈用户的相关控制指令。比如在交互过程中,用户的反馈应答中包括打开智能设备的控制指令,音频设备可基于通信连接,将控制指令上报至中控模组中的ito控制模块。
142.在步骤s250中,中控模组中的ito控制模块可根据控制指令,控制对应的智能设备按控制指令运行。执行控制指令后,中控模组还可为音频设备发送指令已执行的反馈信息。
143.为描述上述实施例,以下将列举不同场景下的应用示例。
144.示例1:结合图5所示,展厅场景中有访客来访场景。
145.s1、设置于展厅门口的监测设备实时采集环境信息,如红外传感器采集红外信息。当采集的红外信息达到触发阈值(当前触发信息),表明门口有访客进入。监测设备上传当前触发信息至中控模组。
146.s2、中控模组根据当前触发信息,调用并查询第二配置信息,确定对应的当前场景标识。
147.s3、中控模组发送当前场景标识至音频设备。
148.s4、音频设备接收当前场景标识,获取中控模组的场景模块中的第一配置信息。
149.s5、音频设备根据当前场景标识和第一配置信息,确定与当前场景标识对应的语音应答策略。
150.s6、音频设备发起语音交互。比如首先播放“欢迎光临,我是店里智能助手,可以帮
您介绍及操控展厅内的产品”的初始交互内容。
151.示例2:结合图5所示,室内场景下的空气调节场景。
152.s1、设置于室内的监测设备采集环境信息,如烟雾探测器检测空气信息。当采集的空气信息达到雾霾天气的触发阈值(当前触发信息),表明室内空气待净化。监测设备上传当前触发信息至中控模组。
153.参见示例1的步骤s2至s5,中控模组和音频设备通信,中控模组可确定当前场景标识,音频设备可确定当前场景标识对应的语音应答策略。随后,执行步骤s6。
154.s6、音频设备发起语音交互。比如播放如下初始交互内容“主人,检测到空气质量不好,是否需要打开空气净化器?”155.s7、根据用户的反馈应答,如反馈应答为“好的/可以”。音频设备则可以发送打开空气净化器的指令至中控模组。
156.s8、中控模组的ito控制模块控制打开空气净化器,并且中控模组发送反馈消息至音频设备。
157.s9、音频设备为用户播放如下目标交互内容“空气净化器已打开”,音频设备还可以同时播放空气净化器的产品信息。
158.示例3:结合图5所示,儿童玩具展厅推荐场景。
159.s1、设置于零售柜台或店铺门口的监测设备实时采集环境信息。如摄像模组采集图像信息,当采集的图像信息达到触发阈值,如图像信息中包含儿童图像(当前触发信息),表明有儿童访客进入。或者,声音传感器采集声音信息,当采集的声音信息达到触发阈值,如声音信息符合儿童声音阈值(当前触发信息),表明有儿童访客进入。监测设备上传当前触发信息至中控模组。
160.参见示例1的步骤s2至s5,中控模组和音频设备通信,中控模组可确定当前场景标识,音频设备可确定当前场景标识对应的语音应答策略。随后,执行步骤s6。
161.s6、音频设备发起语音交互。比如播放如下初始交互内容“店里有一些儿童玩具,可以试玩哦”。
162.s7、根据用户的反馈应答,如反馈应答1为“好的,有没有益智类玩具”。音频设备解析确定关键词“益智类玩具”,可以确定与关键词对应的如下目标交互内容“有的,可以到游戏区试玩一下”,并播放目标交互内容。
163.s8、玩具区的监测设备(如红外传感器)采集到新的触发信息后,表明用户走到游戏区。发送新的触发信息至中控模组。中控模组发送新的场景标识给音频设备,可控制音频设备播报欢迎语,介绍每个玩具的玩法。中控模组还可以控制智能玩具自行演示。
164.基于与中控模组的通信,音频设备可监测场景变更,并与用户多伦对话、回答用户提问。在与音频设备通信过程中,中控模组还可以确定展厅的存货或商品销售情况,并告知音频设备。
165.示例4:结合图5所示,室内智能控制场景。
166.s1、设置于门口的监测设备采集环境信息,如智能门锁监测到开锁事件(当前触发信息),表明用户开门。监测设备上传当前触发信息至中控模组。
167.参见示例1的步骤s2至s5,中控模组和音频设备通信,中控模组可确定当前场景标识,音频设备可确定当前场景标识对应的语音应答策略。随后,执行步骤s6。
168.s6、音频设备发起语音交互。比如播放如下初始交互内容“欢迎回家”,或者“欢迎回家,是否需要打开空气调节设备”。
169.s7、根据用户的反馈应答,如反馈应答2为“好的,打开空调设备(或空气净化设备)”。音频设备解析确定控制指令和智能设备的关键词,将“打开空调设备”的控制指令发送至中控模组。
170.s8、中控模组控制打开空调设备,并发送反馈消息至音频设备。
171.s9、音频设备播放如下目标交互内容:“已打开空调”。
172.可以理解的,在任一场景示例中,如果同时存在其他场景发生的条件,基于中控模组和音频设备,还可以继续开启新的语音交互。
173.本公开实施例中的语音交互方法,以音频设备首先发起与用户的交互,并能够基于中控模组实现与用户的多伦对话。适用性更强,可应用于零售或展厅场景中,以音频设备实现ai客服、导购的功能,引导客户认识到门店的新款智能产品,并介绍产品的详情。通过行为分析产品热度和销售数据统计,利于调整销售策略。同时给用户智能家居的完整体验流程,让用户身临其境,提高了产品体验性。此外,还可以节省人力资源成本,提升了营业效率,提高了用户留存时间。
174.在一个示例性的实施例中,本公开还提出了一种语音交互装置,应用于音频设备,音频设备与中控模组通信连接。如图6所示,本实施例中装置包括:第一接收模块110、第一确定模块120和语音交互模块130。本实施例的装置用于实现如图2所示的方法。其中,第一接收模块110用于接收中控模组发送的当前场景标识,其中,当前场景标识为:中控模组根据触发信息当前触发信息确定的,当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息。第一确定模块120用于根据当前场景标识,确定语音应答策略。语音交互模块130用于根据语音应答策略,发起语音交互。本实施例中,第一确定模块120用于:获取第一配置信息,第一配置信息包括应用场景标识与语音应答策略的对应关系;根据当前场景标识,确定第一配置信息中对应的语音应答策略。
175.在一个示例性的实施例中,语音应答策略包括:与当前场景标识关联的多个交互内容。依旧参照图6所示,本实施例中的装置用于实现如图3所示的方法。其中,语音交互模块130用于:根据当前场景标识,确定初始交互内容并播放;接收用户的反馈应答;根据反馈应答中的关键词,确定与关键词对应的目标交互内容并播放。
176.本实施例中的装置还包括:第一控制模块,用于响应于触发语音终止条件,停止语音交互;其中,语音终止条件包括:接收反馈应答的时长超过预设时长,或者反馈应答中包含预设终止关键词,或者接收到终止指令。语音交互模块还用于:响应于反馈应答中包括:控制指令和智能设备关键词,发送控制指令至中控模组,并播放目标交互内容;其中,目标交互内容包括:已执行控制指令的提示消息。
177.在一个示例性的实施例中,本公开还提出了一种语音交互装置,应用于中控模组,中控模组与当前环境中的音频设备和监测设备通信连接,其中,监测设备包括设置于当前环境中的传感器和/或图像采集设备。如图7所示,本实施例的装置包括:第二接收模块210、第二确定模块220和发送模块230。本实施例的装置用于实现如图4所示的方法。其中,第二接收模块210用于接收监测设备发送的当前触发信息,其中,当前触发信息用于表征:监测设备采集的且达到触发阈值的环境信息;第二确定模块220用于根据当前触发信息,确定对
应的当前场景标识;发送模块230用于发送当前场景标识至音频设备。
178.本实施例中,第二确定模块220用于:调用第二配置信息,第二配置信息包括触发信息与应用场景标识的对应关系;根据当前触发信息,确定第二配置信息中与对应的当前场景标识。装置还包括:第二控制模块,用于接收音频设备发送的控制指令;根据控制指令,控制对应的智能设备按控制指令运行。
179.如图8所示是一种电子设备的框图。本公开还提供了一种电子设备,例如,设备500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
180.设备500可以包括以下一个或多个组件:处理组件502,存储器504,电力组件506,多媒体组件508,音频组件510,输入/输出(i/o)的接口512,传感器组件514,以及通信组件516。
181.处理组件502通常控制设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
182.存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
183.电力组件506为设备500的各种组件提供电力。电力组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
184.多媒体组件508包括在设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
185.音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(mic),当设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
186.i/o接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
187.传感器组件514包括一个或多个传感器,用于为设备500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如组件为设备500的显示器和小键盘,传感器组件514还可以检测设备500或设备500一个组件的位置改变,用户与设备500接触的存在或不存在,设备500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
188.通信组件516被配置为便于设备500和其他设备之间有线或无线方式的通信。设备500可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件516还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
189.在示例性实施例中,设备500可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的方法。
190.本公开另一个示例性实施例中提供的一种非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由设备500的处理器520执行以完成上述方法。例如,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd

rom、磁带、软盘和光数据存储设备等。当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述的方法。
191.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本技术旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
192.应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献