一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音交互方法、语音交互设备、电子设备及存储介质与流程

2021-10-27 13:27:00 来源:中国专利 TAG:人工智能 交互 语音 智能


1.本技术涉及人工智能领域,尤其涉及智能语音交互领域。


背景技术:

2.语音交互设备已经出现在越来越多的家庭中,现有技术支持对一些技能的语音交互,例如查询天气、查询时间等。一些语音交互设备,特别是带屏语音交互设备还可以安装一些应用软件,利用该应用对应的云端服务器为语音交互设备提供相应的技能。在语音交互设备开启这类技能的场景下,如果用户希望使用其他技能,则首先需要退出当前技能对应的应用,再对语音交互设备发出用户请求其他技能的语音请求。
3.例如,语音交互设备安装有购物类应用,当前该设备正开启该应用并提供购物技能;如果此时用户希望查看天气,则需要首先退出该购物类技能,之后向语音交互设备发出请求查看天气的语音请求,由语音交互设备的云端服务器提供查看天气的技能。
4.可见,现有技术中,语音交互设备在一些技能之间的切换操作繁琐,影响用户体验。


技术实现要素:

5.本技术实施例提供语音交互方法、语音交互设备、电子设备及存储介质,以解决现有技术中的一个或多个技术问题。
6.第一方面,本技术提供一种语音交互方法,包括:
7.在语音交互设备提供第一技能的情况下,向第二服务器发送第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
8.接收第二控制指令;所述第二控制指令由所述第二服务器根据所述第二语音请求生成并反馈。
9.采用本技术实施例提出的语音交互方法,能够语音控制语音交互设备在不用技能之间的切换,简化切换操作,提高用户体验。
10.第二方面,本技术提供一种语音交互方法,包括:
11.在语音交互设备提供第一技能的情况下,接收所述语音交互设备发送的第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
12.根据所述第二语音请求生成第二控制指令;
13.向所述语音交互设备反馈所述第二控制指令。
14.第三方面,本技术提供一种语音交互设备,包括:
15.请求发送模块,用于在提供第一技能的情况下,向第二服务器发送第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
16.接收模块,用于接收第二控制指令;所述第二控制指令由所述第二服务器根据所述第二语音请求生成并反馈。
17.第四方面,本技术提供一种服务器,包括:
18.请求接收模块,用于在语音交互设备提供第一技能的情况下,接收所述语音交互设备发送的第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
19.指令生成模块,用于根据所述第二语音请求生成第二控制指令;
20.指令发送模块,用于向所述语音交互设备反馈所述第二控制指令。
21.第五方面,本技术实施例提供一种电子设备,包括:
22.至少一个处理器;以及
23.与至少一个处理器通信连接的存储器;其中,
24.存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本技术任意一项实施例所提供的方法。
25.第六方面,本技术实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本技术任意一项实施例所提供的方法。
26.上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
27.附图用于更好地理解本方案,不构成对本技术的限定。其中:
28.图1为根据本技术一实施例的语音交互方法的应用系统示意图;
29.图2为根据本技术一实施例的语音交互方法的实现流程图一;
30.图3为根据本技术一实施例的语音交互方法的实现流程图二;
31.图4为根据本技术一实施例的语音交互方法的实现流程图三;
32.图5为根据本技术一实施例的语音交互方法中的信息传输示意图一;
33.图6为根据本技术一实施例的语音交互方法中的信息传输示意图二;
34.图7为根据本技术一实施例的语音交互方法的实现流程图四;
35.图8为根据本技术一实施例的语音交互方法的实现流程图五;
36.图9为根据本技术一实施例的语音交互设备的结构示意图一;
37.图10为根据本技术一实施例的语音交互设备的结构示意图二;
38.图11为根据本技术一实施例的服务器的结构示意图一;
39.图12为根据本技术一实施例的服务器的结构示意图二;
40.图13是用来实现本技术实施例的语音交互方法的电子设备的框图。
具体实施方式
41.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
42.本技术实施例提出一种语音交互方法,可以应用于语音交互设备,特别是带屏带屏语音交互设备。
43.为了实现本技术实施例的语音交互方法,本技术实施例提出一种语音交互系统,包括语音交互设备及两个云端服务器(以下简称服务器)。其中,语音交互设备安装有应用程序,该应用程序能够提供相应的技能(以下称为第一技能)。例如购物类应用,为用户提供
购物技能。两个云端服务器中,第一服务器是对应该应用的服务器,用于支持上述第一技能;第二服务器是语音交互设备本身的服务器,为用户提供其他技能(以下称为第二技能),如播放视频、播放音频、查看天气等。
44.图1为根据本技术一实施例的语音交互方法的应用系统示意图。如图1所示,该系统包括:语音交互设备、第一服务器和第二服务器。第二服务器对语音交互设备发送的语音请求进行解析,并提供第二技能;当对语音请求的解析结果对应第一技能时,第二服务器将该解析结果返回至语音交互设备;由语音交互设备重新向第一服务器请求第一技能。以下实施例中,对应用于各个设备/服务器的方法做详细介绍。
45.本技术实施例提出一种语音交互方法,该方法可以应用于语音交互设备,特别是带屏语音交互设备。图2为根据本技术一实施例的语音交互方法的实现流程图一,包括以下步骤:
46.s201:在语音交互设备提供第一技能的情况下,向第二服务器发送第二语音请求;该第二语音请求包括用于请求第二技能的语音请求;
47.s202:接收第二控制指令;该第二控制指令由第二服务器根据第二语音请求生成并反馈。
48.可选地,在服务端侧,第二服务器对第二语音请求进行解析。根据解析结果,确定出该第二语音请求用于请求第二技能,则第二服务器根据解析结果生成对应的第二控制指令,用于提供第二技能。
49.例如,第一技能为购物类技能,第二技能为音乐播放技能。在语音交互设备开启购物类应用并提供购物技能的场景下,用户发出“放点音乐”的语音请求,语音交互设备将该语音请求发送至第二服务器。第二服务器对该语音请求进行解析之后,发现该语音请求用于请求音乐播放技能,则生成对应音乐播放技能的控制指令,将该控制指令下发至语音交互设备,并下发相关播报话术。
50.又如,第一技能为购物类技能,第二技能为视频播放技能。在语音交互设备开启购物类应用并提供购物技能的场景下,用户发出“获奖电影”的语音请求,语音交互设备将该语音请求发送至第二服务器。第二服务器对该语音请求进行解析之后,发现该语音请求用于请求视频播放技能,则生成对应控制指令,将该控制指令下发至语音交互设备,并下发相关播报话术。
51.可见,采用本技术实施例提出的语音交互方式,在实现不同技能之间的切换时,能够采用语音控制的方式进行切换,而无需用户手动操作。因此能够简化切换操作,提高用户体验。
52.图3为根据本技术一实施例的语音交互方法的实现流程图二。在一些实施方式中,如图3所示,上述步骤s202之后还包括:
53.s303:执行上述第二控制指令,以提供上述第二技能。
54.在一些实施方式中,如图4所示,本技术实施例的语音交互方法还包括:
55.s401:在语音交互设备提供第一技能的情况下,向第二服务器发送第一语音请求;第一语音请求包括针对第一技能的语音请求;
56.s402:接收针对第一语音请求的解析结果;该解析结果由第二服务器根据上述第一语音请求生成并反馈;
57.s403:将上述解析结果发送至第一服务器,第一服务器为支持上述第一技能的服务器;
58.s404:接收对应上述解析结果的第一控制指令;该第一控制指令由第一服务器根据上述解析结果生成并反馈。
59.可见,采用上述方式,能够实现对语音交互设备的当前技能的控制。
60.可选地,上述第一技能包括购物类技能,还可以包括其他由相应应用程序提供的技能。因此,本技术实施例能够实现从购物类技能切换至其他技能的语音控制。
61.图5为根据本技术一实施例的语音交互方法中的信息传输示意图一。如图5所示,包括以下步骤:
62.s501:语音交互设备当前提供第一技能,向第二服务器发送第二语音请求;该第二语音请求用于请求第二技能。
63.s502:第二服务器解析该第二语音请求,确定出该第二语音请求对应第二技能,则根据解析结果生成对应第二技能的第二控制指令。
64.s503:第二服务器向语音交互设备发送第二控制指令。
65.图6为根据本技术一实施例的语音交互方法中的信息传输示意图二。如图5所示,包括以下步骤:
66.s601:语音交互设备当前提供第一技能,向第二服务器发送第一语音请求;该第一语音请求用于请求第一技能。
67.s602:第二服务器解析该第一语音请求,得到解析结果;根据解析结果确定出该第一语音请求对应第一技能。
68.s603:第二服务器向语音交互设备发送解析结果。
69.s604:语音交互设备将解析结果发送至第一服务器。
70.s605:第一服务器根据该解析结果生成对应第一技能的第一控制指令。
71.s606:第一服务器根将第一控制指令发送至语音交互设备。
72.本技术实施例还提出一种语音交互方法,该方法可以应用于上述第二服务器。图7为根据本技术一实施例的语音交互方法的实现流程图四,包括以下步骤:
73.s701:在语音交互设备提供第一技能的情况下,接收语音交互设备发送的第二语音请求;该第二语音请求包括用于请求第二技能的语音请求;
74.s702:根据第二语音请求生成第二控制指令;
75.s703:向语音交互设备反馈第二控制指令。
76.在一些实施方式中,如图8所示,本技术实施例的语音交互方法还包括:
77.s801:在语音交互设备提供第一技能的情况下,接收语音交互设备发送的第一语音请求;所述第一语音请求包括针对第一技能的语音请求;
78.s802:根据第一语音请求生成对应的解析结果;
79.s803:向语音交互设备反馈解析结果。
80.本技术实施例还提出一种语音交互设备。图9为根据本技术一实施例的语音交互设备的结构示意图一,包括:
81.请求发送模块901,用于在语音交互设备提供第一技能的情况下,向第二服务器发送第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
82.接收模块902,用于接收第二控制指令;所述第二控制指令由所述第二服务器根据所述第二语音请求生成并反馈。
83.图10为根据本技术一实施例的语音交互设备的结构示意图二。如图10所示,在一些实施方式中,上述语音交互设备还包括:
84.执行模块1003,用于执行所述第二控制指令,以提供所述第二技能。
85.如图10所示,在一些实施方式中,上述语音交互设备还包括:解析结果发送模块1004;
86.请求发送模块901还用于,在语音交互设备提供第一技能的情况下,向第二服务器发送第一语音请求;所述第一语音请求包括针对所述第一技能的语音请求;
87.接收模块902还用于,接收针对所述第一语音请求的解析结果;所述解析结果由所述第二服务器根据所述第一语音请求生成并反馈;
88.解析结果发送模块1004,用于将所述解析结果发送至第一服务器,所述第一服务器为支持所述第一技能的服务器;
89.接收模块902还用于,接收对应所述解析结果的第一控制指令;所述第一控制指令由所述第一服务器根据所述解析结果生成并反馈。
90.可选地,上述第一技能包括购物类技能。
91.本技术实施例各语音交互设备中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
92.本技术实施例还提出一种服务器,该服务器可以为上述第二服务器。图11为根据本技术一实施例的服务器的结构示意图一,包括:
93.请求接收模块1101,用于在语音交互设备提供第一技能的情况下,接收所述语音交互设备发送的第二语音请求;所述第二语音请求包括用于请求第二技能的语音请求;
94.指令生成模块1102,用于根据所述第二语音请求生成第二控制指令;
95.指令发送模块1103,用于向所述语音交互设备反馈所述第二控制指令。
96.如图12所示,在一些实施方式中,上述服务器还包括:解析结果生成模块1204和解析结果反馈模块1205;
97.请求接收模块1101还用于,在语音交互设备提供第一技能的情况下,接收所述语音交互设备发送的第一语音请求;所述第一语音请求包括针对所述第一技能的语音请求;
98.解析结果生成模块1204,用于根据所述第一语音请求生成对应的解析结果;
99.所述解析结果反馈模块1205,用于向所述语音交互设备反馈所述解析结果。
100.本技术实施例各服务器中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
101.根据本技术的实施例,本技术还提供了一种电子设备和一种可读存储介质。
102.如图13所示,是根据本技术实施例的语音交互的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
103.如图13所示,该电子设备包括:一个或多个处理器1310、存储器1320,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图13中以一个处理器1310为例。
104.存储器1320即为本技术所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本技术所提供的语音交互的方法。本技术的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本技术所提供的语音交互的方法。
105.存储器1320作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本技术实施例中的语音交互的方法对应的程序指令/模块(例如,附图9所示的请求发送模块901和接收模块902)。处理器1310通过运行存储在存储器1320中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的语音交互的方法。
106.存储器1320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据语音交互的电子设备的使用所创建的数据等。此外,存储器1320可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1320可选包括相对于处理器1310远程设置的存储器,这些远程存储器可以通过网络连接至语音交互的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
107.语音交互的方法的电子设备还可以包括:输入装置1330和输出装置1340。处理器1310、存储器1320、输入装置1330和输出装置1340可以通过总线或者其他方式连接,图13中以通过总线连接为例。
108.输入装置1330可接收输入的数字或字符信息,以及产生与语音交互的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1340可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
109.此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出
装置。
110.这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
111.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
112.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
113.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
114.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
115.上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜