技术特征:
1.一种用于生成语音动作的方法,所述方法由语音动作系统的一个或多个处理器实现,并且所述方法包括:
接收定义对安装在一个或多个设备上的软件应用当前不存在的新语音动作的数据,所述软件应用不同于所述语音动作系统,所述数据指示用于所述软件应用执行所述新语音动作的一个或多个操作和用于触发所述新语音动作的一个或多个触发项,其中,定义所述新语音动作的数据指定上下文,所述上下文指定安装在用户设备上的所述软件应用的模式的某一状态;
至少基于定义所述新语音动作的数据,生成语音动作无源数据结构,其中,所述语音动作无源数据结构包括当被所述软件应用接收时,使得所述软件应用执行用于执行所述新语音动作的一个或多个操作的数据;
将所述语音动作无源数据结构与所述上下文且与用于触发所述新语音动作的所述一个或多个触发项相关联,其中,多个语音动作无源数据结构被定义在所述语音动作系统中;
接收(i)由所述用户设备获得的用户命令话语,所述用户设备安装有所述软件应用,以及(ii)关于所述用户设备的当前上下文信息,其中,所述当前上下文信息包括当前应用状态,所述当前应用状态是由所述软件应用提供并且指示所述软件应用是否具有所述模式的所述某一状态;
响应于确定所述当前应用状态指示所述软件应用具有所述模式的所述某一状态,包括与所述语音动作无源数据结构相关联的所述一个或多个触发项作为所述当前上下文的候选触发;
确定所述用户命令话语是否对应于所述一个或多个触发项,其中,响应于包括所述一个或多个触发项作为所述当前上下文的所述候选触发而确定所述用户命令话语是否对应于所述一个或多个触发项;
确定所述用户命令话语对应于与所述语音动作无源数据结构相关联的所述一个或多个触发项;以及
响应于确定所述用户命令话语对应于所述一个或多个触发项,使用与所述语音动作无源数据结构相关联的所述语音动作无源数据结构,以使得安装在所述用户设备上的所述软件应用执行所述新语音动作的所述一个或多个操作。
2.如权利要求1所述的计算机实现的方法,其中,所述新语音动作是所述软件应用未被编程以支持的启用语音的命令。
3.如权利要求1所述的计算机实现的方法,其中,接收定义所述新语音动作的所述数据包括从发布了所述软件应用的开发人员接收所述数据。
4.如权利要求1所述的计算机实现的方法,其中,所述语音动作系统从安装在所述用户设备上的所述软件应用未接收到定义所述新语音动作的所述数据。
5.如权利要求1所述的计算机实现的方法,其中,生成所述语音动作无源数据结构包括确定用于执行所述新语音动作的一个或多个操作能够由所述软件应用执行。
6.如权利要求1所述的计算机实现的方法,包括:
接收部署所述新语音动作的请求;以及
响应于所述请求,部署所述新语音动作,其中,部署所述新语音动作启用触发所述新语音动作。
7.如权利要求1所述的计算机实现的方法,包括:
接收撤销部署所述新语音动作的请求;以及
响应于所述请求,撤销部署所述新语音动作,其中,撤销部署所述新语音动作禁用触发所述新语音动作。
8.如权利要求1所述的计算机实现的方法,包括:
接收启用所述新语音动作的测试的请求,其中,所述请求指定应当为其启用所述新语音动作的一个或多个设备;以及
响应于所述请求,启用触发用于一个或多个指定的设备的新语音动作,其中,对不包括在所述指定的一个或多个设备中的设备,禁用触发所述新语音动作。
9.如权利要求1所述的计算机实现的方法,进一步包括:
基于所述数据确定所述新语音动作对所述软件应用是否有效;以及
基于所述新语音动作对所述软件应用是有效的所述确定,引入所述新语音动作以生成所述语音动作无源数据结构。
10.一种用于生成语音动作的系统,包括:
一个或多个计算机以及存储指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时,使得所述一个或多个计算机执行操作,所述操作包括:
接收定义对安装在一个或多个设备上的软件应用当前不存在的新语音动作的数据,所述软件应用不同于所述语音动作系统,所述数据指示用于所述软件应用执行所述新语音动作的一个或多个操作和用于触发所述新语音动作的一个或多个触发项,其中,定义所述新语音动作的数据指定上下文,所述上下文指定安装在用户设备上的所述软件应用的模式的某一状态;
至少基于定义所述新语音动作的数据,生成语音动作无源数据结构,其中,所述语音动作无源数据结构包括当被所述软件应用接收时,使得所述软件应用执行用于执行所述新语音动作的一个或多个操作的数据;
将所述语音动作无源数据结构与所述上下文且与用于触发所述新语音动作的所述一个或多个触发项相关联,其中,多个语音动作无源数据结构被定义在所述语音动作系统中;
接收(i)由所述用户设备获得的用户命令话语,所述用户设备安装有所述软件应用,以及(ii)关于所述用户设备的当前上下文信息,其中,所述当前上下文信息包括当前应用状态,所述当前应用状态是由所述软件应用提供并且指示所述软件应用是否具有所述模式的所述某一状态;
响应于确定所述当前应用状态指示所述软件应用具有所述模式的所述某一状态,包括与所述语音动作无源数据结构相关联的所述一个或多个触发项作为所述当前上下文的候选触发;
确定所述用户命令话语是否对应于所述一个或多个触发项,其中,响应于包括所述一个或多个触发项作为所述当前上下文的所述候选触发而确定所述用户命令话语是否对应于所述一个或多个触发项;
确定所述用户命令话语对应于与所述语音动作无源数据结构相关联的所述一个或多个触发项;以及
响应于确定所述用户命令话语对应于所述一个或多个触发项,使用与所述语音动作无源数据结构相关联的所述语音动作无源数据结构来提供以使得安装在所述用户设备上的所述软件应用执行所述新语音动作的所述一个或多个操作。
11.一种用于生成语音动作的方法,所述方法由语音动作系统的一个或多个处理器实现,并且所述方法包括:
接收定义使得两个或更多个不同动作在安装在一个或多个设备上的两个或更多个软件应用处执行的新语音动作的数据,所述软件应用不同于所述语音动作系统,所述数据指示执行所述新语音动作的一个或多个操作和用于触发所述新语音动作的一个或多个触发项,其中,定义所述新语音动作的数据指定上下文;
至少基于定义所述新语音动作的数据,生成语音动作无源数据结构,其中,所述语音动作无源数据结构包括数据,所述数据当被所述一个或多个设备接收时,使得所述新语音动作的所述两个或更多个不同动作在所述两个或更多个软件应用处执行;
将所述语音动作无源数据结构与所述上下文且与用于触发所述新语音动作的所述一个或多个触发项相关联,其中,多个语音动作无源数据结构被定义在所述语音动作系统中;
接收(i)由用户设备获得的用户命令话语,所述用户设备安装有所述软件应用,以及(ii)关于所述用户设备的当前上下文信息;
响应于确定所述当前上下文与和所述语音动作无源数据结构相关联的所述上下文信息相匹配,包括与所述语音动作无源数据结构相关联的所述一个或多个触发项作为所述当前上下文的候选触发;
确定所述用户命令话语是否对应于所述一个或多个触发项,其中,响应于包括所述一个或多个触发项作为所述当前上下文的所述候选触发而确定所述用户命令话语是否对应于所述一个或多个触发项;
确定所述用户命令话语对应于与所述语音动作无源数据结构相关联的所述一个或多个触发项;以及
响应于确定所述用户命令话语对应于所述一个或多个触发项,使用与所述语音动作无源数据结构相关联的所述语音动作无源数据结构,以使得所述新语音动作的所述两个或更多个不同动作在所述两个或更多个软件应用处执行。
技术总结
本公开涉及开发人员语音动作系统,用于接收指定用于不同于该语音动作系统的应用的新语音动作的数据。至少基于该数据,生成用于该应用的语音动作意图,其中,语音动作意图包括当由该应用接收时,请求该应用执行为该新语音动作指定的一个或多个操作的数据。语音动作意图与对该新语音动作指定的触发项相关联。语音动作系统被配置为接收由已安装该应用的设备获得的用户话语的指示,并且确定用户话语的转录抄本对应于与该语音动作意图相关联的触发项。响应于该确定,语音动作系统将语音动作意图提供给该设备。
技术研发人员:王波;苏尼尔·韦缪里;巴纳比·约翰·詹姆斯;斯科特·B·赫夫曼;普拉维尔·库马尔·古普塔
受保护的技术使用者:谷歌有限责任公司
技术研发日:2016.12.28
技术公布日:2021.07.13
本文用于企业家、创业者技术爱好者查询,结果仅供参考。