基于示例的语音机器人开发技术的制作方法

2023-02-06 13:19:55 来源：中国专利 TAG：

技术特征：
1.一种由一个或多个处理器实现的方法，所述方法包括：经由语音机器人开发平台获得多个训练实例，所述多个训练实例中的每个训练实例包括：训练实例输入，所述训练实例输入包括对应对话的至少部分和所述对应对话的先前场境，以及训练实例输出，所述训练实例输出包括对所述对应对话的至少所述部分的对应真实值响应；经由所述语音机器人开发平台获得与所述多个训练实例中的一个或多个训练实例相关联的对应特征强调输入；经由所述语音机器人开发平台，基于所述多个训练实例和与所述多个训练实例中的一个或多个训练实例相关联的所述对应特征强调输入来训练语音机器人，其中，与所述多个训练实例中的一个或多个训练实例相关联的所述对应特征强调输入使所述语音机器人关注所述对应对话的所述部分的特定特征；以及在训练所述语音机器人之后：使得经训练的语音机器人被部署用于代表第三方进行对话。2.根据权利要求1所述的方法，其中，训练所述语音机器人包括：使用机器学习ml模型的多个ml层并且针对所述多个训练实例中的给定训练实例，来处理所述对应对话的至少所述部分和所述对应对话的所述先前场境，以生成与所述对应对话的当前状态相关联的嵌入。3.根据权利要求2所述的方法，其中，所述对应对话的所述部分包括针对所述对应对话的至少所述部分的多个语音假设，并且其中，处理所述对应对话的至少所述部分和所述对应对话的所述先前场境以生成与所述对应对话的所述当前状态相关联的所述嵌入包括：使用所述多个ml层中的第一ml层来处理所述多个语音假设以生成第一嵌入，使用所述多个ml层中的第二ml层来处理所述对应对话的所述先前场境以生成第二嵌入，以及级联所述第一嵌入和所述第二嵌入以生成与所述对应对话的所述当前状态相关联的所述嵌入。4.根据权利要求3所述的方法，进一步包括：经由所述语音机器人开发平台，基于与所述对应对话的所述当前状态相关联的所述嵌入来生成多个亲和特征。5.根据权利要求4所述的方法，其中，训练所述语音机器人进一步包括：使用所述ml模型或附加ml模型的多个附加ml层来处理所述多个亲和特征和与所述对应对话的所述当前状态相关联的所述嵌入，以生成与对所述对应对话的至少所述部分的预测响应相关联的预测嵌入。6.根据权利要求5所述的方法，其中，训练所述语音机器人进一步包括：在嵌入空间中将与对所述对应对话的至少所述部分的所述预测响应相关联的所述预测嵌入和与对所述对应对话的至少所述部分的所述对应真实值响应相关联的对应真实值嵌入进行比较；基于将所述预测嵌入和所述对应真实值嵌入进行比较来生成一个或多个损失；以及
基于与所述给定训练实例相关联的所述损失和所述对应特征强调输入中的一个或多个来更新所述ml模型。7.根据权利要求6所述的方法，其中，所述ml模型是包括一个或多个注意力机制的transformer模型，并且其中，基于与所述给定训练实例相关联的所述损失和所述对应特征强调输入中的一个或多个来更新所述transformer模型包括：使得基于所述损失中的一个或多个损失来更新所述多个ml层或所述多个附加ml层中的一个或多个的权重；以及使得基于与所述给定训练实例相关联的所述对应特征强调输入来使所述transformer模型的所述注意力机制中的所述一个或多个注意力机制关注所述对应对话的至少所述部分的一个或多个特征。8.根据权利要求3所述的方法，其中，所述对应对话的所述部分进一步包括与捕获所述对应对话的至少所述部分的口头话语相对应的音频数据，并且其中，基于使用自动语音辨识asr模型处理与所述口头话语相对应的所述音频数据以生成针对所述对应对话的至少所述部分的所述多个语音假设，来生成所述多个语音假设。9.根据权利要求8所述的方法，进一步包括：将与所述多个语音假设中的每个语音假设相关联的一个或多个对应文本段对齐；利用至少一个对应标签来注释所述一个或多个对应文本段中的每个，以生成多个注释语音假设；以及其中，使用所述多个ml层中的所述第一ml层来处理所述多个语音假设以生成所述第一嵌入包括：处理所述多个注释语音假设以生成所述第一嵌入。10.根据权利要求3所述的方法，其中，所述对应对话的所述先前场境包括所述对应对话的至少一个或多个先前部分，并且其中，所述对应对话的所述一个或多个先前部分在所述对应对话中发生在所述对应对话的至少所述部分之前。11.根据任一前述权利要求所述的方法，其中，获得与所述多个训练实例中的一个或多个训练实例相关联的所述对应特征强调输入包括：从与所述第三方相关联的一个或多个人接收自然语言输入，其中，所述自然语言输入是以下中的一个或多个：自由形式口头输入或自由形式键入输入；以及处理所述自然语言输入以获得与所述多个训练实例中的一个或多个训练实例相关联的所述对应特征强调输入。12.根据任一前述权利要求所述的方法，其中，从训练实例的语料库获得所述多个训练实例中的一个或多个训练实例，并且其中，所述训练实例的语料库包括多个人之间的多个先前对话。13.根据任一前述权利要求所述的方法，其中，从一个或多个人之间的对应演示性对话获得所述多个训练实例中的一个或多个训练实例，并且其中，所述人中的所述一个或多个人与所述第三方相关联。14.根据任一前述权利要求所述的方法，其中，从经由所述语音机器人开发所接收到的口头话语获得所述多个训练实例中的一个或多个训练实例，并且其中，从与所述第三方相关联的一个或多个人接收所述口头话语。
15.根据任一前述权利要求所述的方法，其中，使得所述经训练的语音机器人被部署用于代表所述第三方进行所述对话包括：使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的电话呼叫的所述对话，并且其中，使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的所述电话呼叫的所述对话包括：使得所述语音机器人应答对应呼入电话呼叫并经由相应的客户端设备与发起所述对应呼入电话呼叫的对应人进行所述对话。16.根据权利要求15所述的方法，进一步包括：在结束所述呼入电话呼叫之后：生成在所述对应呼入电话呼叫期间进行的所述对话的对应对话摘要；以及使得所述对话的所述对应对话摘要经由所述语音机器人开发平台被渲染。17.根据任一前述权利要求所述的方法，其中，使得所述经训练的语音机器人被部署用于代表所述第三方进行所述对话包括：使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的电话呼叫的所述对话，并且其中，使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的所述电话呼叫的所述对话包括：使得所述语音机器人发起对应呼出电话呼叫并与经由相应的客户端设备与应答所述对应呼出电话呼叫的对应人进行所述对话。18.根据权利要求17所述的方法，进一步包括：在结束所述呼出电话呼叫之后：生成在所述对应呼出电话呼叫期间进行的所述对话的对应对话摘要；以及使得所述对话的所述对应对话摘要经由所述语音机器人开发平台被渲染。19.根据任一前述权利要求所述的方法，其中，由与部署所述语音机器人的所述第三方不同的第一方提供所述语音机器人开发平台。20.一种由一个或多个处理器实现的方法，所述方法包括：经由语音机器人开发平台获得多个远程过程调用rpc训练实例，所述多个rpc训练实例中的每个包括：训练实例输入，所述训练实例输入包括对应对话的至少部分和所述对应对话的先前场境，以及训练实例输出，所述训练实例输出包括对所述对应对话的至少所述部分的对应真实值响应；经由所述语音机器人开发平台，至少基于所述多个rpc训练实例来训练语音机器人，其中，基于所述多个rpc训练实例来训练所述语音机器人使得所述语音机器人与第三方系统交互；以及在训练所述语音机器人之后：使得经训练的语音机器人被部署用于代表第三方进行对话。21.根据权利要求20所述的方法，其中，针对所述多个rpc训练实例中的给定rpc训练实例的所述对应真实值响应至少包括对应rpc出站请求，并且其中，训练所述语音机器人包括：使用机器学习ml模型的多个ml层并且针对所述给定训练实例，来处理所述对应对话的至少所述部分和所述对应对话的所述先前场境，以生成与所述对应对话的当前状态相关联
的嵌入。22.根据权利要求21所述的方法，其中，所述对应对话的所述部分包括针对所述对应对话的至少所述部分的多个语音假设，并且其中，处理所述对应对话的至少所述部分和所述对应对话的所述先前场境以生成与所述对应对话的所述当前状态相关联的所述嵌入包括：使用所述多个ml层中的第一ml层来处理所述多个语音假设以生成第一嵌入，使用所述多个ml层中的第二ml层来处理所述对应对话的所述先前场境以生成第二嵌入，以及级联所述第一嵌入和所述第二嵌入以生成与所述对应对话的所述当前状态相关联的所述嵌入。23.根据权利要求22所述的方法，进一步包括：经由所述语音机器人开发平台，基于与所述对应对话的所述当前状态相关联的所述嵌入来生成多个亲和特征。24.根据权利要求23所述的方法，其中，训练所述语音机器人进一步包括：使用所述ml模型或附加ml模型的多个附加ml层来处理所述多个亲和特征和与所述对应对话的所述当前状态相关联的所述嵌入，以生成与对所述对应对话的至少所述部分的预测响应相关联的预测嵌入。25.根据权利要求24所述的方法，其中，训练所述语音机器人进一步包括：在嵌入空间中将与对所述对应对话的至少所述部分的所述预测响应相关联的所述预测嵌入和与所述对应rpc出站请求相关联的对应真实值嵌入进行比较；基于将所述预测嵌入和所述对应真实值嵌入进行比较来生成一个或多个损失；以及基于所述损失中的一个或多个损失来更新所述ml模型。26.根据权利要求20至25中的任一项所述的方法，其中，所述多个rpc训练实例中的给定rpc训练实例的对应对话的至少所述部分至少包括对应rpc入站请求，并且其中，训练所述语音机器人包括：使用机器学习ml模型的多个ml层并且针对所述给定训练实例，处理至少所述对应rpc入站请求和所述对应对话的所述先前场境以生成与所述对应对话的当前状态相关联的嵌入。27.根据权利要求20至26中的任一项所述的方法，其中，处理所述对应对话的至少所述部分和所述对应对话的所述先前场境以生成与所述对应对话的所述当前状态相关联的所述嵌入包括：使用所述多个ml层中的第一ml层来处理至少所述rpc入站请求以生成第一嵌入，使用所述多个ml层中的第二ml层来处理所述对应对话的所述先前场境以生成第二嵌入，以及级联所述第一嵌入和所述第二嵌入以生成与对所述对应对话的至少所述部分的预测响应相关联的预测嵌入。28.根据权利要求20至27中的任一项所述的方法，其中，训练所述语音机器人进一步包括：在嵌入空间中将与对所述对应对话的至少所述部分的所述预测响应相关联的所述预测嵌入和与所述对应真实值响应相关联的对应真实值嵌入进行比较；
基于将所述预测嵌入和所述对应真实值嵌入进行比较来生成一个或多个损失；以及基于所述损失中的一个或多个损失来更新所述ml模型。29.根据权利要求20至28中的任一项所述的方法，其中，部署所述语音机器人的所述第三方不同于与所述第三方系统相关联的附加第三方。30.根据权利要求20至29中的任一项所述的方法，其中，使得所述经训练的语音机器人被部署用于代表所述第三方进行所述对话包括：使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的电话呼叫的所述对话，并且其中，使得所述经训练的语音机器人被部署用于进行与所述第三方相关联的所述电话呼叫的所述对话包括：使得所述语音机器人应答对应呼入电话呼叫并经由相应的客户端设备与发起所述对应呼入电话呼叫的对应人进行所述对话，其中，所述语音机器人在与所述对应人的所述对话期间经由对应rpc与所述第三方系统交互。31.根据权利要求30所述的方法，进一步包括：在结束所述呼入电话呼叫之后：生成在所述对应呼入电话呼叫期间进行的所述对话的对应对话摘要，其中，所述对应对话摘要中的一个或多个包括关于所述对应rpc是基于在所述对应呼入电话呼叫期间接收到的所述对应人的对应口头话语而发生的指示；以及使得所述对话的所述对应对话摘要经由所述语音机器人开发平台被渲染。32.一种语音机器人开发平台，所述语音机器人开发平台包括：至少一个处理器；至少一个存储器；至少一个数据库，所述至少一个数据库包括多个训练实例；至少一个用户接口，所述至少一个用户接口用于使得与第三方相关联的第三方开发人员能够与所述语音机器人开发平台交互以：获得多个训练实例，所述多个训练实例中的每个训练实例包括：训练实例输入，所述训练实例输入包括对应对话的至少部分和所述对应对话的先前场境，以及训练实例输出，所述训练实例输出包括对所述对应对话的至少所述部分的对应真实值响应；基于所述多个训练实例来训练语音机器人以生成所述语音机器人的多个对应行为；以及在训练所述语音机器人之后：使得所述第三方开发人员能够添加存储在所述至少一个数据库中的附加训练实例，以针对所述语音机器人的所述多个对应行为添加新行为；以及使得所述第三方开发人员能够修改存储在所述至少一个数据库中的现有训练实例，以修改所述语音机器人的所述多个对应行为中的现有行为。

技术总结
实施方式涉及提供使得第三方开发人员能够基于训练实例来训练语音机器人的语音机器人开发平台。训练实例能够各自包括训练输入和训练输出。训练输入能够包括对应对话的一部分和对应对话的先前场境。训练输出能够包括对对应对话的该部分的对应真实值响应。在训练之后，语音机器人能够被部署用于代表第三方进行对话。在一些实施方式中，基于使语音机器人关注对应对话的该部分的特定特征的对应特征强调输入来进一步训练语音机器人。在一些附加或替代实施方式中，语音机器人被进一步训练为经由远程过程调用(RPC)与第三方系统交互。由远程过程调用(RPC)与第三方系统交互。由远程过程调用(RPC)与第三方系统交互。

技术研发人员：阿萨夫
受保护的技术使用者：谷歌有限责任公司
技术研发日：2021.12.03
技术公布日：2023/2/3

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：自助终端交易界面的处理方法及装置与流程

基于示例的语音机器人开发技术的制作方法

相关文献

最热文献