一种话语权切换方法、装置、设备和存储介质与流程

2022-12-06 23:42:03 来源：中国专利 TAG：

技术特征：
1.一种话语权切换方法，其特征在于，包括：若在目标应答语音的播放过程中检测到用户输入语音，则暂停播放所述目标应答语音，并采集用户的目标语音数据和目标视频数据；将所述目标语音数据和所述目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策；基于所述目标决策网络模型的输出，确定目标决策结果，并基于所述目标决策结果对当前话语权进行切换。2.根据权利要求1所述的方法，其特征在于，所述将所述目标语音数据和所述目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策，包括：确定所述目标应答语音对应的目标应答文本；将所述目标应答文本、所述目标语音数据和所述目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策。3.根据权利要求2所述的方法，其特征在于，所述目标决策网络模型包括：文本特征提取子模型、语音特征提取子模型、视频特征提取子模型和决策子模型；所述将所述目标应答文本、所述目标语音数据和所述目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策，包括：将所述目标应答文本输入至所述文本特征提取子模型中进行文本特征提取，获得提取出的目标文本特征信息；将所述目标语音数据输入至所述语音特征提取子模型中进行语音特征提取，获得提取出的目标语音特征信息；将所述目标视频数据输入至所述视频特征提取子模型中进行视频特征提取，获得提取出的目标视频特征信息；将所述目标文本特征信息、所述目标语音特征信息和所述目标视频特征信息输入至所述决策子模型中进行话语权的切换决策，获得目标决策结果。4.根据权利要求3所述的方法，其特征在于，所述决策子模型包括：信息拼接层和全连接层；所述将所述目标文本特征信息、所述目标语音特征信息和所述目标视频特征信息输入至所述决策子模型中进行话语权的切换决策，获得目标决策结果，包括：将所述目标文本特征信息、所述目标语音特征信息和所述目标视频特征信息输入至所述信息拼接层中进行特征信息的拼接，获得拼接后的目标特征信息；将所述目标特征信息输入至所述全连接层进行决策分类，获得目标决策结果。5.根据权利要求2所述的方法，其特征在于，所述目标决策网络模型的训练过程包括：获取重叠交互样本数据和所述重叠交互样本数据对应的标签决策结果，其中，所述重叠交互样本数据包括：对话重叠交互时的样本应答文本以及用户的样本语音数据和样本视频数据；将所述重叠交互样本数据输入至预设决策网络模型中进行话语权的切换决策，并基于所述预设决策网络模型的输出，获得输出决策结果；基于所述输出决策结果和所述标签决策结果确定训练误差，并将所述训练误差反向传播至所述预设决策网络模型中，调整所述预设决策网络模型中的网络参数；
当满足预设收敛条件时，确定预设决策网络模型训练结束，获得目标决策网络模型。6.根据权利要求1-5任一项所述的方法，其特征在于，所述基于所述目标决策结果对当前话语权进行切换，包括：若所述目标决策结果为话语权切换结果，则将当前话语权切换至用户；若所述目标决策结果为话语权保留结果，则继续播放所述目标应答语音。7.根据权利要求6所述的方法，其特征在于，所述继续播放所述目标应答语音，包括：若当前决策次数小于预设次数阈值，则基于预设采集时长，对当前采集时间段进行更新，并基于更新后的当前采集时间段返回执行所述采集用户的目标语音数据和目标视频数据的操作；若当前决策次数等于预设次数阈值，则继续播放所述目标应答语音。8.一种话语权切换装置，其特征在于，包括：数据采集模块，用于若在目标应答语音的播放过程中检测到用户输入语音，则暂停播放所述目标应答语音，并采集用户的目标语音数据和目标视频数据；切换决策模块，用于将所述目标语音数据和所述目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策；话语权切换模块，用于基于所述目标决策网络模型的输出，确定目标决策结果，并基于所述目标决策结果对当前话语权进行切换。9.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储器，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的话语权切换方法。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的话语权切换方法。

技术总结
本发明实施例公开了一种话语权切换方法、装置、设备和存储介质。该方法包括：若在目标应答语音的播放过程中检测到用户输入语音，则暂停播放目标应答语音，并采集用户的目标语音数据和目标视频数据；将目标语音数据和目标视频数据输入至预先训练获得的目标决策网络模型中进行话语权的切换决策；基于目标决策网络模型的输出，确定目标决策结果，并基于目标决策结果对当前话语权进行切换。通过本发明实施例的技术方案，可以提高话语权切换的准确性，从而提高人机对话的流畅性，提升用户体验。提升用户体验。提升用户体验。

技术研发人员：冯明超王泽勋杨久东陈蒙
受保护的技术使用者：京东科技信息技术有限公司
技术研发日：2022.09.02
技术公布日：2022/12/5

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种智能机器人语音智能控制装置及方法与流程

一种话语权切换方法、装置、设备和存储介质与流程

相关文献

最热文献