一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、电子设备及存储介质与流程

2022-12-04 06:16:31 来源:中国专利 TAG:

技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:获取历史对话信息和当前请求信息;对所述历史对话信息和所述当前请求信息进行分词处理,得到所述历史对话信息对应的至少一个第一分词和所述当前请求信息对应的至少一个第二分词;基于所述至少一个第一分词对所述至少一个第二分词进行改写分析,得到目标改写信息,所述目标改写信息包括任一所述第二分词对应的删除指示信息、任一所述第二分词对应的起始插入指示信息和任一所述第二分词对应的结束插入指示信息,所述起始插入指示信息表征所述至少一个第一分词中插入任一所述第二分词之前的起始分词;所述结束插入指示信息表征所述至少一个第一分词中插入任一所述第二分词之前的结束分词;基于所述删除指示信息、所述起始插入指示信息和所述结束插入指示信息,对所述当前请求信息进行改写处理,得到所述当前请求信息对应的目标请求信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述删除指示信息、所述起始插入指示信息和所述结束插入指示信息,对所述当前请求信息进行改写处理,得到所述当前请求信息对应的目标请求信息,包括:基于所述起始插入指示信息和所述结束插入指示信息,在所述当前请求信息中每个第二分词之前插入所述每个第二分词对应的目标分词,得到初始请求信息,所述目标分词为所述至少一个第一分词中所述每个第二分词对应的起始分词和所述每个第二分词对应的结束分词之间的分词;基于所述删除指示信息,对所述初始请求信息中的至少一个第二分词进行删除处理,得到所述目标请求信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述删除指示信息,对所述初始请求信息中的至少一个第二分词进行删除处理,得到所述目标请求信息,包括:将所述至少一个第二分词中指示执行删除操作的删除指示信息对应的第二分词删除,得到所述目标请求信息。4.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个第一分词对所述至少一个第二分词进行改写分析,得到目标改写信息,包括:将所述至少一个第一分词和所述至少一个第二分词输入至预设请求改写模型进行改写预测处理,得到所述删除指示信息、任一所述第二分词对应的目标起始统计信息和任一所述第二分词对应的目标结束统计信息,所述目标起始统计信息表征任一所述第一分词作为任一所述第二分词对应的起始分词的概率,所述目标结束统计信息表征任一所述第一分词作为任一所述第二分词对应的结束分词的概率;基于所述目标起始统计信息和所述目标结束统计信息,确定所述起始插入指示信息和所述结束插入指示信息。5.根据权利要求4所述的方法,其特征在于,所述目标起始统计信息包括非插入操作对应的起始执行概率和所述至少一个第一分词对应的起始插入概率;所述目标结束统计信息包括所述非插入操作对应的结束执行概率和所述至少一个第一分词对应的结束插入概率;所述基于所述目标起始统计信息和所述目标结束统计信息,确定所述起始插入指示信息和所述结束插入指示信息,包括:在所述起始执行概率为所述目标起始统计信息中的非最大概率且所述结束执行概率
为所述目标结束统计信息中的非最大概率的情况下,将任一所述第二分词对应的目标起始统计信息中最大概率对应的第一分词作为任一所述第二分词对应的起始分词;基于任一所述第二分词对应的起始分词,生成所述起始插入指示信息;将任一所述第二分词对应的目标结束统计信息中最大概率对应的第一分词作为任一所述第二分词对应的结束分词;基于任一所述第二分词对应的结束分词,生成所述结束插入指示信息。6.根据权利要求4所述的方法,其特征在于,所述预设请求改写模型包括特征提取子模型和感知机映射子模型;所述将所述至少一个第一分词和所述至少一个第二分词输入至预设请求改写模型进行改写预测处理,得到所述删除指示信息、任一所述第二分词对应的目标起始统计信息和任一所述第二分词对应的目标结束统计信息,包括:将所述至少一个第一分词和所述至少一个第二分词输入至所述特征提取子模型进行特征提取处理,得到所述至少一个第一分词对应的第一语义特征信息和所述至少一个第二分词对应的第二语义特征信息;将所述第一语义特征信息和所述第二语义特征信息输入至所述感知机映射子模型进行映射处理,得到所述删除指示信息、所述目标起始统计信息和所述目标结束统计信息。7.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取样本历史对话信息、样本当前请求信息和样本请求信息;对所述样本历史对话信息和所述样本当前请求信息进行分词处理,得到所述样本历史对话信息对应的至少一个第三分词和所述样本当前请求信息对应的至少一个第四分词;将所述至少一个第三分词和所述至少一个第四分词输入至预设机器学习模型进行改写预测处理,得到样本删除指示信息、任一所述第四分词对应的样本起始统计信息和任一所述第四分词对应的样本结束统计信息;所述样本起始统计信息表征任一所述第三分词作为任一所述第四分词对应的起始分词的概率,所述样本结束统计信息表征任一所述第三分词作为任一所述第四分词对应的结束分词的概率;基于所述样本起始统计信息和所述样本结束统计信息,确定样本起始插入指示信息和样本结束插入指示信息;基于所述样本请求信息和所述样本当前请求信息,确定改写信息标签;根据所述样本删除指示信息、所述样本起始插入指示信息、所述样本结束插入指示信息和所述改写信息标签,得到目标损失信息;基于所述目标损失信息训练所述预设机器学习模型,得到所述预设请求改写模型。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述目标请求信息进行领域识别处理,得到所述当前请求信息对应的目标领域信息;基于所述目标请求信息进行意图识别处理,得到所述当前请求信息对应的目标意图信息。9.一种数据处理装置,其特征在于,所述装置包括:信息获取模块,用于获取历史对话信息和当前请求信息;分词处理模块,用于对所述历史对话信息和所述当前请求信息进行分词处理,得到所述历史对话信息对应的至少一个第一分词和所述当前请求信息对应的至少一个第二分词;
改写分析模块,用于基于所述至少一个第一分词对所述至少一个第二分词进行改写分析,得到目标改写信息,所述目标改写信息包括任一所述第二分词对应的删除指示信息、任一所述第二分词对应的起始插入指示信息和任一所述第二分词对应的结束插入指示信息,所述起始插入指示信息表征所述至少一个第一分词中插入任一所述第二分词之前的起始分词;所述结束插入指示信息表征所述至少一个第一分词中插入任一所述第二分词之前的结束分词;改写模块,用于基于所述删除指示信息、所述起始插入指示信息和所述结束插入指示信息,对所述当前请求信息进行改写处理,得到所述当前请求信息对应的目标请求信息。10.一种电子设备,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令以实现权利要求1至8中任意一项所述的数据处理方法。11.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的数据处理方法。12.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至8中任意一项所述的数据处理方法。

技术总结
本公开关于一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取历史对话信息和当前请求信息;对历史对话信息和当前请求信息进行分词处理,得到历史对话信息对应的至少一个第一分词和当前请求信息对应的至少一个第二分词;基于至少一个第一分词对至少一个第二分词进行改写分析,得到包括任一第二分词对应的删除指示信息、对应的起始插入指示信息和对应的结束插入指示信息的目标改写信息;基于删除指示信息、起始插入指示信息和结束插入指示信息,对当前请求信息进行改写处理,得到当前请求信息对应的目标请求信息。利用本公开实施例可以提高改写效率,极大地降低出现错改漏改的可能性,进而提高目标请求信息所表示的用户意图的准确度。用户意图的准确度。用户意图的准确度。


技术研发人员:刘天宇 王晓雪 赵学敏 李超
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.08.09
技术公布日:2022/11/18
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献