一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种意图识别方法、系统、电子设备和存储介质与流程

2022-11-30 15:03:48 来源:中国专利 TAG:

技术特征:
1.一种意图识别方法,其特征在于,包括:收集目标场景下的目标意图语料库和非目标意图语料库;利用目标意图语料库和非目标意图语料库训练双头意图识别模型,由训练好的双头意图识别模型输出二分类置信度和多分类置信度,分别作为各语料对应的特征一和特征二;获取目标意图语料和非目标意图语料的句特征,计算各类目标意图对应语料的句特征的类内期望向量和类内协方差矩阵,作为各类目标意图的意图簇;计算目标意图语料和非目标意图语料中每一条语料的句特征与各类目标意图的意图簇的最近距离,将最近距离作为对应语料的特征三;拼接特征一、特征二和特征三,将各语料的特征拼接结果作为对应语料的总特征,构建正负样本训练第三分类器;根据所述的双头意图识别模型、类内期望向量和类内协方差矩阵计算待识别语料的总特征作为训练好的第三分类器的输入,得到待识别语料的意图识别结果;若识别结果为其他意图,则将第三分类器的识别结果作为最终识别结果输出;若识别结果为目标意图,则根据双头意图识别模型输出的多分类置信度得到最终识别结果输出。2.根据权利要求1所述的意图识别方法,其特征在于,所述的目标意图语料库和非目标意图语料库的构建方法为:从目标场景下的总语料库中筛选目标意图,根据目标意图从总语料库中随机采样得到目标意图语料库;采用目标意图语料库训练弱分类器,利用弱分类器识别目标场景下的总语料库,按比例筛选置信度低于第一阈值和高于第二阈值的语料进行人工标注真实意图,若真实意图不属于目标意图,则人工标注为其他意图;筛选出人工标注为其他意图的语料进行聚类处理,取各聚类簇中距离簇中心最近的m条语料并进行数据扩充,组成非目标意图语料库。3.根据权利要求1所述的意图识别方法,其特征在于,所述的双头意图识别模型由意图特征编码器、第一分类器和第二分类器构成,所述的意图特征编码器用于编码语料的句特征;所述的第一分类器用于将语料的句特征分类为目标意图和非目标意图两类,将分类概率作为对应语料的特征一,第二分类器用于将语料的句特征分类为非目标意图和具体所属的目标意图类型,将分类概率作为对应语料的特征二。4.根据权利要求3所述的意图识别方法,其特征在于,所述的目标意图语料和非目标意图语料的句特征是由训练好的双头意图识别模型中的意图特征编码器进行编码后得到的。5.根据权利要求3所述的意图识别方法,其特征在于,所述的特征二取自第二分类器输出的分类概率中概率最高的k个概率值。6.根据权利要求3所述的意图识别方法,其特征在于,所述的双头意图识别模型的训练过程包括:从目标意图语料库和非目标意图语料库中随机抽取b1个例句,通过意图特征编码器编码b1个例句的句特征,将各例句所属的意图类型作为标签;合成句特征:从b1个例句对应的句特征中随机抽取至少包含2种意图类型的a个句特征,将a个句特征的平均值作为合成句特征,所述合成句特征的标签设为其他意图;循环执行b2次合成句特征的操作;利用第一分类器和第二分类器对b1个例句的句特征以及b2个合成句特征进行分类,根
据分类结果和标签计算分类损失,对双头意图识别模型进行训练。7.根据权利要求1所述的意图识别方法,其特征在于,所述的计算目标意图语料和非目标意图语料中每一条语料的句特征与各类目标意图的意图簇的最近距离,计算公式为:其中,f
3,i
表示第i个样本语料对应的特征三,z
i
表示第i个样本语料的句特征,是第j类目标意图对应语料的句特征的类内期望向量,是第j类目标意图对应语料的句特征的类内协方差矩阵,c是目标意图的种类数,上角标t表示转置。8.一种意图识别系统,其特征在于,包括:语料库获取模块,其用于收集目标场景下的目标意图语料库和非目标意图语料库;双头意图识别模型构建及训练模块,其用于利用目标意图语料库和非目标意图语料库训练双头意图识别模型,由训练好的双头意图识别模型输出二分类置信度和多分类置信度,分别作为各语料对应的特征一和特征二;意图簇构建及距离计算模块,其用于获取目标意图语料和非目标意图语料的句特征,计算各类目标意图对应语料的句特征的类内期望向量和类内协方差矩阵,作为各类目标意图的意图簇;计算目标意图语料和非目标意图语料中每一条语料的句特征与各类目标意图的意图簇的最近距离,将最近距离作为对应语料的特征三;第三分类器构建及训练模块,其用于拼接双头意图识别模型构建及训练模块得到的特征一、特征二、以及意图簇构建及距离计算模块得到的特征三,将各语料的特征拼接结果作为对应语料的总特征,构建正负样本训练第三分类器;意图识别模块,其用于获取待识别语料的总特征,并利用训练好的第三分类器得到待识别语料的意图识别结果;若识别结果为其他意图,则将第三分类器的识别结果作为最终识别结果输出;若识别结果为目标意图,则根据双头意图识别模型输出的多分类置信度得到最终识别结果输出。9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1-7任一项所述的意图识别方法。10.一种机器可读存储介质,其特征在于,该机器可读存储介质存储有机器可执行指令,该机器可执行指令在被处理器调用和执行时,用于实现权利要求1-7任一项所述的意图识别方法。

技术总结
本发明公开了一种意图识别方法、系统、电子设备和存储介质,属于意图识别领域。收集目标场景下的目标意图语料库和非目标意图语料库;训练双头意图识别模型,输出各语料对应的特征一和特征二;获取语料的句特征,计算各类目标意图对应语料的句特征的类内期望向量和类内协方差矩阵,作为各类目标意图的意图簇;计算语料的句特征与各类目标意图的意图簇的最近距离,将最近距离作为对应语料的特征三;拼接特征一、特征二和特征三,根据总特征训练第三分类器;由双头意图识别模型、类内期望向量和类内协方差矩阵计算待识别语料的总特征,进而得到意图识别结果。本发明在加强对非目标意图识别的同时,提高了模型的目标识别结果,鲁棒性高,适用范围广。适用范围广。适用范围广。


技术研发人员:王海涛 姜兴华 陈煦
受保护的技术使用者:杭州一知智能科技有限公司
技术研发日:2022.11.01
技术公布日:2022/11/29
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献