一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

意图识别方法、装置、计算机设备及存储介质与流程

2022-05-27 01:58:25 来源:中国专利 TAG:

技术特征:
1.一种意图识别方法,其特征在于,包括:从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对;将所述输入文本对输入到预设的预训练模型中进行训练,得到初始语义表征模型;将所述样本标签数据输入到所述初始语义表征模型,得到样本标签向量,将所述样本无标签数据输入到所述初始语义表征模型,得到样本无标签向量;根据预设的聚类方法,对所述样本标签向量和所述样本无标签向量进行聚类,得到聚类指数和聚类意图标签数据,其中,所述聚类意图标签数据包括聚类文本和聚类意图标签数据;基于所述聚类指数,通过所述聚类意图标签数据训练所述初始语义表征模型,得到训练好的语义表征模型;从用户端获取用户输入的待识别文本数据,将所述待识别文本数据输入到所述训练好的语义表征模型,得到预测语义向量,将所述样本标签数据输入到所述训练好的语义表征模型,得到验证语义向量;通过所述聚类指数,根据匈牙利算法,计算所述预测语义向量与所述验证语义向量之间的相似度结果,并根据所述相似度结果识别所述待识别文本数据中的未知意图。2.根据权利要求1所述的意图识别方法,其特征在于,所述从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对的步骤包括:确定所述样本标签数据中的目标文本,通过向量转换的方式,计算所述目标文本的目标文本向量和所述样本标签数据的其他文本数据的文本向量;计算所述目标文本向量与所述其他文本数量的文本向量的相似度结果,将相似度结果大于第一预设阈值的文本数据作为正向文本,将相似度结果小于第二预设阈值的文本数据作为负向文本;将所述目标文本、所述正向文本以及所述负向文本进行组成,构成输入文本对。3.根据权利要求1所述的意图识别方法,其特征在于,所述从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对的步骤包括:确定所述样本标签数据的目标文本以及对应的意图标签,将所述目标文本的意图标签作为目标意图标签;通过文本匹配的方式,计算目标意图标签与所述样本标签数据中的意图标签的相似度结果,相似度结果大于第一预设阈值的意图标签对应的文本数据作为正向文本,相似度结果小于第二预设阈值的意图标签对应的文本数据作为负向文本;将所述目标文本、所述正向文本以及所述负向文本进行组合,得到输入文本对。4.根据权利要求1所述的意图识别方法,其特征在于,所述将所述输入文本对输入到预设好的预训练模型中进行训练,得到初始语义表征模型的步骤包括:基于注意力机制构建预训练模型,并构建正向损失函数和负向损失函数;通过所述正向损失函数和负向损失函数对所述预训练模型进行参数调整,得到初始语义表征模型。
5.根据权利要求1所述的意图识别方法,其特征在于,所述根据预设的聚类方法,对所述样本标签向量和所述样本无标签向量进行聚类,得到聚类指数和聚类意图标签数据的步骤包括:根据预设的聚类簇数量,通过k-means聚类方式,对所述样本标签向量和样本无标签向量进行聚类,得到至少一个聚类标签簇;根据预设的筛选方式,在所述聚类标签簇中选择出目标聚类标签簇,作为聚类意图标签数据,并根据所述目标聚类标签簇计算聚类指数。6.根据权利要求1所述的意图识别方法,其特征在于,所述通过所述聚类指数,根据匈牙利算法,计算所述预测语义向量与所述验证语义向量之间的相似度结果,并根据所述相似度结果识别所述待识别文本数据中的未知意图的步骤包括:根据所述聚类指数,对所述预测语义向量进行聚类,得到预测聚类结果,对所述验证语义向量进行聚类,得到验证聚类结果,其中,预测聚类结果包括预测聚类簇,所述验证聚类结果包括验证聚类簇;基于匈牙利算法,计算所述预测聚类结果与所述验证聚类结果之间的距离矩阵,并基于最大匹配算法,识别出所述预测聚类结果中的未知意图。7.一种意图识别装置,其特征在于,包括如下模块:数据获取模块,用于从预设的数据库中获取样本标签数据和样本无标签数据,根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对;初始模型训练模块,用于将所述输入文本对输入到预设的预训练模型中进行训练,得到初始语义表征模型;样本向量生成模块,用于将所述样本标签数据输入到所述初始语义表征模型,得到样本标签向量,将所述样本无标签数据输入到所述初始语义表征模型,得到样本无标签向量;聚类模块,用于根据预设的聚类方法,对所述样本标签向量和所述样本无标签向量进行聚类,得到聚类指数和聚类意图标签数据,其中,所述聚类意图标签数据包括聚类文本和聚类意图标签数据;表征模型训练模块,用于基于所述聚类指数,通过所述聚类意图标签数据训练所述初始语义表征模型,得到训练好的语义表征模型;向量表征模块,用于从用户端获取用户输入的待识别文本数据,将所述待识别文本数据输入到所述训练好的语义表征模型,得到预测语义向量,将所述样本标签数据输入到所述训练好的语义表征模型,得到验证语义向量;意图识别模块,用于通过所述聚类指数,根据匈牙利算法,计算所述预测语义向量与所述验证语义向量之间的相似度结果,并根据所述相似度结果识别所述待识别文本数据中的未知意图。8.根据权利要求7所述的意图识别装置,其特征在于,所述数据获取模块包括:向量转换单元,用于确定所述样本标签数据中的目标文本,通过向量转换的方式,计算所述目标文本的目标文本向量和所述样本标签数据的其他文本数据的文本向量;正负向分类单元,用于计算所述目标文本向量与所述其他文本数量的文本向量的相似度结果,将相似度结果大于第一预设阈值的文本数据作为正向文本,将相似度结果小于第二预设阈值的文本数据作为负向文本;
文本对生成单元,用于将所述目标文本、所述正向文本以及所述负向文本进行组成,构成输入文本对。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述意图识别方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述意图识别方法的步骤。

技术总结
本发明公开了一种意图识别方法,应用于人工智能技术领域,用于提高未知意图的识别准确率。本发明提供的方法包括:根据预设的正负向分类方法对所述样本标签数据进行分类,得到至少一个输入文本对;将所述输入文本对输入到预设好的预训练模型中进行训练,得到初始语义表征模型;将输入到初始语义表征模型得到的样本向量进行聚类,得到聚类指数和聚类意图标签数据,并根据所述聚类指数和聚类意图标签数据得到语义表征模型;将待识别文本数据和样本标签数据输入到所述语义表征模型,得到预测语义向量和验证语义向量;计算所述预测语义向量与所述验证语义向量之间的相似度结果,并根据所述相似度结果识别所述待识别文本数据中的未知意图。意图。意图。


技术研发人员:任俊松 侯晓龙
受保护的技术使用者:中国平安人寿保险股份有限公司
技术研发日:2022.01.14
技术公布日:2022/5/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献