一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

关键词识别模型的训练方法及装置与流程

2022-11-12 10:44:13 来源:中国专利 TAG:

技术特征:
1.一种关键词识别模型的训练方法,其特征在于,包括:获取训练样本;所述训练样本包括:初始菜品的菜品名称、菜品多域信息及与所述初始菜品关联的多个初始关键词;将所述菜品名称、所述菜品多域信息和所述多个初始关键词输入至待训练关键词识别模型;调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率;根据所述预测概率,计算得到所述待训练关键词识别模型对应的损失函数;根据所述损失函数调整所述待训练关键词识别模型的模型参数;迭代执行所述获取训练样本,至所述根据所述损失函数调整所述待训练关键词识别模型的模型参数的步骤,直至得到目标关键词识别模型。2.根据权利要求1所述的方法,其特征在于,所述待训练关键词识别模型包括:特征嵌入层、注意力机制层和解码层,所述调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率,包括:调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息;调用所述注意力机制层对所述菜品词位置信息、所述重要指标信息和字粒度信息进行处理,得到所述菜品多域信息对应的关注度信息;调用所述解码层对所述关注度信息进行解码处理,得到所述多个初始关键词相对于所述初始菜品的预测概率。3.根据权利要求2所述的方法,其特征在于,所述特征嵌入层包括:位置信息标识单元、重要指标获取单元和字粒度信息获取单元,所述调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息,包括:调用所述位置信息标识单元对所述菜品名称进行标识处理,以标识所述菜品名称中各菜品词的菜品词位置信息;调用所述重要指标获取单元对所述菜品多域信息和所述菜品名称进行处理,以获取所述菜品多域信息对所述菜品名称的重要指标信息;调用所述字粒度信息获取单元对所述菜品多域信息进行处理,以得到所述菜品多域信息对应的字粒度信息。4.根据权利要求1所述的方法,其特征在于,在所述得到目标关键词识别模型之后,还包括:获取用户输入的查询关键词;将所述查询关键词输入至所述目标关键词识别模型,以获取由所述目标关键词识别模型输出的所述查询关键词对应的查询标签序列,及所述查询标签序列对应的标签概率;
根据所述标签概率,从所述查询标签序列中筛选出n个目标查询标签序列,n为大于等于1的正整数;对所述目标查询标签序列进行转换处理,生成所述目标查询标签序列对应的目标关键词;根据所述目标关键词,查询得到目标菜品。5.根据权利要求4所述的方法,其特征在于,所述根据所述标签概率,从所述查询标签序列中筛选出n个目标查询,包括:根据所述标签概率由大到小的顺序对所述查询标签序列进行排序,得到排序结果;根据所述排序结果,从所述查询标签序列中筛选出排序在前n位的查询标签序列作为所述目标查询标签序列。6.一种关键词识别模型的训练装置,其特征在于,包括:训练样本获取模块,用于获取训练样本;所述训练样本包括:初始菜品的菜品名称、菜品多域信息及与所述初始菜品关联的多个初始关键词;训练样本输入模块,用于将所述菜品名称、所述菜品多域信息和所述多个初始关键词输入至待训练关键词识别模型;预测概率获取模块,用于调用所述待训练关键词识别模型对所述菜品名称、所述菜品多域信息和所述多个初始关键词进行处理,以获取由所述待训练关键词识别模型输出的所述多个初始关键词相对于所述初始菜品的预测概率;损失函数计算模块,用于根据所述预测概率,计算得到所述待训练关键词识别模型对应的损失函数;模型参数调整模块,用于根据所述损失函数调整所述待训练关键词识别模型的模型参数;目标识别模型获取模块,用于迭代执行所述训练样本获取模块、所述训练样本输入模块、所述预测概率获取模块、所述损失函数计算模块和所述模型参数调整模块,直至得到目标关键词识别模型。7.根据权利要求6所述的装置,其特征在于,所述待训练关键词识别模型包括:特征嵌入层、注意力机制层和解码层,所述预测概率获取模块包括:位置指标信息获取子模块,用于调用所述特征嵌入层对所述菜品名称和所述菜品多域信息进行处理,得到所述菜品名称对应的菜品词位置信息、所述菜品多域信息对应的重要指标信息和字粒度信息;关注度获取子模块,用于调用所述注意力机制层对所述菜品词位置信息、所述重要指标信息和字粒度信息进行处理,得到所述菜品多域信息对应的关注度信息;预测概率获取子模块,用于调用所述解码层对所述关注度信息进行解码处理,得到所述多个初始关键词相对于所述初始菜品的预测概率。8.根据权利要求7所述的装置,其特征在于,所述特征嵌入层包括:位置信息标识单元、重要指标获取单元和字粒度信息获取单元,所述位置指标信息获取子模块包括:菜品词位置标识子模块,用于调用所述位置信息标识单元对所述菜品名称进行标识处
理,以标识所述菜品名称中各菜品词的菜品词位置信息;指标信息获取子模块,用于调用所述重要指标获取单元对所述菜品多域信息和所述菜品名称进行处理,以获取所述菜品多域信息对所述菜品名称的重要指标信息;字粒度获取子模块,用于调用所述字粒度信息获取单元对所述菜品多域信息进行处理,以得到所述菜品多域信息对应的字粒度信息。9.根据权利要求6所述的装置,其特征在于,所述装置还包括:查询关键词获取模块,用于获取用户输入的查询关键词;标签概率获取模块,用于将所述查询关键词输入至所述目标关键词识别模型,以获取由所述目标关键词识别模型输出的所述查询关键词对应的查询标签序列,及所述查询标签序列对应的标签概率;目标标签筛选模块,用于根据所述标签概率,从所述查询标签序列中筛选出n个目标查询标签序列,n为大于等于1的正整数;目标关键词生成模块,用于对所述目标查询标签序列进行转换处理,生成所述目标查询标签序列对应的目标关键词;目标菜品查询模块,用于根据所述目标关键词,查询得到目标菜品。10.根据权利要求9所述的装置,其特征在于,所述目标标签筛选模块包括:排序结果获取子模块,用于根据所述标签概率由大到小的顺序对所述查询标签序列进行排序,得到排序结果;目标标签获取子模块,用于根据所述排序结果,从所述查询标签序列中筛选出排序在前n位的查询标签序列作为所述目标查询标签序列。11.一种电子设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至5中任一项所述的关键词识别模型的训练方法。12.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1至5中任一项所述的关键词识别模型的训练方法。

技术总结
本公开提供了一种关键词识别模型的训练方法及装置。包括:获取训练样本;训练样本包括:初始菜品的菜品名称、菜品多域信息及与初始菜品关联的多个初始关键词;将菜品名称、菜品多域信息和多个初始关键词输入至待训练关键词识别模型;调用待训练关键词识别模型对菜品名称、菜品多域信息和多个初始关键词进行处理,获取待训练关键词识别模型输出的多个初始关键词相对于初始菜品的预测概率;根据预测概率计算得到待训练关键词识别模型的损失函数;根据损失函数调整待训练关键词识别模型的模型参数;迭代执行获取训练样本,至根据损失函数调整待训练关键词识别模型的模型参数的步骤,直至得到目标关键词识别模型。本公开可以提升关键词预测的准确率。提升关键词预测的准确率。提升关键词预测的准确率。


技术研发人员:向超能 王泽华 陈应虎
受保护的技术使用者:北京三快在线科技有限公司
技术研发日:2021.05.10
技术公布日:2022/11/10
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献