一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

二分类模型的训练方法及装置、实体链接方法及装置与流程

2021-10-23 01:28:00 来源:中国专利 TAG:装置 计算机 方法 实体 可读

技术特征:
1.一种二分类模型的训练方法,其特征在于,包括:获取待链接实体和所述待链接实体对应的参考语句;确定与所述待链接实体对应的至少一个候选实体和每个候选实体对应的属性信息;根据每个所述候选实体对应的属性信息与所述参考语句生成每个候选实体对应的训练语句,并为每个所述训练语句配置训练标签;将每个所述训练语句和对应的训练标签输入至预训练的二分类模型中进行迭代训练,直至达到训练停止条件,获得二分类模型。2.如权利要求1所述的二分类模型的训练方法,其特征在于,获取待链接实体和所述待链接实体对应的参考语句,包括:获取训练文本;接收确定指令,根据所述确定指令在所述训练文本中确定待链接实体;根据所述待链接实体在所述训练文本中确定所述待链接实体对应的参考语句。3.如权利要求2所述的二分类模型的训练方法,其特征在于,根据所述待链接实体在所述训练文本中确定所述待链接实体对应的参考语句,包括:在所述训练文本中确定包含所述待链接实体的句子作为所述待链接实体对应的参考语句。4.如权利要求1所述的二分类模型的训练方法,其特征在于,根据每个所述候选实体对应的属性信息与所述参考语句生成每个候选实体对应的训练语句,包括:将每个候选实体的属性信息转换为每个候选实体对应的候选属性语句;将每个候选属性语句分别与参考语句拼接生成对应的训练语句。5.如权利要求1所述的二分类模型的训练方法,其特征在于,将每个所述训练语句和对应的训练标签输入至预训练的二分类模型中进行迭代训练,直至达到训练停止条件,获得二分类模型,包括:将每个所述训练语句和对应的训练标签输入至预训练的二分类模型中进行迭代训练,获取每次二分类模型的输出结果;在所述输出结果的准确率小于预设阈值的情况下,继续训练所述二分类模型;在所述输出结果的准确率大于等于所述预设阈值的情况下,结束训练,获得二分类模型。6.一种实体链接方法,其特征在于,包括:获取待链接实体和所述待链接实体对应的参考语句;确定与所述待链接实体对应的至少一个候选实体和每个候选实体对应的属性信息;根据每个所述候选实体的属性信息与所述参考语句分别生成每个候选实体对应的待检测语句;将每个所述待检测语句输入至二分类模型,以使所述二分类模型根据每个输入的待检测语句输出对应的分类结果,其中,所述二分类模型根据上述权利要求1-5任意一项二分类模型的训练方法训练获得;根据所述分类结果确定目标候选实体,并将所述待链接实体与所述目标候选实体进行链接。7.如权利要求6所述的实体链接方法,其特征在于,获取待链接实体和所述待链接实体
对应的参考语句,包括:获取原始文本;接收确定指令,根据所述确定指令在所述原始文本中确定待链接实体;根据所述待链接实体在所述原始文本中确定所述待链接实体对应的参考语句。8.如权利要求7所述的实体链接方法,其特征在于,根据所述待链接实体在所述原始文本中确定所述待链接实体对应的参考语句,包括:在所述原始文本中确定包含所述待链接实体的句子为所述待链接实体对应的参考语句。9.如权利要求6所述的实体链接方法,其特征在于,根据每个所述候选实体的属性信息与所述参考语句分别生成每个候选实体对应的待检测语句,包括:将每个候选实体的属性信息转换为每个候选实体对应的候选属性语句;将每个候选属性语句分别与参考语句拼接生成对应的待检测语句。10.如权利要求6所述的实体链接方法,其特征在于,所述分类结果包括每个待检测语句对应的分类概率值;根据所述分类结果确定目标候选实体,包括:选取分类概率值最高的待检测语句作为目标待检测语句;选取目标待检测语句对应的候选实体为目标候选实体。11.一种二分类模型的训练装置,其特征在于,包括:第一获取模块,被配置为获取待链接实体和所述待链接实体对应的参考语句;第一确定模块,被配置为确定与所述待链接实体对应的至少一个候选实体和每个候选实体对应的属性信息;第一生成模块,被配置为根据每个所述候选实体对应的属性信息与所述参考语句生成每个候选实体对应的训练语句,并为每个所述训练语句配置训练标签;训练模块,被配置为将每个所述训练语句和对应的训练标签输入至预训练的二分类模型中进行迭代训练,直至达到训练停止条件,获得二分类模型。12.一种实体链接装置,其特征在于,包括:第二获取模块,被配置为获取待链接实体和所述待链接实体对应的参考语句;第二确定模块,被配置为确定与所述待链接实体对应的至少一个候选实体和每个候选实体对应的属性信息;第二生成模块,被配置为根据每个所述候选实体的属性信息与所述参考语句分别生成每个候选实体对应的待检测语句;输入模块,被配置为将每个所述待检测语句输入至二分类模型,以使所述二分类模型根据每个输入的待检测语句输出对应的分类结果,其中,所述二分类模型根据上述权利要求1-5任意一项二分类模型的训练方法训练获得;链接模块,被配置为根据所述分类结果确定目标候选实体,并将所述待链接实体与所述目标候选实体进行链接。13.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-5或者6-10任意一项所述方法的步骤。
14.一种计算机可读存储介质,其存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-5或者6-10任意一项所述方法的步骤。

技术总结
本申请提供二分类模型的训练方法及装置、实体链接方法及装置,其中所述二分类模型的训练方法包括:获取待链接实体和所述待链接实体对应的参考语句;确定与所述待链接实体对应的至少一个候选实体和每个候选实体对应的属性信息;根据每个所述候选实体对应的属性信息与所述参考语句生成每个候选实体对应的训练语句,并为每个所述训练语句配置训练标签;将每个所述训练语句和对应的训练标签输入至预训练的二分类模型中进行迭代训练,直至达到训练停止条件,获得二分类模型。通过本方法使得神经网络模型具有根据输入的语句挖掘更深层次语句之间的关系的能力,使得实体链接过程简洁高效,且准确率高。且准确率高。且准确率高。


技术研发人员:李长亮 朱自强 汪美玲
受保护的技术使用者:北京金山软件有限公司
技术研发日:2020.04.21
技术公布日:2021/10/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜