一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

命名实体识别方法、训练方法、装置、设备及介质与流程

2021-10-19 23:38:00 来源:中国专利 TAG:方法 人工智能 介质 实体 命名

技术特征:
1.一种命名实体识别方法,其特征在于,所述方法包括:获取输入文本,所述输入文本包括至少一个字符;对所述输入文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量;基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率;基于所述第一概率和所述第二概率识别出属于所述候选实体类型的命名实体。2.根据权利要求1所述的方法,其特征在于,所述根据所述字符的第一字符编码向量,预测所述字符为候选实体类型的开始字符的第一概率,以及所述字符为所述候选实体类型的结束字符的第二概率,包括:调用二元模型中的第一分类层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率;对所述字符的第一字符编码向量和所述第二字符编码向量进行级联,得到所述字符的合并字符编码向量;调用所述二元模型的第二分类层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率。3.根据权利要求2所述的方法,其特征在于,所述第一分类层为第一全连接层,所述第二分类层为第二全连接层;所述调用二元模型中的第一分类层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率,包括:调用所述第一全连接层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率;所述调用所述二元模型的第二分类层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率,包括:调用所述第二全连接层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率。4.根据权利要求1至3任一所述的方法,其特征在于,所述对所述输入文本中的每个字符进行字符编码,得到每个字符的字符编码向量,包括:调用语言模型对所述输入文本中的每个字符进行编码,得到所述每个字符的字符编码向量。5.根据权利要求4所述的方法,其特征在于,所述调用语言模型对所述输入文本中的每个字符进行编码,得到所述每个字符的字符编码向量,包括:调用来自变压器的双向编码器表示bert模型中的编码器对所述输入文本中的每个字符进行编码,得到所述每个字符的字符编码向量。6.一种命名实体模型的训练方法,其特征在于,所述命名实体模型包括:语言模型和二元模型,所述方法包括:获取训练集,所述训练集包括样本文本、以及所述样本文本中的样本命名实体;调用所述预训练语言模型对所述样本文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量;
调用所述二元模型基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率;基于所述第一概率和所述第二概率识别出属于所述候选实体类型的预测命名实体;基于所述预测命名实体和所述样本命名实体之间的误差,对所述语言模型和所述二元模型的网络参数进行训练。7.根据权利要求6所述的方法,其特征在于,所述调用所述预训练语言模型对所述样本文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量,包括:调用来自变压器的双向编码器表示bert模型中的编码器对所述样本文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量。8.根据权利要求6所述的方法,其特征在于,所述调用所述二元模型基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率,包括:调用所述二元模型中的第一分类层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率;对所述字符的第一字符编码向量和所述第二字符编码向量进行级联,得到所述字符的合并字符编码向量;调用所述二元模型的第二分类层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率。9.根据权利要求8所述的方法,其特征在于,所述第一分类层为第一全连接层,所述第二分类层为第二全连接层;所述调用所述二元模型中的第一分类层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率,包括:调用所述第一全连接层对所述字符的第一字符编码向量进行预测,得到所述字符的第二字符编码向量,以及所述字符为所述候选实体类型的开始字符的第一概率;所述调用所述二元模型的第二分类层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率,包括:调用所述第二全连接层对所述字符的所述合并字符编码向量进行预测,得到所述字符为所述候选实体类型的结束字符的第二概率。10.根据权利要求6至9任一所述的方法,其特征在于,所述语言模型和所述二元模型具有各自的分层学习率。11.根据权利要求6至9任一所述的方法,其特征在于,所述基于所述预测命名实体和所述样本命名实体之间的误差,对所述语言模型和所述二元模型的网络参数进行训练,包括:基于带标签平滑的交叉熵损失函数计算所述预测命名实体和所述样本命名实体之间的误差,对所述语言模型和所述二元模型的网络参数进行训练。12.一种命名实体识别装置,其特征在于,所述装置包括:获取模块,用于获取输入文本,所述输入文本包括至少一个字符;编码模块,用于对所述输入文本中的每个字符进行字符编码,得到每个字符的第一字
符编码向量;预测模块,用于基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率;识别模块,用于基于所述第一概率和所述第二概率识别出属于所述候选实体类型的命名实体。13.一种命名实体模型的训练装置,其特征在于,所述命名实体模型包括:语言模型和二元模型,所述装置包括:获取模块,用于获取训练集,所述训练集包括样本文本、以及所述样本文本中的样本命名实体;编码模块,用于调用所述预训练语言模型对所述样本文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量;预测模块,用于调用所述二元模型基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率;识别模块,用于基于所述第一概率和所述第二概率识别出属于所述候选实体类型的预测命名实体;训练模块,用于基于所述预测命名实体和所述样本命名实体之间的误差,对所述语言模型和所述二元模型的网络参数进行训练。14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至5任一所述的命名实体识别方法,或,如权利要求6至11任一所述的命名实体识别方法。15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如权利要求1至5任一所述的命名实体识别方法,或,如权利要求6至11任一所述的命名实体识别方法。

技术总结
本申请公开了一种命名实体识别方法、训练方法、装置、设备及介质。属于人工智能领域。所述方法包括:获取输入文本,所述输入文本包括至少一个字符;对所述输入文本中的每个字符进行字符编码,得到每个字符的第一字符编码向量;基于所述每个字符的第一字符编码向量,预测所述每个字符为候选实体类型的开始字符的第一概率,以及所述每个字符为所述候选实体类型的结束字符的第二概率;基于所述第一概率和所述第二概率识别出属于所述候选实体类型的命名实体。本申请可以在多行业多实体的命名实体识别场景下,获得较高的识别精度和识别速度。度。度。


技术研发人员:吴坤
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.11.27
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜