一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种实体识别方法、系统、电子设备及存储介质与流程

2022-02-20 05:59:15 来源:中国专利 TAG:

技术特征:
1.一种实体识别方法,其特征在于,包括:文本向量获取步骤,将一被标注的文本序列输入至一roberta模型中得到所述文本序列的文本向量表示;上下文向量获取步骤,计算所述文本序列中的一注意力权重,根据所述文本向量表示和所述注意力权重计算结合上下文信息的上下文向量表示;实体识别标注步骤,将所述序列中每一个位置字所对应的所述上下文向量表示进行组合,得到整个所述文本序列的序列向量表示,并进一步根据所述序列向量表示得到最终的实体标注结果。2.根据权利要求1所述的实体识别方法,其特征在于,所述上下文向量获取步骤进一步包括:根据所述文本序列的长度,对所述文本序列区分为填充部分和非填充部分,对所述非填充部分位置的字进行所述注意力权重的计算。3.根据权利要求2所述的实体识别方法,其特征在于,所述上下文向量获取步骤进一步包括:利用点互信息对所述注意力权重进行计算。4.根据权利要求1所述的实体识别方法,其特征在于,所述实体识别标注步骤进一步包括:将所述序列向量表示输入到bi-lstm crf模块中得到最终的所述实体标注结果。5.一种实体识别系统,其特征在于,包括:文本向量获取模块,将一被标注的文本序列输入至一roberta模型中得到所述文本序列的文本向量表示;上下文向量获取模块,计算所述文本序列中的一注意力权重,根据所述文本向量表示和所述注意力权重计算结合上下文信息的上下文向量表示;实体识别标注模块,将所述序列中每一个位置字所对应的所述上下文向量表示进行组合,得到整个所述文本序列的序列向量表示,并进一步根据所述序列向量表示得到最终的实体标注结果。6.根据权利要求5所述的实体识别系统,其特征在于,所述上下文向量获取模块进一步包括:根据所述文本序列的长度,对所述文本序列区分为填充部分和非填充部分,对所述非填充部分位置的字进行所述注意力权重的计算。7.根据权利要求6所述的实体识别系统,其特征在于,所述上下文向量获取模块进一步包括:利用点互信息对所述注意力权重进行计算。8.根据权利要求5所述的实体识别系统,其特征在于,所述实体识别标注模块进一步包括:将所述序列向量表示输入到bi-lstm crf模块中得到最终的所述实体标注结果。9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的实体识别方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的实体识别方法。

技术总结
本发明提出一种实体识别方法、系统、电子设备及存储介质,其方法技术方案包括文本向量获取步骤,将一被标注的文本序列输入至一RoBerta模型中得到所述文本序列的文本向量表示;上下文向量获取步骤,计算所述文本序列中的一注意力权重,根据所述文本向量表示和所述注意力权重计算结合上下文信息的上下文向量表示;实体识别标注步骤,将所述序列中每一个位置字所对应的所述上下文向量表示进行组合,得到整个所述文本序列的序列向量表示,并进一步根据所述序列向量表示得到最终的实体标注结果。本申请解决了现有方法特征提取效率低的问题。问题。问题。


技术研发人员:刘伟硕
受保护的技术使用者:上海明略人工智能(集团)有限公司
技术研发日:2021.09.22
技术公布日:2022/1/11
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献