一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

实体关系的抽取方法及装置、电子设备、存储介质与流程

2021-12-14 23:56:00 来源:中国专利 TAG:

技术特征:
1.一种实体关系的抽取方法,其特征在于,包括:获取目标文本;将所述目标文本输入预训练语言表征模型bert中,通过所述预训练语言表征模型bert对所述目标文本进行处理,得到所述目标文本对应的编码;将所述目标文本对应编码输入预先训练好的目标神经网络模型中,通过所述目标神经网络模型抽取出所述目标文本中的各类关系数据,并基于所述目标文本的关系数据,抽取出所述目标文本中的各个实体数据;其中,所述目标神经网络模型预先利用多个文本样本及其对应的关系标注和实体标注进行训练得到;所述文本样本对应的关系标注和实体标注,均基于确定出的数据结构模式schema进行标注。2.根据权利要求1所述的方法,其特征在于,所述目标神经网络模型包括第一神经网络模型以及第二神经网络模型,所述将所述目标文本对应编码输入预先训练好的目标神经网络模型中,通过所述目标神经网络模型抽取出所述目标文本中的各类关系数据,并基于所述目标文本的关系数据,抽取出所述目标文本中的各个实体数据,包括:将所述目标文本对应编码输入所述第一神经网络模型中,通过所述第一神经网络模型对所述目标文本对应的编码进行处理,得到所述目标文本中的各类关系数据;其中,所述第一神经网络模型预先利用所述文本样本及其对应的关系标注进行训练得到;将所述目标文本中的各类关系数据输入所述第二神经网络模型中,通过所述第二神经网络模型对所述目标文本中的关系数据进行处理,得到所述目标文本中的各个实体数据;其中,所述第二神经网络模型预先利用所述文本样本及其对应的实体标注进行训练得到。3.根据权利要求2所述的方法,其特征在于,所述第一神经网络模型由双向长短时记忆模型bi

lstm和逻辑回归模型softmax组成,所述第二神经网络模型由预训练语言表征模型bert、双向长短时记忆模型bi

lstm、条件随机场模型crf以及逻辑回归模型softmax组成。4.根据要求2所述的方法,其特征在于,所述第一神经网络模型的训练方法,包括:基于先验知识确定出数据结构模式schema;获取满足所述数据结构模式schema的多个所述文本样本;基于所述数据结构模式schema,标注各个所述文本样本对应的关系标注;分别将各个所述文本样本输入第一初始模型中,通过所述第一初始模型对所述文本样本进行处理,得到当前所述文本样本对应的预测关系数据;基于所述文本样本对应的关系标注以及当前所述文本样本对应的预测关系数据的对比结果,判断当前所述第一初始模型的输出结果准确率是否满足第一预设要求;若判断出当前所述第一初始模型的输出结果准确率不满足第一预设要求,则对当前所述第一初始模型进行调参,并针对调参后的所述第一初始模型,返回执行所述分别将各个所述文本样本输入第一初始模型中;若判断出当前所述第一初始模型的输出结果准确率满足第一预设要求,则将当前所述第一初始模型确定为训练好后的第一神经网络模型。5.根据权利要求4所述的方法,其特征在于,所述第二神经网络模型的训练方法,包括:获取各个所述文本样本及其对应的实体标注;分别将各个所述文本样本输入所述第一神经网络模型,得到所述文本样本中的各类关系数据;
分别将各个所述文本样本中的各类关系数据输入第二初始模型中,通过所述第二初始模型对所述文本样本中的各类关系数据进行处理,得到当前所述文本样本对应的预测实体数据;基于所述文本样本对应的关系标注以及当前所述文本样本对应的预测实体数据的对比结果,判断当前所述第二初始模型的输出结果准确率是否满足第二预设要求;若判断出当前所述第二初始模型的输出结果准确率不满足第二预设要求,则对当前所述第二初始模型进行调参,并针对调参后的所述第二初始模型,返回执行所述分别将各个所述文本样本中的各类关系数据输入第二初始模型中;若判断出当前所述第二初始模型的输出结果准确率满足第二预设要求,则将当前所述第二初始模型确定为训练好后的第二神经网络模型。6.一种实体关系的抽取装置,其特征在于,包括:第一获取单元,用于获取目标文本;编码单元,用于将所述目标文本输入预训练语言表征模型bert中,通过所述预训练语言表征模型bert对所述目标文本进行处理,得到所述目标文本对应的编码;抽取单元,用于将所述目标文本对应编码输入预先训练好的目标神经网络模型中,通过所述目标神经网络模型抽取出所述目标文本中的各类关系数据,并基于所述目标文本的关系数据,抽取出所述目标文本中的各个实体数据;其中,所述目标神经网络模型预先利用多个文本样本及其对应的关系标注和实体标注进行训练得到;所述文本样本对应的关系标注和实体标注,均基于确定出的数据结构模式schema进行标注。7.根据权利要求6所述的装置,其特征在于,所述目标神经网络模型包括第一神经网络模型以及第二神经网络模型,所述抽取单元,包括:第一抽取单元,用于将所述目标文本对应编码输入所述第一神经网络模型中,通过所述第一神经网络模型对所述目标文本对应的编码进行处理,得到所述目标文本中的各类关系数据;其中,所述第一神经网络模型预先利用所述文本样本及其对应的关系标注进行训练得到;第二抽取单元,用于将所述目标文本中的各类关系数据输入所述第二神经网络模型中,通过所述第二神经网络模型对所述目标文本中的关系数据进行处理,得到所述目标文本中的各个实体数据;其中,所述第二神经网络模型预先利用所述文本样本及其对应的实体标注进行训练得到。8.根据权利要求7所述的装置,其特征在于,所述第一神经网络模型由双向长短时记忆模型bi

lstm和逻辑回归模型softmax组成,所述第二神经网络模型由预训练语言表征模型bert、双向长短时记忆模型bi

lstm、条件随机场模型crf以及逻辑回归模型softmax组成。9.一种电子设备,其特征在于,包括:存储器和处理器;其中,所述存储器用于存储程序;所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至5任意一项所述的实体关系的抽取方法。10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,用于实现如权利要求1至5任意一项所述的实体关系的抽取方法。

技术总结
本申请公开了一种实体关系的抽取方法及装置、电子设备、存储介质,可应用于金融领域或其他领域,其中,所述方法包括:获取目标文本;将所述目标文本输入预训练语言表征模型Bert中,通过所述预训练语言表征模型Bert对所述目标文本进行处理,得到所述目标文本对应的编码;将所述目标文本对应编码输入预先训练好的目标神经网络模型中,通过所述目标神经网络模型抽取出所述目标文本中的各类关系数据,并基于所述目标文本的关系数据,抽取出所述目标文本中的各个实体数据;其中,所述目标神经网络模型预先利用多个文本样本及其对应的关系标注和实体标注进行训练得到;所述文本样本对应的关系标注和实体标注,均基于确定出的数据结构模式schema进行标注。构模式schema进行标注。构模式schema进行标注。


技术研发人员:丁锐
受保护的技术使用者:中国银行股份有限公司
技术研发日:2021.09.29
技术公布日:2021/12/13
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献