一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种实体与关系并行抽取模型及其构建方法、装置及应用与流程

2023-01-16 22:29:44 来源:中国专利 TAG:

技术特征:
1.一种实体与关系并行抽取模型的构建方法,其特征在于,包括以下步骤:获取至少一已标记实体词汇以及实体关系的城管事件文本作为训练样本,利用所述训练样本训练实体与关系并行抽取模型,所述实体与关系并行抽取模型包括拼接模组和并联模组,所述并联模组由实体模组和实体关系模组并联组成;将所述训练样本输入到所述拼接模组中,所述拼接模组分别对所述训练样本进行特征提取,得到样本特征和样本语义特征,将所述样本特征与样本语义特征进行拼接得到拼接特征,根据所述拼接特征计算每一所述训练样本中各个字或词之间的注意力值,根据所述注意力值对所述拼接特征进行深层次语义关系的抽取得到共享信息;将所述共享信息输入到所述实体模组中,所述实体模组对根据所述共享信息进行实体词汇标签的预测后得到预测实体词汇标签信息,对所述预测实体词汇标签信息进行评分得到评分信息,再根据所述评分信息筛选出评分最高的结果得到每一所述训练样本中的实体预测标签;将所述共享信息以及所述实体预测标签输入到所述实体关系模组中,所述实体关系模组根据所述共享信息和所述实体预测标签得到每一实体的关联度矩阵,根据所述每一实体的关联度矩阵得到实体关系预测结果。2.根据权利要求1所述的一种实体与关系并行抽取模型的构建方法,其特征在于,所述拼接模组由特征提取层、多重注意力层、语义分析层串联组成,所述训练样本输入到所述特征提取层进行特征提取,得到样本特征和样本语义特征,每一所述样本特征中包含每一字或词的内容特征向量和位置特征向量,对所述样本特征和所述样本语义特征进行拼接后送入所述多重注意力层中对各个字或词之间进行内容与内容、内容与位置、位置与内容、位置与位置的注意力计算,并将其求和得到每一训练样本的多个注意力值,将每一训练样本中的多个注意力值和所述拼接特征输入到所述语义分析层,所述语义分析层对其进行深层次语义信息的抽取后得到共享信息。3.根据权利要求1所述的一种实体与关系并行抽取模型的构建方法,其特征在于,所述实体模组由实体信息保留层、评分层、条件随机场层串联组成,所述实体信息保留层对所述共享信息中的训练样本进行实体位置与标签的预测,得到预测实体词汇标签信息,所述预测实体词汇标签信息输入到所述评分层,所述评分层对所述预测实体词汇标签信息进行评分,得到评分信息,所述条件随机场层对所述评分信息进行筛选,得到所述共享信息中每一训练样本的实体预测标签。4.根据权利要求1所述的一种实体与关系并行抽取模型的构建方法,其特征在于,将所述共享信息输入到所述实体关系模组中,所述实体关系模组对所述共享信息进行关系提取,获取每一所述训练样本中的每一字或词的多个实体关系信息,再对所述每一实体预测标签与对应的多个实体关系信息分别进行相对位置与内容上的关联度计算,得到实体关联度向量与实体关系关联度向量,将所述实体关联度向量与所述实体关系关联度向量进行拼接得到每一实体的关联度矩阵,对每一实体的关联度矩阵进行评分后得到实体关系预测结果。5.根据权利要求4所述的一种实体与关系并行抽取模型的构建方法,所述实体关系模组由关系信息保留层、实体与关系组合层、评分层串联组成,所述关系信息保留层对所述共享信息中的关系关键词进行提取,得到关系信息,所述实体与关系组合层接收所述实体预
测标签与所述关系信息,对所述各个实体预测标签进行相对位置特征与内容特征的关联度向量计算并进行拼接得到实体关联度向量,对所述各个关系信息进行相对位置特征与内容特征的关联度向量计算并进行拼接得到实体关系关联度向量,将所述实体关联度向量与所述实体关系关联度向量进行拼接得到关联度矩阵,所述评分层对所述关联度矩阵进行评分,通过所述关联度矩阵计算训练样本中各个实体之间的关系。6.根据权利要求5所述的一种实体与关系并行抽取模型的构建方法,其特征在于,所述评分层由关系矩阵计算模块、前馈神经网络、余弦距离计算模块、拼接模块、激活输出模块组成,所述关系矩阵计算模块、前馈神经网络、余弦距离计算模块并联组成,合并模块对所述关系矩阵计算模块、前馈神经网络、余弦距离计算模块的输出结果进行合并后,交由激活输出模块进行激活输出。7.根据权利要求1所述的一种实体与关系并行抽取模型的构建方法,其特征在于,所述实体模组的损失反馈由实体与关系并行抽取模型的损失与所述实体关系模组中的实体与关系组合层中的损失进行相加得到。8.一种实体与关系并行抽取模型,使用权利要求1-6任一所述的方法进行构建得到。9.一种实体与关系并行抽取方法,包括:获取至少一待抽取文本,将所述待抽取文本送入构建好的实体与关系并行抽取模型中,所述实体与关系并行抽取模型中的拼接模组对所述待抽取文本进行特征提取,得到样本特征和样本语义特征,将所述样本特征和所述样本语义特征进行拼接得到拼接特征,根据所述拼接特征计算所述待抽取文本中各个字或词之间的注意力值,根据所述注意力值对所述拼接特征进行深层次语义关系的抽取得到共享信息;将所述共享信息输入到所述实体模组中,所述实体模组对所述共享信息进行实体词汇标签的预测后得到实体词汇标签信息,对所述实体词汇标签信息进行评分得到评分信息,再根据所述评分信息筛选出评分最高的结果得到所述待抽取文本中的实体标签;将所述共享信息输入到所述实体关系模组中,所述实体关系模组对所述共享信息进行关系提取,获取所述待抽取文本中的每一字或词的多个实体关系信息,再对所述每一实体标签与对应的多个实体关系信息分别进行相对位置与内容上的关联度计算,得到实体关联度向量与实体关系关联度向量,将所述实体关联度向量与所述实体关系关联度向量进行拼接得到每一实体的关联度矩阵,对每一实体的关联度矩阵进行评分后得到实体关系。10.一种实体与关系并行抽取模型的构建装置,其特征在于,包括以下步骤:获取模块:获取至少一已标记实体词汇以及实体关系的城管事件文本作为训练样本,利用所述训练样本训练实体与关系并行抽取模型,所述实体与关系并行抽取模型包括拼接模组和并联模组,所述并联模组由实体模组和实体关系模组并联组成;拼接模块:将所述训练样本输入到所述拼接模组中,所述拼接模组分别对所述训练样本进行特征提取,得到样本特征和样本语义特征,将所述样本特征与样本语义特征进行拼接得到拼接特征,根据所述拼接特征计算每一所述训练样本中各个字或词之间的注意力值,根据所述注意力值对所述拼接特征进行深层次语义关系的抽取得到共享信息;实体抽取模块:将所述共享信息输入到所述实体模组中,所述实体模组对根据所述共享信息进行实体词汇标签的预测后得到预测实体词汇标签信息,对所述预测实体词汇标签信息进行评分得到评分信息,再根据所述评分信息筛选出评分最高的结果得到每一所述训
练样本中的实体预测标签;实体关系抽取模块:将所述共享信息以及所述实体预测标签输入到所述实体关系模组中,所述实体关系模组根据所述共享信息和所述实体预测标签得到每一实体的关联度矩阵,根据所述每一实体的关联度矩阵得到实体关系预测结果。11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1-7任一所述的一种实体与关系并行抽取模型的构建方法或权利要求9所述的一种实体与关系并行抽取方法。12.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1-7任一所述的一种实体与关系并行抽取模型的构建方法或权利要求9所述的一种实体与关系并行抽取方法。

技术总结
本申请提出了一种实体与关系并行抽取模型及其构建方法、装置及应用,包括以下步骤:将所述训练样本送入实体与关系并行抽取模型中,所述训练样本先经过所述并联模组得到共享信息;将所述共享信息输入到所述实体模组中到每一所述训练样本中的实体预测标签;将所述共享信息输入到所述实体关系模组中,获取每一所述训练样本中的每一字或词的多个实体关系,再对所述每一实体词汇的标签与对应的多个实体关系分别进行相对位置与内容上的关联度计算,得到每一实体的关联度矩阵,根据关联度矩阵得到实体关系预测结果。本方案将实体模组与实体关系模组合并为一个模型,并结合语义信息与实体相对位置信息进行实体关系预测,提高预测准确率。率。率。


技术研发人员:毛云青 卓家雨 张香伟 彭大蒙 梁艺蕾
受保护的技术使用者:城云科技(中国)有限公司
技术研发日:2022.11.29
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献