一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信息抽取方法及装置与流程

2021-11-06 00:05:00 来源:中国专利 TAG:

技术特征:
1.一种信息抽取方法,其特征在于,包括:接收待抽取文本,将所述待抽取文本中转换为第一目标输入向量;将所述第一目标输入向量传递给主体抽取模型进行抽取,得到目标主体,其中,所述主提抽取模型基于第一bert模型、第一全连接层和第一sigmoid函数构建;将所述目标主体与所述待抽取文本进行拼接,将拼接后的文本转化为第二目标输入向量;将所述第二目标输入向量传递给预测客体和关系模型进行抽取,得到目标客体和目标关系,其中,所述预测客体和关系模型基于第二bert模型、第二全连接层、第二sigmoid函数、相对距离、标点状态向量和主体向量构建。2.根据权利要求1所述的方法,其特征在于,将所述待抽取文本中转换为第一目标输入向量,包括:将所述待抽取文本按字的粒度进行分词,得到各个字;将每个字转换为内容表示向量和位置表示向量;将所述内容表示向量和所述位置标识向量进行叠加,得到第一目标输入向量。3.根据权利要求1所述的方法,其特征在于,将所述第一目标输入向量传递给主体抽取模型进行主体抽取,得到目标主体,包括:将所述第一目标输入向量传递给所述第一bert模型,得到第一语义向量;将所述第一语义向量传递给所述第一全连接层的所述第一sigmoid函数,预测所述待抽取文本中目标主体。4.根据权利要求1所述的方法,其特征在于,将所述第二目标输入向量传递给预测客体和关系模型,得到目标客体和目标关系,包括:将所述得让目标输入向量传递给所述第二bert模型,得到第二语义向量;将所述第二语义向量中添加所述相对距离、所述标点状态向量和所述主体向量,得到第三语义向量;确定所述第三语义向量中主体词和非主体词的相关性,将所述相关性与所述主体向量的乘积添加到对应的第三语义向量中,得到目标语义向量;将所述目标语义向量传递给所述第二全连接层的所述第二sigmoid函数,预测所述待抽取文本中目标客体和目标关系。5.根据权利要求1所述的方法,其特征在于,还包括:所述主体抽取模型和所述预测客体和关系模型至少为一个;获取各个三元组,其中,所述三元组包括:目标主体、目标客体和目标关系;在所述各个三元组中选取待预测三元组;将所述待预测三元组传递给三元组预测模型,得到所述待预测三元组合理性概率,其中,所述三元组预测模型基于第三bert模型、第三全连接层和第三sigmoid函数构建;在各个合理性概率中选取概率值大于预设概率阈值的待预测三元组作为所述目标三元组。6.一种信息抽取装置,其特征在于,包括:第一转换模块,用于接收待抽取文本,将所述待抽取文本中转换为第一目标输入向量;第一抽取模块,用于将所述第一目标输入向量传递给主体抽取模型进行抽取,得到目
标主体,其中,所述主提抽取模型基于第一bert模型、第一全连接层和第一sigmoid函数构建;第二转换模块,用于将所述目标主体与所述待抽取文本进行拼接,将拼接后的文本转化为第二目标输入向量;第二抽取模块,用于将所述第二目标输入向量传递给预测客体和关系模型进行抽取,得到目标客体和目标关系,其中,所述预测客体和关系模型基于第二bert模型、第二全连接层、第二sigmoid函数、相对距离、标点状态向量和主体向量构建。7.根据权利要求6所述的装置,其特征在于,所述第一转换模块包括:分词单元,用于将所述待抽取文本按字的粒度进行分词,得到各个字;转换单元,用于将每个字转换为内容表示向量和位置表示向量;叠加单元,用于将所述内容表示向量和所述位置标识向量进行叠加,得到第一目标输入向量。8.根据权利要求6所述的装置,其特征在于,所述第一抽取模块包括:第一计算单元,用于将所述第一目标输入向量传递给所述第一bert模型,得到第一语义向量;第一预测单元,用于将所述第一语义向量传递给所述第一全连接层的所述第一sigmoid函数,预测所述待抽取文本中目标主体。9.根据权利要求6所述的装置,其特征在于,所述第二抽取模块包括:第二计算单元,用于将所述得让目标输入向量传递给所述第二bert模型,得到第二语义向量;第一添加单元,用于将所述第二语义向量中添加所述相对距离、所述标点状态向量和所述主体向量,得到第三语义向量;第二添加单元,用于确定所述第三语义向量中主体词和非主体词的相关性,将所述相关性与所述主体向量的乘积添加到对应的第三语义向量中,得到目标语义向量;第二预测单元,用于将所述目标语义向量传递给所述第二全连接层的所述第二sigmoid函数,预测所述待抽取文本中目标客体和目标关系。10.根据权利要求6所述的装置,其特征在于,还包括:所述主体抽取模型和所述预测客体和关系模型至少为一个;获取模块,用于获取各个三元组,其中,所述三元组包括:目标主体、目标客体和目标关系;第一选取模块,用于在所述各个三元组中选取待预测三元组;预测模块,用于将所述待预测三元组传递给三元组预测模型,得到所述待预测三元组合理性概率,其中,所述三元组预测模型基于第三bert模型、第三全连接层和第三sigmoid函数构建;第二选取模块,在各个合理性概率中选取概率值大于预设概率阈值的待预测三元组作为所述目标三元组。

技术总结
本发明公开了一种信息抽取方法及装置,将待抽取文本转换为第一目标输入向量;将第一目标输入向量传递给主体抽取模型,得到目标主体,主提抽取模型基于第一Bert模型、第一全连接层和第一sigmoid函数构建;将目标主体与待抽取文本进行拼接后转化为第二目标输入向量;将第二目标输入向量传递给预测客体和关系模型,得到目标客体和目标关系,预测客体和关系模型基于第二Bert模型、第二全连接层、第二sigmoid函数、相对距离、标点状态向量和主体向量构建。上述过程,基于主体抽取模型和预测客体和关系模型抽取目标主体、目标客体和目标关系,基于模型进行抽取保证了抽取的准确率,由于不需要人工参与,节省了人力。节省了人力。节省了人力。


技术研发人员:俞银涛 郝璐妍
受保护的技术使用者:上海金仕达软件科技有限公司
技术研发日:2021.08.12
技术公布日:2021/11/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献