一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多任务框架的方面词和方面类别联合抽取和检测方法

2022-06-01 08:43:04 来源:中国专利 TAG:

技术特征:
1.一种基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,包括如下步骤:步骤1、采用预训练的bert模型对文本进行编码,得到文本嵌入表示;步骤2、利用双向长短时记忆网络对文本嵌入表示进行正反两个方向的时序建模,提取文本中的序列信息,生成文本特征表示,分别用于后续的ate和acd两个任务;针对ate任务:步骤3、利用多层图卷积神经网络将词共现矩阵和依赖树矩阵与步骤2得到的文本特征表示融合,生成ate文本特征表示;步骤4、将ate文本特征表示输入到ate共享向量生成器中,得到ate共享向量,用于将ate任务信息传递到acd任务中;步骤5、利用多头注意力机制将acd任务的信息整合进ate文本特征表示中,生成最终的ate文本表示;步骤6、利用条件随机场对ate最终文本表示进行序列标注;针对acd任务:步骤7、利用门控机制将ate任务中的信息整合进acd文本表示中,生成acd文本特征表示;步骤8、将acd文本特征表示输入到acd共享向量生成器中,得到acd共享向量,用于将acd任务信息传递到ate任务中;步骤9、利用多头注意力机制将ate任务的信息整合进acd文本特征表示中,生成最终的acd文本表示;步骤10、通过多标签分类器对acd最终文本表示进行标签预测。2.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤1中所述的预训练的bert模型把文本序列作为输入,并将序列中的每个单词都映射为一个词向量,最终得到文本嵌入表示。3.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤2中所述的双向长短时记忆网络以文本嵌入表示作为输入,先对文本嵌入表示进行正向的时序建模,提取正向序列的上下文信息,生成正向序列向量,随后对文本嵌入表示进行反向的时序建模,抽取反向序列的上下文信息,生成反向序列向量,最后将两个向量拼接得到文本特征表示,用于后续的ate和acd任务。4.据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤3中所述的依赖树矩阵是通过stanford nlp解析器得到,词共现矩阵是通过对网络上公开数据集内的数据进行统计,并构建矩阵得到。5.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤3中所述的利用多层图卷积神经网络将词共现矩阵和依赖树矩阵整合生成ate文本表示的具体步骤如下:步骤3.1、利用图卷积神经网络将ate文本表示与文本的句法依赖矩阵进行卷积,生成融合了句法依赖信息的ate文本表示;步骤3.2、利用图卷积神经网络将融合了句法依赖信息的ate文本表示与文本的词共现矩阵进行卷积,生成融合了词共现信息的ate文本特征表示。
6.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤3中所述的多层图卷积神经网络包含多个层,除第一层是将步骤2得到的ate文本表示作为输入外,每一层图卷积神经网络都将上一层的输出作为该层输入。7.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤4中所述的ate共享向量生成器和步骤8中所述的acd共享向量生成器分别对输入的ate文本特征表示或acd文本特征表示进行最大池化操作,以此得到ate共享向量和acd共享向量。8.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤5中所述的多头注意力机制将acd共享向量作为查询矩阵,将ate文本特征表示作为键矩阵和值矩阵,获得最终的ate文本表示。9.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤7中所述的门控机制先是利用sigmoid函数计算ate共享向量对于acd文本表示中每个单词向量的贡献度,然后通过加权求和的方式将acd共享向量和acd文本表示整合在一起,得到acd文本特征表示。10.根据权利要求1所述的基于多任务框架的方面词和方面类别联合抽取和检测方法,其特征在于,步骤9中所述的多头注意力机制将ate共享向量作为查询矩阵,将acd文本特征表示作为键矩阵和值矩阵,获得最终的acd文本表示。

技术总结
本发明公开了一种基于多任务框架的方面词和方面类别联合抽取和检测方法,包括如下步骤:步骤1、得到文本嵌入表示;步骤2、生成文本特征表示;步骤3、生成ATE文本特征表示;步骤4、得到ATE共享向量;步骤5、生成最终的ATE文本表示;步骤6、利用条件随机场对ATE最终文本表示进行序列标注;步骤7、生成ACD文本特征表示;步骤8、得到ACD共享向量;步骤9、生成最终的ACD文本表示;步骤10、通过多标签分类器对ACD最终文本表示进行标签预测。这种方法提升了模型在任务中的性能,提高了模型的捕捉能力。提高了模型的捕捉能力。提高了模型的捕捉能力。


技术研发人员:蔡国永 兰天
受保护的技术使用者:桂林电子科技大学
技术研发日:2022.02.25
技术公布日:2022/5/31
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献