一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于知识约束的两步式辟谣文本生成方法与流程

2021-11-09 21:10:00 来源:中国专利 TAG:

技术特征:
1.基于知识约束的两步式辟谣文本生成方法,其特征在于包括以下步骤:1)处理数据,得到知识三元组;2)将知识三元组序列传入知识文本生成模型,得到知识文本序列;3)将知识文本序列和谣言文本序列传入辟谣结论生成模型,得到辟谣结论文本序列;4)将谣言文本序列和知识三元组传入辟谣结论生成模型,得到一步式生成的辟谣文本;5)将知识文本序列和辟谣结论文本序列共同作为两步式生成的辟谣文本。2.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤1)中,所述处理数据,得到知识三元组,是利用哈工大开源的ltp模型,先利用ltp模型得到句法分析树,然后以谓词为中心抽取三元组。3.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤2)中,所述知识文本生成模型采用transformer多层解码器的架构,在原来tranformer的基础上去掉encoder

decoder之间的注意力层,同时更改解码器中的注意力机制。4.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤3)中,所述辟谣结论生成模型采用15g中文语料训练好的pytorch版的gpt2

ml架构。5.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤4)中,所述一步式生成是基于端到端的模型,采用15g中文语料训练好的pytorch版的gpt2

ml架构的辟谣结论模型,传入的是谣言文本序列和知识三元组,输出的是知识文本序列和辟谣结论文本序列,共同作为一步式生成辟谣文本。6.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤5)中,所述知识文本序列由基于transformer多层解码器架构的知识文本生成模型得到,辟谣结论文本序列由采用15g中文语料训练好的pytorch版的gpt2

ml架构的辟谣结论模型得到,两者共同作为两步式生成的辟谣文本。

技术总结
基于知识约束的两步式辟谣文本生成方法,涉及自然语言处理领域。针对辟谣文本对外部知识高度依赖以及辟谣长文本生成困难的问题,以谣言为研究对象,基于Transformer的多层解码器架构建立知识文本生成模型,利用知识三元组生成知识文本序列,同时采用pytorch版的GPT2


技术研发人员:曹冬林 朱多朵 李臣 林达真
受保护的技术使用者:厦门大学
技术研发日:2021.08.11
技术公布日:2021/11/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献