一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于分层异质图神经网络的社交媒体谣言检测方法及系统与流程

2021-10-19 23:48:00 来源:中国专利 TAG:神经网络 分层 谣言 社交 检测方法

技术特征:
1.一种基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,包括以下步骤:步骤s1:对推文事件数据进行预处理,抽取用户静态特征,构建用户行为关系图和分层异质图结构;步骤s2:基于预处理后推文事件数据,采用双层gcn模型,获取推文事件隐层特征向量;步骤s3基于用户静态特征和用户行为关系图作为模块的输入,采用双层gcn模型,从而得到处理后的用户特征向量表示;步骤s4:采用双层gat模型学习文本和用户之间丰富的全局结构信息;步骤s5:将推文事件隐层特征向量、用户特征向量、全局结构信息进行融合,作为事件的整体特征向量,并使用softmax函数对于该向量进行计算,输出其预测标签。2.根据权利要求1所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述步骤s1具体为:步骤s11:去除推文事件数据中的噪声,利用余下的词语构建字典,并利用clfd法计算字典中单词的权重,结合tf

idf统计方法计算推文的向量表示;步骤s12:从推文事件数据中抽取用户描述信息并转化为用户静态特征;步骤s13:根据用户与用户之间是否共同参与事件讨论的关系构建用户行为关系图;步骤s14:根据用户是否参与事件讨论构建用户与事件间的全局异质图。3.根据权利要求2所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述用户描述信息包括用户是否认证、用户的粉丝数量、用户的推文数量、用户的友人数量、用户注册时长。4.根据权利要求1所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述步骤s2具体为:步骤s21:以推文向量表示和传播、扩散结构图作为输入,采用双层gcn模型学习推文文本信息及推文事件传播过程中产生的传播、扩散结构信息;步骤s22:将每层gcn输入的源推文向量复制后与当前gcn层输出的向量进行拼接;步骤s23:利用平均池化方法获得推文事件隐层特征向量.5.根据权利要求1所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述步骤s3具体为:用户静态特征和用户行为关系图作为模块的输入,采用双层gcn模型学习用户的静态特征和用户在参与事件讨论过程中产生的用户行为信息,进一步得到处理后的用户特征向量表示。6.根据权利要求1所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述步骤s4具体为:以推文事件隐层特征向量、用户特征向量、全局异质图作为输入,其中全局异质图包含两种节点:含两种节点:其中w为可学习的模型变量,和分别为所述步骤s2输出的推文事件传
播、扩散向量表示,为所述步骤s3输出的用户特征向量表示,m

j
和u

i
分别为异质图中的推文节点和用户节点;采用双层gat模型学习文本和用户之间丰富的全局结构信息。7.根据权利要求6所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述gat网络使用注意力机制计算融合邻居节点信息的分布式表示,注意力权重计算公式如下:α

ji
=softmax(leakyrelu(a
t
[m

j
;u

i
]))β

jt
=softmax(leakyrelu(c
t
[u

i
;m

t
]))其中,a
t
和c
t
为可学习的模型变量,α

ji
为推文节点m

j
的邻居用户节点u

i
的权重,β

jt
为用户节点u

i
的邻居推文节点m

t
的权重;所述gat网络采用了多头注意力机制,异质图中各个节点的最终向量表示由k个独立的注意力计算结果拼接而成,其计算公式如下:拼接而成,其计算公式如下:其中为第k个注意力层计算出的推文节点m

j
的邻居用户节点u

i
的权重,为第k个注意力层计算出的用户节点u

i
的邻居推文节点m

t
的权重,和为可学习的模型变量,和分别表示推文节点m
j
的邻居用户节点集合和用户节点u
i
的邻居推文节点集合,||为向量拼接操作,σ(
·
)为elu激活函数。8.根据权利要求1所述的基于分层异质图神经网络的社交媒体谣言检测方法,其特征在于,所述步骤s5具体为:将推文事件隐层特征向量、用户特征向量、全局结构信息进行融合,作为事件的整体特征向量,并使用softmax函数对于该向量进行计算,输出其预测标签,计算公式如下:其中和分别为所述步骤s2输出的推文事件传播、扩散向量表示,为所述步骤s3输出的用户特征向量表示,w为可学习的模型变量,b为偏置项,l
e
为模型最终的预测标签。9.一种基于分层异质图神经网络的社交媒体谣言检测系统,其特征在于,包括:数据预处理模块,用于对文本数据进行预处理,抽取用户静态特征,构建分层异质图结构;事件编码模块,用于编码含有传播及扩散结构信息的文本;
用户编码模块,用于学习用户行为特征;全局异质图编码模块,用于捕捉事件和用户之间丰富的全局结构信息;谣言检测标签输出模块,用于融合文本信息、用户行为特征、全局异质图信息,完成谣言检测的标签预测工作。

技术总结
本发明涉及一种基于分层异质图神经网络的社交媒体谣言检测方法及系统,包括基于数据预处理模块,用于对文本数据进行预处理,抽取用户静态特征,构建分层异质图结构;事件编码模块,用于编码含有传播及扩散结构信息的文本;用户编码模块,用于学习用户行为特征;全局异质图编码模块,用于捕捉事件和用户之间丰富的全局结构信息;谣言检测标签输出模块,用于融合文本信息、用户行为特征、全局异质图信息,完成谣言检测的标签预测工作。本发明能够有效的学习用户与用户之间和文本与文本之间的局部内联关系,生成含有临近节点信息的用户、文本表示,以此建模学习用户与事件之间的全局结构关系,最终识别出事件的真实性。最终识别出事件的真实性。最终识别出事件的真实性。


技术研发人员:廖祥文 王灿杰 林建洲 林树凯 陈泓敏
受保护的技术使用者:福州大学
技术研发日:2021.07.09
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜