一种基于动态图注意力胶囊网络的谣言检测方法与装置

2022-07-16 18:52:30 来源：中国专利 TAG：

1.本发明涉及一种基于动态图注意力胶囊网络的谣言检测方法与装置，属于互联网与自然语言处理技术领域。

背景技术：

2.社交媒体的快速发展改变了人与人日常交流的方式，但同时导致大量谣言的产生。谣言传播速度快、影响范围广，传播泛滥的谣言会严重污染社交网络环境的健康生态，降低用户获得高质量的信息的可能性。正确地识别谣言成为了学者乃至工业界重要的研究任务。
3.社交媒体中的谣言是指不法分子发布在社交媒体平台上针对公众关注的事件捏造出来吸引大众的没有事实依据的言论。早期对谣言的自动检测的方法主要使用机器学习技术来检测谣言，该方法首先从谣言数据集中提取能够有效表征数据文本的特征，例如用户特征，文本内容和传播模式特征，然后将这些特征输入到决策树、随机森林、支持向量机等机器学习模型中并进行模型的训练，从而达到分类的目的。此类方法依赖繁重、耗时的特征工程，同时人为构建的特征主观性较强且缺乏高阶的特征表示,故不能有效地抽取谣言深层次的特征。近年来，为了能够提取高阶特征，许多深度学习技术被广泛应用到谣言检测领域中来。研究人员基于这些深度学习模型，例如cnn，rnn等，提出了许多谣言检测的模型。但是这些方法忽略了评论之间的结构关系，不能捕获到谣言的传播特征。近几年，gcn、gat、graphsage 等基于图结构的网络模型相继出现，引起了大量研究人员的广泛关注。huang等人提出了基于图卷积神经网络的谣言检测模型，该模型综合考虑了谣言检测的内容、用户和传播三个方面，由三个模块组成，分别是用户特征编码器，传播树编码器以及整合两个模块输出的联结器。tian等人提出了一种双向图卷积网络结构，该模型中组合了社交媒体文本的向上传播和向下传播模式，有效地捕获了谣言结构的全局特征。
4.如今图神经网络已被广泛应用于谣言检测领域，并实现了较好的检测性能，但是对于蕴含丰富文本属性特征的谣言来说，当谣言的传播结构从图神经网络学习到图嵌入时，每个文本节点被认为学习到多个单独的标量特征，而不是一个有相互依赖关系的特征向量，因此它们不足以有效地表达每个图节点以及谣言文本的更深层次的属性特征如文本位置信息和局部信息等。同时考虑到目前的谣言检测工作大多只聚焦于单一的图传播结构，对于受时间因素影响较大的谣言文本，此结构不能有效地捕捉到谣言评论结构随时间动态演化过程中的动态交互特征，继而限制了谣言检测模型性能的提升。

技术实现要素：

5.针对现有技术中存在的问题，本发明提出了一种基于动态图注意力胶囊网络的谣言检测方法与装置，基于动态图注意力胶囊网络的谣言检测模型(dyn-gacn)，能够有效地挖掘每个图节点和图结构深层次的属性特征，从而提升谣言文本的表示能力，同时动态网络框架使得模型能够捕获谣言评论结构随时间演化的动态交互特征。本发明方法涵盖社交
媒体谣言检测的全过程，主要包括数据集构建及特征处理、模型训练、对未知的帖子进行谣言分类等过程，从而能够有效地挖掘谣言文本深层次的属性以及评论结构随时间演化的动态交互特征，进而提升谣言检测的准确率。
6.本发明首先使用动态网络框架dyn对谣言传播过程中积累的评论以时间顺序进行划分，形成多个静态的以图为基础的子评论结构；然后利用图注意力胶囊网络模块gacn对每个子评论结构进行编码形成子结构分类胶囊，从而挖掘谣言文本的属性特征；最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征，进而获得谣言检测结果。
7.为了达到上述目的，本发明提供如下技术方案：
8.一种基于动态图注意力胶囊网络的谣言检测方法，包括如下步骤：
9.步骤1，数据集构建及特征处理，首先构建谣言检测数据集，然后对数据集中的文本进行数据预处理、数据编码操作；
10.步骤2，构建图注意力胶囊网络模块，将图注意力网络gat应用到谣言的以图为基础的子评论结构中进行聚合计算，得到每个文本节点的全局化特征表示；接着结合源文文本特征加强图节点表示，从而得到初级胶囊；然后使用节点归一化的方法生成归一化的初级胶囊来关注胶囊中重要性信息；最后借助胶囊网络中动态路由机制产生子分类胶囊；
11.步骤3，构建动态网络框架，首先对谣言传播过程中积累的评论以时间顺序进行划分，形成多个静态的子评论结构；然后将每个子结构应用于图胶囊注意力网络模块继而获取子结构分类胶囊；最后设计分类胶囊注意力机制关注各子结构分类胶囊的重要性信息，从而完成最终的预测；
12.步骤4，谣言检测模型训练，采用margin-loss损失函数对模型进行训练，待训练结果趋于稳定时得到预测模型；
13.步骤5，采集待检测的社交媒体帖子并进行模型预测。
14.进一步的，所述步骤1具体包括如下过程：
15.首先收集并整理目前主流的谣言检测数据集twitter15和twitter16中的数据；然后使用 tf-idf技术对数据集中的文本建立词典库，并根据词频选取文本中频率较高的一定数量的单词对每个帖子进行编码；最后对于每个谣言事件，构造以图结构为基础的数据结构。
16.进一步的，所述步骤2具体包括如下子步骤：
17.子步骤2-1，谣言图结构节点全局特征化表示，对于每个谣言事件c,依赖于评论之间和评论与源帖子之间的响应关系，构建在s
(t)
状态下以图为基础的子评论结构＜v
(t)
,e
(t)
＞，其中，表示图中的节点，xr是源帖子的节点，xi是评论的节点，e
(t)
代表节点之间的关系边的集合，
n(t)-1表示s
(t)
下评论内容总数；使用tf-idf模型根据词频选取文本中频率较高的一定数量的单词对节点编码并作为初始特征向量，利用图注意力网络gat获取全局化特征其中，p是图注意力网络的层数，n是图节点的个数，dm是经过每个图注意力层编码后隐藏向量维度的大小；
18.子步骤2-2，谣言源帖子编码，对于源帖子文本中的每个单词，使用glove模型生成每个单词的词向量其中nr表示源帖子文本中单词的个数；采用transformer中
多头注意力机制衡量词语间的重要性程度，计算公式为：
[0019][0020][0021]
其中nr表示源帖子文本中单词的个数，hr是经过transformer的encoder模块编码之后的结果接着使用mean(
·
)函数对其所有单词的隐藏向量表示求取平均值，从而得到最终源帖子文本特征表示向量其中dr是源帖子特征维度的大小；
[0022]
子步骤2-3，形成子结构分类胶囊，将transformer提取源帖子特征r与gat得到的每个节点的全局特征融合以加强每个图节点的表示，从而得到加强后的节点特征表示计算公式为：
[0023]
a＝concat(h,r)
[0024]h′
＝conv1d(a)
[0025]
将不同图网络层的同一位置的特征值进行拼接，从而得到向量形式的初级胶囊其中q是初始胶囊的数量，dc是初始胶囊的维度；使用一维卷积层conv1d(*)函数来聚合特征信息。每个图节点生成的初级胶囊反映了不同聚合程度的图网络层信息，使得节点表示更能体现谣言文本的本质特征；为了能够衡量初级胶囊之间的重要性程度，使用节点归一化的方法在图网络层上生成注意力值α并应用到初级胶囊，从而得到归一化的初级胶囊u，公式如下：
[0026]
α＝fc2(fc1(h
′
))
[0027]
u＝α*h
′
[0028]
通过两层全连接函数fc2(fc1(
·
))训练得到节点在每个图层的注意力值α，并应用到原始的初级胶囊h
′
得到归一化的初级胶囊
[0029]
采用胶囊网络中动态路由算法将归一化的初级胶囊转换成子结构的分类胶囊；
[0030]
进一步的，所述动态路由算法包括如下过程：
[0031]
对训练参数bi进行初始化并获得耦合系数权重mi，即表示初级胶囊i对各子结构分类胶囊的贡献，计算如下所示：
[0032]bij
＝b
ij
u
j|i
*vj[0033]
mi＝softmax(bi)
[0034]
其中，i是初始胶囊层中的单元，j是子结构分类胶囊层中的单元；
[0035]
初级胶囊u通过权重w
ij
获得预测向量u
j|i
，利用初始化的胶囊权重以获得胶囊输出sj；通过激活函数squashing对sj进行计算从而获得下层的子结构分类胶囊输出vj；之后预测向量u
j|i
和胶囊输出vj迭代更新胶囊权重m
ij
；计算公式如下：
[0036]uj|i
＝w
iju[0037]
sj＝∑m
ij
*u
j|i
[0038][0039]
进一步的，所述步骤3具体包括如下子步骤：
[0040]
子步骤3-1，划分评论结构，根据评论文本的发布时间对整体以图结构为基础的评论结构进行划分：将每个源帖子下方的所有评论以相等数量分隔，以图为基础的子评论结
构从s
(1)
开始，每次增加数量的评论作为下一个子评论结构，其中n-1是评论的数量，t是划分数，直到评论数量增加到形成最后一个子评论结构；最终，每个评论结构含有的评论数是事件c的评论结构s被表示为：
[0041]
s＝{s
(1)
,s
(2)
,...,s
(t)
}
[0042]
子步骤3-2，采用分类胶囊注意力机制，在图注意力胶囊网络模块gacn获得子模块的分类胶囊向量g＝[v1,v2,...,va]之后，设计分类胶囊注意力机制，将所有模块中属于同一类别的胶囊组成矩阵并作为查询向量q，键向量k和值向量v的共同值，并计算得到每个子评论结构经过self-attention机制后的分类胶囊其中关键向量的维度dk被用来使梯度稳定；通过对所有子结构分类胶囊向量求取平均值从而得到最终的分类胶囊其中k是分类的个数，f是胶囊的维度，计算公式如下：
[0043][0044][0045]
其中t表示划分的子评论结构的个数。
[0046]
进一步的，所述步骤4中，损失函数公式如下：
[0047][0048]
其中，k是谣言的类数，||ik||是该类别胶囊的输出概率，其值是胶囊向量的长度，tk是分类的指示函数，m

为上界，惩罚假阳性，即预测k类存在但真实不存在，m-为下界，惩罚假阴性，即预测k类不存在但真实存在，λ是比例系数，调整两者比重。
[0049]
进一步的，所述步骤5具体包括如下过程：
[0050]
对于待检测的社交媒体帖子，首先采用爬虫技术爬取平台上的相关数据，包括源帖子以及下方的相关评论内容；接着整理已采集的数据，并使用tf-idf词向量模型对每个帖子编码，形成初始特征向量；然后将数据结构化，即形成以图结构为基础的评论结构，从而作为模型的输入；最后使用已经被训练好的模型对结构化的数据做分类预测，并反馈检测结果。
[0051]
本发明还提供了一种基于动态图注意力胶囊网络的谣言检测装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该计算机程序被加载至处理器时实现上述基于动态图注意力胶囊网络的谣言检测方法。
[0052]
与现有技术相比，本发明具有如下优点和有益效果：
[0053]
1.本发明有效地挖掘了谣言深层次的属性特征。相比较于其他以图神经网络基础的检测模型，本发明抽取谣言文本的语义表示更深、更精准，提升了谣言检测准确率。
[0054]
2.本发明对谣言传播过程中评论之间的关系建模，符合谣言传播特点，有效地捕获谣言评论结构随时间动态演化过程中的动态交互特征，进而提升谣言检测的性能，可用于对社交媒体中的帖子进行谣言识别，从而为用户提供了良好的谣言预判机制。
附图说明
[0055]
图1为本发明提供的一种基于动态图注意力胶囊网络的谣言检测方法总体框架图；
[0056]
图2为本发明实施例涉及的transformer_encoder模型；
[0057]
图3为本发明实施例涉及的图特征转换成胶囊形式图；
[0058]
图4为本发明实施例涉及的gacn中的注意力机制示意图；
[0059]
图5为本发明实施例涉及的动态路由算法图；
[0060]
图6为本发明实施例涉及的分类胶囊注意力机制图。
具体实施方式
[0061]
以下将结合具体实施例对本发明提供的技术方案进行详细说明，应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
[0062]
本发明提供的一种基于动态图注意力胶囊网络的谣言检测方法，其整体框架如图1所示，方法包括如下步骤：
[0063]
步骤1，数据集构建及特征处理。首先收集并整理目前主流的谣言检测数据集twitter15 和twitter16中的数据；然后使用tf-idf技术对数据集中的文本建立词典库，并根据词频选取文本中频率较高的5000个单词对每个帖子进行编码；最后对于每个谣言事件，构造以图结构为基础的数据结构。
[0064]
步骤2，构建图注意力胶囊网络模块，用来抽取谣言文本深层次属性特征。在这个模块中，本发明将图注意力网络gat应用到谣言的以图为基础的子评论结构中进行聚合计算，得到每个文本节点的全局化特征表示；接着结合源文文本特征加强图节点表示，从而得到初级胶囊；然后使用节点归一化的方法生成归一化的初级胶囊来关注胶囊中重要性信息；最后借助胶囊网络中动态路由机制产生子分类胶囊。本步骤实施过程分为3个子步骤：
[0065]
子步骤2-1，谣言图结构节点全局特征化表示，对于每个谣言事件c,依赖于评论之间和评论与源帖子之间的响应关系，本发明构建了在s
(t)
状态下以图为基础的子评论结构＜v
(t)
,e
(t)
＞，其中，表示图中的节点，包括xr是源帖子的节点，xi是评论的节点，e
(t)
代表节点之间的关系边的集合和n
(t)-1表示s
(t)
下评论内容总数。本发明使用tf-idf模型根据词频选取文本中频率较高的5000个单词对节点编码并作为初始特征向量，利用图注意力网络 gat获取全局化特征其中，p是图注意力网络的层数，n是图节点的个数，dm是经过每个图注意力层编码后隐藏向量维度的大小；
[0066]
子步骤2-2，谣言源帖子编码，对于源帖子文本中的每个单词，使用glove模型生成每个单词的词向量其中nr表示源帖子文本中单词的个数。采用transformer中多头注意力机制衡量词语间的重要性程度。计算公式为：
[0067][0068][0069]
其中nr表示源帖子文本中单词的个数，hr是经过transformer的encoder模块编码之后的结果接着使用mean(
·
)函数对其所有单词的隐藏向量表示求取平均值，从而得到最终源帖子文本特征表示向量其中dr是源帖子特征维度的大小，如图2所示。
[0070]
子步骤2-3，形成子结构分类胶囊，本发明使用concat(*)函数将transformer提取源帖子特征r与gat得到的每个节点的全局特征融合以加强每个图节点的表示，从而得到加强后的节点特征表示计算公式为：
[0071]
a＝concat(h,r)
[0072]h′
＝conv1d(a)
[0073]
将不同图网络层的同一位置的特征值进行拼接，从而得到向量形式的初级胶囊其中q是初始胶囊的数量，dc是初始胶囊的维度。本发明使用一维卷积层conv1d(*)函数来聚合特征信息。每个图节点生成的初级胶囊反映了不同聚合程度的图网络层信息，使得节点表示更能体现谣言文本的本质特征，图3展示了图特征转换成胶囊形式的过程。为了能够衡量初级胶囊之间的重要性程度，使用节点归一化的方法在图网络层上生成注意力值并应用到初级胶囊，从而得到归一化的初级胶囊u，图4展示了注意力机制的形成过程，公式如下：
[0074]
α＝fc2(fc1(h
′
))
[0075]
u＝α*h'
[0076]
其中本发明通过两层全连接函数fc2(fc1(
·
))训练得到节点在每个图层的注意力值α，并应用到原始的初级胶囊h
′
得到归一化的初级胶囊
[0077]
为了能够得到谣言更深层次的属性特征，采用胶囊网络中动态路由机制将归一化的初级胶囊转换成子结构的分类胶囊。在动态路由算法中，对训练参数bi进行初始化并获得耦合系数权重mi，即表示初级胶囊i对各子结构分类胶囊的贡献，图5展示了动态路由算法。计算如下所示：
[0078]bij
＝b
ij
u
j|i
*vj[0079]
mi＝softmax(bi)
[0080]
其中，i是初始胶囊层中的单元，j是子结构分类胶囊层中的单元，b
ij
是归一化初级胶囊 i到子结构分类胶囊j的训练参数。
[0081]
初级胶囊u通过权重w
ij
获得预测向量u
j|i
，利用初始化的胶囊权重以获得胶囊输出sj。通过激活函数squashing对sj进行计算从而获得下层的子结构分类胶囊输出vj。之后预测向量u
j|i
和胶囊输出vj迭代更新胶囊权重m
ij
。计算公式如下：
[0082]uj|i
＝w
iju[0083]
sj＝∑m
ij
*u
j|i
[0084][0085]
步骤3，构建动态网络框架，用来捕获谣言评论结构随时间动态演化过程中的动态交互特征。该框架首先对谣言传播过程中积累的评论以时间顺序进行划分，形成多个静态的子评论结构；然后将每个子结构应用于图胶囊注意力网络模块继而获取子结构分类胶囊；最后设计分类胶囊注意力机制关注各子结构分类胶囊的重要性信息，从而完成最终的预测。具体如下：
[0086]
子步骤3-1，划分评论结构，根据评论文本的发布时间对整体以图结构为基础的评论结构进行划分。具体来说，将每个源帖子下方的所有评论以相等数量分隔。以图为基础的
子评论结构从s
(1)
开始，每次增加数量的评论作为下一个子评论结构，其中n-1是评论的数量，t是划分数，直到评论数量增加到形成最后一个子评论结构。最终，每个评论结构含有的评论数是事件c的评论结构s被表示为：
[0087]
s＝{s
(1)
,s
(2)
,...,s
(t)
}
[0088]
子步骤3-2，采用分类胶囊注意力机制，在图注意力胶囊网络模块gacn获得子模块的分类胶囊向量g＝[v1,v2,...,va]之后，本发明借鉴self-attention思想设计了分类胶囊注意力机制，如图6所示。在这机制中，将所有模块中属于同一类别的胶囊组成矩阵并作为查询向量q，键向量k和值向量v的共同值，并计算得到每个子评论结构经过self-attention机制后的分类胶囊其中关键向量的维度dk被用来使梯度稳定。通过对所有子结构分类胶囊向量求取平均值从而得到最终的分类胶囊i∈r
k*f
，其中k是分类的个数，f是胶囊的维度。计算公式如下：
[0089][0090][0091]
其中t表示划分的子评论结构的个数。
[0092]
步骤4，谣言检测模型训练。本发明使用损失函数margin_loss作为谣言分类损失函数，进而进行模型的训练，待训练结果趋于稳定时，便作为预测模型对未知帖子进行预测。公式可以表示为：
[0093][0094]
其中，k是谣言的类数，||ik||是该类别胶囊的输出概率，其值是胶囊向量的长度，tk是分类的指示函数(若k类存在即为1，不存在则为0)，m

为上界，惩罚假阳性，即预测k类存在但真实不存在，实验中设置大小是0.9，m-为下界，惩罚假阴性，即预测k类不存在但真实存在，实验中设置大小是0.1，λ是比例系数，调整两者比重。
[0095]
步骤5，采集待检测的社交媒体帖子并进行模型预测。对于待检测的社交媒体帖子，本发明首先需要采用爬虫技术爬取平台上的相关数据，包括源帖子以及下方的相关评论内容；接着整理已采集的数据，并使用tf-idf词向量模型对每个帖子编码，形成初始特征向量；然后将数据结构化，即形成以图结构为基础的评论结构，从而作为模型的输入；最后使用已经被训练好的模型对结构化的数据做分类预测，并反馈检测结果。
[0096]
综上，本发明包括两个部分：图注意力胶囊网络模块gacn和动态网络框架dyn。模型首先使用dyn框架对谣言传播过程中积累的评论以时间顺序进行划分，形成多个静态的以图为基础的子评论结构；然后利用gacn模块对每个子评论结构进行编码形成子结构分类胶囊，从而挖掘谣言文本的属性特征；最后设计分类胶囊注意力机制整合各子分类胶囊捕获谣言评论结构随时间动态演化过程中的动态交互特征，进而获得谣言检测结果。
[0097]
基于相同的发明构思，本发明实施例公开的一种基于动态图注意力胶囊网络的谣言检测装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该计算机程序被加载至处理器时实现上述基于动态图注意力胶囊网络的谣言检测方法。
[0098]
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段，还包括由以上技术特征任意组合所组成的技术方案。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于物联网的SaaS模式工厂管控平台及系统的制作方法

一种基于动态图注意力胶囊网络的谣言检测方法与装置

相关文献

最热文献