一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

虚假新闻判别模型的训练方法、虚假新闻判别方法及装置

2022-06-05 18:10:27 来源:中国专利 TAG:


1.本公开涉及虚假新闻判别技术领域,更具体地,涉及一种虚假新闻判别模型的训练方法、虚假新闻判别方法、虚假新闻判别模型的训练装置、虚假新闻判别装置、电子设备、可读存储介质及程序产品。


背景技术:

2.虚假新闻是指相关人员或组织为达到自身目的发表的错误新闻,会误导群众导致错误的舆论传播,对于政治、经济发展有很大的损害。随着近些年互联网的发展,虚假新闻在各类社交平台上加速传播,面对高超的伪造技巧和海量的虚假信息,传统的人工判识方式不仅耗费大量人力资源,还难以取得较好的判识效果。


技术实现要素:

3.有鉴于此,本公开实施例提供了一种虚假新闻判别模型的训练方法、虚假新闻判别方法、虚假新闻判别模型的训练装置、虚假新闻判别装置、电子设备、可读存储介质及程序产品。
4.本公开实施例的一个方面提供了一种虚假新闻判别模型的训练方法,包括:
5.获取新闻训练样本集,其中,上述新闻训练样本集包括多个训练样本和与上述训练样本对应的标签数据,其中,上述训练样本包括异构图,上述异构图是根据与新闻相关的节点和节点关系生成的,上述节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量,上述节点关系包括根据与上述新闻对应的关联关系和关注关系生成的邻接矩阵;
6.将上述新闻训练样本集中的上述训练样本输入异构图神经网络,输出预测结果;
7.将上述预测结果和上述标签数据输入损失函数,得到损失结果;
8.根据上述损失结果迭代地调整上述异构图神经网络的网络参数,生成经训练的上述虚假新闻判别模型;
9.其中,上述异构图神经网络包括第一注意力机制层、第二注意力机制层、全连接层和归一化层;
10.其中,上述将上述新闻训练样本集中的上述训练样本输入异构图神经网络,输出预测结果,包括:
11.根据上述异构图,得到节点特征矩阵和节点关系矩阵,其中,上述节点关系矩阵包括上述邻接矩阵,上述节点特征矩阵包括多个新闻节点,上述节点关系矩阵包括多个上述新闻节点之间的节点关系,上述多个新闻节点包括分别对应于上述新闻内容、上述推广内容和上述用户信息的多个上述初始向量;
12.针对每个上述新闻节点,利用上述第一注意力机制层处理上述新闻节点和与上述新闻节点相关的上述节点关系,得到第一注意力值;
13.根据上述新闻节点的节点关系确定与上述新闻节点相关的关联新闻节点;
14.利用上述第二注意力机制层处理上述第一注意力值、上述关联新闻节点,得到上述新闻节点的第二注意力值;
15.根据多个上述第二注意力值和图网络计算公式,确定第一特征向量;
16.利用上述全连接层处理多个上述第一特征向量,得到第二特征向量;
17.利用上述归一化层处理上述第二特征向量,得到上述预测结果。
18.根据本公开的实施例,上述关联关系包括引用关系、转载关系和发布关系;
19.其中,上述训练样本通过如下方式生成:
20.获取上述新闻内容、上述推广内容和上述用户信息,其中,上述推广内容是通过利用信息查询接口查询上述新闻内容的关键字获得的,上述用户信息包括用户资料和社交关系;
21.分别根据上述新闻内容、上述推广内容、上述用户信息,生成分别对应于上述新闻内容、上述推广内容和上述用户信息的多个上述初始向量;
22.根据上述引用关系、上述转载关系、上述发布关系和上述关注关系,生成上述邻接矩阵;
23.根据多个上述初始向量和上述邻接矩阵,生成包括上述异构图的上述训练样本。
24.根据本公开的实施例,上述分别根据上述新闻内容、上述推广内容、上述用户信息,生成分别对应于上述新闻内容、上述推广内容和上述用户信息的多个上述初始向量,包括:
25.在上述新闻内容包括文本信息的情况下,利用段落向量方法获取上述文本信息的文本向量;
26.在上述新闻内容包括图像信息的情况下,利用局部二值方法获取上述图像信息的图像向量;
27.根据上述文本向量和/或上述图像向量,生成对应于上述新闻内容的上述初始向量;
28.在上述推广内容包括原创内容的情况下,利用段落向量方法获取上述原创内容的原创向量;
29.在上述推广内容包括转载内容的情况下,利用段落向量方法处理与上述转载内容对应的用户观点,得到转载向量;
30.根据上述原创向量和/或上述转载向量,生成对应于上述推广内容的上述初始向量;
31.在上述用户信息包括文本类信息的情况下,利用段落向量方法处理上述用户信息,得到文本类向量;
32.在上述用户信息包括图像类信息的情况下,利用局部二值方法获取上述图像类信息的图像类向量;
33.根据上述文本类向量和/或上述图像类向量生成对应于上述用户信息的上述初始向量。
34.根据本公开的实施例,上述图像信息包括多个图像元素以及与每个上述图像元素对应的像素值;
35.其中,上述在上述新闻内容包括图像信息的情况下,利用局部二值方法获取上述
图像信息的图像向量,包括:
36.针对每个上述图像元素,利用上述局部二值方法处理上述图像元素的像素值和与上述图像元素相关的图像元素的像素值,得到上述图像元素的局部二值;
37.对多个上述局部二值进行归一化处理,得到上述图像信息的上述图像向量。
38.根据本公开的实施例,虚假新闻判别模型的训练方法还包括:
39.获取新闻验证样本集,其中,上述新闻验证样本集包括多个验证样本和与上述验证样本对应的验证标签数据,其中,上述验证样本包括根据与验证新闻相关的验证节点和验证节点关系生成的验证异构图,上述验证节点包括分别对应于验证新闻内容、验证推广内容和验证用户信息的多个验证初始向量,上述验证节点关系包括根据验证关联关系和验证关注关系生成的验证邻接矩阵,多个上述验证标签数据与多个上述验证新闻内容之间具有一一对应关系;
40.将多个上述验证样本均输入上述虚假新闻判别模型,输出验证结果,其中,上述验证结果包括分别与每个上述验证样本对应的验证分结果;
41.将上述预测结果和多个上述验证标签数据进行匹配对比,得到对比结果;
42.在上述对比结果表明多个上述验证分结果中与上述验证标签数据相同的验证分结果的数量占比满足预设占比的情况下,将上述虚假新闻判别模型确定为目标虚假新闻判别模型。
43.本公开实施例的另一个方面提供了一种虚假新闻判别方法,包括:
44.获取待判别新闻数据集,其中,上述待判别新闻数据集包括目标新闻、分别与上述目标新闻相关的目标推广内容、目标用户信息、目标关联关系和目标关注关系;
45.根据上述待判别新闻数据集,生成待识别异构图;
46.将上述待识别异构图输入虚假新闻判别模型,输出识别结果,上述识别结果用于表征上述目标新闻的真假类型,其中,上述虚假新闻判别模型是利用如上所述的方法训练得到的。
47.根据本公开的实施例,上述目标关联关系包括目标引用关系、目标转载关系和目标发布关系;
48.其中,上述根据上述待判别新闻数据集,生成待识别异构图,包括:
49.根据上述目标新闻、上述目标推广内容、上述目标用户信息,生成分别对应于上述目标新闻、上述目标推广内容、上述目标用户信息的多个目标向量;
50.根据上述目标引用关系、上述目标转载关系、上述目标发布关系和上述目标关注关系,生成目标邻接矩阵;
51.根据多个上述目标向量和上述目标邻接矩阵,生成上述待识别异构图。
52.本公开实施例的另一个方面提供了一种虚假新闻判别模型的训练装置,包括:
53.第一获取模块,用于获取新闻训练样本集,其中,上述新闻训练样本集包括多个训练样本和与上述训练样本对应的标签数据,其中,上述训练样本包括异构图,上述异构图是根据与新闻相关的节点和节点关系生成的,上述节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量,上述节点关系包括根据与上述新闻对应的关联关系和关注关系生成的邻接矩阵;
54.预测模块,用于将上述新闻训练样本集中的上述训练样本输入异构图神经网络,
输出预测结果;
55.计算模块,用于将上述预测结果和上述标签数据输入损失函数,得到损失结果;以及
56.迭代模块,用于根据上述损失结果迭代地调整上述异构图神经网络的网络参数,生成经训练的上述虚假新闻判别模型;
57.其中,上述异构图神经网络包括第一注意力机制层、第二注意力机制层、全连接层和归一化层;
58.其中,上述预测模块包括:
59.得到子模块,用于根据上述异构图,得到节点特征矩阵和节点关系矩阵,其中,上述节点关系矩阵包括上述邻接矩阵,上述节点特征矩阵包括多个新闻节点,上述节点关系矩阵包括多个上述新闻节点之间的节点关系,上述多个新闻节点包括分别对应于上述新闻内容、上述推广内容和上述用户信息的多个上述初始向量;
60.第一处理子模块,用于针对每个上述新闻节点,利用上述第一注意力机制层处理上述新闻节点和与上述新闻节点相关的上述节点关系,得到第一注意力值;
61.第一确定子模块,用于根据上述新闻节点的节点关系确定与上述新闻节点相关的关联新闻节点;
62.第二处理子模块,用于利用上述第二注意力机制层处理上述第一注意力值、上述关联新闻节点,得到上述新闻节点的第二注意力值;
63.第二确定子模块,用于根据多个上述第二注意力值和图网络计算公式,确定第一特征向量;
64.第三处理子模块,用于利用上述全连接层处理多个上述第一特征向量,得到第二特征向量;
65.归一化子模块,用于利用上述归一化层处理上述第二特征向量,得到上述预测结果。
66.本公开实施例的另一个方面提供了一种虚假新闻判别装置,包括:
67.第二获取模块,用于获取待判别新闻数据集,其中,上述待判别新闻数据集包括目标新闻、分别与上述目标新闻相关的目标推广内容、目标用户信息、目标关联关系和目标关注关系;
68.生成模块,用于根据上述待判别新闻数据集,生成待识别异构图;以及
69.识别模块,用于将上述待识别异构图输入虚假新闻判别模型,输出识别结果,上述识别结果用于表征上述目标新闻的真假类型,其中,上述虚假新闻判别模型是利用如上所述的方法训练得到的。
70.本公开实施例的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
71.本公开实施例的另一个方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
72.本公开实施例的另一个方面提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
73.根据本公开的实施例,通过利用与新闻对应的关联关系和关注关系构成的节点关系以及对应于新闻内容、推广内容和用户信息的多个初始向量构成的节点,根据由节点和节点关系构成的训练样本对异构图神经网络进行训练得到的虚假新闻判别模型,由于训练样本充分考虑了与新闻内容相关的节点关系,因此训练得到的虚假新闻判别模型对待识别新闻的识别结果能够较为准确地确定其是否为虚假新闻,从而至少部分地克服了不能准确地识别虚假新闻,从而容易对用户的认知造成影响的技术问题。
附图说明
74.通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
75.图1示意性示出了根据本公开实施例的应用虚假新闻判别模型的训练方法或虚假新闻判别方法的示例性系统架构;
76.图2示意性示出了根据本公开实施例的虚假新闻判别模型的训练方法的流程图;
77.图3示意性示出了根据本公开实施例的虚假新闻判别模型的结构示意图;
78.图4示意性示出了根据本公开实施例的虚假新闻判别模型的训练方法的流程图;
79.图5示意性示出了根据本公开的实施例的虚假新闻判别模型的训练装置的框图;
80.图6示意性示出了根据本公开的实施例的虚假新闻判别装置的框图;以及
81.图7示意性示出了根据本公开实施例的实现虚假新闻判别模型的训练方法或虚假新闻判别方法的电子设备的框图。
具体实施方式
82.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
83.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
84.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
85.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
86.本公开的实施例提供了一种虚假新闻判别模型的训练方法、虚假新闻判别方法及装置。该训练方法包括获取新闻训练样本集,其中,新闻训练样本集包括多个训练样本和与训练样本对应的标签数据,其中,训练样本包括异构图,异构图是根据与新闻相关的节点和
节点关系生成的,节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量,节点关系包括根据与新闻对应的关联关系和关注关系生成的邻接矩阵;将新闻训练样本集中的训练样本输入异构图神经网络,输出预测结果;将预测结果和标签数据输入损失函数,得到损失结果;根据损失结果迭代地调整异构图神经网络的网络参数,生成经训练的虚假新闻判别模型。
87.图1示意性示出了根据本公开实施例的可以应用虚假新闻判别模型的训练方法或虚假新闻判别方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
88.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等。
89.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如模型训练购物类应用、新闻判别应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
90.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。
91.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
92.需要说明的是,本公开实施例所提供的虚假新闻判别模型的训练方法或虚假新闻判别方法一般可以由服务器105执行。相应地,本公开实施例所提供的虚假新闻判别模型的训练装置或虚假新闻判别装置一般可以设置于服务器105中。本公开实施例所提供的虚假新闻判别模型的训练方法或虚假新闻判别方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的虚假新闻判别模型的训练装置或虚假新闻判别装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的虚假新闻判别模型的训练方法或虚假新闻判别方法也可以由终端设备101、102、或103执行,或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的虚假新闻判别模型的训练装置或虚假新闻判别装置也可以设置于终端设备101、102、或103中,或设置于不同于终端设备101、102、或103的其他终端设备中。
93.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
94.图2示意性示出了根据本公开实施例的虚假新闻判别模型的训练方法的流程图。
95.如图2所示,该虚假新闻判别模型的训练方法包括操作s201~s204。
96.在操作s201,获取新闻训练样本集,其中,新闻训练样本集包括多个训练样本和与
训练样本对应的标签数据,其中,训练样本包括异构图,异构图是根据与新闻相关的节点和节点关系生成的,节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量,节点关系包括根据与新闻对应的关联关系和关注关系生成的邻接矩阵。
97.在操作s202,将新闻训练样本集中的训练样本输入异构图神经网络,输出预测结果。
98.在操作s203,将预测结果和标签数据输入损失函数,得到损失结果。
99.在操作s204,根据损失结果迭代地调整异构图神经网络的网络参数,生成经训练的虚假新闻判别模型。
100.根据本公开的实施例,关联关系可以指是否引用该新闻、是否转载该新闻或者发布该新闻的关系。
101.根据本公开的实施例,推广内容可以指具有推广性质的内容,例如用户可以通过发布该内容发表对于新闻的主观看法。
102.根据本公开的实施例,异构图神经网络(heterogenous graph attention networks,hetgnn)可以将异构结构组成的多种类型的节点和边的信息整合,还可以考虑与每个节点相关联的异构属性、异构内容。
103.根据本公开的实施例,关注关系可以指用户的关注对象和其他用户关注该用户的,例如发布该新闻所关注的用户,也可以指社交关系。用户信息可以指用户主页中用户的身份认证信息。
104.根据本公开的实施例,在获取到新闻训练样本集后,将新闻训练样本集中的训练样本输入至异构图神经网络中,输出对应于该训练样本的预测结果,根据该预测结果和对应的标签数据计算对应于该训练样本的损失结果,从而根据损失结果迭代地调整该异构图神经网络的网络参数,从而可以生成训练完成的虚假新闻判别模型。
105.根据本公开的实施例,通过利用与新闻对应的关联关系和关注关系构成的节点关系以及对应于新闻内容、推广内容和用户信息的多个初始向量构成的节点,根据由节点和节点关系构成的训练样本对异构图神经网络进行训练得到的虚假新闻判别模型,由于训练样本充分考虑了与新闻内容相关的节点关系,因此训练得到的虚假新闻判别模型对待识别新闻的识别结果能够较为准确地确定其是否为虚假新闻,从而至少部分地克服了不能准确地识别虚假新闻,从而容易对用户的认知造成影响的技术问题。
106.根据本公开的实施例,关联关系包括引用关系、转载关系和发布关系。
107.根据本公开的实施例,训练样本通过如下方式生成:
108.获取新闻内容、推广内容和用户信息,其中,推广内容是通过利用信息查询接口查询新闻内容的关键字获得的,用户信息包括用户资料和社交关系。分别根据新闻内容、推广内容、用户信息,生成分别对应于新闻内容、推广内容和用户信息的多个初始向量。根据引用关系、转载关系、发布关系和关注关系,生成邻接矩阵。根据多个初始向量和邻接矩阵,生成包括异构图的训练样本。
109.根据本公开的实施例,新闻内容的来源可以是各种商业网站,商业网站可以检测新闻真假,提供各个领域专家对真实或虚假新闻的判识,因此能作为新闻训练样本集的数据来源。信息查询接口可以包括但不限于提供社交服务的企业api接口。
110.根据本公开的实施例,在获取到新闻内容的情况下,提取该新闻的关键词,利用信
息查询接口可以获得对应于该新闻内容的推广内容,同时获取发布该推广内容的用户资料和社交关系。
111.根据本公开的实施例,为了整合多层次的社交背景信息,本公开的实施例构建包含新闻内容、推广内容、用户信息三种类型的节点的异构图,异构图包含引用关系、转载关系、发布关系、关注关系四种类型的边,可以表示为g=(v,e),其中,v表征节点,e表征节点关系或不同类型的边。
112.根据本公开的实施例,根据获取的新闻内容、推广内容、用户信息的初始向量生成异构图中的节点,并根据引用关系、转载关系、发布关系和关注关系,生成邻接矩阵,上述邻接矩阵可以表征节点关系。
113.根据本公开的实施例,分别根据新闻内容、推广内容、用户信息,生成分别对应于新闻内容、推广内容和用户信息的多个初始向量,可以包括如下操作:
114.在新闻内容包括文本信息的情况下,利用段落向量方法获取文本信息的文本向量。在新闻内容包括图像信息的情况下,利用局部二值方法获取图像信息的图像向量。根据文本向量和/或图像向量,生成对应于新闻内容的初始向量。在推广内容包括原创内容的情况下,利用段落向量方法获取原创内容的原创向量。在推广内容包括转载内容的情况下,利用段落向量方法处理与转载内容对应的用户观点,得到转载向量。根据原创向量和/或转载向量,生成对应于推广内容的初始向量。利用段落向量方法处理用户信息,得到对应于用户信息的初始向量。
115.根据本公开的实施例,新闻内容包括文本信息和图像信息两种模态,在新闻内容为文本信息的情况下,可以利用段落向量方法处理该文本信息,从而获得对应的文本向量。其中,段落向量方法可以包括doc2vec算法。
116.根据本公开的实施例,在新闻内容包括图像信息的情况下,可以利用局部二值方法处理该图像信息,从而获得对应的图像向量。其中,局部二值方法包括lbp(local binary pattern)算法。将文本向量和图像向量进行融合以得到对应于新闻内容的初始向量。
117.根据本公开的实施例,推广内容一般包括原创内容和转载内容两种类型。在推广内容为原创内容或转载内容的情况下,可以利用段落向量方法进行处理,从而得到对应的原创向量或转载向量,进而根据原创向量和/或转载向量得到对应于推广内容的初始向量。
118.根据本公开的实施例,用户是社交环境的重要参与者,用户的身份认证是新闻虚假判识的重要指标,因此可以利用段落向量方法对获取的用户信息进行处理,得到身份认证信息的特征表示,该特征表示可以作为用户信息的初始向量。
119.根据本公开的实施例,图像信息包括多个图像元素以及与每个图像元素对应的像素值。
120.根据本公开的实施例,在新闻内容包括图像信息的情况下,利用局部二值方法(lbp)获取图像信息的图像向量,可以包括如下操作:
121.针对每个图像元素,利用局部二值方法处理图像元素的像素值和与图像元素相关的图像元素的像素值,得到图像元素的局部二值。对多个局部二值进行归一化处理,得到图像信息的图像向量。
122.根据本公开的实施例,lbp算法的计算如公式(1)和公式(2)所示。
[0123][0124][0125]
其中,(xc,yc)表征一个区域内的一个图像元素,像素值为ic,i
p
代表区域内与图像元素相关的图像元素的像素值。
[0126]
根据本公开的实施例,利用lbp算法计算每个图像元素的局部二值,统计多个局部二值并进行归一化处理,得到该图像信息的图像向量。
[0127]
根据本公开的实施例,异构图神经网络包括第一注意力机制层、第二注意力机制层、全连接层和归一化层。
[0128]
根据本公开的实施例,将训练样本输入异构图神经网络,输出预测结果,可以包括如下操作:
[0129]
根据异构图,得到节点特征矩阵和节点关系矩阵,其中,节点关系矩阵包括邻接矩阵,节点特征矩阵包括多个新闻节点,节点关系矩阵包括多个新闻节点之间的节点关系,多个新闻节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量。针对每个新闻节点,利用第一注意力机制层处理新闻节点和与新闻节点相关的节点关系,得到第一注意力值。根据新闻节点的节点关系确定与新闻节点相关的关联新闻节点。利用第二注意力机制层处理第一注意力值、关联新闻节点,得到节点关系的第二注意力值。根据第二注意力值和图网络计算公式,确定第一特征向量。利用全连接层处理多个第一特征向量,得到第二特征向量。利用归一化层处理第二特征向量,得到预测结果。
[0130]
根据本公开的实施例,第一注意力值α
p
的计算如公式(3)和公式(4)所示。
[0131]hp
=∑i′aii
′hi

ꢀꢀꢀ
(3)
[0132][0133]
其中,i表征新闻节点,p表征与新闻节点i相连的关系类型,a代表初始邻接矩阵,h
p
表征关系类型p的特征向量;l代表中心的新闻节点所连的所有关系类型,代表节点间关系为p的训练参数,σ代表非线性激活函数,||代表向量拼接操作。
[0134]
根据本公开的实施例,第二注意力值β
i,j
的计算如公式所示。
[0135][0136]
其中,hi和hj分别表征新闻节点i和j的特征向量,hq表征和节点i关系为p的相邻节点的特征向量,表征节点间关系为p的训练参数,σ表征非线性激活函数,||表征向量拼接操作。
[0137]
根据本公开的实施例,根据多个第二注意力值β
i,j
形成注意力矩阵b
i,j
,b
i,j
=β
i,j
,结合图网络计算公式,可以得到如公式(6)所示的目标图网络计算公式。
[0138]h(l 1)
=σ(b

·h(l)
·w(l)
)
ꢀꢀꢀ
(6)
[0139]
其中,代表对称归一化后的注意力矩阵,m
ij
=∑
jai,j
,a代表初始邻接矩阵,w
(l)
代表可训练的变换矩阵。
[0140]
根据本公开的实施例,根据目标图网络计算公式可以确定第一特征向量h
(l 1)
,从而利用全连接层和归一化层进行处理,以得到预测结果。
[0141]
根据本公开的实施例,预测结果可以包括置信度p
t
或其他类型的预测参数。本实施例以预测结果为置信度进行示例性说明。
[0142]
根据本公开的实施例,虚假新闻存在识别难易不均衡的问题,因此本技术采用focal loss损失函数,这种损失函数提供了一个抑制因子γ,可以有效解决虚假新闻识别难易样本不均衡的问题。损失函数loss如公式(7)所示:
[0143]
loss=-(1-p
t
)
γ
log(p
t
)
ꢀꢀꢀ
(7)
[0144]
根据本公开的实施例,对于容易识别的新闻,p
t
的值较大,(1-p
t
)
γ
的值就会减小。以此来降低容易识别的新闻对损失函数的影响,增强模型在难以分辨真假的新闻上的识别能力,其中,γ为根据实际需求设定的调节因子。
[0145]
根据本公开的实施例,虚假新闻判别模型的训练方法还可以包括如下操作:
[0146]
获取新闻验证样本集,其中,新闻验证样本集包括多个验证样本和与验证样本对应的验证标签数据,其中,验证样本包括根据与验证新闻相关的验证节点和验证节点关系生成的验证异构图,验证节点包括分别对应于验证新闻内容、验证推广内容和验证用户信息的多个验证初始向量,验证节点关系包括根据验证关联关系和验证关注关系生成的验证邻接矩阵。
[0147]
将多个验证样本均输入虚假新闻判别模型,输出验证结果,其中,验证结果包括分别与每个验证样本对应的验证分结果。将预测结果和多个验证标签数据进行匹配对比,得到对比结果。在对比结果表明多个验证分结果中与验证标签数据相同的验证分结果的数量占比满足预设占比的情况下,将虚假新闻判别模型确定为目标虚假新闻判别模型。
[0148]
根据本公开的实施例,在虚假新闻判别模型训练完成后,可以利用新闻验证样本集对虚假新闻判别模型的准确性进行验证,从而确保虚假新闻判别模型的准确性符合预设要求。
[0149]
需要说明的是,新闻验证样本集的构建过程与新闻训练样本集的构建过程相同,在此不进行赘述。
[0150]
根据本公开的实施例,将新闻验证样本集中的验证样本输入到训练完成的虚假新闻判别模型,可以得到验证结果,将验证结果中的多个验证分结果分别与对应的验证标签数据进行对比,可以得到反映结果是否准确的对比结果。在对比结果表明验证结果为正确的数量的占比满足预设占比的情况下,可以将该虚假新闻判别模型确定为目标虚假新闻判别模型。在对比结果表明验证结果为正确的数量的占比不满足预设占比的情况下,可以利用新闻训练样本集继续训练虚假新闻判别模型,直至验证结果为正确的数量的占比不满足预设占比。其中,预设占比的数值可以根据具体需求具体设置,例如可以设置为80%、90%等。
[0151]
为了更加清晰地对虚假新闻判别模型的训练方法进行说明,以下引入具体事例进
行示例性的说明。
[0152]
在一种示例性的实施例中,包括如下步骤:
[0153]
步骤一:数据准备
[0154]
以某网站发布的权威数据为依据,数据引接系统进行自动引接。例如,某网站判定“emmys 2017:what the nominees are saying”是一篇虚假新闻,数据引接系统将根据这篇新闻的url地址获取新闻中的文本信息以及图像信息。之后以该新闻的标题为关键词利用企业api接口展开搜索,获取引用该新闻的推文id列表。根据推文id获取推文内容(即新闻内容)、推文的转载信息(即转载关系)、发布推文的用户、用户的资料(即用户信息)、用户的关注网络(即关注关系)。随机选取70%的样本作为新闻训练样本集,10%的样本作为新闻验证样本集,20%的样本作为待判别新闻数据集,每一份样本中虚假新闻和真实新闻的比例为均可以设置但不限于1∶1。
[0155]
步骤二:构建异构图和特征工程
[0156]
构建包含新闻内容、推广内容、用户信息三种类型节点的异构图,首先要对三种节点进行特征工程,得到节点的向量表示。针对新闻节点,新闻通常包含文本信息和图像信息两部分内容,以“emmys 2017:what the nominees are saying”新闻为例,利用doc2vec算法获得300维的文本信息的特征向量:
[0157]
[0.5527,0.1235,0.2367,

,0.2589,0.6781,0.4523]
[0158]
对于新闻中的图像信息,利用lbp算法提取图像信息的特征,将图像信息向量化。lbp算法对中心像素周围的8个像素进行采样,得到中心节点的二进制的lbp值,如00010011,转换为十进制19。8个像素点采样的方式得到的lbp值范围为0-255,统计lbp值出现的频率,得到256维的向量,作为新闻中图像信息的特征向量,如:
[0159]
[0.2833,0.5546,0,9856,

,0.1299,0.5623,0.8815]
[0160]
之后将文本信息和图像信息的特征向量进行拼接,得到556维的特征向量(即新闻内容的初始向量),作为新闻节点的初始特征表示:
[0161]
[0.5527,0.1235,0.2367,

,0.1299,0.5623,0.8815]
[0162]
针对引用该新闻的推广内容节点,采用和新闻节点同样的方式,利用doc2vec算法和lbp算法处理文本和图像信息得到556维的初始向量,如果推文中不含有图像信息,就用0补齐。
[0163]
针对用户信息节点,获取用户的个人资料,包括昵称、个人介绍、地址信息、“粉丝”数量等,利用doc2vec算法得到这些文本信息的300维特征向量。根据用户的头像图片,利用lbp算法得到头像的256维特征向量,将文本和图片的向量拼接融合得到用户信息节点的556维初始向量。
[0164]
将所有的节点按照新闻内容、推广内容、用户信息的顺序从上到下进行堆叠,形成整个异构图的特征矩阵wm×n,其中m代表异构图所有的节点个数,n代表节点特征向量的维数。
[0165]
完成异构图中节点的特征工程后,开始构建异构图的边。异构图共包含引用关系、转载关系和发布关系、关注关系四种类型的边,构建异构图的邻接矩阵a,如果两个节点间存在关系,那么邻接矩阵上对应的位置为1,否则为0。
[0166]
经过以上步骤,完成了异构图的构建和初始的特征工程,为之后的图计算提供基
础。
[0167]
步骤三:构建模型
[0168]
图3示意性示出了根据本公开实施例的虚假新闻判别模型的结构示意图。
[0169]
以双层注意力机制的异构图神经网络作为本实施例中虚假新闻判别模型的基础(如图3所示),第一层注意力机制是关系类型级注意力。以推广内容节点i为例,推广内容节点的特征向量为hi,包含引用关系、转载关系和发布关系三种关系类型,将和节点i存在引用关系的节点的特征向量进行相加,得到引用关系的特征向量hy。同理,分别得到转载关系和发布官员必须类型的特征向量hr和h
p
。之后利用关系级注意力公式,计算三种类型分配的注意力权重,例如引用关系、转载关系和发布关系分别被分配的权重可以为0.3、0.5、0.2。
[0170]
第二层注意力机制为节点级注意力,同样以推广内容节点i为例,推广内容节点i存在n个转载关系类型节点,利用注意力机制,n个节点被分配的注意力分别为:
[0171]
[0.23,0.15,0.12,

,0.05,0.11,0.27]
[0172]
第一层的关系级注意力对转载类型分配到注意力权重为0.3,经过两层注意力相乘,得到这n个节点实际被分配的注意力,分别为:
[0173]
[0.069,0.045,0.036,

,0.015,0.033,0.081]
[0174]
在图计算的过程中,假设n个节点的特征向量分别为h1到hn,那么中心节点i聚合这n个节点信息的公式(8)所示:
[0175][0176]
经过两层图计算,得到新闻内容的特征矩阵rm×n,m代表新闻内容的个数,n代表新闻内容特征向量的维度。输入到全连接层,和权重矩阵wn×2相乘,得到公式(9):
[0177]r′m×2=rm×n×
wn×2ꢀꢀꢀ
(9)
[0178]
之后经过归一化层,得到新闻内容属于真实或虚假的概率,例如模型最终输出的向量为[0.3,0.7],代表该新闻内有70%的概率为虚假新闻,则该新闻被判识为虚假。
[0179]
步骤四:模型训练
[0180]
在模型训练的过程中,存在样本判识难易不均衡的问题,因此本实施例采用focal loss损失函数进行训练。focal loss的公式(10)所示:
[0181]
loss=-(1-p
t
)
γ
log(p
t
)
ꢀꢀꢀ
(10)
[0182]
其中p
t
代表样本判识正确的置信度,对于一篇真实新闻,如果模型输出的特征向量为[0.95,0.05],则p
t
的值为0.95,显然这篇新闻是一个容易判识的样本,对应的loss值应该减少。反之,置信度越低,对应的loss值应该越高。通过这种方式,可以增强虚假新闻判别模型对难以分辨真假的新闻进行判识的能力。γ作为调节因子,降低易判识样本的loss值,具体数值可以根据实际情况进行调整,本实施例经过大量对比实验选取的γ为2。之后通过损失值进行反向传播,不断更新模型参数,增强模型对于虚假新闻的判识效果。
[0183]
图4示意性示出了根据本公开实施例的虚假新闻判别模型的训练方法的流程图。
[0184]
如图4所示,虚假新闻判别方法包括操作s401~s403。
[0185]
在操作s401,获取待判别新闻数据集,其中,待判别新闻数据集包括目标新闻、分别与目标新闻相关的目标推广内容、目标用户信息、目标关联关系和目标关注关系。
[0186]
在操作s402,根据待判别新闻数据集,生成待识别异构图。
[0187]
在操作s403,将待识别异构图输入虚假新闻判别模型,输出识别结果,识别结果用于表征目标新闻的真假类型,其中,虚假新闻判别模型是利用如上所述的方法训练得到的。
[0188]
根据本公开的实施例,虚假新闻判别模型在使用时,需要将获得的待判别新闻数据集转换为待识别异构图,从而在待识别异构图输入虚假新闻判别模型中后可以输出对应的识别结果,其中,识别结果可以包括“该新闻为真新闻”或“该新闻为假新闻”。
[0189]
根据本公开的实施例,通过利用与新闻对应的关联关系和关注关系构成的节点关系以及对应于新闻内容、推广内容和用户信息的多个初始向量构成的节点,根据由节点和节点关系构成的训练样本对异构图神经网络进行训练得到的虚假新闻判别模型,由于训练样本充分考虑了与新闻内容相关的节点关系,因此训练得到的虚假新闻判别模型对待识别新闻的识别结果能够较为准确地确定其是否为虚假新闻,从而至少部分地克服了不能准确地识别虚假新闻,从而容易对用户的认知造成影响的技术问题。
[0190]
根据本公开的实施例,目标关联关系包括目标引用关系、目标转载关系和目标发布关系。
[0191]
根据本公开的实施例,根据待判别新闻数据集,生成待识别异构图,可以包括如下操作:
[0192]
根据目标新闻、目标推广内容、目标用户信息,生成分别对应于目标新闻、目标推广内容、目标用户信息的多个目标向量。根据目标引用关系、目标转载关系、目标发布关系和目标关注关系,生成目标邻接矩阵。根据多个目标向量和目标邻接矩阵,生成待识别异构图。
[0193]
根据本公开的实施例,目标新闻的来源不限于各种新闻网站或其他,例如微博、推特等商业软件。
[0194]
根据本公开的实施例,在获取到目标新闻的情况下,提取该目标新闻的关键词,利用信息查询接口可以获得对应于该目标新闻的目标推广内容,同时获取发布该目标推广内容的用户资料和社交关系等目标用户信息。
[0195]
根据本公开的实施例,根据上述获得的目标新闻、目标推广内容、目标用户信息,生成对应的目标向量,再结合根据目标引用关系、目标转载关系、目标发布关系和目标关注关系,生成的目标邻接矩阵,可以得到待识别异构图。从而将该待识别异构图输入到虚假新闻判别模型对该目标新闻的真假进行判别。
[0196]
图5示意性示出了根据本公开的实施例的虚假新闻判别模型的训练装置的框图。
[0197]
如图5所示,虚假新闻判别模型的训练装置可以包括第一获取模块510、预测模块520、计算模块530和迭代模块540。
[0198]
第一获取模块510,用于获取新闻训练样本集,其中,新闻训练样本集包括多个训练样本和与训练样本对应的标签数据,其中,训练样本包括异构图,异构图是根据与新闻相关的节点和节点关系生成的,节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量,节点关系包括根据与新闻对应的关联关系和关注关系生成的邻接矩阵。
[0199]
预测模块520,用于将新闻训练样本集中的训练样本输入异构图神经网络,输出预测结果。
[0200]
计算模块530,用于将预测结果和标签数据输入损失函数,得到损失结果。
[0201]
迭代模块540,用于根据损失结果迭代地调整异构图神经网络的网络参数,生成经
训练的虚假新闻判别模型。
[0202]
根据本公开的实施例,通过利用与新闻对应的关联关系和关注关系构成的节点关系以及对应于新闻内容、推广内容和用户信息的多个初始向量构成的节点,根据由节点和节点关系构成的训练样本对异构图神经网络进行训练得到的虚假新闻判别模型,由于训练样本充分考虑了与新闻内容相关的节点关系,因此训练得到的虚假新闻判别模型对待识别新闻的识别结果能够较为准确地确定其是否为虚假新闻,从而至少部分地克服了不能准确地识别虚假新闻,从而容易对用户的认知造成影响的技术问题。
[0203]
根据本公开的实施例,关联关系包括引用关系、转载关系和发布关系。
[0204]
根据本公开的实施例,训练样本可以通过获取子模块、第一生成子模块、第二生成子模块和第三生成子模块生成。
[0205]
获取子模块,用于获取新闻内容、推广内容和用户信息,其中,推广内容是通过利用信息查询接口查询新闻内容的关键字获得的,用户信息包括用户资料和社交关系。
[0206]
第一生成子模块,用于分别根据新闻内容、推广内容、用户信息,生成分别对应于新闻内容、推广内容和用户信息的多个初始向量。
[0207]
第二生成子模块,用于根据引用关系、转载关系、发布关系和关注关系,生成邻接矩阵。
[0208]
第三生成子模块,用于根据多个初始向量和邻接矩阵,生成包括异构图的训练样本。
[0209]
根据本公开的实施例,第一生成子模块可以包括第一获取单元、第二获取单元、第一生成单元、第三获取单元、第一得到单元、第二生成单元和第二得到单元。
[0210]
第一获取单元,用于在新闻内容包括文本信息的情况下,利用段落向量方法获取文本信息的文本向量。
[0211]
第二获取单元,用于在新闻内容包括图像信息的情况下,利用局部二值方法获取图像信息的图像向量。
[0212]
第一生成单元,用于根据文本向量和/或图像向量,生成对应于新闻内容的初始向量。
[0213]
第三获取单元,用于在推广内容包括原创内容的情况下,利用段落向量方法获取原创内容的原创向量。
[0214]
第一得到单元,用于在推广内容包括转载内容的情况下,利用段落向量方法处理与转载内容对应的用户观点,得到转载向量。
[0215]
第二生成单元,用于根据原创向量和/或转载向量,生成对应于推广内容的初始向量。
[0216]
第二得到单元,用于利用段落向量方法处理用户信息,得到对应于用户信息的初始向量。
[0217]
根据本公开的实施例,图像信息包括多个图像元素以及与每个图像元素对应的像素值。
[0218]
根据本公开的实施例,第二获取单元可以包括得到子单元和归一化子单元。
[0219]
得到子单元,用于针对每个图像元素,利用局部二值方法处理图像元素的像素值和与图像元素相关的图像元素的像素值,得到图像元素的局部二值。
[0220]
归一化子单元,用于对多个局部二值进行归一化处理,得到图像信息的图像向量。
[0221]
根据本公开的实施例,异构图神经网络包括第一注意力机制层、第二注意力机制层、全连接层和归一化层。
[0222]
根据本公开的实施例,预测模块520可以包括得到子模块、第一处理子模块、第一确定子模块、第二处理子模块、第二确定子模块、第三处理子模块和归一化子模块。
[0223]
得到子模块,用于根据异构图,得到节点特征矩阵和节点关系矩阵,其中,节点关系矩阵包括邻接矩阵,节点特征矩阵包括多个新闻节点,节点关系矩阵包括多个新闻节点之间的节点关系,多个新闻节点包括分别对应于新闻内容、推广内容和用户信息的多个初始向量。
[0224]
第一处理子模块,用于针对每个新闻节点,利用第一注意力机制层处理新闻节点和与新闻节点相关的节点关系,得到第一注意力值。
[0225]
第一确定子模块,用于根据新闻节点的节点关系确定与新闻节点相关的关联新闻节点。
[0226]
第二处理子模块,用于利用第二注意力机制层处理第一注意力值、关联新闻节点,得到新闻节点的第二注意力值。
[0227]
第二确定子模块,用于根据多个第二注意力值和图网络计算公式,确定第一特征向量。
[0228]
第三处理子模块,用于利用全连接层处理多个第一特征向量,得到第二特征向量。
[0229]
归一化子模块,用于利用归一化层处理第二特征向量,得到预测结果。
[0230]
根据本公开的实施例,虚假新闻判别模型的训练装置还可以包括第三获取模块、验证模块、对比模块和确定模块。
[0231]
第三获取模块,用于获取新闻验证样本集,其中,新闻验证样本集包括多个验证样本和与验证样本对应的验证标签数据,其中,验证样本包括根据与验证新闻相关的验证节点和验证节点关系生成的验证异构图,验证节点包括分别对应于验证新闻内容、验证推广内容和验证用户信息的多个验证初始向量,验证节点关系包括根据验证关联关系和验证关注关系生成的验证邻接矩阵。
[0232]
验证模块,用于将多个验证样本均输入虚假新闻判别模型,输出验证结果,其中,验证结果包括分别与每个验证样本对应的验证分结果。
[0233]
对比模块,用于将预测结果和多个验证标签数据进行匹配对比,得到对比结果。
[0234]
确定模块,用于在对比结果表明多个验证分结果中与验证标签数据相同的验证分结果的数量占比满足预设占比的情况下,将虚假新闻判别模型确定为目标虚假新闻判别模型。
[0235]
图6示意性示出了根据本公开的实施例的虚假新闻判别装置的框图。
[0236]
如图6所示,虚假新闻判别装置600可以包括第二获取模块610、生成模块620和识别模块630。
[0237]
第二获取模块610,用于获取待判别新闻数据集,其中,待判别新闻数据集包括目标新闻、分别与目标新闻相关的目标推广内容、目标用户信息、目标关联关系和目标关注关系。
[0238]
生成模块620,用于根据待判别新闻数据集,生成待识别异构图。
[0239]
识别模块630,用于将待识别异构图输入虚假新闻判别模型,输出识别结果,识别结果用于表征目标新闻的真假类型,其中,虚假新闻判别模型是利用如上所述的方法训练得到的。
[0240]
根据本公开的实施例,通过利用与新闻对应的关联关系和关注关系构成的节点关系以及对应于新闻内容、推广内容和用户信息的多个初始向量构成的节点,根据由节点和节点关系构成的训练样本对异构图神经网络进行训练得到的虚假新闻判别模型,由于训练样本充分考虑了与新闻内容相关的节点关系,因此训练得到的虚假新闻判别模型对待识别新闻的识别结果能够较为准确地确定其是否为虚假新闻,从而至少部分地克服了不能准确地识别虚假新闻,从而容易对用户的认知造成影响的技术问题。
[0241]
根据本公开的实施例,目标关联关系包括目标引用关系、目标转载关系和目标发布关系。
[0242]
根据本公开的实施例,生成模块620可以包括第四生成子模块、第五生成子模块和第六生成子模块。
[0243]
第四生成子模块,用于根据目标新闻、目标推广内容、目标用户信息,生成分别对应于目标新闻、目标推广内容、目标用户信息的多个目标向量。
[0244]
第五生成子模块,用于根据目标引用关系、目标转载关系、目标发布关系和目标关注关系,生成目标邻接矩阵。
[0245]
第六生成子模块,用于根据多个目标向量和目标邻接矩阵,生成待识别异构图。
[0246]
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(field programmable gate array,fpga)、可编程逻辑阵列(programmable logic arrays,pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(application specific integrated circuit,asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0247]
例如,第一获取模块510、预测模块520、计算模块530和迭代模块540,或第二获取模块610、生成模块620和识别模块630中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,第一获取模块510、预测模块520、计算模块530和迭代模块540,或第二获取模块610、生成模块620和识别模块630中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当
组合来实现。或者,第一获取模块510、预测模块520、计算模块530和迭代模块540,或第二获取模块610、生成模块620和识别模块630中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0248]
需要说明的是,本公开的实施例中虚假新闻判别模型的训练装置或虚假新闻判别装置部分与本公开的实施例中虚假新闻判别模型的训练方法或虚假新闻判别方法部分是相对应的,虚假新闻判别模型的训练装置或虚假新闻判别装置部分的描述具体参考虚假新闻判别模型的训练方法或虚假新闻判别方法部分,在此不再赘述。
[0249]
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0250]
如图7所示,根据本公开实施例的电子设备700包括处理器701,其可以根据存储在只读存储器(read-only memory,rom)702中的程序或者从存储部分708加载到随机访问存储器(random access memory,ram)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0251]
在ram 703中,存储有电子设备700操作所需的各种程序和数据。处理器701、rom 702以及ram 703通过总线704彼此相连。处理器701通过执行rom 702和/或ram 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 702和ram 703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0252]
根据本公开的实施例,电子设备700还可以包括输入/输出(i/o)接口705,输入/输出(i/o)接口705也连接至总线704。系统700还可以包括连接至i/o接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0253]
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0254]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/
系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0255]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom(erasable programmable read only memory,eprom)或闪存)、便携式紧凑磁盘只读存储器(computer disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0256]
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 702和/或ram 703和/或rom 702和ram 703以外的一个或多个存储器。
[0257]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的虚假新闻判别模型的训练方法或虚假新闻判别方法。
[0258]
在该计算机程序被处理器701执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0259]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分709被下载和安装,和/或从可拆卸介质711被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0260]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c ,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0261]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组
合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0262]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献