一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种违规广告处理方法、装置和电子设备与流程

2022-05-26 18:35:57 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,具体而言,涉及一种违规广告处理方法、装置和电子设备。


背景技术:

2.目前,每天投放的广告中,往往有大量的违规广告被投放出去,造成不良影响,为了发现每天投放的广告中的违规广告,需要对投放的广告内容进行审查,现在通常是由人工对违规广告进行审查,审查效率低。


技术实现要素:

3.为解决上述问题,本发明实施例的目的在于提供一种违规广告处理方法、装置和电子设备。
4.第一方面,本发明实施例提供了一种违规广告处理方法,包括:
5.获取新投放的多个广告;
6.将所述多个广告中内容相似的广告分为一组,得到至少两个广告分组,其中,所述至少两个广告分组中的各广告分组分别包括:至少两个相似的广告;
7.当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记。
8.第二方面,本发明实施例还提供了一种违规广告处理装置,包括:
9.获取模块,用于获取新投放的多个广告;
10.分组模块,用于将所述多个广告中内容相似的广告分为一组,得到至少两个广告分组,其中,所述至少两个广告分组中的各广告分组分别包括:至少两个相似的广告;
11.处理模块,用于当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记。
12.第三方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。
13.第四方面,本发明实施例还提供了一种电子设备,所述电子设备包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行上述第一方面所述的方法的步骤。
14.本发明实施例上述第一方面之地方面提供的方案中,将新投放发的广告中相似的广告进行分组,得到由相似的广告组成的广告分组,当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,与相关技术中由人工对违规广告进行审查的方式相比,可以通过将新投放发的广告中相似的广告进行分组,并当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,从而可以以组为单位进行违规广告的审查,大大提高了违规广告的处理效率。
15.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1示出了本发明实施例1所提供的一种违规广告处理方法的流程图;
18.图2示出了本发明实施例2所提供的一种违规广告处理装置的结构示意图;
19.图3示出了本发明实施例3所提供的一种电子设备的结构示意图。
具体实施方式
20.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
21.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
22.在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
23.目前,每天投放的广告中,往往有大量的违规广告被投放出去,造成不良影响,为了发现每天投放的广告中的违规广告,需要对投放的广告内容进行审查,现在通常是由人工对违规广告进行审查,审查效率低。
24.基于此,本实施例提出一种违规广告处理方法、装置和电子设备,将新投放发的广告中相似的广告进行分组,得到由相似的广告组成的广告分组,当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,从而可以以组为单位进行违规广告的审查,大大提高了违规广告的处理效率。
25.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术做进一步详细的说明。
26.实施例1
27.本实施例提出一种违规广告处理方法的执行主体是服务器。
28.参见图1所示的一种违规广告处理方法的流程图,本实施例提出一种违规广告处
理方法,包括以下具体步骤:
29.步骤100、获取新投放的多个广告。
30.上述步骤100中,所述服务器将距离上次进行违规广告处理的时间长度达到预设时长时,从广告系统中获取上次进行违规广告处理的时间点到当前的时间点之间,在广告系统上新投放的多个广告。
31.所述广告系统,可以运行在所述服务器中,也可以运行在与所述服务器进行交互的计算设备中。
32.所述多个广告中的各广告,都是以视频为主要内容的广告。
33.步骤102、将所述多个广告中内容相似的广告分为一组,得到至少两个广告分组,其中,所述至少两个广告分组中的各广告分组分别包括:至少两个相似的广告。
34.在上述步骤102中,为了将所述多个广告中内容相似的广告分为一组,包括以下具体步骤(1)至步骤(5):
35.(1)分别提取多个所述广告中各广告的文本信息,并利用word2vec模型对各广告的文本信息进行处理,得到各广告的文本特征向量;
36.(2)分别提取各广告的图片信息,并利用inceptionv3模型对各广告的图片信息进行处理,得到各广告的图片特征向量;
37.(3)分别提取各广告的视频帧,对各广告的所述视频帧进行处理,得到各广告的视频特征向量;
38.(4)分别计算各广告之间的文本特征向量的第一相似度、各广告之间的图片特征向量的第二相似度、以及各广告之间的视频特征向量的第三相似度;
39.(5)将各广告中所述第一相似度、所述第二相似度以及所述第三相似度均大于相似度阈值的广告确定为内容相似的广告,并将所述内容相似的广告分到同一个广告分组中。
40.在上述步骤(1)中,分别提取多个所述广告中各广告的文本信息的具体过程是现有技术,这里不再赘述。
41.在得到各广告的文本信息后,首先,利用在所述服务器自身运行的翻译软件,将各广告的文本信息翻译成英文文本信息;然后,将各广告的英文文本信息输入到所述word2vec模型中,利用word2vec模型对各广告的英文文本信息进行处理,得到各广告的文本特征向量。
42.利用word2vec模型对各广告的英文文本信息进行处理,得到各广告的文本特征向量的具体过程是现有技术,这里不再赘述。
43.在上述步骤(2)中,分别提取各广告的图片信息的具体过程是现有技术,这里不再赘述。
44.利用inceptionv3模型对各广告的图片信息进行处理,具体地,通过卷积操作(convolution layer)和池化(pooling layer)返回提取图片特征向量;2.通过全连接层(fully connected layers)优化特征值;3.利用特征值计算图片相似度将图片分类(classification);从而得到各广告的图片特征向量,而得到各广告的图片特征向的具体过程是现有技术,这里不再赘述。
45.在上述步骤(3)中,为了对各广告的所述视频帧进行处理,得到各广告的视频特征
向量,可以执行以下步骤(31)至步骤(34):
46.(31)按照各广告的播放顺序分别提取各广告的视频帧,并获取各广告的播放时长;
47.(32)将各广告中位于播放时长预设比例位置的视频帧提取出来,并提取出各广告的第一个视频帧和各广告的倒数第二个视频帧;
48.(33)利用inceptionv3模型分别对提取出的各广告中位于播放时长预设比例位置的视频帧、各广告的第一个视频帧、各广告的倒数第二个视频帧分别进行处理,得到各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各广告的倒数第二个视频帧的特征向量;
49.(34)计算各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各广告的倒数第二个视频帧的特征向量的平均值,将得到的计算结果作为各广告的视频特征向量。
50.在上述步骤(31)中,按照各广告的播放顺序分别提取各广告的视频帧的具体过程是现有技术,这里不再赘述。
51.各广告的播放时长是服务器从各广告中提取出来的,具体的提取过程是现有技术,这里不再赘述。
52.在上述步骤(32)中,所述服务器中,可以设置多个播放时长预设比例位置,那么需要将多个播放时长预设比例位置的视频帧都提取出来。
53.在一个实施方式中,播放时长预设比例位置,可以包括但不限于:播放时长10%的位置、播放时长20%的位置、播放时长30%的位置、播放时长40%的位置、播放时长50%的位置、播放时长60%的位置、播放时长70%的位置、播放时长80%的位置以及播放时长90%的位置。
54.当然,播放时长预设比例位置,还可以设置为播放时长其他比例的位置,这里不再一一赘述。
55.示例的,将各广告中位于播放时长预设比例位置的视频帧提取出来,就是将各广告中位于播放时长10%的位置的视频帧、播放时长20%的位置的视频帧、播放时长30%的位置的视频帧、播放时长40%的位置的视频帧、播放时长50%的位置的视频帧、播放时长60%的位置的视频帧、播放时长70%的位置的视频帧、播放时长80%的位置的视频帧以及播放时长90%的位置的视频帧提取出来。
56.服务器提取视频帧的具体过程是现有技术,这里不再赘述。
57.在上述步骤(33)中,利用inceptionv3模型分别对提取出的各广告中位于播放时长预设比例位置的视频帧、各广告的第一个视频帧、各广告的倒数第二个视频帧分别进行处理,得到各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各广告的倒数第二个视频帧的特征向量的具体实现过程是现有技术,这里不再赘述。
58.在上述步骤(34)中,计算各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各广告的倒数第二个视频帧的特征向量的平均值的具体过程是现有技术,这里不再赘述。
59.在上述步骤(4)中,计算各广告之间的文本特征向量的第一相似度时,可以通过计
算各广告的文本特征向量之间的余弦相似度,得到各广告之间的文本特征向量的第一相似度。
60.计算各广告的文本特征向量之间的余弦相似度的具体过程是现有技术,这里不再赘述。
61.各广告之间的图片特征向量的第二相似度和各广告之间的视频特征向量的第三相似度的具体计算过程,与各广告之间的文本特征向量的第一相似度的具体过程类似,这里不再一一赘述。
62.在上述步骤(5)中,所述相似度阈值,缓存在所述服务器中;所述相似度阈值,可以设置为0.6至0.9的任意数值,这里不再一一赘述。
63.在一个实施方式中,所述相似度阈值。可以设置为0.8。
64.就是说如果两个广告的所述第一相似度大于0.8、所述第二相似度大于0.8且所述第三相似度大于0.8,那么将这两个广告确定为内容相似的广告。
65.在通过上述步骤102完成相似广告的广告分组后,可以继续执行以下步骤104,对广告分组中的广告是否为违规广告进行判断。
66.步骤104、当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记。
67.具体地,上述步骤104可以执行以下步骤(1)至步骤(5):
68.(1)获取违规广告的文本特征向量、图片特征向量以及视频特征向量;
69.(2)从各所述广告分组的至少两个相似的广告中选择一个目标广告;
70.(3)计算各所述广告分组中所述目标广告的文本特征向量与所述违规广告的文本特征向量的第四相似度,计算各所述广告分组中所述目标广告的图片特征向量与所述违规广告的图片特征向量的第五相似度,并计算各所述广告分组中所述目标广告的视频特征向量与所述违规广告的视频特征向量的第六相似度;
71.(4)当所述第四相似度、所述第五相似度和所述第六相似度均大于违规图片相似度阈值时,确定所述广告分组中的目标广告被确定为违规广告;
72.(5)利用违规标识对所述目标广告所属的广告分组进行标记。
73.在上述步骤(1)中,所述违规广告的文本特征向量、图片特征向量以及视频特征向量存储在违规广告特征库中,所述违规广告特征库设置在所述服务器中。
74.在上述步骤(2)中,通过随机选择的方式,从各所述广告分组的至少两个相似的广告中选择一个目标广告。
75.在上述步骤(3)中,计算各所述广告分组中所述目标广告的文本特征向量与所述违规广告的文本特征向量的第四相似度,计算各所述广告分组中所述目标广告的图片特征向量与所述违规广告的图片特征向量的第五相似度,并计算各所述广告分组中所述目标广告的视频特征向量与所述违规广告的视频特征向量的第六相似度的具体过程,与上述步骤102中计算各广告之间的文本特征向量的第一相似度的具体过程类似,这里不再赘述。
76.在上述步骤(4)中,所述违规图片相似度阈值,可以设置为0.8至0.95之间的任意数值,
77.在一个实施方式中,所述违规图片相似度阈值,可以设置为0.9。
78.在上述步骤(5)中,所述违规标识,缓存在所述服务器中。
79.当广告分组被所述违规标识标记后,将被所述违规标识标记的广告分组中的广告发送给工作人员进行违规广告二次确认、确保违规广告识别的准确率;而且,只是将被所述违规标识标记的广告分组中的广告发送给工作人员进行确认,大大提高了违规广告的处理效率。
80.综上所述,本实施例提出一种违规广告处理方法,将新投放发的广告中相似的广告进行分组,得到由相似的广告组成的广告分组,当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,与相关技术中由人工对违规广告进行审查的方式相比,可以通过将新投放发的广告中相似的广告进行分组,并当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,从而可以以组为单位进行违规广告的审查,大大提高了违规广告的处理效率。
81.实施例2
82.本实施例提出一种违规广告处理装置,用于执行上述实施例1提出的违规广告处理方法。
83.参见图2所示的一种违规广告处理装置的结构示意图,本实施例提出一种违规广告处理装置,包括:
84.获取模块200,用于获取新投放的多个广告;
85.分组模块202,用于将所述多个广告中内容相似的广告分为一组,得到至少两个广告分组,其中,所述至少两个广告分组中的各广告分组分别包括:至少两个相似的广告;
86.处理模块204,用于当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记。
87.具体地,所述分组模块,用于将所述多个广告中内容相似的广告分为一组,包括:
88.分别提取多个所述广告中各广告的文本信息,并利用word2vec模型对各广告的文本信息进行处理,得到各广告的文本特征向量;
89.分别提取各广告的图片信息,并利用inceptionv3模型对各广告的图片信息进行处理,得到各广告的图片特征向量;
90.分别提取各广告的视频帧,对各广告的所述视频帧进行处理,得到各广告的视频特征向量;
91.分别计算各广告之间的文本特征向量的第一相似度、各广告之间的图片特征向量的第二相似度、以及各广告之间的视频特征向量的第三相似度;
92.将各广告中所述第一相似度、所述第二相似度以及所述第三相似度均大于相似度阈值的广告确定为内容相似的广告,并将所述内容相似的广告分到同一个广告分组中。
93.具体地,所述分组模块,用于分别提取各广告的视频帧,对各广告的所述视频帧进行处理,得到各广告的视频特征向量,包括:
94.按照各广告的播放顺序分别提取各广告的视频帧,并获取各广告的播放时长;
95.将各广告中位于播放时长预设比例位置的视频帧提取出来,并提取出各广告的第一个视频帧和各广告的倒数第二个视频帧;
96.利用inceptionv3模型分别对提取出的各广告中位于播放时长预设比例位置的视频帧、各广告的第一个视频帧、各广告的倒数第二个视频帧分别进行处理,得到各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各
广告的倒数第二个视频帧的特征向量;
97.计算各广告中位于播放时长预设比例位置的视频帧的特征向量、各广告的第一个视频帧的特征向量以及各广告的倒数第二个视频帧的特征向量的平均值,将得到的计算结果作为各广告的视频特征向量。
98.具体地,所述处理模块,具体用于:
99.获取违规广告的文本特征向量、图片特征向量以及视频特征向量;
100.从各所述广告分组的至少两个相似的广告中选择一个目标广告;
101.计算各所述广告分组中所述目标广告的文本特征向量与所述违规广告的文本特征向量的第四相似度,计算各所述广告分组中所述目标广告的图片特征向量与所述违规广告的图片特征向量的第五相似度,并计算各所述广告分组中所述目标广告的视频特征向量与所述违规广告的视频特征向量的第六相似度;
102.当所述第四相似度、所述第五相似度和所述第六相似度均大于违规图片相似度阈值时,确定所述广告分组中的目标广告被确定为违规广告;
103.利用违规标识对所述目标广告所属的广告分组进行标记。
104.综上所述,本实施例提出一种违规广告处理装置,将新投放发的广告中相似的广告进行分组,得到由相似的广告组成的广告分组,当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,与相关技术中由人工对违规广告进行审查的方式相比,可以通过将新投放发的广告中相似的广告进行分组,并当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,从而可以以组为单位进行违规广告的审查,大大提高了违规广告的处理效率。
105.实施例3
106.本实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例1描述的违规广告处理方法的步骤。具体实现可参见方法实施例1,在此不再赘述。
107.此外,参见图3所示的一种电子设备的结构示意图,本实施例还提出一种电子设备,上述电子设备包括总线51、处理器52、收发机53、总线接口54、存储器55和用户接口56。上述电子设备包括有存储器55。
108.本实施例中,上述电子设备还包括:存储在存储器55上并可在处理器52上运行的一个或者一个以上的程序,经配置以由上述处理器执行上述一个或者一个以上程序用于进行以下步骤(1)至步骤(3):
109.(1)获取新投放的多个广告;
110.(2)将所述多个广告中内容相似的广告分为一组,得到至少两个广告分组,其中,所述至少两个广告分组中的各广告分组分别包括:至少两个相似的广告;
111.(3)当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记。
112.收发机53,用于在处理器52的控制下接收和发送数据。
113.其中,总线架构(用总线51来代表),总线51可以包括任意数量的互联的总线和桥,总线51将包括由处理器52代表的一个或多个处理器和存储器55代表的存储器的各种电路链接在一起。总线51还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电
路链接在一起,这些都是本领域所公知的,因此,本实施例不再对其进行进一步描述。总线接口54在总线51和收发机53之间提供接口。收发机53可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发机53从其他设备接收外部数据。收发机53用于将处理器52处理后的数据发送给其他设备。取决于计算系统的性质,还可以提供用户接口56,例如小键盘、显示器、扬声器、麦克风、操纵杆。
114.处理器52负责管理总线51和通常的处理,如前述上述运行通用操作系统。而存储器55可以被用于存储处理器52在执行操作时所使用的数据。
115.可选的,处理器52可以是但不限于:中央处理器、单片机、微处理器或者可编程逻辑器件。
116.可以理解,本发明实施例中的存储器55可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本实施例描述的系统和方法的存储器55旨在包括但不限于这些和任意其它适合类型的存储器。
117.在一些实施方式中,存储器55存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:操作系统551和应用程序552。
118.其中,操作系统551,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序552,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序552中。
119.综上所述,本实施例提出一种计算机可读存储介质和电子设备,将新投放发的广告中相似的广告进行分组,得到由相似的广告组成的广告分组,当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,与相关技术中由人工对违规广告进行审查的方式相比,可以通过将新投放发的广告中相似的广告进行分组,并当广告分组中有一个广告被确定为违规广告时,利用违规标识对所述广告分组进行标记,从而可以以组为单位进行违规广告的审查,大大提高了违规广告的处理效率。
120.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献