一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种广告处理方法、装置和电子设备与流程

2022-06-25 09:18:25 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,具体而言,涉及一种广告处理方法、装置和电子设备。


背景技术:

2.目前,在线广告投放活动中,广告平台对广告内容都有一定的审核,以使广告可以在不违规的情况下投放出来。但由于广告主对平台规则的不了解、以及平台规则本身的模糊性,使得新上架的广告常常因为各种原因违规遭到平台的下架,从而产生损失。


技术实现要素:

3.为解决上述问题,本发明实施例的目的在于提供一种广告处理方法、装置和电子设备。
4.第一方面,本发明实施例提供了一种广告处理方法,包括:
5.获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
6.通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
7.获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;
8.当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
9.当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
10.第二方面,本发明实施例还提供了一种广告处理装置,包括:
11.获取模块,用于获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
12.训练模块,用于通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
13.检测模块,用于获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的
词语;
14.处理模块,用于当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
15.判定模块,用于当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
16.第三方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。
17.第四方面,本发明实施例还提供了一种电子设备,所述电子设备包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行上述第一方面所述的方法的步骤。
18.本发明实施例上述第一方面至第四方面提供的方案中,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,与相关技术中广告主无法对广告是否违规进行判断的方式相比,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
19.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
20.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1示出了本发明实施例1所提供的一种广告处理方法的流程图;
22.图2示出了本发明实施例2所提供的一种广告处理装置的结构示意图;
23.图3示出了本发明实施例3所提供的一种电子设备的结构示意图。
具体实施方式
24.在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
25.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
26.在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
27.目前,在线广告投放活动中,广告平台对广告内容都有一定的审核,以使广告可以在不违规的情况下投放出来。但由于广告主对平台规则的不了解、以及平台规则本身的模糊性,使得新上架的广告常常因为各种原因违规遭到平台的下架,从而产生损失。
28.基于此,本实施例提出一种广告处理方法、装置和电子设备,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
29.为使本技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本技术做进一步详细的说明。
30.实施例1
31.本实施例提出一种广告处理方法,执行主体是广告主使用的服务器。
32.参见图1所示的一种广告处理方法的流程图,本实施例提出一种广告处理方法,包括以下具体步骤:
33.步骤100、获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本。
34.在上述步骤100中,所述违规广告和所述正常投放广告都是存储在所述服务器中的数据库中的。
35.所述违规广告和所述正常投放广告,均是文本形式的广告。
36.为了利用所述违规广告得到模型训练负样本,可以执行以下过程:从所述违规广告中提取出违规广告的标题和文字,并对违规广告的标题和文字进行拼接,得到作为模型训练负样本的违规广告的广告文本。
37.从所述违规广告中提取出违规广告的标题和文字的过程是现有技术,这里不再赘述。
38.对违规广告的标题和文字进行拼接,得到作为模型训练负样本的违规广告的广告文本的过程是现有技术,这里不再赘述。
39.利用所述正常投放广告得到模型训练正样本的过程与上述利用所述违规广告得到模型训练负样本的过程类似,这里不再赘述。
40.步骤102、通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型。
41.在上述步骤102中,可以先对所述模型训练负样本和模型训练负样本进行分词操作,分别得到所述模型训练负样本中的词语以及所述模型训练负样本中的词语。然后利用分别得到的所述模型训练负样本中的词语以及所述模型训练负样本中的词语对文本分类算法模型进行训练,得到广告文本分类模型。
42.所述词语,包括:单词和词组。
43.步骤104、获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语。
44.在上述步骤104中,所述品牌名称集合中所包括的品牌名称,是从电商平台上利用爬虫技术获取到的。
45.所述品牌名称集合,存储在所述服务器中。
46.在获取到品牌名称后,工作人员会对其中即有品牌含义又有非品牌含义的品牌名称进行标注,将即有品牌含义又有非品牌含义的品牌名称确定为多含义词语。
47.那么,在经过工作人员标注后,所述品牌名称集合会包括:品牌名称和多含义词语。多含义词语携带有多含义标识;而品牌名称没有携带多含义标识。
48.在一个实施方式中,所述多含义词语,包括但不限于:苹果和巴塔哥尼亚。
49.所述广告文本中的词语是通过对所述广告文本进行分词后得到的。对文本进行分词的过程是现有技术,这里不再赘述。
50.步骤106、当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值。
51.在上述步骤106中,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值的过程是现有技术,这里不再赘述。
52.所述第一概率值,可以设置为0.5至0.8之间的任意数值,这里不再一一赘述。
53.步骤108、当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
54.在执行完上述步骤108后,若未能从所述广告文本查询出属于品牌名称集合的词语时,就直接将所述广告文本的词语输入到广告文本分类模型中,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的概率。
55.当所述广告文本是违规广告文本的概率大于所述概率阈值时,将所述广告文本判定为违规广告文本。
56.以上内容,对广告文本是否为违规广告文本进行判定的过程进行了说明。
57.进一步地,为了对广告图像是否违规进行判定,本实施例提出的广告处理方法,还可以执行以下步骤(1)至步骤(11):
58.(1)当获取到待检测的广告图像时,利用光学字符识别技术(optical character recognition,ocr)提取所述广告图像中的文字,将提取出的文字确定为广告图像的文本;
59.(2)将所述广告图像的文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的品牌名称时,确定所述广告图像中包含违规词语;
60.(3)当从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告图像的文本进行处理,得到所述广告图像的文本包含违规词语的违规概率值;
61.(4)当所述违规概率值大于概率阈值时,确定所述广告图像中包含违规词语;
62.(5)当利用广告文本分类模型确定广告图像未包含违规词语时,获取带有品牌标志的图片和带有所述品牌标志的图片的图片信息,所述带有所述品牌标志的图片的图片信息,包括:所述图片中的品牌标志所属的品牌名称和品牌标志在图片中的位置信息;
63.(6)利用带有品牌标志的图片和带有所述品牌标志的图片的图片信息对目标检测模型进行训练,得到品牌标志的检测器;
64.(7)将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,得到未包含违规词语的广告图像中具有品牌标志的第二概率值;
65.(8)获取品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像以及正常投放广告中的图像,利用所述品牌款式图像类型的违规图像、所述著名人物图像类型的违规图像、所述漫画人物图像类型的违规图像和所述正常投放广告中的图像对图像分类模型进行训练,得到图片分类器;
66.(9)将未包含违规词语的广告图像输入到所述图片分类器中进行处理,得到所述未包含违规词语的广告图像的图像类型以及第三概率值;
67.(10)通过以下公式对未包含违规词语的广告图像的违规概率值进行计算:
68.s=2*s1*s2/(s1 s2)
69.其中,s表示违规概率值;s1表示第二概率值;s2表示第三概率值;
70.(11)当计算得到的所述违规概率值大于所述概率阈值时,判定所述未包含违规词语的广告图像是违规广告。
71.在上述步骤(2)中,所述广告图像的文本中的词语,是通过对所述广告图像的文本中的分词得到的。
72.在上述步骤(5)中,所述带有品牌标志的图片,是工作人员从互联网中搜索到的,然后将搜索到的所有的带有品牌标志的图片转换到同一个分辨率下,并将转换分辨率后的
带有品牌标志的图片展示给工作人员,由工作人员确定出图片所携带的品牌标志所属的品牌名称,然后工作人员将图片所携带的品牌标志标识出来,之后将品牌标志被标识出的图片输入到运行在上述服务器中的图片处理软件中,得到图片中携带的品牌标志在图片中的位置信息。
73.图片中携带的品牌标志在图片中的位置信息,就是上述品牌标志在图片中的位置信息。
74.在得到图片中携带的品牌标志在图片中的位置信息后,将带有品牌标志的图片、以及作为带有所述品牌标志的图片的图片信息的图片中品牌标志在图片中的位置信息和图片中的品牌标志所属的品牌名称关联到一起,并将关联后的带有品牌标志的图片以及带有所述品牌标志的图片的图片信息存储在所述服务器中。
75.在上述步骤(6)中,利用带有品牌标志的图片和带有所述品牌标志的图片的图片信息对目标检测模型进行训练,得到品牌标志的检测器的具体过程是现有技术,这里不再一一赘述。
76.在一个实施方式中,所述目标检测模型,运行在服务器中;所述目标检测模型,可以采用yolov4模型。
77.在上述步骤(7)中,将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,会得到未包含违规词语的广告图像中品牌标志是目标检测模型已知各个品牌标志的概率值,服务器从得到的概率值中,选择最大的概率值作为未包含违规词语的广告图像中具有品牌标志的第二概率值。
78.将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,会得到未包含违规词语的广告图像中品牌标志是目标检测模型已知各个品牌标志的概率值的具体过程是现有技术,这里不再赘述。
79.而且,将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,会得到未包含违规词语的广告图像中品牌标志是目标检测模型已知各个品牌标志的概率值的同时,还可以输出未包含违规词语的广告图像中品牌标志的位置信息。
80.在上述步骤(8)中,品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像以及正常投放广告中的图像都是从数据库中存储的违规广告的广告图像中得到的。
81.所述数据库中,包括:违规图像和正常投放广告中的图像。
82.所述违规图像携带有图像类型,所述图像类型,包括:品牌款式图像类型、著名人物图像类型和漫画人物图像类型。
83.为了根据品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像训练图片分类器,需要从正常投放广告中的图像中分别选择与品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像对应的图像样本,如:著名人物图像类型的违规图像含有明星肖像,那么与著名人物图像类型的违规图像对应的图像样本,就是正常投放广告中的普通人物图像;品牌款式图像类型的违规图像,那么与品牌款式图像类型的违规图像对应的图像样本,就是正常投放广告中和品牌款式图像类型的违规图像指示商品的商品类型相同的一般商品的商品图像。
84.然后分别将品牌款式图像类型的违规图像和与其对应的图像样本、著名人物图像
类型的违规图像和与其对应的图像样本、漫画人物图像类型的违规图像和与其对应的图像样本输入到图像分类模型中,对图像分类模型进行训练,得到图片分类器,具体的训练过程是现有技术,这里不再赘述。
85.在一个实施方式中,所述图像分类模型,可以采用efficientnet模型。
86.在上述步骤(9)中,所述未包含违规词语的广告图像的图像类型,就是图片分类器已知的各所述图像类型中最大概率值对应的图像类型,并将该最大概率值确定为第三概率值。
87.可选地,在通过以上步骤(1)至步骤(11)对广告图像是否违规进行判定之外,本实施例提出的广告处理方法,还可以执行以下步骤(1)至步骤(4),对广告视频是否违规进行判定:
88.(1)当获取到待检测的广告视频时,利用关键帧提取技术对所述广告视频中的视频关键帧进行提取;
89.(2)将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除,并按照预设时间间隔从已删除位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧的剩余的视频关键帧中提取出待检测的多个视频关键帧;
90.(3)对待检测的多个视频关键帧中的各视频关键帧进行违规判定,得到各视频关键帧的违规判定结果;其中,所述违规判定结果,包括:包含违规词语的视频关键帧以及被判定为违规广告的视频关键帧;
91.(4)当所述违规判定结果指示各视频关键帧中具有包含违规词语的视频关键帧或者各视频关键帧中具有被判定为违规广告的视频关键帧时,确定所述广告视频为违规广告。
92.在上述步骤(1)中,利用关键帧提取技术对所述广告视频中的视频关键帧进行提取的具体过程是现有技术,这里不再赘述。所述视频关键帧携带有时间戳。
93.所述视频关键帧,携带有时间戳。
94.在上述步骤(2)中,根据所述视频关键帧中携带的时间戳指示的时间,将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除。
95.按照视频关键帧的时间戳指示时间从小到大的顺序,对删除首尾视频关键帧后剩余的视频关键帧进行排序,并按照预设时间间隔从排序后的剩余的视频关键帧中提取出待检测的多个视频关键帧。
96.在一个实施方式中,预设时间间隔可以设置为2秒至5秒之间的任意时长,这里不再一一赘述。
97.在上述步骤(3)中,一个视频关键帧,可以看作是一张广告图像。
98.对待检测的多个视频关键帧中的各视频关键帧进行违规判定的过程,与上述步骤(1)至步骤(11)对广告图像是否违规进行判定的过程类似,这里不再赘述。
99.综上所述,本实施例提出一种广告处理方法,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广
告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,与相关技术中广告主无法对广告是否违规进行判断的方式相比,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
100.实施例2
101.本实施例提出一种广告处理装置,用于执行上述实施例1提出的广告处理装置。
102.参见图2所示的一种广告处理装置的结构示意图,本实施例提出一种广告处理装置,包括:
103.获取模块200,用于获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
104.训练模块202,用于通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
105.检测模块204,用于获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;
106.处理模块206,用于当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
107.判定模块208,用于当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
108.本实施例提出一种广告处理装置,还包括:广告图像检测模块。
109.所述广告图像检测模块,具体用于:
110.当获取到待检测的广告图像时,利用光学字符识别技术ocr提取所述广告图像中的文字,将提取出的文字确定为广告图像的文本;
111.将所述广告图像的文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的品牌名称时,确定所述广告图像中包含违规词语;
112.当从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告图像的文本进行处理,得到所述广告图像的文本包含违规词语的违规概率值;
113.当所述违规概率值大于概率阈值时,确定所述广告图像中包含违规词语。
114.所述广告图像检测模块,还具体用于:
115.当利用广告文本分类模型确定广告图像未包含违规词语时,获取带有品牌标志的图片和带有所述品牌标志的图片的图片信息,所述带有所述品牌标志的图片的图片信息,包括:所述图片中的品牌标志所属的品牌名称和品牌标志在图片中的位置信息;
116.利用带有品牌标志的图片和带有所述品牌标志的图片的图片信息对目标检测模型进行训练,得到品牌标志的检测器;
117.将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,得到未包含违规词语的广告图像中具有品牌标志的第二概率值;
118.获取品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像以及正常投放广告中的图像,利用所述品牌款式图像类型的违规图像、所述著名人物图像类型的违规图像、所述漫画人物图像类型的违规图像和所述正常投放广告中的图像对图像分类模型进行训练,得到图片分类器;
119.将未包含违规词语的广告图像输入到所述图片分类器中进行处理,得到所述未包含违规词语的广告图像的图像类型以及第三概率值;所述图像类型,包括:品牌款式图像类型、著名人物图像类型和漫画人物图像类型;
120.通过以下公式对未包含违规词语的广告图像的违规概率值进行计算:
121.s=2*s1*s2/(s1 s2)
122.其中,s表示违规概率值;s1表示第二概率值;s2表示第三概率值;
123.当计算得到的所述违规概率值大于所述概率阈值时,判定所述未包含违规词语的广告图像是违规广告。
124.还包括:广告视频检测模块。
125.本实施例提出一种广告处理装置,还包括:广告视频检测模块。所述广告视频检测模块,具体用于:
126.当获取到待检测的广告视频时,利用关键帧提取技术对所述广告视频中的视频关键帧进行提取;
127.将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除,并按照预设时间间隔从已删除位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧的剩余的视频关键帧中提取出待检测的多个视频关键帧;
128.对待检测的多个视频关键帧中的各视频关键帧进行违规判定,得到各视频关键帧的违规判定结果;其中,所述违规判定结果,包括:包含违规词语的视频关键帧以及被判定为违规广告的视频关键帧;
129.当所述违规判定结果指示各视频关键帧中具有包含违规词语的视频关键帧或者各视频关键帧中具有被判定为违规广告的视频关键帧时,确定所述广告视频为违规广告。
130.综上所述,本实施例提出一种广告处理装置,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一
致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,与相关技术中广告主无法对广告是否违规进行判断的方式相比,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
131.实施例3
132.本实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例1描述的广告处理方法的步骤。具体实现可参见方法实施例1,在此不再赘述。
133.此外,参见图3所示的一种电子设备的结构示意图,本实施例还提出一种电子设备,上述电子设备包括总线51、处理器52、收发机53、总线接口54、存储器55和用户接口56。上述电子设备包括有存储器55。
134.本实施例中,上述电子设备还包括:存储在存储器55上并可在处理器52上运行的一个或者一个以上的程序,经配置以由上述处理器执行上述一个或者一个以上程序用于进行以下步骤(1)至步骤(5):
135.(1)获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
136.(2)通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
137.(3)获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;
138.(4)当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
139.(5)当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
140.收发机53,用于在处理器52的控制下接收和发送数据。
141.其中,总线架构(用总线51来代表),总线51可以包括任意数量的互联的总线和桥,总线51将包括由处理器52代表的一个或多个处理器和存储器55代表的存储器的各种电路链接在一起。总线51还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本实施例不再对其进行进一步描述。总线接口54在总线51和收发机53之间提供接口。收发机53可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发机53从其他设备接收外部数据。收发机53用于将处理器52处理后的数据发送给其他设备。取决于计算系统的性质,还可以提供用户接口56,例如小键盘、显示器、扬声器、麦克风、操纵杆。
142.处理器52负责管理总线51和通常的处理,如前述上述运行通用操作系统。而存储器55可以被用于存储处理器52在执行操作时所使用的数据。
143.可选的,处理器52可以是但不限于:中央处理器、单片机、微处理器或者可编程逻辑器件。
144.可以理解,本发明实施例中的存储器55可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本实施例描述的系统和方法的存储器55旨在包括但不限于这些和任意其它适合类型的存储器。
145.在一些实施方式中,存储器55存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:操作系统551和应用程序552。
146.其中,操作系统551,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序552,包含各种应用程序,例如媒体播放器(media player)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序552中。
147.综上所述,本实施例提出一种计算机可读存储介质和电子设备,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,与相关技术中广告主无法对广告是否违规进行判断的方式相比,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
148.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献