一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

推送数据检测方法、装置、计算机设备和存储介质与流程

2021-10-23 03:43:00 来源:中国专利 TAG:互联网 推送 检测方法 装置 计算机


1.本技术涉及互联网技术领域,特别是涉及一种推送数据检测方法、装置、计算机设备和存储介质。


背景技术:

2.随着互联网技术的发展,人们开始通过互联网了解信息。目前,通过互联网平台进行信息的推送方便快捷,比如,通过视频网站推送视频,通过直播网站推送直播视频,通过新闻网站推送新闻,通过即时通讯应用发送朋友圈消息等等。目前,通过互联网进行信息推送,互联网平台都会对推送的信息进行检测,防止将禁止推送的信息进行推送,保证信息安全。目前,对推送的信息进行检测通常是根据专家意见进行检测,检测通过就进行推送,然而,通过专家意见进行检测的方法存在检测效率低下且准确性低的问题。


技术实现要素:

3.基于此,有必要针对上述技术问题,提供一种能够提高信息推送检测效率和准确性的信息推送检测方法、装置、计算机设备和存储介质。
4.一种信息推送检测方法,所述方法包括:
5.获取待检测信息,待检测信息包括待检测图像和待检测文本;
6.提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;
7.提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;
8.将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;
9.基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
10.一种信息推送检测装置,所述装置包括:
11.信息获取模块,用于获取待检测信息,待检测信息包括待检测图像和待检测文本;
12.第一特征确定模块,用于提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;
13.第二特征得到模块,用于提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;
14.第三特征得到模块,用于将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;
15.结果确定模块,用于基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
16.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理
器执行所述计算机程序时实现以下步骤:
17.获取待检测信息,待检测信息包括待检测图像和待检测文本;
18.提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;
19.提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;
20.将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;
21.基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
22.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
23.获取待检测信息,待检测信息包括待检测图像和待检测文本;
24.提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;
25.提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;
26.将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;
27.基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
28.上述信息推送检测方法、装置、计算机设备和存储介质,通过识别待检测图像目标对象区域中的目标对象的类别,根据目标对象的类别确定第一推送影响特征,并根据待检测图像中的图像文本通过预设关键词库得到第二推送影响特征,同时将待检测文本进行文本分类,根据待检测文本类别得到第三推送影响特征,然后根据第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果,即分别根据不同类型的数据得到对应的推送影响特征,然后根据不同的推送影响特征确定待检测信息对应的推送检测结果,提高了信息推送检测效率和准确性。
附图说明
29.图1为一个实施例中信息推送检测方法的应用环境图;
30.图2为一个实施例中信息推送检测方法的流程示意图;
31.图3为一个实施中得到第一推送影响特征的流程示意图;
32.图4为一个具体实施中得到第一推送影响特征的流程示意图;
33.图5为一个具体实施中检测酒类广告图像的流程示意图;
34.图6为一个实施中确定目标对象类别的流程示意图;
35.图7为一个具体实施中的注意力机制的结构示意图;
36.图8为一个实施中得到已训练的目标对象区域检测网络的流程示意图;
37.图9为一个实施中得到已训练的目标对象识别网络的流程示意图;
38.图10为一个实施中得到第二推送影响特征的流程示意图;
39.图11为一个具体实施中检测酒类广告图像中文本的流程示意图;
40.图12为一个实施中得到已训练的目标对象识别网络的流程示意图;
41.图13为一个实施中得到词频和逆序文件频率的流程示意图;
42.图14为一个具体实施中待检测文本分类模型的网络结构示意图;
43.图15为一个实施中得到推送检测结果的流程示意图;
44.图16为一个具体实施中信息推送检测方法的流程示意图;
45.图17为一个具体实施中信息推送检测方法的框架示意图;
46.图18为一个具体实施中信息推送检测方法的应用场景示意图;
47.图19为一个实施例中信息推送检测装置的结构框图;
48.图20为一个实施例中计算机设备的内部结构图。
具体实施方式
49.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
50.计算机视觉技术(computer vision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
51.自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
52.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
53.本技术实施例提供的方案涉及人工智能的图像处理、文本处理和深度学习等技术,具体通过如下实施例进行说明:
54.本技术提供的信息推送检测方法,可以应用于如图1所示的应用环境中。其中,终
端102通过网络与服务器104进行通信。服务器104获取终端102发送的待检测信息,待检测信息包括待检测图像和待检测文本;服务器104提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;服务器104提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;服务器104将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;服务器104基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
55.在一个实施例中,如图2所示,提供了一种信息推送检测方法,以该方法应用于图1中的服务器为例进行说明,可以理解的是,该方法也可以应用于终端,本实施例中,该方法包括以下步骤:
56.步骤202,获取待检测信息,待检测信息包括待检测图像和待检测文本。
57.其中,待检测信息是指需要进行推送的信息,比如,可以是广告、即时通讯应用朋友圈消息、新闻平台的新闻、视频网站的投稿和社交平台消息等等,新闻平台是用于发布新闻的平台,比如,新闻平台可以是网易新闻平台、百度新闻平台、uc新闻平台和各种新闻网站等等。社交平台是指用于进行社交的平台,比如,社交平台可以是微博应用平台、微信应用平台、视频网站平台等等。该待检测信息是多模态的信息,即待检测信息包括有多种不同形式的信息。待检测图像是指待检测信息中包括的图像,待检测图像可以有多个,该待检测图像也可以是从待检测信息中的视频中得到的图像。待检测文本是指待检测信息中包括的文本,该文本可以是待检测信息中的标题和文案等等。
58.具体地,服务器获取到待检测信息,该待检测信息可以是发送方需要推送给各个接收方的信息,其中,发送方可以是用户、企业、平台等能够推送信息的对象。接收方可以是用户等接收信息的对象。服务器可以从发送方终端获取到发送的待检测信息。待检测信息也可以是保存在数据库。服务器可以从数据库中获取到待检测信息,该数据库可以是服务器自身的数据库,也可以是第三方服务器中的数据库,当数据库是第三方服务器中的数据库时,说明服务器要对第三方需要推送的待检测信息进行推送检测。在一个实施例中,获取到待检测信息时,对待检测信息中的待检测图像和待检测文本进行预处理,比如,将待检测图像转换为固定大小的图像,将待检测文本进行分词去重等等。得到预设处理后的待检测图像和待检测文本,使用预设处理后的待检测图像和待检测文本进行后续的处理。
59.步骤204,提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征。
60.其中,目标对象是指待检测图像中的对象,该目标对象可以有多个,该目标对象可以是各种物体,比如各种广告商品、各种动植物和人体等等。目标对象区域是指存在有目标对象的图像区域。目标对象的类别是指目标对象所属的类别,比如,白酒属于酒类,不同的对象有不同的类别。目标对象的类别也可以是具体的目标对象标识,可以是名称、编号等等。推送影响特征是指影响推送检测结果的特征,包括推送正向影响特征和推送反向影响特征。推送正向影响特征是指能够使推送检测结果向推送进行影响的特征。推送反向影响
特征是指能够使推送检测结果向禁止推送进行影响的特征。第一推送影响特征是指根据待检测图像得到的推送影响特征。
61.具体地,服务器可以使用图像分割算法提取待检测图像中的目标对象区域,其中,图像分割算法用于将图像分词不同的区域并提取出感兴趣区域的算法,可以包括基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法、基于特定理论的分割方法和基于深度学习的分割等。服务器使用深度神经网络算法识别目标对象区域中目标对象的类别,比如,使用cnn(convolutional neural networks,卷积神经网络)算法。将目标对象的类别和预先设置好的推送影响对象的类别进行对比,根据对比结果得到待检测信息对应的第一推送影响特征。其中,当目标对象的类别和预先设置好推送反向影响对象的类别一致时,得到的第一推送影响特征为推送反向影响特征,当不一致时,得到的第一推送影响特征为推送正向影响特征。
62.步骤206,提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征。
63.其中,图像文本是指待检测图像中包含的文本,该文本可以是对待检测图像的说明解释。预设关键词库是指预先设置好的对推送进行影响的关键词的数据库,该预设关键词库可以是推送正向影响的关键词库,也可以是推送反向影响的关键词库。第二推送影响特征是指根据图像文本得到的推送影响特征。
64.具体地,服务器可以使用图像文字识别算法提取到待检测图像中的图像文本,其中,图像文字识别算法可以是ocr(optical character recognition,光学字符识别)算法、图像中文字定位识别算法和深度神经网络算法等等。然后将图像文本分词,得到分词结果,在预设关键词库中查找分词结果,根据查找结果确定匹配结果,根据匹配结果,得到待检测信息对应的第二推送影响特征。
65.步骤208,将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征。
66.其中,待检测文本分类模型是用于识别待检测文本对应的推送影响类别,推送影响类别包括推送正向影响类别和推送反向影响类别。根据推送正向影响类别得到推送正向影响特征,根据推送反向影响类别得到推送反向影响特征。该待检测文本分类模型是使用深度神经网络算法进行训练得到的。其中,深度神经网络算法可以是cnn算法。
67.具体地,服务器将待检测文本输入到待检测文本分类模型中进行文本分类,即将待检测文本输入到待检测文本分类模型的输入层转换成向量,将向量输入到待检测文本分类模型的卷积层进行卷积计算,将卷积计算结果输入到待检测文本分类模型的池化层进行池化,然后将池化结果通过全连接的方式输入到分类输出层进行分类并输出分类结果,即得到待检测文本类别。然后直接根据待检测文本类别得到待检测信息对应的第三推送影响特征。
68.步骤210,基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
69.其中,推送检测结果是指待检测信息是否进行推送的检测结果。
70.具体地,服务器可以将第一推送影响特征、第二推送影响特征和第三推送影响特输入到特征融合模型中进行是否进行推送的识别,得到特征融合模型输出的结果,即得到
了特征融合模型。特征融合模型是根据历史数据使用机器学习算法进行训练得到的模型,该历史数据中包括了历史待检测信息和对应的历史推送检测结果,根据历史待检测信息得到历史第一推送影响特征、历史第二推送影响特征和历史第三推送影响特,然后使用机器学习算法进行训练,当训练完成时,得到特征融合模型。其中,机器学习算法可以是线性回归算法、随机森林算法和神经网络算法等等。服务器也可以根据第一推送影响特征、第二推送影响特征和第三推送影响特征直接得到待检测信息对应的推送检测结果,从第一推送影响特征、第二推送影响特征和第三推送影响特征中确定推送反向影响特征的数量和推送正向影响特征的数量,根据推送反向影响特征的数量和推送正向影响特征的数量确定待检测信息对应的推送检测结果。
71.上述信息推送检测方法,通过识别待检测图像目标对象区域中的目标对象的类别,根据目标对象的类别确定第一推送影响特征,并根据待检测图像中的图像文本通过预设关键词库得到第二推送影响特征,同时将待检测文本进行文本分类,根据待检测文本类别得到第三推送影响特征,然后根据第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果,即分别根据不同类型的数据得到对应的推送影响特征,然后根据不同的推送影响特征确定待检测信息对应的推送检测结果,提高了信息推送检测效率和准确性。
72.在一个实施例中,如图3所示,步骤204,提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征,包括:
73.步骤302,将待检测图像输入到目标对象检测模型中,目标对象检测模型包括目标对象区域检测网络和目标对象识别网络。
74.其中,目标对象检测模型用于识别待检测图像中目标对象的类别,该目标对象检测模型是根据训练图像和对应的训练对象的类别使用深度神经网络进行训练得到的。目标对象区域检测网络用于从待检测图像中识别出感兴趣区域,该目标对象区域检测网络是目标对象检测模型中的部分网络,该目标对象区域检测网络是可以单独训练得到。目标对象识别网络用语识别待检测图像中感兴趣区域中目标对象的类别,该目标对象识别网络可以是目标对象检测模型红的部分网络,该目标对象识别网络也可以是单独训练得到。
75.具体地,服务器将待检测图像输入到目标对象检测模型中进行检测,即通过目标对象区域检测网络和目标对象识别网络之后得到目标对象的类别。
76.步骤304,根据目标对象区域检测网络检测待检测图像,得到目标对象区域。
77.其中,目标对象区域检测网络是根据用于目标检测的深度神经网络训练得到的,其中,用于目标检测的深度神经网络可以是ssd(single shot multibox detector)网络、cascade-rcnn(一种目标检测算法)网络、yolo(一种目标检测算法)网络、faster rcnn(一种目标检测算法)网络等等。目标对象区域是指存在目标对象的区域,该目标对象区域可以有多个,也可以只有一个。
78.具体地,服务器将待检测图像输入到目标对象区域检测网络中进行感兴趣区域的检测,得到目标对象区域。其中,通过使用cascade-rcnn网络进行检测,能够提高感兴趣区域定位准确率,进而提高整个模型性能。
79.步骤306,将目标对象区域输入到目标对象识别网络中进行识别,得到目标对象区
域中目标对象的类别。
80.其中,目标对象识别网络是根据用于进行对象识别的深度神经网络进行训练得到的。其中,该用于进行对象识别的深度神经网络可以是resnet(残差)网络、rcnn网络和fast rcnn网络等等。
81.具体地,服务器将目标对象区域输入到目标对象识别网络中进行识别,得到目标对象区域中目标对象的类别。当有多个目标对象区域时,将多个目标对象区域都输入到目标对象识别网络中进行识别,得到每个目标对象区域对应的目标对象类别。在一个实施例中,目标对象识别网络只用于识别禁止推送的目标对象的类别,减少识别的类别数量,提高识别的效率和准确性。
82.在一个具体的实施例中,如图4所示,为检测待检测图像的网络结构示意图,具体来说:待检测图像中包括有图像文本和目标对象的区域,将检测图像输入到目标对象检测模型中的ssd网络中,从待检测图像中得到感应趣的区域,即目标对象的区域。将目标对象的区域输入到目标对象检测模型resnet网络中,resnet网络引入了cbam模块,得到输入的目标对象区域中目标对象类别。例如,如图5所示,为对酒类广告中图像进行检测的示意图,其中,对待检测广告中的待检测图像使用目标对象检测模型进行检测时,通过目标对象区域检测网络检测得到酒瓶所在的区域,对酒瓶所在的区域进行识别,得到识别结果为酒类。
83.步骤308,将目标对象的类别与预设推送反向影响对象类别进行匹配,当匹配一致时,得到待检测信息对应的第一推送影响特征为第一推送反向影响特征。
84.步骤310,当匹配未一致时,得到待检测信息对应的第一推送影响特征为第一推送正向影响特征。
85.其中,预设推送反向影响对象类别是指预先设置好的禁止推送的对象类别,比如,广告图像中禁止推送酒类、手表类和成人用品类等对象,
86.具体地,服务器将得到的所有目标对象类别与预设推送反向影响对象类别进行匹配,当存在匹配一致的预设推送反向影响对象类别时,得到待检测信息对应的第一推送影响特征为第一推送反向影响特征。当未存在匹配一致的预设推送反向影响对象类别时,得到的待检测信息对应的第一推送影响特征为第一推送正向影响特征,即只有所有的目标对象的类别都不是推送反向影响对象类别时,得到的待检测信息对应的第一推送影响特征为第一推送正向影响特征。
87.在上述实施例中,通过使用目标对象检测模型来检测待检测图像中对应的目标对象的类别,提高了得到目标对象类别的准确性和效率,然后将目标对象的类别与预设推送反向影响对象类别进行匹配,得到第一推送影响特征,提高了得到的第一推送影响特征的准确性和效率。
88.在一个实施例中,如图6所示,步骤306,将目标对象区域输入到目标对象识别网络中进行识别,得到目标对象区域中目标对象的类别,包括:
89.步骤602,通过目标对象识别网络计算目标对象区域的区域特征、通道注意力特征和空间注意力特征。
90.其中,区域特征是指提取到的目标对象区域的特征,通道注意力特征是指根据区域特征的通道间的关系得到的特征,空间注意力特征是指根据区域特征的空间的关系得到的特征,是对通道注意力特征的补充。
91.具体地,服务器通过目标对象识别网络使用区域参数计算目标对象区域对应的区域特征,使用注意力机制模块中的通道注意力参数计算通道注意力特征,使用注意力机制模块中的空间注意力参数计算空间注意力特征。
92.步骤604,将通道注意力特征、空间注意力特征和区域特征进行组合,根据组合后的特征进行卷积计算,根据卷积计算结果进行分类识别确定目标对象区域中目标对象的类别。
93.其中,组合是指将特征进行组合在一起,可以将特征直接拼接,也可以进行特征之间的运算后得到组合后的特征,比如进行加法运算、点乘运算和乘积运算等等。
94.具体地,服务器将通道注意力特征、空间注意力特征和区域特征进行拼接,得到拼接后的特征,将拼接后的特征输入到卷积层进行卷积运算,根据卷积计算结果通过输出层进行分类识别,得到输出的概率,根据输出的概率确定目标对象区域中目标对象的类别。
95.在一个具体的实施例中,目标对象识别网络中包括了注意力机制模块,即包括cbam(convolutional block attention module,卷积块注意模块)模块,如图7所示,为注意力机制的结构示意图,具体来说:获取到上一个卷积块的输出特征作为输入特征f,使用输入特征f和通道注意力mc进行计算得到通道注意特征f’,使用通道注意特征f’和空间注意力ms进行计算得到空间注意力特征f”。然后根据空间注意力特征f”得到注意力记住模块的输出特征,将该输出特征作为下一个卷积块的输入特征继续进行计算。
96.在上述实施例中,通过计算区域特征、通道注意力特征和空间注意力特征,提高了对目标对象区域的表达能力,然后使用区域特征、通道注意力特征和空间注意力特征计算得到目标对象的类别,使得到的目标对象的类别更加准确。
97.在一个实施例中,如图8所示,目标对象区域检测网络的训练包括以下步骤:
98.步骤802,获取已标注目标对象区域的训练图像。
99.具体地,服务器获取到已标注目标对象区域的训练图像,已标注目标对象区域是指标注出训练图像中的目标对象,该目标对象可以是禁止推送的对象,也可以是能够进行推送的对象。服务器可以预先采集未标注的图像,然后进行标注后得到已标注目标对象区域的训练图像,其中,服务器可以从互联网采集未标注的图像进行标注,也可以从服务器数据库中获取到未标注的图像进行标注,服务器也可以从第三方数据平台中获取到已标注目标对象区域的训练图像,该第三方数据平台用于提供标注的训练图像。
100.步骤804,将已标注目标对象区域的训练图像输入到初始目标对象区域检测网络中检测,得到初始目标对象区域。
101.其中,初始目标对象区域检测网络是指网络参数初始化的目标对象区域检测网络。初始目标对象区域使用初始化的网络参数进行区域提取得到的目标对象区域。
102.具体地,服务器将已标注目标对象区域的训练图像输入到初始目标对象区域检测网络中检测,即将训练图像向量化,并将向量化后的训练图像使用初始化的网络参数进行图像区域划分,得到初始目标对象区域。
103.步骤806,计算初始目标对象区域与已标注目标对象区域的区域误差信息,根据区域误差信息更新初始目标对象区域检测网络中的网络参数。
104.步骤808,直到训练得到的区域误差信息符合预设第一训练完成条件时,得到已训练的目标对象区域检测网络。
105.其中,区域误差信息用于表示训练得到的目标对象区域和已标注的目标对象区域之间的误差。预设第一训练完成条件是指预先设置好的目标对象区域检测网络训练完成的条件,可以包括区域误差信息小于预设阈值或者训练迭代次数超过预先设置好的次数。
106.具体地,服务器使用预设损失函数计算初始目标对象区域与已标注目标对象区域的区域误差信息,其中,预设损失函数可以是交叉熵损失函数。并判断区域误差信息是否符合预设第一训练完成条件,该预设第一训练完成条件可以是误差信息是否小于预设阈值。预设第一训练完成条件也可以是训练迭代次数是否超过预设次数。当区域误差信息未符合预设第一训练完成条件时,根据区域误差信息使用反向传播算法进行反向传播,即更新初始目标对象区域检测网络中的网络参数,也可以使用梯度下降算法进行反向传播。得到更新网络参数的目标对象区域检测网络。将更新网络参数的目标对象区域检测网络作为初始目标对象区域检测网络,并返回步骤802继续进行迭代执行,直到训练得到的区域误差信息符合预设第一训练完成条件时,说明目标对象区域检测网络训练完成,得到已训练的目标对象区域检测网络。
107.在一个实施例中,如图9所示,目标对象识别网络的训练包括以下步骤:
108.步骤902,获取已标注目标对象区域的训练图像,从训练图像中提取已标注目标对象区域,并获取已标注目标对象区域对应的目标对象类别标签。
109.其中,目标对象类别标签是指真实的目标对象类别。
110.具体地,服务器获取到已标注目标对象区域的训练图像,使用已训练的目标对象区域检测网络提取到已标注目标对象区域,也可以直接对已标注目标对象区域的训练图像进行裁剪,得到已标注目标对象区域。同时获取到已标注目标对象区域对应的目标对象类别标签,可以是在标注目标对象区域时设置好目标对象类别标签。也可以是根据已标注目标对象区域从保证有类别标签的数据库中获取到的。
111.步骤904,将已标注目标对象区域输入到初始目标对象识别网络中进行分类,得到输出的训练目标对象类别概率,根据训练目标对象类别概率得到训练目标对象类别。
112.其中,初始目标对象识别网络是指网络参数初始化的目标对象识别网络,训练目标对象类别概率是指训练得到的目标对象类别的概率。
113.具体地,服务器将已标注目标对象区域到输入到初始目标对象识别网络中进行分类识别,即将已标注目标对象区域向量化,根据向量化后的已标注目标对象区域和初始化的网络参数计算得到各个目标对象类别概率,获取到最大的训练目标对象类别概率对应的目标对象类别作为训练目标对象类别。
114.步骤906,计算目标对象类别标签与训练目标对象类别的类别误差信息,基于类别误差信息更新初始目标对象识别网络中的网络参数。
115.步骤908,直到训练得到的类别误差信息达到预设第二训练完成条件时,得到已训练的目标对象识别网络。
116.其中,类别误差信息是指真实目标对象类别与训练得到的目标对象类别之间的误差。预设第二训练完成条件是指预先设置好的目标对象识别网络训练完成的条件,可以是类别误差信息是否小于预设类别误差阈值,或者是训练次数是否达到最大训练迭代次数。
117.具体地,服务器使用预先设置好损失函数计算目标对象类别标签与训练目标对象类别的类别误差信息,其中,损失函数可以是交叉熵损失函数。服务器判断类别误差信息是
否达到预设第二训练完成条件,当类别误差信息未达到预设第二训练完成条件时,根据类别误差信息使用反向传播算法进行反向传播,即更新初始目标对象识别网络中的网络参数,得到更新网络参数后的目标对象识别网络,将更新网络参数后的目标对象识别网络作为初始目标对象识别网络,并返回步骤902继续进行迭代执行,直到训练得到的类别误差信息达到预设第二训练完成条件时,说明训练得到的类别误差信息小于预设类别误差阈值或者训练次数达到最大训练迭代次数,则目标对象识别网络训练完成,即得到已训练的目标对象识别网络。
118.在上述实施例中,通过将目标对象检测模型中目标对象区域检测网络和目标对象识别网络分别进行训练,从而可以定向进行优化,比如,目标对象区域检测网络表现不佳时,可以单独优化该目标对象区域检测网络,或者当目标对象识别网络表现不佳时,可以单独优化该目标对象识别网络,提高了训练的准确性。
119.在一个实施例中,如图10所示,步骤206,提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征,包括:
120.步骤1002,通过图像文本识别算法提取待检测图像中的图像文本,将图像文本分词,得到各个待检测词。
121.其中,图像文本识别算法用于识别出图像中的文本,该图像文本识别算法可以包括
122.具体地,服务器通过图像文本识别算法提取待检测图像中的特征序列,获取特征序列对应的真实文本分布,将特征序列对应的真实文本分布进行去除整合等操作转换为各个待检测词。其中,图像文本识别算法包括crnn ocr(卷积循环神经网络光学字符识别)算法和attention ocr(注意力光学字符识别)算法。
123.步骤1004,将各个待检测词与预设关键词库中的推送反向影响关键词进行匹配。
124.其中,预设关键词库是存储送反向影响关键词的数据库。推送反向影响关键词是指对待检测信息是否进行推送有反向影响的关键词,即是禁止推送的关键词。
125.具体地,服务器在预设关键词库中的推送反向影响关键词中查找各个待检测词,当查找到与待检测词一致的推送反向影响关键词时,得到匹配一致的结果。当所有的待检测词都未在预设关键词库查找到时,得到匹配未一致的结果。
126.步骤1006,当匹配一致时,得到待检测信息对应的第二推送影响特征为第二推送反向影响特征。
127.步骤1008,当匹配未一致时,得到待检测信息对应的第二推送影响特征为第二推送正向影响特征。
128.其中,第二推送反向影响特征是指图像文本中包含有禁止推送待检测词时对应的推送影响特征。第二推送正向影响特征是指图像文本中未包含有禁止推送待检测词时对应的推送影响特征。
129.具体地,当匹配一致时,得到待检测信息对应的第二推送影响特征为第二推送反向影响特征。当匹配未一致时,得到待检测信息对应的第二推送影响特征为第二推送正向影响特征。
130.在一个具体地实施例中,如图11所示,为对图像文本识别的框架示意图。其中,将酒类广告图像通过ocr文本识别算法进行识别,得到各个文本词,包括酿酒师、国货和精品,
然后通过预设关键词库对各个文本词的类别进行识别,得到酿酒师为推送反向影响关键词,得到第二推送影响特征为第二推送反向影响特征。
131.在上述实施例中,通过预设关键词库检测图像文本中是否存在推送反向影响关键词,进而得到第二推送影响特征,提高了得到第二推送影响特征的效率。
132.在一个实施例中,如图12所示,预设关键词库的建立包括以下步骤:
133.步骤1202,获取推送反向影响目标对象标识,根据推送反向影响目标对象标识采集对应的推送反向影响目标对象文本;
134.其中,推送反向影响目标对象是指对待检测信息是否进行推送有反向影响的目标对象,即是禁止推送的目标对象,推送反向影响目标对象标识用于标识,推送反向影响目标对象。推送反向影响目标对象文本是指对待检测信息是否进行推送有反向影响的文本,即是禁止推送的目标对象文本。
135.具体地,服务器获取到推送反向影响目标对象标识,根据推送反向影响目标对象标识可以从互联网采集对应的推送反向影响目标对象文本,也可以直接从数据库中获取到保存的推送反向影响目标对象文本。其中,推送反向影响目标对象标识可以有多个,每一个推送反向影响目标对象标识获取到多个推送反向影响目标对象文本。
136.步骤1204,对推送反向影响目标对象文本进行分词,得到各个文本词。
137.具体地,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。服务器对获取到的每个推送反向影响目标对象文本进行分词,得到每个推送反向影响目标对象文本对应的各个文本词。
138.步骤1206,计算各个文本词对应的词频和逆向文件频率,基于各个文本词对应的词频和逆向文件频率计算各个文本词的重要程度。
139.其中,词频是指文本词在推送反向影响目标对象文本中出现的频率。逆向文件频率是指文本词在所有的推送反向影响目标对象文本中出现的频率。
140.具体地,服务器计算每个文本词对应的词频和逆向文件频率,然后计算每个文本词对应的词频和逆向文件频率的乘积,得到每个文本词的重要程度。
141.步骤1208,根据各个文本词的重要程度选取目标数量的文本词作为推送反向影响关键词,并将推送反向影响关键词保存到关键词库中,得到预设关键词库。
142.具体地,服务器按照各个文本词的重要程度的大小进行排序,根据排序结果按照重要程度从大到小依次选取目标数量的文本词作为推送反向影响关键词。即得到推送反向影响目标对象标识对应的推送反向影响关键词,将每个推送反向影响目标对象标识对应的推送反向影响关键词保存到关键词数据库中,得到预设关键词库。
143.在上述实施例中,通过计算各个文本词对应的词频和逆向文件频率,得到各个文本词的重要程度,根据各个文本词的重要程度得到推送反向影响目标对象标识对应的推送反向影响关键词,使得到的推送反向影响关键词更加准确。然后建立关键词库,方便后续的使用。
144.在一个实施例中,如图13所示,步骤1206,计算各个文本词对应的词频和逆向文件频率,包括:
145.步骤1302,统计推送反向影响目标对象文本对应的词总数,并统计各个文本词在推送反向影响目标对象文本中的出现次数。
146.步骤1304,计算各个文本词对应的出现次数与词总数的比值,得到各个文本词对应的词频。
147.其中,词总数是指推送反向影响目标对象文本中包含的文本词的数量。
148.具体地,服务器统计推送反向影响目标对象文本对应的各个文本词的词总数,并统计各个文本词在推送反向影响目标对象文本中的出现次数,计算各个文本词对应的出现次数与词总数的比值,得到各个文本词对应的词频。可以使用如下公式(1)计算各个文本词对应的词频。
[0149][0150]
其中,tf
w
是指文本词对应的词频。
[0151]
步骤1306,统计推送反向影响目标对象文本对应的文本总数,并统计各个文本词对应的目标文本数,目标文本数是指推送反向影响目标对象文本中包含有目标文本词的文本数量,目标文本词是从各个文本词中选取得到的。
[0152]
具体地,服务器统计采集到的推送反向影响目标对象标识对应的推送反向影响目标对象文本的文本总数。然后将每个文本词作为目标文本词,并计算包含有目标文本词的文本数量。
[0153]
步骤1308,计算各个文本词对应的目标文本数与文本总数的比值,并计算比值的对数,得到各个文本词对应的逆向文件频率。
[0154]
具体地,服务器计算各个文本词对应的目标文本数与文本总数的比值,然后计算比值的对数,就得到各个文本词对应的逆向文件频率。其中,可以使用公式(2)计算文本词对应的逆向文件频率。
[0155][0156]
其中,idf是指文本词对应的逆向文件频率,分母加1是为了避免分母为0。
[0157]
在一个实施例中,待检测文本分类模型的训练包括以下步骤:
[0158]
获取训练待检测文本和对应的训练待检测文本类别;将训练待检测文本作为输入,将训练待检测文本类别作为标签使用卷积神经网络进行训练,当训练完成时,得到待检测文本分类模型。
[0159]
其中,训练待检测文本类别是指训练时真实的待检测文本类别,待检测文本类别包括推送类别和禁止推送类别。其中,卷积神经网络(convolutional neural networks,cnn)是一类包含卷积计算且具有深度结构的前馈神经网络。卷积神经网络包括输入层,卷积层,池化层,全连接和softmax层。
[0160]
具体地,服务器获取到训练待检测文本和对应的训练待检测文本类别,该训练待检测文本是从互联网络采集到的,训练待检测文本类别是对训练待检测文本进行类别标注后得到的类别。然后服务器将训练待检测文本作为输入,将训练待检测文本类别作为标签使用卷积神经网络进行训练,其中训练使用的激活函数可以是relu激活函数或者s型激活函数或者tanh激活函数。当训练完成时,得到待检测文本分类模型,其中,训练完成是指损失函数的值达到预设阈值或者训练达到最大迭代次数。损失函数可以使用交叉熵损失函数、也可以是平方误差损失函数、也可以是二分类损失函数和kl散度损失函数等等。
[0161]
在一个具体的实施例中,如图14所示,为卷积神经网络的结构示意图,其中,包括输入层、卷积层、池化层、全连接和softmax层。对“酿酒师、国货和精品”进行文本分类,将“酿酒师、国货和精品”通过输入层得到文本的表征,即得到3x100的向量矩阵。然后输入到卷积层进行卷积后,得到文本的特征,然后将文本的特征通过池化层进行池化,即从特征中提取到最大值对应的特征作为池化结果,将池化结果通过全连接和softmax层进行分类,得到类别为推送类别的概率和禁止推送类别的概率,然后得到训练输出的类别,根据训练输出的类别和推送类别和禁止推送类别使用损失函数计算损失值,根据损失值更新网络中的参数,完成一轮训练,当损失值小于预设阈值时,训练完成,得到待检测文本分类模型。
[0162]
在上述实施例中,通过使用训练待检测文本和对应的训练待检测文本类别进行训练得到待检测文本分类模型,然后可以将待检测文本分类模型进行部署,方便后续的使用。
[0163]
在一个实施例中,步骤210,基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果,包括步骤:
[0164]
将第一推送影响特征、第二推送影响特征和第三推送影响特征进行组合,得到组合特征,将组合特征输入到推送影响检测模型中进行推送影响检测,得到待检测信息对应的推送检测结果。
[0165]
其中,组合特征是指将第一推送影响特征、第二推送影响特征和第三推送影响特征进行组合后得到的特征,其中,组合可以是进行拼接、进行向量运算等等,向量运算可以是进行相加、进行数乘、进行点积等运算。推送影响检测模型是根据历史推送影响特征数据和历史推送检测结果使用机器学习算法进行训练得到的,其中,机器学习算法可以是线性回归算法、神经网络算法、随机森林算法等等。推送检测结果是指对待检测信息是否进行推送的检测结果,包括推送和禁止推送。
[0166]
具体地,服务器可以直接将第一推送影响特征、第二推送影响特征和第三推送影响特征进行拼接得到组合特征,将组合投资输入到推送影响检测模型中进行推送影响检测,得到输出的推送检测结果,即得到了待检测信息对应的推送检测结果。
[0167]
在上述实施例中,通过使用推送影响检测模型进行推送影响检测,得到待检测信息对应的推送检测结果,提高了得到推送检测结果的准确性。
[0168]
在一个实施例中,推送影响特征包括推送正向影响特征和推送反向影响特征。如图15所示,步骤210,基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果,包括:
[0169]
步骤1502,将第一推送影响特征、第二推送影响特征和第三推送影响特征与推送反向影响特征进行匹配,统计匹配一致的特征数量。
[0170]
具体地,服务器判断第一推送影响特征、第二推送影响特征和第三推送影响特征中的推送反向影响特征,即将推送反向影响特征分别与第一推送影响特征、第二推送影响特征和第三推送影响特征进行匹配,即推送反向影响特征是否与第一推送影响特征、第二推送影响特征和第三推送影响特征相同。则统计匹配一致的特征数量,其中,该特征数量是指第一推送影响特征、第二推送影响特征和第三推送影响特征中与推送反向影响特征一致的数量,比如,当第一推送影响特征为推送反向影响特征,第二推送影响特征为推送反向影响特征,第三推送影响特征为推送正向影响特征时,则推送反向影响特征与第一推送影响特征和第二推送影响特征匹配一致,统计得到的特征数量为2。
[0171]
步骤1504,当特征数量超过预设数量时,得到待检测信息对应的推送检测结果为禁止推送,当特征数量未超过预设数量时,得到待检测信息对应的推送检测结果为推送。
[0172]
其中,预设数量可以是预先设置好的推送反向影响特征存在的数量阈值。禁止推送是指该待检信息是指禁止进行推送的信息。推送是指该待检测信息是能够进行推送的信息。
[0173]
具体地,将特征数量与预设数量进行比较,当比较结果为特征数量超过预设数量时,得到待检测信息对应的推送检测结果为禁止推送,当特征数量未超过预设数量时,得到待检测信息对应的推送检测结果为推送。在一个实施例中,服务器还可以统计匹配未一致的特征数量,当匹配一致的特征数量大于匹配未一致的特征数量时,得到待检测信息对应的推送检测结果为禁止推送,当匹配一致的特征数量小于匹配未一致的特征数量时,得到待检测信息对应的推送检测结果为推送。
[0174]
在上述实施例中,通过统计与推送反向影响特征匹配一致的特征数量,进行而与预设数量进行比较得到待检测信息对应的推送检测结果,提高了得到推送检测结果的效率。
[0175]
在一个实施例中,在步骤210之后,在基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果之后,还包括步骤:
[0176]
当推送检测结果为推送时,获取各个接收方地址,根据各个接收方地址向接收方终端发送待检测信息,以使接收方终端展示待检测信息。
[0177]
当推送检测结果为禁止推送时,生成报警信息,并获取发送方地址,向发送方地址对应的发送方终端返回报警信息。
[0178]
其中,接收方是指接收推送的信息的对象。接收方地址用于指示接收方终端的地址,可以是ip(网际协议)地址和mac(物理)地址等等。报警信息用于提示待检测信息是禁止推送的信息。发送方是指推送待检测信息的对象。发送方地址用于指示发送方终端的地址,可以是ip地址和mac地址等等。
[0179]
具体地,服务器在得到待检测信息的检测结果时,按照检测结果进行后续处理,即当推送检测结果为推送时,获取各个接收方地址,该各个接收方地址是预先设置好的待检测信息要进行推送的地址。根据各个接收方地址向对应的接收方终端发送待检测信息。接收方终端接收到待检测信息时,展示待检测信息。当推送检测结果为禁止推送时,生成报警信息,并获取发送方地址,向发送方地址对应的发送方终端返回报警信息,发送方终端接收到报警信息时,按照报警信息对待检测信息进行重新修改后再进行推送。在一个实施例中,档推送检测结果为禁止推送时,向管理终端提示存在违禁信息的提示,使管理终端对禁止推送对应的待检测信息进一步进行审核,得到进一步的检测结果,提高了检测结果的准确性。
[0180]
在上述实施例中,当推送检测结果为推送时,将待检测信息进行推送,当推送检测结果为禁止推送时,生成报警信息,使待检测信息能够根据推送检测结果进行后续处理。
[0181]
在一个具体的实施例中,如图16所示,信息推送检测方法具体包括以下步骤:
[0182]
步骤1602,获取待检测信息,待检测信息包括待检测图像和待检测文本。
[0183]
步骤1604,将待检测图像输入到目标对象检测模型中,目标对象检测模型包括目标对象区域检测网络和目标对象识别网络,根据目标对象区域检测网络检测待检测图像,
得到目标对象区域。
[0184]
步骤1606,通过目标对象识别网络计算目标对象区域的区域特征、通道注意力特征和空间注意力特征,将通道注意力特征、空间注意力特征和区域特征进行组合,根据组合后的特征进行卷积计算,根据卷积计算结果进行分类识别确定目标对象区域中目标对象的类别。
[0185]
步骤1608,将目标对象的类别与预设推送反向影响对象类别进行匹配,当匹配一致时,得到待检测信息对应的第一推送影响特征为第一推送反向影响特征,当匹配未一致时,得到待检测信息对应的第一推送影响特征为第一推送正向影响特征。
[0186]
步骤1610,通过图像文本识别算法提取待检测图像中的图像文本,将图像文本分词,得到各个待检测词。
[0187]
步骤1612,将各个待检测词与预设关键词库中的推送反向影响关键词进行匹配,当匹配一致时,得到待检测信息对应的第二推送影响特征为第二推送反向影响特征;当匹配未一致时,得到待检测信息对应的第二推送影响特征为第二推送正向影响特征。
[0188]
步骤1614,将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,当待检测文本类别为推送类别时,得到待检测信息对应的第三推送影响特征为第三推送正向影响特征,当待检测文本类别为禁止推送类别时,得到待检测信息对应的第三推送影响特征为第三推送反向影响特征。
[0189]
步骤1616,将第一推送影响特征、第二推送影响特征和第三推送影响特征与推送反向影响特征进行匹配,统计匹配一致的特征数量,当特征数量超过预设数量时,得到待检测信息对应的推送检测结果为禁止推送,当特征数量未超过预设数量时,得到待检测信息对应的推送检测结果为推送。
[0190]
在一个具体的实施例中,如图17所示,提供一种信息推送检测方法的框架示意图,具体来说:
[0191]
服务器要将酒广告进行推送到各个用户终端中,此时,服务器获取到酒广告信息,该酒广告信息包括酒广告标题文本以及酒广告视频,从酒广告视频中截取酒广告图像,将酒广告图像通过ocr文本识别得到图像文本,将图像文本分词得到各个文本词,并使用各个文本词通过预设关键词库进行是否是禁止推送商品对应的图像文本的判断,该图像文本中存在酒相关的文本,得到图像文本是禁止推送的检测结果。然后将酒广告图像输入到已训练的ssd网络中得到感兴趣区域,即酒瓶区域,将酒瓶区域输入到已训练的引入cbam模块的resnet网络中,得到输出的酒瓶区域的酒瓶的类别为酒类,酒类是禁止推送的商品,得到禁止推送的检测结果。然后将酒广告标题文本输入到cnn文本分类网络中,通过输入层、卷积层、池化层、全连接和softmax层得到禁止推送的结果。最后根据三个检测结果都是禁止推送的结果得到该酒广告信息是禁止推送的信息,此时生成报警信息进行禁止推送的提示。
[0192]
本技术还提供一种应用场景,该应用场景应用上述的信息推送检测方法。具体地,该信息推送检测方法在该应用场景的应用如下:
[0193]
该信息推送检测方法应用在新闻网站中,新闻网站要发送一条新闻,新闻网站服务器获取到要发送的新闻,该新闻中有新闻文案和新闻图片,提取新闻图片中的新闻对象区域,并识别新闻对象区域中新闻对象的类别,根据新闻对象的类别确定新闻对应的第一推送影响特征;提取新闻图片中的图片文本,通过预设关键词库匹配图片文本,得到新闻对
应的第二推送影响特征;将新闻文案输入到待检测文本分类模型中进行文本分类,得到新闻文案类别,根据新闻文案类别得到新闻对应的第三推送影响特征;基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定新闻对应的推送检测结果。当推送检测结果是推送时,可以向用户进行推送,即用户进入该新闻网站时,将该新闻推送到用户终端,使用户终端在新闻网站页面展示该新闻。当该新闻中有血腥暴力的图片和词语时,则推送检测结果是禁止推送时,此时生成提示信息比如,新闻中有血腥暴力的图片和词语,向管理终端进行提示,通过管理终端对新闻进行修改后再进行推送。
[0194]
本技术还另外提供一种应用场景,该应用场景应用上述的信息推送检测方法。具体地,该信息推送检测方法在该应用场景的应用如下:
[0195]
该信息推送检测方法应用在微信应用平台中,如图18所示,为微信应用平台进行推送检测的框架示意图,具体来说:
[0196]
微信应用平台获取到待检测信息,该待检测信息可以是微信公众号发布的信息、可以是微信中的广告等等。将待检测信息通过数据处理服务器进行数据预处理,即对待检测信息中的文本进行预处理,对待检测信息中的图像进行预处理。然后通过智能审核系统进行检测,将待检测图像输入到目标对象检测模型中进行检查,得到第一推送影响特征。使用orc识别得到图像文本,将图像文本分词,得到各个待检测词,将各个待检测词与预设关键词库中的推送反向影响关键词进行匹配,得到第二推送影响特征。将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征。基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。当推送检测结果为推送时,进行推送处理。当推送检测结果为禁止推送时,将禁止推送的待检测信息发送到通过审核系统进行进一步审核,即进行人工审核,或者通过巡检系统进行检测。然后通过审核快照服务器保存审核记录信息。然后保存的审核记录信息进行离线模型的训练包括图像能力模型和文本能力模型,训练得到深度学习模型。然后通过深度学习模型进行检测。即进行自学习循环来对待检测信息是否进行推送的检测处理。还可以使用保存的审核记录信息通过数据分析系统进行数据分析,比如,分析出现禁止推送的原因,出现禁止推送的占比等等。
[0197]
应该理解的是,虽然图2、图3、图6、图8-图10、图12、图13、图15和16的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图3、图6、图8-图10、图12、图13、图15和16中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0198]
在一个实施例中,如图19所示,提供了一种信息推送检测装置1900,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:信息获取模块1902、第一特征确定模块1904、第二特征得到模块1906、第三特征得到模块1908和结果确定模块1910,其中:
[0199]
信息获取模块1902,用于获取待检测信息,待检测信息包括待检测图像和待检测文本;
[0200]
第一特征确定模块1904,用于提取待检测图像中的目标对象区域,并识别目标对象区域中目标对象的类别,根据目标对象的类别确定待检测信息对应的第一推送影响特征;
[0201]
第二特征得到模块1906,用于提取待检测图像中的图像文本,通过预设关键词库匹配图像文本,得到待检测信息对应的第二推送影响特征;
[0202]
第三特征得到模块1908,用于将待检测文本输入到待检测文本分类模型中进行文本分类,得到待检测文本类别,根据待检测文本类别得到待检测信息对应的第三推送影响特征;
[0203]
结果确定模块1910,用于基于第一推送影响特征、第二推送影响特征和第三推送影响特征确定待检测信息对应的推送检测结果。
[0204]
在一个实施例中,第一特征确定模块1904,包括:
[0205]
图像输入单元,用于将待检测图像输入到目标对象检测模型中,目标对象检测模型包括目标对象区域检测网络和目标对象识别网络;
[0206]
区域得到单元,用于根据目标对象区域检测网络检测待检测图像,得到目标对象区域;
[0207]
对象识别单元,用于将目标对象区域输入到目标对象识别网络中进行识别,得到目标对象区域中目标对象的类别;
[0208]
类别匹配单元,用于将目标对象的类别与预设推送反向影响对象类别进行匹配,当匹配一致时,得到待检测信息对应的第一推送影响特征为第一推送反向影响特征;当匹配未一致时,得到待检测信息对应的第一推送影响特征为第一推送正向影响特征。
[0209]
在一个实施例中,对象识别单元还用于通过目标对象识别网络计算目标对象区域的区域特征、通道注意力特征和空间注意力特征;将通道注意力特征、空间注意力特征和区域特征进行组合,根据组合后的特征进行卷积计算,根据卷积计算结果进行分类识别确定目标对象区域中目标对象的类别。
[0210]
在一个实施例中,信息推送检测装置1900,还包括:
[0211]
检测网络训练模块,用于获取已标注目标对象区域的训练图像;将已标注目标对象区域的训练图像输入到初始目标对象区域检测网络中检测,得到初始目标对象区域;计算初始目标对象区域与已标注目标对象区域的区域误差信息,根据区域误差信息更新初始目标对象区域检测网络中的网络参数;直到训练得到的区域误差信息符合预设第一训练完成条件时,得到已训练的目标对象区域检测网络。
[0212]
在一个实施例中,信息推送检测装置1900,还包括:
[0213]
识别网络训练模块,用于获取已标注目标对象区域的训练图像,从训练图像中提取已标注目标对象区域,并获取已标注目标对象区域对应的目标对象类别标签;将已标注目标对象区域输入到初始目标对象识别网络中进行分类,得到输出的训练目标对象类别概率,根据训练目标对象类别概率得到训练物体类别;计算目标对象类别标签与训练目标对象类别的类别误差信息,基于类别误差信息更新初始目标对象识别网络中的网络参数;直到训练得到的类别误差信息达到预设第二训练完成条件时,得到已训练的目标对象识别网络。
[0214]
在一个实施例中,第二特征得到模块1906,包括:
[0215]
文本提取单元,用于通过图像文本识别算法提取待检测图像中的图像文本,将图像文本分词,得到各个待检测词;
[0216]
词匹配单元,用于将各个待检测词与预设关键词库中的推送反向影响关键词进行匹配;当匹配一致时,得到待检测信息对应的第二推送影响特征为第二推送反向影响特征;当匹配未一致时,得到待检测信息对应的第二推送影响特征为第二推送正向影响特征。
[0217]
在一个实施例中,信息推送检测装置1900,还包括:
[0218]
文本采集模块,用于获取推送反向影响目标对象标识,根据推送反向影响目标对象标识采集对应的推送反向影响目标对象文本;
[0219]
分词模块,用于对推送反向影响目标对象文本进行分词,得到各个文本词;
[0220]
第一计算模块,用于计算各个文本词对应的词频和逆向文件频率;
[0221]
第二计算模块,用于基于各个文本词对应的词频和逆向文件频率计算各个文本词的重要程度;
[0222]
选取模块,用于根据各个文本词的重要程度选取目标数量的文本词作为推送反向影响关键词,并将推送反向影响关键词保存到关键词库中,得到预设关键词库。
[0223]
在一个实施例中,第一计算模块还用于统计推送反向影响目标对象文本对应的词总数,并统计各个文本词在推送反向影响目标对象文本中的出现次数;计算各个文本词对应的出现次数与词总数的比值,得到各个文本词对应的词频;统计推送反向影响目标对象文本对应的文本总数,并统计各个文本词对应的目标文本数,目标文本数是指推送反向影响目标对象文本中包含有目标文本词的文本数量,目标文本词是从各个文本词中选取得到的;计算各个文本词对应的目标文本数与文本总数的比值,并计算比值的对数,得到各个文本词对应的逆向文件频率。
[0224]
在一个实施例中,信息推送检测装置1900,还包括:
[0225]
分类模型训练模块,用于获取训练待检测文本和对应的训练待检测文本类别;将训练待检测文本作为输入,将训练待检测文本类别作为标签使用卷积神经网络进行训练,当训练完成时,得到待检测文本分类模型。
[0226]
在一个实施例中,结果确定模块1910还用于将第一推送影响特征、第二推送影响特征和第三推送影响特征进行组合,得到组合特征,将组合特征输入到推送影响检测模型中进行推送影响检测,得到待检测信息对应的推送检测结果。
[0227]
在一个实施例中,推送影响特征包括推送正向影响特征和推送反向影响特征;结果确定模块1910还用于将第一推送影响特征、第二推送影响特征和第三推送影响特征与推送反向影响特征进行匹配,统计匹配一致的特征数量;当特征数量超过预设数量时,得到待检测信息对应的推送检测结果为禁止推送,当特征数量未超过预设数量时,得到待检测信息对应的推送检测结果为推送。
[0228]
在一个实施例中,信息推送检测装置1900,还包括:
[0229]
推送模块,用于当推送检测结果为推送时,获取各个接收方地址,根据各个接收方地址向接收方终端发送待检测信息,以使接收方终端展示待检测信息;
[0230]
禁止推送模块,用于当推送检测结果为禁止推送时,生成报警信息,并获取发送方地址,向发送方地址对应的发送方终端返回报警信息。
[0231]
关于信息推送检测装置的具体限定可以参见上文中对信息推送检测方法的限定,
在此不再赘述。上述信息推送检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0232]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图20所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待检测信息以及检测结果数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推送检测方法。
[0233]
本领域技术人员可以理解,图20中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0234]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0235]
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0236]
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
[0237]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0238]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0239]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜