一种基于深度学习的内容安全检测系统的制作方法

2022-11-12 21:29:00 来源：中国专利 TAG：

1.本发明涉及内容检测领域，特别是涉及一种基于深度学习的内容安全检测系统。

背景技术：

2.深度学习就是学习样本数据的内在规律和表示层次，而在这些学习过程中获得的信息对文本、图像、声音等数据的解释有很大的帮助。其最终目标是让机器能够像人类一样进行分析和学习，识别文字、图像、声音等数据。深度学习是一种复杂的机器学习算法，在语音和图像识别方面取得了远超以往相关技术的成果。
3.为了对网页中的文字、图像中的敏感信息进行过滤，现有技术一般是采用文本识别和图像识别结合的方式来综合进行判断。在对网页中的图像进行识别时，现有技术一般是利用预先设置的单一的肤色检测模型来获取图像中的皮肤区域，然后再使用深度学习算法对获取的区域进行检测，显然这样的方式严重依赖于预先设置的肤色检测模型中的参数，不能适应图像的多样性，导致获取的皮肤区域的准确度不足，使得对网页内容进行安全检测的结果不够准确。

技术实现要素：

4.本发明的目的在于公开一种基于深度学习的内容安全检测系统，解决现有的网页信息检测系统仅依靠预先设置的单一的肤色检测模型来获取图像中的皮肤区域，导致获取的皮肤区域的准确度不足，使得对网页内容进行安全检测的结果不够准确的问题。
5.为了达到上述目的，本发明采用如下技术方案：
6.一种基于深度学习的内容安全检测系统，包括内容获取模块、区域提取模块和检测模块；
7.内容获取模块用于获取网页中的图像；
8.区域提取模块用于采用如下方式获取图像中的皮肤区域：
9.对图像进行人脸检测，判断图像中是否包含人脸，
10.若是，则获取人脸区域的像素点的集合u1，获取u1中的像素点在ycrcb颜色空间中的cr分量的取值范围和cb分量的取值范围；基于cr分量的取值范围和cb分量的取值范围获取图像中的皮肤区域；
11.若否，则分别采用椭圆肤色模型、rgb肤色模型和ycrcb肤色模型对图像进行识别处理，获得对应的肤色像素点的集合u2、u3和u4；获取u2、u3和u4的交集u5；基于交集u5获取图像中的皮肤区域；
12.检测模块用于将皮肤区域输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像。
13.作为优选，所述对图像进行人脸检测，包括：
14.使用人脸检测算法对图像进行人脸检测；
15.人脸检测算法包括faceness-net人脸检测算法、dsfd人脸检测算法、dlib人脸检
测算法中的任一种。
16.作为优选，所述基于cr分量的取值范围和cb分量的取值范围获取图像中的皮肤区域，包括：
17.将cr分量的取值范围记为[micr,macr]，micr和macr分别表示u1中的像素点在ycrcb颜色空间中的cr分量的最小值和最大值，将cb分量的取值范围记为[micb,macb]，micb和macb分别表示u1中的像素点在ycrcb颜色空间中的cb分量的最小值和最大值；
[0018]
将图像中除了人脸区域的像素点存入集合utemp；
[0019]
对于utemp中的像素点pix，若pix在ycrcb颜色空间中满足micr≤cr
pix
≤macr且micb≤cb
pix
≤macb，则将pix存入第一临时集合utp1，cr
pix
和cb
pix
分别表示pix在ycrcb颜色空间中的cr分量和cb分量的值；
[0020]
将人脸区域的像素点加入到第一临时集合utp1中，获得第二临时集合utp2；
[0021]
以第二临时集合utp2中的像素点为种子点，在图像中进行区域生长处理，获得多个连通区域；
[0022]
按照设定的规则对连通区域中进行筛选，获得皮肤区域。
[0023]
作为优选，所述rgb肤色模型，包括：
[0024][0025]
其中，r(x,y)、g(x,y)、b(x,y)分别表示坐标为(x,y)的像素点在rgb颜色空间中红色分量、绿色分量、蓝色分量的值。
[0026]
作为优选，所述ycrcb肤色模型，包括：
[0027][0028]
其中，cr(x,y)和cb(x,y)分别表示坐标为(x,y)的像素点在ycrcb颜色空间中的cr分量和cb分量的值。
[0029]
作为优选，所述基于交集u5获取图像中的皮肤区域，包括：
[0030]
以交集u5中的像素点为种子点，在图像中进行区域生长处理，获得多个连通区域；
[0031]
按照设定的规则对连通区域中进行筛选，获得皮肤区域。
[0032]
作为优选，所述将皮肤区域输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像，包括：
[0033]
对皮肤区域进行光线调节处理，获得第一图像；
[0034]
对第一图像进行降噪处理，获得第二图像；
[0035]
将第二图像输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像。
[0036]
本发明在对网页中的图像进行安全检测时，采用的不是的单一的肤色检测模型，
而是先判断是否出现人脸，然后再基于判断结果选择自适应的检测算法来获取皮肤区域，然后再使用深度学习算法来对获得的皮肤区域进行敏感图像识别，从而有效地提高了获得的皮肤区域的准确性。因此，本发明能够提高对网页内容进行安全检测的准确性。
附图说明
[0037]
利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。
[0038]
图1为本发明一种基于深度学习的内容安全检测系统的一种实施例图。
[0039]
图2为本发明进行内容安全检测，判断图像是否为敏感图像的一种实施例图。
具体实施方式
[0040]
下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。
[0041]
如图1所示的一种实施例，本发明提供了一种基于深度学习的内容安全检测系统，包括内容获取模块、区域提取模块和检测模块；
[0042]
内容获取模块用于获取网页中的图像；
[0043]
区域提取模块用于采用如下方式获取图像中的皮肤区域：
[0044]
对图像进行人脸检测，判断图像中是否包含人脸，
[0045]
若是，则获取人脸区域的像素点的集合u1，获取u1中的像素点在ycrcb颜色空间中的cr分量的取值范围和cb分量的取值范围；基于cr分量的取值范围和cb分量的取值范围获取图像中的皮肤区域；
[0046]
若否，则分别采用椭圆肤色模型、rgb肤色模型和ycrcb肤色模型对图像进行识别处理，获得对应的肤色像素点的集合u2、u3和u4；获取u2、u3和u4的交集u5；基于交集u5获取图像中的皮肤区域；
[0047]
检测模块用于将皮肤区域输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像。
[0048]
本发明在对网页中的图像进行安全检测时，采用的不是的单一的肤色检测模型，而是先判断是否出现人脸，然后再基于判断结果选择自适应的检测算法来获取皮肤区域，然后再使用深度学习算法来对获得的皮肤区域进行敏感图像识别，从而有效地提高了获得的皮肤区域的准确性。因此，本发明能够提高对网页内容进行安全检测的准确性。
[0049]
作为优选，所述获取网页中的图像，包括：
[0050]
通过统一资源定位符来爬取网页中的图像。
[0051]
作为优选，所述对图像进行人脸检测，包括：
[0052]
使用人脸检测算法对图像进行人脸检测；
[0053]
人脸检测算法包括faceness-net人脸检测算法、dsfd人脸检测算法、dlib人脸检测算法中的任一种。
[0054]
通过进行人脸检测，能够先获取确定的皮肤区域，由于人体的脸部皮肤和身体的
皮肤颜色较为接近，因此，再基于人脸区域的数据来获取其他区域的皮肤像素点，便能够获得准确度很高的检测结果。本发明的皮肤区域检测算法能够根据图像的实际参数来进行皮肤区域的检测，有效地提高了本发明的自适应能力，能够适用于多种类型的图像。
[0055]
作为优选，所述基于cr分量的取值范围和cb分量的取值范围获取图像中的皮肤区域，包括：
[0056]
将cr分量的取值范围记为[micr,macr]，micr和macr分别表示u1中的像素点在ycrcb颜色空间中的cr分量的最小值和最大值，将cb分量的取值范围记为[micb,macb]，micb和macb分别表示u1中的像素点在ycrcb颜色空间中的cb分量的最小值和最大值；
[0057]
将图像中除了人脸区域的像素点存入集合utemp；
[0058]
对于utemp中的像素点pix，若pix在ycrcb颜色空间中满足micr≤cr
pix
≤macr且micb≤cb
pix
≤macb，则将pix存入第一临时集合utp1，cr
pix
和cb
pix
分别表示pix在ycrcb颜色空间中的cr分量和cb分量的值；
[0059]
将人脸区域的像素点加入到第一临时集合utp1中，获得第二临时集合utp2；
[0060]
以第二临时集合utp2中的像素点为种子点，在图像中进行区域生长处理，获得多个连通区域；
[0061]
按照设定的规则对连通区域中进行筛选，获得皮肤区域。
[0062]
当背景中存在与皮肤区域的像素点相似的像素点时，在获得除了人脸区域之外的皮肤区域的像素点后，背景中的部分像素点也会被错误地识别为皮肤像素点。因此，本发明通过先将临时集合中的像素点作为种子点来进行区域生长，然后再对获得的连通区域进行筛选的方式来排除这些背景中的像素点，从而获得了准确的皮肤区域。对于被错误的识别为皮肤像素点的背景区域的像素点而言，一般都是分散存在的，进行区域生长后，面积一般都比较小，因此，可以利用这一特征进行筛选。
[0063]
作为优选，所述按照设定的规则对连通区域中进行筛选，获得皮肤区域，包括：
[0064]
分别计算每个连通区域的面积与图像的总面积之间的比例，将比例小于设定的比例阈值的连通区域作为背景区域删除。
[0065]
作为优选，所述rgb肤色模型，包括：
[0066][0067]
其中，r(x,y)、g(x,y)、b(x,y)分别表示坐标为(x,y)的像素点在rgb颜色空间中红色分量、绿色分量、蓝色分量的值。
[0068]
作为优选，所述ycrcb肤色模型，包括：
[0069][0070]
其中，cr(x,y)和cb(x,y)分别表示坐标为(x,y)的像素点在ycrcb颜色空间中的cr
分量和cb分量的值。
[0071]
作为优选，所述基于交集u5获取图像中的皮肤区域，包括：
[0072]
以交集u5中的像素点为种子点，在图像中进行区域生长处理，获得多个连通区域；
[0073]
按照设定的规则对连通区域中进行筛选，获得皮肤区域。
[0074]
作为优选，如图2所示，所述将皮肤区域输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像，包括：
[0075]
对皮肤区域进行光线调节处理，获得第一图像；
[0076]
对第一图像进行降噪处理，获得第二图像；
[0077]
将第二图像输入到深度学习识别模型中进行内容安全检测，判断图像是否为敏感图像。
[0078]
作为优选，所述对皮肤区域进行光线调节处理，获得第一图像，包括：
[0079]
获取皮肤区域对应的灰度图像gr；
[0080]
对于gr中的像素点gr，若gr的灰度值gr(gr)大于设定的第一阈值firthr，则将gr的灰度值调节为firthr；
[0081]
若gr的灰度值gr(gr)小于设定的第二阈值secthr，
[0082]
则将gr的灰度值调节为secthr；
[0083]
若gr的灰度值gr(gr)大于等于第二阈值secthr且小于等于第一阈值firthr，则使用如下公式计算对gr进行光线调节处理后的像素值agr(gr)：
[0084][0085]
进行光线调节处理能够对高光的区域进行压制，同时提高暗部的区域的亮度，而当像素值处于两个阈值之间时，本发明采用了对数变换的方式来进行亮度调节，使得调节后的图像整体过度更为自然，提高了光线分布的均匀程度。
[0086]
作为优选，所述对第一图像进行降噪处理，获得第二图像，包括：
[0087]
使用非局部均值降噪算法对第一图像进行降噪处理，获得第二图像。
[0088]
作为优选，深度学习识别模型通过如下方式建立：
[0089]
获取数据集；
[0090]
将数据集分为训练集和测试集；
[0091]
使用训练集对深度学习识别模型进行训练，确定模型中的参数；
[0092]
使用测试集对训练出来的模型进行识别效果测试，直至网络收敛，获得训练好的深度学习模型。
[0093]
数据集可以通过爬虫获取，也可以直接从现有的数据库中获取。
[0094]
以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于监控视频的车间危险行为识别报警方法及系统

一种基于深度学习的内容安全检测系统的制作方法

相关文献

最热文献