针对包含边框的视频拷贝检测方法及装置与流程

2022-02-21 09:17:10 来源：中国专利 TAG：

1.本发明实施例涉及计算机视觉领域，尤其涉及一种针对包含边框的视频拷贝检测方法及装置。

背景技术：

2.近年来，随着互联网技术和多媒体技术的迅速发展，每天有相当庞大数量的视频被上传到互联网上，视频数据的剧增，给视频数据管理的工作造成了巨大压力，并且，海量的视频数据中，有相当数量的视频内容是重复或者相似的。
3.目前，现有技术通过光学变换、几何变换或时间变换等方式对这些重复视频进行监控、版权保护和去重处理和分析，但是，由于视频的多样性和检测方法的不确定性使得一些特殊的视频，例如，视频周围存在较大区域的黑框、白框、蓝框或者其他边框等的特殊视频严重影响现有技术对视频处理分析的准确性。

技术实现要素：

4.鉴于此，为解决上述针对包含边框的特殊视频拷贝检测的不准确性的问题，本发明实施例提供一种针对包含边框的视频拷贝检测方法及装置。
5.第一方面，本发明实施例提供一种针对包含边框的视频拷贝检测方法，包括：
6.从样本视频中抽取多个第一关键帧图像；
7.基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；
8.对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；
9.从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；
10.基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；
11.根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
12.在一个可能的实施方式中，所述方法还包括：
13.基于视觉显著性，按照时序信息从所述样本视频中提取多个关键帧图像；
14.从每个所述关键帧图像中提取对应的多个特征信息，组成特征向量，得到多个所述关键帧图像对应的多个所述特征向量；
15.依次对比多个所述特征向量的相似度，保留相似度低于第二阈值的多个所述特征向量对应的多个关键帧图像，得到多个第一关键帧图像。
16.在一个可能的实施方式中，所述方法还包括：
17.基于灰度图像特征提取方法，从每个所述第二关键帧图像中提取对应的多个图像特征；
18.基于多个所述图像特征，通过深度神经网络确定每个所述第二关键帧图像对应的多维图像特征向量，进而得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量。
19.在一个可能的实施方式中，所述方法还包括：
20.基于hash结构，对多个所述第一多维图像特征向量与多个所述第二多维图像特征向量建立索引，检测拷贝视频片段。
21.在一个可能的实施方式中，所述方法还包括：
22.基于滑动窗口的时间对齐方法，将多个所述拷贝视频帧图像按照时间信息依次进行整合，获得拷贝视频片段。
23.第二方面，本发明实施例提供一种针对包含边框的视频拷贝检测装置，包括：
24.获取模块，用于从样本视频中抽取多个第一关键帧图像；
25.处理模块，用于基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；
26.所述处理模块，还用于对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；
27.计算模块，用于从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；
28.检测模块，用于基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；
29.确定模块，用于根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
30.第三方面，本发明实施例提供一种计算机设备，包括：处理器和存储器，所述处理器用于执行所述存储器中存储的视频拷贝检测程序，以实现上述第一方面中任一项所述的视频拷贝检测方法。
31.第四方面，本发明实施例提供一种存储介质，包括：所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现上述第一方面中任一项所述的视频拷贝检测方法。
32.本发明实施例提供的针对包含边框的视频拷贝检测方案，通过从样本视频中抽取多个第一关键帧图像；基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝
视频帧图像；根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段，由此方法，可以实现对针对包含边框的视频中存在的多处拷贝视频片段进行准确检测，并确定拷贝视频片段在原视频中的准确位置，方便后续对视频的处理与分析操作。
附图说明
33.图1为本发明实施例提供的一种针对包含边框的视频拷贝检测方法的基本框架图；
34.图2为本发明实施例提供的一种针对包含边框的视频拷贝检测方法的流程示意图；
35.图3为本发明实施例提供的另一种针对包含边框的视频拷贝检测方法的流程示意图；
36.图4为本发明实施例提供的一种针对包含边框的视频拷贝检测装置的结构示意图；
37.图5为本发明实施例提供的一种计算机设备的结构示意图；
38.图6为本发明实施例提供的一种两边存在透明色边框的视频数据示意图；
39.图7为本发明实施例提供的一种两边存在黑色边框的视频数据示意图；
40.图8为本发明实施例提供的一种两边存在蓝色边框的视频数据示意图；
41.图9为本发明实施例提供的一种两边存在白色边框的视频数据示意图；
42.图10为本发明实施例提供的一种两边存在黑框且黑框部分包含字幕和logo的视频数据示意图；
43.图11为本发明实施例提供的一种视频关键帧图像特征提取流程示意图。
具体实施方式
44.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
45.为便于对本发明实施例的理解，下面将结合附图以具体实施例做进一步的解释说明，实施例并不构成对本发明实施例的限定。
46.图1为本发明实施例提供的一种针对包含边框的视频拷贝检测方法的基本框架图，如图1所示：
47.本方案针对样本视频和视频库中的库视频进行拷贝检测，首先进行视频关键帧的抽取，即获取视频中包含重要信息的帧序列；然后将视频的关键帧进行预变换操作，即将上一步抽取出的关键帧中的无效区域去除掉；然后进行视频中关键帧的特征抽取，即对视频关键帧提取相应的特征向量，并经过一定的处理形成帧特征或视频特征集合；进而针对获得的帧特征或视频特征建立索引，为了达到更高效的检索；最后使用视频中的时间信息将拷贝视频帧整合成拷贝片段，进行时间对齐操作，完成时间对齐操作后可得到拷贝的视频片段。
48.需要说明的是，本方案针对的拷贝检测视频是一种视频周围存在较大区域的黑框、白框或者其他纯色边框且边框部分包含logo、字幕等的特殊视频，如图6所示的一种两边存在透明色边框的视频、图7所示的一种两边存在黑色边框的视频、图8所示的一种两边存在蓝色边框的视频、图9所示的一种两边存在白色边框的视频或图10所示的一种两边存在黑框且黑框部分包含字幕和logo的视频。
49.本方案针对新媒体视频数据，利用本方案的针对包含边框的视频拷贝检测方法能够提高对包含边框视频拷贝检测的准确率和速度，可更好地服务于视频拷贝检测、视频转载转引、视频的传播影响力分析等工作。
50.图2为本发明实施例提供的一种针对包含边框的视频拷贝检测方法的流程示意图，如图2所示，该方法具体包括：
51.s21、从样本视频中抽取多个第一关键帧图像。
52.对样本视频进行镜头分割，然后确定每一个镜头的主要内容，从每一个镜头中按照视频图像序列抽取多个代表此镜头内容的关键帧图像，最终得到多个第一关键帧图像。
53.s22、基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像。本发明实施例中，对上述得到的多个第一关键帧图像进行变换处理，首先从图像的四个边缘由外向内依次遍历图像中的所有纯色像素点，直至出现非纯色像素点为止，将所有纯色像素点组成的区域去除，得到多个非纯色像素点为边缘的第二关键帧图像，即寻找到第一关键帧图像中代表关键图像的大致轮廓。例如，如图6所示的一种两边存在透明色边框的视频帧图像，首先确定图像的上、下、左、右四个边缘，然后分别以四个边缘由外向内依次遍历图像中的所有纯色像素点，直至遍历到非纯色的像素点为止。裁剪掉纯色像素点区域，本图就是裁剪掉透明色边框部分，最终保留下图中人物所在的无边框部分。
54.s23、对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第二阈值的图像区域，得到处理后的多个第二关键帧图像。
55.重新遍历多个第二关键帧图像中纯色且连续的像素点个数，若纯色且连续像素点的个数低于阈值则保存裁剪后的关键帧，若纯色且连续像素点的个数高于阈值，则对这些纯色连续的关键帧区域进行区域内图像裁剪操作去除这些纯色连续的区域。
56.s24、从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量。
57.从上述得到的多个第二关键帧图像中采用计算机提取图像信息，图像信息包括颜色信息、纹理信息、形状信息或空间关系信息等，从图像信息中确定图像中的颜色特征、纹理特征、形状特征或空间关系特征等是否是该图像的重要特征，筛选出重要图像特征后，将每个第二关键帧对应的所有特征转换成一个多维度的图像特征向量，进而得到全部第二关键帧图像对应的多个第一多维图像特征向量。
58.s25、基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像。
59.为了快速查找到样本视频中的视频帧图像与库视频中的视频帧图像是否存在互相拷贝的情况，需要将多个所述第一多维图像特征向量与视频库中存储的库视频对应的多
个第二多维图像特征向量建立索引，采用高效的索引结构可提高视频拷贝检测的速度，达到快速检索的目的。
60.s26、根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
61.根据检测到的样本视频和库视频中的每个互为拷贝的视频帧图像在原视频中对应的时间信息，利用预先设定的方法将视频帧图像进行整合，最终得到整合成的拷贝视频片段。
62.本发明实施例提供的针对包含边框的视频拷贝检测方案，通过从样本视频中抽取多个第一关键帧图像；基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段，由此方法，可以实现对视频中存在的多处拷贝视频片段进行准确检测，并确定拷贝视频片段在原视频中的准确位置，方便后续对视频的处理与分析操作。
63.图3为本发明实施例提供的另一种针对包含边框的视频拷贝检测方法的流程示意图，如图2所示，该方法具体包括：
64.s31、基于视觉显著性，按照时序信息从所述样本视频中提取多个关键帧图像。
65.本发明实施例中，采用视觉显著性的智能算法，模拟人类的视觉特点，对样本视频进行序列检测，标注出视频帧图像中的显著区域，然后将原始图像与显著性图像进行相乘，抽取出视频中容易引起人们注意的多个关键帧图像。
66.s32、从每个所述关键帧图像中提取对应的多个特征信息，组成特征向量，得到多个所述关键帧图像对应的多个所述特征向量。
67.为定量的描述关键帧图像中所包含的数据信息，分别提取原始图像的纹理特征、相乘结果图的颜色特征以及显著性图像的运动信息，并将特征进行融合，得到每个关键帧图像对应的多个特征向量。
68.s33、依次对比多个所述特征向量的相似度，保留相似度低于第二阈值的多个所述特征向量对应的多个关键帧图像，得到多个第一关键帧图像。
69.依次对比每个关键帧图像对应的特征向量的相似度，通过对关键帧图像的特征向量之间的相似性计算，得到相似度小，差异性大的多个候选关键帧图像。
70.进一步地，对得到的候选关键帧图像进行两层处理和聚类操作，得到设定个数的第一关键帧图像并保持了原视频的时序性。
71.s34、基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像。
72.具体地，先确定每帧图像的上、下、左、右四个点的坐标位置，然后分别以四个点为起点由外向内依次遍历图像中的所有纯色像素点，直至遍历到非纯色的像素点为止。最后以非纯色像素点为新的边界点，保留非纯色像素点内部的关键帧区域，并裁剪掉遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像。
73.例如，如图7所示的一种两边存在黑色边框的视频帧图像，首先确定图像的上、下、左、右四个点的坐标位置，然后分别以四个点为起点由外向内依次遍历图像中的所有纯色像素点，直至遍历到非纯色的像素点为止。裁剪掉黑色纯色像素点区域，本图就是裁剪掉黑色边框部分，最终保留下图中人物所在的无边框部分。
74.s35、对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像。
75.重新遍历多个第二关键帧图像中纯色且连续的像素点个数，若纯色且连续像素点的个数低于第一阈值则保存裁剪后的关键帧，若纯色且连续像素点的个数高于第一阈值，则对这些纯色连续的关键帧区域进行区域内图像裁剪操作去除这些纯色连续的区域。
76.首先将上述裁剪后得到的多个第二关键帧图像利用预设的算法，转换成灰度图；进而采用sobel算子计算x,y方向上的梯度，在x方向上减去y方向上的梯度，通过减法操作保留具有高水平梯度和低垂直梯度的图像区域；然后对图像进行去噪操作，利用低通滤波器平滑图像，该步骤的目的是降低图像的变化率，用平滑替代强度变化明显的区域，对模糊图像二值化；然后对上一步操作后的黑色空余部分，使用白色填充空余部分；在经过上一步处理后图像会出现一些小的白色斑点，这对于图像的物体检测容易造成干扰，需要将这些白色斑点去除，分别执行6次形态学的腐蚀与膨胀操作；找出图像中非纯色连续区域的轮廓，将关键帧转换为二值图，根据关键帧轮廓线条的颜色、线条的粗细等特征检测关键帧的外轮廓，求得包含点集最小面积的矩形区域；对检测到的区域进行裁剪，计算检测到的矩形区域的四个顶点的坐标，找出四个顶点x，y坐标的最大最小值，通过以下公式1和公式2计算新图像的高height
new-image
和宽width
new-image
。
77.height
new-image
＝y
max-y
min
ꢀꢀꢀ
(公式1)
78.width
new-image
＝x
max-x
min
ꢀꢀꢀ
(公式2)
79.s36、基于灰度图像特征提取方法，从每个所述第二关键帧图像中提取对应的多个图像特征。
80.基于灰度帧图像特征提取的方法，首先将每一个第二关键帧图像转换成灰度图像；然后设置一个m*n的矩形块，将每一个第二关键帧图像分割成多个小的矩形块；其次计算每一个第二关键帧图像的每一个矩形块区域灰度值的平均值，然后将每个矩形块的灰度值按照顺序存储，形成基于灰度的关键帧图像特征，提取基于灰度的关键帧图像特征。
81.s37、基于多个所述图像特征，通过深度神经网络确定每个所述第二关键帧图像对应的多维图像特征向量，进而得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量。
82.在卷积神经网络结构中，多层结构网络的可视层输入为关键帧图像分割成的小矩形块。在卷积层中，通过一组滤波器以及非线性层变换，提取出图像的局部特征。输入的图像通过多个可训练的滤波器和可加偏置进行卷积，卷积后在卷积层产生特征映射，然后对特征映射中每组的像素进行求和，赋予权值、加入偏置，通过一个sigmoid函数得到多个采
样层的特征映射，具体计算过程如以下公式3所示：
[0083][0084]
其中，mj为输入该层的特征映射集，t表示当前的卷积层数，表示采样层第j个神经元输出的特征向量，表示上一卷积层第i个神经元输出，表示上一卷积层第i个神经元与本层第j个神经元之间的连接阈值，该过程所增加的偏置为通过激活函数f。
[0085]
在采样层中，采用池化的方式对卷积层的特征向量进行降维，以提升特征的表达能力。这些特征映射再经过滤波得到下一卷积层，该层级结构对每一个映射重复如采样层相同的计算过程，产生下一采样层。最终这些像素值被光栅化，并连接成一个向量输入到神经网络，得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量，具体如下公式4所示：
[0086][0087]
其中，n表示从卷积层至采样层的窗口宽度。
[0088]
本方案采用如图11所示的一种基于灰度视频帧图像特征提取和基于深度神经网络的视频帧图像特征提取算法的视频帧图像特征提取流程示意图。
[0089]
s38、基于hash结构，对多个所述第一多维图像特征向量与多个所述第二多维图像特征向量建立索引，检测拷贝视频片段。
[0090]
对于视频特征的比对，总体特征量十分庞大，如果采用枚举的方式进行一一匹配，检索效率会十分低下，很难满足大规模的视频采用计算。为达到快速检索的目的，可以运用高效的索引结构。本方案采用hash结构对从样本视频中得到的多个所述第一多维图像特征向量与对视频库中的库视频中得到的多个所述第二多维图像特征向量建立索引与特征匹配，提高视频拷贝检测的速度，达到快速检索的目的。
[0091]
s39、基于滑动窗口的时间对齐方法，将多个所述拷贝视频帧图像按照时间信息依次进行整合，获得拷贝视频片段。
[0092]
时间对齐是在局部视频拷贝检测任务中为确定两个视频之间拷贝的视频片段而进行的操作，本方案采用基于滑动窗口的时间对齐算法，将视频帧图像进行整合，最终得到整合成的拷贝视频片段。
[0093]
本发明实施例提供的针对包含边框的视频拷贝检测方案，通过从样本视频中抽取多个第一关键帧图像；对多个所述第一关键帧图像进行变换处理，得到处理后的多个第二关键帧图像；从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段，由此方法，可以实现同时处理大批量的包含边框的特殊长视频和短视频数据，对视频中存在的多处拷贝视频片段进行准确检测，并确定拷贝视频片段在原视频中的准备位置，方便后续对视频的处理与分析操作。
[0094]
图4为本发明实施例提供的一种针对包含边框的视频拷贝检测装置的结构示意图，具体包括：
[0095]
获取模块401，用于从样本视频中抽取多个第一关键帧图像；
[0096]
处理模块402，用于基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；
[0097]
处理模块402，还用于对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；
[0098]
计算模块403，用于从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；
[0099]
检测模块404，用于基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；
[0100]
确定模块405，用于根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
[0101]
获取模块，具体用于基于视觉显著性，按照时序信息从所述样本视频中提取多个关键帧图像；从每个所述关键帧图像中提取对应的多个特征信息，组成特征向量，得到多个所述关键帧图像对应的多个所述特征向量；依次对比多个所述特征向量的相似度，保留相似度低于第二阈值的多个所述特征向量对应的多个关键帧图像，得到多个第一关键帧图像。
[0102]
计算模块，具体用于基于灰度图像特征提取方法，从每个所述第二关键帧图像中提取对应的多个图像特征；基于多个所述图像特征，通过深度神经网络确定每个所述第二关键帧图像对应的多维图像特征向量，进而得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量。
[0103]
检测模块，具体用于基于hash结构，对多个所述第一多维图像特征向量与多个所述第二多维图像特征向量建立索引，检测拷贝视频片段。
[0104]
确定模块，具体用于基于滑动窗口的时间对齐方法，将多个所述拷贝视频帧图像按照时间信息依次进行整合，获得拷贝视频片段。
[0105]
本实施例提供的一种针对包含边框的视频拷贝检测装置可以是如图4中所示的一种针对包含边框的视频拷贝检测装置，可执行如图2-3中一种针对包含边框的视频拷贝检测方法的所有步骤，进而实现图2-3所示一种针对包含边框的视频拷贝检测方法的技术效果，具体请参照图2-3相关描述，为简洁描述，在此不作赘述。
[0106]
图5为本发明实施例提供的一种计算机设备的结构示意图，图5所示的计算机设备500包括：至少一个处理器501、存储器502、至少一个网络接口504和其他用户接口503。计算机设备500中的各个组件通过总线系统505耦合在一起。可理解，总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图4中将各种总线都标为总线系统505。
[0107]
其中，用户接口503可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。
[0108]
可以理解，本发明实施例中的存储器502可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，rom)、可编程只读存储器(programmable rom，prom)、可擦除可编程只读存储器(erasable prom，eprom)、电可擦除可编程只读存储器(electrically eprom，eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory，ram)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的ram可用，例如静态随机存取存储器(static ram，sram)、动态随机存取存储器(dynamic ram，dram)、同步动态随机存取存储器(synchronous dram，sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram，ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram，esdram)、同步连接动态随机存取存储器(synch link dram，sldram)和直接内存总线随机存取存储器(direct rambus ram，drram)。本文描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
[0109]
在一些实施方式中，存储器502存储了如下的元素，可执行单元或者数据结构，或者他们的子集，或者他们的扩展集：操作系统5021和应用程序5022。
[0110]
其中，操作系统5021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序5022，包含各种应用程序，例如媒体播放器(media player)、浏览器(browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。
[0111]
在本发明实施例中，通过调用存储器502存储的程序或指令，具体的，可以是应用程序5022中存储的程序或指令，处理器501用于执行各方法实施例所提供的方法步骤，例如包括：
[0112]
从样本视频中抽取多个第一关键帧图像；基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；；从每个所述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
[0113]
在一个可能的实施方式中，基于视觉显著性，按照时序信息从所述样本视频中提取多个关键帧图像；从每个所述关键帧图像中提取对应的多个特征信息，组成特征向量，得到多个所述关键帧图像对应的多个所述特征向量；依次对比多个所述特征向量的相似度，保留相似度低于第二阈值的多个所述特征向量对应的多个关键帧图像，得到多个第一关键帧图像。
[0114]
在一个可能的实施方式中，基于灰度图像特征提取方法，从每个所述第二关键帧图像中提取对应的多个图像特征；基于多个所述图像特征，通过深度神经网络确定每个所述第二关键帧图像对应的多维图像特征向量，进而得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量。
[0115]
在一个可能的实施方式中，基于hash结构，对多个所述第一多维图像特征向量与多个所述第二多维图像特征向量建立索引，检测拷贝视频片段。
[0116]
在一个可能的实施方式中，基于滑动窗口的时间对齐方法，将多个所述拷贝视频帧图像按照时间信息依次进行整合，获得拷贝视频片段。
[0117]
上述本发明实施例揭示的方法可以应用于处理器501中，或者由处理器501实现。处理器501可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现成可编程门阵列(field programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502，处理器501读取存储器502中的信息，结合其硬件完成上述方法的步骤。
[0118]
可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(application specific integrated circuits，asic)、数字信号处理器(digital signal processing，dsp)、数字信号处理设备(dspdevice，dspd)、可编程逻辑设备(programmable logic device，pld)、现场可编程门阵列(field-programmable gate array，fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
[0119]
对于软件实现，可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
[0120]
本实施例提供的计算机设备可以是如图5中所示的计算机设备，可执行如图2-3中视频拷贝检测方法的所有步骤，进而实现图2-3所示视频拷贝检测方法的技术效果，具体请参照图2-3相关描述，为简洁描述，在此不作赘述。
[0121]
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中，存储介质可以包括易失性存储器，例如随机存取存储器；存储器也可以包括非易失性存储器，例如只读存储器、快闪存储器、硬盘或固态硬盘；存储器还可以包括上述种类的存储器的组合。
[0122]
当存储介质中一个或者多个程序可被一个或者多个处理器执行，以实现上述在计算机设备侧执行的视频拷贝检测方法。
[0123]
所述处理器用于执行存储器中存储的视频拷贝检测程序，以实现以下在计算机设备侧执行的视频拷贝检测方法的步骤：
[0124]
从样本视频中抽取多个第一关键帧图像；基于图像边缘由外向内遍历多个所述第一关键帧图像直至出现非纯色像素点为止，去除所有遍历过的纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；对多个所述第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域，得到处理后的多个第二关键帧图像；从每个所
述第二关键帧图像中提取对应的多个图像特征，并确定每个所述第二关键帧图像对应的多维图像特征向量，得到多个所述第二关键帧图像对应的多个第一多维图像特征向量；基于多个所述第一多维图像特征向量与视频库中存储的库视频对应的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；根据多个所述拷贝视频帧图像对应的时间信息，将多个所述拷贝视频帧图像进行整合，获得拷贝视频片段。
[0125]
在一个可能的实施方式中，基于视觉显著性，按照时序信息从所述样本视频中提取多个关键帧图像；从每个所述关键帧图像中提取对应的多个特征信息，组成特征向量，得到多个所述关键帧图像对应的多个所述特征向量；依次对比多个所述特征向量的相似度，保留相似度低于第二阈值的多个所述特征向量对应的多个关键帧图像，得到多个第一关键帧图像。
[0126]
在一个可能的实施方式中，基于灰度图像特征提取方法，从每个所述第二关键帧图像中提取对应的多个图像特征；基于多个所述图像特征，通过深度神经网络确定每个所述第二关键帧图像对应的多维图像特征向量，进而得到多个所述第二关键帧图像对应的多个所述第一多维图像特征向量。
[0127]
在一个可能的实施方式中，基于hash结构，对多个所述第一多维图像特征向量与多个所述第二多维图像特征向量建立索引，检测拷贝视频片段。
[0128]
在一个可能的实施方式中，基于滑动窗口的时间对齐方法，将多个所述拷贝视频帧图像按照时间信息依次进行整合，获得拷贝视频片段。
[0129]
专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0130]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0131]
以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：图像检测方法、装置、电子设备及存储介质与流程

针对包含边框的视频拷贝检测方法及装置与流程

相关文献

最热文献