一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

视频异常检测、模型训练方法、设备、模型及存储介质与流程

2021-10-19 23:34:00 来源:中国专利 TAG:模型 视频处理 异常 训练 检测


1.本技术涉及视频处理技术领域,尤其涉及一种视频异常检测、模型训练方法、设备、模型及存储介质。


背景技术:

2.视频异常检测旨在自动感知视频序列中的异常事件。
3.在自然场景中,异常事件可能导致危险,甚至可能造成严重损坏,例如火灾、爆炸等,因此,在实践中,很难获得大量的包含异常事件的训练样本。这样,在异常数据严重缺乏的情况下,使用传统的全监督方式训练出的检测模型性能不佳,甚至可能无法完成训练。
4.因此,亟需一种能够改善视频异常检测困境的方案。


技术实现要素:

5.本技术的多个方面提供一种视频异常检测、模型训练方法、设备、模型及存储介质,用以提高视频异常检测的准确度。
6.本技术实施例提供一种模型训练方法,包括:
7.将目标场景下的正常视频样本输入用于视频异常检测的检测模型;
8.利用所述检测模型,分别预测所述正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征;并计算所述至少一个样本未来帧与其在所述正常视频样本中对应的样本视频帧之间的视觉特征误差;
9.以所述视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对所述检测模型进行训练,以供所述检测模型获得所述目标场景下的模型参数。
10.本技术实施例还提供一种视频异常检测方法,适用于检测模型,包括:
11.获取待检测视频;
12.分别预测所述待检测视频中至少一个视频帧的未来帧的视觉特征;
13.计算所述至少一个未来帧与其在所述待检测视频帧中对应的视频帧之间的视觉特征误差;
14.若所述视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定所述待检测视频存在异常;
15.其中,所述目标状态为在所述检测模型进行训练过程中针对正常视频的视觉特征误差在时域上的波动状态设定的约束条件。
16.本技术实施例还提供一种视频异常检测方法,包括:
17.响应于调用目标服务的请求,确定所述目标服务对应的处理资源,利用所述目标服务对应的处理资源执行如下步骤:
18.获取待检测视频;
19.分别预测所述待检测视频中至少一个视频帧的未来帧的视觉特征;
20.计算所述至少一个未来帧与其在所述待检测视频帧中对应的视频帧之间的视觉
特征误差;
21.若所述视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定所述待检测视频存在异常;
22.其中,所述目标状态为在所述检测模型进行训练过程中针对正常视频的视觉特征误差在时域上的波动状态设定的约束条件。
23.本技术实施例还提供一种检测模型,包括编码器、记忆单元和处理器;
24.所述编码器,用于获取待检测视频;并提取所述待检测视频中至少一个视频帧的视觉特征;
25.所述记忆单元,用于分别预测所述至少一个视频帧的未来帧的视觉特征;
26.所述处理器,用于计算所述至少一个未来帧与其在所述待检测视频帧中对应的视频帧之间的视觉特征误差;若所述视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定所述待检测视频存在异常;
27.其中,所述目标状态为在所述检测模型进行训练过程中针对正常视频的视觉特征误差在时域上的波动状态设定的约束条件。
28.本技术实施例还提供一种计算设备,包括存储器和处理器;
29.所述存储器用于存储一条或多条计算机指令;
30.所述处理器与所述存储器耦合,用于执行所述一条或多条计算机指令,以用于:
31.将目标场景下的正常视频样本输入用于视频异常检测的检测模型;
32.利用所述检测模型,分别预测所述正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征;并计算所述至少一个样本未来帧与其在所述正常视频样本中对应的样本视频帧之间的视觉特征误差;
33.以所述视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对所述检测模型进行训练,以供所述检测模型获得所述目标场景下的模型参数。
34.本技术实施例还提供一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行前述的模型训练方法或前述的视频异常检测方法。
35.在本技术实施例中,以目标场景下的正常视频样本作为训练样本,利用检测模型预测正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征,并计算样本视频帧和对应的样本未来帧之间的视觉特征误差;以视觉特征误差在时域上的波动状态达到目标状态为约束条件,对检测模型进行训练。这种半监督的训练方式,可有效改善检测模型对未来帧的预测性能。基于此,在视频异常检测过程中,可通过检测模型保证目标场景下正常视频中视觉特征误差在时域上的波动状态趋于目标状态,而异常视频中视觉特征误差在时域上的波动状态则会偏离目标状态,从而可更加准确地检测出目标场景下的视频中存在的异常情况。
附图说明
36.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
37.图1为本技术一示例性实施例提供的一种检测模型的结构示意图;
38.图2为本技术一示例性实施例提供的一种检测模型的内部逻辑示意图;
39.图3为本技术一示例性实施例提供的一种模型训练方法的流程示意图;
40.图4为本技术一示例性实施例提供的一种视频异常检测方法的流程示意图;
41.图5为本技术一示例性实施例提供的另一种视频异常检测方法的流程示意图;
42.图6为本技术一示例性实施例提供的一种计算设备的结构示意图。
具体实施方式
43.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
44.针对现有的全监督方式训练出的检测模型性能不佳,甚至可能无法完成训练的技术问题,本技术实施例的一些实施例中:以目标场景下的正常视频样本作为训练样本,利用检测模型预测正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征,并计算样本视频帧和对应的样本未来帧之间的视觉特征误差;以视觉特征误差在时域上的波动状态达到目标状态为约束条件,对检测模型进行训练。这种半监督的训练方式,可有效改善检测模型对未来帧的预测性能。基于此,在视频异常检测过程中,可通过检测模型保证目标场景下正常视频中视觉特征误差在时域上的波动状态趋于目标状态,而异常视频中视觉特征误差在时域上的波动状态则会偏离目标状态,从而可更加准确地检测出目标场景下的视频中存在的异常情况。
45.以下结合附图,详细说明本技术各实施例提供的技术方案。
46.图1为本技术一示例性实施例提供的一种检测模型的结构示意图。图2为本技术一示例性实施例提供的一种检测模型的内部逻辑示意图。如图1和图2所示,检测模型至少包括编码器10、记忆单元20和处理器40。
47.参考图1和图2,编码器10,可用于提取视频序列中各视频帧的视觉特征,可参考图2中的特征图提取部分。编码器10可采用深度卷积深度网络对视频帧进行视觉特征提取。具体地,可按照预设步长,通过卷积核在视频帧上进行特征提取,以获得视频帧的视觉特征(如图2中的f
2,1
、f
t,1
等),例如,视觉特征可采用特征图(feature map)等形式来表征。视觉特征,可用于表征视频帧中的语义信息。
48.记忆单元20,可用于预测视频帧的未来帧的视觉特征(如图2中的等),可参考图2中的特征图预测部分。这里,记忆单元20可基于当前视频帧的视觉特征或者当前视频帧及其前的历史视频帧的视觉特征,来预测当前视频帧在视频序列中的未来帧的视觉特征。未来帧可以是当前视频帧的下一帧。
49.编码器10和记忆单元20在检测模型的训练阶段和应用阶段的功能相同,而处理器40在检测模型的训练阶段和应用阶段的功能略有差异。以下将结合图1和2,分别对检测模型的训练方案和应用方案进行说明。
50.在检测模型的训练阶段,主要是优化编码器10和记忆单元20的性能。图3为本技术一示例性实施例提供的一种模型训练方法的流程示意图,参考图3,该方法包括:
51.步骤300、将目标场景下的正常视频样本输入用于视频异常检测的检测模型;
52.步骤301、利用检测模型,分别预测正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征;并计算至少一个样本未来帧与其在正常视频样本中对应的样本视频帧之间的视觉特征误差;
53.步骤302、以视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对检测模型进行训练,以供检测模型获得目标场景下的模型参数。
54.本实施例提供的检测模型及模型训练方案可应用于各种需要进行视频异常检测的场景中,例如,安全监管、应急管理、交通监管等场景中,可准确监测出各种应用场景中的异常事件,例如、火灾、爆炸、交通违法等事件。本实施例对应用场景不做限定。
55.本实施例中,针对不同场景,可分别训练检测模型,以提高检测模型的检查性能。当然,本实施例对此不做限定,相近场景也可共用同一检测模型。其中,不同场景下视频中的背景内容不同。本文中,将以目标场景为例,来说明检测模型的训练过程,应当理解的是,目标场景可以是实际所需的任何场景。
56.在步骤300中,可将目标场景下的正常视频作为训练样本,称之为正常视频样本,正常视频样本可作为前文中的视频序列。可以理解的是,正常视频样本是指不存在异常事件的视频。本实施例中,仅使用正常视频作为训练样本,以供检测模型充分学习到正常视频的特点。
57.在步骤301中,可利用检测模型中的编码器10来提取正常视频样本中至少一个样本视频帧的视觉特征,还可利用记忆单元20来分别预测至少一个样本视频帧的样本未来帧的视觉特征。这样,可获得至少一个样本视频帧及其对应的样本未来帧的视觉特征。其中,可对记忆单元20预测出的样本未来帧可与正常视频样本中的至少一个视频帧进行时序对齐,以确定样本视频帧和样本未来帧的对应关系。参考图2,样本视频帧f2与样本未来帧对齐,也即,样本视频帧f2对应的样本未来帧为
58.在此基础上,处理器40可计算至少一个样本未来帧与其在正常视频样本中对应的样本视频帧之间的视觉特征误差。其中,视觉特征误差可采用均方误差,当然,本实施例并不限于此。视觉特征误差用于表征样本视频帧及其对应的样本未来帧之间的差距。
59.在获得至少一个样本未来帧与其在正常视频样本中对应的样本视频帧之间的视觉特征误差后,在步骤302中,可以视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对检测模型进行训练,以供检测模型获得目标场景下的模型参数。
60.其中,目标状态可以是视觉特征误差在时域上的波动最小。当然,本实施例并不限于此,目标状态还可以是其它能反映视频正常性的效果状态。
61.实际应用中,参考图2,可计算视觉特征误差在时域上的标准差,作为时域波动损失函数(如图2中的l
σ2
);以时域波动损失函数收敛至最小作为第一约束条件,对检测模型进行训练。实际应用中,可以图2中的l2距离来表征视觉特征误差,当然,本实施例并不限于此。
62.另外,本实施例中,可分区域约束视觉特征误差在时域上的波动状态。正如上文提及的,编码器10可采用卷积神经网络进行视觉特征提取,基于此,本实施例中,可将前文中卷积核的覆盖位置,也即是单次卷积时的视野区域,作为一个空间位置。这样,对于正常视
频样本来说将具有至少一个空间位置,相应地,对单个样本视频帧来说,也具有至少一个空间位置。
63.以至少一个样本视频帧中的第一样本视频帧为例,本实施例中,编码器10可提取第一样本视频帧在第一空间位置的视觉特征。记忆单元20在进行样本未来帧的视觉特征预测过程中,也可以单个样本视频帧的单个空间位置为预测单位,从而可预测出第一样本视频帧对应的样本未来帧在第一空间位置上的视觉特征。其中,第一样本视频帧可以是至少一个样本视频帧中的任意一个,第一空间位置为正常样本视频帧包含的至少一个空间位置中的任意一个。这样,可保证样本视频帧和样本未来帧在局部区域上语义方面的对齐,从而提高记忆单元20的性能。基于此,处理器40可计算第一样本视频帧及其对应的样本未来帧在第一空间位置上的视觉特征误差。从而,处理器40可计算出至少一个样本视频帧及其对应的样本未来帧在各个空间位置上的视觉特征误差。实际应用中,可为单个空间位置构建视觉特征误差沿时间轴的波动曲线,以表征视觉特征误差在时域上的波动状态。当然,本实施例并不限于此。
64.据此,本实施例中,可以至少一个样本视频帧在至少一个空间位置上对应的视觉特征误差的波动状态达到目标状态为第一约束条件。从而,可在至少一个空间位置上分别约束视觉特征误差在时域上的波动状态。
65.在第一约束条件的约束下,检测模型可不断进行反向传播,从而不断优化编码器10和记忆单元20中的模型参数,直至依据检测模型而确定出的视觉特征误差在时域上的波动状态能够达到至目标状态。训练后的检测模型中,编码器10的特征提取性能和记忆单元20对未来帧的视觉特征的预测性能均已得到了优化,编码器10和记忆单元20配合下,目标场景下,正常视频对应的视觉特征误差在时域上的波动将会趋于目标状态,比较平稳。
66.除了上述的第一约束条件,参考图2,本实施例中,还可以至少一个样本视频帧对应的视频特征误差达到第一预设要求为第二约束条件,对检测模型进行训练。
67.实际应用中,如图2所示,可以至少一个样本视频帧对应的视频特征误差作为特征预测损失函数(如图2中的l
f
);以特征预测损失函数收敛至最小作为第二约束条件,对检测模型进行训练。同样,本实施例中,可以至少一个样本视频帧在至少一个空间位置上对应的视觉特征误差,作为特征预测损失函数。而基于空间位置而实现的样本视频帧和样本未来帧的语义方面的对齐效果,可有效减轻对未来帧的预测难度,从而优化对复杂视频中的未来帧预测性能。
68.本实施例中,可同时采用上述的第一约束条件和第二约束条件来进行检测模型的训练。基于第二约束条件,可约束样本视频帧中各个空间位置的语义信息,是检测模型能够更加有效地预测样本视频帧中的复杂内容。这样,在正常视频为复杂视频的情况下,依然可保证视觉特征误差在时域上的波动趋于目标状态,比较平稳。从而避免将复杂视频误判为异常视频。
69.参考图2,本实施例中,检测模型还可包含解码器30,解码器30可根据未来帧的视觉特征,还原出未来帧。基于此,处理器40还可计算至少一个样本视频帧与其对应的样本未来帧之间的像素误差;以至少一个样本视频帧各自对应的像素误差达到第二预设要求为第三约束条件,对检测模型进行训练。实际应用中,可以至少一个样本视频帧各自对应的像素误差作为像素预测损失函数(如图2中的l
i
);以像素预测损失函数收敛至最小作为第三个
约束条件,对检测模型进行训练。第三约束条件可进一步优化编码器10和记忆单元20的性能。
70.其中,像素误差是以像素为单位的,也即是,本实施例中,可计算至少一个样本视频帧与其对应的样本未来帧在至少一个像素上的像素误差,并以这些像素误差收敛至最小作为第三约束条件。
71.本实施例中,可如图2所示,以第一约束条件、第二约束条件和第三约束条件同时对检测模型进行训练约束,以将检测模型优化至所需性能。本实施例中,在检测模型的培训了过程中,可同时兼顾视觉特征在时间与空间上的状态,将时间和空间约束有效应用于模型训练,能够有效减小视频中正常的内容变化所带来的视觉特征误差,并且可让时间波动成为判断视频中是否出现异常的有效依据;而且,将时间和空间上的视觉特征分析进行有效解耦,可有利于简化模型训练任务。
72.以下将继续说明目标场景下检测模型的应用方案。
73.本实施例中,可将目标场景下的待检测视频输入训练后的检测模型;利用训练后的检测模型,分别预测待检测视频中至少一个视频帧的未来帧的视觉特征;计算至少一个未来帧与其对应的视频帧之间的视觉特征误差;若视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定待检测视频存在异常。
74.正如前文提及的,对于训练后的检测模型来说,通过编码器10和记忆单元20的配合,可保证正常视频对应的视觉特征误差在时域上的波动状态趋于目标状态。因此,在检测模型的应用阶段,可以视觉特征误差在时域上的波动状态是否满足目标状态,来分辨异常视频。
75.其中,编码器10和记忆单元20在应用阶段的处理逻辑与训练阶段中的处理逻辑相同,在此不再赘述。但此时的编码器10和记忆单元20是以训练后获得模型参数来执行处理逻辑,因此,两者输出的视觉特征,可保证正常视频对应的视觉特征误差在时域上的波动趋于目标状态。
76.但处理器40在应用阶段的处理逻辑与训练阶段中的处理逻辑存在差异。在应用阶段,处理器40可用于判断视觉特征误差在时域上的波动状态是否满足目标状态,来分辨异常视频。实际应用中,处理器40可根据至少一个视频帧各自对应的视觉特征误差,计算待检测视频对应的参考误差值;若至少一个视频帧各自对应的视频特征误差中,存在与参考误差值的差距超过预设范围的目标视频特征误差,则确定目标视频特征误差所属的视频帧存在异常。从前述的空间位置层面,处理器40可根据至少一个视频帧各自在第一空间位置上的视觉特征误差,计算待检测视频在第一空间位置上的参考误差值;其中,第一空间位置为待检测视频中至少一个空间位置中的任意一个。
77.其中,处理器40可计算至少一个视频帧各自在第一空间位置上的视觉特征误差的均值,作为待检测视频在第一空间位置上的参考误差值。当然,本实施例并不限于此,处理器40也可计算至少一个视频帧各自在第一空间位置上的视觉特征误差的中值等,作为待检测视频在第一空间位置上的参考误差值。
78.实际应用中,对于正常视频来说,内容较为简单的情况下的参考误差值将小羽内容较为复杂的情况下的参考误差值。但无论哪种情况下,正常视频对应的视觉特征误差都会在参考误差值附近小幅波动。而异常视频并未经过检测模型学习,因此,异常视频对应的
视觉特征误差将会带来较大的震荡,从而能够被更容易地分辨出来。
79.这样,处理器40可判断至少一个视频帧各自对应的视频特征误差中是否存在与参考误差值的差距超过预设范围的目标视频特征误差,如果存在,则可确定待检测视频存在异常。进一步,还可根据目标视频特征误差找到存在异常的目标视频帧,甚至是目标视频帧中的目标空间位置,并通过图像识别等技术,识别出异常事件的类型,如火灾、爆炸、闯红灯等等。
80.实际应用中,还可在检测模型之后增加报警组件,报警组件可根据检测模型输出的异常检测结果、异常事件类型等信息,发出报警,以提示工作人员及时处理异常事件。
81.据此,本实施例中,可以目标场景下的正常视频样本作为训练样本,利用检测模型预测正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征,并计算样本视频帧和对应的样本未来帧之间的视觉特征误差;以视觉特征误差在时域上的波动状态达到目标状态为约束条件,对检测模型进行训练。这种半监督的训练方式,可有效改善检测模型对未来帧的预测性能。基于此,在视频异常检测过程中,可通过检测模型保证目标场景下正常视频中视觉特征误差在时域上的波动状态趋于目标状态,而异常视频中视觉特征误差在时域上的波动状态则会偏离目标状态,从而可更加准确地检测出目标场景下的视频中存在的异常情况。
82.图4为本技术一示例性实施例提供的一种视频异常检测方法的流程示意图,参考图4,该方法包括:
83.步骤400、获取待检测视频;
84.步骤401、分别预测待检测视频中至少一个视频帧的未来帧的视觉特征;
85.步骤402、计算至少一个未来帧与其在待检测视频帧中对应的视频帧之间的视觉特征误差;
86.步骤403、若视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定待检测视频存在异常;
87.其中,目标状态为在检测模型进行训练过程中针对正常视频的视觉特征误差在时域上的波动状态设定的约束条件。
88.本实施例提供的视频异常检测方法可基于前述实施例中的检测模型实现。其中,待检测视频与检测模型对应的场景应尽量保持一致,以保证检测的准确性。
89.在一可选实施例中,步骤403可包括:
90.根据至少一个视频帧各自对应的视觉特征误差,计算待检测视频对应的参考误差值;
91.若至少一个视频帧各自对应的视频特征误差中,存在与参考误差值的差距超过预设范围的目标视频特征误差,则确定目标视频特征误差所属的视频帧存在异常。
92.在一可选实施例中,步骤根据至少一个视频帧各自对应的视觉特征误差,计算待检测视频对应的参考误差值,可包括:
93.根据至少一个视频帧各自在第一空间位置上的视觉特征误差,计算待检测视频在第一空间位置上的参考误差值;
94.其中,第一空间位置为待检测视频中至少一个空间位置中的任意一个。
95.在一可选实施例中,步骤根据至少一个视频帧各自在第一空间位置上的视觉特征
误差,计算待检测视频在第一空间位置上的参考误差值,可包括:
96.计算至少一个视频帧各自在第一空间位置上的视觉特征误差的均值,作为待检测视频在第一空间位置上的参考误差值。
97.关于检测模型的训练方案和应用方案已在前述实施例中进行详述,基于此,本实施例中各步骤中的技术细节可参考前述实施例中对检测模型的应用方案的描述,在此不再赘述,但这不应造成对本技术保护范围的损失。
98.在一种可能的设计中,上述视频异常检测方案可由云服务器或云平台实施。图5为本技术一示例性实施例提供的另一种视频异常检测方法的流程示意图。参考图5,该方法包括:
99.步骤500、响应于调用目标服务的请求,确定目标服务对应的处理资源,利用目标服务对应的处理资源执行如下步骤:
100.步骤501、获取待检测视频;
101.步骤502、分别预测待检测视频中至少一个视频帧的未来帧的视觉特征;
102.步骤503、计算至少一个未来帧与其在待检测视频帧中对应的视频帧之间的视觉特征误差;
103.步骤504、若视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定待检测视频存在异常;其中,目标状态为在检测模型进行训练过程中针对正常视频的视觉特征误差在时域上的波动状态设定的约束条件。
104.本实施例中,目标服务可部署在云服务器或云平台上,云服务器或云平台可接收调用目标服务的请求,以对外提供视频异常检测功能。其中,目标服务中可包含用于视频异常检测的检测模型,而云服务器或云平台还可获取目标场景下的若干正常视频作为训练样本,以对目标服务中包含的检测模型进行训练,从而是目标服务可支持对目标场景下的待检测视频进行异常检测。
105.关于目标服务可提供的视频异常检测方案以及对检测模型的训练方案,可参考前述实施例中的相关描述,在此不再赘述,但这不应造成对本技术保护范围的损失。
106.需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤401至步骤403的执行主体可以为设备a;又比如,步骤401和402的执行主体可以为设备a,步骤403的执行主体可以为设备b;等等。
107.另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如401、402等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的视频帧、位置、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
108.图6为本技术一示例性实施例提供的一种计算设备的结构示意图。如图6所示,该装置包括:存储器60、处理器61以及通信组件62。
109.存储器60,用于存储计算机程序,并可被配置为存储其它各种数据以支持在计算平台上的操作。这些数据的示例包括用于在计算平台上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
110.存储器60可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
111.处理器61,与存储器60耦合,用于执行存储器60中的计算机程序,以用于:
112.将目标场景下的正常视频样本输入用于视频异常检测的检测模型;
113.利用检测模型,分别预测正常视频样本中至少一个样本视频帧的样本未来帧的视觉特征;并计算至少一个样本未来帧与其在正常视频样本中对应的样本视频帧之间的视觉特征误差;
114.以视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对检测模型进行训练,以供检测模型获得目标场景下的模型参数。
115.在一可选实施例中,目标状态为视觉特征误差在时域上的波动最小。
116.在一可选实施例中,处理器61在以视觉特征误差在时域上的波动状态达到目标状态为第一约束条件,对检测模型进行训练时,用于:
117.计算视觉特征误差在时域上的标准差,作为时域波动损失函数;
118.以时域波动损失函数收敛至最小作为第一约束条件,对检测模型进行训练。
119.在一可选实施例中,处理器61在计算至少一个样本未来帧与其在正常视频样本中对应的样本视频帧之间的视觉特征误差时,用于:
120.提取第一样本视频帧在第一空间位置的视觉特征;
121.获取第一样本视频帧对应的样本未来帧在第一空间位置上的视觉特征;
122.计算第一样本视频帧及其对应的样本未来帧在第一空间位置上的视觉特征误差;
123.其中,第一样本视频帧为至少一个样本视频帧中的任意一个,第一空间位置为正常样本视频帧包含的至少一个空间位置中的任意一个。
124.在一可选实施例中,处理器61在以视觉特征误差在时域上的波动状态达到目标状态为第一约束条件时,用于:
125.以至少一个样本视频帧在至少一个空间位置上对应的视觉特征误差的波动状态达到目标状态为第一约束条件。
126.在一可选实施例中,处理器61还用于:
127.以至少一个样本视频帧对应的视频特征误差达到第一预设要求为第二约束条件,对检测模型进行训练。
128.在一可选实施例中,处理器61在以至少一个样本视频帧对应的视频特征误差达到第一预设要求为第二约束条件,对检测模型进行训练时,用于:
129.以至少一个样本视频帧对应的视频特征误差作为特征预测损失函数;
130.以特征预测损失函数收敛至最小作为第二约束条件,对检测模型进行训练。
131.在一可选实施例中,处理器61还用于:
132.计算至少一个样本视频帧与其对应的样本未来帧之间的像素误差;
133.以至少一个样本视频帧各自对应的像素误差达到第二预设要求为第三约束条件,对检测模型进行训练。
134.在一可选实施例中,处理器61在以至少一个样本视频帧各自对应的像素误差达到
第二预设要求为第三约束条件,对检测模型进行训练时,用于:
135.以至少一个样本视频帧各自对应的像素误差作为像素预测损失函数;
136.以像素预测损失函数收敛至最小作为第三个约束条件,对检测模型进行训练。
137.在一可选实施例中,处理器61在对检测模型进行训练之后,还用于:
138.将目标场景下的待检测视频输入训练后的检测模型;
139.利用训练后的检测模型,分别预测待检测视频中至少一个视频帧的未来帧的视觉特征;计算至少一个未来帧与其对应的视频帧之间的视觉特征误差;
140.若视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则确定待检测视频存在异常。
141.在一可选实施例中,若视觉特征误差在时域上的波动状态存在不满足目标状态的异常状态,则处理器61在确定待检测视频存在异常时,用于:
142.根据至少一个视频帧各自对应的视觉特征误差,计算待检测视频对应的参考误差值;
143.若至少一个视频帧各自对应的视频特征误差中,存在与参考误差值的差距超过预设范围的目标视频特征误差,则确定目标视频特征误差所属的视频帧存在异常。
144.在一可选实施例中,处理器61在根据视觉特征误差,计算待检测视频对应的参考误差值时,用于:
145.根据至少一个视频帧各自在第一空间位置上的视觉特征误差,计算待检测视频在第一空间位置上的参考误差值;
146.其中,第一空间位置为待检测视频中至少一个空间位置中的任意一个。
147.在一可选实施例中,处理器61在根据至少一个视频帧各自在第一空间位置上的视觉特征误差,计算待检测视频在第一空间位置上的参考误差值时,用于:
148.计算至少一个视频帧各自在第一空间位置上的视觉特征误差的均值,作为待检测视频在第一空间位置上的参考误差值。
149.进一步,如图6所示,该计算设备还包括:通信组件62、电源组件63等其它组件。图6中仅示意性给出部分组件,并不意味着计算设备只包括图6所示组件。
150.值得说明的是,上述关于计算设备各实施例中的技术细节,可参考前述的方法实施例中的相关描述,为节省篇幅,在此不再赘述,但这不应造成本技术保护范围的损失。
151.相应地,本技术实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由计算设备执行的各步骤。
152.上述图6中的通信组件,被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如wifi,2g、3g、4g/lte、5g等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
153.上述图6中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力
相关联的组件。
154.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
155.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
156.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
157.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
158.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
159.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
160.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd

rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
161.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
162.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员
来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜