一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

视频的识别方法、装置、可读介质和电子设备与流程

2021-12-01 01:54:00 来源:中国专利 TAG:

技术特征:
1.一种视频的识别方法,其特征在于,所述方法包括:对获取到的待处理视频进行预处理,以得到目标视频;将所述目标视频输入预先训练的识别模型,以得到所述识别模型输出的识别结果,所述识别结果用于表征所述待处理视频的类别;所述识别模型包括编码器和投射层;所述编码器为根据多个预投射层和第一数量个预训练视频,预训练得到的,每个所述预投射层对应一个时序范围,该预投射层用于提取所述预训练视频中对应的时序范围内的视频帧的特征;所述投射层为根据经过预训练的所述编码器,和第二数量的训练视频训练得到的,所述第二数量小于所述第一数量,所述第一样本视频不具有用于指示类别的类别标签。2.根据权利要求1所述的方法,其特征在于,所述将所述目标视频输入预先训练的识别模型,以得到所述识别模型输出的识别结果,包括:通过所述编码器对所述目标视频进行编码,以得到所述目标视频对应的编码向量;通过所述投射层将所述编码向量投射为视频向量,所述视频向量的维度,与待选类别的数量相同,所述待处理视频的类别属于所述待选类别;根据所述视频向量确定所述识别结果。3.根据权利要求1所述的方法,其特征在于,所述编码器是通过如下方式预训练获得的:对第一数量个所述预训练视频进行预处理,以得到每个所述预训练视频对应的目标预训练视频;随机生成两种调整顺序,并针对每个所述目标预训练视频,按照两种所述调整顺序调整该目标预训练视频,以得到该目标预训练视频对应的第一视频和第二视频;将所述第一视频输入所述编码器,并将所述编码器的输出,输入多个所述预投射层,以得到每个所述预投射层提取的,所述第一视频中,该预投射层对应的时序范围内的视频帧的特征;将所述第二视频输入所述编码器,并将所述编码器的输出,输入多个所述预投射层,以得到每个所述预投射层提取的,所述第二视频中,该预投射层对应的时序范围内的视频帧的特征;根据所述第一视频中多个时序范围内的视频帧的特征,和所述第二视频中多个时序范围内的视频帧的特征,预训练所述编码器和多个所述预投射层。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一视频中多个时序范围内的视频帧的特征,和所述第二视频中多个时序范围内的视频帧的特征,预训练所述编码器和多个所述预投射层,包括:针对每个时序范围,根据两种所述调整顺序确定该时序范围的正相似度和负相似度,所述正相似度为所述第一视频中该时序范围内的视频帧的特征,与所述第二视频中目标时序范围内的视频帧的特征的相似度;在两种所述调整顺序中,该时序范围与所述目标时序范围对应;根据该时序范围的所述正相似度和所述负相似度,确定该时序范围对应的损失;该时序范围对应的损失与该时序范围的所述正相似度负相关,与该时序范围的所述负相似度正相关;
根据每个时序范围对应的损失确定综合损失;以降低所述综合损失为目标,利用反向传播算法预训练所述编码器和多个所述预投射层。5.根据权利要求1所述的方法,其特征在于,所述识别模型是通过如下方式训练获得的:对第二数量个所述训练视频进行预处理,以得到每个所述训练视频对应的目标训练视频;将每个所述目标训练视频输入所述识别模型,并根据所述识别模型的输出与该目标训练视频对应的所述训练视频的类别标签,训练所述识别模型。6.根据权利要求5所述的方法,其特征在于,所述将每个所述目标训练视频输入所述识别模型,并根据所述识别模型的输出与该目标训练视频对应的所述训练视频的类别标签,训练所述识别模型,包括:将该目标训练视频输入经过预训练的所述编码器,以得到经过预训练的所述编码器输出的,该目标训练视频对应的训练编码向量;将所述训练编码向量输入所述投射层,以得到所述投射层输出的训练视频向量;将所述训练视频向量输入所述识别模型的分类层,以得到所述分类层输出的训练识别结果,并将所述训练识别结果作为所述识别模型的输出;根据所述训练识别结果和该目标训练视频对应的所述训练视频的类别标签,训练所述投射层,和/或所述编码器。7.根据权利要求6所述的方法,其特征在于,所述识别模型还通过如下方式训练获得的:根据待选类别的数量,确定所述投射层的输出维度,以使所述投射层输出的所述训练视频向量的维度与所述待选类别的数量相同;所述待处理视频的类别属于所述待选类别。8.一种视频的识别装置,其特征在于,所述装置包括:预处理模块,用于对获取到的待处理视频进行预处理,以得到目标视频;识别模块,用于将所述目标视频输入预先训练的识别模型,以得到所述识别模型输出的识别结果,所述识别结果用于表征所述待处理视频的类别;所述识别模型包括编码器和投射层;所述编码器为根据多个预投射层和第一数量个预训练视频,预训练得到的,每个所述预投射层对应一个时序范围,该预投射层用于提取所述预训练视频中对应的时序范围内的视频帧的特征;所述投射层为根据经过预训练的所述编码器,和第二数量的训练视频训练得到的,所述第二数量小于所述第一数量,所述第一样本视频不具有用于指示类别的类别标签。9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1

7中任一项所述方法的步骤。10.一种电子设备,其特征在于,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1

7中任一项所述方法的步骤。

技术总结
本公开涉及一种视频的识别方法、装置、可读介质和电子设备,涉及图像处理技术领域,该方法包括:对获取到的待处理视频进行预处理,以得到目标视频,将目标视频输入预先训练的识别模型,以得到识别模型输出的识别结果,识别结果用于表征待处理视频的类别;识别模型包括编码器和投射层,编码器为根据多个预投射层和第一数量个预训练视频,预训练得到的,每个预投射层对应一个时序范围,该预投射层用于提取预训练视频中对应的时序范围内的视频帧的特征,投射层为根据经过预训练的编码器,和第二数量的训练视频训练得到的,第二数量小于第一数量,第一样本视频不具有用于指示类别的类别标签。本公开中能够提高识别模型的识别准确度。度。度。


技术研发人员:佘琪 张林 王长虎
受保护的技术使用者:北京有竹居网络技术有限公司
技术研发日:2021.09.08
技术公布日:2021/11/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献