一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

真实分割点判断方法、系统、存储介质及电子设备与流程

2021-10-29 23:17:00 来源:中国专利 TAG:分割 判断 真实 电子设备 方法


1.本发明属于真实分割点判断领域,具体涉及一种真实分割点判断方法、系统、存储介质及电子设备。


背景技术:

2.基于事件检测的方法(dence boundary generator)。但是此方法每个事件会有重叠的时间区域,而场景分割要求每个segment没有时间上的重叠。


技术实现要素:

3.本技术实施例提供了一种真实分割点判断方法、系统、存储介质及电子设备,以至少解决现有的真实分割点判断方法中事件有重叠时间区域的问题。
4.本发明提供了一种真实分割点判断方法,其中,包括:
5.视频特征维度获取步骤:将视频按照时间分成若干个视频等份,使用深度学习预训练模型对所述视频等份提取特征,获得视频特征;
6.模型处理步骤:将所述视频特征输入到真实分割点判断模型进行处理获得每个候选分割点的分类概率;
7.判断步骤:根据所述分类概率对所述候选分割点进行判断以确定场景真实分割点。
8.上述真实分割点判断方法,其中,所述视频特征获取步骤包括:
9.视频等份获得步骤:将所述视频按照时间分成若干个所述视频等份;
10.获得视频特征步骤:使用深度学习预训练模型对每个所述视频等份提取特征获得对应每个所述视屏等份的第一特征。
11.上述真实分割点判断方法,其中,所述模型处理步骤包括:
12.样本视频等份获得步骤:将样本视频按照时间分成若干个样本视频等份;
13.获得样本视频特征步骤:使用深度学习预训练模型对每个所述样本视频等份提取特征,获得所述视屏的多个样本视频特征;
14.构造候选分割点特征步骤:针对每个所述候选分割点取所述候选分割点所在视频等份的样本视频特征和上一个候选分割点之间的样本视频特征以及下一个候选分割点之间的样本视频特征,依次搭建encoder网络和predictor网络并设计损失函数后构建所述真实分割点判断模型;
15.分类概率获得步骤:根据所述视频特征通过真实分割点判断模型获得每个所述候选分割点的所述分类概率。
16.上述真实分割点判断方法,其中,所述判断步骤包括:通过设置阈值对每个所述候选分割点的所述分类概率进行判断以确定所述候选分割点是否为所述场景真实分割点。
17.本发明还提供了一种真实分割点判断系统,其中,包括:
18.视频特征维度获取模块,所述视频特征维度获取模块将视频按照时间分成若干个
视频等份,使用深度学习预训练模型对所述视频等份提取特征,获得视频特征;
19.模型处理模块,所述模型处理模块将所述视频特征输入到真实分割点判断模型进行处理获得每个候选分割点的分类概率;
20.判断模块,所述判断模块根据所述分类概率对所述候选分割点进行判断以确定场景真实分割点。
21.上述真实分割点判断系统,其中,所述视频特征获取模块包括:
22.视频等份获得单元,所述视频等份获得单元将所述视频按照时间分成若干个所述视频等份;
23.获得视频特征单元,所述获得视频特征单元使用深度学习预训练模型对每个所述视频等份提取特征获得对应每个所述视屏等份的第一特征。
24.上述真实分割点判断系统,其中,所述模型处理模块包括:
25.样本视频等份获得单元,所述样本视频等份获得单元将样本视频按照时间分成若干个样本视频等份;
26.获得样本视频特征单元,所述获得样本视频特征单元使用深度学习预训练模型对每个所述样本视频等份提取特征,获得所述视屏的多个样本视频特征;
27.构造候选分割点特征单元,所述构造候选分割点特征单元针对每个所述候选分割点取所述候选分割点所在视频等份的样本视频特征和上一个候选分割点之间的样本视频特征以及下一个候选分割点之间的样本视频特征,依次搭建encoder网络和predictor网络并设计损失函数后构建所述真实分割点判断模型;
28.分类概率获得单元,所述分类概率获得单元根据所述视频特征通过真实分割点判断模型获得每个所述候选分割点的所述分类概率。
29.上述真实分割点判断系统,其中,所述判断模块包括:通过设置阈值对每个所述候选分割点的所述分类概率进行判断以确定所述候选分割点是否为所述场景真实分割点。
30.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上述任一所述的真实分割点判断方法。
31.一种存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上述任一所述的真实分割点判断方法。
32.本发明的有益效果在于:
33.本发明属于深度学习技术中的计算机视觉领域。本发明使用了全局一致性损失,降低相同场景的相似度,提高不同场景的相似度,能够得到非常好的表达,模型会逐渐收敛,而不会出现loss上升;本发明还使用transformer,能够实现自动注意力,学习到视频序列内部的关系。
附图说明
34.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。
35.在附图中:
36.图1是本发明的真实分割点判断方法的流程图;
37.图2是本发明的分步骤s1的流程图;
38.图3是本发明的分步骤s2的流程图;
39.图4是本发明的视频场景分割图;
40.图5是本发明的模型图;
41.图6是本发明的真实分割点判断系统的结构示意图;
42.图7是根据本发明实施例的电子设备的框架图。
具体实施方式
43.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
44.显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
45.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
46.除非另作定义,本技术所涉及的技术术语或者科学术语应当为本技术所属技术领域内具有一般技能的人士所理解的通常意义。本技术所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本技术所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本技术所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本技术所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
47.下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
48.在详细阐述本发明各个实施例之前,对本发明的核心发明思想予以概述,并通过
下述若干实施例予以详细阐述。
49.实施例一:
50.请参照图1,图1是真实分割点判断方法的流程图。如图1所示,本发明的真实分割点判断方法包括:
51.视频特征维度获取步骤s1:将视频按照时间分成若干个视频等份,使用深度学习预训练模型对所述视频等份提取特征,获得视频特征;
52.模型处理步骤s2:将所述视频特征输入到真实分割点判断模型进行处理获得每个候选分割点的分类概率;
53.判断步骤s3:根据所述分类概率对所述候选分割点进行判断以确定场景真实分割点。
54.请参照图2,图2是视频特征维度获取步骤s1的流程图。如图2所示,所述视频特征维度获取步骤s1包括:
55.视频等份获得步骤s11:将所述视频按照时间分成若干个所述视频等份;
56.获得视频特征步骤s12:使用深度学习预训练模型对每个所述视频等份提取特征获得对应每个所述视屏等份的第一特征。
57.请参照图3,图3是模型处理步骤s2的流程图。如图3所示,所述模型处理步骤s2包括:
58.样本视频等份获得步骤s21:将样本视频按照时间分成若干个样本视频等份;
59.获得样本视频特征步骤s22:使用深度学习预训练模型对每个所述样本视频等份提取特征,获得所述视屏的多个样本视频特征;
60.构造候选分割点特征步骤s23:针对每个所述候选分割点取所述候选分割点所在视频等份的样本视频特征和上一个候选分割点之间的样本视频特征以及下一个候选分割点之间的样本视频特征,依次搭建encoder网络和predictor网络并设计损失函数后构建所述真实分割点判断模型;
61.分类概率获得步骤s24:根据所述视频特征通过真实分割点判断模型获得每个所述候选分割点的所述分类概率。
62.其中,所述判断步骤包括:通过设置阈值对每个所述候选分割点的所述分类概率进行判断以确定所述候选分割点是否为所述场景真实分割点。
63.具体地说,如图4、图5所示,训练阶段包括:
64.步骤1:将一个视频按照时间分成l等份,每等份的视频称为一个clip。
65.步骤2:使用深度学习预训练模型对每个clip提取特征,每个clip得到1*d的特征表达(d为特征维度),那么l个clip得到l*d的特征。
66.步骤3:encoder网络搭建,目的是对每个点的特征进行更高级语义的表征,并且将d降低为128维。
67.步骤4:构造每个候选分割点的特征,每个候选分割点取这个候选分割点所在clip的特征和上一个候选分割点之间的特征以及下一个候选分割点之间的特征。如图5,分割点p5的特征会选取[f3,f4,f5,f6,f7,f8]。
[0068]
步骤5:transformer网络搭建,输出除了步骤4的特征,还加入一个分类cls token,直接使用输出的cls token进行判断是否为真实分割点。
[0069]
步骤6:设计损失函数:损失函数包含两个:分类损失函数为l
cls
=g
mask
log(p) (1

g
mask
)log(1

p)
[0070]
其中g
mask
设置为:当某个点与groundtruth的距离小于等于1时认为是正例,反之为负例。
[0071]
一致性正则化损失函数为:
[0072][0073]
其中:i,j分别为任意两个clip,cosine<f
i
f
j
>

为当i,j两个clip属于同一个场景时的余弦相似度,cosine<f
i
f
j
>

为当i,j两个clip不属于同一个场景时的余弦相似度,m为属于同一个场景的两个clip的对数,n为不属于同一个场景的两个clip的对数。
[0074]
步骤7:反向传播训练模型。
[0075]
推理阶段包括:
[0076]
步骤1:按照训练阶段一样,得到每个视频的特征l*d。
[0077]
步骤2:前向传播经过encoder网络和transformer网络,得到每个候选分割点的分类概率,卡一定的阈值即可判断是否为真实分割点。
[0078]
整体模型方案如图5。
[0079]
实施例二:
[0080]
请参照图6,图6是本发明的真实分割点判断系统的结构示意图。如图6所示本发明的一种真实分割点判断系统,其中,包括:
[0081]
视频特征维度获取模块,所述视频特征维度获取模块将视频按照时间分成若干个视频等份,使用深度学习预训练模型对所述视频等份提取特征,获得视频特征;
[0082]
模型处理模块,所述模型处理模块将所述视频特征输入到真实分割点判断模型进行处理获得每个候选分割点的分类概率;
[0083]
判断模块,所述判断模块根据所述分类概率对所述候选分割点进行判断以确定场景真实分割点。
[0084]
其中,所述视频特征获取模块包括:
[0085]
视频等份获得单元,所述视频等份获得单元将所述视频按照时间分成若干个所述视频等份;
[0086]
获得视频特征单元,所述获得视频特征单元使用深度学习预训练模型对每个所述视频等份提取特征获得对应每个所述视屏等份的第一特征。
[0087]
其中,所述模型处理模块包括:
[0088]
样本视频等份获得单元,所述样本视频等份获得单元将样本视频按照时间分成若干个样本视频等份;
[0089]
获得样本视频特征单元,所述获得样本视频特征单元使用深度学习预训练模型对每个所述样本视频等份提取特征,获得所述视屏的多个样本视频特征;
[0090]
构造候选分割点特征单元,所述构造候选分割点特征单元针对每个所述候选分割点取所述候选分割点所在视频等份的样本视频特征和上一个候选分割点之间的样本视频特征以及下一个候选分割点之间的样本视频特征,依次搭建encoder网络和predictor网络并设计损失函数后构建所述真实分割点判断模型;
bus)、扩展总线(expansion bus)、局部总线(local bus)。举例来说而非限制,总线80可包括图形加速接口(accelerated graphics port,简称为agp)或其他图形总线、增强工业标准架构(extended industry standard architecture,简称为eisa)总线、前端总线(front side bus,简称为fsb)、超传输(hyper transport,简称为ht)互连、工业标准架构(industry standard architecture,简称为isa)总线、无线带宽(infiniband)互连、低引脚数(low pin count,简称为lpc)总线、存储器总线、微信道架构(micro channel architecture,简称为mca)总线、外围组件互连(peripheral component interconnect,简称为pci)总线、pci

express(pci

x)总线、串行高级技术附件(serial advanced technology attachment,简称为sata)总线、视频电子标准协会局部(video electronics standards association local bus,简称为vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0102]
该电子设备可以基于真实分割点判断,从而实现结合图1

图3描述的方法。
[0103]
另外,结合上述实施例中真实分割点判断方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种真实分割点判断方法。
[0104]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0105]
综上所述,基于本发明的有益效果在于,本发明使用了全局一致性损失,降低相同场景的相似度,提高不同场景的相似度,能够得到非常好的表达,模型会逐渐收敛,而不会出现loss上升;本发明还使用transformer,能够实现自动注意力,学习到视频序列内部的关系。
[0106]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本发明的保护范围应以所附权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜