一种基于卡尔曼滤波的视频标注方法及系统与流程

2021-10-24 04:00:00 来源：中国专利 TAG：标注卡尔滤波视频方法

技术特征：
1.一种基于卡尔曼滤波的视频标注方法，其特征在于，所述方法包括：步骤1，对卡尔曼滤波器的参数进行初始化设置；步骤2，根据在预设帧数的图片上手动确定的待标注对象所在位置的起始框依次对所述卡尔曼滤波器的参数进行更新；步骤3，利用更新后的卡尔曼滤波器预测在当前帧中所述待标注对象所在位置的预测框；步骤4，利用选择性搜索算法查找当前帧的图片中所有的存在所述待标注对象的候选框；步骤5，将所述待标注对象在当前帧图片所在的位置预测框和所有的候选框进行匹配，确定最匹配的候选框，并将所述最匹配的候选框作为所述待标注对象在当前帧图片中的目标框。2.根据权利要求1所述的方法，其特征在于，所述卡尔曼滤波器的参数，包括：卡尔曼滤波器在初始时刻的状态变量的最优估计卡尔曼滤波器在初始时刻的噪声协方差p0、卡尔曼滤波器的状态转移矩阵a和卡尔曼滤波器的噪声矩阵q。3.根据权利要求1所述的方法，其特征在于，所述根据在预设帧数的图片上手动确定的待标注对象所在位置的起始框依次对所述卡尔曼滤波器的参数进行更新，包括：s21，计算k＝1时刻时第1帧图片的状态变量的最优估计和噪声协方差p1，以用于k＝2时刻时第2帧图片的使用，包括：s211，根据在第1帧图片上确定的待标注对象所在位置的起始框box1的信息得到k＝1时刻的观测输入值z1＝[u
z1
,v
z1
,s
z1
,r
z1
]；其中，u
z1
,v
z1
,s
z1
,r
z1
分别为box1的横坐标、纵坐标、面积和长宽比；s212，将p0、a、q代入式(1)、(2)，得出和p1‑
；s213，将p1‑
、r、h、h
t
代入式(3)得出k1；s214，将k1、z1、h代入式(4)得出s215，将k1、h、i代入式(5)得出p1；；；；；其中，a为卡尔曼滤波器的状态转移矩阵，a的取值为：
其中，δt为间隔的时间或帧数；a
t
为a的转置矩阵；q为卡尔曼滤波器的噪声矩阵；为卡尔曼滤波器在k
‑
1时刻的状态变量的最优估计；p
k
‑1为卡尔曼滤波器在k
‑
1时刻的噪声协方差，表示各个状态变量之间的相互影响，p
k
‑1为7行7列的矩阵；为卡尔曼滤波器在k时刻的噪声协方差的初步预测值；为卡尔曼滤波器在k时刻的状态变量的初步估计，取值为：其中，u
k
,v
k
,s
k
,r
k
分别为k时刻预测框中心位置的横坐标、纵坐标、面积和长宽比，分别为k时刻预测框横向、纵向和面积的变化速率，长宽比r
k
为定值；k
k
为k时刻的卡尔曼增益系数；为卡尔曼滤波器在k时刻的状态变量的最优估计；p
k
为卡尔曼滤波器在k时刻的噪声协方差的最优估计，用于下次迭代更新；为卡尔曼滤波器在k时刻的噪声协方差的初步预测值；z
k
为k时刻的观测输入值，z
k
＝[u
zk
,v
zk
,s
zk
,r
zk
]，u
zk
,v
zk
,s
zk
,r
zk
分别为k时刻起始框中心位置的横坐标、纵坐标、面积和长宽比；h
t
为h的转置矩阵，h为观测函数；r为测量噪声，r＝1000*i，i为4阶的单位矩阵；h的取值为：s22，依次利用当前帧图片对应的状态变量的最优估计和噪声协方差计算得到下一帧图片对应的状态变量的最优估计和噪声协方差，直至完成k＝n时刻对卡尔曼滤波器参数的迭代更新，以用于预测所述第n 1帧图片中所述待标注对象出现的位置；其中，n为预设帧数。4.根据权利要求1所述的方法，其特征在于，所述利用更新后的卡尔曼滤波器预测在当前帧中所述待标注对象所在位置的预测框，包括：取当前帧数为k＝n 1，将第n帧中的代入式(1)预测得到第n 1帧图片上所述待标注对象所在位置的预测框u
n 1
，v
n 1
，s
n 1
，r
n 1
分别为k＝n 1时刻时第n 1帧图片上所述待标注对象所在位置的预测框的横坐标、纵坐标、面积和长宽比。5.根据权利要求1所述的方法，其特征在于，所述利用选择性搜索算法查找当前帧的图
片中所有的存在所述待标注对象的候选框，包括：输入阈值w至选择性搜索selective search算法，获取w个候选框，并将获取的w个候选框与上一帧图片中所述待标注对象所在位置的起始框box
n
进行遍历比对，以确定当前帧的图片中所有的存在所述待标注对象的候选框；其中，如果能找到满足预设条件的候选框，则所述候选框的数量即为该阈值w；否则，该阈值w自增1得到新阈值w 1，新阈值w 1继续在第n 1帧图片中进行遍历比对，直到找到满足预设条件的候选框为止，确定当前帧的图片中所有的存在所述待标注对象的候选框。6.根据权利要求5所述的方法，其特征在于，所述预设条件，包括：iou1＞k1ꢀꢀꢀꢀ
(7)其中，对于任一个候选框，iou1为候选框与box
n
的交并比，s
1交
为候选框与box
n
交集的面积，s
1并
为候选框与box
n
并集的面积，k1为第一交并比阈值；其中，若候选框满足iou1＞k1，则确定候选框满足要求。7.根据权利要求1所述的方法，其特征在于，所述将所述待标注对象在当前帧图片所在的位置预测框和所有的候选框进行匹配，确定最匹配的候选框，包括：计算所述待标注对象在当前帧图片所在的位置预测框和每个候选框的交并比；当仅存在一个候选框的交并比大于预设的第二交并比阈值时，选取该候选框为最匹配的候选框；当存在至少两个候选框的交并比大于预设的第二交并比阈值时，分别计算每个交并比大于预设的交并比阈值的候选框和所述待标注对象在当前帧图片所在的位置预测框的相似度，并选取最大相似度对应的候选框为最匹配的候选框。8.根据权利要求1所述的方法，其特征在于，所述方法还包括：利用所述待标注对象在当前帧图片中的目标框对所述卡尔曼滤波器进行更新，并返回步骤3重新计算，直至预测结果不满足预设的数据标注要求时，重新手动确定所述待标注对象所在位置的起始框，并使用重新手动确定的所述待标注对象所在位置的起始框按照预设的第三帧数阈值对所述卡尔曼滤波器进行更新，并返回步骤3重新计算，直至所有的帧被标注完成时停止。9.一种基于卡尔曼滤波的视频标注系统，其特征在于，所述系统包括：初始化单元，用于对卡尔曼滤波器的参数进行初始化设置；第一更新单元，用于根据在预设帧数的图片上手动确定的待标注对象所在位置的起始框依次对所述卡尔曼滤波器的参数进行更新；预测单元，用于利用更新后的卡尔曼滤波器预测在当前帧中所述待标注对象所在位置的预测框；候选框确定单元，用于利用选择性搜索算法查找当前帧的图片中所有的存在所述待标注对象的候选框；标注单元，用于将所述待标注对象在当前帧图片所在的位置预测框和所有的候选框进行匹配，确定最匹配的候选框，并将所述最匹配的候选框作为所述待标注对象在当前帧图片中的目标框。
10.根据权利要求9所述的系统，其特征在于，所述卡尔曼滤波器的参数，包括：卡尔曼滤波器在初始时刻的状态变量的最优估计卡尔曼滤波器在初始时刻的噪声协方差p0、卡尔曼滤波器的状态转移矩阵a和卡尔曼滤波器的噪声矩阵q。11.根据权利要求9所述的系统，其特征在于，所述第一更新单元，根据在预设帧数的图片上手动确定的待标注对象所在位置的起始框依次对所述卡尔曼滤波器的参数进行更新，包括：s21，计算k＝1时刻时第1帧图片的状态变量的最优估计和噪声协方差p1，以用于k＝2时刻时第2帧图片的使用，包括：s211，根据在第1帧图片上确定的待标注对象所在位置的起始框box1的信息得到k＝1时刻的观测输入值z1＝[u
z1
,v
z1
,s
z1
,r
z1
]；其中，u
z1
,v
z1
,s
z1
,r
z1
分别为box1的横坐标、纵坐标、面积和长宽比；s212，将p0、a、q代入式(1)、(2)，得出和p1‑
；s213，将p1‑
、r、h、h
t
代入式(3)得出k1；s214，将k1、z1、h代入式(4)得出s215，将k1、h、i代入式(5)得出p1；；；；；其中，a为卡尔曼滤波器的状态转移矩阵，a的取值为：其中，δt为间隔的时间或帧数；a
t
为a的转置矩阵；q为卡尔曼滤波器的噪声矩阵；为卡尔曼滤波器在k
‑
1时刻的状态变量的最优估计；p
k
‑1为卡尔曼滤波器在k
‑
1时刻的噪声协方差，表示各个状态变量之间的相互影响，p
k
‑1为7行7列的矩阵；为卡尔曼滤波器在k时刻的噪声协方差的初步预测值；为卡尔曼滤波器在k时刻的状态变量的初步估计，取值为：
其中，u
k
,v
k
,s
k
,r
k
分别为k时刻预测框中心位置的横坐标、纵坐标、面积和长宽比，分别为k时刻预测框横向、纵向和面积的变化速率，长宽比r
k
为定值；k
k
为k时刻的卡尔曼增益系数；为卡尔曼滤波器在k时刻的状态变量的最优估计；p
k
为卡尔曼滤波器在k时刻的噪声协方差的最优估计，用于下次迭代更新；为卡尔曼滤波器在k时刻的噪声协方差的初步预测值；z
k
为k时刻的观测输入值，z
k
＝[u
zk
,v
zk
,s
zk
,r
zk
]，u
zk
,v
zk
,s
zk
,r
zk
分别为k时刻起始框中心位置的横坐标、纵坐标、面积和长宽比；h
t
为h的转置矩阵，h为观测函数；r为测量噪声，r＝1000*i，i为4阶的单位矩阵；h的取值为：s22，依次利用当前帧图片对应的状态变量的最优估计和噪声协方差计算得到下一帧图片对应的状态变量的最优估计和噪声协方差，直至完成k＝n时刻对卡尔曼滤波器参数的迭代更新，以用于预测所述第n 1帧图片中所述待标注对象出现的位置；其中，n为预设帧数。12.根据权利要求9所述的系统，其特征在于，所述预测单元，利用更新后的卡尔曼滤波器预测在当前帧中所述待标注对象所在位置的预测框，包括：取当前帧数为k＝n 1，将第n帧中的代入式(1)预测得到第n 1帧图片上所述待标注对象所在位置的预测框u
n 1
，v
n 1
，s
n 1
，r
n 1
分别为k＝n 1时刻时第n 1帧图片上所述待标注对象所在位置的预测框的横坐标、纵坐标、面积和长宽比。13.根据权利要求9所述的系统，其特征在于，所述候选框确定单元，利用选择性搜索算法查找当前帧的图片中所有的存在所述待标注对象的候选框，包括：输入阈值w至选择性搜索selective search算法，获取w个候选框，并将获取的w个候选框与上一帧图片中所述待标注对象所在位置的起始框box
n
进行遍历比对，以确定当前帧的图片中所有的存在所述待标注对象的候选框；其中，如果能找到满足预设条件的候选框，则所述候选框的数量即为该阈值w；否则，该阈值w自增1得到新阈值w 1，新阈值w 1继续在第n 1帧图片中进行遍历比对，直到找到满足预设条件的候选框为止，确定当前帧的图片中所有的存在所述待标注对象的候选框。14.根据权利要求13所述的系统，其特征在于，所述预设条件，包括：iou1＞k1ꢀꢀꢀꢀ
(7)其中，对于任一个候选框，iou1为候选框与box
n
的交并比，s
1交
为候选框与box
n
交集的面积，s
1并
为候选框与box
n
并集的面积，k1为第一交并比阈值；其中，若候选框满足iou1＞k1，则
确定候选框满足要求。15.根据权利要求9所述的系统，其特征在于，所述标注单元，将所述待标注对象在当前帧图片所在的位置预测框和所有的候选框进行匹配，确定最匹配的候选框，包括：计算所述待标注对象在当前帧图片所在的位置预测框和每个候选框的交并比；当仅存在一个候选框的交并比大于预设的第二交并比阈值时，选取该候选框为最匹配的候选框；当存在至少两个候选框的交并比大于预设的第二交并比阈值时，分别计算每个交并比大于预设的交并比阈值的候选框和所述待标注对象在当前帧图片所在的位置预测框的相似度，并选取最大相似度对应的候选框为最匹配的候选框。16.根据权利要求9所述的系统，其特征在于，所述系统还包括：第二更新单元，用于利用所述待标注对象在当前帧图片中的目标框对所述卡尔曼滤波器进行更新，并进入预测单元重新计算，直至预测结果不满足预设的数据标注要求时，重新手动确定所述待标注对象所在位置的起始框，并使用重新手动确定的所述待标注对象所在位置的起始框按照预设的第三帧数阈值对所述卡尔曼滤波器进行更新，并进入预测单元重新计算，直至所有的帧被标注完成时停止。

技术总结
本发明公开了一种基于卡尔曼滤波的视频标注方法及系统，包括：对卡尔曼滤波器的参数进行初始化设置；手动确定待标注对象所在位置的起始框，并利用起始框的坐标对卡尔曼滤波器进行更新；利用卡尔曼滤波器预测下一帧中所述待标注对象所在位置的预测框；利用选择性搜索算法查找当前帧的图片中所有的存在所述待标注对象的候选框；将所述待标注对象所在的位置预测框和所有的存在待标注对象的候选框进行匹配，确定最匹配的候选框，利用所述最匹配的候选框对所述待标注对象在当前帧的预测框进行更新，并根据更新后的预测框进行标注。本发明相比于传统的标注方式，极大的提高了视频标注效率，可以提高效率30％

技术研发人员：党杨军王鹏飞崔树成赵建明侯永玲
受保护的技术使用者：航天信息（山东）科技有限公司
技术研发日：2021.06.04
技术公布日：2021/10/23

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于改进遗传算法的服务功能链映射方法、装置及设备与流程

一种基于卡尔曼滤波的视频标注方法及系统与流程

相关文献

最热文献