一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种视频内容识别方法和相关装置与流程

2022-03-16 15:21:04 来源:中国专利 TAG:

技术特征:
1.一种视频内容识别方法,其特征在于,所述方法包括:获取待识别视频;根据所述待识别视频的图像信息,确定所述待识别视频对应的第一待定视频内容标签;根据所述待识别视频的音频信息,确定所述待识别视频对应的第二待定视频内容标签;根据所述第一待定视频内容标签和所述第二待定视频内容标签,确定所述待识别视频对应的视频内容标签,所述视频内容标签用于标识所述待识别视频对应的视频内容。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述图像信息,确定所述待识别视频对应的第一待定属性信息,所述第一待定属性信息用于标识所述待识别视频的视频内容与所述第一待定视频内容标签下的多个属性之间的匹配度;根据所述音频信息,确定所述待识别视频对应的第二待定属性信息,所述第二待定属性信息用于标识所述待识别视频的视频内容与所述第二待定视频内容标签下的多个属性之间的匹配度;根据所述第一待定属性信息和所述第二待定属性信息,确定所述待识别视频对应的属性信息,所述属性信息用于标识所述待识别视频的视频内容与所述视频内容标签下的多个属性之间的匹配度。3.根据权利要求1所述的方法,其特征在于,所述图像信息包括所述待识别视频对应的多个连续的视频帧图像,所述根据所述待识别视频的图像信息,确定所述待识别视频对应的第一待定视频内容标签,包括:确定所述多个连续的视频帧图像中相邻视频帧图像之间的像素平均值差值;响应于目标相邻视频帧图像之间的像素平均值差值大于预设阈值,将所述目标相邻视频帧图像中后一帧的视频帧图像确定为关键帧图像;响应于所述多个连续的视频帧图像中不存在相邻视频帧图像之间的像素平均值差值大于所述预设阈值,将所述多个连续的视频帧图像中位于中间帧的视频帧图像确定为关键帧图像;根据所述关键帧图像,确定所述待识别视频对应的第一待定视频内容标签。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对所述关键帧图像进行去噪处理;所述根据所述关键帧图像,确定所述待识别视频对应的第一待定视频内容标签,包括:根据去噪处理后的所述关键帧图像,确定所述待识别视频对应的第一待定视频内容标签。5.根据权利要求1所述的方法,其特征在于,根据所述待识别视频的音频信息,确定所述待识别视频对应的第二待定视频内容标签,包括:确定所述音频信息对应的文本信息;对所述文本信息进行分句处理,所述分句处理用于将所述文本信息转换为以句子为单位的文本信息;根据预设字典识别处理后的所述文本信息中的词语信息;
根据所述词语信息确定所述待识别视频对应的第二待定视频内容标签。6.根据权利要求5所述的方法,其特征在于,所述根据预设字典识别处理后的所述文本信息中的词语信息,包括:以句子为单位,按照第一顺序浏览所述处理后的所述文本信息;将所述处理后的所述文本信息中匹配所述预设字典的词语确定为第一待定词语信息;以句子为单位,按照第二顺序浏览所述处理后的所述文本信息,所述第二顺序与所述第一顺序相反;将所述处理后的所述文本信息中匹配所述预设字典的词语确定为第二待定词语信息;根据所述第一待定词语信息和所述第二待定词语信息确定所述待识别视频对应的词语信息。7.一种视频内容识别装置,其特征在于,所述装置包括获取单元、第一确定单元、第二确定单元和第三确定单元:所述获取单元,用于获取待识别视频;所述第一确定单元,用于根据所述待识别视频的图像信息,确定所述待识别视频对应的第一待定视频内容标签;所述第二确定单元,用于根据所述待识别视频的音频信息,确定所述待识别视频对应的第二待定视频内容标签;所述第三确定单元,用于根据所述第一待定视频内容标签和所述第二待定视频内容标签,确定所述待识别视频对应的视频内容标签,所述视频内容标签用于标识所述待识别视频对应的视频内容。8.根据权利要求7所述的装置,其特征在于,所述装置还包括第四确定单元、第五确定单元和第六确定单元:所述第四确定单元,用于根据所述图像信息,确定所述待识别视频对应的第一待定属性信息,所述第一待定属性信息用于标识所述待识别视频的视频内容与所述第一待定视频内容标签下的多个属性之间的匹配度;所述第五确定单元,用于根据所述音频信息,确定所述待识别视频对应的第二待定属性信息,所述第二待定属性信息用于标识所述待识别视频的视频内容与所述第二待定视频内容标签下的多个属性之间的匹配度;所述第六确定单元,用于根据所述第一待定属性信息和所述第二待定属性信息,确定所述待识别视频对应的属性信息,所述属性信息用于标识所述待识别视频的视频内容与所述视频内容标签下的多个属性之间的匹配度。9.根据权利要求7所述的装置,其特征在于,所述图像信息包括所述待识别视频对应的多个连续的视频帧图像,所述第一确定单元具体用于:确定所述多个连续的视频帧图像中相邻视频帧图像之间的像素平均值差值;响应于目标相邻视频帧图像之间的像素平均值差值大于预设阈值,将所述目标相邻视频帧图像中后一帧的视频帧图像确定为关键帧图像;响应于所述多个连续的视频帧图像中不存在相邻视频帧图像之间的像素平均值差值大于所述预设阈值,将所述多个连续的视频帧图像中位于中间帧的视频帧图像确定为关键帧图像;
根据所述关键帧图像,确定所述待识别视频对应的第一待定视频内容标签。10.根据权利要求9所述的装置,其特征在于,所述装置还包括去噪单元:所述去噪单元,用于对所述关键帧图像进行去噪处理;所述第一确定单元具体用于:根据去噪处理后的所述关键帧图像,确定所述待识别视频对应的第一待定视频内容标签。

技术总结
本申请实施例公开了一种视频内容识别方法和相关装置,可以分别根据待识别视频的图像信息和音频信息,确定该待识别视频对应的第一待定视频内容标签和第二待定视频内容标签,该第一待定视频内容标签能够从视频信息维度体现出该待识别视频的视频内容,该第二待定视频内容标签可以从音频信息维度体现出待识别视频的视频内容。从而,处理设备可以根据第一待定视频内容标签和第二待定视频内容标签,确定待识别视频对应的视频内容标签,该视频内容标签用于标识待识别视频对应的视频内容,进而可以结合视频维度和音频维度这两个维度的信息来对该待识别视频的视频内容进行综合识别,在保障视频内容识别准确度的前提下提高了视频内容的识别效率。内容的识别效率。内容的识别效率。


技术研发人员:张鑫
受保护的技术使用者:国网电商科技有限公司
技术研发日:2021.12.07
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献