一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于标签视频一致性比对方法与流程

2022-10-26 21:49:40 来源:中国专利 TAG:


1.本发明涉及视频分析技术,尤其涉及了基于标签视频一致性比对方法。


背景技术:

2.在互联网时代之前,人们通过收音机、电视机等传统播放机来欣赏视音频,无法随意随时地进行观赏。随着互联网时代的来临,数字技术将文字、图像、视音频内容的出版、复制、储存、传播的成本大幅降低,使得信息几乎能随意地进行传播、共享、使用。但是版权保护制度却因此受到前所未有的冲击,互联网上传播的数字内容尤其是视音频存在大量的盗版和侵权问题。这种现象也引起了越来越多作者和发行者的关注,互联网版权保护开始成为互联网时代的一个热点话题,同时互联网视音频版权保护技术也成为研究的热点。
3.互联网视音频版权保护需要技术手段和法律措施双管齐下,防止和打击非法拷贝、剽窃、盗用、篡改和分发等侵权行为。
4.互联网视音频版权现有主流的保护技术有:如现有技术其通过水印进行视频的审核;隐藏式的水印是以数字资料的方式加入音频、图片或视频中,但在一般的状况下无法被看见。浮现式的水印影响用户观看体验。隐藏式的水印存在鲁棒性差,需采用专有检测设备,技术升级复杂问题。
5.现有技术通过对视频中的画面或声音的特征进行提取,将视频的特征转换成信息字符串,形成数字基因。通过目标视频和数字基因库的样本匹配技术进行一致性比对。目前存在技术难度大,技术升级需重新提供基因等问题。
6.如现有技术cn202210454687.0,其技术难度大,技术升级复杂。


技术实现要素:

7.本发明针对现有技术中对于标签视频一致性比对的方法其技术难度大,技术升级复杂的问题,提供了基于标签视频一致性比对方法。
8.为了解决上述技术问题,本发明通过下述技术方案得以解决:
9.基于标签视频一致性比对方法,其方法包括:
10.标签的提取,针对视频中的标签进行声音的提取;
11.标签的比对,对于提取的标签进行哈希值的比对;从而确定标签视频的一致性。
12.作为优选,标签的提取方法包括:
13.步骤1,视频的获取,通过上载或本地扫描的方式获取需要提取的视频;
14.步骤2,视频的解码,通过解码器对提取的视频进行解码,并获得视频解码数据;视频解码数据包括声音数据和声音数据对应的视频时间点信息;
15.步骤3,声音数据的识别,通过自动语音识别技术对于解码后的声音数据输出时间偏差信息和识别文本结果的结构化数据;时间偏差信息包括开始时间和结束时间;文本结果的结构化数据包括文本相对于视频的绝对开始时间偏移st和文本相对于视频的绝对结束时间偏移et;
16.步骤4,识别文本的分段,对于识别文本结果进行分段;
17.步骤5,关键词的抽取,对于分段后的识别文本通过tf-idf算法进行关键词的抽取;关键词抽取最多为n条;
18.步骤6,字符串数据的合并,对于抽取的关键词通过字符串连接方式合并为字符串数据;
19.步骤7,段落哈希值的计算,对于合并之后的字符串数据通过md5哈希算法获得段落哈希值;
20.步骤8,将段落哈希值和分段对应的时间点信息开始时间偏移st和结束时间偏移et形成记录并存储至数据库;
21.步骤9,通过重复步骤4到7最终在数据库中形成一个视频对应多条标签提取结果时间和哈希值记录。
22.作为优选,标签的比对方法包括:
23.s1、标签结果信息的获取,从数据库中分别查询出要比对的第一视频和第二视频对应多条标签结果信息;标签结果信息包含时间偏差和哈希值;
24.s2、标签结果的排序,对标签结果信息根据时间信息中的开始时间进行降序排序;
25.s3、匹配结果一致性的判断,通过比较第一视频哈希值和第二视频哈希值,从而确定匹配结果的一致性。
26.作为优选,步骤4,识别文本的分段其通过句号、问号和叹号进行分段。
27.作为优选,匹配结果一致性的判断包括:
28.查找第一视频和第二视频对应两个视频哈希值序列完全匹配的子序列开始位置和结束位置;
29.并获取开始位置的开始时间和结束位置的结束时间;
30.依据开始位置的开始时间和结束位置的结束时间计算匹配结果对应的时长,如果匹配结果对应的时长大于偏差的阈值,则匹配结果有效,所有有效匹配结果即为一致位置。
31.作为优选,匹配结果时长偏差的阈值为不小于5秒。
32.为了解决上述技术问题,本发明还提供了一种存储介质,其包括基于标签视频一致性比对方法实现的存储介质。
33.为了解决上述技术问题,本发明还提供了一种电子设备,其包括基于标签视频一致性比对方法实现的电子设备。
34.本发明由于采用了以上技术方案,具有显著的技术效果:
35.本发明只需处理声音数据,不需要处理视频,极大提升处理速度和并发;
36.本发明采用asr和关键字提取技术,该技术成熟,技术难度低;
37.本发明只需要记录哈希值和时间信息,存储要求低;本发明比对采用哈希值比较方式,速度快,性能优;
38.本发明比对算法更新不需要重新做视频进行提取,方便比对算法结合结果和业务进行调整和升级。
附图说明
39.图1是本发明的流程图;
40.图2是本发明的标签的提取流程图;
41.图3是本发明的标签的比对流程图。
具体实施方式
42.下面结合附图与实施例对本发明作进一步详细描述。
43.实施例1
44.基于标签视频一致性比对方法,其方法包括:
45.标签的提取,针对视频中的标签进行声音的提取;
46.标签的比对,对于提取的标签进行哈希值的比对;从而确定标签视频的一致性。
47.标签的提取方法包括:
48.步骤1,视频的获取,通过上载或本地扫描的方式获取需要提取的视频;
49.步骤2,视频的解码,通过解码器对提取的视频进行解码,并获得视频解码数据;视频解码数据包括声音数据和声音数据对应的视频时间点信息;
50.步骤3,声音数据的识别,通过自动语音识别技术对于解码后的声音数据输出时间偏差信息和识别文本结果的结构化数据;时间偏差信息包括开始时间和结束时间;文本结果的结构化数据包括文本相对于视频的绝对开始时间偏移st和文本相对于视频的绝对结束时间偏移et;
51.步骤4,识别文本的分段,对于识别文本结果进行分段;
52.步骤5,关键词的抽取,对于分段后的识别文本通过tf-idf算法进行关键词的抽取;关键词抽取最多为n条;
53.步骤6,字符串数据的合并,对于抽取的关键词通过字符串连接方式合并为字符串数据;
54.步骤7,段落哈希值的计算,对于合并之后的字符串数据通过md5哈希算法获得段落哈希值;
55.步骤8,将段落哈希值和分段对应的时间点信息开始时间偏移st和结束时间偏移et形成记录并存储至数据库;
56.步骤9,通过重复步骤4到7最终在数据库中形成一个视频对应多条标签提取结果时间和哈希值记录。
57.标签的比对方法包括:
58.s1、标签结果信息的获取,从数据库中分别查询出要比对的第一视频和第二视频对应多条标签结果信息;标签结果信息包含时间偏差和哈希值;
59.s2、标签结果的排序,对标签结果信息根据时间信息中的开始时间进行降序排序;
60.s3、匹配结果一致性的判断,通过比较第一视频哈希值和第二视频哈希值,从而确定匹配结果的一致性。
61.步骤4,识别文本的分段其通过句号、问号和叹号进行分段。
62.匹配结果一致性的判断包括:
63.查找第一视频和第二视频对应两个视频哈希值序列完全匹配的子序列开始位置和结束位置;
64.并获取开始位置的开始时间和结束位置的结束时间;
65.依据开始位置的开始时间和结束位置的结束时间计算匹配结果对应的时长,如果匹配结果对应的时长大于偏差的阈值,则匹配结果有效,所有有效匹配结果即为一致位置。
66.匹配结果时长偏差的阈值为不小于5秒。
67.实施例2
68.在实施例1基础上,本实施例的匹配结果时长偏差的阈值为5秒。
69.实施例3
70.在实施例1基础上,本实施例为一种存储介质。
71.实施例4
72.在实施例1基础上,本实施例为一种电子设备。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献