基于数字资产管理的视频数据加工方法和系统与流程

2022-03-26 10:21:24 来源：中国专利 TAG：

1.本发明涉及数字资产加工的技术领域，特别涉及基于数字资产管理的视频数据加工方法和系统。

背景技术：

2.公共场所通常设置有视频播放屏幕这样的视频播放平台，通过该视频播放平台能够向观众实时播放相应的视频影像。但是该视频播放平台播放的视频影像中可能存在一些不适宜进行公共传播的声音和/或画面，为此需要对播放的视频影像预先进行人工筛查和剪接，从而提出其中不适宜传播的声音和/或画面，但是上述人工处理视频影像的方式不仅需要花费大量人力和时间去处理视频影像，同时也无法保证能够对视频影像的声音和画面进行全面的排查，这无疑降低对视频影像进行声音/画面处理的效率和可靠性。

技术实现要素：

3.针对现有技术存在的缺陷，本发明提供基于数字资产管理的视频数据加工方法和系统，其通过采集视频播放平台待播放的视频流数据，并将其分块为若干视频流子数据包；再对每个视频流子数据包中的声音信息和视频影像信息分别进行语音识别处理和图像帧识别处理，以此得到相应的语义文字信息和图像帧画面信息；最后，确定预设关键词和预设图形在视频流数据各自的出现时间状态，这样能够在视频流数据中对预设关键词和预设图形进行准确的时间定位，以便于后续在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理，其通过对视频流数据进行细分以确保全面排查其中存在的预设关键词和预设图形，这样能够在短时间内对视频流数据进行自动化的加工处理，从而提高对视频影像进行声音/画面处理的效率和可靠性。
4.本发明提供基于数字资产管理的视频数据加工方法，其特征在于，其包括如下步骤：步骤s1，构建数字资产管理终端与视频播放平台之间的通信连接后，通过数字资产管理终端采集视频播放平台待播放的视频流数据；并对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包；步骤s2，从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对所述声音信息进行语音识别处理，从而得到所述声音信息对应的语义文字信息；对所述视频影像信息进行图像帧识别处理，从而得到所述视频影像信息对应的图像帧画面信息；步骤s3，对所述语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对所述图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据所述第一出现状态和/或所述第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理；进一步，在所述步骤s1中，构建数字资产管理终端与视频播放平台之间的通信连接后，通过数字资产管理终端采集视频播放平台待播放的视频流数据；并对所述视频流数
据进行数据分块处理，从而得到若干视频流子数据包具体包括：步骤s101，通过数字资产管理终端向视频播放平台发送控制连接邀约指令；当所述视频播放平台处于开启状态时，向所述数字资产管理终端返回邀约答应消息；其中，所述邀约答应消息包括所述视频播放平台的平台身份信息；步骤s102，当所述数字资产管理终端根据所述邀约答应消息对所述视频播放平台成功进行身份识别验证后，建立所述数字资产管理终端与所述视频播放平台之间的通信连接；并通过所述数字资产管理终端在所述视频播放平台的后台上采集其待播放的视频流数据；步骤s103，获取所述视频流数据的总视频播放时间和视频总数据量；并根据所述总视频播放时间和所述视频总数据量，对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包；进一步，在所述步骤s103中，根据所述总视频播放时间和所述视频总数据量，对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包具体包括：步骤s1031，利用下面公式（1），根据所述视频流数据的总视频播放时间和所述视频流子数据包允许的最长视频播放时间，对所述视频流数据按照时间进行初步分块，（1）在上述公式（1）中，表示所述视频流数据按照时间进行初步分块后得到的分块视频个数；表示所述视频流数据的总视频播放时间；表示所述视频流数据播放一帧视频影像画面所需要的时间；表示所述视频流子数据包允许的最长视频播放时间；表示向下取整运算；表示向上取整运算；表示所述视频流数据按照时间进行初步分块后得到的第i个分块视频的实际播放时间长度；表示所述视频流子数据包允许的最长视频播放时间内可连续播放的影像画面的总帧数；表示所述视频流子数据包允许的最长视频播放时间内可连续播放的影像画面对应的总时间长度；通过上述步骤s1031得到的实际播放时间长度，对所述视频流数据进行初步分块，从而得到n个分块视频；步骤s1032，通过上述步骤s1031得到的n个分块视频对应的视频数据包的其中一部分会存在视频数据量过大的情况，此时利用下面公式（2），根据所述视频流子数据包允许的最大视频数据量对所述分块视频对应的视频数据包进行二次分块，（2）在上述公式（2），表示初步分块得到的第i个分块视频的视频数据包进行二次分
块后对应的分割时间间隔，表示所述视频流数据按照时间进行初步分块后得到的第i个分块视频对应的视频数据包的视频数据量；表示所述视频流子数据包允许的最大视频数据量；表示按照所述视频流子数据包允许的最大视频数据量能够将初步分块后的第i个分块视频的视频数据包进行二次分块对应的个数；按照上述公式（2），对初步分块后的第i个分块视频的视频数据按照的时间间隔进行二次分块，当在二次分块过程中最后一个分块视频的时间间隔小于，则不继续进行分块，并且最后一个分块的剩余视频数据作为第i个视频流子数据包；步骤s1033，将i的值从1取到n并代入到上述公式（2），从而完成对所有初步分块后的分块视频进行二次分块，以及将二次分块得到的所有视频流子数据包作为最终的视频流子数据包；将每个最终的视频流子数据包按照视频播放先后的时间轴顺序进行重新编号并记做a、即第a个最终视频流子数据包，并且将所有最终视频流子数据包的个数记做m；步骤s1034，利用下面公式（3），根据每一个最终视频流子数据包以及所述视频总数据量，对每一个最终视频流子数据包进行校验，以此确定每一个最终视频流子数据包是否存在数据丢失；（3）在上述公式（3）中，表示对每一个最终视频流子数据包进行校验的校验值；表示所述视频总数据量；表示第a个最终视频流子数据包的视频数据量；当，表示每一个最终视频流子数据包不存在数据丢失；当，表示其中一个最终视频流子数据包存在数据丢失，此时重新执行上述步骤s1031至s1034，直到为止；进一步，在所述步骤s2中，从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对所述声音信息进行语音识别处理，从而得到所述声音信息对应的语义文字信息；对所述视频影像信息进行图像帧识别处理，从而得到所述视频影像信息对应的图像帧画面信息具体包括：步骤s201，通过所述数字资产管理终端对每个视频流子数据包进行声音与视频影像分离提取处理，从而得到相应的声音信息和视频影像信息；步骤s202，按照所述声音信息的播放时间先后顺序，对所述声音信息进行语音识别处理，从而得到与所述声音信息的播放时间轴一致对应的语义文字信息；步骤s203，按照所述视频影像信息的播放时间先后顺序，对所述视频影像信息进行图像帧识别处理，从而得到与所述视频影像信息的播放时间轴一致对应的图像帧画面信息；其中，所述图像帧画面信息包括若干按照所述视频影像信息的播放时间轴依次排列的图像帧；进一步，在所述步骤s3中，对所述语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对所述图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据所述第一出现状态和/或所述第二
出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理具体包括：步骤s301，将所述语义文字信息与预设关键词进行比对，以此确定预设关键词在所述语义文字信息中的出现位置；再根据所述出现位置和所述声音信息的播放时间轴，确定预设关键词在所述声音信息中的播放时间点，以此作为所述第一出现状态；步骤s302，将所述图像帧画面信息中的每个图像帧进行图形识别处理，以此确定每个图像帧是否存在预设图形；当图像帧存在预设图形，则结合所述视频影像信息的播放时间轴确定对应的图像帧在所述视频影像信息中的播放时间点，以此作为所述第二出现状态；步骤s303，根据所述第一出现状态和/或所述第二出现状态，在所述视频播放平台播放视频流数据过程中标定出预设关键词在所述声音信息中的播放时间点和/或预设图像图形在所述视频影像信息中的播放时间点，从而在相应的播放时间点上对包含预设关键词的声音信息进行声音屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理。
5.本发明还提供基于数字资产管理的视频数据加工系统，其特征在于，其包括通信连接关系构建模块、视频流数据采集与分块模块、视频流声像处理模块和视频流声像屏蔽处理模块；其中，所述通信连接关系构建模块用于构建数字资产管理终端与视频播放平台之间的通信连接；所述视频流数据采集与分块模块用于采集视频播放平台待播放的视频流数据；并对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包；所述视频流声像处理模块用于从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对所述声音信息进行语音识别处理，从而得到所述声音信息对应的语义文字信息；对所述视频影像信息进行图像帧识别处理，从而得到所述视频影像信息对应的图像帧画面信息；所述视频流声像屏蔽处理模块用于对所述语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对所述图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据所述第一出现状态和/或所述第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理；进一步，所述通信连接关系构建模块用于构建数字资产管理终端与视频播放平台之间的通信连接具体包括：通过数字资产管理终端向视频播放平台发送控制连接邀约指令；当所述视频播放平台处于开启状态时，向所述数字资产管理终端返回邀约答应消息；其中，所述邀约答应消息包括所述视频播放平台的平台身份信息；当所述数字资产管理终端根据所述邀约答应消息对所述视频播放平台成功进行身份识别验证后，建立所述数字资产管理终端与所述视频播放平台之间的通信连接；以及，所述视频流数据采集与分块模块用于采集视频播放平台待播放的视频流数据；并
对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包具体包括：在所述视频播放平台的后台上采集其待播放的视频流数据；获取所述视频流数据的总视频播放时间和视频总数据量；并根据所述总视频播放时间和所述视频总数据量，对所述视频流数据进行数据分块处理，从而得到若干视频流子数据包；进一步，所述视频流声像处理模块用于从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对所述声音信息进行语音识别处理，从而得到所述声音信息对应的语义文字信息；对所述视频影像信息进行图像帧识别处理，从而得到所述视频影像信息对应的图像帧画面信息具体包括：通过所述数字资产管理终端对每个视频流子数据包进行声音与视频影像分离提取处理，从而得到相应的声音信息和视频影像信息；按照所述声音信息的播放时间先后顺序，对所述声音信息进行语音识别处理，从而得到与所述声音信息的播放时间轴一致对应的语义文字信息；按照所述视频影像信息的播放时间先后顺序，对所述视频影像信息进行图像帧识别处理，从而得到与所述视频影像信息的播放时间轴一致对应的图像帧画面信息；其中，所述图像帧画面信息包括若干按照所述视频影像信息的播放时间轴依次排列的图像帧；进一步，所述视频流声像屏蔽处理模块用于对所述语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对所述图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据所述第一出现状态和/或所述第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理具体包括：将所述语义文字信息与预设关键词进行比对，以此确定预设关键词在所述语义文字信息中的出现位置；再根据所述出现位置和所述声音信息的播放时间轴，确定预设关键词在所述声音信息中的播放时间点，以此作为所述第一出现状态；将所述图像帧画面信息中的每个图像帧进行图形识别处理，以此确定每个图像帧是否存在预设图形；当图像帧存在预设图形，则结合所述视频影像信息的播放时间轴确定对应的图像帧在所述视频影像信息中的播放时间点，以此作为所述第二出现状态；根据所述第一出现状态和/或所述第二出现状态，在所述视频播放平台播放视频流数据过程中标定出预设关键词在所述声音信息中的播放时间点和/或预设图像图形在所述视频影像信息中的播放时间点，从而在相应的播放时间点上对包含预设关键词的声音信息进行声音屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理。
6.相比于现有技术，该基于数字资产管理的视频数据加工方法和系统通过采集视频播放平台待播放的视频流数据，并将其分块为若干视频流子数据包；再对每个视频流子数据包中的声音信息和视频影像信息分别进行语音识别处理和图像帧识别处理，以此得到相应的语义文字信息和图像帧画面信息；最后，确定预设关键词和预设图形在视频流数据各自的出现时间状态，这样能够在视频流数据中对预设关键词和预设图形进行准确的时间定位，以便于后续在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理，其通过对视频流数据进行细分以确保全面排查其中存在的预设关键词和预设图形，
这样能够在短时间内对视频流数据进行自动化的加工处理，从而提高对视频影像进行声音/画面处理的效率和可靠性。
7.本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
8.下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
附图说明
9.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
10.图1为本发明提供的基于数字资产管理的视频数据加工方法的流程示意图。
11.图2为本发明提供的基于数字资产管理的视频数据加工系统的结构示意图。
具体实施方式
12.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
13.参阅图1，为本发明实施例提供的基于数字资产管理的视频数据加工方法的流程示意图。该基于数字资产管理的视频数据加工方法包括如下步骤：步骤s1，构建数字资产管理终端与视频播放平台之间的通信连接后，通过数字资产管理终端采集视频播放平台待播放的视频流数据；并对该视频流数据进行数据分块处理，从而得到若干视频流子数据包；步骤s2，从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对该声音信息进行语音识别处理，从而得到该声音信息对应的语义文字信息；对该视频影像信息进行图像帧识别处理，从而得到该视频影像信息对应的图像帧画面信息；步骤s3，对该语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对该图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据该第一出现状态和/或该第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理。
14.上述技术方案的有益效果为：该基于数字资产管理的视频数据加工方法通过采集视频播放平台待播放的视频流数据，并将其分块为若干视频流子数据包；再对每个视频流子数据包中的声音信息和视频影像信息分别进行语音识别处理和图像帧识别处理，以此得到相应的语义文字信息和图像帧画面信息；最后，确定预设关键词和预设图形在视频流数据各自的出现时间状态，这样能够在视频流数据中对预设关键词和预设图形进行准确的时间定位，以便于后续在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理，其通过对视频流数据进行细分以确保全面排查其中存在的预设关键词和预设图
形，这样能够在短时间内对视频流数据进行自动化的加工处理，从而提高对视频影像进行声音/画面处理的效率和可靠性。
15.优选地，在该步骤s1中，构建数字资产管理终端与视频播放平台之间的通信连接后，通过数字资产管理终端采集视频播放平台待播放的视频流数据；并对该视频流数据进行数据分块处理，从而得到若干视频流子数据包具体包括：步骤s101，通过数字资产管理终端向视频播放平台发送控制连接邀约指令；当该视频播放平台处于开启状态时，向该数字资产管理终端返回邀约答应消息；其中，该邀约答应消息包括该视频播放平台的平台身份信息；步骤s102，当该数字资产管理终端根据该邀约答应消息对该视频播放平台成功进行身份识别验证后，建立该数字资产管理终端与该视频播放平台之间的通信连接；并通过该数字资产管理终端在该视频播放平台的后台上采集其待播放的视频流数据；步骤s103，获取该视频流数据的总视频播放时间和视频总数据量；并根据该总视频播放时间和该视频总数据量，对该视频流数据进行数据分块处理，从而得到若干视频流子数据包。
16.上述技术方案的有益效果为：该数字资产管理终端可为数字资产管理人员所使用的智能手机等移动终端；该视频播放平台可包括视频播放控制服务器和视频播放器。该移动终端能够与该视频播放控制服务器进行通信连接，并且还能够对该视频播放控制服务器内存储的视频流数据进行加工处理，最后将加工处理后的视频流数据通过该视频播放器的播放屏幕进行播放。
17.该视频播放平台可与不同数字资产管理人员所使用的移动终端进行通信连接。在通信连接之前，该数字资产管理终端可向该视频播放平台进行连接邀约，当该视频播放平台处于开启状态并且当前并未与其他数字资产管理平台连接时，该视频播放平台会通过其对应的视频播放控制服务器返回相应的邀约答应消息；接着该视频播放控制服务器会对该邀约答应消息中的平台身份信息进行身份识别验证，即将该平台身份信息与预设身份信息白名单进行比对，若该平台身份信息存在于预设身份信息白名单中，则表明身份识别验证成功，随后即可建立该数字资产管理终端与该视频播放平台之间的无线通信连接。该数字资产管理终端能够在该视频播放控制服务器的视频数据库中采集该视频播放平台即将播放的视频流数据。最后，根据该视频流数据的总视频播放时间和视频总数据量（即视频总数据比特量），对其进行数据分块处理，这样能够得到若干视频流子数据包，通过将容量较大的视频流数据分切为若干容量适中的若干视频流子数据包，这样能够避免对该视频流数据整体进行分析而导致分析遗漏的情况发生，同时还能够对多个视频流子数据包进行并行处理以此提高视频数据加工的效率。
18.优选地，在该步骤s103中，根据该总视频播放时间和该视频总数据量，对该视频流数据进行数据分块处理，从而得到若干视频流子数据包具体包括：步骤s1031，利用下面公式（1），根据该视频流数据的总视频播放时间和该视频流子数据包允许的最长视频播放时间，对该视频流数据按照时间进行初步分块，（1）
在上述公式（1）中，表示该视频流数据按照时间进行初步分块后得到的分块视频个数；表示该视频流数据的总视频播放时间；表示该视频流数据播放一帧视频影像画面所需要的时间；表示该视频流子数据包允许的最长视频播放时间；表示向下取整运算；表示向上取整运算；表示该视频流数据按照时间进行初步分块后得到的第i个分块视频的实际播放时间长度；表示该视频流子数据包允许的最长视频播放时间内可连续播放的影像画面的总帧数；表示该视频流子数据包允许的最长视频播放时间内可连续播放的影像画面对应的总时间长度；通过上述步骤s1031得到的实际播放时间长度，对该视频流数据进行初步分块，从而得到n个分块视频；步骤s1032，通过上述步骤s1031得到的n个分块视频对应的视频数据包的其中一部分会存在视频数据量过大的情况，此时利用下面公式（2），根据该视频流子数据包允许的最大视频数据量对该分块视频对应的视频数据包进行二次分块，（2）在上述公式（2），表示初步分块得到的第i个分块视频的视频数据包进行二次分块后对应的分割时间间隔，表示该视频流数据按照时间进行初步分块后得到的第i个分块视频对应的视频数据包的视频数据量；表示该视频流子数据包允许的最大视频数据量；表示按照该视频流子数据包允许的最大视频数据量能够将初步分块后的第i个分块视频的视频数据包进行二次分块对应的个数；按照上述公式（2），对初步分块后的第i个分块视频的视频数据按照的时间间隔进行二次分块，当在二次分块过程中最后一个分块视频的时间间隔小于，则不继续进行分块，并且最后一个分块的剩余视频数据作为第i个视频流子数据包；步骤s1033，将i的值从1取到n并代入到上述公式（2），从而完成对所有初步分块后的分块视频进行二次分块，以及将二次分块得到的所有视频流子数据包作为最终的视频流子数据包；将每个最终的视频流子数据包按照视频播放先后的时间轴顺序进行重新编号并记做a、即第a个最终视频流子数据包，并且将所有最终视频流子数据包的个数记做m；步骤s1034，利用下面公式（3），根据每一个最终视频流子数据包以及该视频总数据量，对每一个最终视频流子数据包进行校验，以此确定每一个最终视频流子数据包是否存在数据丢失；（3）在上述公式（3）中，表示对每一个最终视频流子数据包进行校验的校验值；表示
该视频总数据量；表示第a个最终视频流子数据包的视频数据量；当，表示每一个最终视频流子数据包不存在数据丢失；当，表示其中一个最终视频流子数据包存在数据丢失，此时重新执行上述步骤s1031至s1034，直到为止。
19.上述技术方案的有益效果为：上述过程对视频流数据进行数据分块处理是为了简化视频流数据的长度和数据量，从而对视频流数据进行快速处理；为了保证进行数据分块处理后得到的每一个视频流子数据包对应的视频播放时间和视频数据量都限定在特定的数值范围内，需要对视频流数据进行限制性分块。其中，利用上述公式（1）根据视频流数据的总视频播放时间和单个最终视频流子数据包可以储存的视频最长播放时间对视频流数据按照时间进行初步分块，进而可以保证所述视频流数据在进行分块处理的过程中以及分块后不会破坏每一帧视频影像画面的播放连续性，从而最大限度的保证在进行分块处理前后数据的完整性以及分块的可靠性；利用上述公式（2）根据单个最终视频流子数据包可以储存的最大视频数据量对初步分块后的视频流子数据包进行二次分块，进而完成对视频流数据的分块处理，并且得到的每个最终视频流子数据包可以满足播放时长以及数据大小的限制要求，进而方便后续对视频流子数据包的进一步处理；利用上述公式（3）根据每一个最终视频流子数据包以及所述视频总数据量对此次分块过程进行校验，以保证数据分块处理的准确性以及可靠性。
20.优选地，在该步骤s2中，从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对该声音信息进行语音识别处理，从而得到该声音信息对应的语义文字信息；对该视频影像信息进行图像帧识别处理，从而得到该视频影像信息对应的图像帧画面信息具体包括：步骤s201，通过该数字资产管理终端对每个视频流子数据包进行声音与视频影像分离提取处理，从而得到相应的声音信息和视频影像信息；步骤s202，按照该声音信息的播放时间先后顺序，对该声音信息进行语音识别处理，从而得到与该声音信息的播放时间轴一致对应的语义文字信息；步骤s203，按照该视频影像信息的播放时间先后顺序，对该视频影像信息进行图像帧识别处理，从而得到与该视频影像信息的播放时间轴一致对应的图像帧画面信息；其中，该图像帧画面信息包括若干按照该视频影像信息的播放时间轴依次排列的图像帧。
21.上述技术方案的有益效果为：每个视频流子数据包均包括声音信息成分和视频影像成分，通过对视频流子数据包进行声音信息成分和视频影像成分的分离提取处理，可得到相应的声音信息和视频影像信息；其中该分离提取处理可为但不限于是现有技术常用的视频声画分离处理方式，这里不做详细的累述。
22.当提取得到该声音信息后，按照该声音信息对应的播放时间先后顺序，对该声音信息进行语音识别处理，这样可保证得到的语义文字信息的排布顺序与该声音信息的播放时间轴是相一致的，从而便于后续对任意语义文字进行准确的时间标定。
23.当提取得到该视频影像信息后，按照该视频影像信息对应的播放时间先后顺序，对该视频影像信息进行图像帧识别处理，这样可保证得到的图像帧画面信息的排布顺序与该视频影像信息的播放时间轴是相一致，从而便于后续对任意图像帧画面进行准确的时间
标定。
24.优选地，在该步骤s3中，对该语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对该图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据该第一出现状态和/或该第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理具体包括：步骤s301，将该语义文字信息与预设关键词进行比对，以此确定预设关键词在该语义文字信息中的出现位置；再根据该出现位置和该声音信息的播放时间轴，确定预设关键词在该声音信息中的播放时间点，以此作为该第一出现状态；步骤s302，将该图像帧画面信息中的每个图像帧进行图形识别处理，以此确定每个图像帧是否存在预设图形；当图像帧存在预设图形，则结合该视频影像信息的播放时间轴确定对应的图像帧在该视频影像信息中的播放时间点，以此作为该第二出现状态；步骤s303，根据该第一出现状态和/或该第二出现状态，在该视频播放平台播放视频流数据过程中标定出预设关键词在该声音信息中的播放时间点和/或预设图像图形在该视频影像信息中的播放时间点，从而在相应的播放时间点上对包含预设关键词的声音信息进行声音屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理。
25.上述技术方案的有益效果为：将该语义文字信息与预设关键词进行比对，即可确定该语义文字信息中是否出现预设关键词，其中该预设关键词可为但不限于是不文明用语关键词等，随后结合预设关键词在该语义文字信息中的出现位置和该声音信息的播放时间轴，即可确定预设关键词出现时对应的播放时间点。而将该图像帧画面信息进行图像识别处理，即可确定该图像帧画面信息的每个图像帧是否出现预设图形，其中该预设图形可为但不限于是特定形状的图形，随后结合出现预设图形的图像帧的出现位置和该视频影像信息的播放时间轴，即可确定出现预设图形的图像帧出现时对应的播放时间点。
26.最后，以上述两种播放时间点作为基准，从视频流数据标定出预设关键词在该声音信息中的播放时间点和/或预设图像图形在该视频影像信息中的播放时间点，并且在相应的播放时间点上对包含预设关键词的声音信息进行声音屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理，这样能够逐一地和全面地对该视频流数据进行排查加工，从而提高视频影像进行声音/画面处理的效率和可靠性。
27.参阅图2，为本发明实施例提供的基于数字资产管理的视频数据加工系统的结构示意图。该基于数字资产管理的视频数据加工系统包括通信连接关系构建模块、视频流数据采集与分块模块、视频流声像处理模块和视频流声像屏蔽处理模块；其中，该通信连接关系构建模块用于构建数字资产管理终端与视频播放平台之间的通信连接；该视频流数据采集与分块模块用于采集视频播放平台待播放的视频流数据；并对该视频流数据进行数据分块处理，从而得到若干视频流子数据包；该视频流声像处理模块用于从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对该声音信息进行语音识别处理，从而得到该声音信息对应的语义文字信息；对该视频影像信息进行图像帧识别处理，从而得到该视频影像信息对应的图像帧画面信息；该视频流声像屏蔽处理模块用于对该语义文字信息进行关键词识别处理，以此确
定预设关键词在视频流数据中的第一出现状态；对该图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据该第一出现状态和/或该第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理。
28.上述技术方案的有益效果为：该基于数字资产管理的视频数据加工系统通过采集视频播放平台待播放的视频流数据，并将其分块为若干视频流子数据包；再对每个视频流子数据包中的声音信息和视频影像信息分别进行语音识别处理和图像帧识别处理，以此得到相应的语义文字信息和图像帧画面信息；最后，确定预设关键词和预设图形在视频流数据各自的出现时间状态，这样能够在视频流数据中对预设关键词和预设图形进行准确的时间定位，以便于后续在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理，其通过对视频流数据进行细分以确保全面排查其中存在的预设关键词和预设图形，这样能够在短时间内对视频流数据进行自动化的加工处理，从而提高对视频影像进行声音/画面处理的效率和可靠性。
29.优选地，该通信连接关系构建模块用于构建数字资产管理终端与视频播放平台之间的通信连接具体包括：通过数字资产管理终端向视频播放平台发送控制连接邀约指令；当该视频播放平台处于开启状态时，向该数字资产管理终端返回邀约答应消息；其中，该邀约答应消息包括该视频播放平台的平台身份信息；当该数字资产管理终端根据该邀约答应消息对该视频播放平台成功进行身份识别验证后，建立该数字资产管理终端与该视频播放平台之间的通信连接；以及，该视频流数据采集与分块模块用于采集视频播放平台待播放的视频流数据；并对该视频流数据进行数据分块处理，从而得到若干视频流子数据包具体包括：在该视频播放平台的后台上采集其待播放的视频流数据；获取该视频流数据的总视频播放时间和视频总数据量；并根据该总视频播放时间和该视频总数据量，对该视频流数据进行数据分块处理，从而得到若干视频流子数据包。
30.上述技术方案的有益效果为：该数字资产管理终端可为数字资产管理人员所使用的智能手机等移动终端；该视频播放平台可包括视频播放控制服务器和视频播放器。该移动终端能够与该视频播放控制服务器进行通信连接，并且还能够对该视频播放控制服务器内存储的视频流数据进行加工处理，最后将加工处理后的视频流数据通过该视频播放器的播放屏幕进行播放。
31.该视频播放平台可与不同数字资产管理人员所使用的移动终端进行通信连接。在通信连接之前，该数字资产管理终端可向该视频播放平台进行连接邀约，当该视频播放平台处于开启状态并且当前并未与其他数字资产管理平台连接时，该视频播放平台会通过其对应的视频播放控制服务器返回相应的邀约答应消息；接着该视频播放控制服务器会对该邀约答应消息中的平台身份信息进行身份识别验证，即将该平台身份信息与预设身份信息白名单进行比对，若该平台身份信息存在于预设身份信息白名单中，则表明身份识别验证成功，随后即可建立该数字资产管理终端与该视频播放平台之间的无线通信连接。该数字资产管理终端能够在该视频播放控制服务器的视频数据库中采集该视频播放平台即将播放的视频流数据。最后，根据该视频流数据的总视频播放时间和视频总数据量（即视频总数据比特量），对其进行数据分块处理，这样能够得到若干视频流子数据包，通过将容量较大
的视频流数据分切为若干容量适中的若干视频流子数据包，这样能够避免对该视频流数据整体进行分析而导致分析遗漏的情况发生，同时还能够对多个视频流子数据包进行并行处理以此提高视频数据加工的效率。
32.优选地，该视频流声像处理模块用于从每个视频流子数据包中提取得到相应的声音信息和视频影像信息；对该声音信息进行语音识别处理，从而得到该声音信息对应的语义文字信息；对该视频影像信息进行图像帧识别处理，从而得到该视频影像信息对应的图像帧画面信息具体包括：通过该数字资产管理终端对每个视频流子数据包进行声音与视频影像分离提取处理，从而得到相应的声音信息和视频影像信息；按照该声音信息的播放时间先后顺序，对该声音信息进行语音识别处理，从而得到与该声音信息的播放时间轴一致对应的语义文字信息；按照该视频影像信息的播放时间先后顺序，对该视频影像信息进行图像帧识别处理，从而得到与该视频影像信息的播放时间轴一致对应的图像帧画面信息；其中，该图像帧画面信息包括若干按照该视频影像信息的播放时间轴依次排列的图像帧。
33.上述技术方案的有益效果为：每个视频流子数据包均包括声音信息成分和视频影像成分，通过对视频流子数据包进行声音信息成分和视频影像成分的分离提取处理，可得到相应的声音信息和视频影像信息；其中该分离提取处理可为但不限于是现有技术常用的视频声画分离处理方式，这里不做详细的累述。
34.当提取得到该声音信息后，按照该声音信息对应的播放时间先后顺序，对该声音信息进行语音识别处理，这样可保证得到的语义文字信息的排布顺序与该声音信息的播放时间轴是相一致的，从而便于后续对任意语义文字进行准确的时间标定。
35.当提取得到该视频影像信息后，按照该视频影像信息对应的播放时间先后顺序，对该视频影像信息进行图像帧识别处理，这样可保证得到的图像帧画面信息的排布顺序与该视频影像信息的播放时间轴是相一致，从而便于后续对任意图像帧画面进行准确的时间标定。
36.优选地，该视频流声像屏蔽处理模块用于对该语义文字信息进行关键词识别处理，以此确定预设关键词在视频流数据中的第一出现状态；对该图像帧画面信息进行图形识别处理，以此确定预设图形在视频流数据中的第二出现状态；根据该第一出现状态和/或该第二出现状态，在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理具体包括：将该语义文字信息与预设关键词进行比对，以此确定预设关键词在该语义文字信息中的出现位置；再根据该出现位置和该声音信息的播放时间轴，确定预设关键词在该声音信息中的播放时间点，以此作为该第一出现状态；将该图像帧画面信息中的每个图像帧进行图形识别处理，以此确定每个图像帧是否存在预设图形；当图像帧存在预设图形，则结合该视频影像信息的播放时间轴确定对应的图像帧在该视频影像信息中的播放时间点，以此作为该第二出现状态；根据该第一出现状态和/或该第二出现状态，在该视频播放平台播放视频流数据过程中标定出预设关键词在该声音信息中的播放时间点和/或预设图像图形在该视频影像信息中的播放时间点，从而在相应的播放时间点上对包含预设关键词的声音信息进行声音
屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理。
37.上述技术方案的有益效果为：将该语义文字信息与预设关键词进行比对，即可确定该语义文字信息中是否出现预设关键词，其中该预设关键词可为但不限于是不文明用语关键词等，随后结合预设关键词在该语义文字信息中的出现位置和该声音信息的播放时间轴，即可确定预设关键词出现时对应的播放时间点。而将该图像帧画面信息进行图像识别处理，即可确定该图像帧画面信息的每个图像帧是否出现预设图形，其中该预设图形可为但不限于是特定形状的图形，随后结合出现预设图形的图像帧的出现位置和该视频影像信息的播放时间轴，即可确定出现预设图形的图像帧出现时对应的播放时间点。
38.最后，以上述两种播放时间点作为基准，从视频流数据标定出预设关键词在该声音信息中的播放时间点和/或预设图像图形在该视频影像信息中的播放时间点，并且在相应的播放时间点上对包含预设关键词的声音信息进行声音屏蔽处理和/或对包含预设图像的视频影像信息进行影像画面模糊化屏蔽处理，这样能够逐一地和全面地对该视频流数据进行排查加工，从而提高视频影像进行声音/画面处理的效率和可靠性。
39.从上述实施例的内容可知，该基于数字资产管理的视频数据加工方法和系统通过采集视频播放平台待播放的视频流数据，并将其分块为若干视频流子数据包；再对每个视频流子数据包中的声音信息和视频影像信息分别进行语音识别处理和图像帧识别处理，以此得到相应的语义文字信息和图像帧画面信息；最后，确定预设关键词和预设图形在视频流数据各自的出现时间状态，这样能够在视频流数据中对预设关键词和预设图形进行准确的时间定位，以便于后续在视频播放平台播放视频流数据过程中进行声音屏蔽和/或影像画面屏蔽处理，其通过对视频流数据进行细分以确保全面排查其中存在的预设关键词和预设图形，这样能够在短时间内对视频流数据进行自动化的加工处理，从而提高对视频影像进行声音/画面处理的效率和可靠性。
40.显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种带3R放大功能的光缆主备路由控制器的制作方法

基于数字资产管理的视频数据加工方法和系统与流程

相关文献

最热文献