视频处理方法、装置、计算机设备和存储介质

2022-08-21 16:31:41 来源：中国专利 TAG：

1.本技术涉及计算机图像
技术领域：
：，特别是涉及一种视频处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术：
：：2.随着计算机视觉的发展，为人民的生活提供极大的便利，现已成为制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分。3.相关技术中，只能识别出一段视频中的目标对象，无法实现对视频的目标对象的追踪。技术实现要素：4.基于此，有必要针对上述技术问题，提供一种能够能够对目标对象进行追踪和识别的视频处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。5.第一方面，本技术提供了一种应用于服务端的视频处理方法，该方法包括：6.接收客户端上传的待处理视频；7.对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端；8.接收客户端上传的对第一帧待处理图像的标注结果，根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频，并将目标视频发送至客户端。9.在其中一个实施例中，上述根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频包括：10.当标注结果为合格时，对坐标转换后的待处理视频中的目标对象进行识别和追踪并生成目标视频；11.当标注结果为不合格时，根据标注结果中携带的坐标信息对待处理视频进行坐标转换，并对坐标转化后的待处理视频中的目标对象进行识别和追踪并生成目标视频。12.在其中一个实施例中，上述对坐标转换后的待处理视频中的目标对象进行识别和追踪并生成目标视频，包括：13.对待处理视频中的目标对象进行识别，得到待处理视频中每一帧动作识别图像；14.对待处理视频中的目标对象进行追踪，得到待处理视频中每一帧目标追踪图像；15.将每一帧动作识别图像和每一帧目标追踪图像进行匹配，得到每一帧目标图像；16.对每一帧目标图像进行连接，得到目标视频。17.在其中一个实施例中，上述将每一帧动作识别图像和每一帧目标追踪图像进行匹配，得到每一帧目标图像之后，还包括：18.计算目标图像中每一目标对象的特征值；19.针对目标图像中的每一目标对象，根据目标对象的特征值对目标对象进行分类，得到目标对象对应的类别。20.第二方面，本技术还提供了一种应用于客户端的视频处理方法，该方法包括：21.向服务端发送待处理视频；22.接收服务端发送的坐标转换后的第一帧待处理图像，并对坐标转换后的第一帧待处理图像进行判断，生成标注结果，并将标注结果发送至服务端；第一帧待处理图像为服务端对待处理视频进行坐标转换得到；23.接收服务端发送的目标视频，目标视频为服务端根据标注结果对待处理视频中目标对象进行识别和追踪而生成。24.第三方面，本技术还提供了一种应用于服务端的视频处理装置，该装置包括：25.接收模块，用于接收客户端上传的待处理视频；26.坐标转换模块，用于对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端；27.识别模块，用于接收客户端上传的对第一帧待处理图像的标注结果，根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频，并将目标视频发送至客户端。28.第四方面，本技术还提供了一种应用于客户端的视频处理装置，该装置包括：29.发送模块，用于向服务端发送待处理视频；30.标注接收模块，用于接收服务端发送的坐标转换后的第一帧待处理图像，并对坐标转换后的第一帧待处理图像进行判断，生成标注结果，并将标注结果发送至服务端；第一帧待处理图像为服务端对待处理视频进行坐标转换得到；31.目标视频接收模块，用于接收服务端发送的目标视频，目标视频为服务端根据标注结果对待处理视频中目标对象进行识别和追踪而生成。32.第五方面，本技术还提供了一种计算机设备。计算机设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述任意一个实施例中的方法的步骤。33.第四方面，本技术还提供了一种计算机可读存储介质。计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。34.第五方面，本技术还提供了一种计算机程序产品。计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。35.上述视频识别方法、装置、计算机设备、存储介质和计算机程序产品，服务端首先接收客户端上传的待处理视频，然后对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端，由客户端判断第一帧待处理图像的坐标转换效果，并生成标注结果，这样可以保证待处理视频坐标转换的质量，以提高后续生成目标视频的精确度。然后，服务端根据客户端上传的对第一帧待处理图像的标注根据对待处理图像中的目标对象进行追踪和识别，生成能够同时对目标对象进行识别和追踪的目标视频。附图说明36.图1为一个实施例中视频处理方法的应用环境图；37.图2为一个实施例中视频处理方法的流程示意图；38.图3为一个实施例中足球场坐标转换示意图；39.图4为另一个实施例中视频处理方法的流程示意图；40.图5为一个实施例中的目标视频中某一帧的示意图；41.图6为一个实施例中的gui运行示意图；42.图7为一个实施例中的gui界面示意图；43.图8为另一个实施例中的gui界面示意图；44.图9为一个实施例中的qt传输示意图；45.图10为一个实施例中视频处理装置的结构框图；46.图11为另一个实施例中的视频处理装置的结构框图；47.图12为一个实施例中计算机设备的内部结构图。具体实施方式48.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。49.本技术实施例提供的视频处理方法，可以应用于如图1所示的应用环境中。其中，客户端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。服务器104首先接收客户端102上传的待处理视频，然后将待处理视频进行坐标转换，得到坐标转换后的待处理视频，并将坐标转换后的待处理视频中的第一帧待处理图像发送至客户端102，由客户端102根据第一帧待处理图像判断坐标转换效果，并生成标注结果，将标注结果发送至服务端104，服务端104根据标注结果对待处理视频中的目标对象进行追踪和识别并生成目标视频，最后将目标视频发送至客户端102，其中目标视频能够同时实现对目标对象的识别和追踪。其中，客户端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。50.在一个实施例中，如图2所示，提供了一种视频处理方法，以该方法应用于图1中的服务端104为例进行说明，包括以下步骤：51.s202，接收客户端上传的待处理视频。52.其中，待处理视频是指通过摄像机、手机等设备所拍摄的视频，其可以是拍摄任意场景的视频，例如拍摄的足球视频、篮球视频等，不在此做具体限定。53.s204，对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端。54.其中，第一帧待处理图像是指将待处理视频进行坐标转换后，得到的坐标转换后的待处理视频中的第一帧图像。55.具体地，服务端接收客户端上传的待处理视频之后，对待处理视频进行坐标转换，然后将坐标转换后的视频中的第一帧待处理图像发送至客户端，以使客户端通过第一帧待处理图像对坐标转换的质量进行判断。56.在一个实施例中，可以通过预先训练的坐标转换模型，例如坐标转换神经网络对待处理视频进行坐标转换，得到坐标转换后的待处理视频。57.在一个实施例中，具体结合图3所示，图3为一个实施例中足球场坐标转换示意图，左边为拍摄的足球视频中的某一帧图像，其中的足球场图像呈透视状，右边的足球场为正常的矩形，将左边的图像转换为右边的图像的过程称为坐标转换。通过预先训练的坐标转化模型可以将左边足球场图像转换为右边正常矩形的图像。58.在一个实施例中，可以首先对待处理视频中的第一帧待处理图像进行坐标转换后，然后将坐标转换后的第一帧待处理图像发送至客户端，再客户端对第一帧待处理图像的标注结果来对待处理视频继续坐标转换。59.s206，接收客户端上传的对第一帧待处理图像的标注结果，根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频，并将目标视频发送至客户端。60.其中，标注结果是指从客户端上传的客户端对坐标转换后第一针待处理图像的质量判断结果；目标视频是指对待处理视频进行处理得到的，能够对待处理视频中的目标对象进行识别和追踪的视频，其中目标对象是指待处理视频中需要进行识别和追踪的人或物体。61.具体地，服务端接收客户端上传的对第一帧待处理图像的标注结果，然后根据标注结果对待处理视频中的目标对象进行识别和追踪，其中可选地，当标注结果为合格时，可以按照服务端对待处理视频进行坐标转换后得到的坐标转换后的待处理视频继续处理；当标注结果为不合格时，可以根据标注结果中携带的坐标信息对待处理视频进行坐标转换，然后再对坐标转换后的待处理视频中的目标对象进行识别和追踪。具体地，可以根据对目标对象的识别结果以及追踪结果进行匹配后生成目标视频。最后，服务端将生成的目标视频发送至客户端。62.上述视频处理方法中，服务端首先接收客户端上传的待处理视频，然后对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端，由客户端判断第一帧待处理图像的坐标转换效果，并生成标注结果，这样可以保证待处理视频坐标转换的质量，以提高后续生成目标视频的精确度。然后，服务端根据客户端上传的对第一帧待处理图像的标注根据对待处理图像中的目标对象进行追踪和识别，生成能够同时对目标对象进行识别和追踪的目标视频。63.在一个实施例中，上述根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频包括：当标注结果为合格时，对坐标转换后的待处理视频中的目标对象进行识别和追踪并生成目标视频；当标注结果为不合格时，根据标注结果中携带的坐标信息对待处理视频进行坐标转换，并对坐标转化后的待处理视频中的目标对象进行识别和追踪并生成目标视频。64.其中，标注结果是指客户端对从服务端接收的第一帧待处理图像的坐标转换效果进行判断生成的结果，其中可以包括合格和不合格两个标准。65.具体地，当服务端结果的标注结果为合格时，直接对坐标转换后的待处理视频中的目标对象进行识别和追踪，并根据识别结果和追踪结果生成目标视频。当服务端接收的标注结果为不合格时，根据标注结果中携带的坐标信息对待处理视频进行坐标转换，再对根据坐标信息进行坐标转换的待处理视频进行识别和追踪，并根据追踪结果生成目标视频。66.在一个实施例中，服务端可以将根据坐标信息进行坐标转换后，将待处理视频中的第一帧待处理图像发送至客户端，由客户端对第一帧待处理图像的坐标转换效果进行判断，并生成对应的标注结果上传至服务端，服务器再根据标注结果对待处理视频进行坐标转换，然后再将第一帧图像发送至客户端，直至从客户端接收到的标注结果为合格。67.在一个实施例中，首先客户端上传待处理足球视频到服务端，服务端对待处理足球视频进行坐标转换，然后服务端分析出第一帧足球图像后发送至客户端，用户下载球场变换的结果，即第一帧足球图像。然后对第一帧足球图像的转换效果进行判断，生成对应的标注结果。继续结合图3所示，若第一帧足球视频中球场中的预设数量的点能够与右边正常矩形中预设数量的点能够相对应，则判断为合格，否则就通过python(一种编程软件)编写的标定程序生成坐标信息。python标定程序结合预设数量的点的变换推算出pkl文件(坐标信息)，然后客户端将标注结果以及坐标信息上传到服务端进一步分析。其中优选地，预设数量的点为球场四角固定的四个点。68.在上述实施例中，通过根据客户端上传的标注结果作为待处理视频坐标转换的效果，并根据标注结果来决定是否要对待处理视频再次进行坐标转换，这样可以保证待处理视频坐标转换的质量，进而保证生成的目标视频的精确度。69.在一个实施例中，上述对坐标转换后的待处理视频中的目标对象进行识别和追踪并生成目标视频，包括：对待处理视频中的目标对象进行识别，得到待处理视频中每一帧动作识别图像；对待处理视频中的目标对象进行追踪，得到待处理视频中每一帧目标追踪图像；将每一帧动作识别图像和每一帧目标追踪图像进行匹配，得到每一帧目标图像；对每一帧目标图像进行连接，得到目标视频。70.其中，动作识别对象是指对待处理视频中的目标对象进行识别后生成的图像；目标追踪图像是指对待处理视频中的目标对象进行追踪之后生成的图像；目标图像是指将动作识别图像和目标追踪对应中的目标对象进行匹配后生成的图像。71.具体地，服务端对待处理视频中的每一帧待处理图像中的目标对象的动作进行识别，得到对待处理视频中每一帧待处理图像中目标对象的动作进行识别后的动作识别图像，也就是上文中提到的识别结果。其中可选地，可以通过预先训练的动作识别模型对目标对象进行识别，示例性的，如pastanet(pastanet，一种动作识别模型)。72.具体地，服务端对待处理视频中的每一帧待处理图像中的目标对象进行追踪，得到对待处理视频中每一帧待处理图像中目标对象进行追踪后的目标追踪图像，也就是上文中提到的追踪结果。其中可选地，可以通过预先训练的追踪模型对待处理图像中的目标对象进行追踪，示例性的，如yolov5(youonlylookoncev5，一种目标检测模型)。73.需要说明的一点是，对待处理视频中的目标对象进行识别和对待处理视频中的目标对象进行追踪的顺序在此不做限定，即可以先对待处理视频中的目标对象进行识别也可以先对待处理视频中的目标对象进行追踪。74.具体地，在得到待处理视频中每一帧动作识别图像以及每一帧目标追踪图像后，对相应帧动作识别图像和目标追踪图像中的目标对象进行匹配，得到每一帧目标图像。具体地，可以计算动作识别图像和目标追踪图像中目标对象所在检测框的目标计算值，并取最大的目标计算值的目标对象进行匹配。在一个实施例中，将yolov5网络和pastanet网络得到的boundingbox(目标对象的检测框)进行匹配，分别计算对应帧之间的目标对象的检测框的iou(intersectionoverunion，一种测量检测相应物体准确度的标准)值，取iou值最大的目标对象的检测框进行匹配。75.最后，将每一帧目标图像进行连接，得到目标视频。76.在一个实施例中，pasta网络用来得到每个人在不同时刻的动作，但没办法把每个人物相对应(比如运动员b检测到第一帧a在做动作a，但到第二帧的时候，又检测到a’在做动作a，不知道现在的a和a’是不是同一个)，yolov5做目标检测和跟踪，把跟踪到的结果和pasta的输出对应起来，因为yolov5可以知道上一帧的a和当前帧的a’是不是同一个对象，这样就能同时做到识别和跟踪了。77.在上述实施例中，分别对待处理视频中的目标对象进行识别和追踪，得到待处理视频中每一帧动作识别图像和每一帧目标追踪图像，然后将每一帧动作识别图像和每一帧目标追踪图像进行匹配，得到每一帧目标图像，最后将目标图像进行连接，就可以得到同时能对目标对象进行识别和追踪的目标视频。78.在一个实施例中，上述将每一帧动作识别图像和每一帧目标追踪图像进行匹配，得到每一帧目标图像之后，还包括：计算目标图像中每一目标对象的特征值；针对目标图像中的每一目标对象，根据目标对象的特征值对目标对象进行分类，得到目标对象对应的类别。79.其中，特征值是根据目标对象对应的检测框中的某一位置的信息计算获得的，其是作为对目标对象分类的标准。80.具体地，首先计算每一帧目标图像中每一目标对象对应的检测框的中心位置的信息，在本实施例中计算的是检测框中心位置的颜色信息作为特征值，在其他实施例中可以是检测框其他位置的其他信息。在得到待处理视频中每一帧目标图像中每一目标对象的特征值后，对所有帧中同一目标对象的特征值求平均作为该目标对象在视频中的特征值，在其他实施例中，可以通过求方差、求平法差的方式求目标对象在视频中的特征值。然后，按照特征值对目标对象进行分类，得到目标对象对应的类别。示例性地，以足球视频为例，按照特征值对目标对象进行分类，就可以对足球视频中的目标对象，也就是运动员进行分队。这样便于后续对足球竞赛中的战术进行分析。81.在一个实施例中，在计算目标图像中每一目标对象的特征值之前还对目标图像进行降噪处理，其中可选地，可以通过高斯模糊的方式进行降噪，这样可以提高目标图像的信噪比，最大限度保持目标图像的原有信息。82.在一个实施例中，待处理视频为足球视频，采用对每帧图片(每一帧足球目标图像)进行高斯模糊，对运动员(目标对象)在每帧中boundingbox(检测框)中心位置的颜色信息(特征值)进行采样，并在全视频所有帧中取颜色均值作为该人的颜色特征向量。对所得人的颜色向量进行k-means二聚类，得到分队信息。这样能够对足球视频进行各种分析，比如运动员技战术(根据动作识别)，运动员体能(根据跟踪运动员跑到路线)，做这些分析的目的是方便后续教练指定战术。83.在上述实施例中，首先计算目标图像中每一目标对象的特征值，这样是为了取特征值来表示目标对象所在检测框，以便于进行分类；根据目标对象的特征值对目标对象进行分类是为了方便后续对目标视频作更进一步地处理，例如足球战术分析等。84.在一个实施例中，如图4所示，提供了一种视频处理方法，以该方法应用于图1中的服务端102为例进行说明，包括以下步骤：85.s402，向服务端发送待处理视频。86.s404，接收服务端发送的坐标转换后的第一帧待处理图像，并对坐标转换后的第一帧待处理图像进行判断，生成标注结果，并将标注结果发送至服务端；第一帧待处理图像为服务端对待处理视频进行坐标转换得到。87.具体地，客户端接收服务端发送的坐标转换的第一帧待处理图像，并对第一帧待处理图像进行判断，即对第一帧待处理图像坐标转换的质量进行分析，若第一帧足球视频中球场中的预设数量的点能够与右边正常矩形中预设数量的点能够相对应，则判断为合格，否则就通过python编写的标定程序生成坐标信息。python标定程序结合预设数量的点的变换推算出pkl文件(坐标信息)，然后客户端将标注结果以及坐标信息上传到服务端进一步分析。88.s406，接收服务端发送的目标视频，目标视频为服务端根据标注结果对待处理视频中目标对象进行识别和追踪而生成。89.在一个实施例中，结合图5所示，图5为一个实施例中的目标视频中某一帧的示意图，具体地左侧场地为变换后的球场坐标，其中显示出的为一个球队的队员。图中的数字表示球员的编号，数字所在的位置代表视频中球员经过变换后的实际位置。右侧为坐标变换神经网络对球员的姿态估计，其中id字段表示球员的编号，对应左侧图上的数字，id下方的动作表示pastanet对运动员的part-level姿态估计，即每个身体部位的姿态估计。90.在一个实施例中，用户下载mp4文件(目标视频)，打开分析部分的gui进行观看。该分析gui支持逐帧暂停并读写取应帧的球员动作和球队战术。如果想人工修正，还可以点击修改并保存，留以下次观看研究。91.在上述实施例中，客户端首先上传待处理视频，然后接收服务端发送的坐标转换后的第一帧待处理图像，然后对第一帧待处理图像进行坐标转换，并生成标注结果后上传服务端，以用于指示服务端对待处理图像继续进行坐标转换或对待处理图像中的目标对象进行识别和分析，最后接收服务端发送的目标视频，该目标视频是对待处理图像中的目标对象进行识别和追踪后的视频。客户端接收目标视频后，便于用户对目标视频作进一步地处理。92.在一个实施例中，还设计了gui(图像界面)，结合图6所示，图6为一个实施例中的gui运行流程示意图。首先，客户端首先上传要分析的视频(待处理视频)，在接收到连接请求后，服务端会下载视频，并启动神经网络进行分析。分析完成后，服务器通知客户端下载标注的数据，数据下载完成后，客户端可以与服务端进行命令交互，完成重分析等任务，进一步提高精确度。其中usergui为客户端gui，server为服务端，video为视频，labeleddata为数据标签。图7和图8为其他实施例中的gui展示示意图。93.在上述实施例中，通过gui界面可以更方面，更直观地对待处理视频进行处理。94.在一个实施例中，采用qt6(一种程序开发框架)开发客户端gui和服务端框架。本实施例需要展示的数据有：足球视频、标注后的视频、队员位置视频、服务器信息。对于视频的播放，需要精确到帧。恰好，qt6提供了多媒体模块qmediaplayer(qt自带多媒体)，支持视频的拖动，并能逐帧暂停。因此，在视频播放部分，本实施例主体采用qmedia-player，辅以视频控制模块；在文本展示部分，本实施例主体qjson qtablewidget，辅以文件的解析和读写。95.在上述实施例中，通过qt6和qmediaplayer可以方面对目标视频后续的处理，例如对目标视频的战术分析。96.在一个实施例中，端交互须实现客户端发送命令，服务端接收命令并执行，然后将结果返回客户端这几点要求。因此，端交互必须满足实时性、可靠性，故在本实施例中采用qprocess模块配合本实施例中编写的connection模块实现了这个要求。在执行命令时，首先服务器会创建一个qprocess实例，向其中初始化命令，然后运行该进程。当qprocess有输出能够读入时，释放信号。connect-ion的操接受该信号，然后从qprocess实例中读取输出到connection，然connection发给客户端的connection，最终显示在文本编辑栏。97.在一个实施例中，客户端与服务端之间的文件传输继承了ftp的设计思路，即开放多个连接，一个用于传输指令、多个用于传输数据。文件和指令传输模块均基于qt提供的传输层apiqtcpsocket(一种套接字)编写，能做到可靠传输。对于文件传输，本组实现了qt4.0关于文件传输的协议，包括开始时服务端与客户端greeting，每个元数据传输时的询问和确认，以及文件传输完成时的检查。对于指令传输，本组也基于底层qtcpserver进行派生，最终编写成connection类实现了所有功能。具体传输协议与传输结果如图9所示，图9为一个实施例中的qt传输示意图。其中，服务端和客户端的数据传输方式为可靠传输，过程是：客户端向服务端发送连接请求connectrequest，服务端收到请求后同意客户端的连接请求于是返回greeting，客户端接收到greeting后开始向服务端传输数据(transfer)，服务端收到数据后向客户端发送确认收到的信号ack，transfering是表示第一个数据到最后一个数据的传输过程，最后一个数据传输完成后客户端发送ok信号告诉服务端数据发完了，服务端接收到该信号后向客户端发送断开连接的信号bye，客户端同意断开于是向服务端回了个bye信号，服务端继续监听来自其它客户端的连接请求。98.在上述实施例中，将客户端和服务端分开，中间用tcp(transmissioncontrolprotocol，传输控制协议)连接，方便后续将本项目部署在云上。这样既能利用好计算资源，也方便管理。不仅如此，由于计算端需要在linux环境中运行神经网络，用户端和计算端分离的设计也免去了用户配环境的不便。99.应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。100.基于同样的发明构思，本技术实施例还提供了一种用于实现上述所涉及的视频处理方法的视频处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个视频处理装置实施例中的具体限定可以参见上文中对于视频处理方法的限定，在此不再赘述。101.在一个实施例中，如图10所示，提供了一种应用于服务端的视频处理装置，包括：接收模块100、坐标转换模块200和识别模块300，其中：102.接收模块100，用于接收客户端上传的待处理视频。103.坐标转换模块200，用于对待处理视频进行坐标转换，并将坐标转换后的第一帧待处理图像发送至客户端。104.识别模块300，用于接收客户端上传的对第一帧待处理图像的标注结果，根据标注结果对待处理视频中的目标对象进行识别和追踪并生成目标视频，并将目标视频发送至客户端。105.在一个实施例中，上述识别模块300包括：106.标注合格子模块，用于当所述标注结果为合格时，对所述坐标转换后的待处理视频中的目标对象进行识别和追踪并生成目标视频。107.标注不合格子模块，用于当所述标注结果为不合格时，根据所述标注结果中携带的坐标信息对所述待处理视频进行坐标转换，并对所述坐标转化后的待处理视频中的目标对象进行识别和追踪并生成目标视频。108.在一个实施例中，上述标注合格子模块以及上述标注不合格子模块包括：109.图像识别单元，用于对所述待处理视频中的目标对象进行识别，得到所述待处理视频中每一帧动作识别图像。110.图像追踪单元，用于对所述待处理视频中的目标对象进行追踪，得到所述待处理视频中每一帧目标追踪图像。111.图像匹配单元，用于将每一帧所述动作识别图像和每一帧所述目标追踪图像进行匹配，得到每一帧目标图像。112.拼接单元，用于对每一帧所述目标图像进行连接，得到所述目标视频。113.在一个实施例中，上述标注合格子模块以及上述标注不合格子模块包括：114.特征值计算单元，用于计算所述目标图像中每一目标对象的特征值。115.分类单元，用于针对所述目标图像中的每一目标对象，根据所述目标对象的特征值对所述目标对象进行分类，得到所述目标对象对应的类别。116.在一个实施例中，如图11所示，提供了一种应用于服务端的视频处理装置，包括：发送模块400、标注接收模块500和目标视频接收模块600，其中：117.发送模块400，用于向服务端发送待处理视频；118.标注接收模块500，用于接收所述服务端发送的所述坐标转换后的第一帧待处理图像，并对坐标转换后的所述第一帧待处理图像进行判断，生成标注结果，并将所述标注结果发送至所述服务端；所述第一帧待处理图像为所述服务端对所述待处理视频进行坐标转换得到；119.目标视频接收模块600，用于接收所述服务端发送的目标视频，所述目标视频为所述服务端根据所述标注结果对所述待处理视频中目标对象进行识别和追踪而生成。120.上述视频处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。121.在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待处理视频。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频处理方法。122.本领域技术人员可以理解，图12中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。123.在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述任意一个实施例中的方法的步骤。124.在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。125.在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任意一个实施例中的方法的步骤。126.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory，rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistiverandomaccessmemory，mram)、铁电存储器(ferroelectricrandomaccessmemory，fram)、相变存储器(phasechangememory，pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(randomaccessmemory，ram)或外部高速缓冲存储器等。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(staticrandomaccessmemory，sram)或动态随机存取存储器(dynamicrandomaccessmemory，dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。127.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。128.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本技术专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术的保护范围应以所附权利要求为准。当前第1页12当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：包括角度敏感检测器的头戴式显示系统的位置跟踪系统的制作方法

视频处理方法、装置、计算机设备和存储介质

相关文献

最热文献