一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据预处理系统、方法、电子设备及存储介质与流程

2022-12-20 00:49:48 来源:中国专利 TAG:


1.本技术涉及数据预处理技术领域,特别涉及一种数据预处理系统、方法、电子设备及存储介质。


背景技术:

2.在智能驾驶领域蓬勃发展的今天,算法已经成为智能驾驶的核心。但是,高质量的算法需要依托大量数据的训练,因此,提高算法训练的效率和质量,会极大促进算法迭代,推动智能驾驶技术的发展。由于算法训练需要大量的、带有特定标注信息的图像数据,因此,图像数据的预处理是算法训练的必要环节。
3.然而,现阶段数据预处理一般存在以下几个问题,第一,原始图片直接采用手工标注,缺少机器辅助标注;第二,图片中存在大多数相似或相同图片,标注员重复标注,耗费了大量时间和精力,却没有明显的效果提升;第三,从原始视频到算法训练,各个环节割裂不统一,造成流程性的效率低下,因此,当前算法整体存在效率不高、数据冗余、质量低下的问题,亟待解决。


技术实现要素:

4.本技术提供一种数据预处理系统、方法、电子设备及存储介质,以解决相关技术中的预处理算法效率不高、数据冗余、质量低下等问题。
5.本技术第一方面实施例提供一种数据预处理系统,包括:数据管理模块,用于读取并存储车辆的原始视频数据,并根据当前业务需求对所述原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据;自动标注模块,用于根据接收到的标注请求自动标注所述待标注图像数据,得到初始标注图像数据;以及校准标注模块,用于根据所述当前业务需求判断所述初始标注图像数据内的标注是否满足预设修改条件,并在所述初始标注图像数据内的标注满足所述预设修改条件时,根据所述当前业务需求修改所述初始标注图像数据,得到最终标注图像数据。
6.根据上述技术手段,通过三种模块的功能采集,得到待标注图像的数据及修改条件,从而提高了数据处理的精度和效率。
7.进一步地,在本技术的一个实施例中,所述校准标注模块还用于在所述初始标注图像数据内的标注不满足所述预设修改条件时,将所述初始标注图像数据作为所述最终标注图像数据。
8.根据上述技术手段,通过对修改条件的判定对初始标注图像进行相应的修改,从而提高了数据处理的效率和可靠性。
9.进一步地,在本技术的一个实施例中,上述的数据预处理系统,还包括:基础服务模块,所述基础服务模块用于为所述用户提供数据库、算法和存储服务。
10.根据上述技术手段,可以为用户实时的进行业务调用。
11.进一步地,在本技术的一个实施例中,上述的数据预处理系统,还包括:显示模块,
用于显示所述原始视频数据、所述待标注图像数据、所述初始标注图像数据和所述最终标注数据。
12.根据上述技术手段,通过显示模块,提高了待标注数据的可视化。
13.进一步地,在本技术的一个实施例中,上述的数据预处理系统,还包括:设置于所述数据管理模块和所述自动标注模块之间的通讯模块,所述通讯模块设置有预设通信方式和预设通讯协议,使得所述数据管理模块直接向所述自动标注模块发起所述标注请求。
14.根据上述技术手段,通过采用通讯模块,提高了数据的处理周期。
15.本技术第二方面实施例提供一种数据预处理方法,包括以下步骤:读取并存储车辆的原始视频数据,并根据当前业务需求对所述原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据;根据接收到的标注请求自动标注所述待标注图像数据,得到初始标注图像数据;以及根据所述当前业务需求判断所述初始标注图像数据内的标注是否满足预设修改条件,并在所述初始标注图像数据内的标注满足所述预设修改条件时,根据所述当前业务需求修改所述初始标注图像数据,得到最终标注图像数据。
16.进一步地,在本技术的一个实施例中,上述的数据预处理方法,还包括:在所述初始标注图像数据内的标注不满足所述预设修改条件时,将所述初始标注图像数据作为所述最终标注图像数据。
17.进一步地,在本技术的一个实施例中,上述的数据预处理方法,还包括:显示所述原始视频数据、所述待标注图像数据、所述初始标注图像数据和所述最终标注数据。
18.本技术第三方面实施例提供一种车辆,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的数据预处理方法。
19.本技术第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的数据预处理方法。
20.本技术实施例可以通过数据管理模块、自动标注模块和校准标注模块,对车辆的原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据并自动标注,得到初始标注图像数据,根据当前业务需求判断初始标注图像数据内的标注满足预设修改条件时,则对其修改初始标注图像数据,得到最终标注图像数据。由此,解决了相关技术中的预处理算法效率不高、数据冗余、质量低下等问题。
21.本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
22.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
23.图1为根据本技术实施例提供的一种数据预处理系统的示例图;
24.图2为根据本技术一个实施例的算法训练场景下的数据预处理系统结构示意图;
25.图3为根据本技术一个实施例的数据预处理系统的整体流程图;
26.图4为根据本技术实施例的数据预处理方法的流程图;
27.图5为根据本技术实施例的电子设备的结构示意图。
28.附图标记说明:10-车辆的多传感器目标融合装置;100-数据管理模块、200-自动标注模块、300-校准标注模块。
具体实施方式
29.下面详细描述本技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
30.下面参考附图描述本技术实施例的数据预处理系统、方法、电子设备及存储介质。针对上述背景技术中提到的相关技术中的预处理算法效率不高、数据冗余、质量低下的问题,本技术提供了一种数据预处理系统,在该系统中,通过数据管理模块、自动标注模块和校准标注模块,对车辆的原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据并自动标注,得到初始标注图像数据,根据当前业务需求判断初始标注图像数据内的标注满足预设修改条件时,则对其修改初始标注图像数据,得到最终标注图像数据,通过集成多种数据处理方式与数据传输协议,实现数据预处理系统与算法训练系统的紧密集成,实现对原始数据从预处理到算法训练的全链路流转,从而简化系统复杂性,缩短数据处理周期,提高数据的处理效率和可靠性。由此,解决了相关技术中的预处理算法效率不高、数据冗余、质量低下等问题。
31.具体而言,图1为本技术实施例所提供的一种数据预处理系统的方框示意图。
32.如图1所示,该数据预处理系统10包括:数据管理模块100、自动标注模块200和校准标注模块300。
33.其中,数据管理模块100,用于读取并存储车辆的原始视频数据,并根据当前业务需求对原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据;自动标注模块200,用于根据接收到的标注请求自动标注待标注图像数据,标注结果可以被标注系统所读取,从而得到初始标注图像数据;校准标注模块300,用于根据当前业务需求判断初始标注图像数据内的标注是否满足预设修改条件,并在初始标注图像数据内的标注满足预设修改条件时,根据当前业务需求修改初始标注图像数据,得到最终标注图像数据。
34.进一步地,在本技术的一个实施例中,上述的数据预处理系统10,还包括:基础服务模块。其中,基础服务模块用于为用户提供数据库、算法和存储服务。
35.具体地,本技术实施例中,数据管理模块100根据当前业务需求对原始视频数据执行视频抽帧的过程中,用户可以对抽帧的频率以及抽帧的视角进行自定义选择,同时数据预处理系统10对抽帧数据进行同步存储。
36.其中,抽帧数据的存储可以通过基础服务模块实现,通过将拉取到的实时图像数据通过网络协议,如http(hypertext transfer protocol,超文本传输协议)、ftp(file transfer protocol,文件传输协议)、tcp(transmission control protocol,传输控制协议)族、udp(user datagram protocol,用户数据报协议)族、rpc(remote procedure call protocol,远程过程调用协议)、ptp(picture transfer protocol,图片传输协议)和自定义协议等,存储到数据库中。
37.需要说明的是,数据管理模块100在首次抽帧时会存储全帧率数据,因而后续抽帧只需存储数据关系即可,从而有效减少了存储空间的占用率。
38.进一步地,本技术实施例的数据管理模块100在图像清洗环节中,用户首先可以快速预览帧的结果数据,基于抽帧的视角数据,删除与视频数据相似性、重复性等无关场景的图片,以减少数据冗余及后续重复标注的情况,同时为后续的标注提高了质量和效率;其次,在数据清洗完成后,数据预处理系统10基于抽帧视角,可以自动同步其他视角的数据,以保证各视角数据采集时间的一致性。
39.进一步地,在本技术的一个实施例中,上述的数据预处理系统10,还包括:设置于数据管理模块和自动标注模块之间的通讯模块,通讯模块设置有预设通信方式和预设通讯协议,使得数据管理模块直接向自动标注模块发起标注请求。
40.具体地,如图2所示,本技术实施例的数据预处理系统10,通过集成了语义分割和目标检测等算法,提供了对数据自动标注的功能,以用于对图像进行标注并识别标注的结果,从而加速标注数据的流转;同时,算法还可以被实时进行业务调用,以提供图像数据存储的存储方案。
41.进一步地,如图3所示,本技术实施例的数据预处理系统10可以设置一个设置于数据管理模块100和自动标注模块之间的通讯模块,用户基于数据管理模块100,并依托特有通信方式和通讯协议,可以直接发起数据标注请求,同时自动标注模块接收请求,并通过ai(artificial intelligence,人工智能)对图像数据进行预标注,即初始标注,在完成图像数据的预标注后,通过接口反馈图像数据的预标注结果给数据管理模块100,即可完成一次自动标注任务。
42.进一步地,在本技术的一个实施例中,校准标注模块300还用于在初始标注图像数据内的标注不满足预设修改条件时,将初始标注图像数据作为最终标注图像数据。
43.其中,预设修改条件可以根据实际业务情况自行设定,在此不做具体限定。
44.具体地,当本技术实施例所需要标注的图像数据通过自动标注模块标注完成后,数据预处理系统10会自动读取自动标注的结果文件,并可视化展示自动标注的结果,此时,若初始标注图像数据内的标注满足预设修改条件,则用户可以根据实际业务情况,对已标注好的图像数据进行调整修改,在人工标注确认无误后,图像数据依托网络协议,可以直接流转至算法训练系统,从而得到图像数据最终的标注结果,以供算法训练时所使用;若初始标注图像数据内的标注不满足预设修改条件,则说明上述自动标注模块对于图像数据的初始标注满足当前的实际业务情况,因此,将初始标注图像数据作为最终标注图像数据,以实现用户需求。
45.由此,通过自动标注以及人工标注的结合,既降低了人工标注成本,又提高了人工标注效率。
46.进一步地,在本技术的一个实施例中,上述的数据预处理系统10,还包括:显示模块。其中,显示模块用于显示原始视频数据、待标注图像数据、初始标注图像数据和最终标注数据。
47.具体地,本技术实施例的数据预处理系统10还可以通过显示模块管理和显示获取的原始视频数据、待标注图像数据、初始标注图像数据和最终标注数据,同时,也可以查看不同数据的状态、处理进程以及对标注过程的可视化,从而提高数据的处理效率和数据可
靠性。
48.综上,通过上述对于本技术实施例的论述,其有益效果具体如下:
49.(1)提高数据标注效率、速度慢的问题。系统集成数据清洗、自动标注、人工标注等模块,覆盖了数据从原始数据到已标注数据的全生命周期,数据只需在一个系统中进行业务流转,避免跨系统流转的传输时间损耗,极大提高了数据标注的效率。
50.(2)解决数据重复标注的问题。系统集成数据抽帧、筛选、同步等功能,可以过滤绝大部分重复、无效、场景无关的图片,从源头解决了数据重复标注的问题,提供了标注图片的质量。
51.(3)打通原始视频到训练服务全流程,形成完整的数据链路,依托成熟的数据通信服务,使数据流转更迅速,提供了高效地数据存储服务,只需存储一份数据,从而减少了数据的传输成本和存储成本。
52.根据本技术实施例的数据预处理系统,可以通过数据管理模块、自动标注模块和校准标注模块,对车辆的原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据并自动标注,得到初始标注图像数据,根据当前业务需求判断初始标注图像数据内的标注满足预设修改条件时,则对其修改初始标注图像数据,得到最终标注图像数据,通过集成多种数据处理方式与数据传输协议,实现数据预处理系统与算法训练系统的紧密集成,实现对原始数据从预处理到算法训练的全链路流转,从而简化系统复杂性,缩短数据处理周期,提高数据的处理效率和可靠性。由此,解决了相关技术中的预处理算法效率不高、数据冗余、质量低下等问题。
53.其次参照附图描述根据本技术实施例提出的数据预处理方法。
54.图4是本技术实施例的数据预处理方法的流程图。
55.如图4所示,该数据预处理方法流程图包括以下步骤:
56.步骤s401,读取并存储车辆的原始视频数据,并根据当前业务需求对原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据;
57.步骤s402,根据接收到的标注请求自动标注待标注图像数据,得到初始标注图像数据;以及
58.步骤s403,根据当前业务需求判断初始标注图像数据内的标注是否满足预设修改条件,并在初始标注图像数据内的标注满足预设修改条件时,根据当前业务需求修改初始标注图像数据,得到最终标注图像数据。
59.进一步地,在本技术的一个实施例中,上述的数据预处理方法,还包括:在初始标注图像数据内的标注不满足预设修改条件时,将初始标注图像数据作为最终标注图像数据。
60.进一步地,在本技术的一个实施例中,上述的数据预处理方法,还包括:显示原始视频数据、待标注图像数据、初始标注图像数据和最终标注数据。
61.根据本技术实施例的数据预处理方法,可以通过数据管理模块、自动标注模块和校准标注模块,对车辆的原始视频数据执行视频抽帧、图像清洗和图像筛选操作,得到满足预设条件的待标注图像数据并自动标注,得到初始标注图像数据,根据当前业务需求判断初始标注图像数据内的标注满足预设修改条件时,则对其修改初始标注图像数据,得到最终标注图像数据,通过集成多种数据处理方式与数据传输协议,实现数据预处理系统与算
法训练系统的紧密集成,实现对原始数据从预处理到算法训练的全链路流转,从而简化系统复杂性,缩短数据处理周期,提高数据的处理效率和可靠性。由此,解决了相关技术中的预处理算法效率不高、数据冗余、质量低下等问题。
62.图5为本技术实施例提供的电子设备的结构示意图。该电子设备可以包括:
63.存储器501、处理器502及存储在存储器501上并可在处理器502上运行的计算机程序。
64.处理器502执行程序时实现上述实施例中提供的数据预处理方法。
65.进一步地,电子设备还包括:
66.通信接口503,用于存储器501和处理器502之间的通信。
67.存储器501,用于存放可在处理器502上运行的计算机程序。
68.存储器501可能包含高速ram(random access memory,随机存取存储器)存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
69.如果存储器501、处理器502和通信接口503独立实现,则通信接口503、存储器501和处理器502可以通过总线相互连接并完成相互间的通信。总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component,外部设备互连)总线或eisa(extended industry standard architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
70.可选的,在具体实现上,如果存储器501、处理器502及通信接口503,集成在一块芯片上实现,则存储器501、处理器502及通信接口503可以通过内部接口完成相互间的通信。
71.处理器502可能是一个cpu(central processing unit,中央处理器),或者是asic(application specific integrated circuit,特定集成电路),或者是被配置成实施本技术实施例的一个或多个集成电路。
72.本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的数据预处理方法。
73.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
74.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
75.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺
序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
76.应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。
77.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献