一种数据标注方法、装置、设备及介质与流程

2022-11-30 11:37:01 来源：中国专利 TAG：

技术特征：
1.一种数据标注方法，其特征在于，包括：基于第一数据集中的多张第一图像，确定所述第一图像中目标的类别；确定是否存在第二数据集；所述第二数据集包括多张带有标签的第二图像，所述标签用于指示目标在所述第二图像中的位置和/或目标的类别，所述第二图像中目标的类别与所述第一图像中目标的类别相同；若存在所述第二数据集，将所述第一图像输入训练后的目标检测模型进行预测，获得所述第一图像的标签；其中，所述训练后的目标检测模型通过所述第二数据集对目标检测模型进行训练得到，所述第二数据集包括多张带有标签的第二图像，所述标签用于指示目标在所述第二图像中的位置和/或目标的类别，所述第二图像中目标的类别与所述第一图像中目标的类别相同。2.如权利要求1所述的方法，其特征在于，在将所述第一图像输入训练后的目标检测模型进行预测，获得所述第一图像的标签之前，所述方法还包括：对任一张第二图像进行特征提取，获得所述任一张第二图像的特征，以及对所述任一张第二图像的特征进行预测，获得所述任一张第二图像的预测结果；对任一张第一图像进行特征提取，获得所述任一张第一图像的特征；根据所述任一张第一图像的特征和所述任一张第二图像的特征之间的第一误差、以及所述任一张第二图像的预测结果与对应标签之间的第二误差，调整所述目标检测模型的参数；直到达到最大迭代次数，获得所述训练后的目标检测模型。3.如权利要求1所述的方法，其特征在于，将所述第一图像输入训练后的目标检测模型进行预测，获得所述第一图像的标签，包括：若所述训练后的目标检测模型未达到可用性指标值，则获取所述第一数据集中人工标注的部分图像；其中，所述第一数据集包括所述部分图像和未标注的剩余图像；基于所述部分图像，对所述训练后的目标检测模型的参数进行调整，直到调整后的目标检测模型达到所述可用性指标值；将所述剩余图像输入所述调整后的目标检测模型进行预测，获得所述剩余图像的标签。4.如权利要求1所述的方法，其特征在于，在确定是否存在第二数据集之后，所述方法还包括：若不存在所述第二数据集，则获取所述第一数据集中人工标注的部分图像；其中，所述第一数据集包括所述部分图像和未标注的剩余图像；将所述剩余图像输入训练后的目标检测模型进行预测，获得所述剩余图像的标签；其中，所述训练后的目标检测模型通过所述部分图像和所述剩余图像对所述目标检测模型进行训练得到。5.如权利要求4所述的方法，其特征在于，将所述剩余图像输入所述训练后的目标检测模型进行预测，获得所述剩余图像的标签，包括：若所述训练后的目标检测模型未达到可用性指标值，则对所述部分图像进行傅里叶变换，获得第一幅频图和第一相位图，以及对所述剩余图像进行傅里叶变换，获得第二幅频图和第二相位图；
对所述第一幅频图和所述第二幅频图取均值，获得均值幅频图，以及对所述均值幅频图和所述第一相位图进行傅里叶逆变换，获得增强后的部分图像；基于所述增强后的部分图像，对所述训练后的目标检测模型进行调整，直到调整后的目标检测模型达到所述可用性指标值；将所述剩余图像输入所述调整后的目标检测模型进行预测，获得所述剩余图像的标签。6.如权利要求3或5所述的方法，其特征在于，将所述剩余图像输入所述调整后的目标检测模型进行预测，获得所述剩余图像的标签，包括：将所述剩余图像划分为多份图像子集；当i等于1时，将第i份图像子集中各图像输入所述调整后的目标检测模型进行预测，获得所述第i份图像子集中各图像的标签。7.如权利要求6所述的方法，其特征在于，在将所述剩余图像划分为多份图像子集之后，所述方法还包括：当i大于或等于2时，获取所述第i-1份图像子集中人工纠正且带有正确标签的图像，以及所述第i-1份图像子集对应的指标值；若所述第i-1份图像子集对应的指标值未达到饱和指标值，则基于所述人工纠正且带有正确标签的图像，对第i-1个增量模型进行训练，获得第i个增量模型；其中，当i等于2时，所述第i-1个增量模型为所述调整后的目标检测模型，所述饱和指标值大于所述可用性指标值；将所述第i份图像子集中各图像输入多个增量模型进行预测，获得所述第i份图像子集中各图像的多个预测结果；其中，所述多个增量模型包括所述第i-1个增量模型和所述第i个增量模型；对所述第i份图像子集中各图像的多个预测结果进行加权求和，获得所述第i份图像子集中各图像的标签。8.如权利要求7所述的方法，其特征在于，在将所述第i份图像子集中各图像输入多个增量模型进行预测，获得所述第i份图像子集中各图像的多个预测结果之前，所述方法还包括：从所述部分图像中抽取样本图像，将所述样本图像分别输入所述多个增量模型进行预测，获得所述样本图像的多个预测结果；根据所述样本图像的多个预测结果以及对应标签，获得所述样本图像对应的多个指标值；对所述第i份图像子集中各图像的多个预测结果进行加权求和，获得所述第i份图像子集中各图像的标签，包括：基于所述多个指标值，对所述第i份图像子集中各图像的多个预测结果进行加权求和，获得所述第i份图像子集中各图像的标签。9.一种数据标注装置，其特征在于，包括：确定模块，用于基于第一数据集中的多张第一图像，确定所述第一图像中目标的类别；所述确定模块，还用于确定是否存在第二数据集；所述第二数据集包括多张带有标签的第二图像，所述标签用于指示目标在所述第二图像中的位置和/或目标的类别，所述第二
图像中目标的类别与所述第一图像中目标的类别相同；获得模块，用于若不存在第二数据集，将所述第一图像输入训练后的目标检测模型进行预测，获得所述第一图像的标签；其中，所述训练后的目标检测模型通过第二数据集对目标检测模型进行训练得到。10.一种电子设备，其特征在于，包括：存储器，用于存储程序指令；处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行权利要求1-8中任一项所述的方法。11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时，使所述计算机执行如权利要求1-8中任一项所述的方法。

技术总结
本申请涉及图像处理技术领域，具体涉及一种数据标注方法、装置、设备及介质，用于提高数据标注效率。该方法包括：基于第一数据集中的多张第一图像，确定第一图像中目标的类别，确定是否存在第二数据集，第二数据集包括多张带有标签的第二图像，标签用于指示目标在第二图像中的位置和/或目标的类别，第二图像中目标的类别与第一图像中目标的类别相同。若存在第二数据集，将第一图像输入训练后的目标检测模型进行预测，获得第一图像的标签，训练后的目标检测模型通过第二数据集对目标检测模型进行训练得到。该方法利用相似场景的第二数据集，快速获得训练后的目标检测模型，通过该模型来预测未标注图像的标签，从而提高数据标注效率。效率。效率。

技术研发人员：王仁根马媛媛张朋蔡丹平张学涵虞响陈波扬黄鹏殷俊
受保护的技术使用者：浙江大华技术股份有限公司
技术研发日：2022.08.03
技术公布日：2022/11/29

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种地铁通风空调系统负荷预测方法与流程

一种数据标注方法、装置、设备及介质与流程

相关文献

最热文献