一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

样本标注方法、装置及计算机存储介质与流程

2022-06-18 01:51:59 来源:中国专利 TAG:


1.本技术实施例涉及数据处理技术领域,特别涉及一种样本标注方法、装置及计算机存储介质。


背景技术:

2.深度学习模型的性能往往随着训练数据量的增大而提升,但是标注数据需要大量人力、时间成本。主动学习算法可以通过模型从未标注数据中找出当前模型不确定的数据,然后人为标注后补充至训练数据中以提升效果。
3.然而,在实际应用中,由于未标注数据的数量非常庞大,且主动学习算法的实施过程较为复杂,导致了样本的筛选效率较低。
4.因此,需要一种可提高处理性能且实施容易的主动学习算法,以提高样本筛选效率。


技术实现要素:

5.鉴于上述问题,本技术提供一种样本标注方法、装置及计算机存储介质,可提高样本筛选效率。
6.本技术第一方面提供一种样本标注方法,包括:利用样本筛选模型的特征提取子模型,获取未标注样本的样本特征;利用所述样本筛选模型的损失预测子模型,根据所述未标注样本的样本特征执行损失预测,获得所述未标注样本的预测损失值;根据预设条件和所述未标注样本的预测损失值,针对满足所述预设条件的所述未标注样本执行样本标注。
7.本技术第二方面提供一种样本标注装置,包括:特征提取模块,用于利用样本筛选模型的特征提取子模型,获取未标注样本的样本特征;损失预测模块,用于利用所述样本筛选模型的损失预测子模型,根据所述未标注样本的样本特征执行损失预测,获得所述未标注样本的预测损失值;样本标注模块,用于根据预设条件和所述未标注样本的预测损失值,若所述未标注样本满足所述预设条件,针对所述未标注样本执行样本标注。
8.本技术第三方面提供一种计算机存储介质,其特征在于,所述计算机存储介质中存储有用于执行上述第一方面所述的样本标注方法中各步骤的各指令。
9.综上所述,本技术各实施例提供的样本标注方案,通过预测样本损失值,可从大量为标注样本中搜索出离群样本并进行标注,以提高样本标注效率并降低样本标注成本。
附图说明
10.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
11.图1为本技术示例性实施例的样本标注方法的处理流程图。
12.图2为本技术另一示例性实施例的样本标注方法的处理流程图。
13.图3为本技术样本标注方法的损失预测子模型的训练架构示意图。
14.图4示出了本技术示例性实施例的样本标注装置的结构框图。
具体实施方式
15.为了使本领域的人员更好地理解本技术实施例中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术实施例一部分实施例,而不是全部的实施例。基于本技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本技术实施例保护的范围。
16.承上在背景技术部分所述,在实际应用中,由于未标注数据的数量非常庞大,且主动学习算法的实施过程较为复杂,导致了样本的筛选效率较低。有鉴于此,本技术提出一种样本标注方法,以改善现有技术中的至少部分问题。
17.以下将结合各附图详细描述本技术的各实施例。
18.图1为本技术示例性实施例的样本标注方法的处理流程图。如图所示,本实施例的样本标注方法主要包括以下步骤:
19.步骤s102,利用样本筛选模型的特征提取子模型,获取未标注样本的样本特征。
20.可选地,未标注样本可包括图片样本。
21.于本实施例中,特征提取子模型可为任意有监督的深度学习模型。
22.可选地,特征提取子模型可基于各特征维度,针对未标注样本执行特征提取,获取未标注样本对应于各特征维度的各特征图。
23.于本实施例中,特征提取子模型可包括多个中间层,不同中间层可基于不同的特征维度,针对未标注样本执行特征提取。
24.步骤s104,利用样本筛选模型的损失预测子模型,根据未标注样本的样本特征执行损失预测,获得未标注样本的预测损失值。
25.可选地,损失预测子模型可根据未标注样本对应于各特征维度的各特征图,获取每一个特征图的特征向量;拼接每一个特征图的特征向量,获取未标注样本的拼接特征,并根据拼接特征执行预测,获得未标注样本的预测损失值。
26.可选地,损失预测子模型包括多个特征向量提取单元,其中,特征向量提取单元的数量与特征图的数量对应,每一个特征向量提取单元包括依次连接的卷积层、池化层、激活层。
27.具体地,损失预测子模型可针对特征提取子模型(例如特征提取子模型的各中间层)输出的具有不同特征维度的不同特征图依次执行卷积、池化、激活处理,以获取每一个特征图的特征向量,再拼接各特征向量,并使用全连接层针对特征向量的拼接结果执行损失预测,以获得未标注样本的预测损失值。
28.步骤s106,根据预设条件和未标注样本的预测损失值,针对满足预设条件的未标注样本执行样本标注。
29.可选地,可根据未标注样本的预测损失值、预设损失阈值,针对满足预设损失阈值的未标注样本执行样本标注。
30.例如,可根据每一个未标注样本的预测损失值进行排序,筛选出损失预测值排名
在前k的未标注样本以作为离群样本,并进行标注。
31.综上所述,本实施例的样本标注方法,通过针对未标注样本执行损失预测,以筛选出未标注样本中的离群样本进行标注,借以提高样本标注效率并降低样本标注成本,其借由本实施例所生成的标注样本,可对模型训练提供较大增益,以提高模型预测结果的鲁棒性。
32.图2示出了本技术另一实施例的样本标注方法中的样本筛选模型的损失预测子模型的具体训练方案。图3示出了本技术损失预测子模型的训练架构示意图。
33.以下将结合图2和图3详细描述本技术损失预测子模型的训练步骤,本实施例主要包括以下步骤:
34.步骤s202,利用训练好的特征提取子模型,针对标注样本执行特征提取,以获得标注样本的样本特征,并针对标注样本执行特征预测,获得标注样本的特征预测值,且根据标注样本的真实标注值和特征预测值,获得样本的真实损失值,并根据标注样本的真实标注值和特征预测值,获得标注样本的真实损失值。
35.可选地,标注样本可包括图片样本,并具有真实标签。
36.可选地,标注样本可包括由两个标注子样本所构成的标注样本对。
37.例如,可针对标注样本池中的各标注子样本进行两两配对,以构成各标注样本对。
38.可选地,特征提取子模型可基于不同的特征维度针对标注样本执行特征提取,获得标注样本对应于各特征维度的各特征图。
39.步骤s204,利用损失预测子模型,根据特征提取子模型输出的样本特征执行损失预测,获得标注样本的预测损失值,并基于真实损失值和预测损失值,确定损失预测子模型的损失函数。
40.可选地,损失预测子模型针对特征提取子模型输出的对应于各特征维度的各特征图进行卷积、池化、激活处理,以获得每一个特征图的特征向量,并拼接每一个特征向量,获得标注样本的拼接特征,并基于拼接特征执行损失预测,获得标注样本的预测损失值。
41.可选地,损失预测子模型也可不加入卷积,而直接针对特征提取子模型输出的对应于各特征维度的各特征图进行池化处理。
42.可选地,可使用均方差的方法,获得损失预测子模型的损失函数,其可表示为:
[0043][0044]
其中,l表示标注样本的真实损失值,表示标注样本的预测损失值。
[0045]
可选地,在标注样本为由两个标注子样本构成的标注样本对的情况下,损失预测子模型的损失函数可表示为:l
branch
=pilog(pi/qi) pjlog(pj/qj)
[0046]
其中,pi=li/(li lj)。
[0047]
其中,(li,lj)表示标注样本对的真实损失值,表示标注样本对的预测损失值。
[0048]
可选地,在标注样本为由两个标注子样本构成的标注样本对的情况下,损失预测
子模型的损失函数也可表示为:子模型的损失函数也可表示为:
[0049]
其中,n表示n个标注样本对,(li,lj)表示标注样本对的真实损失值,表示标注样本对的预测损失值,ξ为预设值。
[0050]
其中,当(l
i-lj)大于ξ时,l
branch
大于0;否则,l
branch
等于0。
[0051]
步骤s206,基于损失预测子模型的损失函数和训练好的特征提取子模型的损失函数,确定样本筛选模型的总损失函数。
[0052]
可选地,特征提取子模型的损失函数可包括交叉熵损失函数、l2范数损失函数、均方差损失函数中的一个。
[0053]
于一实施例中,若特征提取子模型用于执行分类任务,特征提取子模型的损失函数可表示为:
[0054]
其中,表示标注样本的特征预测值,y表示标注样本的真实标注值。
[0055]
于一实施例中,若特征提取子模型用于执行检测任务,特征提取子模型的损失函数可表示为:
[0056]
其中,表示标注样本的特征预测值,y表示标注样本的真实标注值。
[0057]
可选地,样本筛选模型的总损失函数可表示为;
[0058]
其中,l
total
表示样本筛选模型的总损失函数,l
base
表示已训练好的特征提取子模型的损失函数,l
branch
表示损失预测子模型的损失函数,表示标注样本的特征预测值,y表示标注样本的真实标注值,表示预测损失值,l等于用于表示真实损失值,λ为权重参数。
[0059]
于本实施例中,由于特征提取子模型为已训练好模型,因此特征提取子模型的损失函数保持不变。
[0060]
步骤s208,判断总损失函数是否满足预设收敛条件,若是则结束本流程,若否,则返回步骤s202。
[0061]
可选地,可当样本筛选模型的总损失函数趋于稳定时,或者当样本筛选模型的总损失函数收敛至预设值时,可获得总损失函数已满足预设收敛条件的判断结果,其代表损
失预测子模型已训练完成,则可退出本流程。
[0062]
可选地,当判断总损失函数未满足预设收敛条件时,可基于当前的总损失函数针对损失预测子模型进行优化,并返回执行步骤s202。
[0063]
综上所述,本技术实施例利用已训练好的特征提取子模型,协同执行损失预测子模型的训练任务,可以使得损失预测子模型的训练更为容易且收敛更快,以提高损失预测子模型的训练效率。
[0064]
图4示出了本技术示例性实施例的样本标注装置的结构框图。如图所示,本实施例的样本标注装置400主要包括:
[0065]
特征提取模块402,用于利用样本筛选模型的特征提取子模型,获取未标注样本的样本特征。
[0066]
损失预测模块404,用于利用所述样本筛选模型的损失预测子模型,根据所述未标注样本的样本特征执行损失预测,获得所述未标注样本的预测损失值.
[0067]
样本标注模块406,用于根据预设条件和所述未标注样本的预测损失值,若所述未标注样本满足所述预设条件,针对所述未标注样本执行样本标注。
[0068]
可选地,所述未标注样本包括图片样本,特征提取模块402还用于:基于各特征维度,针对所述未标注样本执行特征提取,获取所述未标注样本对应于各所述特征维度的各特征图。
[0069]
可选地,损失预测模块404还用于:根据所述未标注样本对应于各所述特征维度的各特征图,获取每一个特征图的特征向量;拼接每一个特征图的特征向量,获取所述未标注样本的拼接特征;根据所述拼接特征执行预测,获得所述未标注样本的预测损失值。
[0070]
可选地,所述损失预测子模型包括多个特征向量提取单元,所述特征向量提取单元的数量与所述特征图的数量对应,每一个特征向量提取单元包括依次连接的卷积层、池化层、激活层。
[0071]
可选地,样本标注模块406还用于:根据所述未标注样本的预测损失值、预设损失阈值,针对满足所述预设损失阈值的所述未标注样本执行样本标注。
[0072]
可选地,样本标注装置400还包括训练模块,用于样本筛选模型的损失预测子模型,其包括:利用训练好的所述特征提取子模型,针对标注样本执行特征提取,以获得所述标注样本的样本特征,并针对所述标注样本执行特征预测,获得所述标注样本的特征预测值,且根据所述标注样本的真实标注值和所述特征预测值,获得所述标注样本的真实损失值;利用所述损失预测子模型,根据所述特征提取子模型输出的所述样本特征执行损失预测,获得所述标注样本的预测损失值,并基于所述真实损失值和所述预测损失值,确定所述损失预测子模型的损失函数;基于所述损失预测子模型的损失函数和训练好的所述特征提取子模型的损失函数,确定所述样本筛选模型的总损失函数,并基于所述总损失函数,重复执行所述利用训练好的所述特征提取子模型,针对标注样本执行特征预测的步骤,直至所述总损失函数满足预设收敛条件,以完成所述损失预测子模型的训练。
[0073]
可选地,所述样本筛选模型的总损失函数可表示为;
[0074]
其中,所述l
total
表示所述样本筛选模型的总损失函数,所述l
base
表示已训练好的
所述特征提取子模型的损失函数,所述l
branch
表示所述损失预测子模型的损失函数,所述表示所述标注样本的特征预测值,所述y表示所述标注样本的真实标注值,所述表示所述预测损失值,所述l等于所述用于表示所述真实损失值,所述λ为权重参数。
[0075]
可选地,所述特征提取子模型的损失函数包括交叉熵损失函数、l2范数损失函数、均方差损失函数中的一个。
[0076]
可选地,所述标注样本包括由两个标注子样本所构成的标注样本对,所述损失预测子模型的损失函数可表示为:l
branch
=pilog(pi/qi) pjlog(pj/qj)
[0077]
其中,pi=li/(li lj);且其中,所述(li,lj)表示所述标注样本对的真实损失值,所述表示所述标注样本对的预测损失值。
[0078]
可选地,所述标注样本包括由两个标注子样本所构成的标注样本对,所述损失预测子模型的损失函数可表示为:可表示为:
[0079]
其中,所述n表示第n个标注样本对,所述(li,lj)表示所述标注样本对的真实损失值,所述表示所述标注样本对的预测损失值,所述ξ为预设值;其中,当(l
i-lj)大于ξ时,所述l
branch
大于0;否则,所述l
branch
等于0。
[0080]
此外,本实施例的样本标注装置还可用于实现前述各样本标注方法实施例所述的各步骤,在此不予赘述。
[0081]
本技术示例性实施例还提供一种计算机存储介质,所述计算机存储介质中存储有用于执行上述各实施例所述的样本标注方法中各步骤的各指令。
[0082]
综上所述,本技术各实施例所述的样本标注方法、装置及计算机存储介质,通过预设未标注样本的损失,以基于未标注样本的损失预测值,筛选出未标注样本的离群样本以进行标注,借此,本技术可以提高样本标注效率并降低样本标注成本,且利用本技术所生成的标注样本,可为模型训练提供较大的增益效果,以提升模型预测的鲁棒性。
[0083]
最后应说明的是:以上实施例仅用以说明本技术实施例的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献