一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种带有缺失标记的不完备数据的多标记分类方法及装置与流程

2021-10-24 10:35:00 来源:中国专利 TAG:标记 数据 分类 缺失 装置

技术特征:
1.一种带有缺失标记的不完备数据的多标记分类方法,其特征在于,该分类方法包括以下步骤:1)获取含有缺失标记的不完备多标记数据集,并计算数据集中每个样本在每个特征上的邻域半径,得到一个不完备多标记邻域决策系统;2)根据得到的邻域半径,通过样本之间差异性和相似性计算邻域可辨识矩阵和邻域不可辨识矩阵;3)基于邻域可辨识矩阵和邻域不可辨识矩阵,确定样本之间的相似度,由此恢复不完备的信息,并得到所恢复信息的特征权重矩阵;4)根据所述的特征权重矩阵,并结合邻域模糊集和线性回归模型构造新的目标函数;5)采用交替梯度下降策略对新的目标函数进行优化求解,以实现对含有缺失标记的不完备数据的多标记分类。2.根据权利要求1所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤1)中邻域半径的计算公式为:其中,δ

a
(x
i
)为样本x
i
在属性a上的邻域半径,mean(a)是属性a中所有未缺失属性的平均值,f
a
表示属性a中所谓未缺失属性的密度函数,max(f
a
)是密度函数f
a
的最大值,f
a
(x
i
)表示样本x
i
在属性a上所对应的密度函数值。3.根据权利要求1所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述的特征权重矩阵为:其中,iter代表用于恢复样本x
i
的第j个特征所用的迭代次数,iter
max
表示最大迭代次数。4.根据权利要求3所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤4)中建立的新的目标函数为:所述步骤4)中建立的新的目标函数为:其中α,β,γ和λ是超参数,x∈r
m
×
n
为样本集,y∈r
t
×
n
为标记集,b∈r
t
×
t
和w∈r
t
×
m
分别是标记相关性矩阵和特定标记特征矩阵,||w||2和||b||2分别是矩阵w和矩阵b的l

2正则项,tr(byl1y
t
b
t
)是矩阵byl2y
t
b
t
的迹,l2=d2‑
s是一个拉普拉矩阵,s是模糊相似矩阵,d2是一个对角矩阵,且有s
ij
表示样本x
i
和样本x
j
之间的模糊相似度,c表示特征权重矩阵,w
i
和w
j
分别表示矩阵w的第i列和第j列的值,b
ij
表示矩阵b中第i行第j列的值,

表示哈达玛积。5.根据权利要求4所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤5)在求解过程中将新的目标函数划分成w子问题和b子问题,在求解w子问题时,固
定b更新w,计算新的目标函数转换成关于w的偏导数,并按照变量w的迭代梯度下降策略进行求解;在求解b子问题时,固定w更新b,计算新的目标函数转换成关于b的偏导数,并按照变量b的迭代梯度下降策略进行求解。6.根据权利要求3所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤3)的实现过程如下:a.计算样本的差异性和样本的相似性;b.确定缺失属性集合和缺失属性的对象集合;c.根据缺失属性集合和缺失属性的对象集合确定按照样本差异性升序排列的集合以及按照样本相似性降序排列的集合;d.利用样本差异性升序排列的集合与样本相似性降序排列的集合中共有样本的特征均值作为缺失特征的恢复值。7.根据权利要求6所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤a中样本的差异性和样本的相似性的计算公式分别为:所述步骤a中样本的差异性和样本的相似性的计算公式分别为:其中ns(x
i
,x
j
)表示样本x
i
和x
j
的差异性,b为属性集,a
k
∈b,a
k
为样本的属性,m为邻域可辨识矩阵,ps(x
i
,x
j
)表示样本x
i
和x
j
的邻域相似度,表示样本x
i
和x
j
在属性a的邻域半径内的相似性。8.根据权利要求6所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤b中的缺失属性集合为:mas
i
={a
k
|a
k
(x
i
)=*,k=1,

,m},其中a
k
为样本的第k个属性,x
i
和表示样本,符号*代表缺失的特征。9.根据权利要求6所述的带有缺失标记的不完备数据的多标记分类方法,其特征在于,所述步骤b中的缺失属性的对象集合为:其中mas
i
表示缺失属性集合,表示空集。10.一种带有缺失标记的不完备数据的多标记分类装置,其特征在于,该装置包括处理器和存储器,所述处理器执行由所述存储器存储的计算机程序,以实现如上述权利要求1

9任一项所述的带有缺失标记的不完备数据的多标记分类方法。

技术总结
本发明涉及一种带有缺失标记的不完备数据的多标记分类方法及装置,属于数据分类技术领域。本发明首先基于邻域粗糙集理论,通过样本之间的差异性和相似性,构造了邻域可辨识和不可辨识矩阵,以此恢复不完备的信息,并得到所恢复信息的特征权重矩阵;然后基样本之间的模糊相似关系,结合模糊相似关系、回归模型以及特征权重矩阵建立考虑特征之间非线性关系的新的目标函数,并通过梯度下降方法对其进行优化求解,从而实现对带有缺失标记的不完备数据的多标记分类。本发明充分考虑了特征之间的非线性关系,大大提高了带有缺失标记的不完备数据的多标记分类的精度和效率。数据的多标记分类的精度和效率。数据的多标记分类的精度和效率。


技术研发人员:孙林 王天翔 孟慧丽 张艳 齐娜 马媛媛 窦智
受保护的技术使用者:河南师范大学
技术研发日:2021.05.21
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜