一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于虚拟密度和竞争算法的网格聚类方法

2023-03-28 15:15:05 来源:中国专利 TAG:

技术特征:
1.一种基于虚拟密度和竞争算法的网格聚类方法,其特征在于:包括如下步骤:步骤1、根据数据空间分布和需求确定单元格虚拟密度邻域,虚拟密度邻域中,当前单元格一侧的单元格行或列数记为ev;步骤2、计算数据空间各维的坐标区间,基于坐标区间和ev划分网格;步骤3、统计落在每个网格中数据点的数量,得到单元格密度;步骤4、计算每个单元格的虚拟密度;步骤5、确定聚类阈值;步骤6、高密度网格群形成簇;步骤7、去除含有成员极少的簇;步骤8、采用竞争算法将没有划归到现有簇中的单元格按照竞争规则分配到合适的簇中,完成聚类。2.根据权利要求1所述的基于虚拟密度和竞争算法的网格聚类方法,其特征在于:对于数据空间,a={a1,a2,...,a
r
}是包含n个数据点的r维空间数据集v={v1,v2,...,v
n
}中数据对象的r个属性的有界定义域,w=a1×
a2×
...
×
a
r
是r维空间,其中任一数据元素v
i
={v
i1
,v
i2
,...,v
in
}(i∈1,2,...n)的第j个分量v
ij
∈a
ij
;网格划分时将w的每一维m等分,将w分割成m
r
个网格的单元,称为w的m
r
划分;基于上述划分,第i维上的单元格边长为:l
i
=(max(v
1i
,v
2i
,...,v
ni
)-min(v
1i
,v
2i
,...,v
ni
))/m(i=1,2,...,r);
ꢀꢀꢀꢀꢀ
(1)第1维序号为k1,第2维序号为k2,...第r序号为k
r
个单元格记为cell(k1,k2,...k
r
),任意数据点v
p
={v
p1
,v
p2
,...,v
pn
}i∈(1,2,...r)如果符合:v
pi
∈[l
i
(k
i-1) min(v
1i
,v
2i
,...,v
ni
),l
i
k
i
min(v
1i
,v
2i
,...,v
ni
))(i=1,2,...n)则认为v
p
落入cell(k1,k1,...k
r
);把落入cell(k1,k1,...k
r
)的数据点的数量成为cell(k1,k2,...k
r
)的密度,记为d(cell(k1,k1,...k
r
));其中单元格c1=cell(a1,a2,...a
r
),c2=cell(b1,b2,...b
r
)为任意两个单元格;将直接相邻单元格,即有r-1共同边的两个单元格的距离定义为1,基于欧式距离算法,c1与c2的距离为:以单元格p=cell(k1,k2,...k
r
)为圆心,ε为半径的空间区域作为单元格c的ε-邻域,记作δ
ε
(p);所有满足r
i
∈(k
i-ε,k
i
ε)(i=1,2,...,r)的单元格的集合称为单元格p的ε-邻域;单元格p的虚拟密度是其邻域内各单元格的实际密度加权和:式中,r为权值函数,r(x)∈(0,1),其值随着p
i
与p的距离增大而减小;为计算虚拟密度设置的邻域为虚拟密度邻域,记作δ
ev
,其当前单元格一侧的单元格行或列数用ev表示。3.根据权利要求2所述的基于虚拟密度和竞争算法的网格聚类方法,其特征在于:所述
单元格p的虚拟密度采用如下的权值函数来调整邻域内单元格的贡献率:r(d(p
i
,p
j
))=r/(d 1);式中,r(d(p
i
,p
i
))=1,即当前单元格密度的贡献率为1,r是权值调整系数。4.根据权利要求2所述的基于虚拟密度和竞争算法的网格聚类方法,其特征在于:步骤6中,簇的形成按如下公式进行:其中,当vd(p)<tc并且其直接邻居均不属于任何格簇,则认为当前单元格p不属于任何格簇,其簇号仍然为0;当vd(p)>tc并且其直接邻居均属于簇号为k的格簇,则将单元格p归入该簇号为k的格簇;当vd(p)>tc并且其直接邻居均属于多个格簇,则合并这些集群,并任取其一作为簇号,令其为c
merge
;当vd(p)>tc并且其直接邻居不属于任何格簇,则新建一个格簇,簇号为c
max
1,c
max
是现有格簇的最大簇号。5.根据权利要求1所述的基于虚拟密度和竞争算法的网格聚类方法,其特征在于:步骤7中,设置簇评定阈值clmt,去除单元格少于阈值clmt的高密度单元格群,将高密度单元格数量高于阈值clmt的密度单元格群形成单独的簇。6.根据权利要求1所述的基于虚拟密度和竞争算法的网格聚类方法,其特征在于:步骤8中,所述竞争算法是对于有两个或以上格簇临近的单元格,通过判断该单元格更靠近哪一个格簇来确定其归属;其中为竞争算法设置邻域称为竞争邻域,记作δ
ec
,其当前单元格一侧的单元格行或列数用ec表示。

技术总结
本发明公开了一种基于虚拟密度和竞争算法的网格聚类方法,包括如下步骤:步骤1、根据数据空间分布和需求确定单元格虚拟密度邻域,虚拟密度邻域中,当前单元格一侧的单元格行或列数记为Ev;步骤2、计算数据空间各维的坐标区间,基于坐标区间和Ev划分网格;步骤3、统计落在每个网格中数据点的数量,得到单元格密度;步骤4、计算每个单元格的虚拟密度;步骤5、确定聚类阈值;步骤6、高密度网格群形成簇;步骤7、去除含有成员极少的簇;步骤8、采用竞争算法将没有划归到现有簇中的单元格按照竞争规则分配到合适的簇中,完成聚类。本发明可以对不同数据集有较好的适应能力,避免了网格聚类大量遗漏元素的情况,具有高效率且保证了效果。具有高效率且保证了效果。具有高效率且保证了效果。


技术研发人员:张海波
受保护的技术使用者:浙江水利水电学院
技术研发日:2022.11.22
技术公布日:2023/3/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献