一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多路切图准则和蚁群优化的OD流向聚类方法与流程

2021-10-20 00:14:00 来源:中国专利 TAG:流向 多路 准则 优化 方法

技术特征:
1.一种基于多路切图准则和蚁群优化的od流向聚类方法,其特征在于:包括以下步骤:步骤s1:去除od流向数据和poi数据中的重复值、错误值、无意义值,利用mongodb构建od流向库,利用2dsphere indexes建立空间索引;步骤s2:建立流向终点缓冲区,选择缓冲区中的poi点,基于poi数据调用python gensim工具库构建主题分布模型,在此基础上计算语义相似度,并计算od流向空间、时间相似度,最终得到流向时空语义相似度;步骤s3:基于时空语义相似度构建od流向初始无向图复杂网络,提取所有连通分量,利用连通分量识别出噪音和有待聚类的连通分量;步骤s4:基于多路切图准则设计改进启发式函数,结合蚁群信息素正反馈作用,对有待聚类的连通分量,采用多进程并行的方式,一个进程对一个连通分量进行聚类;步骤s5:汇总步骤s4中各进程的聚类结果,得到最终聚类结果。2.根据权利要求1所述的一种基于多路切图准则和蚁群优化的od流向聚类方法,其特征在于:所述步骤s2具体包括以下步骤:步骤s21:根据流向终点建立半径250米的圆形缓冲区,搜索缓冲区内的所有poi点;步骤s22:根据流向编号,将每条流向对应的poi点的类型字段值汇总为一个文档,该文档即为该流向对应的poi语义文档,再将所有流向的语义文档汇总建立语料库,利用语料库调用python gensim工具库对lda主题分布模型进行训练,训练获得语料—主题分布,再将流向语料输入模型进行预测,得到主题—流向,即流向的主题概率分布;步骤s23:根据主题概率分布计算js散度,将js散度作为语义相似度度量,流向i与流向j的语义相似度计算公式如下:j的语义相似度计算公式如下:其中,p
i
、p
j
分别为流向i、j的主题概率分布;p
i
(x)、p
j
(x)分别为流向i,j中x主题的主题概率分布值;步骤s24:计算流向的空间相似度sim
dis
及时间相似度sim
t
;步骤s25:利用高斯核函数对流向语义、时间和空间相似度进行映射,得到od流向时空语义相似度,计算公式如下:3.根据权利要求1所述的一种基于多路切图准则和蚁群优化的od流向聚类方法,其特征在于:所述步骤s3具体包括以下步骤:步骤s31:以流向为网络节点,以两两流向之间的od流向时空语义相似度为边的权重,使用networkx建立无向图复杂网络,提取所有连通分量;步骤s32:根据连通分量的节点数划分分量;小于阈值的归类为噪音分量;大于阈值则
归类为待聚类的连通分量。4.根据权利要求1所述的一种基于多路切图准则和蚁群优化的od流向聚类方法,其特征在于:所述步骤s4具体包括以下步骤:步骤s41:采用多进程并行的方式,一个进程对一个连通分量进行聚类,每个进程均执行步骤s42

步骤s48;步骤s42:根据连通分量的节点个数,建立维度为n*n的初始信息素矩阵,信息素初始值均为1;步骤s43:计算连通分量中每个节点的介数中心性,根据中心性值大小排序,选取前k个点为蚂蚁的初始位置,开始搜索;中心性计算公式如下:其中,表示经过节点i,且为最短路径的路径数量;g
st
表示连接s和t的最短路径的数量;步骤s44:获取蚂蚁所在节点的邻接节点,判断邻接节点是否在禁忌表中,若不在禁忌表中,将该节点加入备选节点列表;步骤s45:遍历备选节点列表,计算基于多路切图准则改进的启发式函数n
ij
(t),并结合信息素pher
ij
(t),计算节点被选取概率在t时刻下,处于结点i的蚂蚁k选择结点j作为下一个结点的概率的计算公式如下:的计算公式如下:的计算公式如下:其中,pher
ij
(t)为信息素因子;n
ij
(t)为启发式函数;sim
ij
为流向时空语义相似度;mncut
(k,ij)
(t)为t时刻选择j节点的多路切图因子;cut(a
(k)
,v

a
(k)
)为a
(k)
类内节点与其他类内节点邻接边的权值之和;assoc(a
(k)
)为a
(k)
类各节点间邻接边的权值之和;步骤s46:依据各备选节点的选取概率,采取轮盘赌方式选择下一节点,同时将选取节点加入禁忌表中;步骤s47:根据蚂蚁选取的节点,进行信息素更新,信息素的更新方程如下:其中,ε为信息素挥发率;为t时刻第k只蚂蚁在ij的边上增加的信息素浓度;c
k
(t)为t时刻第k只蚂蚁所经过边的时空语义相似度;
步骤s48:所有蚂蚁无可选节点时,该轮迭代结束,进入下一轮迭代;直到结果收敛或达到最大迭代次数结束迭代。5.根据权利要求1所述的一种基于多路切图准则和蚁群优化的od流向聚类方法,其特征在于:所述步骤s5具体包括以下步骤:步骤s51:将步骤s4中各进程聚类得到的结果进行汇总,合并为一个结果列表;步骤s52:遍历结果列表,统一输出类别编号,用以避免类别编号重复。

技术总结
本发明涉及一种基于多路切图准则和蚁群优化的OD流向聚类方法,利用流向终点POI构建主题分布模型,计算流向时空语义相似度,构建无向图复杂网络及初始信息素矩阵,提取网络所有连通分量,识别待聚类连通分量,基于多路切图准则和蚁群优化对待聚类的连通分量采用多进程并行的方式,一个进程对一个连通分量进行聚类。汇总步骤各进程的聚类结果,得到最终聚类结果。本发明将无向图复杂网络思想与聚类算法有机结合,采用高斯核函数进行复杂网络简化,利用图连通分量实现噪音自动识别。本发明基于多路切图准则改进了启发式函数,并基于复杂网络思想利用介数中心性筛选蚁群初始节点,有效改善聚类效果。有效改善聚类效果。有效改善聚类效果。


技术研发人员:邬群勇 张晗 朱秋圳
受保护的技术使用者:福州大学
技术研发日:2021.07.12
技术公布日:2021/10/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜