一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于轨迹表示学习的相似度查询优化方法

2022-12-31 15:24:53 来源:中国专利 TAG:

技术特征:
1.基于路网划分的轨迹表示学习和相似度查询方法,其特征在于,包括如下步骤:s1:对路网进行分区,并对每个分区及边界边按顺序排号赋予标签单词,构建词汇表;s2:获取多条原始轨迹,基于上述词汇表,对原始轨迹进行路网匹配,将匹配后的轨迹序列转换为词序列;s3:根据分区结果构建pt-gtree,将步骤s2中匹配后的轨迹存储到pt-gtree最小公共祖先节点中,针对轨迹相似性查询,利用pt-gtree对查询数据库进行剪枝,确定查询候选轨迹集;s4:构建基于gru的编码器-解码器模型,使用步骤s2中的词序列作为输入,经过编码器将其编码为低维的潜在向量v,然后通过解码器解码出一个输出序列y,同时设计一种基于空间和拓扑信息的损失函数对该模型进行训练;s5:利用训练好的编码器-解码器模型将步骤s3中确定的候选轨迹嵌入到低维向量空间,将候选轨迹都表示成向量的形式,使用两个轨迹向量之间的欧氏距离来表示轨迹的相似程度,距离越小轨迹越相似。2.按照权利要求1所述的基于路网划分的轨迹表示学习和相似度查询方法,其特征在于:步骤s1中,利用多层划分算法对路网进行划分,具体的,对路网的顶点和边缘进行粗化来减少网络规模;使用kernighan-lin网络划分算法对粗化的路网图上进行划分形成多个子图;通过设定两个参数m和n进行划分,其中m为每个子图中路网节点的个数;n为划分子图的数量;对子图进行解粗,生成原始网络的最终分区,对最终分区和边界边按顺序编号赋予标签,每个标签对应相应的单词,这些单词组成词汇表。3.按照权利要求1所述的基于路网划分的轨迹表示学习和相似度查询方法,其特征在于:基于pt-gtree索引的轨迹相似度查询剪枝方法如下:利用步骤s2中的分区结果构建pt-gtree,找到所有原始轨迹经过的所有叶子节点,找到所有叶子节点的最小公共祖先节点,并将原始轨迹存储到相应的树节点中;给定一条待查询轨迹,首先找到待查询轨迹经过的所有叶子节点,再根据这些叶子节点找到待查询轨迹的最小公共祖先节点,将最小公共祖先节点和其孩子节点中存储的原始轨迹作为候选集。4.按照权利要求1所述的基于路网划分的轨迹表示学习和相似度查询方法,其特征在于:损失函数如下所示于:损失函数如下所示其中,w是将h
t
从隐藏状态空间投射到单词列表空间的投影矩阵,w
u
表示它的第u行,d(u,y
t
)表示单词之间最短的路网距离,λ是一个距离尺度参数,tk(y
t
)表示接近y
t
的k个单词,t(y
t
)表示拓扑结构上直接与目标单词相连的单词。
5.按照权利要求1所述的基于路网划分的轨迹表示学习和相似度查询方法,其特征在于:步骤s5中,将词序列输入到改进后模型的编码器,通过嵌入和3层gru网络的计算单元将轨迹序列编码为一个低维的潜在向量v;解码器依此计算每个位置上的输出序列的条件概率;具体的,在某一位置上,解码器将该位置之前的输出序列和潜在向量转换为隐藏状态,该隐藏状态保留了词序列和输出序列的序列信息,然后通过隐藏状态预测该位置的输出,最后得到输出序列y,利用损失函数计算输出序列y和目标序列之间的损失,模型根据损失来调整参数,使模型更加准确。

技术总结
本发明公开了一种基于轨迹表示学习的相似度查询优化方法,本发明的轨迹相似度查询是将轨迹表示成向量,在向量空间利用两个向量之间的欧氏距离找到离查询轨迹距离最近的轨迹。本发明提出了一种基于路网分区的轨迹表示学习模型PT2vec,PT2vec考虑了轨迹的空间特征和底层路网的拓扑约束将轨迹嵌入到低维向量空间,设计一个基于空间和拓扑信息的损失函数,加快模型的训练,提高模型准确度,并有效的解决了大规模轨迹相似度计算时间过大的问题。同时为了减小轨迹查询空间,提高查询效率,使用PT-GTree索引对查询数据库中的轨迹进行剪枝。GTree索引对查询数据库中的轨迹进行剪枝。GTree索引对查询数据库中的轨迹进行剪枝。


技术研发人员:李佳佳 王明申 赵颖 李雷
受保护的技术使用者:沈阳航空航天大学
技术研发日:2022.09.27
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献