一种基于相似度距离的船舶轨迹分类方法

2022-05-18 04:58:43 来源：中国专利 TAG：

1.本发明属于船舶技术领域，具体涉及一种船舶轨迹分类方法。

背景技术：

2.为帮助海事监管人员跟踪船舶并确保航行安全,国际海事组织(imo)要求国际航行中总吨位在300以上的船舶、载运量在500总吨以上货物的船舶和不在国际水域的客船，必须配备自动识别系统(ais)。但是，从ais接收到的船只轨迹实时性较低，其时间间隔也是不规则的。同时，由于通信可靠性的原因，ais数据偶尔会丢失，这将会导致船舶轨迹更新暂停。而对于航海者来说，船舶数据的完整性越好，避免事故的响应空间和时间就越充分。因此，有必要针对船舶的运动轨迹进行分类，以加强对船舶的管理。近年来，数据分析和预测建模成为新兴的研究课题。
3.然而传统的分类方法——knn(k-nearest neighbors)算法中的所设计的相似度距离为欧氏距离，而此种相似度距离计算方式并不适用于船舶轨迹之间的聚类。原因是船舶轨迹点数据包含的影响因素较多，不能直接将其视为坐标点之间的距离。这就导致knn算法在船舶轨迹分类上的表现效果不佳。
4.综上所述，如何提升船舶轨迹分类方法的实际效果具有重要的研究意义。

技术实现要素：

5.为了克服现有技术的不足，本发明提供了一种基于相似度距离的船舶轨迹分类方法，首先记录船舶的轨迹点数据，选取基准船舶；计算基准船舶与其它船舶之间的位置相似度距离和速度相似度距离，再将两者合成计算最终相似度距离；用最终相似度距离替换knn中的相似度距离进行训练，得到最佳超参数；再把全部最终相似度距离按照数值大小进行排序，统计生成前k个最终相似度距离值的船舶轨迹点所对应的船舶的mmsi值次数；则mmsi值最多的该船舶与基准船舶为同类。本发明主要针对传统欧氏距离不适用于海上船舶轨迹分类的问题，提高了船舶轨迹分类的准确性和合理性。
6.本发明解决其技术问题所采用的技术方案包括如下步骤：
7.步骤1：记录δt时间段内所有船舶的轨迹点数据，再对轨迹点数据进行预处理，删除离群值、空值；选取一条船舶为基准船舶；
8.步骤2：选取δt时间段内t时刻基准船舶的轨迹点为基准轨迹点；采用式(1)计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的位置相似度距离：
9.distance1＝r*arccos[sin(λ1)sin(λ2) cos(λ1)cos(λ2)cos(l
1-l2)]
ꢀꢀꢀꢀ
(1)
[0010]
其中，r为地球平均半径，l1、l2分别为两个轨迹点的经度，λ1、λ2分别为两个轨迹点的纬度；
[0011]
步骤3：选取t时段船舶sog值，采用式(2)计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的速度相似度距离：
[0012]
distance2＝v
1-v2ꢀꢀꢀꢀ
(2)
[0013]
其中，v1、v2分别为两个轨迹点的航速；
[0014]
步骤4：步骤2和步骤3得到所有船舶轨迹点的位置相似度距离和速度相似度距离组成数据集；
[0015]
步骤5：定义最终相似度距离：
[0016]
d＝a*distance1 (1-a)*distance2ꢀꢀꢀꢀ
(3)
[0017]
其中，a为权重，a∈[0，1]；
[0018]
步骤6：采用留一法确定最佳超参数；
[0019]
在数据集中任选1条作为测试集，其余作为训练集；将knn中的相似度距离用d替换进行训练，得到最佳超参数k和a；
[0020]
步骤7：将a值带入式(3)，计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的最终相似度距离，再把全部最终相似度距离按照数值大小进行排序；
[0021]
步骤8：选取排序后的最终相似度距离列表的前k个值，并统计生成前k个最终相似度距离值的船舶轨迹点所对应的船舶的mmsi值次数；
[0022]
步骤9：返回出现次数最多的船舶mmsi值，则该船舶与基准船舶为同类。
[0023]
本发明的有益效果如下：
[0024]
本发明主要针对传统欧氏距离不适用于海上船舶轨迹分类的问题，提高了船舶轨迹分类的准确性和合理性。
附图说明
[0025]
图1是本发明方法流程图。
[0026]
图2是本发明实施例提供的各参数下方法的分类准确率。
[0027]
图3是本发明实施例提供的分类准确率对比效果图。
具体实施方式
[0028]
下面结合附图和实施例对本发明进一步说明。
[0029]
根据实际环境和船舶轨迹数据，近港口海域船舶密集度高，由于船舶之间存在相互影响的因素，基于相似度距离的分类算法适用于此类场景，但是传统分类方法所涉及的相似度距离，诸如欧式距离、曼哈顿距离等不适用于海上船舶轨迹点的分类，无法较好的衡量轨迹点之间的相似度，故本方法基于knn方法，改进其相似度距离，进行船舶轨迹点分类。
[0030]
如图1所示，一种基于相似度距离的船舶轨迹分类方法，包括如下步骤：
[0031]
步骤1：记录δt时间段内所有船舶的轨迹点数据，再对轨迹点数据进行预处理，删除离群值、空值；选取一条船舶为基准船舶；
[0032]
步骤2：选取δt时间段内t时刻基准船舶的轨迹点为基准轨迹点；采用式(1)计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的位置相似度距离：
[0033]
distance1＝r*arccos[sin(λ1)sin(λ2) cos(λ1)cos(λ2)cos(l
1-l2)]
ꢀꢀꢀꢀ
(1)
[0034]
其中，r为地球平均半径，l1、l2分别为两个轨迹点的经度，λ1、λ2分别为两个轨迹点的纬度；
[0035]
步骤3：选取t时段船舶sog值，采用式(2)计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的速度相似度距离：
[0036]
distance2＝v
1-v2ꢀꢀꢀꢀ
(2)
[0037]
其中，v1、v2分别为两个轨迹点的航速；
[0038]
步骤4：步骤2和步骤3得到所有船舶轨迹点的位置相似度距离和速度相似度距离组成数据集；
[0039]
步骤5：定义最终相似度距离：
[0040]
d＝a*distance1 (1-a)*distance2ꢀꢀꢀꢀ
(3)
[0041]
其中，a为权重，a∈[0，1]；
[0042]
步骤6：采用留一法确定最佳超参数；
[0043]
在数据集中任选1条作为测试集，其余作为训练集；将knn中的相似度距离用d替换进行训练，得到最佳超参数k和a；
[0044]
步骤7：将a值带入式(3)，计算δt时间段内基准轨迹点与所有其它船舶轨迹点之间的最终相似度距离，再把全部最终相似度距离按照数值大小进行排序；
[0045]
步骤8：选取排序后的最终相似度距离列表的前k个值，并统计生成前k个最终相似度距离值的船舶轨迹点所对应的船舶的mmsi值次数；
[0046]
步骤9：返回出现次数最多的船舶mmsi，则该船舶与基准船舶为同类。
[0047]
图2是a取不同值本发明方法的分类准确率。
[0048]
图3是本发明方法与传统knn方法的分类准确率对比效果图。
[0049]
从图中可以看出，本发明方法取得了比较好的效果。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种用于电网数据共享开放的标准化数字经济通用数据构型的制作方法

一种基于相似度距离的船舶轨迹分类方法

相关文献

最热文献