一种船舶异常行为的识别方法、装置、终端和存储介质与流程

2022-07-14 01:36:12 来源：中国专利 TAG：

1.本发明属于计算机技术领域，具体涉及一种船舶异常行为的识别方法、装置、终端和存储介质，尤其涉及一种内河(即位于一个国家区域内的河流)船舶异常行为的识别方法、装置、终端和存储介质。

背景技术：

2.ais(船舶自动识别系统)系统的快速的发展已经在海事领域得到了很广泛的应用。ais收发的信息包括船舶编号、船舶位置、吃水深度、速度、船首向、船舶类型、船舶长宽、载人数目等。ais信息内部包含着丰富的海上船舶轨迹特征属性，这些信息为实现船舶航迹预测提供了重要的数据来源。但是，ais系统的信息播发周期受船舶航行速度的影响，并非固定周期发送，从时间维度上增加了船舶违规行为分析的难度。
3.上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

技术实现要素：

4.本发明的目的在于，提供一种船舶异常行为的识别方法、装置、终端和存储介质，以解决ais系统的信息播发周期受船舶航行速度影响，增加了船舶违规行为分析的难度的问题，达到通过采用固定周期采集ais收发信息，对历史船位数据进行聚类分析并建模，对船舶违规行为进行分析，从而较容易地实现对船舶违规行为的分析的效果。
5.本发明提供一种船舶异常行为的识别方法，包括：按设定采样周期，采样设定水域内所有船舶的航行数据；确定所述设定水域内预先设置的网格模型的编号集合，根据所述设定水域内预先设置的网格模型的编号集合，提取该集合内所有航行数据，作为样本数据；利用所述样本数据，对所述网格模型进行训练，得到所述设定水域内的船舶异常行为识别模型；对设定时长内采集到的所有船舶的航行数据进行聚类分析，得到类型分析结果，记为航道类型；按所述航道类型，对所述设定水域内的船舶异常行为识别模型进行分类，得到所述设定水域内的船舶异常行为分类识别模型；利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，得到分类识别结果。
6.在一些实施方式中，所述设定水域内所有船舶中任一船舶的航行数据，包括：该船舶的位置数据、该船舶的航速、以及该船舶的真航向中的至少之一；每个船舶的位置数据，包括：该船舶的经度、以及该船舶的纬度中的至少之一；采样设定水域内所有船舶的航行数据，包括：利用所述设定水域内所有船舶中任一船舶的北斗船载终端，采集该船舶的经度、该船舶的纬度、该船舶的航速、以及该船舶的真航向中的至少之一。
7.在一些实施方式中，其中，确定所述设定水域内预先设置的网格模型的编号集合，包括：将所述设定水域内所有船舶的航行数据进行网格化，得到所述设定水域内所有船舶的航行数据的所有网格，该所有网格能够分层布置；对每个网格进行编号，得到网格编号；根据所述设定水域内预先设置的每个网格的网格模型、以及所述网格编号，得到所述设定
水域内预先设置的网格模型的编号集合；和/或，对设定时长内采集到的所有船舶的航行数据进行聚类分析，包括：确定所述设定水域内所有船舶的航行数据的所有网格中的指定网格的集合，记为网格集合；选取所述网格集合在设定时长内的航行数据，记为分析数据；采用基于密度的聚类分析算法，对所述分析数据进行聚类分析。
8.在一些实施方式中，所述设定水域内的船舶异常行为分类识别模型，包括：位置异常识别行为模型、轨迹异常识别行为模型、航速和真航向异常识别行为模型、以及申报异常识别行为模型中的至少之一；利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，包括：对航行路过所述设定水域内已具有船舶异常行为分类识别模型的网格区域的船舶，采样该船舶的航行数据；基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别；其中，基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别，包括：基于采样到的该船舶的航行数据，利用所述航速和真航向异常识别行为模型，对该船舶的异常行为进行识别，具体包括：对采样到的该船舶的航行数据进行均值归一化处理和box-cox变换后，利用所述航速和真航向异常识别行为模型对该船舶的航速和真航向的异常行为进行检测：如果所述航速和真航向异常识别行为模型输出的检测结果在设定的置信区间内，则确定该船舶的航速和真航向正常，否则，则确定该船舶的航速和/或真航向异常；
9.基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，采用射线法和基于密度的离群检测算法，识别该船舶的位置异常行为；基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，在该船舶的主电源切断信号接入、且备用电源启动的情况下，检测该船舶的天线状态，以在无法检测到该船舶的天线信号的情况下确定该船舶的轨迹出现异常行为；基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，统计该船舶的所有采用周期内轨迹数据的异常系数，根据该异常系数识别该船舶是否存在申报异常行为。
10.与上述方法相匹配，本发明另一方面提供一种船舶异常行为的识别装置，包括：采样单元，被配置为按设定采样周期，采样设定水域内所有船舶的航行数据；建模单元，被配置为确定所述设定水域内预先设置的网格模型的编号集合，根据所述设定水域内预先设置的网格模型的编号集合，提取该集合内所有航行数据，作为样本数据；利用所述样本数据，对所述网格模型进行训练，得到所述设定水域内的船舶异常行为识别模型；分类单元，被配置为对设定时长内采集到的所有船舶的航行数据进行聚类分析，得到类型分析结果，记为航道类型；按所述航道类型，对所述设定水域内的船舶异常行为识别模型进行分类，得到所述设定水域内的船舶异常行为分类识别模型；识别单元，被配置为利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，得到分类识别结果。
11.在一些实施方式中，所述设定水域内所有船舶中任一船舶的航行数据，包括：该船舶的位置数据、该船舶的航速、以及该船舶的真航向中的至少之一；每个船舶的位置数据，
包括：该船舶的经度、以及该船舶的纬度中的至少之一；所述采样单元，采样设定水域内所有船舶的航行数据，包括：利用所述设定水域内所有船舶中任一船舶的北斗船载终端，采集该船舶的经度、该船舶的纬度、该船舶的航速、以及该船舶的真航向中的至少之一。
12.在一些实施方式中，其中，所述建模单元，确定所述设定水域内预先设置的网格模型的编号集合，包括：将所述设定水域内所有船舶的航行数据进行网格化，得到所述设定水域内所有船舶的航行数据的所有网格，该所有网格能够分层布置；对每个网格进行编号，得到网格编号；根据所述设定水域内预先设置的每个网格的网格模型、以及所述网格编号，得到所述设定水域内预先设置的网格模型的编号集合；和/或，所述分类单元，对设定时长内采集到的所有船舶的航行数据进行聚类分析，包括：确定所述设定水域内所有船舶的航行数据的所有网格中的指定网格的集合，记为网格集合；选取所述网格集合在设定时长内的航行数据，记为分析数据；采用基于密度的聚类分析算法，对所述分析数据进行聚类分析。
13.在一些实施方式中，所述设定水域内的船舶异常行为分类识别模型，包括：位置异常识别行为模型、轨迹异常识别行为模型、航速和真航向异常识别行为模型、以及申报异常识别行为模型中的至少之一；所述识别单元，利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，包括：对航行路过所述设定水域内已具有船舶异常行为分类识别模型的网格区域的船舶，采样该船舶的航行数据；基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别；其中，所述识别单元，基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别，包括：基于采样到的该船舶的航行数据，利用所述航速和真航向异常识别行为模型，对该船舶的异常行为进行识别，具体包括：对采样到的该船舶的航行数据进行均值归一化处理和box-cox变换后，利用所述航速和真航向异常识别行为模型对该船舶的航速和真航向的异常行为进行检测：如果所述航速和真航向异常识别行为模型输出的检测结果在设定的置信区间内，则确定该船舶的航速和真航向正常，否则，则确定该船舶的航速和/或真航向异常；基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，采用射线法和基于密度的离群检测算法，识别该船舶的位置异常行为；基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，在该船舶的主电源切断信号接入、且备用电源启动的情况下，检测该船舶的天线状态，以在无法检测到该船舶的天线信号的情况下确定该船舶的轨迹出现异常行为；基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，统计该船舶的所有采用周期内轨迹数据的异常系数，根据该异常系数识别该船舶是否存在申报异常行为。
14.与上述装置相匹配，本发明再一方面提供一种终端，包括：以上所述的船舶异常行为的识别装置。
15.与上述方法相匹配，本发明再一方面提供一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的船舶异常行为的识别方法。
16.由此，本发明的方案，通过以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型；并基于该网格化参数模型，识别伪造船舶轨迹、虚假申报过闸行为等违规行为，从而，通过采用固定周期采集ais收发信息，对历史船位数据进行聚类分析并建模，对船舶违规行为进行分析，从而较容易地实现对船舶违规行为的分析。
17.本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。
18.下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
附图说明
19.图1为北斗船载智能终端实体机的示意图；
20.图2为当事人行为与责任关系的示意图；
21.图3为本发明的船舶异常行为的识别方法的一实施例的流程示意图；
22.图4为本发明的方法中确定所述设定水域内预先设置的网格模型的编号集合的一实施例的流程示意图；
23.图5为本发明的方法中对设定时长内采集到的所有船舶的航行数据进行聚类分析的一实施例的流程示意图；
24.图6为本发明的方法中对所述设定水域内的船舶异常行为进行分类识别的一实施例的流程示意图；
25.图7为本发明的船舶异常行为的识别装置的一实施例的结构示意图；
26.图8为一种内河船舶异常行为的识别方法的一实施例的流程示意图；
27.图9为网格化参数模型的一实施例的结构示意图；
28.图10为检测船速和航向异常的网格化参数模型结构，其中，(a)为与电子航道图融合的3*4检测区域设置的示意图，(b)为以3*4检测区域为例的参数模型的示意图；
29.图11为葛洲坝2#和3#船闸下游船位聚类分析结果的示意图；
30.图12为gis(地理信息系统)融合的单层船位数据网格化模型的一实施例的结构示意图；
31.图13为航向与航速异常检测算法流程示意图；
32.图14为航向与航速异常检测方法结果的示意图，其中，(a)为均值标准化后航向、航速数据直方图，(b)为box-cox变换后航向、航速数据直方图，(c)为航向航速分布图；
33.图15为船舶航速、航向分布图；
34.图16为停靠在锚地的静止船舶识别结果的示意图；
35.图17为基于射线法的船位异常检测结果的示意图；
36.图18为基于lof的离群检测散点图；
37.图19为基于lof的离群检测船位分布图；
38.图20为违规拆卸分析流程的示意图；
39.图21为过闸船舶违规结果分布情况的示意图；
40.图22为413831889船报闸区间航段详细轨迹的示意图；
41.图23为413831889船全部航段详细轨迹的示意图；
42.图24为三峡局通报“振荣858”轮违规申报过闸情况的示意图；
43.图25为振荣858轮虚假申报轨迹的示意图；
44.图26为振荣858轮虚假申报轨迹与正常船舶轨迹对比的示意图，其中，(a)为正常船舶锚泊轨迹的示意图，(b)为正常过闸船舶轨迹的示意图，(c)为振荣858轮锚泊轨迹的示意图，(d)为振荣858轮过闸轨迹的示意图；
45.图27为三峡局关于“振荣858”轮违规申报过闸情况的通报截图。
46.结合附图，本发明实施例中附图标记如下：
47.102-采样单元；104-建模单元；106-分类单元；108-识别单元。
具体实施方式
48.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
49.关于船载ais配合卫星监测技术，水上交通环境随着世界经济一体化的蓬勃发展，船舶数量急剧增加使得海况变得繁杂，更加严峻的情况摆在海事部门和管理人员的面前。海上交通监管技术的中的重要手段就是对目标海域内船舶的轨迹跟踪。但是，相关方案的很多跟踪工具都受到一定程度的距离限制，即使ais基站已经联网，但只有靠近海岸的指定海域才能监测，无法实现更全面的水域覆盖。但用相关方案的卫星监测系统ais—卫星船载基站ais系统可以调节所有水域的所有船舶，进行调查和分析，还可以进行全天候、远程、全方位监测海上船舶并进一步保护航行安全。
50.关于ais技术用于船舶间的避碰，一些方案提出了一种船舶四元动态模型，并结合ais技术，设计了一个合理的用来决策避免船舶间碰撞的模型，且在这个基础上设计了避碰的系统。该系统能够意识到碰撞和判断的风险会遇到的情况，并且可以给出减轻意见，包括避免方向和避让程度；一些方案也提出了ais系统可以是避免碰撞的有效手段。装备ais系统的船只因天气或人为因素导致的航向航速的变动，都会通过ais被对方准确探知，这有助于船舶判定是否会际遇碰触的场面。
51.关于ais与其他设备或系统的关联研究，ais技术在海域应用以后，主要表现在ais所提供的信息量(包括静态信息和动态信息)要比雷达多(雷达只有目标的位置信息和粗略编号等基础信息)，而且精度更高。针对以上所述，还有一些方案将ais和雷达结合起来，ais为主、雷达为辅，深入论证了ais与雷达的信息融合的算法，在目标的显示上，由于融合目标的出现，使画面变得更加简洁，船舶目标更具区分度。还有一些方案阐述了基于ais的电子海图的开发必要性，并详细地设计了基于ecdis(电子海图显示与信息系统)与ais的电子海图信息服务系统。该电子海图信息系统实现了ais信息实时采集、海图态势情况显示等功能，这在海事领域中辅助vts(船舶交通服务)监管起到了巨大的作用。还有一些方案将ais技术应用于航标相关领域，这将使得航标数字化，有助于提高航标的可靠性和可用性。航标相关技术利用ais的海上通信优势，更好地发挥导航作用，提高航海保障服务质量。
52.关于船舶在vts系统中的探测与追踪的相关研究，船舶实施有效的监督和跟踪船舶是提高交通安全的重要保证。ais信息接收空间识别远程检测和跟踪服务的方法基于前
景。vts系统里，中心工作人员可以利用ais自动识别技术来识别船名，快速判断，大大降低甚高频通话的频率，使组织船舶进入效率变得更高效，同时也对及时有效的进行某些标签管制的目标，然后调整vts目标水域内的船舶交通。
53.关于船载智能终端应用现状，移动智能终端作为移动互联网的发展载体，已经进入了快速发展期，移动智能终端引领的技术变革和产业模式创新已成为我国重要的历史性机遇。国内用的内河船载终端包括ais、ecs(云服务器)和过闸终端三类，在船舶信息化管理和服务中体现了各自的优势。长江航运的船舶上安装的终端数量大都在3个或以上，主要包括：长江三峡通航管理局上线的“三峡船闸、葛洲坝船闸”过闸申报和过闸计划gps终端；重庆港航管理局上线的过闸申报和航运监管gps助航终端，长江海事局上线的船舶自动识别、预警ais终端，长江航道局上线的ecs终端等。这样，不仅从经济上增加了船方负担，从管理层面上看，数据来源混乱，不利于数据共享，很大程度上降低了管理效率和服务水平。
54.随着我国北斗卫星导航系统建设和物联网技术的发展，集多种技术于一体的智能船载终端是必然趋势，而在相关技术领域的研究也取得了许多突出的研究成果。在多功能智能船载终端系统结构方面，已从内河智能航运数据采集与交互中的诸多问题着手，从总体结构、功能设计、数据处理和人机界面等层面开展了内河船载智能终端的设计与应用研究，提出了基于can(控制器局域网络)总线的集多模北斗、gps(全球定位系统)模型、rfid(射频识别技术)、ais等多种技术的智能船载终端系统结构。
55.在船舶安全助航方面，一些方案提出一套基于ais与雷达融合信息的船舶安全助航系统，可以有效的解决单一导航设备目标识别不准确与目标信息不丰富的问题，从而提高目标识别的准确性和目标跟踪的精度，进而实现船舶航行安全自动化，减轻船员的劳作强度及心理负担，确保海上人、船、货物安全。
56.在终端数据可视化方面，已实现基于android的移动ais数据显示系统。该系统可通过蓝牙无线连接船载ais设备，从而在智能移动终端(手机或平台)上接收、解析ais数据，并将其传递的船舶动态与电子海图进行叠加显示，实现对ais船舶信息的实时监控和查询。利用操船者的移动设备运行该系统，即可形成一个简易的移动导航系统，满足内河众多小型船舶的航行需求。而通过电子海图、移动互联网以及大数据等技术手段在船舶智能移动终端的综合应用，解决了小型船舶使用电子海图、船舶导航以及船舶避碰等问题。
57.依托本技术人自主研发的北斗船载智能终端开展相关技术研究工作。北斗船载智能终端涵盖客船、散货船、危险品船、集装箱船、滚装船等各类船舶，具备技术推广条件，应用前景广阔。北斗船载智能终端实体机如图1所示。
58.该北斗船载智能终端实体机针对内河船舶高精度定位、过闸安检、通航功能技术集成等需求，研发了北斗双频定位芯片，攻克了船载终端防拆卸定位技术，实现了船舶自动识别系统(ais)、电子航道图、远程安检、过闸申报等功能集成，研发了内河船载多功能单北斗智能终端产品。该北斗船载智能终端实体机在长江三峡航段成功应用，缩短了船舶待闸时间，提高了船舶安检效率，保障了船舶过闸安全。
59.关于船舶违规行为与水上交通事故之间关系研究现状，从水上交通事故调查情况来看，船舶违章行为一般包括：为牟取暴利，无舱盖内河船在海上从事盗采、运输海砂作业；船员无证或持低等级证书驾驶船舶；船舶无(有效)船检证书；为多装载货物私自篡改、伪造船检证书，移动船舶体载重线标志位置；为逃避监管关闭ais、vdr等助航设施，不显示号灯
号型或不正确显示号灯号型；不遵守船舶定线制和报告制，违规穿越航道、锚地或逆向航行。在这些违法违章行为船舶中非公约船占绝大多数，给水上交通安全埋下了很大隐患。
60.在水上交通事故中，当事人行为导致事故发生的情况多种多样，但大致可以归纳为如下几类：1、当事人(船舶)违法违章行为；2、当事人(船舶)的过失、疏忽行为；3、当事人(船舶)的人为故意行为(犯罪)；4、不可抗力因素。第1、第2和第3种行为导致的事故为责任事故；第4种为非责任事故。
61.对于行政违章行为，当事人要根据行政处罚的相关规定负行政法律责任，处罚的方法一般是扣留或吊销证书、罚款、停止作业和禁止进出港等措施。此外，对于责任事故还应根据当事人(船舶)的行为与事故发生的因果关系及其行为在事故中所起到作用大小，划分为“全部”、“对等”、“主要与次要”责任，这些责任的划分属于事故当事人责任，并不属于事故引起的法律责任范畴；对于当事人的人为故意引起的事故，有可能涉及刑事责任；而不可抗力导致的事故，当事人无需承担责任。各类行为与责任关系如图2所示。
62.事故当事人(船)的违法违章行为和水上交通事故是否存在因果关系，是判断当事人(船)是否要负当事人责任的关键所在。诚然，不是所有的违法违章行为都会导致事故，但从实践中发现，在特定水域、特定种类的违法违章和某类事故具有相当的关联性，如果说二者之间没有因果关系则难以作出合理解释。例如，由于有的驾驶人员没有经过相关专业培训，不熟悉避碰规则相关条款的关系和要求，无证驾驶或持内河证书在海上违章进行运输作业，在港口锚地和定线制水域违法逆行、不按照规定横穿水道和通航分道，在沿海通航密集水域不按照避碰规则和定线制规定采取避让行动，导致多起碰撞事故发生。在无证驾驶人员看来，任何情况下，海上所有的船舶都可能是让路船，自己是直航船，又岂能随时为他船让路；要求其保持正规了望、正确使用雷达等助航仪器、运用良好的船艺更是无从谈起。
63.关于船舶违规行为检测技术现状，船舶违规行为产生的客观和主观原因非常多，对于船舶违规行为识别的定义，portnoy等认为违规行为可以根据船舶正常行为数学建模与被检测船数据指标之间的差异来定义；holst等基于模式识别，认为进行违规行为识别需要对大多数船舶行为数据模式进行研究与描绘，进而找出这些少量数据和主要数据在某些典型模式上呈现出来的异同点并进行对比。综合国内外学者的观点，船舶违规行为是指船舶在航行或者锚泊时，出现的非正常行为或者违反水上交通管理规定的行为，船舶违规行为的识别是根据输入的船舶航行相关数据，对船舶的航速、航向、轨迹、船位等要素进行分析，结合船舶所处的地理、环境和气候条件，判断船舶的航行是否符合正常的、普遍的航行运动规律，识别非法运动嫌疑，进而对船舶航行安全及潜在的危险进行评估与预警。
64.对船舶轨迹建模及违规检测的方法包括聚类分析、数理统计、贝叶斯网络及神经网络等，具体包括：
65.(1)基于聚类分析，应用于船舶轨迹的聚类算法有：dbscan(聚类算法)、optics(基于密度的聚类算法)、k-means(k均值聚类算法)等。根据这些算法的特点可以分为：基于层侧的方法、谱聚类的方法、自组织神经映射等。
66.轨迹的聚类需要对轨迹间的相似性进行度量，而这通常由聚合轨迹点间的距离来获得，因此轨迹相似性度量的核屯、就是轨迹间的距离度量函数。其中使用较为广泛的距离度量画数包括：hausdorff(豪斯多夫)距离、动态时间弯曲距离、lee等人提出的包括垂直、平行、角度的结构化距离等。这类建模普遍根据轨迹与聚类出的样本模型之间的距离，来判
断其是否违规。
67.(2)基于梳理统计，基于数理统计的方法中，最常用的模型是混合高斯模型和核密度估计模型。
68.核密度估计是一种非参数的估计方法，ristic等人提出基于自适应核密度的方法对ais轨迹数据进行运动模式的挖掘，然后利用微粒过滤器完成船舶的违规检测。laxhanmar等人分析了文献，对比了高斯混合模型和核密度估计两种方法后，发现核密度估计的方法更为有效，但计算复杂。lampe等人核密度估计为基础对船舶轨迹进行了可视化分析研究。
69.船舶运动受到多种因素的影响，于是学者们又提出了利用多个概率分布来建立轨迹模型，其中混合高斯模型最为常见。laxhanmar运用四维高斯混合模型对网格海区建模，并提出使用greedy算法来求解该模型，通过比对轨迹点的概率与预设阀值判断是否违规。kowalska采用增量学习方法，来降低算法的复杂度及适应航迹数据的不断变化，smith用cholesky分解方法对协方差矩阵进行分解将算法的复杂度降低为o(n2)。laxhanmar又提出了基于一致性预测技术的船舶违规检测方法。此外，潘家财等人采用统计的方法对厦口港的船舶特性进行了数据挖掘。
70.(3)基于神经网络，对船舶违规行为识别，国内外学者做了深入研究。johansson和flakman采用pc算法从模拟结构中学习贝叶斯网络的结构。helldin用贝叶斯网络从ais数据中检测船舶的违规行为。mascaro等人从航迹点和航迹角度来分析航行规律，后续又基于ais数据构造了静态和动态的贝叶斯网络。
71.bomberger等人提出基于关联神经网络的非监督增量学习算法，建立船舶运动信息的预测模型，通过对比预测的结果检测违规船舶。rhodes等人利用多尺度的方法来提高近似和预测效果。riverivo提出运用高斯混合模型及自组织神经网络聚类算法挖掘船舶的运动信息，并采用贝叶斯理论计算概率检测违规船舶。甄荣采用基于贝叶斯分类器的船舶违规识别模型对厦门港进行了船舶监测实验。
72.熊勇等采用ais数据，运用多核函数非参数估计法与假设检验方法辨别在设定航线上出现违规行为的船舶；甄荣等参照平面几何中的点和直线的位置关系，选用多边形区域里的船舶ais数据，采用多种算法建立了基于贝叶斯分类的船舶违规行为识别模型；邓磊针对内河航道的特征，基于ais历史数据构建了船舶正常行为模型，运用数据分析和挖掘算法实现了对船舶违规行为的识别；tang等设计了一种船舶违规行为智能融合系统，在系统中，把一些智能方法融合到一个集成的智能信息处理模型中。这些方法主要着眼于从宏观上建立整体的监控模型，在实时指导船舶纠正违规行为、避开潜在危险因素、掌握航行状况提供的帮助有限，且在目前来说采用先进平台结合研究的方法较少，因此结合现有平台资源，以智能化的角度分析船舶违规行为成为此方向的研究趋势。
73.但是，多年来，针对vts系统开展了一系列的研究和信息化建设，以天津vts为例，天津vts始终以科技创新为引领，在科技创新方面的积累为智能vts的建设和应用提供了坚实的基础。天津vts中心上世纪90年代成功应用船舶数据处理系统(sdps系统)，实现了“vts、ais与cctv系统集成联动技术开发应用”、“天津港小型船舶监控系统”等九项技术创新；之后创新vts系统实现了港口重点水域全覆盖、船舶交通实时3d显示、vts管理信息系统(mis系统)智能关联、vts信息实时发布查询等突破；之后开始数据交换平台系统设计，之后
开发交通动态风险管理、航行计划智能编排推演、vts信息服务拓展等系统，之后完成“天津港智能船舶交通监控和服务系统开发研究”。
74.在智能vts建设过程中，面临很多技术问题，比如相关系统数据分散，存在信息孤岛问题；现有vts系统普遍存在人员值守责任重、压力大、配员紧张问题；vts监控所需的基础数据较多，如何实现全数据的监测处理问题；面对几十年形成的vts监管习惯，如何创新新的服务理念问题。
75.上述问题的存在有一定的历史和现实原因，比如海事系统未形成统一机制和监管平台，vts系统以及其他海事监管系统各自独立运行，缺乏数据资源的统一管理机制，难以在决策支持、业务规范、流程再造、综合管理与对外服务等方面得到深化应用。在人员监管方面需要构建智能辅助决策系统，以提升监管水平，减轻值守压力。随着航运智能化水平的发展，在数据监测和应用方面，对基础数据的监测、传递和分析等要求越来越高，同时，对于强化智能vts开放、协同、共享的服务理念要求也在逐渐增强。
76.考虑到，基于船载终端可实现船舶动态和静态信息任意周期采集(最短采集周期1s)，可以避免因ais采集周期不固定带来的技术困难。同时，在较短周期内采集船舶位置信息，可更及时、准确地获取船舶信息，以免遗落关键时刻的关键信息，提高船舶违规行为分析识别的准确性和可靠性。
77.另外，据统计，船舶碰撞事故占到各类水上交通事故的50％以上。对碰撞事故原因分析的依据是《1972年国际海上避碰规则》。避碰规则作为国际公约，只有符合规范的船舶和经过考试发证的船员才能够更好地按照规则的要求采取避碰行动，才能更好地发挥出应有的避免碰撞作用。但在实际工作过程中监管人员很难对船舶航行过程中避碰规则的执行情况有充分了解，多是在事故发生后的追责中进行调查取证，无法做到事故发生前的告警或提示。
78.相关方案的海上船舶违规行为识别模型主要利用传统机器学习技术，结合复杂运动学方程的浅层模型。这种预测模型受限程度很高，在实际应用中不能达到满意效果。在航运大数据背景下，可以重新考虑深层次的模型去实现船舶航迹预测模型，通过对船舶运动轨迹规律的发掘，训练出船舶轨迹的运动规律模型。由此，加强内河重点水域交通监测管理，追踪和发现船舶异常安全隐患，是保障船舶安全航行的迫切需要，同时也要防止各种水上违法活动，维护重点水域交通安全。
79.另外，vts(船舶交通服务)系统具备船舶信息收集、信息处理、信息评估和助航服务，其基础架构、处理模式、计算方法、功能及设备信息能都是基于十多年前的技术和用户需求设计的。经过多年的发展，原由技术条件和设备状态已经不能满足当下和未来的使用需求，存在目标识别与跟踪不稳定，系统功能单一，数据互联互通不畅，功能扩展能力差等技术瓶颈。
80.根据本发明的实施例，提供了一种船舶异常行为的识别方法，如图3所示本发明的方法的一实施例的流程示意图。该船舶异常行为的识别方法可以包括：步骤s110至步骤s140。
81.在步骤s110处，按设定采样周期，采样设定水域内所有船舶的航行数据。
82.在一些实施方式中，所述设定水域内所有船舶中任一船舶的航行数据，包括：该船舶的位置数据、该船舶的航速、以及该船舶的真航向中的至少之一。每个船舶的位置数据，
包括：该船舶的经度、以及该船舶的纬度中的至少之一。
83.步骤s110中采样设定水域内所有船舶的航行数据，包括：利用所述设定水域内所有船舶中任一船舶的北斗船载终端，采集该船舶的经度、该船舶的纬度、该船舶的航速、以及该船舶的真航向中的至少之一。
84.图8为一种内河船舶异常行为的识别方法的一实施例的流程示意图。如图8所示，本发明的方案提供的一种内河船舶异常行为的识别方法，包括：
85.步骤11、基础数据采集：基于多功能单北斗船载智能终端(如型号为mt-15单北斗船载智能终端)，采集船舶经度、纬度、航速和真航向等数据，信息采集周期即为采集时间窗口参数，通常设置为1-900秒。
86.其中，真航向，指的是船舶航行时，真北线与船首线之间的夹角。真航向以真北线为基准，顺时针量至船首线。真北(也称为大地北)是沿着地球表面朝向地理北极的方向。地面p点真子午面与地球表面交线称为真子午线，真子午线在p点的切线北方向称真北方向。
87.在步骤s120处，确定所述设定水域内预先设置的网格模型的编号集合，根据所述设定水域内预先设置的网格模型的编号集合，提取该集合内所有航行数据，作为样本数据。利用所述样本数据，对所述网格模型进行训练，得到所述设定水域内的船舶异常行为识别模型。
88.在一些实施方式中，结合图4所示本发明的方法中确定所述设定水域内预先设置的网格模型的编号集合的一实施例流程示意图，进一步说明步骤s120中确定所述设定水域内预先设置的网格模型的编号集合的具体过程，包括：步骤s210和步骤s220。
89.步骤s210，将所述设定水域内所有船舶的航行数据进行网格化，得到所述设定水域内所有船舶的航行数据的所有网格，该所有网格能够分层布置。对每个网格进行编号，得到网格编号。
90.步骤s220，根据所述设定水域内预先设置的每个网格的网格模型、以及所述网格编号，得到所述设定水域内预先设置的网格模型的编号集合。
91.如图8所示，本发明的方案提供的一种内河船舶异常行为的识别方法，还包括：
92.步骤12、训练数据提取：根据网格模型设置的编号集合，提取集合内所有船舶经度、纬度、航速、真航向等数据，进行训练，得到船舶异常行为识别模型。其中，编号可以是人为设定或系统分配的id(地址)，每个网格具有独立编号，便于网格检索。
93.具体地，本发明的方案，以北斗船载终端采集的航速、真航向和船位等历史数据为基础，提出基于网格化的船舶轨迹异常行为识别方法。基于步骤11采集的船载终端数据，本发明的方案提出了一种网格化参数模型，信息采集周期即为采集时间窗口参数，通常设置为1-900秒。
94.下面对网格化参数模型的构建情况进行示例性说明。
95.受航道环境限制，内河船舶的航行路线相对固定，将检测数据网格化处理后，可针对每一单元格的船舶违规行为进行定制、定量分析，提升算法的精准性和可靠性。网格形状一般选取正方形区域，其边长的设置应结合船舶交通流、船舶尺寸、软硬件性能等条件合理设定。通过学习训练每一个网格中的所有参数，最终形成一张参数网，进而可覆盖所有检测区域。
96.例如：固定检测区域内，若网格边长选取小，则该区域内网格数量增加，整个区域
内需要计算和分析的数据量会增加，因此需要增加提高软硬件性能。若边长选取大，则区域内交通流加大，分析工作也增加。若船舶尺寸大，而选取的边长小，则在该网格内不能体现船舶运动过程。
97.图9为网格化参数模型的一实施例的结构示意图。参照矢量瓦片技术的设计思想，类似的，可将单层网格化参数模型扩展为多层网格化参数模型，如图9所示。n表示编号为n的网格区块，k表示第k层网格，k∈n
*
。lk表示第k层网格区域边长，l
k 1
表示第k 1层网格区域边长，ln表示第n层网格区域边长，lk＞l
k 1
。网格化参数模型初始化后，可通过接入新的检测数据，定期对参数模型进行迭代学习，以便更好的优化参数模型，生成针对不同季节、水位、气象等复杂条件下的参数模型。
98.图10为检测船速和航向异常的网格化参数模型结构，其中，(a)为与电子航道图融合的3*4检测区域设置的示意图，(b)为以3*4检测区域为例的参数模型的示意图。
99.在本发明的方案中，网格化参数模型，以3*4检测区域为例，对模型的应用及算法实现开展研究。设置网格边长l为500米的检测区域，并对船位数据进行网格化分割。通过与电子航道图进行融合检测区域设置效果如图10中(a)所示。检测区域设定后，需要确定参数集，对参数模型进行初始化。本发明的方案基于局部异常因子算法，实现船舶位置异常判定，其判定参数为局部异常值因子θ。基于历史数据的统计特征，实现对船舶航向和航速异常判定，其判定参数分别为λc和λv。因此，参数模型为3*4*3的三维空间集合。其中，3表示检测区域高度包含的网格行数，4表示检测区域宽度包含的网格列数，5表示检测区域参数模型通道数量，参数模型如下图10中(b)所示。
100.在步骤s130处，对设定时长内采集到的所有船舶的航行数据进行聚类分析，得到类型分析结果，记为航道类型。按所述航道类型，对所述设定水域内的船舶异常行为识别模型进行分类，得到所述设定水域内的船舶异常行为分类识别模型。
101.在一些实施方式中，结合图5所示本发明的方法中对设定时长内采集到的所有船舶的航行数据进行聚类分析的一实施例流程示意图，进一步说明步骤s130中对设定时长内采集到的所有船舶的航行数据进行聚类分析的具体过程，包括：步骤s310至步骤s330。
102.步骤s310，确定所述设定水域内所有船舶的航行数据的所有网格中的指定网格的集合，记为网格集合。
103.步骤s320，选取所述网格集合在设定时长内的航行数据，记为分析数据。
104.步骤s330，采用基于密度的聚类分析算法，对所述分析数据进行聚类分析。
105.如图8所示，本发明的方案提供的一种内河船舶异常行为的识别方法，还包括：
106.步骤13、分类模型学习，具体包括：
107.步骤131、选取用户设置或指定网格集合内的船舶经度、纬度、航速、真航向等数据。
108.步骤132、采用基于密度的聚类分析算法，对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型。
109.其中，历史船位数据是船舶经纬度、航速、航向数据，就是采集的数据。聚类分析算法dbscan是通用的聚类算法，基于该算法通过设置合理的参数，可以对船舶位置进行分类，按照分类结果，可以间接的对航道类型进行分类。
110.船舶异常行为的判断与船舶所在区域的航道环境有直接的关系。因此，需要对网
格区域航道类型进行分类。通常船舶交通流密度是判断航道繁忙程度的显著标志，因此本发明的方案，采用基于密度的聚类分析算法，实现船舶所在区域的航道分类。基于密度的带噪声空间聚类算法(dbscan)是一种简单、高效的聚类分析算法，能够有效发现任意形状的类簇，且具备抗噪声的能力。该算法的两个输入参数分别为邻域范围ε和最少数据量min points。基于葛洲坝2#和3#闸下游船舶数据，当邻域范围ε和最少数据量min points的取值分别为0.0021165和80时，获得如图12所示的结果。邻域范围是以该船舶位置为圆心，ε为半径的圆。最少数据量，是落在圆内其它船位数量。
111.图12为葛洲坝2#和3#船闸下游船位聚类分析结果的示意图。从图12中可以发现，算法的分类结果与卫星图片中的实际通航状态基本一致。因此，本发明的方法可以对船舶所在航道的类型进行有效区分，便于针对不同航道类型，选取合适的算法及参数，构建船舶异常行为参数模型。
112.下面对重点检测区域的选取情况进行示例性说明。
113.图12为gis融合的单层船位数据网格化模型的一实施例的结构示意图。本发明的方案，以单层网格参数模型为例，设置网格边长l1为200米的检测区域，并对船位数据进行网格化分割。
114.如图12所示，参照实际航道环境，将图12中第7块区域设为桥区检测范围，可选择相应的检测算法进行分析，并结合桥区附近航道环境、桥柱宽度等现场环境，对报警阈值集合up_params7和dowm_param7进行学习设置，生成grid7。up_params7表示第7块网格区域中上行船舶参数集，dowm_param7表示第7块网格区域中下行船舶参数集，grid7表示第7块网格区域参数集。up_paramsi表示第i块网格区域中上行船舶参数集，up_paramsi＝{λi,μi,σi,θi}。dowm_paramsi表示第i块网格区域中下行船舶参数集，down_paramsi＝{λi,μi,σi,θi}。gridi表示第i块网格区域参数集，down_paramsi＝{up_paramsi，down_paramsi}。
115.在步骤s140处，利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，得到分类识别结果。
116.本发明的方案，为实现安装北斗船载终端船舶的违规行为识别，以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型。并基于该网格化参数模型，提出一种内河船舶轨迹异常识别方法，该方法可识别伪造船舶轨迹、虚假申报过闸行为。
117.在一些实施方式中，所述设定水域内的船舶异常行为分类识别模型，包括：位置异常识别行为模型、轨迹异常识别行为模型、航速和真航向异常识别行为模型、以及申报异常识别行为模型中的至少之一。
118.步骤s140中利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别的具体过程，参见以下示例性说明。
119.下面结合图6所示本发明的方法中对所述设定水域内的船舶异常行为进行分类识别的一实施例流程示意图，进一步说明步骤s140中对所述设定水域内的船舶异常行为进行分类识别的具体过程，包括：步骤s410和步骤s420。
120.步骤s410，对航行路过所述设定水域内已具有船舶异常行为分类识别模型的网格区域的船舶，采样该船舶的航行数据。
121.步骤s420，基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行
为分类识别模型，对该船舶的异常行为进行识别。
122.如图8所示，本发明的方案提供的一种内河船舶异常行为的识别方法，还包括：
123.步骤14、船舶违规行为识别判定：对航行路过训练后的网格区域的船舶，根据分类模型学习训练的参数结果作为判定阈值，进而识别是否存在位置异常、轨迹异常、航速异常、航向异常和申报异常等行为。
124.本发明的方案，以北斗船载终端采集的航速、航向和船位等历史数据为基础，提出基于网格化的船舶异常行为识别方法。首先，本发明的方案，采集的船舶数据与相关方案中ais数据主要区别在于采集周期相对固定，数据时间窗口一致。其次，本发明的方案，提出的网格化参数模型，可根据不同时间、空间的航道环境对算法参数集进行灵活设置。然后，本发明的方案，基于数理统计、聚类分析、离群检测等算法，提出了船舶航速、航向及船位异常检测方法。最后，本发明的方案，以葛洲坝船闸下游船舶数据为例，对模型及检测算法的有效性进行了试验验证。
125.其中，基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别，包括以下至少一种识别情况：
126.第一种识别情况：基于采样到的该船舶的航行数据，利用所述航速和真航向异常识别行为模型，对该船舶的异常行为进行识别，具体包括：对采样到的该船舶的航行数据进行均值归一化处理和box-cox变换后，利用所述航速和真航向异常识别行为模型对该船舶的航速和真航向的异常行为进行检测：如果所述航速和真航向异常识别行为模型输出的检测结果在设定的置信区间内，则确定该船舶的航速和真航向正常，否则，则确定该船舶的航速和/或真航向异常。
127.下面对航向与航速异常检测的情况进行示例性说明。
128.图13为航向与航速异常检测算法流程示意图。通过分析船舶在每个网格区域中的历史航向与航速数据分布情况，发现均近似服从正态分布ni～(μi，σ
i2
)，x∈{c,v}。因此，分别计算每个网格区域中航向、航速维度的均值和方差，得到其统计特征，并根据得到的统计特征构建状态异常检测算法，算法主要流程如图13所示。如图13所示，航向与航速异常检测算法流程示意图，包括：
129.步骤21、获取样本数据。
130.步骤22、均值归一化处理，box-cox变换，航向、航速异常检测，输出置信区间。
131.步骤23、判断输出的置信区间是否在设定的置信区间范围内：若是，则标记为正常船舶，输出检测结果。否则，则标记为异常船舶，输出检测结果。
132.这样，对经过均值归一化、box-cox变换后的航速、航向数据，采用参数估计法识别异常航速、航向。其中，box-cox变换是box和cox在1964年提出的一种广义幂变换方法，是统计建模中常用的一种数据变换，用于连续的响应变量不满足正态分布的情况。box-cox变换之后，可以一定程度上减小不可观测的误差和预测变量的相关性。
133.一般在统计学中可以认为，当总体服从一般正态分布时，样本落在3倍标准差区域内的概率为99.7％。因此，获取每个区域中99.7％的船舶位置数据构建正常状态模型，其余则为异常状态。采用以下box-cox变换公式：
[0134][0135]
给定置信度(1-α)*100％，其中α＝0.003为显著性水平，则第i区域的航向、航速置信区间的上下边界可通过以下公式计算：
[0136]
mini,maxi＝μi±
3*σiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)。
[0137]
式(2)中，mini,maxi分别为航向、航速异常检测算法的阈值边界。
[0138]
其中，i表示第i块网格区域，i∈n
*
，n
*
表示网格编号0-n整形。xi表示第i块网格区域中样本数据，xi∈{c,v}，c表示航向，v表示航速。μi表示第i块网格区域中样本均值，μi∈{c,v}。σi表示第i块网格区域中样本标准差，σi∈{c,v}。λi第i块网格区域中box-cox变换参数。
[0139]
图14为航向与航速异常检测方法结果的示意图，其中，(a)为均值标准化后航向、航速数据直方图，(b)为box-cox变换后航向、航速数据直方图，(c)为航向航速分布图。本发明的方案以第7块区域中上行船舶航速、航向样本数据为例，对算法的有效性进行试验验证，具体检测结果如图14所示。从图14中(a)中可以发现，经过均值归一化处理后，航速数据基本服从一般正态分布。由于在该检测区域内，船舶航向基本一致，不能明显发现其正态分布规律。从图14中(b)中可以发现，当航向、航速的box-cox变换参数λ取值分别为9.2和1.6时，航向数据的正态性得到了明显改变。从图14中(c)中可以发现，航向异常检测算法识别出2艘船舶的异常航向行为，未发现异常航速行为。
[0140]
图15为船舶航速、航向分布图。本发明的方案，采用极坐标的方式，可以更好的展现航速与航向之间的分布关系。如图15所示，圆点表示船舶的航向、航速状态，被绿色区域包围的为正常航速、航向状态，区域外被方框标记的则为异常点。
[0141]
图16为停靠在锚地的静止船舶识别结果的示意图。通过调取低航速船舶信息，并结合gis分析，如图16所示，可以发现该船舶停靠在锚地区域，并非在航道内违规停留。
[0142]
第二种识别情况：基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，采用射线法和基于密度的离群检测算法，识别该船舶的位置异常行为。
[0143]
下面对船位异常检测的情况进行示例性说明。
[0144]
本发明的方案，采用射线法(ray casting)和局部异常因子算法(lof)，实现船位异常状态的检测。基于射线法的检测方法，需要预先设定边界参数，可以实现船舶进出重点区域检测，如禁区、锚地、导航墙、靠船墩等区域。相较于射线法，基于局部异常因子算法的检测方法更加灵活，可以结合历史船位数据，定期学习训练参数，检测出该点是否离群，如果离群则判定为船位异常。
[0145]
射线法是以目标点为端点，引出一条射线。计算这条射线和检测边界的交点数目。如果交点个数为奇数，则该点在检测区域内部，反之则在检测区域外部。检测区域的边界可以使任意多边形，如果在重点航道水域，可基于航标遥测遥报位置进行自动设定，进而可以有效检测船舶是否在航道内航行。图17为基于射线法的船位异常检测结果的示意图，该算法检测效果如图17所示。
[0146]
局部异常因子算法是一种基于密度的异常点检测算法。第i块区域中pj点的局部异常值因子可表示为：
[0147][0148]
式(3)中，j表示第j条船舶记录，j∈n
*
。vj表示第j条船舶记录的速度。cj表示第j条船舶记录的航速。pj表示第j条船舶记录的位置，pj＝{lat,lng}，lat表示经度，lng表示维度。ε表示船位数据间邻域范围。m points表示邻域范围内最少船舶船位数据量。θi表示第i块网格区域中异常值因子阈值。r表示邻近的船位个数，nb(pj)表示对象pj的r个最邻近组成的集合，lrdb(pj)表示数据对象pj的局部可达密度，该局部可达密度主要是根据pj与其r个最近邻之间的可达距离得到。
[0149]
根据数据对象和它的r个邻近估计出该对象的相对密度，结合相对密度给每个数据对象定义一个θi(pj)。数据对象的θi(pj)值越大表示异常值的可能性就越大。图18为基于lof的离群检测散点图。本发明的方案，选取第7块区域中上行船位数据，当r值为10时，该区域内异常因子值分布如图18所示。
[0150]
如图18，当局部异常因子阈值θ为0.1时，可检测出3条异常船位数据。图19为基于lof的离群检测船位分布图。为了更加直观显示异常船位状态，将离群点标记为红色圆圈，发现算法能够有效检测出离群船舶，具体结果如图19所示。
[0151]
这样，采用射线法和基于密度的离群检测算法，分别实现船舶进出检测水域和异常位置的识别。
[0152]
以葛洲坝下游船舶数据为例，对上述方法进行试验验证。本发明的方案提出一种船舶过闸虚假申报检测算法，该算法基于数据相等判定法、离散系数判定法和系数离散度判定法三种内核算法驱动，可识别人工伪造的船舶定位数据。
[0153]
第三种识别情况：基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，在该船舶的主电源切断信号接入、且备用电源启动的情况下，检测该船舶的天线状态，以在无法检测到该船舶的天线信号的情况下确定该船舶的轨迹出现异常行为。
[0154]
下面对船舶轨迹异常的检测情况进行示例性说明。
[0155]
船舶违规过闸检测算法流程包括：
[0156]
步骤31、主电源切断信号接入。
[0157]
例如：北斗芯片有一个adc检测功能，比较主电源与备用电池之间的电压差，来判断主电源是否接入。在船舶运行期间主电源24小时运行。主电源切断有两种情况，一是船舶停止航行或完成一次运输任务(属于正常操作)。二是人为拆卸机器(违规行为)。
[0158]
步骤32、定位模型的备用电源启动。
[0159]
步骤33、检测天线状态。检测天线目的在于，仅凭主电源是否掉电不能判别船方是否违规，需检测天线状态信号。比如在正常操作时不会拔掉定位天线的，只有拆卸设备才需要拔掉天线，因为天线已经固定在船舶上，不能和终端一同携带。
[0160]
北斗定位模组需接入天线才能接收到北斗卫星信号，进而进行定位分析。北斗定位模组中有天线信号数据传输接口，如果该数据传输接口不能收到信息，则说明天线被拆卸了。如果该接口正常接收天线传来的数据，则说明天线已接入。
[0161]
备用电源的作用是当主电源切断，需保证北斗拆卸检测模型的正常运行(如持续记录、保存北斗定位数据，便于终端上电联网运行后，将数据回传至监管部门)。备用电源是可充电电池，充满电可独立工作可连续运行2个月，设备上电后，进行充电。
[0162]
其中，终端离线信息获取方式，可以包括：船上电源供电方式、模型电池供电方式、岸上电源供电方式，三种供电方式可以选择使用，具体如下：
[0163]
第一种可选的供电方式：在船上电源供电方式中，可以设置定时如每3分钟记录一次utc(即世界标准时间)时间、经纬度、速度和天线状态。无论是否连接天线，都记录定位结果和天线状态。
[0164]
第二种可选的供电方式：在模型电池供电方式中，需要判断天线是否连接。若天线连接，则保持utc时间、位置、速度和天线状态等信息，也是定时如每3分钟进入一次睡眠模式，唤醒后保存一次数据。若天线未连接，则时定时如每隔5分钟会进入低功耗模式。
[0165]
第三种可选的供电方式：在岸上电源供电方式中，需要读取log信息(即运行时间信息)，然后擦除数据。然后根据读取的信息和客户报的位置、时间、天线状态判断客户是否违规。还需要判断天线是否连接。若天线连接，则需等到定位后上传nmea信息(即海用电子设备制定的标准格式信息)，不上传未定位的信息。若未连接天线，则上传无定位标识的nmea信息，服务器解析后报警，未接天线。
[0166]
步骤34、判断北斗天线是否拆除。若是，则执行步骤35。否则，结束防拆卸检测流程。
[0167]
步骤35、保存最后一条北斗定位数据。
[0168]
步骤36、判断主电源是否开启。若是，则执行步骤37。否则，执行步骤38。
[0169]
步骤37、检测天线状态。
[0170]
步骤38、判断北斗天线是否接入。若是，则执行步骤39。否则，结束防拆卸检测流程。
[0171]
步骤39、获取最新一条北斗定位数据。
[0172]
步骤310、判断船舶位置变化是否异常。若是，则执行步骤311。否则，结束防拆卸检测流程。
[0173]
步骤311、推送终端拆卸警示信息，之后结束防拆卸检测流程。
[0174]
例如：一条船舶的航线是上海-》宜昌-》重庆，船舶行驶至宜昌时需要申报过闸。违规流程是当船舶从上海出发前，设备断电取出，断电后模型记录并保存最后一条北斗位置(最后一条北斗定位数据l1、断电时间t1)，此时，有其他人员乘坐高铁将设备运送至宜昌开始申报(设备和船舶是一一对应的，不存在一艘船多个设备)，申报需要上电，此时记录位置(最新一条北斗定位数据l2、开机时间t2)。可以计算最后一条北斗定位数据l1和最新一条北斗定位数据l2的直线距离s，断电时间t1和开机时间t2的时间差t。正常情况下，船舶行驶速度相对较慢20-30km/h，一条船舶的从上海行驶至宜昌的时间是相对固定的，包括中间装卸作业、运输等时间在10天以上。但如果做高铁则1天就到，时间差t明显减少。综合断电和上电时的偏移距离，时间差越小违规的标志越明显。船舶违规概率的计算公式，其中，a代
表：船舶上行航线起点距离申报点的距离，b代表：船舶航行理论所用时间，s的单位为千米km，t的单位为小时h。违规概率主要用于分析判断船舶违规申报的判定，需参考一定阈值。图20为违规拆卸分析流程的示意图，详细检测流程如图20所示。
[0175]
第四种识别情况：基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，统计该船舶的所有采用周期内轨迹数据的异常系数，根据该异常系数识别该船舶是否存在申报异常行为。
[0176]
下面对船舶违规过闸检测的结果进行示例性说明。
[0177]
图21为过闸船舶违规结果分布情况的示意图。本发明的方案选取上游巴东大桥到下游石首大桥之间的2000余艘过闸船舶数据进行分析。每条船舶违规概率结果分布情况如图21所示，可以发现有4艘违规概率相对较高船舶。
[0178]
图22为413831889船报闸区间航段详细轨迹的示意图，图23为413831889船全部航段详细轨迹的示意图。对以上4艘船舶逐一分析，其中2艘船舶船位数据分别为36条和498条，其结果不具评判价值，因此剔除以上2艘船舶。其余2艘船舶计算结果分别为0.98和1，船位数据分别为2253条和2591条。经过与gis融合显示分析后，发现以上2艘船舶具有一定的违规嫌疑。以mmsi为413831889的船舶为例进行分析，如图22和图23所示。图22和图23中，我们以时间顺序展示了船舶形式轨迹路线，并选择其中5条数据进行分析。标号为0的船位数据，获取时间为2月22日7时，此后1天内再无船位数据上船。可以判断出船舶在该锚地附近停留一段时间后，为逃避海事监管，违规关闭了终端。此后，2月22日18时该船通过巴东大桥后在附近锚地停留。2月23日4时-9时期间，船舶位置出现异常情况，如标为1、2、3的船位数据。
[0179]
为更加全面、准确分析船舶违规情况，获取了船舶全部航行记录，并结合gis进行全面展示和分析，如图22和图23所示。可以发现，该船在过闸申报监管的关键节点，包括巴东大桥、三峡船闸和石首大桥附近，均存在异常位置。且船舶轨迹存在大量不连续情况，初步分析可能存在其它船舶终端协助伪造船舶位置的情况，可判定为违规申报行为。
[0180]
下面对虚假申报检测的情况进行示例性说明。
[0181]
图24为三峡局通报“振荣858”轮违规申报过闸情况的示意图。本发明的方案提出一种船舶过闸虚假申报检测算法，该算法可识别人工伪造的船舶定位数据。项目组通过分析历史船舶定位数据，梳理并分析了人工伪造船舶定位数据的特征。通过识别系列特征，能够实现对过闸船舶虚假申报行为进行检测。驱动该算法运行的数据，以固定窗口内数据为单元数据。通过计算船舶轨迹数据的所有窗口内数据的异常系数，进行统计，最终结合判定阈值，识别潜在违规船舶。具体算法流程如图24所示。
[0182]
该算法的核心是计算窗口内数据的异常系数。本发明的方案，提出了三种判定方法，分别是数据相等判定法、离散系数判定法和系数离散度判定法。三种判定方法适用于不同层级的虚假申报手段。
[0183]
数据相等判定法：基于数据相等的判定方法最为简单，仅需判断数据的一致性即可实现对虚假申报船舶的识别。
[0184]
离散系数判定法：基于离散系数判定法是在数据相等判定法的基础上衍生而来，但技术上能够从一定程度上降低人工干扰。其中，离散系数是概率分布离散程度的一个归
一化量度，其定义为标准差与平均值之比。
[0185]
系数离散度判定法：回归系数判定方法引入了回归系数集合。一般情况下，如果仅凭人工伪造船舶定位数据，其工作量较大，至少需要伪造上千条船舶定位数据。随着技术发展，采用实验室仪器或破解软件方式，可实现船舶定位数据的自动生成，但生成的规则也需要人为参与、制定。因此，如果发现船舶定位数据存在某种异常规则或特征，也就能够识别虚假船位数据。规则大多引入某种公式实现，因此，采用回归分析方法，先实现船舶数据的回归分析。结合其显著性检验结果和可视化gis分析，如果回归分析结果与船舶数据匹配度较高，则可以判定船舶数据是由计算机模拟生成，即可认定其为虚假申报船舶。该方法的优点是不仅能否发现船舶虚假申报行为，还可以识别其采用的方法。但该方法缺点是只适用于特定较小范围区域，不适用于过闸全域或大范围检验分析场景。
[0186]
下面对虚假申报检测的结果进行示例性说明。
[0187]
图25为振荣858轮虚假申报轨迹的示意图。现阶段，船舶虚假申报行为较为单一，特征相对明显。通过相对较为简单的数据相等判定法就可以识别并发现违规船舶。通过该算法，在2021年7月至2021年8月船载终端历史数据中，仅发现了“振荣858”轮的违规行为。振荣858轮虚假申报轨迹，如图25所示。
[0188]
图26为振荣858轮虚假申报轨迹与正常船舶轨迹对比的示意图，其中，(a)为正常船舶锚泊轨迹的示意图，(b)为正常过闸船舶轨迹的示意图，(c)为振荣858轮锚泊轨迹的示意图，(d)为振荣858轮过闸轨迹的示意图。通过分析该轮的历史船位数据，并结合可视化gis，可以清晰发现该轮伪造数据的手段与方法，详见图26所示。通过与正常船舶轨迹相比较，可以发现正常船舶的定位装置会受到环境影响，存在一定的定位误差，且该误差不能完全消除。因此，会围绕某点随机产生定位数据，如图26中(a)所示。而振荣858轮的轨迹十分规则，围绕固定点位生成，如图26中(c)所示。再对过闸时船舶轨迹分析，可以发现相同的情况，详见图26中(b)和图26中(d)所示。正常过闸船舶轨迹分布均匀，且船舶在一个闸室内的定位数据普遍体现在上下闸首和船闸中心，符合船舶过闸行为规律。而振荣858轮过闸船舶轨迹分布不规则，且存在较多船舶定位已偏移出闸室水域。通过分析两坝间船位数据也可发现，其船位数据位置分布过于均匀，且航向、航速数据与船舶正常航行数据不匹配、不一致。
[0189]
对振荣858轮进行分析后，发现该轮伪造船舶数据采用一种网格化的数据生成方式。该轮历史船位数据，均符合一种网格模型，且坐标位置均在网格模型的节点上，不存在其它位置数据，总体可总结为“横平竖直”。
[0190]
图27为三峡局关于“振荣858”轮违规申报过闸情况的通报截图。为了检验该轮的违规行为，通过浏览长江三峡通航管理局网页，发现三峡局，对“振荣858”轮违规申报过闸情况进行了通报，通报内容如图27所示。
[0191]
本发明的方案，以固定采集时间窗口的航向、航速和船位数据为基础，开展了基于网格化参数模型的船舶异常行为识别技术研究。构建了一种灵活可扩展的多层次网格化参数模型。综合运用数理统计、聚类分析、离群检测等算法，提出了船舶航速、航向及船位异常检测方法。试验结果显示：本发明的方案，提出的方法可以有效的针对船舶航向、航速和船位异常状态进行检测。通过对船舶当前航行信息与模型学习结果进行比较，判断其是否存在潜在的异常行为。研究成果可为内河船舶航行风险分析和预测预警等提供技术支撑。
[0192]
采用本实施例的技术方案，通过以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型。并基于该网格化参数模型，识别伪造船舶轨迹、虚假申报过闸行为等违规行为，从而，通过采用固定周期采集ais收发信息，对历史船位数据进行聚类分析并建模，对船舶违规行为进行分析，从而较容易地实现对船舶违规行为的分析。
[0193]
根据本发明的实施例，还提供了对应于船舶异常行为的识别方法的一种船舶异常行为的识别装置。参见图7所示本发明的装置的一实施例的结构示意图。该船舶异常行为的识别装置可以包括：采样单元102、建模单元104、分类单元106和识别单元108。
[0194]
其中，采样单元102，被配置为按设定采样周期，采样设定水域内所有船舶的航行数据。该采样单元102的具体功能及处理参见步骤s110。
[0195]
在一些实施方式中，所述设定水域内所有船舶中任一船舶的航行数据，包括：该船舶的位置数据、该船舶的航速、以及该船舶的真航向中的至少之一。每个船舶的位置数据，包括：该船舶的经度、以及该船舶的纬度中的至少之一。
[0196]
所述采样单元102，采样设定水域内所有船舶的航行数据，包括：所述采样单元102，具体还被配置为利用所述设定水域内所有船舶中任一船舶的北斗船载终端，采集该船舶的经度、该船舶的纬度、该船舶的航速、以及该船舶的真航向中的至少之一。
[0197]
图8为一种内河船舶异常行为的识别装置的一实施例的流程示意图。如图8所示，本发明的方案提供的一种内河船舶异常行为的识别装置，包括：
[0198]
步骤11、基础数据采集：基于多功能单北斗船载智能终端(如型号为mt-15单北斗船载智能终端)，采集船舶经度、纬度、航速和真航向等数据，信息采集周期即为采集时间窗口参数，通常设置为1-900秒。
[0199]
其中，真航向，指的是船舶航行时，真北线与船首线之间的夹角。真航向以真北线为基准，顺时针量至船首线。真北(也称为大地北)是沿着地球表面朝向地理北极的方向。地面p点真子午面与地球表面交线称为真子午线，真子午线在p点的切线北方向称真北方向。
[0200]
建模单元104，被配置为确定所述设定水域内预先设置的网格模型的编号集合，根据所述设定水域内预先设置的网格模型的编号集合，提取该集合内所有航行数据，作为样本数据。利用所述样本数据，对所述网格模型进行训练，得到所述设定水域内的船舶异常行为识别模型。该建模单元104的具体功能及处理参见步骤s120。
[0201]
在一些实施方式中，所述建模单元104，确定所述设定水域内预先设置的网格模型的编号集合，包括：
[0202]
所述建模单元104，具体还被配置为将所述设定水域内所有船舶的航行数据进行网格化，得到所述设定水域内所有船舶的航行数据的所有网格，该所有网格能够分层布置。对每个网格进行编号，得到网格编号。该建模单元104的具体功能及处理还参见步骤s210。
[0203]
所述建模单元104，具体还被配置为根据所述设定水域内预先设置的每个网格的网格模型、以及所述网格编号，得到所述设定水域内预先设置的网格模型的编号集合。该建模单元104的具体功能及处理还参见步骤s220。
[0204]
如图8所示，本发明的方案提供的一种内河船舶异常行为的识别装置，还包括：
[0205]
步骤12、训练数据提取：根据网格模型设置的编号集合，提取集合内所有船舶经度、纬度、航速、真航向等数据，进行训练，得到船舶异常行为识别模型。其中，编号可以是人
为设定或系统分配的id(地址)，每个网格具有独立编号，便于网格检索。
[0206]
具体地，本发明的方案，以北斗船载终端采集的航速、真航向和船位等历史数据为基础，提出基于网格化的船舶轨迹异常行为识别装置。基于步骤11采集的船载终端数据，本发明的方案提出了一种网格化参数模型，信息采集周期即为采集时间窗口参数，通常设置为1-900秒。
[0207]
下面对网格化参数模型的构建情况进行示例性说明。
[0208]
受航道环境限制，内河船舶的航行路线相对固定，将检测数据网格化处理后，可针对每一单元格的船舶违规行为进行定制、定量分析，提升算法的精准性和可靠性。网格形状一般选取正方形区域，其边长的设置应结合船舶交通流、船舶尺寸、软硬件性能等条件合理设定。通过学习训练每一个网格中的所有参数，最终形成一张参数网，进而可覆盖所有检测区域。
[0209]
例如：固定检测区域内，若网格边长选取小，则该区域内网格数量增加，整个区域内需要计算和分析的数据量会增加，因此需要增加提高软硬件性能。若边长选取大，则区域内交通流加大，分析工作也增加。若船舶尺寸大，而选取的边长小，则在该网格内不能体现船舶运动过程。
[0210]
图9为网格化参数模型的一实施例的结构示意图。参照矢量瓦片技术的设计思想，类似的，可将单层网格化参数模型扩展为多层网格化参数模型，如图9所示。n表示编号为n的网格区块，k表示第k层网格，k∈n
*
。lk表示第k层网格区域边长，l
k 1
表示第k 1层网格区域边长，ln表示第n层网格区域边长，lk＞l
k 1
。网格化参数模型初始化后，可通过接入新的检测数据，定期对参数模型进行迭代学习，以便更好的优化参数模型，生成针对不同季节、水位、气象等复杂条件下的参数模型。
[0211]
图10为检测船速和航向异常的网格化参数模型结构，其中，(a)为与电子航道图融合的3*4检测区域设置的示意图，(b)为以3*4检测区域为例的参数模型的示意图。
[0212]
在本发明的方案中，网格化参数模型，以3*4检测区域为例，对模型的应用及算法实现开展研究。设置网格边长l为500米的检测区域，并对船位数据进行网格化分割。通过与电子航道图进行融合检测区域设置效果如图10中(a)所示。检测区域设定后，需要确定参数集，对参数模型进行初始化。本发明的方案基于局部异常因子算法，实现船舶位置异常判定，其判定参数为局部异常值因子θ。基于历史数据的统计特征，实现对船舶航向和航速异常判定，其判定参数分别为λc和λv。因此，参数模型为3*4*3的三维空间集合。其中，3表示检测区域高度包含的网格行数，4表示检测区域宽度包含的网格列数，5表示检测区域参数模型通道数量，参数模型如下图10中(b)所示。
[0213]
分类单元106，被配置为对设定时长内采集到的所有船舶的航行数据进行聚类分析，得到类型分析结果，记为航道类型。按所述航道类型，对所述设定水域内的船舶异常行为识别模型进行分类，得到所述设定水域内的船舶异常行为分类识别模型。该分类单元106的具体功能及处理参见步骤s130。
[0214]
在一些实施方式中，所述分类单元106，对设定时长内采集到的所有船舶的航行数据进行聚类分析，包括：
[0215]
所述分类单元106，具体还被配置为确定所述设定水域内所有船舶的航行数据的所有网格中的指定网格的集合，记为网格集合。该分类单元106的具体功能及处理还参见步
骤s310。
[0216]
所述分类单元106，具体还被配置为选取所述网格集合在设定时长内的航行数据，记为分析数据。该分类单元106的具体功能及处理还参见步骤s320。
[0217]
所述分类单元106，具体还被配置为采用基于密度的聚类分析算法，对所述分析数据进行聚类分析。该分类单元106的具体功能及处理还参见步骤s330。
[0218]
如图8所示，本发明的方案提供的一种内河船舶异常行为的识别装置，还包括：
[0219]
步骤13、分类模型学习，具体包括：
[0220]
步骤131、选取用户设置或指定网格集合内的船舶经度、纬度、航速、真航向等数据。
[0221]
步骤132、采用基于密度的聚类分析算法，对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型。
[0222]
船舶异常行为的判断与船舶所在区域的航道环境有直接的关系。因此，需要对网格区域航道类型进行分类。通常船舶交通流密度是判断航道繁忙程度的显著标志，因此本发明的方案，采用基于密度的聚类分析算法，实现船舶所在区域的航道分类。基于密度的带噪声空间聚类算法(dbscan)是一种简单、高效的聚类分析算法，能够有效发现任意形状的类簇，且具备抗噪声的能力。该算法的两个输入参数分别为邻域范围ε和最少数据量min points。基于葛洲坝2#和3#闸下游船舶数据，当邻域范围ε和最少数据量min points的取值分别为0.0021165和80时，获得如图12所示的结果。
[0223]
图12为葛洲坝2#和3#船闸下游船位聚类分析结果的示意图。从图12中可以发现，算法的分类结果与卫星图片中的实际通航状态基本一致。因此，本发明的装置可以对船舶所在航道的类型进行有效区分，便于针对不同航道类型，选取合适的算法及参数，构建船舶异常行为参数模型。
[0224]
下面对重点检测区域的选取情况进行示例性说明。
[0225]
图12为gis融合的单层船位数据网格化模型的一实施例的结构示意图。本发明的方案，以单层网格参数模型为例，设置网格边长l1为200米的检测区域，并对船位数据进行网格化分割。
[0226]
如图12所示，参照实际航道环境，将图12中第7块区域设为桥区检测范围，可选择相应的检测算法进行分析，并结合桥区附近航道环境、桥柱宽度等现场环境，对报警阈值集合up_params7和dowm_param7进行学习设置，生成grid7。up_params7表示第7块网格区域中上行船舶参数集，dowm_param7表示第7块网格区域中下行船舶参数集，grid7表示第7块网格区域参数集。up_paramsi表示第i块网格区域中上行船舶参数集，up_paramsi＝{λi,μi,σi,θi}。dowm_paramsi表示第i块网格区域中下行船舶参数集，down_paramsi＝{λi,μi,σi,θi}。gridi表示第i块网格区域参数集，down_paramsi＝{up_paramsi，down_paramsi}。
[0227]
识别单元108，被配置为利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，得到分类识别结果。该识别单元108的具体功能及处理参见步骤s140。
[0228]
本发明的方案，为实现安装北斗船载终端船舶的违规行为识别，以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型。并基于该网格化参数模型，提
出一种内河船舶轨迹异常识别装置，该装置可识别伪造船舶轨迹、虚假申报过闸行为。
[0229]
在一些实施方式中，所述设定水域内的船舶异常行为分类识别模型，包括：位置异常识别行为模型、轨迹异常识别行为模型、航速和真航向异常识别行为模型、以及申报异常识别行为模型中的至少之一。
[0230]
所述识别单元108，利用所述设定水域内的船舶异常行为分类识别模型，对所述设定水域内的船舶异常行为进行分类识别，包括：
[0231]
所述识别单元108，具体还被配置为对航行路过所述设定水域内已具有船舶异常行为分类识别模型的网格区域的船舶，采样该船舶的航行数据。该分类单元106的具体功能及处理还参见步骤s410。
[0232]
所述识别单元108，具体还被配置为基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别。该分类单元106的具体功能及处理还参见步骤s420。
[0233]
如图8所示，本发明的方案提供的一种内河船舶异常行为的识别装置，还包括：
[0234]
步骤14、船舶违规行为识别判定：对航行路过训练后的网格区域的船舶，根据分类模型学习训练的参数结果作为判定阈值，进而识别是否存在位置异常、轨迹异常、航速异常、航向异常和申报异常等行为。
[0235]
本发明的方案，以北斗船载终端采集的航速、航向和船位等历史数据为基础，提出基于网格化的船舶异常行为识别装置。首先，本发明的方案，采集的船舶数据与相关方案中ais数据主要区别在于采集周期相对固定，数据时间窗口一致。其次，本发明的方案，提出的网格化参数模型，可根据不同时间、空间的航道环境对算法参数集进行灵活设置。然后，本发明的方案，基于数理统计、聚类分析、离群检测等算法，提出了船舶航速、航向及船位异常检测装置。最后，本发明的方案，以葛洲坝船闸下游船舶数据为例，对模型及检测算法的有效性进行了试验验证。
[0236]
其中，所述识别单元108，基于采样到的该船舶的航行数据，利用对应网格区域内的船舶异常行为分类识别模型，对该船舶的异常行为进行识别，包括以下至少一种识别情况：
[0237]
第一种识别情况：所述识别单元108，具体还被配置为基于采样到的该船舶的航行数据，利用所述航速和真航向异常识别行为模型，对该船舶的异常行为进行识别，具体包括：对采样到的该船舶的航行数据进行均值归一化处理和box-cox变换后，利用所述航速和真航向异常识别行为模型对该船舶的航速和真航向的异常行为进行检测：如果所述航速和真航向异常识别行为模型输出的检测结果在设定的置信区间内，则确定该船舶的航速和真航向正常，否则，则确定该船舶的航速和/或真航向异常。
[0238]
下面对航向与航速异常检测的情况进行示例性说明。
[0239]
图13为航向与航速异常检测算法流程示意图。通过分析船舶在每个网格区域中的历史航向与航速数据分布情况，发现均近似服从正态分布ni～(μi，σ
i2
)，x∈{c,v}。因此，分别计算每个网格区域中航向、航速维度的均值和方差，得到其统计特征，并根据得到的统计特征构建状态异常检测算法，算法主要流程如图13所示。如图13所示，航向与航速异常检测算法流程示意图，包括：
[0240]
步骤21、获取样本数据。
[0241]
步骤22、均值归一化处理，box-cox变换，航向、航速异常检测，输出置信区间。
[0242]
步骤23、判断输出的置信区间是否在设定的置信区间范围内：若是，则标记为正常船舶，输出检测结果。否则，则标记为异常船舶，输出检测结果。
[0243]
这样，对经过均值归一化、box-cox变换后的航速、航向数据，采用参数估计法识别异常航速、航向。其中，box-cox变换是box和cox在1964年提出的一种广义幂变换装置，是统计建模中常用的一种数据变换，用于连续的响应变量不满足正态分布的情况。box-cox变换之后，可以一定程度上减小不可观测的误差和预测变量的相关性。
[0244]
一般在统计学中可以认为，当总体服从一般正态分布时，样本落在3倍标准差区域内的概率为99.7％。因此，获取每个区域中99.7％的船舶位置数据构建正常状态模型，其余则为异常状态。采用以下box-cox变换公式：
[0245][0246]
给定置信度(1-α)*100％，其中α＝0.003为显著性水平，则第i区域的航向、航速置信区间的上下边界可通过以下公式计算：
[0247]
mini,maxi＝μi±
3*σiꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)。
[0248]
式(2)中，mini,maxi分别为航向、航速异常检测算法的阈值边界。
[0249]
其中，i表示第i块网格区域，i∈n
*
，n
*
表示网格编号0-n整形。xi表示第i块网格区域中样本数据，xi∈{c,v}，c表示航向，v表示航速。μi表示第i块网格区域中样本均值，μi∈{c,v}。σi表示第i块网格区域中样本标准差，σi∈{c,v}。λi第i块网格区域中box-cox变换参数。
[0250]
图14为航向与航速异常检测装置结果的示意图，其中，(a)为均值标准化后航向、航速数据直方图，(b)为box-cox变换后航向、航速数据直方图，(c)为航向航速分布图。本发明的方案以第7块区域中上行船舶航速、航向样本数据为例，对算法的有效性进行试验验证，具体检测结果如图14所示。从图14中(a)中可以发现，经过均值归一化处理后，航速数据基本服从一般正态分布。由于在该检测区域内，船舶航向基本一致，不能明显发现其正态分布规律。从图14中(b)中可以发现，当航向、航速的box-cox变换参数λ取值分别为9.2和1.6时，航向数据的正态性得到了明显改变。从图14中(c)中可以发现，航向异常检测算法识别出2艘船舶的异常航向行为，未发现异常航速行为。
[0251]
图15为船舶航速、航向分布图。本发明的方案，采用极坐标的方式，可以更好的展现航速与航向之间的分布关系。如图15所示，圆点表示船舶的航向、航速状态，被绿色区域包围的为正常航速、航向状态，区域外被方框标记的则为异常点。
[0252]
图16为停靠在锚地的静止船舶识别结果的示意图。通过调取低航速船舶信息，并结合gis分析，如图16所示，可以发现该船舶停靠在锚地区域，并非在航道内违规停留。
[0253]
第二种识别情况：所述识别单元108，具体还被配置为基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述位置异常识别行为模型，采用射线法和基于密度的离群检测算法，识别该船舶的位置异常行为。
[0254]
下面对船位异常检测的情况进行示例性说明。
[0255]
本发明的方案，采用射线法(ray casting)和局部异常因子算法(lof)，实现船位异常状态的检测。基于射线法的检测装置，需要预先设定边界参数，可以实现船舶进出重点区域检测，如禁区、锚地、导航墙、靠船墩等区域。相较于射线法，基于局部异常因子算法的检测装置更加灵活，可以结合历史船位数据，定期学习训练参数，检测出该点是否离群，如果离群则判定为船位异常。
[0256]
射线法是以目标点为端点，引出一条射线。计算这条射线和检测边界的交点数目。如果交点个数为奇数，则该点在检测区域内部，反之则在检测区域外部。检测区域的边界可以使任意多边形，如果在重点航道水域，可基于航标遥测遥报位置进行自动设定，进而可以有效检测船舶是否在航道内航行。图17为基于射线法的船位异常检测结果的示意图，该算法检测效果如图17所示。
[0257]
局部异常因子算法是一种基于密度的异常点检测算法。第i块区域中pj点的局部异常值因子可表示为：
[0258][0259]
式(3)中，j表示第j条船舶记录，j∈n
*
。vj表示第j条船舶记录的速度。cj表示第j条船舶记录的航速。pj表示第j条船舶记录的位置，pj＝{lat,lng}，lat表示经度，lng表示维度。ε表示船位数据间邻域范围。m points表示邻域范围内最少船舶船位数据量。θi表示第i块网格区域中异常值因子阈值。r表示邻近的船位个数，nb(pj)表示对象pj的r个最邻近组成的集合，lrdb(pj)表示数据对象pj的局部可达密度，该局部可达密度主要是根据pj与其r个最近邻之间的可达距离得到。
[0260]
根据数据对象和它的r个邻近估计出该对象的相对密度，结合相对密度给每个数据对象定义一个θi(pj)。数据对象的θi(pj)值越大表示异常值的可能性就越大。图18为基于lof的离群检测散点图。本发明的方案，选取第7块区域中上行船位数据，当r值为10时，该区域内异常因子值分布如图18所示。
[0261]
如图18，当局部异常因子阈值θ为0.1时，可检测出3条异常船位数据。图19为基于lof的离群检测船位分布图。为了更加直观显示异常船位状态，将离群点标记为红色圆圈，发现算法能够有效检测出离群船舶，具体结果如图19所示。
[0262]
这样，采用射线法和基于密度的离群检测算法，分别实现船舶进出检测水域和异常位置的识别。
[0263]
以葛洲坝下游船舶数据为例，对上述装置进行试验验证。本发明的方案提出一种船舶过闸虚假申报检测算法，该算法基于数据相等判定法、离散系数判定法和系数离散度判定法三种内核算法驱动，可识别人工伪造的船舶定位数据。
[0264]
第三种识别情况：所述识别单元108，具体还被配置为基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述轨迹异常识别行为模型，在该船舶的主电源切断信号接入、且备用电源启动的情况下，检测该船舶的天线状态，以在无法检测到该船舶的天线信号的情况下确定该船舶的轨迹出现异常行为。
[0265]
下面对船舶轨迹异常的检测情况进行示例性说明。
[0266]
船舶违规过闸检测算法流程包括：
[0267]
步骤31、主电源切断信号接入。
[0268]
例如：北斗芯片有一个adc检测功能，比较主电源与备用电池之间的电压差，来判断主电源是否接入。在船舶运行期间主电源24小时运行。主电源切断有两种情况，一是船舶停止航行或完成一次运输任务(属于正常操作)。二是人为拆卸机器(违规行为)。
[0269]
步骤32、定位模型的备用电源启动。
[0270]
步骤33、检测天线状态。检测天线目的在于，仅凭主电源是否掉电不能判别船方是否违规，需检测天线状态信号。比如在正常操作时不会拔掉定位天线的，只有拆卸设备才需要拔掉天线，因为天线已经固定在船舶上，不能和终端一同携带。
[0271]
北斗定位模组需接入天线才能接收到北斗卫星信号，进而进行定位分析。北斗定位模组中有天线信号数据传输接口，如果该数据传输接口不能收到信息，则说明天线被拆卸了。如果该接口正常接收天线传来的数据，则说明天线已接入。
[0272]
备用电源的作用是当主电源切断，需保证北斗拆卸检测模型的正常运行(如持续记录、保存北斗定位数据，便于终端上电联网运行后，将数据回传至监管部门)。备用电源是可充电电池，充满电可独立工作可连续运行2个月，设备上电后，进行充电。
[0273]
其中，终端离线信息获取方式，可以包括：船上电源供电方式、模型电池供电方式、岸上电源供电方式，三种供电方式可以选择使用，具体如下：
[0274]
第一种可选的供电方式：在船上电源供电方式中，可以设置定时如每3分钟记录一次utc(即世界标准时间)时间、经纬度、速度和天线状态。无论是否连接天线，都记录定位结果和天线状态。
[0275]
第二种可选的供电方式：在模型电池供电方式中，需要判断天线是否连接。若天线连接，则保持utc时间、位置、速度和天线状态等信息，也是定时如每3分钟进入一次睡眠模式，唤醒后保存一次数据。若天线未连接，则时定时如每隔5分钟会进入低功耗模式。
[0276]
第三种可选的供电方式：在岸上电源供电方式中，需要读取log信息(即运行时间信息)，然后擦除数据。然后根据读取的信息和客户报的位置、时间、天线状态判断客户是否违规。还需要判断天线是否连接。若天线连接，则需等到定位后上传nmea信息(即海用电子设备制定的标准格式信息)，不上传未定位的信息。若未连接天线，则上传无定位标识的nmea信息，服务器解析后报警，未接天线。
[0277]
步骤34、判断北斗天线是否拆除。若是，则执行步骤35。否则，结束防拆卸检测流程。
[0278]
步骤35、保存最后一条北斗定位数据。
[0279]
步骤36、判断主电源是否开启。若是，则执行步骤37。否则，执行步骤38。
[0280]
步骤37、检测天线状态。
[0281]
步骤38、判断北斗天线是否接入。若是，则执行步骤39。否则，结束防拆卸检测流程。
[0282]
步骤39、获取最新一条北斗定位数据。
[0283]
步骤310、判断船舶位置变化是否异常。若是，则执行步骤311。否则，结束防拆卸检测流程。
[0284]
步骤311、推送终端拆卸警示信息，之后结束防拆卸检测流程。
[0285]
例如：一条船舶的航线是上海-》宜昌-》重庆，船舶行驶至宜昌时需要申报过闸。违规流程是当船舶从上海出发前，设备断电取出，断电后模型记录并保存最后一条北斗位置(最后一条北斗定位数据l1、断电时间t1)，此时，有其他人员乘坐高铁将设备运送至宜昌开始申报(设备和船舶是一一对应的，不存在一艘船多个设备)，申报需要上电，此时记录位置(最新一条北斗定位数据l2、开机时间t2)。可以计算最后一条北斗定位数据l1和最新一条北斗定位数据l2的直线距离s，断电时间t1和开机时间t2的时间差t。正常情况下，船舶行驶速度相对较慢20-30km/h，一条船舶的从上海行驶至宜昌的时间是相对固定的，包括中间装卸作业、运输等时间在10天以上。但如果做高铁则1天就到，时间差t明显减少。综合断电和上电时的偏移距离，时间差越小违规的标志越明显。船舶违规概率的计算公式，其中，a代表：船舶上行航线起点距离申报点的距离，b代表：船舶航行理论所用时间，s的单位为千米km，t的单位为小时h。违规概率主要用于分析判断船舶违规申报的判定，需参考一定阈值。图20为违规拆卸分析流程的示意图，详细检测流程如图20所示。
[0286]
第四种识别情况：所述识别单元108，具体还被配置为基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，对该船舶的异常行为进行识别，具体包括：基于采样到的该船舶的航行数据，利用所述申报异常识别行为模型，统计该船舶的所有采用周期内轨迹数据的异常系数，根据该异常系数识别该船舶是否存在申报异常行为。
[0287]
下面对船舶违规过闸检测的结果进行示例性说明。
[0288]
图21为过闸船舶违规结果分布情况的示意图。本发明的方案选取上游巴东大桥到下游石首大桥之间的2000余艘过闸船舶数据进行分析。每条船舶违规概率结果分布情况如图21所示，可以发现有4艘违规概率相对较高船舶。
[0289]
图22为413831889船报闸区间航段详细轨迹的示意图，图23为413831889船全部航段详细轨迹的示意图。对以上4艘船舶逐一分析，其中2艘船舶船位数据分别为36条和498条，其结果不具评判价值，因此剔除以上2艘船舶。其余2艘船舶计算结果分别为0.98和1，船位数据分别为2253条和2591条。经过与gis融合显示分析后，发现以上2艘船舶具有一定的违规嫌疑。以mmsi为413831889的船舶为例进行分析，如图22和图23所示。图22和图23中，我们以时间顺序展示了船舶形式轨迹路线，并选择其中5条数据进行分析。标号为0的船位数据，获取时间为2月22日7时，此后1天内再无船位数据上船。可以判断出船舶在该锚地附近停留一段时间后，为逃避海事监管，违规关闭了终端。此后，2月22日18时该船通过巴东大桥后在附近锚地停留。2月23日4时-9时期间，船舶位置出现异常情况，如标为1、2、3的船位数据。
[0290]
为更加全面、准确分析船舶违规情况，获取了船舶全部航行记录，并结合gis进行全面展示和分析，如图22和图23所示。可以发现，该船在过闸申报监管的关键节点，包括巴东大桥、三峡船闸和石首大桥附近，均存在异常位置。且船舶轨迹存在大量不连续情况，初步分析可能存在其它船舶终端协助伪造船舶位置的情况，可判定为违规申报行为。
[0291]
下面对虚假申报检测的情况进行示例性说明。
[0292]
图24为三峡局通报“振荣858”轮违规申报过闸情况的示意图。本发明的方案提出一种船舶过闸虚假申报检测算法，该算法可识别人工伪造的船舶定位数据。项目组通过分析历史船舶定位数据，梳理并分析了人工伪造船舶定位数据的特征。通过识别系列特征，能
够实现对过闸船舶虚假申报行为进行检测。驱动该算法运行的数据，以固定窗口内数据为单元数据。通过计算船舶轨迹数据的所有窗口内数据的异常系数，进行统计，最终结合判定阈值，识别潜在违规船舶。具体算法流程如图24所示。
[0293]
该算法的核心是计算窗口内数据的异常系数。本发明的方案，提出了三种判定装置，分别是数据相等判定法、离散系数判定法和系数离散度判定法。三种判定装置适用于不同层级的虚假申报手段。
[0294]
数据相等判定法：基于数据相等的判定装置最为简单，仅需判断数据的一致性即可实现对虚假申报船舶的识别。
[0295]
离散系数判定法：基于离散系数判定法是在数据相等判定法的基础上衍生而来，但技术上能够从一定程度上降低人工干扰。其中，离散系数是概率分布离散程度的一个归一化量度，其定义为标准差与平均值之比。
[0296]
系数离散度判定法：回归系数判定装置引入了回归系数集合。一般情况下，如果仅凭人工伪造船舶定位数据，其工作量较大，至少需要伪造上千条船舶定位数据。随着技术发展，采用实验室仪器或破解软件方式，可实现船舶定位数据的自动生成，但生成的规则也需要人为参与、制定。因此，如果发现船舶定位数据存在某种异常规则或特征，也就能够识别虚假船位数据。规则大多引入某种公式实现，因此，采用回归分析装置，先实现船舶数据的回归分析。结合其显著性检验结果和可视化gis分析，如果回归分析结果与船舶数据匹配度较高，则可以判定船舶数据是由计算机模拟生成，即可认定其为虚假申报船舶。该装置的优点是不仅能否发现船舶虚假申报行为，还可以识别其采用的装置。但该装置缺点是只适用于特定较小范围区域，不适用于过闸全域或大范围检验分析场景。
[0297]
下面对虚假申报检测的结果进行示例性说明。
[0298]
图25为振荣858轮虚假申报轨迹的示意图。现阶段，船舶虚假申报行为较为单一，特征相对明显。通过相对较为简单的数据相等判定法就可以识别并发现违规船舶。通过该算法，在2021年7月至2021年8月船载终端历史数据中，仅发现了“振荣858”轮的违规行为。振荣858轮虚假申报轨迹，如图25所示。
[0299]
图26为振荣858轮虚假申报轨迹与正常船舶轨迹对比的示意图，其中，(a)为正常船舶锚泊轨迹的示意图，(b)为正常过闸船舶轨迹的示意图，(c)为振荣858轮锚泊轨迹的示意图，(d)为振荣858轮过闸轨迹的示意图。通过分析该轮的历史船位数据，并结合可视化gis，可以清晰发现该轮伪造数据的手段与装置，详见图26所示。通过与正常船舶轨迹相比较，可以发现正常船舶的定位装置会受到环境影响，存在一定的定位误差，且该误差不能完全消除。因此，会围绕某点随机产生定位数据，如图26中(a)所示。而振荣858轮的轨迹十分规则，围绕固定点位生成，如图26中(c)所示。再对过闸时船舶轨迹分析，可以发现相同的情况，详见图26中(b)和图26中(d)所示。正常过闸船舶轨迹分布均匀，且船舶在一个闸室内的定位数据普遍体现在上下闸首和船闸中心，符合船舶过闸行为规律。而振荣858轮过闸船舶轨迹分布不规则，且存在较多船舶定位已偏移出闸室水域。通过分析两坝间船位数据也可发现，其船位数据位置分布过于均匀，且航向、航速数据与船舶正常航行数据不匹配、不一致。
[0300]
对振荣858轮进行分析后，发现该轮伪造船舶数据采用一种网格化的数据生成方式。该轮历史船位数据，均符合一种网格模型，且坐标位置均在网格模型的节点上，不存在
其它位置数据，总体可总结为“横平竖直”。
[0301]
图27为三峡局关于“振荣858”轮违规申报过闸情况的通报截图。为了检验该轮的违规行为，通过浏览长江三峡通航管理局网页，发现三峡局，对“振荣858”轮违规申报过闸情况进行了通报，通报内容如图27所示。
[0302]
本发明的方案，以固定采集时间窗口的航向、航速和船位数据为基础，开展了基于网格化参数模型的船舶异常行为识别技术研究。构建了一种灵活可扩展的多层次网格化参数模型。综合运用数理统计、聚类分析、离群检测等算法，提出了船舶航速、航向及船位异常检测装置。试验结果显示：本发明的方案，提出的装置可以有效的针对船舶航向、航速和船位异常状态进行检测。通过对船舶当前航行信息与模型学习结果进行比较，判断其是否存在潜在的异常行为。研究成果可为内河船舶航行风险分析和预测预警等提供技术支撑。
[0303]
由于本实施例的装置所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。
[0304]
采用本发明的技术方案，通过以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型；并基于该网格化参数模型，识别伪造船舶轨迹、虚假申报过闸行为等违规行为，可识别人工伪造的船舶定位数据，高效且可靠性。
[0305]
根据本发明的实施例，还提供了对应于船舶异常行为的识别装置的一种终端。该终端可以包括：以上所述的船舶异常行为的识别装置。
[0306]
由于本实施例的终端所实现的处理及功能基本相应于前述装置的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。
[0307]
采用本发明的技术方案，通过以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型；并基于该网格化参数模型，识别伪造船舶轨迹、虚假申报过闸行为等违规行为，可为内河船舶航行风险分析和预测预警等支撑，有利于提升船舶航行安全性。
[0308]
根据本发明的实施例，还提供了对应于船舶异常行为的识别方法的一种存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行以上所述的船舶异常行为的识别方法。
[0309]
由于本实施例的存储介质所实现的处理及功能基本相应于前述方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。
[0310]
采用本发明的技术方案，通过以固定时间窗口采集的航速、航向和船位等数据为基础，采用基于密度的聚类分析算法对历史船位数据进行聚类分析，实现航道类型的分类并构建其网格化参数模型；并基于该网格化参数模型，识别伪造船舶轨迹、虚假申报过闸行为等违规行为，通过对船舶当前航行信息与模型学习结果进行比较，判断其是否存在潜在的异常行为，可靠且精准。
[0311]
综上，本领域技术人员容易理解的是，在不冲突的前提下，上述各有利方式可以自
由地组合、叠加。
[0312]
以上所述仅为本发明的实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于图像分析的高校课堂氛围评价系统

一种船舶异常行为的识别方法、装置、终端和存储介质与流程

相关文献

最热文献