一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向航班计划的离港旅客聚集信息预测方法及系统与流程

2022-06-11 09:31:02 来源:中国专利 TAG:


1.本发明属于民用航空数据信息处理技术领域,尤其涉及一种面向航班计划的离港旅客聚集信息预测方法、面向航班计划的离港旅客聚集信息预测系统。


背景技术:

2.目前,实时准确感知航站楼离港旅客聚集特性并做好筛查防护和应急准备成为保持社会安全平稳运行的重要手段之一。旅客是航站楼服务主体(行李附着于旅客),而离港旅客的到达,是触发航站楼旅客服务流程的起点。
3.感知旅客分布态势和旅客聚散规律,揭示旅客流聚集特性,攻克旅客流高强度混合叠加下旅客流态势预测,对此将服务资源进行规划和调度,使有限的旅客服务资源发挥更大的效用,加快机场运行效率,为决策者提供合理客观的意见及资源优化策略。
4.通过上述分析,现有技术存在的问题及缺陷为:(1)多航班耦合离港旅客聚集信息预测准确率低;(2)多航班耦合离港旅客聚集信息预测不能为服务资源进行规划和调度提供客观的理论依据和优化的意见,使得机场运行效率低。
5.解决以上问题及缺陷的难度为:在建立的单航班赋权叠加公式中,叠加公式的设计以及权重系数的求解是难点问题。在影响因素的前提下,考虑到了众多航班叠加带来的高误差以及系数难以调解的情况。在这里,约束系数相加和为1,系数的赋值也并非所有航班均分系数,而是有权重的赋值,某一时间段的航班影响将远远大于其他航班,而这些航班的系数具体解则需要采用智能优化算法求解以量化出来。另外,众多航班叠加繁琐,将带来误差和系数收敛精度不够,需要对众多航班分组统一化每组的公式来达到简化众多航班带来的误差目的
6.解决以上问题及缺陷的意义为:问题的解决将提高多航班耦合离港旅客聚集预测精度,机场运营者将提前感知高峰期多航班旅客流的分布态势以对资源整合调度,将航站楼的各个流程衔接流畅化,减少流程间的脱节现象。同时机场运营者可以展现出科学性和超前性的航站楼管理,打破运营瓶颈,实现流程设计与业务发展高度匹配模式,让机场实现整体协调发展成为可能。


技术实现要素:

7.为克服相关技术中存在的问题,本发明公开实施例提供了一种面向航班计划的离港旅客聚集信息预测方法、系统、接收用户输入程序存储介质及信息数据处理终端。本发明创新点在于设计叠加公式并对其权重系数调整以达到最大程度的拟合真实多航班离港旅客聚集规律。
8.所述技术方案如下:一种面向航班计划的离港旅客聚集信息预测方法,
9.以组为单位分析单航班离港旅客聚集特性,得到单航班离港旅客在各个组合条件下的完整分布,采用参数回归确定完整分布的未知参数;建立基于单航班赋权叠加公式的多航班耦合离港旅客聚集模型,以kl散度为指标评估多航班耦合离港旅客聚集模型精度。
10.在一实施例中,所述面向航班计划的离港旅客聚集信息预测方法包括以下步骤:
11.步骤一,分析影响离港旅客到达因素,确定影响因素,并按影响因素对离港旅客数据分类分组(如图2-图3为影响离港旅客因素的工作日、非工作日、高峰期);影响离港旅客到达因素包括:航班计划、工作日、非工作日以及高峰期因素;
12.步骤二,利用离港旅客影响因素,分组分别建立基于单航班离港旅客到达模型;
13.步骤三,利用步骤二建立的基于单航班离港旅客到达模型检验基于单航班离港旅客到达模型,确立单航班离港旅客到达时间在各个组合条件下的完整分布;
14.步骤四,利用步骤三确定的完整分布对面向所有旅客的公共服务,建立单航班赋权叠加的多航班离港旅客聚集模型;
15.步骤五,利用步骤四所述的单航班赋权叠加的多航班离港旅客聚集模型,对设计的单航班叠加公式的权重系数求解。
16.在一实施例中,所述步骤二利用建立的单航班离港旅客到达模型对已分组好的单航班离港旅客到达数据采用多种分布对离港旅客提前到达时间进行分布拟合,分析取单航班离港旅客到达特征以及旅客到达航站楼规律;
17.具体包括:
18.选取符合重尾分布特征的分布对离港旅客直方图进行数据拟合,经过实证分析,选取对数正态分布、指数修正的正态分布、偏正态分布拟合,具体的概率密度表达式如下:
19.对数正态分布是指随机变量x的密度函数为概率密度:
[0020][0021]
其中:μ与σ分别是变量对数的均值与标准差;
[0022]
指数修正的正态分布是指随机变量x的密度函数为:
[0023][0024]
其中:λ为形状参数;σ为比例参数;μ为移动参数;
[0025]
偏正态分布是指随机变量x的密度函数为概率密度:
[0026][0027]
其中:φ(x;μ,σ)和φ(x;μ,σ)分别为标准正态分布的密度函数和分布函数,称随机变量x服从参数为(μ,σ,λ)的偏态分布;
[0028]
选取伯尔分布、约翰逊分布、贝塔分布,具体的概率密度表达式如下:
[0029]
伯尔分布是指随机变量x的密度函数为:
[0030][0031]
其中:a为形状参数;b为形状参数;p为比例参数。
[0032]
约翰逊分布是指随机变量x的密度函数为:
[0033][0034]
其中:γ为形状参数;δ>0为形状参数;ξ为形状参数;λ>0为比例参数。
[0035]
贝塔分布是指随机变量x的密度函数为:
[0036][0037]
其中:a为最小值,b为最大值,四参数贝塔分布x取值不限定于(0,1)。α,β>0俩分布参数。
[0038]
在一实施例中,采用freedman-diaconis规则绘制直方图,此规则对异常数据不敏感,能更好展示离港旅客到达航站楼规律。通过freedman-diaconis规则确定组距:
[0039][0040]
其中:n为直方图组距;q(x)为样本数据的x四分位数;l为样本x的观测数。
[0041]
在一实施例中,所述步骤三对选取的各种分布采用拟合优度检验方法选取最优分布,所述拟合优度检验方法使用柯尔莫哥洛夫检验法,判断概率密度拟合函数能否反映历史数据中的信息,具体步骤包括:
[0042]
(1)设x1,

,xn为某单航班概率密度为f(x)时抽取的样本,做出如下假设:
[0043]
h0:f(x)=f0(x);
[0044]
h1:f(x)≠f0(x);
[0045]
其中,f0(x)为单航班中某个已知分布函数,将x1,

,xn由小到大排列,得到 x
(1)
,

x
(n)
,并构造经验函数f0(x);
[0046]
(2)求d
(n)

[0047][0048]
其中,k为样本从小到大排列后的序数,sup函数表示一个组距离中的上确界;
[0049]
给定显著性水平柯尔莫哥洛夫检验法返回两个值d值和p值,d 值表示两个分布之间最大距离,d值越小,分布越一致,p值大于给定的显著性水平时,则不能拒接原假设;
[0050]
对分布未知参数进行估计,其中指数修正的正态分布概率密度函数f(x)为:
[0051][0052]
其中:λ为形状参数;σ为比例参数;μ为移动参数;
[0053]
约翰逊分布的概率密度函数g(x)为:
[0054][0055]
其中:γ为形状参数;δ》0为形状参数;ξ为移动参数;λ》0为比例参数。
[0056]
在一实施例中,所述步骤四单航班赋权叠加的多航班离港旅客聚集模型包括对离港航班的选取以及将高峰期已一小时为时段划分,对划分好的各个时段按利用k-means算法进行聚类,确定不同天同一划分时段内所有单航班分布的统一概率密度函数搭建面向多航班耦合的离港旅客聚集模型;
[0057]
所述k-means的算法包括:
[0058]
步骤1:确定n个不同的簇;
[0059]
步骤2:随机选取n个点作为初始聚类中心;
[0060]
步骤3:用欧氏距离公式将每个点分配到距离最短的聚类中,所采用的欧氏距离公式如下:
[0061][0062]
其中:xi为第i个点,yi为第i个聚类中心;
[0063]
步骤4:根据公式重新定义聚类中心,公式为:
[0064][0065]
其中:ψr是第r个簇的中心向量;是簇n的第i个数据;qn是每个簇的样本量;
[0066]
步骤5:重复步骤3和4,直到中心向量收敛;
[0067]
所述确定不同天同一划分时段内所有单航班分布的统一概率密度函数搭建面向多航班耦合的离港旅客聚集模型包括:
[0068]
以聚类中心的样本信息代替原始样本的整体属性,去除冗余部分,确定各个时段的质心,所述质心为此时段的所有航班的旅客到达的分布参数,采用可决系数r2检验数据,r2越接近于1,分布的拟合优度越高,计算公式为:
[0069][0070]
其中:yi′
为真实数据直方图中第i个小区间xi的概率密度值;为yi的平均值;为在分布中的概率密度值;
[0071]
对每天高峰期细化成以一小时为单位的小时段后,采用k-means的聚类算法得出划分时段后的每个时段的所有航班整体分布的概率密度函数;把上午高峰期划分成三个时段,下午高峰期划分成三个时段,则一天里上午高峰期多航班叠加公式为:
[0072]
[0073]
其中:k=3,xh为划分的以一小时为时段的离港旅客到达时间,f(xh;μi,λi,σi) 为划分的以一小时为时段的旅客到达分布的指数修正的正态分布概率密度函数,yj为叠加的权重系数;其中,h=1,2,3;
[0074]
下午高峰期多航班叠加公式为:
[0075][0076]
其中:xm为划分的以一小时为时段的离港旅客到达时间,f(xm;ζm,γm,δm,λm) 为划分的以一小时为时段的旅客到达分布的约翰逊分布概率密度函数;yn为叠加的权重系数;其中,m=1,2,3。
[0077]
在一实施例中,所述步骤五所述的对单航班赋权叠加的权重系数求解,采用混合蛙跳算法确定系数值,以指标预测高峰期内多航班整体分布;
[0078]
所述混合蛙跳算法中目标函数为:
[0079][0080]
其中,以上午高峰期为例,yi为公式正态分布概率密度函数f(x)的概率密度值,为多航班实际分布的概率密度值,n为训练数据集的旅客样本数;
[0081]
权重系数的约束函数为
[0082][0083]
使用均方根误差作为指标分析相应的分布,计算公式为:
[0084][0085]
其中:ym为真实数据直方图中第m个小区间xm的概率密度值;ym′
为xm在分布中的概率密度值;
[0086]
使用kl散度比较模型所建立的分布与真实分布之间的差异,真实分布p(x) 和近似分布q(x)之间的kl表达式为:
[0087][0088]
kl=0,q(x)=p(x)。
[0089]
本发明的另一目的在于提供一种面向航班计划的离港旅客聚集信息预测系统包括:
[0090]
影响因素分析模块,用于分析影响离港旅客到达因素,确定影响因素,并按影响因素对离港旅客数据分类分组;
[0091]
基于单航班离港旅客到达模型构建模块,用于利用离港旅客影响因素,分组分别建立基于单航班离港旅客到达模型;
[0092]
完整分布获取模块,用于利用建立的基于单航班离港旅客到达模型检验基于单航班离港旅客到达模型,确立单航班离港旅客到达时间在各个组合条件下的完整分布;
[0093]
多航班离港旅客聚集模型构建模块,用于利用确定的完整分布对面向所有旅客的公共服务,建立基于单航班赋权叠加的多航班离港旅客聚集模型;
[0094]
权重系数求解模块,用于利用所述的单航班赋权叠加的多航班离港旅客聚集模型,对设计的单航班叠加公式的权重系数求解。
[0095]
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
[0096]
本发明优点:目前国内外研究的多是单航班离港旅客聚集模型,鲜有对多航班离港旅客聚集模型做研究,并且对影响离港旅客因素细分并做了分组,详细建立了每组的单航班离港旅客聚集模型,再设计了叠加公式,建立了每组情况的基于单航班赋权叠加的多航班离港旅客聚集模型。较现有研究考虑全面且针对高峰期机场运行效率低下做了高峰期内多航班旅客分布态势感知,实现机场运营效率和旅客服务满意度双丰收的格局,以此大大提高机场竞争力。
[0097]
本发明积极效果:模型将最大程度拟合真实高峰期下多航班离港旅客分布态势,利用此效果提前感知机场航站楼高峰期旅客流聚集趋势,对旅客何时为聚集高峰做好全面的应对,向机场运营者提供科学的管理方案。
[0098]
本发明提出了感知多航班离港旅客聚集态势的方法,首先以组为单位分析单航班离港旅客聚集特性,得到单航班离港旅客在各个组合条件下的完整分布,采用参数回归确定分布的未知参数,再建立基于单航班赋权叠加公式的多航班耦合离港旅客聚集模型,以kl散度为指标评估模型精度。实验结果表明,提出的基于单航班赋权叠加公式的多航班耦合离港旅客聚集模型有理想的预测效果。
[0099]
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明的公开。
附图说明
[0100]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0101]
图1是本发明实施例提供的面向航班计划的离港旅客聚集信息预测方法流程图。
[0102]
图2是本发明实施例提供的量化影响离港旅客到达机场因素图。
[0103]
图3是本发明实施例提供的9:00-12:00的旅客人数和航班数量。
[0104]
图4是本发明实施例提供的15:00-17:00的旅客人数和航班数量。
[0105]
图5是本发明实施例提供的采用多种分布拟合对其中一组单航班离港旅客提前到达时间示意图。
[0106]
图6是本发明实施例提供的采用多种分布拟合对其中一组单航班离港旅客提前到达时间示意图。
[0107]
图7是本发明实施例提供的混合蛙跳算法流程图。
具体实施方式
[0108]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不
违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
[0109]
如图1所示,本发明提供一种面向航班计划的离港旅客聚集信息预测方法,包括按下列步骤:
[0110]
s101:分析影响离港旅客到达因素,确定影响因素,并按影响因素对离港旅客数据分类分组并将其大致分为四类。
[0111]
s102:在上述对离港旅客影响因素分析基础上,分组分别建立基于单航班离港旅客到达模型的描述和假设。
[0112]
s103:在上述模型假设基础上,检验基于单航班离港旅客到达模型,确立单航班离港旅客到达时间在各个组合条件下的完整分布。
[0113]
s104:在上述分布确定的基础上,针对航站楼关键业务环节的服务资源是面向所有旅客的公共服务,建立单航班赋权叠加的多航班离港旅客聚集模型。
[0114]
s105:利用步骤s104所述的单航班赋权叠加的多航班离港旅客聚集模型,对设计的单航班叠加公式的权重系数采用算法求解。
[0115]
在本发明一优选实施例中,在步骤s101中,所述的影响离港旅客到达因素是除了受航班计划之外,还与工作日、非工作日、高峰期等因素相关。根据工作日的高峰时段和非工作日的高峰时段对离港旅客数据进行分组。
[0116]
在本发明一优选实施例中,在步骤s102中,所述的单航班离港旅客到达模型的描述和假设是对已分组好的单航班离港旅客到达数据采用多种分布对离港旅客提前到达时间进行分布拟合,描述单航班离港旅客到达特征,刻画旅客到达航站楼规律。
[0117]
具体包括:
[0118]
具体包括:
[0119]
选取符合重尾分布特征的分布对离港旅客直方图进行数据拟合,经过实证分析,选取了对数正态分布、指数修正的正态分布、偏正态分布拟合ⅰ、ⅱ组,具体的概率密度表达式如下:
[0120]
对数正态分布是指随机变量x的密度函数为概率密度:
[0121][0122]
其中:μ与σ分别是变量对数的均值与标准差;
[0123]
指数修正的正态分布是指随机变量x的密度函数为:
[0124][0125]
其中:λ为形状参数;σ为比例参数;μ为移动参数;
[0126]
偏正态分布是指随机变量x的密度函数为概率密度:
[0127][0128]
其中:φ(x;μ,σ)和φ(x;μ,σ)分别为标准正态分布的密度函数和分布函数,称随机变量x服从参数为(μ,σ,λ)的偏态分布;
[0129]
选取伯尔分布、约翰逊分布、贝塔分布,具体的概率密度表达式如下:
[0130]
伯尔分布是指随机变量x的密度函数为:
[0131][0132]
其中:a为形状参数;b为形状参数;p为比例参数。
[0133]
约翰逊分布是指随机变量x的密度函数为:
[0134][0135]
其中:γ为形状参数;δ>0为形状参数;ξ为形状参数;λ>0为比例参数。
[0136]
贝塔分布是指随机变量x的密度函数为:
[0137][0138]
其中:a为最小值,b为最大值,四参数贝塔分布x取值不限定于(0,1)。α,β>0俩分布参数。
[0139]
在本发明一优选实施例中,在步骤s103中,所述的确立单航班离港旅客到达时间分布是包括对选取的各种分布采用拟合优度检验方法选取最优分布,确定单航班离港旅客提前到达时间在各个组合下的完整分布。
[0140]
在本发明一优选实施例中,在步骤s104中,单航班赋权叠加的多航班离港旅客聚集模型包含对离港航班的选取以及将高峰期已一小时为时段划分,对划分好的各个时段按进行聚类,确定不同天同一划分时段内所有单航班分布的统一概率密度函数来搭建面向多航班耦合的离港旅客聚集模型。
[0141]
在本发明一优选实施例中,在步骤s105中,所述的对单航班赋权叠加的权重系数求解,在求解权重系数采用的是混合蛙跳算法确定系数值,以指标评估仿真模型,证明模型能很好地预测高峰期内多航班整体分布,具有工程推广价值。
[0142]
下面结合具体实施例对本发明的技术方案作进一步描述。
[0143]
实施例
[0144]
本发明的面向航班计划的离港旅客聚集信息预测方法包括下列步骤:
[0145]
步骤1:分析影响离港旅客到达因素,确定影响因素,并按影响因素对离港旅客数据分类分组并将其大致分为四类。
[0146]
旅客到达航站楼的流量在工作日与非工作日上有很大的差异。为了直观看出工作日与非工作日的旅客流量差异,统计了某机场夏秋航季旅客运行数据,见图2,可知:非工作旅客到达航站楼的人数显著高于工作日,人数显著差异会造成离港旅客分布的不同。
[0147]
同一天不同时段,机场的繁忙程度也不一样,不同时段的航班排班数量也不一样,相应地,旅客到达航站楼的人数也呈现一定的差异性。结合历史运行数据,计算工作日与非工作日各不同时段下的平均航班排班数量以及平均旅客到达航站楼的人数,见图3-图4,可
知:平均每天的高峰期分布在上午的 9:00-12:00及下午的15:00-17:00。高峰极易造成资源调度的不及时,因此分析高峰段下离港旅客呈现何种分布也是很有必要的。因此可以将离港旅客数据分为工作日上午高峰期、工作日下午高峰期、非工作日上午高峰期以及非工作日下午高峰期这四组。见表1将离港旅客数据分类分组。
[0148]
表1样本数据分类
[0149][0150]
步骤2:在上述对离港旅客影响因素分析基础上,分组分别建立基于单航班离港旅客到达模型的描述和假设。
[0151]
为了分析离港旅客到达时间的分布特征,根据工作日的高峰时段和非工作日高峰时段对数据进行分组,以组为单位,选取不同分布对高峰时段的旅客数据进行拟合。图5-图6分别给出了非工作日高峰期内单航班离港旅客提前到达分布。图中横坐标表示旅客提前到达时间。
[0152]
在绘制直方图时,考虑到离港旅客到达行为有很强的非均匀性并且活跃性随时间变化剧烈,有明显的重尾特性,采用freedman-diaconis规则,它对异常数据不敏感,更适合重尾分布的数据,能更好的展示单航班离港旅客聚集规律,因此采用此规则来确定组距:
[0153][0154]
其中:n为直方图组距;q(x)为样本数据的x四分位数;l为样本x的观测数。
[0155]
由图5-图6可以看出:一天里两个高峰期内旅客到达时间规律存在差异性, 9:00-12:00高峰期的单航班旅客呈现重尾分布,偏正态分布、指数修正的正态分布以及对数正态分布对数据有较好的拟合度。而15:00-17:00高峰期内旅客到达时间较大概率集中在某一个区间内,贝塔分布、伯尔分布、约翰逊分布对数据有较好的拟合度。
[0156]
步骤3:在上述模型假设基础上,检验基于单航班离港旅客到达模型,确立单航班离港旅客到达时间在各个组合条件下的完整分布。
[0157]
使用柯尔莫哥洛夫检验法来判断概率密度拟合函数能否反映历史数据中的信息具体步骤如下:
[0158]
(1)设x1,

,xn为某单航班概率密度为f(x)时抽取的样本,做出如下假设:
[0159]
h0:f(x)=f0(x)
ꢀꢀ
(2);
[0160]
h1:f(x)≠f0(x)
ꢀꢀ
(3);
[0161]
其中,f0(x)为单航班中某个已知分布函数,将x1,

,xn由小到大排列,得到 x
(1)
,

x
(n)
,并构造经验函数f0(x)。
[0162]
(2)求d
(n)
,即:
[0163][0164]
其中,k为样本从小到大排列后的序数,sup函数表示一个组距离中的上确界。
[0165]
给定显著性水平柯尔莫哥洛夫检验法返回两个值d值和p值,d 值表示两个分布之间最大距离,d值越小,分布越一致,p值大于给定的显著性水平时,则不能拒接原假设。
[0166]
为了得到分布的未知参数,对分布未知参数进行估计,其中指数修正的正态分布概率密度函数f(x)为:
[0167][0168]
其中:λ为形状参数;σ为比例参数;μ为移动参数。
[0169]
约翰逊分布的概率密度函数g(x)为:
[0170][0171]
其中:γ为形状参数;δ》0为形状参数;ξ为移动参数;λ》0为比例参数。
[0172]
步骤4:在上述分布确定的基础上,针对航站楼关键业务环节的服务资源是面向所有旅客的公共服务,建立基于单航班赋权叠加的多航班离港旅客聚集模型。
[0173]
在单航班层面能对大多数正常离港航班进行模型建立,但是从行业特点和机场的实际运行角度出发,航站楼的关键业务环节的服务资源是面向所有旅客的公共服务,因此分析多航班耦合的离港旅客聚集模型具有现实意义。
[0174]
在多航班建模分析过程中,在不违背实际运行情况的基础上,方便建模以及提升方法的准确度,本发明以时间维度为旅客行为的主要因素,故针对造成高峰时段离港航班做出如下假设:
[0175]
1)离港旅客数据均来自同一机场;
[0176]
2)航线性质相同,即均为国内航线的非中转航班;
[0177]
3)以旅客实际运行数据为准,不考虑迟到旅客;
[0178]
4)不考虑大面积航班延误的特殊情况。
[0179]
通过数据筛选统计,每天上午高峰时段的航班达到了30架甚至往上,下午高峰时段的航班也是达到了20架左右,对高峰期内每个单航班直接叠加将带来大误差以及权重调试的困难性。因此,将造成高峰期的航班进行时段的划分,细化单位为1小时,即高峰期9:00-12:00的旅客航班划分为三个时段: 10:00-11:00,11:00-12:00,12:00-13:00,对造成高峰期15:00-17:00的旅客航班划分为三个时段:16:00-17:00,17:00-18:00,18:00-19:00。将各个时段下的所有航班的分布参数进行k-means聚类。k-means算法的结果是星团之间的距离尽可能大,而簇中的点尽可能紧密连接在一起。如下展示了k-means的算法步骤:
[0180]
步骤1:确定n个不同的簇;
[0181]
步骤2:随机选取n个点作为初始聚类中心;
[0182]
步骤3:用欧氏距离公式将每个点分配到距离最短的聚类中,所采用的欧氏距离公
式如下:
[0183][0184]
其中:xi为第i个点,yi为第i个聚类中心。
[0185]
步骤4:根据公式重新定义聚类中心,公式如下所示:
[0186][0187]
其中:ψr是第r个簇的中心向量;是簇n的第i个数据;qn是每个簇的样本量。
[0188]
步骤5:重复步骤3和4,直到中心向量收敛。
[0189]
以聚类中心的样本信息代替原始样本的整体属性,可以去除冗余部分,提高数据精度,解决原始数据质量不高的问题。确定各个时段的质心,此质心即为此时段的所有航班的旅客到达的分布参数,采用可决系数r2检验数据,r2越接近于1,表明分布的拟合优度越高,计算公式为:
[0190][0191]
其中:yi′
为真实数据直方图中第i个小区间xi的概率密度值;为yi的平均值;为在分布中的概率密度值。
[0192]
对每天高峰期细化成以一小时为单位的小时段后,采用了k聚类方法得出了划分时段后的每个时段的所有航班整体分布的概率密度函数。已把上午高峰期划分成了3个时段,同样,下午高峰期也划分成了3个时段,则一天里上午高峰期多航班叠加公式如下所示:
[0193][0194]
其中:k=3,xh(h=1,2,3)为划分的以一小时为时段的离港旅客到达时间, f(xh;μi,λi,σi)为划分的以一小时为时段的旅客到达分布的指数修正的正态分布概率密度函数,yj为叠加的权重系数。
[0195]
下午高峰期多航班叠加公式如下所示:
[0196][0197]
其中:xm(m=1,2,3)为划分的以一小时为时段的离港旅客到达时间, f(xm;ζm,γm,δm,λm)为划分的以一小时为时段的旅客到达分布的约翰逊分布概率密度函数。yn为叠加的权重系数。
[0198]
步骤5:在步骤4所述的多航班耦合离港旅客聚集模型的基础上,对单航班赋权叠加的权重系数求解。
[0199]
混合蛙跳算法(如图7所示)是模拟自然界青蛙寻食过程行为而提出的一种仿生算法,青蛙群体按子群分类进行信息交换,将全局搜索与子群局部搜索相结合,朝着全局最优
解的方向进化。对单航班赋权的权重系数采用混合蛙跳算法求解,其中,单航班可以看作一个个体,局部搜索中通过一个个体感染另一个个体,最终多航班整体允许在局部搜索之间交换信息,向全局最优移动。选取70%的历史运行数据作为训练集,参与混合蛙跳算法确定权重系数。
[0200]
算法中目标函数为:
[0201][0202]
其中:以上午高峰期为例,yi为公式(5)概率密度值,为多航班实际分布的概率密度值,n为训练数据集的旅客样本数。
[0203]
权重系数的约束函数为
[0204]
混合蛙跳算法流程大致如下
[0205]
对高峰期的所有多航班旅客数据采用贝塔分布拟合工上午高峰时段,采用对数正态分布分布拟合下午高峰时段,随机选取几天的高峰期内多航班离港旅客分布仿真。
[0206]
使用均方根误差作为指标来分析相应的分布对实际数据的拟合效果,rmse 越接近0表明拟合效果越好,计算公式为:
[0207][0208]
其中:ym为真实数据直方图中第m个小区间xm的概率密度值;ym′
为xm在分布中的概率密度值。
[0209]
根据所建立的数学模型,将未参与建模分析的航班数据作为验证集,参与模型验证。随机选取4天的高峰期航班,实验在python3.7环境中运行。
[0210]
为了定量分析拟合的优劣,使用kl散度(kullback-leiblerdivergence)来比较模型所建立的分布与真实分布之间的差异,真实分布p(x)和近似分布q(x)之间的kl表达式为:
[0211][0212]
kl值越小说明近似分布q(x)越接近真实分布p(x),当kl=0,q(x)=p(x)。
[0213]
检验的航班包含工作日与非工作日的高峰期。仿真表明模型可以根据单航班分布赋权叠加公式来预测多航班整体的旅客分布情况,在时间维度上有很好的契合效果,显示了模型较好的预测能力。
[0214]
综上所述,本发明提出了感知多航班离港旅客聚集态势的方法,首先以组为单位分析单航班离港旅客聚集特性,得到单航班离港旅客在各个组合条件下的完整分布,采用参数回归确定分布的未知参数,再建立基于单航班赋权叠加公式的多航班耦合离港旅客聚集模型,以kl散度为指标评估模型精度。
[0215]
实验结果表明,提出的基于单航班赋权叠加公式的多航班耦合离港旅客聚集模型有理想的预测效果。
[0216]
将本发明提出的基于单航班赋权叠加方法与已有研究的单航班时序平移方法做多航班离港旅客预测模型结果对比,见表2。
[0217]
表2与现有技术进行数据对比
[0218][0219]
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
[0220]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献