一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于CNN-GRU和SSA-GWO-LightGBM的机票价格预测方法与流程

2022-07-23 07:38:46 来源:中国专利 TAG:

一种基于cnn-gru和ssa-gwo-lightgbm的机票价格预测方法
技术领域
1.本发明涉及民航机票价格预测技术领域,具体涉及一种基于cnn-gru和ssa-gwo-lightgbm的机票价格预测方法。


背景技术:

2.随着交通运输业的发展,越来越多的旅客选择飞机作为出行交通工具,网络使得机票预定更加便捷,机票价格预测可以帮助旅客、代理商合理的选择购买时间、了解市场。然而各航空公司定价机制复杂,机票实时价格受多方面因素影响不断变化,具有趋势性、随机性和波动性的特点,历史价格与预测值间很难用精确的关系表示。为了使旅客以最低的价格买到心仪的机票,机票价格预测显得尤为重要。
3.机票价格预测的关键在于如何通过机票的历史价格和历史航班信息获得数据分布,根据历史机票价格与历史航班信息之间的相关性,对未来票价进行预测。现存在通过使用模糊时间序列来进行机票价格预测,但其特征间相关性差,联系不紧密,数据预测精度低。还有使用卷积神经网络进行机票价格预测,其预测准确度稳定性差。


技术实现要素:

4.有鉴于此,本发明的目的是针对现有技术的不足,提供一种相关性强、预测精度高的基于cnn-gru和ssa-gwo-lightgbm的机票价格预测方法。
5.为达到上述目的,本发明采用以下技术方案:
6.一种基于cnn-gru和ssa-gwo-lightgbm的机票价格预测方法,包括以下步骤:
7.s1:采集历史航班特征和近期价格序列,从历史航班特征中分别提取航班连续特征和航班离散特征,并对航班离散特征进行独热编码,将数据集划分成训练集和测试集;
8.s2:建立卷积神经网络优化的融合自注意力机制的gru模型,将历史航班特征和近期价格序列的训练集输入模型中进行特征增强和特征提取,对历史航班各个特征与价格序列相关性进行探讨,根据卷积神经网络优化的融合自注意力机制的gru模型,得出历史航班各个特征相对应的权重;
9.s3:建立ssa改进gwo进而优化的lightgbm模型,lightgbm模型通过对卷积神经网络优化的融合自注意力机制的gru处理以后的历史航班特征进行权重选择,输入训练集进行训练;
10.s4:将测试数据集输入到sa-gru和ssa-gwolightgbm模型中进行数据集的测试,得到机票价格预测结果。
11.优选的,步骤s1中的所述航班特征主要包括航空公司、航线属性、航班时间属性和星期属性;其中将航空公司中航空公司的类别属性标志、航班时间属性中航班起飞时间段和航班降落时间段、星期属性中时间片代表的星期属性标志分别设置为独热编码;将航线属性中出发城市是否为一线城市和目的地是否为一线城市、航班时间属性中航班是否跨天标志设置为布尔值;将航线属性中航线长度设置为double;将航线属性中航线拥有航班数
量(繁忙程度)设置为int。
12.优选的,步骤s2中所述卷积神经网络优化的融合自注意力机制的gru模型包括第一单元、第二单元和第三单元;所述卷积神经网络优化的融合自注意力机制的gru模型的第一单元由cnn中8个连续的卷积层和一个池化层构成,每一个卷积层后跟随一个带泄露修正线性单元(leaky relu),卷积滤波器的数量分别为32、32、64、64、128、128、256和256,每个卷积层使用9*9卷积核,步长为1,填充为0;池化层使用9*9卷积核,步长为2,填充为0;将步骤s1中预处理好的数据向量输入到第一单元,第一单元主要作用是自动对输入数据进行特征提取;
13.所述卷积神经网络优化的融合自注意力机制的gru模型的第二单元由融合自注意力机制的gru构成,通过自注意力机制对gru更新门和重置门所提取到的特征向量进行计算得到更新门和重置门的自注意力机制分布和特征权重矩阵,再将特征权重矩阵与隐藏层提取的特征向量进行相乘,计算如下:
[0014][0015][0016]
其中:t与t-1为序列中元素的先后顺序;x
t
与h
t-1
分别为当前时刻输入信息与上一时刻输入信息;w用于更新输入的权重系数矩阵;u用于更新输入的权重系数矩阵;s为注意力分布;b为偏置向量;下标z和r分别为更新门和重置门;σ(x)中x为自变量,e
x
为指数函数,其中e=2.718281828;
[0017]
更新门和重置门的自注意力机制分布计算如下:
[0018][0019][0020]
其中:sz为更新门的注意力分布;sr为重置门的注意力分布;αz和αr分别为更新门和重置门的sa层,计算如下:
[0021][0022][0023]
其中:v
t
为更新门的特征向量;u
t
为重置门的特征向量;q为查询向量;f为评分函数,计算如下
[0024][0025]
[0026]
所述卷积神经网络优化的融合自注意力机制的gru模型的第三单元由cnn中全连接层和dropout层构成;第三单元主要用于减少过拟合,以概率p=0.25将输入的特征值从网络中丢弃。
[0027]
优选的,步骤s3中lightgbm模型的算法使用一种带深度限制的leafwise的叶子生长策略,每次从当前所有叶子中找到具有最大分裂增益的叶子节点进行迭代分裂;为了使模型性能更优,使用ssa改进gwo算法进行超参数的调试,计算如下:
[0028][0029][0030][0031]
其中:α狼为头狼,代表适应度最高的解;β、δ分别代表第二优解和第三优解;α、β、δ作为前三优解指挥剩余个体进行位置更新。a
θ
、c
θ
(θ=1,2,3)为系数向量;k∈[-1,1];x
t
为个体当前位置;x
t 1
为更新后普通灰狼位置;q是一个服从正太分布的随机数;l为1
×
d的向量,其元素全为1;r2∈[0,1];st∈[0.5,1];表示在t 1代β的最佳位置,p表示一个最佳位置标志;a为1
×
d的矩阵,其中每个元素随机赋值为-1或1,且符合a

=a
t
·
(aa
t
)-1
;fi、fg和fw分别表示当前麻雀的适应度值,全局最优解适应度和最差适解的应度值;ε是很小的常数,避免分母为0的情况;if为条件检测。
[0032]
优选的,所述ligthgbm模型算法的超参数主要有树的最大深度、树的叶子数量、每次迭代时用的数据比例、选定设定比例特征构建树、最小叶子节点权重和、l1正则化、l2正则化和学习率;使用ssa改进gwo算法优化ligthgbm算法的超参数训练数据集。
[0033]
本发明的有益效果是:
[0034]
本发明通过卷积神经网络优化的融合自注意力机制的gru将历史航班特征与机票价格的关系进行机票价格相关内容的特征提取和特征增强,使特征之间的关联性增强;并且通过ssa改进gwo算法来进行ligthgbm的超参数优化,提升了ligthgbm模型预测机票价格的准确度。
附图说明
[0035]
图1为本发明的流程图;
[0036]
图2为本发明中融合自注意力机制的gru的示意图。
具体实施方式
[0037]
下面结合附图和实施例对本发明作进一步描述。
[0038]
一种基于cnn-gru和ssa-gwo-lightgbm的机票价格预测方法,如图1所示,包括以
下步骤:
[0039]
s1:采集历史航班特征和近期价格序列,从历史航班特征中分别提取航班连续特征和航班离散特征,并对航班离散特征进行独热编码,将数据集划分成训练集和测试集;
[0040]
航班特征主要包括航空公司、航线属性、航班时间属性和星期属性;其中将航空公司中航空公司的类别属性标志、航班时间属性中航班起飞时间段和航班降落时间段、星期属性中时间片代表的星期属性标志分别设置为独热编码;将航线属性中出发城市是否为一线城市和目的地是否为一线城市、航班时间属性中航班是否跨天标志设置为布尔值;将航线属性中航线长度设置为double;将航线属性中航线拥有航班数量(繁忙程度)设置为int。
[0041]
s2:建立卷积神经网络优化的融合自注意力机制的gru模型,将历史航班特征和近期价格序列的训练集输入模型中进行特征增强和特征提取,对历史航班各个特征与价格序列相关性进行探讨,根据卷积神经网络优化的融合自注意力机制的gru模型,得出历史航班各个特征相对应的权重;
[0042]
卷积神经网络优化的融合自注意力机制的gru模型包括第一单元、第二单元和第三单元;所述卷积神经网络优化的融合自注意力机制的gru模型的第一单元由cnn中8个连续的卷积层和一个池化层构成,每一个卷积层后跟随一个带泄露修正线性单元(leaky relu),卷积滤波器的数量分别为32、32、64、64、128、128、256和256,每个卷积层使用9*9卷积核,步长为1,填充为0;池化层使用9*9卷积核,步长为2,填充为0;将步骤s1中预处理好的数据向量输入到第一单元,第一单元主要作用是自动对输入数据进行特征提取;
[0043]
所述卷积神经网络优化的融合自注意力机制sa的gru模型的第二单元由融合自注意力机制sa的gru构成,通过自注意力机制sa对gru更新门和重置门所提取到的特征向量进行计算得到更新门和重置门的自注意力机制sa分布和特征权重矩阵,再将特征权重矩阵与隐藏层提取的特征向量进行相乘,如图2所述,计算如下:
[0044][0045][0046]
其中:t与t-1为序列中元素的先后顺序;x
t
与h
t-1
分别为当前时刻输入信息与上一时刻输入信息;w用于更新输入的权重系数矩阵;u用于更新输入的权重系数矩阵;s为注意力分布;b为偏置向量;下标z和r分别为更新门和重置门;σ(x)中x为自变量,e
x
为指数函数,其中e=2.718281828;
[0047]
更新门和重置门的自注意力机制分布计算如下:
[0048][0049][0050]
其中:sz为更新门的注意力分布;sr为重置门的注意力分布;αz和αr分别为更新门和重置门的sa层,计算如下:
[0051][0052][0053]
其中:v
t
为更新门的特征向量;u
t
为重置门的特征向量;q为查询向量;f为评分函数,计算如下
[0054][0055][0056]
所述卷积神经网络优化的融合自注意力机制的gru模型的第三单元由cnn中全连接层和dropout层构成;第三单元主要用于减少过拟合,以概率p=0.25将输入的特征值从网络中丢弃。
[0057]
优选的,步骤s3中lightgbm模型的算法使用一种带深度限制的leafwise的叶子生长策略,每次从当前所有叶子中找到具有最大分裂增益的叶子节点进行迭代分裂;为了使模型性能更优,使用ssa改进gwo算法进行超参数的调试,计算如下:
[0058][0059][0060][0061]
其中:α狼为头狼,代表适应度最高的解;β、δ分别代表第二优解和第三优解;α、β、δ作为前三优解指挥剩余个体进行位置更新。a
θ
、c
θ
(θ=1,2,3)为系数向量;k∈[-1,1];x
t
为个体当前位置;x
t 1
为更新后普通灰狼位置;q是一个服从正太分布的随机数;l为1
×
d的向量,其元素全为1;r2∈[0,1];st∈[0.5,1];表示在t 1代β的最佳位置,p表示一个最佳位置标志;a为1
×
d的矩阵,其中每个元素随机赋值为-1或1,且符合a

=a
t
·
(aa
t
)-1
;fi、fg和fw分别表示当前麻雀的适应度值,全局最优解适应度和最差适解的应度值;ε是很小的常数,避免分母为0的情况;if为条件检测。
[0062]
s3:建立ssa改进gwo进而优化的lightgbm模型,ligthgbm模型算法的超参数主要有树的最大深度、树的叶子数量、每次迭代时用的数据比例、选定设定比例特征构建树、最小叶子节点权重和、l1正则化、l2正则化和学习率;使用ssa改进gwo算法优化ligthgbm算法的超参数训练数据集;lightgbm模型通过对卷积神经网络优化的融合自注意力机制的gru处理以后的历史航班特征进行权重选择,输入训练集进行训练;
[0063]
s4:将测试数据集输入到sa-gru和ssa-gwolightgbm模型中进行数据集的测试,得到机票价格预测结果。
[0064]
本发明提出了采用卷积神经网络优化的融合自注意力机制的gru来增强数据特征及其之间的联连性,使用ssa改进gwo进而优化的lightgbm进行机票价格的预测,提升预测票价的精确度。
[0065]
在以上实施例中所涉及的设备元件如无特别说明,均为常规设备元件,所涉及的结构设置方式、工作方式或控制方式如无特别说明,均为本领域常规的设置方式、工作方式或控制方式。
[0066]
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其他修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献