一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种航班竞争力定量分析和预测方法及装置与流程

2022-07-19 21:31:03 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种航班竞争力定量分析和预测方法及装置。


背景技术:

2.收益管理在航运行业中是一个绕不开的话题,与竞品间的博弈则是航空公司收益管理中极其重要的一环。定量分析乃至预测各航线航班间的竞争力对航司收益管理至关重要,是收益管理中的调价和舱位部署的重要依据,也是航空公司调整航班计划的关键参考依据,所以准确预测各航线航班间的竞争力有着巨大的商业应用前景和市场价值。
3.目前,主要是航空公司将其在售航班分别分配给航空公司的操作人员,各操作人员实时观察自己负责的航班的售卖情况,并结合历史售卖情况,根据经验判断航班在竞品中所处的位置,从而实现了对当前航班竞争力的分析。以便于,操作员根据当前的航班竞争力分析进行调价、调舱等一系列操作,以提高航班的竞争力,达到对未来航班竞争力预测。
4.但是,以上采用的现有方法,具有的缺点是人工成本高、操作人员的主观因素影响大。


技术实现要素:

5.有鉴于此,本发明提供一种航班竞争力定量分析和预测方法及装置,主要目的在于基于机器学习模型来定量分析并预测各航线的航班竞争力,人工成本低,主观因素小,且有定量的数值进行效果评估以及优化。
6.为了达到上述目的,本发明主要提供如下技术方案:
7.本技术第一方面提供了一种航班竞争力定量分析和预测方法,该方法包括:
8.获取未起飞航班对应的多维度数据信息,所述多维度数据信息至少包含:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息;
9.根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合;
10.利用预设机器学习模型对所述二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值,其中,所述预设机器学习模型基于历史航班对应的历史数据训练得到。
11.在本技术第一方面的一些变更实施方式中,所述在所述根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成一个二维数据表之后,所述方法还包括:
12.获取每个航线对应的数据集合,所述数据集合包含属性及其对应的内容信息;
13.根据所述属性对应的内容信息,构造所述属性对应的衍生特征;
14.根据所述属性对应的属性内容、所述属性对应的衍生特征,组成每个航线对应的目标数据集合。
15.在本技术第一方面的一些变更实施方式中,所述利用预设机器学习模型对所述二维数据表中每个航线对应数据集合进行处理,包括:
16.获取每个航线对应的目标数据集合;
17.按照航线为处理单位,利用所述预设机器学习模型对所述目标数据集合中包含的属性对应的属性内容、属性对应的衍生特征进行处理。
18.在本技术第一方面的一些变更实施方式中,在所述获取未起飞航班对应的多维度数据信息之前,所述方法还包括:
19.利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,所述历史多维度数据信息至少包含:历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息。
20.在本技术第一方面的一些变更实施方式中,所述利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,包括:
21.获取历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值;
22.根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成对应的二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合;
23.根据每个航线对应数据集合包含属性及其对应内容信息,构造所述属性对应的衍生特征,得到包含有所述属性对应的属性内容、所述属性对应的衍生特征的衍生数据集合;
24.从预先创建的算法模型类型空间中提取算法模型和所述算法模型对应的超参数;
25.在利用所述算法模型对所述衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对所述算法模型对应的超参数执行参数调试,得到所述算法模型对应目标参数组合,其中,所述算法模型和所述目标参数组合用于构建目标机器学习模型。
26.在本技术第一方面的一些变更实施方式中,若所述预先创建的算法模型类型空间中包含多个算法模型和每个算法模型对应的超参数,则所述方法还包括:
27.利用每个算法模型对所述衍生数据集合进行处理;
28.在处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对每个算法模型对应的超参数执行参数调试,得到每个算法模型对应目标参数组合;
29.通过比较每个模型在测试集上的预测误差之间数值大小,选择最小预测误差值对应的算法模型和目标参数集合构建目标机器学习模型。
30.本技术第二方面提供了一种航班竞争力定量分析和预测装置,该装置包括:
31.获取单元,用于获取未起飞航班对应的多维度数据信息,所述多维度数据信息至少包含:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,每个维
度数据信息包含了多个属性及其对应的内容信息;
32.汇总单元,用于根据获取单元获取到的不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合;
33.处理单元,用于利用预设机器学习模型对所述汇总单元得到的二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值,其中,所述预设机器学习模型基于历史航班对应的历史数据训练得到。
34.在本技术第二方面的一些变更实施方式中,所述装置,包括:
35.所述获取单元,还用于获取每个航线对应的数据集合,所述数据集合包含属性及其对应的内容信息;
36.构造单元,用于根据所述获取单元得到的属性对应的内容信息,构造所述属性对应的衍生特征;
37.组成单元,用于根据所述获取单元得到的属性对应的属性内容、所述构造单元得到的属性对应的衍生特征,组成每个航线对应的目标数据集合。
38.在本技术第二方面的一些变更实施方式中,所述处理单元包括:
39.获取模块,用于获取每个航线对应的目标数据集合;
40.处理模块,用于按照航线为处理单位,利用所述预设机器学习模型对所述获取模块得到的目标数据集合中包含的属性对应的属性内容、属性对应的衍生特征进行处理。
41.在本技术第二方面的一些变更实施方式中,所述装置还包括:
42.构建单元,用于利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,所述历史多维度数据信息至少包含:历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息。
43.在本技术第二方面的一些变更实施方式中,所述构建单元包括:
44.获取模块,用于获取历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值;
45.汇总模块,用于根据所述获取模块得到的不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成对应的二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合;
46.构造模块,用于根据所述汇总模块得到的每个航线对应数据集合包含属性及其对应内容信息,构造所述属性对应的衍生特征,得到包含有所述属性对应的属性内容、所述属性对应的衍生特征的衍生数据集合;
47.提取模块,用于从预先创建的算法模型类型空间中提取算法模型和所述算法模型对应的超参数;
48.执行模块,用于在利用所述提取模块得到算法模型对所述衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对所述算法模型对应的超参数执行参数调试,得到所述算法模型对应目标参数组合,其中,所述算法模型和所述目标参数组合用于构建目标机器学习模型。
49.在本技术第二方面的一些变更实施方式中,所述构建单元还包括:
50.所述执行模块,还用于若所述预先创建的算法模型类型空间中包含多个算法模型和每个算法模型对应的超参数,利用每个算法模型对所述衍生数据集合进行处理;
51.所述执行模块,还用于在处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对每个算法模型对应的超参数执行参数调试,得到每个算法模型对应目标参数组合;
52.选择模块,用于通过比较每个模型在测试集上的预测误差之间数值大小,选择最小预测误差值对应的算法模型和目标参数集合构建目标机器学习模型。
53.本技术第三方面一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上述的航班竞争力定量分析和预测方法。
54.本技术第四方面提供一种电子设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;
55.其中,所述处理器、所述存储器通过所述总线完成相互间的通信;
56.所述处理器用于调用所述存储器中的程序指令,以执行如上述的航班竞争力定量分析和预测方法。
57.借由上述技术方案,本发明提供的技术方案至少具有下列优点:
58.本发明提供一种航班竞争力定量分析和预测方法及装置,本发明预先获取未起飞航班的多维度数据信息,该多维度数据信息至少包含了航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,通过整合该多维度数据信息得到对应的二维数据表,且同时确保该二维数据表中内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合,进而利用预先训练的机器学习模型对每个航线对应的数据集合进行处理,输出预测的每个航线的航班竞争力数值。相较于现有技术,解决了现有预测航班竞争力方法人工成本高、被主观因素影响大的技术问题,本发明是基于机器学习模型来定量分析并预测各航线的航班竞争力,人工成本低,主观因素小,且有定量的数值进行效果评估以及优化。
59.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
60.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
61.图1为本发明实施例提供的一种航班竞争力定量分析和预测方法流程图;
62.图2为本发明实施例提供的另一种航班竞争力定量分析和预测方法流程图;
63.图3为本发明实施例提供的一种航班竞争力定量分析和预测装置的组成框图;
64.图4为本发明实施例提供的另一种航班竞争力定量分析和预测装置的组成框图;
65.图5为本发明实施例提供的航班竞争力定量分析和预测的电子设备。
具体实施方式
66.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
67.本发明实施例提供了一种航班竞争力定量分析和预测方法,如图1所示,该方法是基于机器学习模型来定量分析并预测各航线的航班竞争力,对此本发明实施例提供以下具体步骤:
68.101、获取未起飞航班对应的多维度数据信息。
69.在本发明实施例中,预测航班竞争力主要对象是未起飞航班,需要整合未起飞航班的多维度数据信息,作为预测数据集构造。
70.具体的,可以从航班业务集成不同子系统中获取航班多维度数据信息,该多维度数据信息可以包括:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息。
71.例如,对于航班售卖信息,可以实时爬取航班的售卖信息,对于爬取数据中没有的信息,从历史承运数据中获取,整合后表头如起飞城市、到达城市、起飞日期、航班号、航司、起飞时间、飞行距离、飞行时长等
72.对于航班基本信息,可以从数据库获取航司、飞机机型、机场所在城市等的基本信息表,并按照(起飞城市、到达城市、起飞日期、航班号)的唯一标识把数据连接起来。表头如起飞城市、到达城市、起飞日期、航班号、航司层级、城市线级、城市常住人口、飞机机型生产商、机型大小宽窄等。
73.对于航班调价信息,可以实时爬取调价过程数据。实时爬取未起飞航班起飞前21天的调价过程(即实际售卖过程中实时调整的价格),离散化为前期、中期、后期调价特征。表头如起飞城市、到达城市、起飞日期、航班号、前期调价、中期调价、后期调价。
74.对于航班对应的市场需求信息,爬取获取市场需求相关数据。比如起飞当天各航线人员流动情况、是否有特殊事件(如演唱会、大型活动等)发生、是否处于节假日、淡旺季等等,处理后表头如起飞城市、到达城市、起飞日期、航班号、航线人口转移量、是否淡旺季、是否节假日、特殊事件等
75.在本发明实施例中,获取到的航班多维度数据信息,作为数据源用于后续预测操作,每个维度数据信息包含了多个属性及其对应的内容信息,为了确保数据源数据全面性,最好在每个维度上选取未来3周的数据(即t到t 20的起飞时间)。
76.102、根据不同维度数据信息包含属性之间存在的关联关系,将多维度数据信息进行汇总,生成二维数据表,二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合。
77.在本发明实施例中,获取到的航班多维度数据信息,作为数据源用于后续预测操作,对于每个数据源,可以通过(起飞城市、到达城市、起飞日期、航班号)的唯一标识把所有数据连接起来,生成一张二维数据表。
78.需要说明的是,对于生成二维数据表内数据信息,也可以按照航线分类执行预处理,得到每个航线对应的数据集合,以便于后续预测操作是针对每个航线为单位而做出的。
79.103、利用预设机器学习模型对二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值。
80.其中,预设机器学习模型基于历史航班对应的历史数据训练得到,预设机器学习模型为采用自动机器学习得到的航线模型,目标就是使用自动化的数据驱动方式来做出最佳的决策,如在构建模型时只要提供历史航班数据,采用自动机器学习去自动决策最佳的模型方案,其中包括了对模型超参数不断调参以得到最佳参数组合。
81.在本发明实施例中构建的预设机器学习模型输出的数据为预测的航班竞争力数值,是对每个航线对应数据集合进行处理结果进行量化处理,从而实现对航班竞争力定量分析,利用一个数值表征航班竞争力,这不仅方便于同一未来时段不同航线航班竞争力的横向比较,也方便于未来不同时段同一航线航班竞争力的纵向比较,大大方便于利用定量的数值进行效果评估以及优化。
82.本发明实施例提供一种航班竞争力定量分析和预测方法,本发明实施例预先获取未起飞航班的多维度数据信息,该多维度数据信息至少包含了航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,通过整合该多维度数据信息得到一个二维数据表,且同时确保该二维数据表中内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合,进而利用预先训练的机器学习模型对每个航线对应的数据集合进行处理,输出预测的每个航线的航班竞争力数值。相较于现有技术,解决了现有预测航班竞争力方法人工成本高、被主观因素影响大的技术问题,本发明实施例是基于机器学习模型来定量分析并预测各航线的航班竞争力,人工成本低,主观因素小,且有定量的数值进行效果评估以及优化。
83.为了对上述实施例做出更加详细的说明,本发明实施例还提供了另一种航班竞争力定量分析和预测方法,如图2所示,对此本发明实施例提供以下具体步骤:
84.201、利用历史航班对应的历史多维度数据信息以及历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型。
85.其中,历史多维度数据信息至少包含:历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息,该历史多维度数据信息是历史数据且用于训练样本集构造,进一步的,历史多维度数据信息来源是历史发生的航班事实业务,根据该历史多维度数据信息就能够评估历史航班竞争力,但是评估历史航班竞争力的方法主要需要人工借助的,但作为后续训练模型的数据准备,应尽量确保历史竞争力数值的准确性。
86.在本发明实施例中,历史多维度数据信息包含的内容,可以包括如下:
87.例如,对于历史航班售卖,从数据库获取历史航班的承运计划及收益情况,表头如起飞城市、到达城市、起飞日期、航班号、航司、起飞时间、飞行距离、飞行时长、乘客数、收入等。
88.对于历史航班基本信息,从数据库获取航司、飞机机型、机场所在城市等的基本信息表,并按照(起飞城市、到达城市、起飞日期、航班号)的唯一标识把数据连接起来。表头如起飞城市、到达城市、起飞日期、航班号、航司层级、城市线级、城市常住人口、飞机机型生产商、机型大小宽窄等。
89.对于历史航班调价信息,获取调价过程数据。从数据库获取历史航班起飞前21天
的调价过程(即实际售卖过程中实时调整的价格),离散化为前期、中期、后期调价特征。表头如起飞城市、到达城市、起飞日期、航班号、前期调价、中期调价、后期调价。
90.对于历史航班对应的市场需求信息,爬取获取市场需求相关数据。比如起飞当天各航线人员流动情况、是否有特殊事件(如演唱会、大型活动等)发生、是否处于节假日、淡旺季等等,处理后表头如起飞城市、到达城市、起飞日期、航班号、航线人口转移量、是否淡旺季、是否节假日、特殊事件等。
91.在本发明实施例中,对于利用历史航班对应的多维度数据信息训练自动机器学习模型的步骤进行细化陈述,可以包括如下:
92.首先,获取历史航班对应的多维度数据信息以及历史多维度数据信息对应的历史航班竞争力数值。
93.在本发明实施例中,具体的该多维度数据信息可以为历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,获取到的历史航班多维度数据信息,每个维度数据信息包含了多个属性及其对应的内容信息,为了确保数据源数据全面性,最好在每个维度上选取历史4周的数据(即t-28到t-1的起飞时间)。
94.其次,根据不同维度数据信息包含属性之间存在的关联关系,将多维度数据信息进行汇总,生成一个二维数据表,二维数据表内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合。
95.在本发明实施例中,可以根据每个维度数据信息包含的属性,例如通过(起飞城市、到达城市、起飞日期、航班号)的唯一标识把所有多维度数据信息连接起来,生成一张二维数据表,整合为模型训练初步的数据源。
96.再者,根据每个航线对应数据集合包含属性及其对应内容信息,构造属性对应的衍生特征,得到包含有属性对应的属性内容、属性对应的衍生特征的衍生数据集合。
97.对应本发明实施例,该衍生特征是通过对属性对应内容信息进行分析而得到的特征,例如,对于一个航线的属性“起飞日期”,该属性对应的内容信息为“2020-12-1”“2020-12-4”“2020-12-5”,这些内容信息是散乱的日期信息,但是可以根据这些内容信息进行分析总结,可以设定周为时间单位划分,进而得到该属性“起飞日期”对应衍生特征为“周”。
98.根据属性对应内容信息而构造属性对应的衍生特征,目的是,也将衍生特征添加进入训练模型的数据源,进而得到模型会在利用某个属性对应内容信息进行相关运算时会考虑到衍生特征的因素,接续上述例举,就是以衍生特征“周”实现对散乱日期的划分,训练得到模型会考虑到衍生特征对模型运算输出结果的影响,接续上述例举,模型输出结果不仅会考虑到“起飞日期”,也会考虑到以衍生特征“周”为时间划分所带来的影响,比如一周包含几个起飞日期(即起飞频率)。利用衍生特征也作为模型训练的数据源,进而使得训练得到模型在后续具体应用中能够输出预测竞争力数值更加准确、符合实际航班需求。
99.在本发明实施例中,是利用属性对应的属性内容、属性对应的衍生特征组成衍生数据集合,作为模型训练数据源,它就是在模型训练初步的数据源基础之上,再加入衍生特征。
100.最后,从预先创建的算法模型类型空间中提取算法模型和算法模型对应的超参数。在利用算法模型对衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与历史航班竞争力数值,对算法模型对应的超参数执行参数调试,得到算法模型
对应目标参数组合,其中,算法模型和目标参数组合用于构建目标机器学习模型。
101.在本发明实施例中,由于本发明实施例采用自动机器学习方法训练模型,以得到最佳模型方案,那么对于一个算法模型而言,只有在利用算法模型对衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与历史航班竞争力数值,对算法模型对应的超参数执行不断参数调试,具体的,可以利用autogluon方式进行模型参数调试,进而得到算法模型对应最佳参数组合(即目标参数组合),进而利用该算法模型和目标参数组合就得到用于执行预测航班竞争力数值的目标机器学习模型。
102.进一步的,需要说明的是,预先创建的算法模型类型空间可以预先存储多个算法模型和每个算法模型对应的超参数的,那么选择哪个算法模型和对应超参数来构建最终的目标机器学习模型,具体实施方法可以包括:
103.首先,利用每个算法模型对衍生数据集合进行处理,在处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对每个算法模型对应的超参数执行参数调试,得到每个算法模型对应最佳参数组合(即目标参数组合)。
104.其次,根据目前得到每个算法模型以及其对应最佳参数组合,来进行选择操作,具体的选择的标准为:通过比较每个模型在测试集上的预测误差之间数值大小,选择出最小预测误差值。获取这个最小预测误差值所指向的算法模型和它的最佳参数组合,来构造目标机器学习模型,用于去执行后续预测竞争力数值操作。
105.202、获取未起飞航班对应的多维度数据信息,多维度数据信息至少包含:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息。
106.在本发明实施例中,对本步骤陈述,请参见步骤101,此处不再赘述。
107.203、根据不同维度数据信息包含属性之间存在的关联关系,将多维度数据信息进行汇总,生成一个二维数据表,二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合。
108.在本发明实施例中,对本步骤陈述,请参见步骤102,此处不再赘述。
109.204、获取每个航线对应的数据集合,数据集合包含属性及其对应的内容信息,根据属性对应的内容信息,构造属性对应的衍生特征,将属性对应的衍生特征添加进入每个航线对应的数据集合中。
110.其中,该衍生特征是通过对属性对应内容信息进行分析而得到的特征,例如,对于一个航线的属性“起飞日期”,该属性对应的内容信息为“2020-12-1”“2020-12-4”“2020-12-5”,这些内容信息是散乱的日期信息,但是可以根据这些内容信息进行分析总结,可以设定周为时间单位划分,进而得到该属性“起飞日期”对应衍生特征为“周”。
111.在本发明实施例中,需要说明的是,整合多维数据信息得到的每个航线对应的数据集合,可以作为后续预测操作对应的初步数据源,向该初步数据源中添加了衍生特征,目的是,进而得到模型处理过程中利用某个属性对应内容信息进行相关运算时会考虑到衍生特征的因素,接续上述例举,就是以衍生特征“周”实现对散乱日期的划分,模型会考虑到衍生特征对模型运算输出结果的影响,接续上述例举,模型输出结果不仅会考虑到“起飞日期”,也会考虑到以衍生特征“周”为时间划分所带来的影响,比如一周包含几个起飞日期(即起飞频率)。进而使得模型输出预测竞争力数值更加准确、符合实际航班需求。
112.205、利用预设机器学习模型对二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值。
113.在本发明实施例中,对本步骤陈述,请参见步骤103,此处不再赘述。
114.进一步的,作为对上述图1、图2所示方法的实现,本发明实施例提供了一种航班竞争力定量分析和预测装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置应用于预测航班竞争力,具体如图3所示,该装置包括:
115.获取单元31,用于获取未起飞航班对应的多维度数据信息,所述多维度数据信息至少包含:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息;
116.汇总单元32,用于根据获取单元31获取到的不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成一个二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合;
117.处理单元33,用于利用预设机器学习模型对所述汇总单元32得到的二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值,其中,所述预设机器学习模型基于历史航班对应的历史数据训练得到。
118.进一步的,如图4所示,所述装置,还包括:
119.所述获取单元31,还用于获取每个航线对应的数据集合,所述数据集合包含属性及其对应的内容信息;
120.构造单元34,用于根据所述获取单元31得到的属性对应的内容信息,构造所述属性对应的衍生特征;
121.组成单元35,用于根据所述获取单元31得到的属性对应的属性内容、所述构造单元34得到的属性对应的衍生特征,组成每个航线对应的目标数据集合。
122.进一步的,如图4所示,所述处理单元33包括:
123.获取模块331,用于获取每个航线对应的目标数据集合;
124.处理模块332,用于按照航线为处理单位,利用所述预设机器学习模型对所述获取模块331得到的目标数据集合中包含的属性对应的属性内容、属性对应的衍生特征进行处理。
125.进一步的,如图4所示,所述装置还包括:
126.构建单元36,用于利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,所述历史多维度数据信息至少包含:历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息。
127.进一步的,如图4所示,所述构建单元36包括:
128.获取模块361,用于获取历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值;
129.汇总模块362,用于根据所述获取模块361得到的不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成对应的二维数据表,所述二维数据
表内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合;
130.构造模块363,用于根据所述汇总模块362得到的每个航线对应数据集合包含属性及其对应内容信息,构造所述属性对应的衍生特征,得到包含有所述属性对应的属性内容、所述属性对应的衍生特征的衍生数据集合;
131.提取模块364,用于从预先创建的算法模型类型空间中提取算法模型和所述算法模型对应的超参数;
132.执行模块365,用于在利用所述提取模块364得到算法模型对所述衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对所述算法模型对应的超参数执行参数调试,得到所述算法模型对应目标参数组合,其中,所述算法模型和所述目标参数组合用于构建目标机器学习模型。
133.进一步的,如图4所示,所述构建单元36还包括:
134.所述执行模块365,还用于若所述预先创建的算法模型类型空间中包含多个算法模型和每个算法模型对应的超参数,利用每个算法模型对所述衍生数据集合进行处理;
135.所述执行模块365,还用于在处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对每个算法模型对应的超参数执行参数调试,得到每个算法模型对应目标参数组合;
136.选择模块366,用于通过比较每个模型在测试集上的预测误差之间数值大小,选择最小预测误差值对应的算法模型和目标参数集合构建目标机器学习模型。
137.综上所述,本发明实施例提供一种航班竞争力定量分析和预测方法及装置,本发明实施例预先获取未起飞航班的多维度数据信息,该多维度数据信息至少包含了航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,通过整合该多维度数据信息得到一个二维数据表,且同时确保该二维数据表中内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合,进而利用预先训练的机器学习模型对每个航线对应的数据集合进行处理,输出预测的每个航线的航班竞争力数值。相较于现有技术,解决了现有预测航班竞争力方法人工成本高、被主观因素影响大的技术问题,本发明实施例是基于机器学习模型来定量分析并预测各航线的航班竞争力,人工成本低,主观因素小,且有定量的数值进行效果评估以及优化。
138.所述航班竞争力定量分析和预测装置包括处理器和存储器,上述获取单元、汇总单元和处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
139.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来基于机器学习模型来定量分析并预测各航线的航班竞争力,人工成本低,主观因素小,且有定量的数值进行效果评估以及优化。
140.本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述航班竞争力定量分析和预测方法。
141.本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述航班竞争力定量分析和预测方法。
142.本发明实施例提供了一种电子设备40,如图5所示,设备包括至少一个处理器401、以及与处理器401连接的至少一个存储器402、总线403;其中,处理器401、存储器402通过总
线403完成相互间的通信;处理器401用于调用存储器402中的程序指令,以执行上述的航班竞争力定量分析和预测方法。
143.本文中的设备可以是服务器、pc、pad、手机等。
144.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
145.一种航班竞争力定量分析和预测方法,所述方法包括:获取未起飞航班对应的多维度数据信息,所述多维度数据信息至少包含:航班售卖信息、航班基本信息、航班调价信息和航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息;根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航线对应的数据集合;利用预设机器学习模型对所述二维数据表中每个航线对应数据集合进行处理,预测每个航线对应的航班竞争力数值,其中,所述预设机器学习模型基于历史航班对应的历史数据训练得到。
146.进一步的,所述在所述根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成一个二维数据表之后,所述方法还包括:获取每个航线对应的数据集合,所述数据集合包含属性及其对应的内容信息;根据所述属性对应的内容信息,构造所述属性对应的衍生特征;根据所述属性对应的属性内容、所述属性对应的衍生特征,组成每个航线对应的目标数据集合。
147.进一步的,所述利用预设机器学习模型对所述二维数据表中每个航线对应数据集合进行处理,包括:获取每个航线对应的目标数据集合;按照航线为处理单位,利用所述预设机器学习模型对所述目标数据集合中包含的属性对应的属性内容、属性对应的衍生特征进行处理。
148.进一步的,在所述获取未起飞航班对应的多维度数据信息之前,所述方法还包括:利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,所述历史多维度数据信息至少包含:历史航班售卖信息、历史航班基本信息、历史航班调价信息和历史航班对应的市场需求信息,每个维度数据信息包含了多个属性及其对应的内容信息。
149.进一步的,所述利用历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值训练自动机器学习模型,包括:获取历史航班对应的历史多维度数据信息以及所述历史多维度数据信息对应的历史航班竞争力数值;根据不同维度数据信息包含属性之间存在的关联关系,将所述多维度数据信息进行汇总,生成对应的二维数据表,所述二维数据表内数据信息是按照航线进行预分类处理的并得到每个航行对应的数据集合;根据每个航线对应数据集合包含属性及其对应内容信息,构造所述属性对应的衍生特征,得到包含有所述属性对应的属性内容、所述属性对应的衍生特征的衍生数据集合;从预先创建的算法模型类型空间中提取算法模型和所述算法模型对应的超参数;在利用所述算法模型对所述衍生数据集合进行处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对所述算法模型对应的超参数执行参数调试,得到所述算法模型对应目标参数组合,其中,所述算法模型和所述目标参数组合用于构建目标机器学习模型。
150.进一步的,若所述预先创建的算法模型类型空间中包含多个算法模型和每个算法模型对应的超参数,则所述方法还包括:利用每个算法模型对所述衍生数据集合进行处理;在处理过程中,通过比对经模型处理输出的航班竞争力数值与所述历史航班竞争力数值,对每个算法模型对应的超参数执行参数调试,得到每个算法模型对应目标参数组合;通过比较每个模型在测试集上的预测误差之间数值大小,选择最小预测误差值对应的算法模型和目标参数集合构建目标机器学习模型。
151.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
152.在一个典型的配置中,设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
153.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
154.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
155.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
156.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
157.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献