一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图卷积与注意力机制的时空旅游需求预测方法

2022-12-07 00:29:49 来源:中国专利 TAG:


1.本发明涉及时空序列预测与旅游需求预测技术领域,具体涉及一种基于图卷积与注意力机制的时空旅游需求预测方法。


背景技术:

2.在过去的几十年里,旅游业在世界范围内得到了快速的发展,并产生了巨大的经济和社会效益。精准的旅游需求预测可以帮助游客合理安排行程,也可以帮助旅游从业者合理配置旅游资源,在提升旅游体验、实现智慧旅游方面发挥着越来越重要的作用。
3.旅游需求预测问题通常被建模为时间序列预测问题,空间建模问题(或横截面分析),或时空预测问题。时间序列预测是指利用已观测的时间序列数据对未来一段时间内某一目标时间序列发展趋势做出预测。而空间建模则是利用在某一时刻收集的不同对象数据(即横截面数据)建立不同对象间的空间联系,再对所涉及的解释变量作出假设,形成“事前预测”。基于时间序列预测和空间建模的旅游需求预测,忽略了空间信息或是更重要的时间信息,导致难以获得准确的旅游需求预测。时空预测同时考虑旅游需求的空间信息和时间信息,被认为是旅游需求预测最合理的问题表述。时空预测模型可以在指定的空间结构下处理多个区域的旅游需求预测,因为空间信息被聚合到该模型中以提供准确的跨区域旅游需求预测。然而,现有的旅游需求时空预测方法只考虑了预先指定的区域间静态空间联系(参照非专利文献1-3),而没有考虑多重空间联系和动态空间联系。
4.近年来,基于深度学习的时空预测模型(参照非专利文献4-6),尤其是使用图卷积和注意力机制的模型,在车流预测、出行需求预测等预测问题上取得了很好的预测效果,表明深度学习模型可以从数据中学习复杂的时空特征以进行准确的时空预测。然而,到目前为止,还没有使用图卷积和注意力机制的旅游需求时空预测模型。
5.现有技术文献
6.非专利文献
7.非专利文献1:yang y,zhang h.spatial-temporal forecasting of tourism demand[j/ol].annals of tourism research,2019,75:106-119.doi:10.1016/j.annals.2018.12.024.
[0008]
非专利文献2:jiao x,li g,chen j l.forecasting international tourism demand:a local spatiotemporal model[j/ol].annals of tourism research,2020,83:102937.doi:10.1016/j.annals.2020.102937.
[0009]
非专利文献3:long w,liu c,song h.pooling in tourism demand forecasting[j/ol].journal of travel research,2019,58(7):1161-1174.doi:10.1177/0047287518800390.
[0010]
非专利文献4:ma x,dai z,he z,等.learning traffic as images:a deep convolutional neural network for large-scale transportation network speed prediction[j/ol].sensors,2017,17(4):818.doi:10.3390/s17040818.
[0011]
非专利文献5:yu b,yin h,zhu z.spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[c]//proceedings of the 27th international joint conference on artificial intelligence.stockholm,sweden:aaai press,2018:3634-3640.
[0012]
非专利文献6:xu m,dai w,liu c,等.spatial-temporal transformer networks for traffic flow forecasting[j/ol].arxiv:2001.02908[cs,eess],2021.http://arxiv.org/abs/2001.02908.


技术实现要素:

[0013]
针对现有旅游需求预测方法的不足,本发明提供了一种基于图卷积与注意力机制的时空旅游需求预测方法,通过图卷积和空间自注意力分别学习景点间显式空间联系与隐式空间联系,并使用双向卷积长短时记忆与时间自注意力层逐步提取短期高维时空特征和长期高维时空特征,提升时空旅游需求预测效果。
[0014]
本发明的时空旅游需求预测方法特征在于,包括以下步骤:
[0015]
s1、数据获取步骤,根据经验与数据可用性,获取针对景区时空旅游需求预测所能获取的有用数据;
[0016]
s2、景点间空间联系分析步骤,根据所获取的有用数据,分析所述景区的景点间空间联系,确定可以显式表示的景点间空间联系,并针对难以被显式表示地表示的隐式空间联系,归纳隐式空间联系的相关因素;
[0017]
s3、时空信息表示步骤,针对所述景点间显式空间联系与隐式空间联系,构建时空信息表示,具体包括:
[0018]
s301、与景点间显式空间联系关联的多维动态图的构建,考虑一个有n个景点的景区s={s1,s2,...,sn},构建一个动态多维图g=(v,e),其由代表多个景点的节点集v={v1,v2,...,vn}与d个不相交的代表不同显式动态联系的子集构成的边集e={e1,e2,...,ed}组成,
[0019]
s302、与景点间隐式空间联系关联的时空序列的构建,考虑c个可能与所述隐式空间联系相关的变量,该时空序列x可以表示为:
[0020][0021]
其中t为x的时序长度,n为景点数;
[0022]
s4、高维空间联系嵌入步骤,根据所述时空信息表示,使用图卷积嵌入层从所述动态多维图中提取高维显式空间联系表示,使用空间自注意力嵌入层从所述时空序列中提取高维隐式空间联系表示,最后将所述高维显式空间联系表示与所述高维隐式空间联系表示聚合成高维空间联系表示;
[0023]
s5、高维时空特征提取步骤,在所述高维空间联系特征序列上,应用双向卷积长短时记忆层与时间自注意力层逐步提取短期高维时空特征和长期高维时空特征。
[0024]
s6、预测步骤,根据提取到的所述高维时空特征,对时空旅游需求进行预测。
[0025]
作为本发明的时空旅游需求预测方法之一种可选的方式,所述动态多维图的每一维都表示一种景点间的显式空间联系,其中节点集v中的节点包含景点历史旅游需求属性和周期性旅游需求属性。
[0026]
作为本发明的时空旅游需求预测方法之一种可选的方式,所述的步骤s4中使用图卷积嵌入层从动态多维图中提取高维显式空间联系表示包括:
[0027]
s401、使用图卷积嵌入层提取高维显式空间联系表示,假设历史旅游需求x
his
与n1种显式空间联系相关,则其图嵌入表示为:
[0028][0029]
其中由t时刻第i种显式空间联系与x
his
通过图卷积运算得到。假设q种周期性旅游需求,周期性旅游需求与n
p
种显式空间联系相关,则其图嵌入表示为:
[0030][0031]
其中由t时刻第i种显式空间联系与通过图卷积运算得到。最终的高维显式空间联系表示由与各组连接并加上一个全连接层得到:
[0032][0033]
其中relu是线性整流函数,w
exp
和b
exp
是可学习参数与偏置。
[0034]
作为本发明的时空旅游需求预测方法之一种可选的方式,所述的步骤s4中使用空间自注意力嵌入层从时空序列中提取高维隐式空间联系表示包括:
[0035]
s402、使用空间自注意力嵌入层提取高维隐式空间联系表示,假设实际每次输入到空间自注意力嵌入层的序列是时序长度为τ的时空序列首先将其分割为τ个片段将每个片段分别线性映射为q,k,v三个矩阵,进行缩放点积注意力计算,最后聚合为空间自注意力的输出。经由两个层归一化与一个前馈层后,得到高维隐式空间联系表示h
imp

[0036]himp
=layernorm((relu(h
ln
w1 b1)w2 b2)) h
ln

[0037]hln
=layernorm(h
at
) h
at

[0038][0039][0040]
其中attention(
·
,
·
,
·
)为缩放点积注意力计算。
[0041]
作为本发明的时空旅游需求预测方法之一种可选的方式,所述的步骤s4中将所述高维显式空间联系表示与所述高维隐式空间联系表示聚合成高维空间联系表示包括:
[0042]
s403、将高维显式空间联系表示与高维隐式空间联系表示聚合成高维空间联系表示h
emb
,即:
[0043]hemb
=concat(h
exp
,h
imp
)w3 b3,
[0044]
其中w3和b3是可学习参数与偏置。
[0045]
作为本发明的时空旅游需求预测方法之一种可选的方式,所述有用数据包括景区内各景点历史旅游需求、各景点间旅客流动信息、各景点间交通条件、各景点地理位置信息、各景点搜索指数、各景点(或景区)天气情况、景区节假日信息中的至少一种。
[0046]
本发明相对于现有技术具有如下的优点和效果:
[0047]
1、本发明建立了对景点间显式、隐式空间联系进行区分与建模的理论,对于系统分析景点间的空间联系有重要的指导意义。
[0048]
2、本发明的时空信息表示方法,通过图与时空序列两种数据形式,可以结合多重动态空间联系。
[0049]
3、本发明的图卷积嵌入层可以嵌入多维动态图中的景点间显式空间联系,空间自注意力机制可以嵌入时空序列中的景点间隐式空间联系,从而全面嵌入景点间高维动态空间联系。
[0050]
4、本发明通过双向卷积长短时记忆与时间自注意力机制可以有效提取复杂的高维局部和长期时空特征,从而提供精准的时空旅游需求预测。
[0051]
5、本发明相比现有技术文献中的时空旅游需求预测方法可以取得最好的时空旅游需求预测精度。
附图说明
[0052]
图1是本发明技术方案的整体流程图。
[0053]
图2是本发明时空旅游需求预测模型的架构图。
[0054]
图3是本发明时空旅游需求预测模型中空间注意力机制的架构图
[0055]
图4是本发明实施例的多维动态图表示图。
具体实施方式
[0056]
为了更清楚的展示本发明的技术原理、技术方案细节和优点,下面结合实施例及附图进行更详细、清除的描述。显然,所描述的实施例只是本发明一部分的实施例,并非全部的实施例。基于本说明书所描述的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0057]
本发明的时空旅游需求预测方法,技术方案实施步骤如图1所示,时空旅游需求预测模型的架构图如图2所示,每个步骤具体描述如下:
[0058]
步骤s1、数据获取,根据经验与数据可用性,获取针对某一景区时空旅游需求预测所能获取的有用数据,包括但不限于景区内各景点历史旅游需求、各景点间旅客流动信息、各景点间交通条件、各景点地理位置信息、各景点搜索指数、各景点(或景区)天气情况、景区节假日信息等。
[0059]
步骤s2、景点间空间联系分析,根据所获取的有用数据,分析所述景区的景点间空间联系,确定可以显式表示的景点间空间联系,例如景点间空间距离联系、景点间交通联系、景点间旅客流动联系等。除显式空间联系外,景点间还存在一些难以被显式表示地表示,例如溢出效应等,归纳这些隐式空间联系可能的相关因素(变量)。
[0060]
步骤s3、时空信息表示,针对所述景点间显式空间联系与隐式空间联系,构建时空信息表示。动态多维图的每一维都表示一种景点间的显式空间联系,其中节点包含景点历史旅游需求属性和周期性旅游需求属性,边的权重反映了景点间某种显式联系的强弱,节点的属性与边的权重都是动态变化的;同时构建包含所有景点历史旅游需求、周期性旅游需求与协变量的空间序列,用于抽取景点间隐式联系,这些空间序列在时间维度上堆叠,形成时空序列。
[0061]
具体包括:
[0062]
步骤s301、与景点间显式空间联系关联的多维动态图的构建,考虑一个有n个景点
的景区s={s1,s2,...,sn},构建一个动态多维图g=(v,e),其由代表多个景点的节点集v={v1,v2,...,vn}与d个不相交的代表不同显式动态联系的子集构成的边集e={e1,e2,...,ed}组成。
[0063]
步骤s302、与景点间隐式空间联系关联的时空序列的构建,考虑c个可能与隐式空间联系相关的变量,该时空序列x可以表示为:
[0064][0065]
其中t为x的时序长度,n为景点数。
[0066]
步骤s4、高维空间联系嵌入,根据所述的时空信息表示,使用图卷积嵌入层从动态多维图中提取高维显式空间联系表示,使用空间自注意力嵌入层从时空序列中提取高维隐式空间联系表示,最后将高维显式空间联系表示与高维隐式空间联系表示聚合成高维空间联系表示。具体包括:
[0067]
步骤s401、使用图卷积嵌入层提取高维显式空间联系表示,假设历史旅游需求x
his
与n1种显式空间联系相关,则其图嵌入表示为:
[0068][0069]
其中由t时刻第i种显式空间联系与x
his
通过图卷积运算得到。假设q种周期性旅游需求,周期性旅游需求与n
p
种显式空间联系相关,则其图嵌入表示为:
[0070][0071]
其中由t时刻第i种显式空间联系与通过图卷积运算得到。最终的高维显式空间联系表示由与各组连接并加上一个全连接层得到:
[0072][0073]
其中relu是线性整流函数,w
exp
和b
exp
是可学习参数与偏置。
[0074]
步骤s402、使用空间自注意力嵌入层提取高维隐式空间联系表示,空间自注意力架构图如图3所示,假设实际每次输入到空间自注意力嵌入层的序列是时序长度为τ的时空序列首先将其分割为τ个片段将每个片段分别线性映射为q,k,v三个矩阵,进行缩放点积注意力计算,最后聚合为空间自注意力的输出。经由两个层归一化与一个前馈层后,得到高维隐式空间联系表示h
imp

[0075]himp
=layernorm((relu(h
ln
w1 b1)w2 b2)) h
ln
,
[0076]
其中
[0077]hln
=layernorm(h
at
) h
at
,
[0078][0079][0080]
其中attention(
·
,
·
,
·
)为缩放点积注意力计算,即:
[0081][0082]
步骤s403、将高维显式空间联系表示与高维隐式空间联系表示聚合成高维空间联系表示h
emb
,即:
[0083]hemb
=concat(h
exp
,h
imp
)w3 b3,
[0084]
其中w3和b3是可学习参数与偏置。
[0085]
步骤s5、高维时空特征提取,在高维空间联系特征序列上,应用双向卷积长短时记忆层与时间自注意力层逐步提取短期高维时空特征和长期高维时空特征。
[0086]
步骤s6、时空旅游需求预测,根据提取到的高维时空特征,对时空旅游需求进行预测。
[0087]
实施例
[0088]
本实施例考虑本发明在中国珠海市万山群岛旅游需求预测中的应用。万山群岛是珠海市的一个岛屿风景区,主要包括桂山岛、外伶仃岛、东澳岛、万山岛四个景点,位于珠海市区的香洲、横琴两个港口是万山群岛游客的主要输入输出港口。因此本实施例考虑这六个景点的旅游需求预测。
[0089]
s1、数据获取,收集的数据包括:
[0090]
1)从轮渡票务数据中获得的历史旅游需求和景点间旅客流动数据,时间范围为2019年1月1日至2019年12月31日,每天共有11个观测值(20:00-8:00(次日)之间没有轮渡服务,所以每天的观测值包括9:00-19:00的每小时观测值);日、周、月周期性旅游需求和周期性景点间旅客流动数据是过去日、周、月旅游需求和旅客流动的平均值,因此保持和历史旅游需求和景点间旅客流动数据相同的数据粒度;
[0091]
2)2019年1月1日至2019年12月31日每天六个景点的百度搜索引擎的搜索指数数据、中国气象数据服务中心的天气数据、中国的节假日数据;每天的数据被扩展到11个观测值的时间索引上;在本实施例中,所有六个地区共享相同的假期信息;
[0092]
3)六个景点的地理位置信息、六个景点间的轮渡服务可用性;数据被扩展到2019年1月1日至2019年12月31日,每天11个观测值的时间索引上。
[0093]
数据集按8:1:3划分为训练集、验证集和测试集(总共12个月的可用数据)。
[0094]
s2、景点间空间联系分析,根据所获取的数据,确定可以显式表示的景点间空间联系,包括景点间空间距离联系、景点间轮渡交通联系、景点间旅客流动联系(包括短期流动联系(即上个观测期间内)、日旅客流动联系、周旅客流动联系与月旅客流动联系);收集的历史旅游需求x
htd
、周期性旅游需求(x
dtd
、x
wtd
、x
mtd
)、天气信息x
wea
、搜索指数信息x
si
、节假日信息x
hol
用于学习景点间隐式空间联系。
[0095]
s3、时空信息表示,具体包括:
[0096]
s301、针对景点间显式空间联系,所构建动态多维图如图4所示,该多维动态图包括6维表示不同显式空间联系的图,每维图上包含六个节点以及一些连接节点的边,节点的属性和边的权重是动态变化的。这6维图对应的邻接矩阵表示如下:
[0097][0098][0099]
[0100][0101][0102][0103]
其中dis(li,lj)函数表示计算节点和间的距离。
[0104]
s302、与景点间隐式空间联系关联的时空序列的构建,这里考虑7个可能与隐式空间联系相关的变量,因此该时空序列x可以表示为:
[0105][0106]
其中t为x的时序长度,n为景点数(此处n=6)。
[0107]
s4、高维空间联系嵌入,具体包括:
[0108]
s401、使用图卷积嵌入层提取高维显式空间联系表示,历史旅游需求x
htd
与周期性旅游需求(x
dtd
、x
wtd
、x
mtd
)共四组,假设实际输入时空预测模型的序列时序长度为τ
lag
,则图卷积嵌入层的输入具体为:
[0109][0110]
假设这四组旅游需求都与2种显式空间联系相关:地理位置距离联系、轮渡交通联系,同时各自与对应的旅客流动联系相关,因此其图嵌入表示为:
[0111][0112]
其中
[0113][0114][0115][0116][0117][0118]
其中w
exp
、w
set
、w
set,dis
、w
set,trans
、w
set,set
是可学习参数,d
t
和a
t
是显式空间联系的度矩阵和邻接矩阵,relu是线性整流函数,b
exp
是可学习偏置。
[0119]
s402、使用空间自注意力嵌入层提取高维隐式空间联系表示,对于时序长度为τ
lag
的时空序列首先将其分割为τ
lag
个片段将每个片段分别线性映射为q,k,v三个矩阵,进行缩放点积注意力计算,最后聚合为空间自注意力的输出。经由两个层归一化与一个前馈层后,得到高维隐式空间联系表示h
imp

[0120]himp
=layernorm((relu(h
ln
w1 b1)w2 b2)) h
ln
,
[0121]hln
=layernorm(h
at
) h
at
,
[0122]
其中
[0123][0124][0125][0126]
步骤s403、将高维显式空间联系表示与高维隐式空间联系表示聚合成高维空间联系表示h
emb
,即:
[0127]hemb
=concat(h
exp
,h
imp
)w3 b3,
[0128]
其中w3和b3是可学习参数与偏置。
[0129]
s5、高维时空特征提取,在高维空间联系特征序列上,应用双向卷积长短时记忆层与时间自注意力层逐步提取短期高维时空特征和长期高维时空特征。
[0130]
s6、时空旅游需求预测,根据提取到的高维时空特征,我们使用两层前馈网络作为回归器,对万山群岛六个景点时空旅游需求进行预测。
[0131]
为帮助理解本发明的技术效果,发明人采用技术指标对本发明的方法和模型与现有技术的模型进行了对比评估。
[0132]
模型的评估指标为平均绝对误差(mae)和均方根误差(rmse),对于景点i与时序长度为τ
seq
的旅游需求预测,mae与rmse分别定义如下:
[0133][0134][0135]
本实施例对比了本发明与非专利文献1、2中的时空自回归模型(starma)、非专利文献1、3中的面板模型(panel)、非专利文献4中的深度卷积网络模型(dcnn)、非专利文献5中的时空图卷积网络模型(stgcn)、非专利文献6中的时空transformer模型(sttn)。实验的结果见表1。
[0136]
表1
[0137][0138]
由表1可以看出,本发明提出的时空旅游需求预测模型的mae表现与rmse表现在总体上都好于其他技术文献中的模型。
[0139]
综上所述,本发明的时空旅游需求预测方法与模型,通过对景点间显式、隐式空间联系的区分、综合分析和联合表示,以及基于图卷积和注意力机制的时空旅游需求预测模型,使得时空旅游需求预测性能显著提升,该分析方法与预测模型具有重要的指导意义与应用价值。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献