一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于手机信令数据的城际出行扩样方法

2022-05-11 16:10:41 来源:中国专利 TAG:


1.本发明涉及城市交通规划与管理领域,尤其是涉及一种基于手机信令数据的城际出行扩样方法。


背景技术:

2.我国在2019年提到要加快长三角都市圈一体化发展,推进都市圈协调联动,加强都市圈间合作互动的同时打造长三角世界级城市群。城市群内部各城市间的客运流量是反映不同城市之间的发展状况的重要因素,并且通过对客运量的集计分析可以了解长三角城市群的层级结构,由于城市间客运量与城市规模具有较强的正相关关系,其也成为测量城市之间联系强度的重要指标。
3.在城市群客运的研究中,大多数是从单个交通方式的客运数据例如公路、铁路等对城市之间的客运量进行分析,用这样的方式往往不能较为全面的反映城市间的客运总量需求,因此如何对客运数据进行合理有效的扩样也是城市群客运结构研究的重要一部分。
4.相较于问卷调查等方式,手机信令数据具有实时程度高,采集成本低,同时具有覆盖范围以及时间广的优点,能实现长期的轨迹追踪,因此在获取用户的活动数据上具有极高优势,可以为城际间的交通联系强度与客运需求评价提供很好的参考价值。
5.从运营商所提供的手机信令数据上来看,在经过运营商一方基本的数据处理后,数据表一般涵盖几项重要的属性:uid(user id,用户的唯一性标识)、move_id(当日出行编号)、stime(一次活动开始的时间)、grid_id(所在栅格的唯一性标识)等。利用运营商提供的数据表格可以比较精准的刻画手机用户在一定时间段内的出行链条。这种方法可以有效的解决城际间不同交通方式的出行量难以准确获取的问题,直接利用信令数据对个体进行集计测算,手机信令数据表如表1所示。
6.表1手机信令数据表
[0007][0008][0009]
基于手机信令识别的用户活动数据计算城际间客运联系,目前国内外的研究往往采用手机信令数量与一端的运营商占有率的比值来表示实际的客流量,而没有考虑这种方法对于精度的影响。如果出行起终点城市其两端的运营商占有率存在较大的差距的情况下,这种扩样方法无疑会有较大的误差,不能很好的反映城际间的实际客流强度。并且现有
的扩样方式往往无法满足不同城市之间的出行产生量与吸引量平衡的条件,难以满足交通规划的技术需求。


技术实现要素:

[0010]
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于手机信令数据的城际出行扩样方法。
[0011]
本发明的目的可以通过以下技术方案来实现:
[0012]
一种基于手机信令数据的城际出行扩样方法,用以估算各城市之间的实际出行量,包括以下步骤:
[0013]
1)根据运营商提供的原始手机信令数据进行预处理并提取用户活动,统计基于手机信令数据的各城市之间的信令出行量;
[0014]
2)统计每个交通单元的信令发生量和出行吸引量,引入扩样系数并采用双约束模型进行迭代求解,得到满足精度条件的各城市之间的实际出行量。
[0015]
所述的步骤1)具体包括以下步骤:
[0016]
11)获取运营商提供的原始手机信令数据,通过日期时间戳进行分箱处理,按照手机信令表中的stime属性进行排序,分离用户在一天内的所有活动,并对手机信令数据进行时空间平滑处理;
[0017]
12)设定用户活动时间间隔阈值,并剔除用户在相邻两次数据间没有发生栅格变化的活动,识别用户的有效出行信息;
[0018]
13)设定栅格的边长,利用栅格函数标记用户每一次出行的起终点位置;
[0019]
14)统计用户出行数据,计算基于手机信令数据的基于手机信令数据的各城市之间的信令出行量。
[0020]
所述的步骤11)中,分离后的数据字段具体为《用户唯一性标识uid,活动开始时间stime,活动开始栅格(loncol,latcol),栅格变化状态识别statuschange》。
[0021]
所述的步骤12)中,识别用户的有效出行信息的数据字段具体为《用户唯一性标识uid,活动开始时间stime,活动结束时间etime,活动开始栅格(loncol,latcol),活动结束栅格(eloncol,elatcol),栅格变化状态识别statuschange》
[0022]
所述的用户活动时间间隔阈值设定为30min,所述的栅格的边长设定为1km。
[0023]
所述的步骤2)具体包括以下步骤:
[0024]
21)在初始迭代步骤中,根据基于手机信令数据的各城市之间的信令出行量构建原始信令od矩阵其中,为i城市前往j城市的信令出行量,对原始信令od矩阵od
00
进行行和列求和分别得到原始信令发生量和原始出行吸引量
[0025]
22)设定初始增长系数η,将原始信令od矩阵od
00
中的元素分别除以初始增长系数η得到初始迭代步骤的初始od矩阵并进行行和列求和分别计算得到初始的实际信令发生量和初始的实际出行吸引量同时计算得到初始迭代步骤的出行产生扩样系数与吸引扩样系数
[0026]
23)在满足双约束模型的基础上,计算初始迭代步骤的位置系数和
[0027]
24)计算初始迭代步骤的i城市前往j城市的实际出行量构成下一迭代步骤的初始od矩阵
[0028]
25)在以后的每个当前迭代步骤m中根据上一步骤得到的初始od矩阵odm中的实际出行量通过行和列求和的方式更新当前迭代步骤m中的实际信令发生量和实际出行吸引量进而更新当前迭代步骤m中的出行产生扩样系数与吸引扩样系数直至当前迭代步骤中的出行产生扩样系数与吸引扩样系数均在扩样系数精度范围(1

σ,1 σ)内,并以当前迭代步骤的实际出行量作为最终的实际出行量,否则更新当前迭代步骤m中的位置系数和并计算下一迭代步骤中的实际出行量构建下一迭代步骤的初始od矩阵od
m 1

[0029]
所述的步骤22)中,初始增长系数η设定为运营商在i城市和j城市的市占率的均值。
[0030]
所述的步骤23)中,初始迭代步骤的位置系数和的计算式为:
[0031][0032][0033]
其中,为初始迭代步骤的出行产生扩样系数,具体为初始的实际信令发生量与原始信令发生量的比值,为初始迭代步骤的吸引扩样系数,具体为初始的实际出行吸引量与原始出行吸引量的比值;
[0034]
则所述的步骤24)中,初始迭代步骤的i城市前往j城市的实际出行量的计算式为:
[0035][0036]
所述的步骤25)中,对于迭代步骤m,i城市前往j城市的实际出行量的计算式以及更新式为:
[0037][0038]
[0039][0040]
其中,上标m表示当前迭代步骤。
[0041]
所述的步骤25)中,精度值σ设定为0.03。
[0042]
与现有技术相比,本发明具有以下优点:
[0043]
本发明利用手机信令记录的个体时空间坐标,经过数据清洗等步骤,定义了出行吸引增长系数、交通小区位置系数等多项指标,建立了满足双约束的出行量预测模型来识别城际间客运强度,通过本方法能够获取在城市群内部不同城市之间真实的客运联系状况,并且在拥有多天手机信令数据的基础上,可进一步分析城市间出行强度的变化,对于城市群客运交通需求分析和交通规划具有实际应用价值。
附图说明
[0044]
图1为基于手机信令数据的城际出行扩样方法数据处理流程图。
具体实施方式
[0045]
下面结合附图和具体实施例对本发明进行详细说明。
[0046]
本发明提供一种基于手机信令数据的城际出行扩样方法,出行扩样具体是指结合运营商的手机信令数据,获取用户在不同时间内的活动情况,利用该活动计算所得的城市间出行od矩阵与运营商在不同城市的市占率来推算不同城市间的客运联系,本发明利用运营商所提供的手机信令数据(形式如表1)以及在不同城市的市占率,构建双约束模型,准确推算不同城市之间客流量的实际值,包括以下步骤:
[0047]
步骤1:数据预处理与活动提取,具体包括以下步骤:
[0048]
1.1:按照手机信令表中的stime属性进行排序,分离用户在同一天内的所有活动,对信令数据进行时空间平滑处理;
[0049]
1.2:设定活动时间间隔阈值(30min),去除没有栅格变化的活动,筛选用户的有效出行信息;
[0050]
1.3:设定栅格的边长参数,利用栅格函数标记用户每一次出行的起终点位置,添加如区、县、地级市等属性;
[0051]
1.4:集计用户出行数据,计算手机信令反映的城际间不同交通单元(本发明中以地级市作为基本交通单元)的信令出行量,并构建原始信令od矩阵;
[0052]
步骤2:计算交通单元的出行量指标,求解增长系数与位置系数,具体包括以下步骤:
[0053]
2.1:根据步骤1.4所统计的信令出行量,可以计算:
[0054]
对于单个地级市,统计原始信令发生量和原始出行吸引量信令发生量定义为一定时间段内由i地级市出发,前往其他地级市的手机信令统计总量,出行吸引量定义为一定时间段内由其他地级市出发,前往j地级市的手机信令统计总量;
[0055]
同时,在初始迭代步骤中,需要设置初始增长系数,本发明采用i地级市和j地级市的市占率的均值作为初始增长系数,并以此计算i地级市的初始实际信令发生量以及j地
级市的初始实际出行吸引量实际信令发生量定义为一定时间段内由i地级市出发,前往其他地级市的实际出行总量,实际出行吸引量定义为一定时间段内由其他地级市出发,前往j地级市的实际出行总量。
[0056]
2.2:在后续的迭代步骤m中,出行产生扩样系数定义为i地级市的初始迭代步骤中的实际信令发生量与迭代步骤m中的实际信令发生量的比值,吸引扩样系数定义为j地级市初始迭代步骤中的实际出行吸引量与迭代步骤m中的实际信令发生量的比值。
[0057]
2.3:为满足双约束模型,需要计算迭代步骤m的位置系数和两者的计算式如下:
[0058][0059][0060]
其中,为由i地级市前往j地级市的实际出行量。
[0061]
双约束模型是相较于早期无约束模型的描述方式,由于在1955年所提出的重力模型中,无法满足交通守恒约束条件,即:(1)∑jt
ij
=oi,(2)∑it
ij
=dj,因此在本发明所描述的模型中,加入了位置系数与迭代的方式,以保证能够满足交通守恒约束条件,故为双约束模型)。
[0062]
步骤3:迭代并求解至模型收敛
[0063]
3.1:求解当前迭代步骤中i地级市前往j地级市的实际出行量则有:
[0064][0065]
其中,m为迭代次数。
[0066]
对于上一迭代步骤所求出的实际出行量可以以此构建新的不同地级市间od矩阵,并更新和在求出和后,求解当前迭代步骤m中的出行产生扩样系数与出行吸引扩样系数
[0067]
3.2:验证是否收敛,当出行产生扩样系数与出行吸引扩样系数均在范围(1

σ,1 σ)内,即可认为收敛,σ为扩样系数精度阈值,在本发明中精度值设定为0.03,如果存在扩样系数不符合取值范围,则需要进一步迭代,即依照新的出行产生扩样系数与出行吸引扩样系数求解位置系数li和lj,并重新计算构建od矩阵,直至模型收敛。
[0068]
实施例
[0069]
本例中采用长三角城市群2019年5月的某个工作日的手机信令数据,具体操作流程如图1所示,具体步骤说明如下:
[0070]
步骤1:
[0071]
1.1:由于获取的是运营商所提供的原始手机信令数据,因此需要对数据进行分箱处理,通过日期时间戳进行分箱,选取2019年5月的某个工作日作为本实例的数据基础,依照其中的stime属性进行排序,分离所有用户在一天内的所有活动,对信令数据进行平滑处理,分离后的数据字段含有《uid,stime,loncol,latcol,statuschange》,其分别代表用户唯一性标识、活动开始时间、活动开始栅格(loncol,latcol)、栅格变化状态识别,若栅格未发生变化,则删除本次活动。
[0072]
1.2:将用户一次活动的识别阈值设定为30min,并去除用户在相邻两次数据间没有发生栅格变化的活动,筛选出用户的有效出行信息。筛选后的数据字段含有《uid,stime,etime,sloncol,slatcol,eloncol,elatcol,duration》,分别代表用户唯一性标识、活动开始时间、活动结束时间、活动开始栅格、活动结束栅格、活动持续时间,识别30min以上的用户活动信息。
[0073]
1.3:基于长三角的地理信息文件,以1km栅格作为用户活动识别的最小单位,共将长三角地区分为356490个栅格,利用栅格函数标记用户每一次出行的起终点位置,并添加如区、县、地级市等属性。
[0074]
1.4:对用户的出行数据进行集计处理并导出,共识别出4927561次活动,以长三角41个城市作为本方法基本交通单元,计算信令数据所反映出的城际间出行量(部分数据如表2所示)。
[0075]
表2扩样前部分城市间的预估实际出行统计
[0076][0077][0078]
步骤2:
[0079]
2.1:以步骤1.4所计算的城际间出行量,计算长三角41个地级市的信令发生量
出行吸引量以及各地级市的实际信令发生量pi和实际出行吸引量aj;
[0080]
2.2:计算出行产生扩样系数与吸引扩样系数
[0081]
2.3:根据计算的信令发生量和出行吸引量以及地级市的实际信令发生量pi和实际出行吸引量aj以及扩样系数,求解地级市的位置系数li和lj,并计算实际出行量t
ij

[0082]
步骤3:
[0083]
3.1:依照t
ij
的计算式,构建长三角共41个地级市间的od矩阵,即计算每两个城市间的t
ij
的值。
[0084]
3.2:在本实际案例中,共迭代m=2次后,模型收敛(精度设定为σ=0.03),此时长三角41个地级市的扩样后客流联系可视化如表3所示。
[0085]
表3扩样后部分城市间的预估实际出行统计
[0086] 苏州市上海市无锡市安庆市池州市常州市杭州市绍兴市嘉兴市苏州市 10082256024365971236752333640919006146951上海市980589 8486478119623738911228740812271353无锡市66090579371 259517511075480101381915804安庆市603837312 577109349597153138池州市9401238518575712 9549509690常州市69680262125301423071125 584017053058杭州市342031211011595070312248885 437859364086绍兴市124572804837171303071837403203 57408嘉兴市13728424115113332138277409136577567257 [0087]
3.3:对案例的扩样效果进行验证,基于长三角不同城市之间客运巴士的班次数量对扩样后的长三角od进行检验,客运巴士一定程度上直接反映了不同城市之间客运量,铁路运输的班次往往与货运也存在一定关联,与之相比城市间巴士的班次与客运的关联程度更高,在本案例中采用长三角各城市间公路客运的巴士班次与各个城市间的od量作相关性分析,基于所有城市的回归分析结果分析,模型r2的值均值为0.46,一般认为r2大于0.3时,模型拟合程度较好。因此利用客运巴士的班次检验,一定程度上可验证该扩样模型的合理性,本方法基于手机信令数据的城际出行扩样方法是有效的。
[0088]
综上,在本发明中,不同城市的运营商占有率都纳入了计算实际客运联系的模型中,与此同时,依照手机信令所统计的客流量为不同的城市设置增长系数以及修正系数,根据多次迭代的方法,很好的契合出行产生与吸引的约束条件,该方法有效提升了计算城际间实际客流联系的准确率,对于城市群客运交通需求分析和交通规划具有很高的应用价值。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献