一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种异常时空点的识别方法、装置、电子设备及存储介质与流程

2022-03-23 03:20:02 来源:中国专利 TAG:


1.本发明属于的大数据处理技术领域,具体涉及一种异常时空点的识别方法、装置、电子设备及存储介质。


背景技术:

2.网约车领域,经营模式通常为:乘客端请求约车服务,司机端接收乘客端的请求并生成网约车订单,在网约车将乘客派送至订单终点时,乘客端向网约车平台支付该笔订单的费用,然后网约车平台将该笔订单的车费支付给司机端。正是由于这种先下单后付款的经营模式,让许多乘客钻空子产生逃单行为。通常为平台垫付该笔订单的车费支付给司机,然后平台以短信、电话和app消息推送等形式提醒乘客及时支付该笔订单,但仍存在大量未支付的订单。
3.现有相关技术中,通常针对逃单的乘客账号进行监测,但是逃单乘客通常仅使用一次该网约车平台的乘车服务,在使用完毕后并丢弃该账号,由于乘客注册网约车平台时仅通过手机号码就可注册成功,而平台未能获取乘客的个人信息,难以有效监测乘客的逃单行为。


技术实现要素:

4.本发明的目的是要解决上述的技术问题,提供一种异常时空点的识别方法、装置、电子设备及存储介质。
5.为了解决上述问题,本发明按以下技术方案予以实现的:
6.第一方面,本发明提供了一种异常时空点的识别方法,包括以下步骤:
7.接收监控请求选择监控的时空区域;
8.生成所述时空区域对应的时空网格;
9.通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
10.比较所述估计值与预设异常时空阈值,识别异常时空点。
11.结合第一方面,本发明还提供了第一方面的第1种实施方式,所述生成所述时空区域对应的时空网格后,还包括:
12.接收分辨率选择命令,根据所述分辨率选择命令重新划分所述时空区域的时空网格。
13.结合第一方面,本发明还提供了第一方面的第2种实施方式,所述比较所述估计值与预设异常时空阈值,识别异常时空点,具体为:
14.通过预设公式比较已支付订单核密度估计模型的估计值和未支付订单核密度估计模型的估计值,输出具有单调含义的实数值;若所述实数值大于所述预设异常时空阈值,
则该网格节点为异常时空点。
15.结合第一方面,本发明还提供了第一方面的第3种实施方式,所述预设公式的表达式为:
[0016][0017]
式中,k(x,y,t)为实数值,kde
up
为未支付订单核密度估计模型的估计值,kde
p
为已支付订单核密度估计模型的估计值,kde
up
的输入为kde
up
(x,y,t),kde
p
的输入为kde
p
(x,y,t)。
[0018]
结合第一方面,本发明还提供了第一方面的第4种实施方式,所述预设时空核密度估计模型是通过以下方法获得,包括:
[0019]
获取乘客端已支付订单时空数据或未支付时空数据,建立时空数据集;
[0020]
通过预设分布函数、空间带宽和时间带宽,对时空数据集中每个已支付订单时空数据或未支付时空数据进行核密度估计,生成所述时空数据集对应的核密度估计函数。
[0021]
结合第一方面,本发明还提供了第一方面的第5种实施方式,所述预设分布函数为高斯核函数,所述核密度估计函数的表达式为:
[0022][0023]
式中,kde(x,y,t)为核密度估计值,n为时空数据集中已支付订单时空数据或未支付时空数据的个数,h1为空间带宽,h2为时间带宽,(xi,yi)为第i个已支付订单时空数据或未支付时空数据中经纬度数据,ti为第i个已支付订单时空数据或未支付时空数据中时间数据。
[0024]
第二方面,本发明提供了一种异常时空点的识别装置,包括:
[0025]
时空区域选择模块,所述时空区域选择模块用于接收监控请求选择监控的时空区域;
[0026]
时空网格生成模块,所述时空网格生成模块用于生成所述时空区域对应的时空网格;
[0027]
遍历模块,所述遍历模块用于通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
[0028]
识别模块,所述识别模块用于比较所述估计值与预设异常时空阈值,识别异常时空点。
[0029]
结合第二方面,本发明还提供了第二方面的第1种实施方式,还包括:
[0030]
重新划分时空网格模块,所述重新划分时空网格模块用于接收分辨率选择命令,根据所述分辨率选择命令重新划分所述时空区域的时空网格。
[0031]
第三方面,本发明提供了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,所述至少一个处理器执行指令时,具体执行如第
一方面中任一项所述的一种异常时空点的识别方法。
[0032]
第四方面,本发明提供了一种存储介质,存储有计算机程序,其特征在于:所述计算机程序被处理器执行时,具体执行如第一方面中任一项所述的一种异常时空点的识别方法。
[0033]
与现有技术相比,本发明的有益效果是:
[0034]
已支付订单核密度估计模型输出已支付订单的估计值,反应了该网格节点已支付订单的出现概率,未支付订单核密度估计模型输出未支付订单的估计值,反应了该网格节点未支付订单的出现概率,通过引入时间数据,建立时间维度邻近的约束,进而建立时空核密度估计模型,计算未支付订单和已支付订单的行为的时空分布密度,进而分析未支付订单的出现频率和已支付订单的出现频率,有效识别在特定时间段和特定时间区域呈现聚集状态的异常时空点,弥补的空间和时间割裂分析的方法缺陷,有效识别乘客的逃单行为。
附图说明
[0035]
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
[0036]
图1是本发明的一种异常时空点的识别方法的流程示意图;
[0037]
图2是本发明的一种异常时空点的识别装置的结构示意图。
具体实施方式
[0038]
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0039]
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0040]
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
[0041]
网约车领域的经营模式通常为:乘客端请求约车服务,司机端接收乘客端的请求并生成网约车订单,在网约车将乘客派送至订单终点时,乘客端向网约车平台支付该笔订单的费用,然后网约车平台将该笔订单的车费支付给司机端。正是由于这种先下单后付款的经营模式,让许多乘客钻空子产生逃单行为。通常为平台垫付该笔订单的车费支付给司机,然后平台以短信、电话和app消息推送等形式提醒乘客及时支付该笔订单,但仍存在大量未支付的订单。
[0042]
现有技术中,通常针对逃单的乘客账号进行监测,但是逃单乘客通常仅使用一次该网约车平台的乘车服务,在使用完毕后并丢弃该账号,由于乘客注册网约车平台时仅通过手机号码就可注册成功,而平台未能获取乘客的个人信息,难以有效监测乘客的逃单行为。
[0043]
相关技术中,uber(优步)公司提供了一种六边形分层网格系统h3,h3是一种基于网格的空间索引,其利用六边形作为网格索引的基本单元,将整个地球铺满六边形网格,按照不同的六边形区域,对经纬度进行编码,按照不同的网格精度,变成不同位数的编码,在同一区域中编码相同,通过采集未支付订单所在网格的包含经纬度的编码,对这些数据进行统计分析,识别未支付订单的时空点。但是每个六边形网格的宽度大小是预先设定的,在需要调整网格大小时,需重新建立整个网格索引系统,并且六边形网格的宽度太大时,准确度较低,难以准确识别未支付订单的经纬度特征,若六边形网格的宽度太小时,相邻网格之间容易产生不连续的空白区域,容易遗漏空白区域内的未支付订单。
[0044]
实施例1
[0045]
如图1所示,第一方面,本发明提供一种异常时空点的识别方法,包括以下步骤:
[0046]
接收监控请求选择监控的时空区域;
[0047]
生成所述时空区域对应的时空网格;
[0048]
通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
[0049]
比较所述估计值与预设异常时空阈值,识别异常时空点。
[0050]
在实践中发现,大多数逃单的乘客均为惯犯,他们屡次通过这种支付模式的漏洞产生逃单行为,且这些乘客的逃单地点通常在特定时间段和特定的区域内发生,在时间和空间上以一定程度聚集,平台可通过识别这些呈现聚集形态的未支付订单的区域和未支付时间段,并将这些区域标记为异常时空点,通过分析这些异常时空点可有效识别逃单乘客。
[0051]
本实施例中,已支付订单核密度估计模型输出已支付订单的估计值,反应了该网格节点已支付订单的出现概率,未支付订单核密度估计模型输出未支付订单的估计值,反应了该网格节点未支付订单的出现概率,通过引入时间数据,建立时间维度邻近的约束,进而建立时空核密度估计模型,计算未支付订单和已支付订单的行为的时空分布密度,进而分析未支付订单的出现频率和已支付订单的出现频率,有效识别在特定时间段和特定时间区域呈现聚集状态的异常时空点,弥补的空间和时间割裂分析的方法缺陷,有效识别乘客的逃单行为。
[0052]
步骤1:接收监控请求选择监控的时空区域。
[0053]
具体的,在选择时空区域前,通过建立空间核密度估计模型分析查找呈现聚集状态的空间区域,通过建立数据时钟查找聚集的时间段,接收监控请求,并选择具有聚集空间区域和聚集时间段的时间区域为监控区域,识别这些区域那个具体经纬度区域,那个具体时间段内未支付订单较多,有效识别逃单行为。
[0054]
步骤2:生成所述时空区域对应的时空网格。
[0055]
具体的,利用正方形作为网格索引的基本单元,将整个时空区域铺满正方形的网格,按照不同的正方形区域,对经纬度进行编码,按照不同的网格精度,变成不同位数的编码,在同一区域中编码相同,通过采集未支付订单和已支付订单所在网格的包含经纬度的编码,如果两个坐标的前五位编码相同,表明这两个坐标在五级精度中位于同一时空网格中,如果两个坐标的前五位编码相同,第六位编码不同,表明这两个坐标在五级精度中位于
同一时空网格中,而在六级精度中位于不同时空网格。
[0056]
在另一实施例中,利用正三角形或六边形作为网格索引的基本单元,将整个时空区域铺满正三角形或六边形的网格。由于六边形的面积周长比较低,可减少由于网格形状的边界效应带来的样本偏差,且六边形网格与其周围网格之间质心的距离相等,六边形网格铺满整个时空区域后没有间隙,在查找相邻领域的时空网格时,可更方便快捷找出所有的相邻时空网格。
[0057]
步骤3:通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据。
[0058]
具体的,网格搜索法即按照编码顺序,对每个网格节点内的未支付数据和已支付订单数据通过时空核密度估计模型训练,其中未支付订单时空数据通过未支付订单核密度估计模型训练,得到该网格节点的未支付订单的核密度估计值kde
up
,已支付订单时空数据通过已支付订单核密度估计模型训练,得到该网格节点的已支付订单的核密度估计值kde
p
,通过网格搜索法可避免遗漏该时空区域内的难以察觉,较为隐蔽的网格节点,避免遗漏识别异常时空点。
[0059]
具体的,所述预设时空核密度估计模型是通过以下方法获得,包括:
[0060]
步骤301:获取乘客端已支付订单时空数据或未支付时空数据,建立时空数据集;
[0061]
步骤302:通过预设分布函数、空间带宽和时间带宽,对时空数据集中每个已支付订单时空数据或未支付时空数据进行核密度估计,生成所述时空数据集对应的核密度估计函数。
[0062]
其中,所述预设分布函数为高斯核函数,所述核密度估计函数的表达式为:
[0063][0064]
式中,kde(x,y,t)为核密度估计值,n为时空数据集中已支付订单时空数据或未支付时空数据的个数,h1为空间带宽,h1∈(0.05,2),h2为时间带宽,h2∈(0.05,2),(xi,yi)为第i个已支付订单时空数据或未支付时空数据中经纬度数据,ti为第i个已支付订单时空数据或未支付时空数据中时间数据。
[0065]
具体的,由于离散分布的经纬度数据难以捕捉较为细微的连续性变化,而预设分布函数采用高斯核函数,高斯核函数可横梁不同经纬度数据之间的相似度,在一定区域内,让经纬度数据更好的聚集在一起,使这些起点位置数据变得线性可分,提高了核密度估计函数的准确性。同时,在经纬度数据的基础上,通过引入时间数据,建立时间维度邻近的约束,进而建立时空核密度估计模型,计算未支付订单和已支付订单的行为的时空分布密度,进而分析未支付订单的出现频率和已支付订单的出现频率,有效识别在特定时间段和特定时间区域呈现聚集状态的异常时空点,弥补的空间和时间割裂分析的方法缺陷,有效识别乘客的逃单行为。
[0066]
其中,空间带宽和时间带宽可自适应调整,当空间带宽和时间带宽较大时,核函数对应的曲线较为平滑,包含的细节较少,误差较大;当空间带宽和时间带宽较小时,核函数
对应的曲线较为波折陡峭,包含的噪声较多,不利于分析查找出异常时空点。空间带宽可按照该时空网格内的未支付订单数量和已支付订单数量调整,便于清晰识别该时空节点是否为异常时空点。
[0067]
步骤4:比较所述估计值与预设异常时空阈值,识别异常时空点。
[0068]
具体的,通过预设公式比较已支付订单核密度估计模型的估计值和未支付订单核密度估计模型的估计值,输出具有单调含义的实数值;若所述实数值大于所述预设异常时空阈值,则该网格节点为异常时空点。
[0069]
其中,所述预设公式的表达式为:
[0070][0071]
式中,k(x,y,t)为实数值,kde
up
为未支付订单核密度估计模型的估计值,kde
p
为已支付订单核密度估计模型的估计值,kde
up
的输入为kde
up
(x,y,t),kde
p
的输入为kde
p
(x,y,t)。
[0072]
例如,k(x,y,t)表明的该网格节点未支付订单与已支付订单之间的数量差距,k(x,y,t)的数值越大,表明该网格节点未支付订单的占比较多,该网格节点极有可能为异常时空点,需要重点监控并防范在这一时间段内,且经纬度为该地点的订单。
[0073]
优选的,在生成所述时空区域对应的时空网格后,还包括:
[0074]
步骤5:接收分辨率选择命令,根据所述分辨率选择命令重新划分所述时空区域的时空网格。
[0075]
当初次划分的时空网格精度较低时,即该时空区域内时空网格数量较少,每个时空网格所划分的面积较大,难以准确查找具体经纬度和时间的异常时空点;当初次划分的时空网格精度较高时,即该时空区域内时空网格数量较多,每个时空网格所划分的面积较小,分析起来数据较多,维护时间较长。此时,可通过重新设置分辨率,选择合适的时空网格的数量,便于快捷且准确查找该时空网格内的异常时空点。
[0076]
综上所述,当本发明方法执行时,一方面,本发明在经纬度数据的基础上,通过引入时间数据,建立时间维度邻近的约束,进而建立时空核密度估计模型,计算未支付订单和已支付订单的行为的时空分布密度,进而分析未支付订单的出现频率和已支付订单的出现频率,有效识别在特定时间段和特定时间区域呈现聚集状态的异常时空点,弥补的空间和时间割裂分析的方法缺陷,有效识别乘客的逃单行为。另一方面,通过重新设置分辨率,选择合适的时空网格的数量,便于快捷且准确查找该时空网格内的异常时空点。此外,通过网格搜索法可避免遗漏该时空区域内的难以察觉,较为隐蔽的网格节点,避免遗漏识别异常时空点
[0077]
本发明所述异常时空点的识别方法的其它步骤参照现有技术。
[0078]
实施例2
[0079]
如图2所示,第二方面,本发明公开了一种异常时空点的识别装置,包括时空区域选择模块m1、时空网格生成模块m2、遍历模块m3和识别模块m4。
[0080]
所述时空区域选择模块m1用于接收监控请求选择监控的时空区域;
[0081]
所述时空网格生成模块m2用于生成所述时空区域对应的时空网格;
[0082]
所述遍历模块m3用于通过网格搜索法在预设时空核密度估计模型中遍历所述时
空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
[0083]
所述识别模块m4用于比较所述估计值与预设异常时空阈值,识别异常时空点。
[0084]
针对第二方面,还包括第1种优选实施,还包括重新划分时空网格模块m5。
[0085]
所述重新划分时空网格模块m5用于接收分辨率选择命令,根据所述分辨率选择命令重新划分所述时空区域的时空网格。
[0086]
综上所述,本实施例所述装置在运行时,能实现实施例1中所述的异常时空点的识别方法的全部步骤,以实现实施例1中所达到的技术效果。
[0087]
本实施例所述的异常时空点的识别装置的其它结构参见现有技术。
[0088]
实施例3
[0089]
本发明还公开一种电子设备,至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,所述至少一个处理器执行指令时,具体实现以下的步骤:
[0090]
接收监控请求选择监控的时空区域;
[0091]
生成所述时空区域对应的时空网格;
[0092]
通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
[0093]
比较所述估计值与预设异常时空阈值,识别异常时空点。
[0094]
实施例4
[0095]
本发明还公开一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时,具体实现以下步骤:
[0096]
接收监控请求选择监控的时空区域;
[0097]
生成所述时空区域对应的时空网格;
[0098]
通过网格搜索法在预设时空核密度估计模型中遍历所述时空网格的网格节点,输出估计值;所述预设时空核密度估计模型包括已支付订单核密度估计模型和未支付订单核密度估计模型;所述网格节点包括已支付订单时空数据和未支付时空数据;所述已支付订单时空数据和未支付时空数据包括经纬度数据和时间数据;
[0099]
比较所述估计值与预设异常时空阈值,识别异常时空点。
[0100]
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
[0101]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上
存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0102]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0103]
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,上述编程语言包括面向对象的编程语言—诸如smalltalk、c 、java等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0104]
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献