一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于指数平滑的位置预测系统及方法

2022-04-27 12:43:04 来源:中国专利 TAG:


1.本发明是推荐算法位置预测领域,具体涉及一种基于指数平滑的位置预测系统及方法。


背景技术:

2.随着智能手机广泛的使用,基于位置的服务的不断增加以及gps等位置获取技术的最新发展,使得位置信息成为foursquare、gowalla和facebook等社交网络的重要组成成分。准确的位置预测在城市规划、交通预测、广告推送、疾病预防以及推荐系统等方面具有非常重要的应用价值。
3.随着信息技术的快速发展,在位置预测系统中用户的信息变得多元化,各种各样的辅助信息可以被利用,从社交网络信息到兴趣相投的陌生人信息、从时间信息到运动轨迹信息,从上下文信息到环境信息,这些信息维度随着互联网技术的发展越来越高,从而使得位置预测系统能够更加准确的去描述用户和位置的特征,从而提高用户体验。
4.影响位置预测精度的因素有很多种,比较常见的是用户的签到数据和社交网络。(1)用户的签到数据。其中包含的位置坐标和签到时间对预测结果具有很大的作用。用户的行为是具有稳定性和周期性的,用户的位置是受时间和空间的限制;(2)用户的社交网络。朋友对用户位置的影响受时间差和距离差的影响,比如用户的朋友访问了一个位置,随着时间的推移,用户访问该位置的概率越低;用户的朋友访问的位置距离用户越远,用户访问的概率越低。基于这两个影响因素,已有学者提出频次模型,高斯模型,pmm模型和psmm模型。
5.传统模型对签到数据的使用,仅限于使用当天的数据来进行位置预测,没有使用历史签到数据,或者无差别的使用历史签到数据。这将导致历史签到数据对用户位置预测的影响无法体现,这是因为历史数据的影响会随时间的推移而变弱。指数平滑方法的引入,可以真实的反应历史数据对位置预测结果的影响。


技术实现要素:

6.针对现有技术中存在的不足,本发明提供了一种基于指数平滑的位置预测系统及方法。本发明利用指数平滑方法,结合历史签到数据,更加真实的体现历史签到数据对位置预测的影响,解决了如何使用历史签到数据进行位置预测和提高预测精度的问题。
7.一种基于指数平滑的位置预测系统,包括数据处理模块和位置预测模块。
8.所述的数据处理模块用于获取用户的签到数据,基于当前需要预测的时刻,提取前n天的签到数据作为历史数据。
9.所述的位置预测模块包括参数拟合模块、模型计算模块和预测模块。
10.所述的参数拟合模块对数据处理模块获取的历史签到数据集以天为单位使用em算法进行签到状态分类,计算相关一维时序高斯模型参数,使用指数平滑进行计算,获得一维时序高斯模型最终参数,最后进行二维空间高斯模型参数计算。
11.所述的模型计算模块根据预测的时间,通过一维时序高斯模型利用参数拟合模块拟合出来的一维时序高斯参数计算响应度,根据二维空间高斯模型,计算出位置集中每一个位置出现的概率,获取给定位置集中在空间模型中的得分。
12.所述的预测模块根据得到的给定位置集中在空间模型中的得分获取最佳预测位置。
13.一种基于指数平滑的位置预测方法,步骤如下:
14.步骤(1).获取历史数据集:
15.获取用户的签到数据,基于当前需要预测的时刻,提取前n天的签到数据作为历史数据。
16.步骤(2).拟合参数:
17.获取的历史签到数据集以天为单位使用em算法进行签到状态分类,计算相关一维时序高斯模型参数,使用指数平滑进行计算,获得一维时序高斯模型最终参数,最后进行二维空间高斯模型参数计算。
18.步骤(3).位置预测:
19.根据当前预测时间,使用一维时序高斯模型和二维空间高斯模型,得到预测经纬度坐标。
20.进一步的,步骤(1)中获得的数据集包括:用户,签到时间,经纬度。
21.进一步的,步骤(2)具体方法如下:
22.将签到点状态分为home状态和work状态,同时采用两个基于时序的一维高斯分模型和两个基于空间的二维高斯模型进行位置预测。引入指数平滑方法,根据时间差合理的分配权重,真实的反应历史数据的影响力和时间差的关系。将指数平滑公式进行推导,应用到模型参数的计算当中。
23.(2-1)、通过em算法拟合时序高斯模型参数:
24.构建一维时序高斯分模型:
[0025][0026][0027]
其中p
ch
是指历史数据集中某天home状态的占比,τh是home状态的平均时间,σh是home状态的方差;p
cw
是指历史数据集中某天work状态的占比,τw是work状态的平均时间,σw是work状态的方差;
[0028]
a:将历史数据集中每天的每一条签到数据随机标签状态,根据状态不同,计算出一维时序高斯模型初始参数。
[0029]
b:e步,根据当前模型参数,计算每个一维时序高斯分模型对每一条签到数据的响应度。
[0030]
[0031][0032]
其中nh(t)和nw(t)是表示该时刻在一维时序高斯分模型的响应度根据响应度的不同,对每一条签到数据重新分配标签;
[0033]
c:m步,根据重新分配标签的情况,计算出一维时序高斯分模型相关参数;
[0034]
d:重复第b步和第c步,直至收敛;得到模型参数θ;
[0035]
根据历史数据集,以天为单位通过em算法拟合时序高斯模型参数,获得模型参数θ
0-θ
n-1
,其中θi表示时间差为i(0≤i<n)天的签到数据拟合出来的模型参数。
[0036]
(2-2)、通过指数平滑计算一维时序高斯模型的最终参数:
[0037]
(1)基本公式:
[0038]st 1
=α*y
t
(1-α)*s
t
[0039]
其中s
t 1
是时间t 1的平滑值,y
t
是时间t的实际值,s
t
是时间t的平滑值,α是平滑指数,取值范围(0,1)。
[0040]
(2)指数平滑在一维时序高斯模型中的应用:
[0041]
指数平滑公式经过推导,一维时序高斯模型最终参数为:
[0042]
θ=αθ0 α(1-α)θ1 α(1-α)2θ2 ... α(1-α)
n-1
θ
n-1
[0043]
(2-3)、空间高斯模型参数计算:
[0044]
构建基于空间的二维高斯模型:
[0045][0046]
其中μh是home状态下的经纬度的均值,σh是home状态下的经纬度的协方差;μw是work状态下的经纬度的均值,σw是work状态下的经纬度的协方差。
[0047]
根据历史数据集中的数据分类情况,计算出用户在home状态下的均值μh和协方差矩阵σh,在work状态下的均值μw和协方差矩阵σw。
[0048]
进一步的,所述的步骤(3)具体方法如下:
[0049]
基于当前预测的时间,模型给出一个最优的位置,这个最优位置来自给定的位置集location中。location为历史数据集中所有出现过的位置的经纬度的集合。
[0050]
根据步骤(2)中拟合出来的一维时序高斯参数,计算出两个时序分模型对时间点的响应度,根据二维空间高斯模型,计算出location中每一个位置在home状态或者work状态出现的概率。
[0051]
根据公式计算出location中每一对经纬度的概率,概率最大的经纬度是模型预测的位置:
[0052]
p[x(t)=x]=p[xu(t)=x|cu(t)=h]
·
p[cu(t)=h] p[xu(t)=x|cu(t)=w]
·
p[cu(t)=w]。
[0053]
本发明有益效果如下:
[0054]
本发明利用指数平滑方法,有差别的使用历史数据,可以更加真实的反应出历史数据对位置预测的影响,进而提高位置预测模型的预测精度。
附图说明
[0055]
图1为本发明系统的结构示意图;
[0056]
图2为本发明预测结果和pmm模型预测结果对比图。
具体实施方式
[0057]
下面结合附图进一步说明本发明的技术方案:
[0058]
如图1所示,一种基于指数平滑的位置预测系统,包括数据处理模块和位置预测模块。
[0059]
所述的数据处理模块用于获取用户的签到数据,基于当前需要预测的时刻,提取前n天的签到数据作为历史数据。
[0060]
所述的位置预测模块包括参数拟合模块、模型计算模块和预测模块。
[0061]
所述的参数拟合模块对数据处理模块获取的历史签到数据集以天为单位使用em算法进行签到状态分类,计算相关一维时序高斯模型参数,使用指数平滑进行计算,获得一维时序高斯模型最终参数,最后进行二维空间高斯模型参数计算。
[0062]
所述的模型计算模块根据预测的时间,通过一维时序高斯模型利用参数拟合模块拟合出来的一维时序高斯参数计算响应度,根据二维空间高斯模型,计算出位置集中每一个位置出现的概率,获取给定位置集中在空间模型中的得分。
[0063]
所述的预测模块根据得到的给定位置集中在空间模型中的得分获取最佳预测位置。
[0064]
本发明提供了一个基于指数平滑的位置预测方法,使用用户历史签到数据,结合em算法、指数平滑和高斯模型,实现对用户下一个时间出现的位置进行预测。该方法可用于人类移动行为预测。体现了历史数据对位置预测的影响会随时间的推迟而减弱。
[0065]
本发明具体实施步骤如下:
[0066]
步骤(1).首先获取brightkite网站公开的用户签到集作为数据集,对数据集进行清洗,保留签到条数大于10的用户。基于当前需要预测的时刻,提取前n天的签到数据作为历史数据集。数据样例如表1所示。
[0067]
表1.用户经纬度坐标
[0068]
numtimelatlon02010-10-17t01:48:53z39.747652-104.9925102010-10-16t06:02:04z39.891383-105.07081402010-10-16t03:48:54z39.891077-105.06853202010-10-14t18:25:51z39.750469-104.99907302010-10-14t00:21:47z39.752713-104.996337
[0069]
步骤(2).参数拟合;
[0070]
人类的移动具有一定的周期性和区域限制性,在特定的时间内,在同一个位置频繁出现,例如,在工作日的中午十二点,极大可能出现在公司,而在晚上十点,极大可能出现在家里。基于这种现象,本发明将签到点状态分为home状态和work状态,同时采用两个基于时序的一维高斯分模型和两个基于空间的二维高斯模型进行位置预测。
[0071]
过去的签到点对位置预测的影响会随时间推迟而减弱,距离时间越久,影响力越
小,例如,本周一的签到点对本周二的影响和对本周五的影响是不一样的,因为时间越长,人类移动行为的波动性越强。基于这种现象,引入指数平滑方法,根据时间差合理的分配权重,真实的反应历史数据的影响力和时间差的关系。将指数平滑公式进行推导,应用到模型参数的计算当中。
[0072]
(2-1)、通过em算法拟合时序高斯模型参数:
[0073]
构建一维时序高斯分模型:
[0074][0075][0076]
其中p
ch
是指历史数据集中某天home状态的占比,τh是home状态的平均时间,σh是home状态的方差;p
cw
是指历史数据集中某天work状态的占比,τw是work状态的平均时间,σw是work状态的方差;
[0077]
a:将历史数据集中每天的每一条签到数据随机标签状态,根据状态不同,计算出一维时序高斯模型初始参数。
[0078]
b:e步,根据当前模型参数,计算每个一维时序高斯分模型对每一条签到数据的响应度。
[0079][0080][0081]
其中nh(t)和nw(t)是表示该时刻在一维时序高斯分模型的响应度根据响应度的不同,对每一条签到数据重新分配标签;
[0082]
c:m步,根据重新分配标签的情况,计算出一维时序高斯分模型相关参数;
[0083]
d:重复第b步和第c步,直至收敛;得到模型参数θ;
[0084]
根据历史数据集,以天为单位通过em算法拟合时序高斯模型参数,获得模型参数θ
0-θ
n-1
,其中θi表示时间差为i(0≤i<n)天的签到数据拟合出来的模型参数。
[0085]
(2-2)、通过指数平滑计算一维时序高斯模型的最终参数:
[0086]
(1)基本公式:
[0087]st 1
=α*y
t
(1-α)*s
t
[0088]
其中s
t 1
是时间t 1的平滑值,y
t
是时间t的实际值,s
t
是时间t的平滑值,α是平滑指数,取值范围(0,1)。
[0089]
(2)指数平滑在一维时序高斯模型中的应用:
[0090]
指数平滑公式经过推导,一维时序高斯模型最终参数为:
[0091]
θ=αθ0 α(1-α)θ1 α(1-α)2θ2 ... α(1-α)
n-1
θ
n-1
[0092]
(2-3)、空间高斯模型参数计算:
[0093]
构建基于空间的二维高斯模型:
[0094][0095]
其中μh是home状态下的经纬度的均值,σh是home状态下的经纬度的协方差;μw是work状态下的经纬度的均值,σw是work状态下的经纬度的协方差。
[0096]
根据历史数据集中的数据分类情况,计算出用户在home状态下的均值μh和协方差矩阵σh,在work状态下的均值μw和协方差矩阵σw。
[0097]
步骤(3).位置预测模型;
[0098]
基于当前预测的时间,模型给出一个最优的位置,这个最优位置来自给定的位置集location中。location为历史数据集中所有出现过的位置的经纬度的集合,如表2所示。
[0099]
表2.location数据样例
[0100]
纬度经度39.747652-104.9925139.891383-105.07081439.891077-105.06853239.750469-104.99907339.752713-104.996337
[0101]
根据步骤(2)中拟合出来的一维时序高斯参数,计算出两个时序分模型对时间点的响应度,根据二维空间高斯模型,计算出location中每一个位置在home状态或者work状态出现的概率。
[0102]
根据公式计算出location中每一对经纬度的概率,概率最大的经纬度是模型预测的位置:
[0103]
p[x(t)=x]=p[xu(t)=x|cu(t)=h]
·
p[cu(t)=h] p[xu(t)=x|cu(t)=w]
·
p[cu(t)=w]
[0104]
图2为本发明预测结果和pmm模型预测结果对比图。
[0105]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献