一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于MR常驻地的建筑物属性识别方法及系统与流程

2022-04-16 14:37:54 来源:中国专利 TAG:

一种基于mr常驻地的建筑物属性识别方法及系统
技术领域
1.本发明涉及建筑物属性识别技术领域,具体涉及一种基于mr常驻地的建筑物属性识别方 法及系统。


背景技术:

2.随着互联网、移动物联网、物联网、云计算的不断发展,社会各个领域都 在源源不断地产生大量的数据。数据资源被各国视为未来最重要的国家资产, 推动着未来人类社会生产、生活模式的改变和创新。近两年,各国不断颁布推 动大数据发展的政策,大数据应用也开始逐渐落地,从概念阶段正式进入成熟 阶段。电信运营商作为大数据的重要拥有者,其数据具备数量体大、类型多、 真实、准确的特点;近期电信运营商因传统业务发展饱和,导致其传统业务收 入不断下滑,急需新的业务增长点,与此同时各国际运营商亦积极开展战略转 型,布局大数据等新兴领域;所以围绕当前的数据金矿,充分挖掘、发挥数据 价值是当前电信运营商的必走之路,而在诸多运营商数据核心能力中,位置能 力就是其中之一,在对内运维优化、精准营销,对外数据变现、行业应用支撑 等方面起着至关重要的作用。
3.运营商获取建筑物属性,有利于针对不同场景的建筑物进行合作营销。然而,传统对建 筑物属性的识别通常是实地探测,往往需要花费大量的人力物力,效率较低,针对新建的建 筑物不能及时获取建筑物相关信息。因此,提出一种基于mr常驻地的建筑物属性识别方法及 系统。


技术实现要素:

4.本发明所要解决的技术问题在于:如何解决传统对建筑物属性的识别方式中存在的人力 物力耗费大、效率较低、不能及时获取新建建筑物相关信息的问题,提供了一种基于mr常驻 地的建筑物属性识别方法。该方法先利用精准识别的常住工作地和常住居住地用户,就近依 附到建筑物之中,然后根据结果计算建筑物工作地和居住地的人数密度,以建筑物工作地用 户数、居住地用户数、建筑物面积、居住地用户人数、工作地用户人数、周围人口密度指数、 建筑物属性作为入参,通过lightgbm的机器学习算法对模型进行训练,并通过函数调用形式, 完成对未知建筑物的属性识别。
5.本发明是通过以下技术方案解决上述技术问题的,本发明包括以下步骤:
6.s1:mr常驻地分析
7.通过mr指纹库定位清晰刻画出用户轨迹,对多日用户轨迹聚类分析,分析出用户常住工 作地和居住地;
8.s2:常驻地入楼处理
9.基于pnpoly算法进行点面计算,将用户常驻地归入到建筑物之中;在建筑物之外的用户 常驻地采用计算距离方式,就近依附到楼栋的方法,将用户常驻地入楼;
10.s3:模型参数整合及训练
11.对建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居 住地用户年龄分布、建筑物面积、人口密度指数分布、建筑物属性数据整合,然后将建筑物 工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居住地用户年龄 分布、建筑物面积、人口密度指数分布作为模型入参,建筑物属性数据作为模型出参进行模 型学习训练;
12.s4:未知建筑物属性预测
13.对经过评估后输出的模型进行封装,输入建筑物工作地用户数、建筑物居住地用户数、 建筑物工作地用户年龄分布、建筑物居住地用户年龄分布、建筑物面积、人口密度指数参数, 对未知建筑物属性进行预测。
14.更进一步地,在所述步骤s1中,用户常驻地包括用户常住工作地、用户常住居住地。
15.更进一步地,在所述步骤s1中,用户常驻地的分析过程如下:
16.s11:取用户的mr测量报告信息,基于三点定位算法与mr指纹库相匹配,定位出每个用 户的每条mr测量报告的具体位置;
17.s12:通过对每天的时间范围内的已定位的mr测量报告分布点聚类分析,分析出用户每 天的日居住地和日工作地位置;
18.s13:取一段周期内的用户日居住地和用户日工作地,聚类分析出用户的常住工作地和常 住居住地。
19.更进一步地,在所述步骤s12中,对于工作地识别,每天的时间范围取正常的工作时间, 早上08:00-11:00、下午14:00-17:00;对于居住地识别,每天的时间范围取正常的作息时间, 凌晨00:00-06:00、20:00-24:00。
20.更进一步地,在所述步骤s2中,pnpoly算法的计算过程如下:
21.s21:取需要判断点的纵坐标并从目标点出发引一条射线;
22.s22:判断射线和多边形所有边的交点数目;
23.s23:如果有奇数个交点,则说明在内部,即用户常驻地在楼栋内;如果有偶数个交点, 则说明在外部,即用户常驻地在楼栋外。
24.更进一步地,各入参与出参的含义分别如下:
25.建筑物工作地用户数:常住工作地在该建筑物的用户总数;
26.建筑物居住地用户数:常住居住地在该建筑物的用户总数;
27.建筑物工作地用户年龄分布:常住工作地在该建筑物的用户年龄分布情况;
28.建筑物居住地用户年龄分布:常住居住地在该建筑物的用户年龄分布情况;
29.建筑物面积:建筑物的实际占地面积;
30.人口密度指数分布:建筑物内部及周边不同日期不同时间段的人口密度指数分区情况;
31.建筑物属性数据:表明建筑物实际属性。
32.更进一步地,在所述步骤s3中,在模型训练的初始阶段,取样本的80%数据集为训练数 据集,包含入参和出参;对这部分数据进行分析,利用训练集训练模型,建立一个分类或回 归模型;再用剩下20%的数据作为测试集,将训练好的模型应用于测试集上用于预测;根据模 型在测试集上的表现来选择最佳模型。
33.更进一步地,在所述步骤s4中,采用均方根误差rmse来评估模型的预测精度,rmse的 值越小,表明模型的预测结果越准确。
34.本发明还提供了一种基于mr常驻地的建筑物属性识别系统,采用上述的识别方法对未知 建筑物属性进行识别,包括:
35.用户常驻地分析模块,用于通过mr指纹库定位清晰刻画出用户轨迹,对多日用户轨迹聚 类分析,分析出用户常住工作地和居住地;
36.常驻地处理模块,用于基于pnpoly算法进行点面计算,将用户常驻地归入到建筑物之中; 在建筑物之外的用户常驻地采用计算距离方式,就近依附到楼栋的方法,将用户常驻地入楼;
37.整合训练模块,用于对建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户 年龄分布、建筑物居住地用户年龄分布、建筑物面积、人口密度指数分布、建筑物属性数据 整合,然后将建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建 筑物居住地用户年龄分布、建筑物面积、人口密度指数分布作为模型入参,建筑物属性数据 作为模型出参进行模型学习训练;
38.属性预测模块,用于对经过评估后输出的模型进行封装,输入建筑物工作地用户数、建 筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居住地用户年龄分布、建筑物面积、 人口密度指数参数,对未知建筑物属性进行预测;
39.控制处理模块,用于向其他模块发出指令,完成相关动作;
40.所述用户常驻地分析模块、常驻地处理模块、整合训练模块、属性预测模块均与所述控 制处理模块电性连接。
41.本发明相比现有技术具有以下优点:该基于mr常驻地的建筑物属性识别方法及系统,首 先,利用mr识别的常驻地作为数据输入源,精度高,覆盖广,时效性好;其次,引入建筑物 面积、居住地人口密度、工作地人口密度、工作地人数、居住地人数、周围人口密度指数作 为模型入参可以有效反应建筑物的特征状况;通过lightgbm算法对建筑物属性模型训练,训 练效率更高,使用内存更低;此外采用均方根误差rmse,对模型进行有效的精准度评估,最 终实现对已知参数的建筑物属性进行预测,精度较高,有效减少人力物力成本,值得被推广 使用。
附图说明
42.图1是本发明实施例二中基于mr常驻地的建筑物属性识别方法的流程示意图;
具体实施方式
43.下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施, 给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
44.实施例一
45.本实施例提供一种技术方案:一种基于mr常驻地的建筑物属性识别方法,包括以下步骤:
46.s1:mr常驻地分析
47.通过mr指纹库定位清晰刻画出用户轨迹,对多日用户轨迹聚类分析,分析出用户常住工 作地和居住地;
48.s2:常驻地入楼处理
49.基于pnpoly算法进行点面计算,将用户常驻地归入到建筑物之中;在建筑物之外的用户 常驻地采用计算距离方式,就近依附到楼栋的方法,将用户常驻地入楼;
50.s3:模型参数整合及训练
51.对建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居 住地用户年龄分布、建筑物面积、人口密度指数分布、建筑物属性数据整合,然后将建筑物 工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居住地用户年龄 分布、建筑物面积、人口密度指数分布作为模型入参,建筑物属性数据作为模型出参进行模 型学习训练;
52.s4:未知建筑物属性预测
53.对经过评估后输出的模型进行封装,输入建筑物工作地用户数、建筑物居住地用户数、 建筑物工作地用户年龄分布、建筑物居住地用户年龄分布、建筑物面积、人口密度指数参数, 对未知建筑物属性进行预测。
54.在本实施例中,在所述步骤s1中,用户常驻地包括用户常住工作地、用户常住居住地。
55.在本实施例中,在所述步骤s1中,用户常驻地的分析过程如下:
56.s11:取用户的mr测量报告信息,基于三点定位算法与mr指纹库相匹配,定位出每个用 户的每条mr测量报告的具体位置;
57.s12:通过对每天的时间范围内的已定位的mr测量报告分布点聚类分析,分析出用户每 天的日居住地和日工作地位置;
58.s13:取一段周期内的用户日居住地和用户日工作地,聚类分析出用户的常住工作地和常 住居住地。
59.在本实施例中,在所述步骤s12中,对于工作地识别,每天的时间范围取正常的工作时 间,早上08:00-11:00、下午14:00-17:00;对于居住地识别,每天的时间范围取正常的作息 时间,凌晨00:00-06:00、20:00-24:00。
60.在本实施例中,在所述步骤s2中,pnpoly算法的计算过程如下:
61.s21:取需要判断点的纵坐标并从目标点出发引一条射线;
62.s22:判断射线和多边形所有边的交点数目;
63.s23:如果有奇数个交点,则说明在内部,即用户常住地在楼栋内;如果有偶数个交点, 则说明在外部,即用户常住地在楼栋外。
64.在本实施例中,各入参与出参的含义分别如下:
65.建筑物工作地用户数:工作地在该建筑物的用户总数;
66.建筑物居住地用户数:居住地在该建筑物的用户总数;
67.建筑物工作地用户年龄分布:工作地在该建筑物的用户年龄分布情况;
68.建筑物居住地用户年龄分布:居住地在该建筑物的用户年龄分布情况;
69.建筑物面积:建筑物的实际占地面积;
70.人口密度指数分布:建筑物内部及周边不同日期不同时间段的人口密度指数分区
情况;
71.建筑物属性数据:表明建筑物实际属性。
72.在本实施例中,在所述步骤s3中,在模型训练的初始阶段,取样本的80%数据集为训练 数据集,包含入参和出参;对这部分数据进行分析,利用训练集训练模型,建立一个分类或 回归模型;再用剩下20%的数据作为测试集,将训练好的模型应用于测试集上用于预测;根据 模型在测试集上的表现来选择最佳模型。
73.在本实施例中,在所述步骤s4中,采用均方根误差rmse来评估模型的预测精度,rmse 的值越小,说明模型的预测结果越准确。
74.本实施例还提供了一种基于mr常驻地的建筑物属性识别系统,采用上述的识别方法对未 知建筑物属性进行识别,包括:
75.用户常驻地分析模块,用于通过mr指纹库定位清晰刻画出用户轨迹,对多日用户轨迹聚 类分析,分析出用户常住工作地和居住地;
76.常驻地处理模块,用于基于pnpoly算法进行点面计算,将用户常驻地归入到建筑物之中; 在建筑物之外的用户常驻地采用计算距离方式,就近依附到楼栋的方法,将用户常驻地入楼;
77.整合训练模块,用于对建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户 年龄分布、建筑物居住地用户年龄分布、建筑物面积、人口密度指数分布、建筑物属性数据 整合,然后将建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建 筑物居住地用户年龄分布、建筑物面积、人口密度指数分布作为模型入参,建筑物属性数据 作为模型出参进行模型学习训练;
78.属性预测模块,用于对经过评估后输出的模型进行封装,输入建筑物工作地用户数、建 筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居住地用户年龄分布、建筑物面积、 人口密度指数参数,对未知建筑物属性进行预测;
79.控制处理模块,用于向其他模块发出指令,完成相关动作;
80.所述用户常驻地分析模块、常驻地处理模块、整合训练模块、属性预测模块均与所述控 制处理模块电性连接。
81.实施例二
82.如图1所示,本发明是利用精准的mr常驻地以及建筑物的轮廓进行建模分析,实现对未 知的建筑物属性进行识别,主要数据源及流程步骤如下:
83.数据源说明:
84.mr常驻地:包含利用mr指纹库定位轨迹,挖掘精准的mr用户工作地和居住地;
85.gis建筑物数据:包含建筑物名称、建筑物属性、建筑物gis经纬度序列。在用户常驻地 入楼栋处理时,需要知道建筑物的边界信息,根据用户的常驻地信息和楼栋边界判断用户是 否在该建筑物楼栋内。
86.流程步骤说明:
87.步骤一:mr常驻地分析
88.通过mr指纹库定位清晰刻画出用户轨迹,通过对多日用户轨迹聚类分析,分析出用户常 住工作地和居住地,精度高达50米。
89.在步骤一中,具体分析过程如下:
90.取用户的mr测量报告信息,基于三点定位算法与mr指纹库相匹配,定位出每个用户的 每条mr测量报告的具体位置;具体为取用户的mr测量报告信息,基于三点定位算法与mr指 纹库相匹配,定位出每个用户的每条mr测量报告的具体位置。
91.具体实现为首先需要建立一个mr指纹库,取mr数据和s1-u数据(xdr信令数据,含有 具体经纬度信息,关联度较低,可作为建库基础数据使用)相关联,取出关联结果并落入到 对应的50米栅格中,根据栅格中落入的点,分别计算每个栅格的特征信息(包含平均电平值、 主小区信息、邻区信息、ta值等),即为mr指纹库;最后定位的过程中,对于每一条需要定 位的mr测量报告信息,取其特征信息与mr指纹库相匹配,根据三点定位算法,找出三个与 该mr测量报告信息特征最为接近的栅格,计算三个栅格的平均经纬度即为该mr测量报告信 息的最终位置。
92.对于工作地识别,一般取正常的工作时间,早上08:00-11:00、下午14:00-17:00。对于 居住地识别,一般取正常的作息时间,凌晨00:00-06:00、20:00-24:00;
93.通过对每天的时间范围内的已定位的mr测量报告分布点聚类分析,分析出用户每天的日 居住地和日工作地位置;
94.最后取一段周期内的用户日居住地和用户日工作地,聚类分析出用户的常住工作地和常 住居住地。
95.步骤二:常驻地入楼处理
96.基于pnpoly算法进行点面计算,将用户常驻地(包括日常驻地与月常驻地)归入到建筑 物之中;在建筑物之外的用户常驻地采用计算距离方式,就近依附到楼栋的方法,将用户常 驻地入楼。
97.在步骤二中,pnpoly算法规则如下:
98.首先,需要取判断点的纵坐标并从目标点出发引一条射线。然后,判断射线和多边形所 有边的交点数目。如果有奇数个交点,则说明在内部,即用户常驻地在楼栋内;如果有偶数 个交点,则说明在外部,即用户常驻地在楼栋外。
99.步骤三:模型参数整合及训练
100.对建筑物工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居 住地用户年龄分布、建筑物面积、人口密度指数分布、建筑物属性数据整合,然后将建筑物 工作地用户数、建筑物居住地用户数、建筑物工作地用户年龄分布、建筑物居住地用户年龄 分布、建筑物面积、人口密度指数分布作为模型入参,建筑物属性数据作为模型出参进行模 型学习训练;
101.在步骤三中,输入参数(入参)的详细信息如下:
102.建筑物工作地用户数:常住工作地在该建筑物的用户总数;
103.建筑物居住地用户数:常住居住地在该建筑物的用户总数;
104.建筑物工作地用户年龄分布:常住工作地在该建筑物的用户年龄分布情况(年龄数据通 过由运营商客户登记的客户信息为准);
105.建筑物居住地用户年龄分布:常住居住地在该建筑物的用户年龄分布情况(年龄数据通 过由运营商客户登记的客户信息为准);
106.建筑物面积:建筑物的实际占地面积;
107.人口密度指数分布:建筑物内部及周边不同日期(周末及节假日与工作日分开提
供)不 同时间段的人口密度指数分区情况(通过对不同时间段的mr测量报告信息定位计算分析出人 口密度指数分布)。
108.输出参数(出参)的详细信息如下:
109.建筑物属性数据:表明建筑物实际属性,如医院、高校、商超(商场超市)、写字楼等。
110.在步骤三中,模型训练的过程如下:
111.在模型训练的初始阶段,取样本的80%数据集为训练数据集,包含入参和出参。对这部分 数据进行探索性数据分析,获得对数据的初步了解,通常方法包括描述性统计(平均数、中位 数、模式、标准差)、数据可视化(热力图、箱形图、散点图、主成分分析)、数据整形-对数 据进行透视、分组、过滤等,利用训练集训练模型,建立一个分类或回归模型。用剩下20%的 数据作为测试集,将训练好的模型应用于测试集上用于预测。根据模型在测试集上的表现来 选择最佳模型,为了获得最佳模型,还可以进行参数优化。
112.步骤四:未知建筑物属性预测
113.对经过评估后输出的模型进行封装,输入建筑物工作地用户数、建筑物居住地用户数、 建筑物工作地用户年龄分布、建筑物居住地用户年龄分布、建筑物面积、人口密度指数参数, 从而实现对未知建筑物属性进行预测。
114.为了保证模型训练后的精确度,采用均方根误差rmse来评估其预测精度,rmse的值越 小,说明模型的预测结果越准确。
115.需要说明的是,对于不同的建筑物属性,与所属人的职业属性特点关联性较强,对于入 参有较明显的特征。比如高校,每天的工作地用户和居住地用户数较为稳定,之间也没有明 显的差异;用户年龄分布趋于17-25周岁之间,较为集中;人口密度在工作日和周末以及白 天和晚上亦无明显差异。而对于写字楼来说,首先工作地用户和居住地用户差异较大;用户 年龄分布较为分散;人口密度在白天和晚上以及工作日和周末的差异非有明显的差异性。
116.在训练的模型中,通过对入参的大量迭代训练,每一种建筑物属性都与其自有的入参属 性较为拟合,对于新的入参输入到模型中,至少需要满足50%的入参的特征属性相拟合,就能 在模型中找到与其相拟合的特征值,以及出参-建筑物属性。在实际的测试过程中,对于高校、 写字楼、商超等具有明显特征的建筑物属性的识别准确率在90%左右,而对于医院等没有明 显特征的建筑物属性识别率在65%左右。
117.需要注意的是,在本实施例中,常驻地包括常住居住地与常住工作地,常住地即常住居 住地,同时也是用户居住地,工作地即常住工作地,同时也是用户工作地。
118.综上所述,上述实施例的基于mr常驻地的建筑物属性识别方法,首先,利用mr识别的 常驻地作为数据输入源,精度高,覆盖广,时效性好;其次,引入建筑物面积、居住地人口 密度、工作地人口密度、工作地人数、居住地人数、周围人口密度指数作为模型入参可以有 效反应建筑物的特征状况;通过lightgbm算法对建筑物属性模型训练,训练效率更高,使用 内存更低;此外采用均方根误差rmse,对模型进行有效的精准度评估,最终实现对已知参数 的建筑物属性进行预测,精度较高,有效减少人力物力成本,值得被推广使用。
119.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的, 不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述
实施例进 行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献