一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种不动产存量数据整理方法及其应用与流程

2023-04-04 23:04:45 来源:中国专利 TAG:


1.本发明涉及互联网领域,ipc分类号为:g06q10/06,特别涉及一种不动产存量数据整理方法及其应用。
技术背景
2.不动产存量数据是指在指定时间内已经保存至历史数据库中的数据,通常情况下,由于不动产存量数据的固定性以及历史录入能力的局限性,经常存在历史存量数据出现数据完整性较差,数据异常,存量数据与新录入的数据间存在重复或部分重复的问题,从而导致地籍数据的属性特征错误,后期数据流量数据录入时关联错误甚至无法关联的情况发生,但是,传统的存量数据的手动录入方式效率较低,同时人工处理庞大的地籍数据极易出现错误,导致地籍数据在实际使用中出现较多问题。
3.专利cn202010449837提供了一种基于多数据获取的不动产测绘与调查方法,此专利通过采集多维度的不动产评估数据,并建立了基于多数据的交叉组合方法从而对不动产的测绘数据进行多方面的评估和校验。专利cn201810361413提供了一种不动产资料上传方法、装置、计算机设备和存储介质,此专利通过设计了一种资料上传的装置,用以提升不动产业务办理的效率,通过在系统中直接录入并查询资料,用以避免虚假信息录入的情况。
4.但是上述专利只是针对不动产数据的采集精确度与采集效率进行了一定的优化,并未设计存量数据的纠正与优化问题,同时也无法更好的解决存量数据带来的后续的数据关联性错误的问题,针对上述情况,急需推出一种不动产存量数据整理方法及其应用。


技术实现要素:

5.针对上述存在的问题,本发明提供了一种不动产存量数据整理方法及其应用,具体整理方法流程为:
6.s1、对历史数据库中的不动产存量数据进行存量数据预处理;
7.s2、对预处理后的存量数据进行基于属性特征数据的拆分;
8.s3、对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据;
9.s4、批量筛选标准化结构数据中的异常值与缺失值,同时实时与采集的现有数据进行比对,筛选出重复与部分重复的存量数据。
10.优选的,所述的存量数据预处理,包括离散数据格式统一处理,地址结构化处理,图幅特征提取处理,地籍信息录入处理,图幅位置坐标标定处理。
11.优选的,所述的地址结构化处理,建立了结构化格式列表。
12.具体的,所述的与现有采集的数据进行对比,用以筛选出历史数据库在地籍数据存储过程中存在的重复存储,或土地分割过程时历史数据库并未更新,造成的现有数据关联失败,属性特征数据重叠的情况发生。
13.其中,对重复与部分重复的存量数据首先建立重复关键词查询,并通过设定重复关键词频次,将超出指定关键词频次的存量数据提取,并以时间线为基准,分析该存量数据
中地籍信息变更原因,自动生成地籍信息时间表,通过地籍信息时间表判断地籍的归属信息与权责变更事项,从而保留指定归属信息下的存量数据,删除其余重复部分。
14.优选的,所述的结构化格式列表,将地址数据转换为字符串形式,并将字符串形式的数据拆分为数据编号,数据名称,数据类型,以此作为属性数据对地址数据进行分类组合处理,生成统一结构数据。
15.优选的,所述的地籍信息录入处理,通过地籍图扫描基线标定与定位偏差拟合处理,实现地籍图的矢量化提取。
16.优选的,所述的地籍图扫描基线标定,通过建立基于ocr的图像分扫描方式,以扫描的地籍图进行图像处理与数据拟合,提升ocr扫描的精度。
17.优选的,所述的图幅特征提取处理,对存量数据中的图幅地号进行拆分并提取关键词,所述的关键词筛选包括关键词结构拆分,关键词属性拆分和人工校对筛选。
18.具体的,由于地籍信息中的图幅通常可分为“图号”“幅号”和“地号”三部分,但是由于各地区与各领域的统计方式不同,所述的图幅特征的格式也有所不同,因此需要进行图幅特征提取处理与结构标准化。
19.优选的,所述的多维度挂接处理,具体包括属性特征数据与幢图形数据库挂接,之后进行幢图形数据库数据与宗地图形数据库进行挂接。
20.优选的,所述的多维度挂接处理中,建立了基于批量数据统一挂接操作。
21.具体的,所述的基于批量数据统一挂接操作,通过建立基于最大后验概率分布计算的地籍信息校验。所述的预挂接信息表中由于自动进行批量信息筛选,可能会存在关联信息缺失与关联错误的情况发生,为了在提高地籍数据多维度挂接处理的效率的同时,提高地籍信息关联精度,在此基础上建立了基于最大后验概率分布计算地籍信息校验。
22.优选的,具体应用于不动产地籍数据整理系统的数据处理中。
23.与现有技术相比,本贩发明的有益效果在于:
24.(1)本发明所述的不动产存量数据整理方法,对历史数据库中的不动产存量数据进行系统化与标准化的整理,将之前在录入过程中由于历史录入能力的局限性导致的数据不完整或数据错误的问题进行补齐和修正,从而避免后续新的现有数据的录入过程中出现的关联性错误的问题,提高不动产存量数据系统工作的稳定性。
25.(2)在(1)的基础上,本发明通过建立基于批量数据统一挂接操作,克服了原有的数据录入过程中数据匹配效率低,数据关联精度差的问题,在批量遍历的方法进行地籍信息挂接的同时,建立了基于基于最大后验概率分布计算地籍信息校验方式,通过自动校验关联概率的方式,提高地籍信息数据关联的准确性,避免人工操作过程中匹配效率过低的问题。
附图说明
26.图1为一种不动产存量数据整理方法流程图。
具体实施方式
27.实施例1:
28.本实施例所述的一种不动产存量数据整理方法及其应用,如图1所示,具体整理方
法流程为:
29.s1、对历史数据库中的不动产存量数据进行存量数据预处理;
30.s2、对预处理后的存量数据进行基于属性特征数据的拆分;
31.s3、对拆分后存量数据的属性特征进行多维度挂接处理,并生成标准化结构数据;
32.所述的图幅特征提取处理的具体操作流程为:
33.a1、首先需要将存量数据中图幅数据进行关键词结构拆分,消除原有的结构框架,并将格式统一转换为xml格式;
34.a2、之后在此基础上进行基于关键词属性拆分,进行基于“图号”“幅号”和“地号”但三部分字符属性,字符类型的筛选与提取;
35.a3、最后照指定的字符属性进行基于数据列表的字符重排布,实现图幅特征提取处理与结构化构建,并将其中构建失败的图幅特征筛选后进行人工校对筛选。
36.所述的基于批量数据统一挂接操作,其具体操作流程为:
37.b1、首先进行单一区域范围的划分;
38.b2、针对指定区域范围内的地籍信息建立第一数据列表,在数据列表中记录地籍信息的属性特征数据;
39.b3、提取幢图形数据库与宗地图形数据库中该区域内的界址点,界址线与宗地面积建立第二数据列表;
40.b4、使用第一数据列表对第二数据列表进行自动遍历匹配,并将匹配结果生成预挂接关联信息表。
41.其中所述的基于最大后验概率分布计算的地籍信息校验,具体的校验方法为:
42.c1、预先对该地区内原始数据中地籍信息进行训练构建概率分布模型;
43.c2、之后在概率分布模型中导入预挂接信息表中的关联信息;
44.c3、查看数据的关联程度是否满足设定阈值;
45.c4、如满足设定阈值表明该地籍信息挂接成功;
46.c5、如果未满足设定阈值,则说明该地籍信息挂接错误,需进行人工数据核查。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献