一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种客户标准地址数据库的更新方法及系统

2022-12-07 10:20:46 来源:中国专利 TAG:

技术特征:
1.一种客户标准地址数据库的更新方法,其特征在于,包括:获取与原始地址对应的文本信息,并基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组;其中,所述区域地址数组由高至低依次包括:省级地址、市级地址、县级地址、镇级地址及社区级地址;所述详情地址数组由高至低依次包括:楼栋地址及门牌地址;拼接所述区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第一拼接地址,并基于第三方地址标准化api对所述第一拼接地址进行补充以得到第一补全地址,及与所述第一补全地址相应的经纬度数据;基于trie树结构将所述区域地址数组匹配至分词匹配表内,并取相应子节点中的关联地址对所述区域地址数组进行补充以得到补充区域地址数组;拼接所述补充区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第二拼接地址,并基于第三方地址标准化api对所述第二拼接地址进行补充以得到第二补全地址,及与所述第二补全地址相应的经纬度数据;通过分别计算所述第一补全地址、所述第二补全地址中各地址层级的权重和,并取与较大权重和对应的第一补全地址或第二补全地址作为预标准地址;其中,k为地址层级的总数,y
i
表示第i个地址层级是否为空值,y
i
=0表示为空值,y
i
=1表示有填充值,x
i
表示所述第一补全地址或所述第二补全地址中第i个地址层级与所述原始地址中第i个地址层级进行模糊匹配后的命中率,x
j
表示所述第一补全地址或所述第二补全地址中第j个地址层级与所述原始地址中第j个地址层级进行模糊匹配后的命中率,f
ij
表示所述第一补全地址或所述第二补全地址中第j个地址层级命中后对第i个地址层级的影响系数;基于所述详情地址数组对所述预标准地址进行补充以作为标准地址,并将所述标准地址及与之对应的经纬度数据存入标准地址数据库内以对其进行更新。2.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述基于配置表对所述文本信息进行拆分以得到相应的区域地址数组及详情地址数组之前,包括:基于模糊语义算法对所述文本信息进行处理以修正其内的错误表述信息或缺陷表述信息。3.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:基于trie树结构及多模式匹配算法对所述标准地址及所述分词匹配表间进行字符串匹配;若匹配失败则基于所述标准地址在所述分词匹配表中构建新增地址节点。4.根据权利要求1所述的客户标准地址数据库的更新方法,其特征在于,所述将所述标准地址及与之对应的经纬度数据存入标准地址数据库内之后,包括:对比所述标准地址与所述标准数据库中的原有地址以补充所述原有地址中缺少的地址层级,或修改所述原有地址中有误的地址层级。5.一种客户标准地址数据库的更新系统,其特征在于,包括:获取模块,用于获取与原始地址对应的文本信息,并基于配置表对所述文本信息进行
拆分以得到相应的区域地址数组及详情地址数组;其中,所述区域地址数组由高至低依次包括:省级地址、市级地址、县级地址、镇级地址及社区级地址;所述详情地址数组由高至低依次包括:楼栋地址及门牌地址;第一标准化模块,用于拼接所述区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第一拼接地址,并基于第三方地址标准化api对所述第一拼接地址进行补充以得到第一补全地址,及与所述第一补全地址相应的经纬度数据;第一预处理模块,用于基于trie树结构将所述区域地址数组匹配至分词匹配表内,并取相应子节点中的关联地址对所述区域地址数组进行补充以得到补充区域地址数组;第二标准化模块,用于拼接所述补充区域地址数组中的所有地址层级及所述详情地址数组中的最高地址层级以获得第二拼接地址,并基于第三方地址标准化api对所述第二拼接地址进行补充以得到第二补全地址,及与所述第二补全地址相应的经纬度数据;对比模块,用于通过分别计算所述第一补全地址、所述第二补全地址中各地址层级的权重和,并取与较大权重和对应的第一补全地址或第二补全地址作为预标准地址;其中,k为地址层级的总数,y
i
表示第i个地址层级是否为空值,y
i
=0表示为空值,y
i
=1表示有填充值,x
i
表示所述第一补全地址或所述第二补全地址中第i个地址层级与所述原始地址中第i个地址层级进行模糊匹配后的命中率,x
j
表示所述第一补全地址或所述第二补全地址中第j个地址层级与所述原始地址中第j个地址层级进行模糊匹配后的命中率,f
ij
表示所述第一补全地址或所述第二补全地址中第j个地址层级命中后对第i个地址层级的影响系数;第一更新模块,用于基于所述详情地址数组对所述预标准地址进行补充以作为标准地址,并将所述标准地址及与之对应的经纬度数据存入标准地址数据库内以对其进行更新。6.根据权利要求5所述的客户标准地址数据库的更新系统,其特征在于,包括:第二预处理模块,用于基于模糊语义算法对所述文本信息进行处理修正其内的错误表述信息或缺陷表述信息。7.根据权利要求5所述的客户标准地址数据库的更新系统,其特征在于,包括:匹配模块,用于基于trie树结构及多模式匹配算法对所述标准地址及所述分词匹配表间进行字符串匹配;新增模块,用于若匹配失败则基于所述标准地址在所述分词匹配表中构建新增地址节点。8.根据权利要求5所述的客户标准地址数据库的更新系统,其特征在于,包括:第二更新模块,用于对比所述标准地址与所述标准数据库中的原有地址以补充所述原有地址中缺少的地址层级,或修改所述原有地址中有误的地址层级。

技术总结
本发明公开了一种客户标准地址数据库的更新方法及系统。包括:对文本信息拆分得到区域地址数组及详情地址数组;拼接区域地址数组及部分详情地址数组获得第一拼接地址,基于第三方地址标准化API对其补充得到第一补全地址及相应的经纬度数据;基于Trie树结构将区域地址数组匹配至分词匹配表内,并对其补充得到补充区域地址数组;拼接补充区域地址数组及部分详情地址数组获得第二拼接地址,并基于第三方地址标准化API对其补充得到第二补全地址及经纬度数据;对比第一补全地址及第二补全地址各地址层级匹配权重和,基于较优权重和对应的补全地址对标准地址数据库更新。本发明基于文本类,特别是异地输入的文本类原始地址实现了标准地址数据库更新。准地址数据库更新。准地址数据库更新。


技术研发人员:邰伟鹏 卞义 李伟 陈业斌
受保护的技术使用者:安徽工业大学科技园有限公司
技术研发日:2022.10.14
技术公布日:2022/12/6
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献