一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种IP定位基准点提取方法、装置及可读存储介质与流程

2022-02-20 05:26:17 来源:中国专利 TAG:

一种ip定位基准点提取方法、装置及可读存储介质
技术领域
1.本发明涉及定位技术领域,尤其涉及一种ip定位基准点提取方法、装置及可读存储介质。


背景技术:

2.ip定位是为确定ip设备地理位置所采取的网络测量,广泛应用于基于地理位置的网络应用,例如恶意行为溯源、定向广告、社交网络、网络安全、性能优化等。
3.ip定位的基本原理是,利用ip设备的名字、注册信息或时延信息等来估计其地理位置。定位算法设计的基本原则是:在保证定位精度的前提下,尽量减少测量开销,同时兼具良好的扩展性,并能保护用户隐私。
4.常用的ip地址定位算法根据时延与地理距离之间的线性关系来估测主机位置,并通过拓扑信息来减小定位误差。传统的基准点信息的获取主要通过网页爬取、购买运营商ip地址分配数据、whois信息提取等,但由于互联网拓扑的多变,采集或购买到的基准点信息准确率和可信度较低,无法满足ip定位的需求。


技术实现要素:

5.本发明实施例提供一种ip定位基准点提取方法、装置及可读存储介质,用以利用被动流量提取的手段获取高质量、高精度、高可信度的基准点信息,形成基准点库,为ip地址位置测量提供基准点信息支撑。
6.第一方面,本发明实施例提供一种ip定位基准点提取方法,包括:
7.获取网络流量;
8.过滤所述网络流量,以保留目标协议的流量数据;
9.基于所述目标协议的流量数据确定基准点的ip地址;
10.基于所述基准点的ip地址来确定所述网络流量对应的位置信息;
11.基于所确定的位置信息建立基准点库。
12.在一些实施例中,基于所述目标协议的流量数据确定基准点的ip地址具体包括
13.基于所述目标协议的流量数据的五元组信息中提取源ip地址,作为基准点的ip地址。
14.在一些实施例中,还包括过滤所述网络流量,并保留http协议的流量数据。
15.在一些实施例中,基于所述基准点的ip地址来确定所述网络流量对应的位置信息包括:
16.基于所述http协议的流量数据的post请求或get请求中通过正则表达式匹配来确定经纬度信息;
17.基于所述经纬度信息来确定所述网络流量对应的位置信息。
18.在一些实施例中,基于所述http协议的流量数据的post请求或get请求中通过正则表达式匹配来确定经纬度信息包括:
19.在所述post请求或get请求中包含与所述经纬度信息相关的目标字段或目标字符的情况下,基于所述目标字段或目标字符来确定经纬度信息。
20.在一些实施例中,还包括基于其他渠道所确定的基准点融合信息来建立基准点库。
21.在一些实施例中,所述其他渠道所确定的基准点是根据其他渠道的基准点数据来确定的。
22.本发明实施例还提供一种ip定位基准点提取系统,包括处理器,被配置为:
23.获取网络流量;
24.过滤所述网络流量,以保留目标协议的流量数据;
25.基于所述目标协议的流量数据确定基准点的ip地址;
26.基于所述基准点的ip地址来确定所述网络流量对应的位置信息;
27.基于所确定的位置信息建立基准点库。
28.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的ip定位基准点提取方法的步骤。
29.本发明实施例过滤所述网络流量,以保留目标协议的流量数据,基于所述目标协议的流量数据确定基准点的ip地址,由此来提取位置信息建立基准点库,本发明利用被动流量提取的手段获取高质量、高精度、高可信度的基准点信息,形成基准点库。
30.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
31.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
32.图1为本公开实施例方法基本流程图;
33.图2为本公开实施例方法子流程图。
具体实施方式
34.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
35.应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
36.包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开
的原理。
37.通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本公开的这些和其它特性将会变得显而易见。
38.还应当理解,尽管已经参照一些具体实例对本公开进行了描述,但本领域技术人员能够确定地实现本公开的很多其它等效形式,它们具有如权利要求的特征并因此都位于借此所限定的保护范围内。
39.当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
40.此后参照附图描述本公开的具体实施例;然而,应当理解,所申请的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
41.本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
42.本发明实施例提供一种ip定位基准点提取方法,如图1所示,包括:
43.s101、获取网络流量;
44.示例性的,可以利用流量镜像、流量分光等手段获取某出口路由器的原始网络流量。
45.s102、过滤所述网络流量,以保留目标协议的流量数据;
46.本示例中可以对于不可能或小概率出现ip地理位置信息的流量进行过滤。流量过滤可以保留http流量,过滤掉其他协议流量。在互联网流量中,http协议中包含地理位置信息的可能性最大,主要由于大量基于地理位置信息的互联网应用需要将用户的经纬度坐标信息以请求的形式发送到应用服务器上进行处理,例如周边推荐服务、地图服务等。该流量中的经纬度坐标通常为应用终端的gps传感器采集的实时经纬度信息,而流量中的ip地址通常为用户真实的ip地址,因此具有较高的定位精度和可信度。例如可以在一些实施方式中过滤所述网络流量,并保留http协议的流量数据。由于对流量的解析和基准点发现需要耗费大量计算资源,因此本示例中对原始流量进行过滤,从而能够极大降低计算资源的消耗,从而提高计算的效率。
47.s103、基于所述目标协议的流量数据确定基准点的ip地址。
48.在过滤获得的http协议的流量数据中即可用于确定基准点的ip地址。
49.最后即可s104、基于所述基准点的ip地址来确定所述网络流量对应的位置信息,并在步骤s105中可以基于所确定的位置信息建立基准点库。
50.本发明实施例过滤所述网络流量,以保留目标协议的流量数据,基于所述目标协议的流量数据确定基准点的ip地址,由此来提取位置信息建立基准点库,本发明利用被动流量提取的手段获取高质量、高精度、高可信度的基准点信息,形成基准点库。
51.在一些实施例中,基于所述目标协议的流量数据确定基准点的ip地址具体包括:基于所述目标协议的流量数据的五元组信息中提取源ip地址,作为基准点的ip地址。示例性的,可以从http协议的流量数据的五元组信息中提取源ip地址作为基准点的ip地址。
52.在一些实施例中,基于所述基准点的ip地址来确定所述网络流量对应的位置信息包括:基于所述http协议的流量数据的post请求或get请求中通过正则表达式匹配来确定经纬度信息;基于所述经纬度信息来确定所述网络流量对应的位置信息。在一些实施例中,基于所述http协议的流量数据的post请求或get请求中通过正则表达式匹配来确定经纬度信息包括:在所述post请求或get请求中包含与所述经纬度信息相关的目标字段或目标字符的情况下,基于所述目标字段或目标字符来确定经纬度信息。例如基于地理位置信息的网络应用可以将用户终端的地理位置信息通过http的post或get方法向应用服务器明文传输,可以在post或get请求中通过正则表达式匹配的手段发现经纬度信息。由于该请求的编码方式取决于应用服务开发者的命名习惯,因此没有普遍试用的规则识别出所有的经纬度信息,本实施例方法提出如下解决方法:
53.情况一、出现经纬度关键词
54.当post或get请求中出现“longitude=”和“latitude=”等字段时,通过匹配关键词和后面的数值,可以发现地理位置信息。类似的关键词还有“lon=”和“lat=”等。
55.情况二、出现符合条件的数字
56.post或get请求中可能并没有出现关键词,但出现了符合经纬度条件的数字,例如出现了“x=113.18”和“y=26.98”。当上下文中同时出现两组数字,均在-180至180之间,则将其作为经纬度信息提取出来。
57.最后可以将基准点信息入库,例如可以将识别出的ip地址信息和经纬度信息写入数据库,作为基准点数据。
58.在一些实施例中,还包括基于其他渠道所确定的基准点融合信息来建立基准点库。在一些实施例中,所述其他渠道所确定的基准点是根据其他渠道的基准点数据来确定的。通过被动流量获取的基准点数据库规模有限,因此作为基准点库建设的补充手段,如图2所示,本示例中还可以与其他渠道获得的基准点数据进行融合。然后再执行ip地址定位测量,ip地址定位系统使用基准点发起测量任务,估算ip地址的真实地理位置,将地理位置写入ip地理位置信息库。
59.与现有技术相比,本发明提出的方法获取了高质量、高精度、高可信度的基准点信息,形成基准点库,为ip地址位置测量提供基准点信息支撑。本发明方法对原始流量进行过滤,对于不可能或小概率出现ip地理位置信息的流量进行过滤,只保留可能出现地理位置信息的流量,避免了对流量的解析和基准点发现需要耗费的大量计算资源。本发明方法可以利用更少的计算资源,达到更高效的技术成果。
60.本发明实施例还提供一种ip定位基准点提取系统,包括处理器,被配置为:获取网络流量;过滤所述网络流量,以保留目标协议的流量数据;基于所述目标协议的流量数据确定基准点的ip地址;基于所述基准点的ip地址来确定所述网络流量对应的位置信息;基于所确定的额位置信息建立基准点库。
61.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的ip定位基准点提取方法的步骤。
62.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而
且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
63.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
64.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
65.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献