一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

实体关联处理方法、装置及电子设备与流程

2021-12-07 20:46:00 来源:中国专利 TAG:


1.本技术涉及互联网技术,尤其涉及一种实体关联处理方法、装置及电子设备。


背景技术:

2.随着互联网技术的不断发展,产生了基于互联网的商品销售方式。这种销售方式主要体现在线上线下结合,使用线上数据为线下零售场景赋能,通过线上用户画像、行为偏好数据,线下店可以为用户提供更加个性化的服务,通过线下店数据的反哺,线上用户画像偏好的刻画也可以更加精准。在基于互联网的商品销售场景中,如何将线上用户与线下实体基于位置进行关联,是一项重要的内容。示例性的,当需要完成某个线下门店的画像时,需要首先将该线下门店与线上用户基于位置进行关联,从而找到来该线下门店消费或者出现在该线下门店周边一定范围内的线上用户,利用这些线上用户的用户画像,确定出该线下门店的画像。
3.现有技术中,可以使用经纬度进行直接关联。具体的,当需要在一定范围内(例如1公里、3公里、5公里等)寻找关联的用户实体或者门店等位置实体时,首先使用城市信息关联缩写计算范围,进而,通过经纬度距离计算公式直接计算得出一定范围内的关联用户实体或者位置实体。
4.但是,使用现有技术的方法会导致计算的时效性较差。


技术实现要素:

5.本技术提供一种实体关联处理方法、装置及电子设备,用于解决现有技术中使用经纬度计算实体关联所导致的计算时效性较差的问题。
6.第一方面,本技术提供一种实体关联处理方法,包括:
7.获取第一实体的地理编码和第二实体的地理编码,所述第一实体的地理编码基于所述第一实体的经纬度信息得到,所述第二实体的地理编码预先基于所述第二实体的经纬度信息得到。
8.根据所述第一实体的地理编码以及用户指示的所述第一实体的关联范围,确定覆盖所述关联范围的目标地理编码集合,所述目标地理编码集合中包括多个地理编码。
9.确定所述第二实体的地理编码是否属于所述目标地理编码集合。
10.若所述第二实体的地理编码属于所述目标地理编码集合,则根据所述第一实体的经纬度信息以及所述第二实体的经纬度信息确定所述第一实体与所述第二实体是否关联。
11.在一种可能的实现方式中,所述根据所述第一实体的地理编码以及用户指示的关联范围,确定所述第一实体在所述关联范围内的目标地理编码集合,包括:
12.根据所述第一实体的地理编码以及所述关联范围,确定初始地理编码。
13.对所述初始地理编码进行扩展,得到所述目标地理编码集合,所述目标地理编码集合中各地理编码所覆盖的区域范围之和大于或等于所述关联范围。
14.在一种可能的实现方式中,所述对所述初始地理编码进行扩展,得到所述目标地
理编码集合,包括:
15.将所述初始地理编码加入所述目标地理编码集合。
16.循环执行下述步骤,直至所述目标地理编码集合中各地理编码所覆盖的区域范围大于或等于所述关联范围。
17.从所述初始地理编码的邻域地理编码中选择至少一个扩展地理编码,分别将每个所述扩展地理编码作为新的地理初始编码,并将所述扩展地理编码加入所述目标地理编码集合。
18.在一种可能的实现方式中,所述从所述初始地理编码的邻域地理编码中选择至少一个扩展地理编码,包括:
19.从所述初始地理编码的邻域地理编码中选择预设数量的扩展地理编码,所述预设数量小于所述邻域地理编码的数量。
20.在一种可能的实现方式中,所述根据所述第一实体的地理编码以及所述关联范围,确定初始地理编码,包括:
21.根据所述关联范围,从所述第一实体的地理编码中选择预设位数的编码,作为所述初始地理编码,所述预设位数小于所述第一实体的地理编码的位数。
22.在一种可能的实现方式中,所述获取第一实体的地理编码和第二实体的地理编码之前,还包括:
23.根据所述第一实体的经纬度信息,确定所述第一实体的地理编码。
24.根据所述第二实体的经纬度信息,确定所述第二实体的地理编码。
25.在一种可能的实现方式中,所述根据所述第一实体的经纬度信息,确定所述第一实体的地理编码,包括:
26.对所述第一实体的经纬度信息进行编码转换,得到所述第一实体的地理编码。
27.在一种可能的实现方式中,所述据所述第一实体的经纬度信息以及所述第二实体的经纬度信息确定所述第一实体与所述第二实体是否关联,包括:
28.根据所述第一实体的经纬度信息以及所述第二实体的经纬度信息,确定所述第一实体和所述第二实体之间的距离。
29.若所述第一实体和所述第二实体之间的距离小于或等于所述关联范围所表征的距离,则确定所述第一实体和所述第二实体关联。
30.在一种可能的实现方式中,所述方法还包括:
31.若所述第一实体和所述第二实体关联,则根据所述第二实体的实体画像确定所述第一实体的实体画像。
32.第二方面,本技术提供一种实体关联处理装置,包括:
33.获取模块,用于获取第一实体的地理编码和第二实体的地理编码,所述第一实体的地理编码基于所述第一实体的经纬度信息得到,所述第二实体的地理编码预先基于所述第二实体的经纬度信息得到。
34.处理模块,用于根据所述第一实体的地理编码以及用户指示的所述第一实体的关联范围,确定覆盖所述关联范围的目标地理编码集合,所述目标地理编码集合中包括多个地理编码;以及,确定所述第二实体的地理编码是否属于所述目标地理编码集合;以及,若所述第二实体的地理编码属于所述目标地理编码集合,则根据所述第一实体的经纬度信息
以及所述第二实体的经纬度信息确定所述第一实体与所述第二实体是否关联。
35.在一种可能的实现方式中,所述处理模块具体用于:
36.根据所述第一实体的地理编码以及所述关联范围,确定初始地理编码;对所述初始地理编码进行扩展,得到所述目标地理编码集合,所述目标地理编码集合中各地理编码所覆盖的区域范围之和大于或等于所述关联范围。
37.在一种可能的实现方式中,所述处理模块具体用于:
38.将所述初始地理编码加入所述目标地理编码集合;循环执行下述步骤,直至所述目标地理编码集合中各地理编码所覆盖的区域范围大于或等于所述关联范围:从所述初始地理编码的邻域地理编码中选择至少一个扩展地理编码,分别将每个所述扩展地理编码作为新的地理初始编码,并将所述扩展地理编码加入所述目标地理编码集合。
39.在一种可能的实现方式中,所述处理模块具体用于:
40.从所述初始地理编码的邻域地理编码中选择预设数量的扩展地理编码,所述预设数量小于所述邻域地理编码的数量。
41.在一种可能的实现方式中,所述处理模块具体用于:
42.根据所述关联范围,从所述第一实体的地理编码中选择预设位数的编码,作为所述初始地理编码,所述预设位数小于所述第一实体的地理编码的位数。
43.在一种可能的实现方式中,所述处理模块还用于:
44.根据所述第一实体的经纬度信息,确定所述第一实体的地理编码。
45.根据所述第二实体的经纬度信息,确定所述第二实体的地理编码。
46.在一种可能的实现方式中,所述处理模块具体用于:
47.对所述第一实体的经纬度信息进行编码转换,得到所述第一实体的地理编码。
48.在一种可能的实现方式中,所述处理模块具体用于:
49.根据所述第一实体的经纬度信息以及所述第二实体的经纬度信息,确定所述第一实体和所述第二实体之间的距离;若所述第一实体和所述第二实体之间的距离小于或等于所述关联范围所表征的距离,则确定所述第一实体和所述第二实体关联。
50.在一种可能的实现方式中,所述处理模块具体用于:
51.若所述第一实体和所述第二实体关联,则根据所述第二实体的实体画像确定所述第一实体的实体画像。
52.第三方面,本技术提供一种电子设备,包括:
53.存储器,用于存储程序指令。
54.处理器,用于调用并执行所述存储器中的程序指令,执行上述第一方面所述的方法步骤。
55.第四方面,本技术提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行上述第一方面所述的方法。
56.本技术所提供的实体关联处理方法、装置及电子设备,基于预先计算得到的地理编码,仅需要执行生成目标地理编码集合以及地理编码比较这些简单的计算,即可筛选出在关联范围内的所有第二实体,进一步的,针对这些筛选出的第二实体,可以基于经纬度信息精确判断出其是否与第一实体关联。由于筛选出的在关联范围内的所有第二实体的数据量级相比于现有技术中的所有用户有了极大降低,因此,在基于经纬度信息判断是否与第
一实体关联时所需的计算量相比于现有技术也可以得到极大降低。因此,通过本技术能够极大降低计算量,保证时效性,还能够极大减少资源的消耗,同时,还能够保证所确定的关联结果的准确性。
附图说明
57.为了更清楚地说明本技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
58.图1为位置实体画像的场景示意图;
59.图2为本技术实施例提供的实体关联处理方法的流程示意图;
60.图3为geohash编码方式的示意图;
61.图4为本技术实施例提供的实体关联处理方法的流程示意图;
62.图5为对初始地理编码按照邻域地理编码扩展的示例图;
63.图6为本技术实施例提供的一种实体关联处理装置的模块结构图;
64.图7为本技术实施例提供的一种电子设备700的结构示意图。
具体实施方式
65.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
66.现有技术中可以使用经纬度进行实体之间的直接关联。具体的,当需要在一定范围内(例如1公里、3公里、5公里等)寻找关联的用户实体或者位置实体时,首先使用城市信息关联缩写计算范围,进而,通过经纬度距离计算公式直接计算得出一定范围内的关联用户实体或者位置实体。
67.在实际的应用场景中,用户实体的数据量可能达到亿级,位置实体的数据量可能达到百万级,在通过城市首先关联后,在城市内部基于经纬度距离计算公式进行计算时,采用的是笛卡尔积的方式,这种方式会导致出现数据倾斜,从而导致计算的时效性较差。另外,在某些大型城市中,人口和设施均较多,因此采集到的位置实体和用户实体数据较多,采用笛卡尔积计算产生的中间数据过大,对于资源消耗过多,计算成本过高。
68.考虑到现有技术中直接基于经纬度距离计算公式计算实体之间的关联所导致的计算的时效性较差以及资源消耗过多、计算成本过高的问题,本技术实施例首先基于实体的地理编码筛选出候选的关联实体,进而再对候选的关联实体利用经纬度信息确定准确的关联关系,从而能够显著降低计算量,提升计算的时效性,同时还能够保证关联结果的准确性。
69.本技术实施例的方法可以应用在位置实体画像、线下门店选址评估、用户画像等场景中。以下以位置实体画像和线下门店选址评估这两种场景为例进行说明。
70.图1为位置实体画像的场景示意图,如图1所示,对位于某个固定地理位置上的某
个线下门店,可以基于来该门店消费的用户的画像以及经常出现在门店周围3公里之内的用户的画像来生成该门店的画像。在该场景下,可以使用本技术实施例的方案,确定出到该门店消费的用户以及出现在该门店周围3公里之内的用户,即确定与该门店关联的用户。在确定出这些关联的用户之后,再基于这些用户的画像生成该门店的画像。
71.在线下门店选址评估的场景中,对位于某个固定地理位置上待评估的地址,可以根据该地址周围5公里之内的人流量来评估该地址是否适合作为线下门店。在该场景下,可以使用本技术实施例的方案,确定出该地址周围5公里之内的用户,即确定与该地址关联的用户。在确定出这些关联的用户之后,再对这些用户的数量、消费类型等进行统计分析,根据统计分析的结果评估是否适合作为线下门店的地址。
72.图2为本技术实施例提供的实体关联处理方法的流程示意图,该方法的执行主体可以为具有计算处理能力的电子设备,例如服务器。如图2所示,该方法包括:
73.s201、获取第一实体的地理编码和第二实体的地理编码,所述第一实体的地理编码基于所述第一实体的经纬度信息得到,所述第二实体的地理编码预先基于所述第二实体的经纬度信息得到。
74.可选的,上述第一实体和上述第二实体可以为任何类型的实体。示例性的,第一实体为位置实体、第二实体为用户实体;或者,第一实体为位置实体、第二实体为位置实体;或者,第一实体为用户实体,第二实体为位置实体。
75.本技术实施例中,用户实体可以指线上用户,用户实体的信息可以通过用户在线上的操作过程获得。示例性的,用户登录线上平台时,获取用户当时所在的位置,该位置可以作为用户实体的信息。位置还实体可以指线下实体,例如门店、医院、小区等。
76.本技术实施例中,第一实体可以是本技术应用场景中的处理对象,例如上述位置实体画像场景中的线下门店,以及上述线下门店选址评估场景中的线下门店。上述第二实体是需要将其与第一实体进行关联处理以判断其是否与第一实体关联的实体。因此,将本技术应用于前述的各种场景中时,第一实体保持不变,不断变换第二实体,以判断各第二实体是否与第一实体关联。
77.在执行本步骤之前,可以预先基于第一实体的经纬度信息和第二实体的经纬度信息得到第一实体的地理编码和第二实体的地理编码。该过程可以提前预先批量执行。示例性的,每天统计使用某线上平台的用户的经纬度信息,并对统计到的这些用户批量执行上述过程,得到所有用户的地理编码。该过程可以独立于某个应用场景来执行,例如每天均执行该过程。当某个场景下需要确定实体的关联关系时,可以直接使用实体的地理编码,而不需要在该场景下基于经纬度信息获取地理编码。进而,在执行本技术实施例时,可以将所有用户均作为上述第二实体,逐一确定每个用户是否与第一实体关联,或者,也可以首先按照城市对所有用户进行筛选,将属于某个城市的用户作为第二实体,逐一确定这些第二实体是否与第一实体关联。
78.可选的,第一实体的地理编码和第二实体的地理编码可以分别为geohash编码。
79.s202、根据上述第一实体的地理编码以及用户指示的该第一实体的关联范围,确定第一实体在该关联范围内的目标地理编码集合,该目标地理编码集合中包括多个地理编码。
80.其中,上述用户指示的第一实体的关联范围用于指示与第一实体关联的用户所属
的范围。此处的“用户”是指在具体的应用场景中负责完成该场景下的业务的用户。示例性的,在上述位置实体画像场景中,“用户”可以值负责完成为止实体画像的用户。用户指示一个关联范围,例如3公里,则表明用户希望确定出线下门店周围3公里范围内的用户。
81.如上所述,预先可以得到例如某个城市的所有用户的地理编码,而用户指示的例如3公里这一关联范围后,表明用户希望找到在第一实体周围3公里范围内的用户。本技术即是基于第一实体的地理编码和用户所指示的例如3公里这一关联范围,判断某个线上用户,即第二实体,是否是属于第一实体周围3公里范围内的线上用户,如果是,则表明该线上用户与第一实体是否关联。
82.可选的,实体的地理编码可以表示实体所在的一个特定大小的地理区域。本技术实施例以下均以geohash编码为例说明本技术的方案,但是,应理解,本技术还可以使用其他利用一维编码标识特定大小的地理区域的编码。
83.图3为geohash编码方式的示意图,如图3所示,假设某城市中包括9个矩形区域,每个区域可以分别具有一个特定的geohash编码,例如为图3所示例的wx4er、wx4g2、wx4g3等。以wx4er对应的矩形区域为例,该矩形区域内的所有点,即所有的经纬度坐标共享wx4er这一编码。geohash编码的字符串长度可以根据需要灵活选择,字符串长度越长,能够表示的区域范围越小,即越精确。示例性的,5位的编码能够表示10平方公里范围的矩形区域,6位的编码能够表示约0.34平方公里的矩形区域。
84.本步骤中,基于第一实体的地理编码和用户所指示的第一实体的关联范围,可以确定出能够覆盖该关联范围的目标地理编码集合。具体的,该集合中包括多个地理编码,这些地理编码所代表的区域拼接起来形成的区域,能够覆盖该关联范围。
85.s203、确定上述第二实体的地理编码是否属于上述目标地理编码集合。
86.如上所述,目标地理编码集合中包括了多个地理编码,在确定上述第二实体的地理编码是否属于上述目标地理编码集合时,可以将第二实体的地理编码分别与集合中的各地理编码进行字符串比较,如果第二实体的地理编码与集合中某个地理编码的字符串相同,则可以确定第二实体的地理编码属于目标地理编码集合。
87.值得说明的是,在基于第一实体的地理编码确定目标地理编码集合时,可能是按照下述实施例中所述的,从第一实体的地理编码中选择预设位数的编码进行扩展并得到目标地理编码集合的,在这种情况下,目标地理编码集合中的地理编码均包括预设位数。相应的,在确定第二实体的地理编码是否属于上述目标地理编码集合时,可以确定第二实体的地理编码中的预设位数的编码是否属于上述目标地理编码集合。例如,目标地理编码集合中的地理编码为12位geohash编码中的前6位编码,则可以获取第二实体的地理编码中的前6位编码,如果该前6位编码与目标地理编码集合中某个地理编码相同,则确定第二实体的地理编码属于目标地理编码集合。
88.s204、若第二实体的地理编码属于目标地理编码集合,则根据第一实体的经纬度信息以及第二实体的经纬度信息确定第一实体与第二实体是否关联。
89.目标地理编码集合中包括多个地理编码,每个地理编码可以代表一个矩形区域,而用户所指示的第一实体的关联范围是指第一实体周围的圆形范围,因此,当目标地理编码集合覆盖该关联范围时,实际上已经超出该关联范围,因此,可能存在某个第二实体属于目标地理编码集合的范围但是已经超出了上述关联范围,因此,本步骤中,基于第一实体经
纬度信息和第二实体的经纬度信息,可以更加准确地确定第二实体是否为上述关联范围内的实体,即确定第二实体是否与第一实体关联。
90.上述步骤s201-s204说明了确定第一实体与一个第二实体是否关联的过程。在具体的应用场景下,可能需要确定第一实体与百万级的第二实体是否关联,如果使用现有技术中直接利用经纬度信息进行距离计算的方式来确定,会由于庞大的计算量导致时效性差以及资源浪费等问题。
91.而在本实施例中,基于预先计算得到的地理编码,仅需要执行生成目标地理编码集合以及地理编码比较这些简单的计算,即可筛选出在关联范围内的所有第二实体,进一步的,针对这些筛选出的第二实体,可以基于经纬度信息精确判断出其是否与第一实体关联。由于筛选出的在关联范围内的所有第二实体的数据量级相比于现有技术中的所有用户有了极大降低,因此,在基于经纬度信息判断是否与第一实体关联时所需的计算量相比于现有技术也可以得到极大降低。因此,通过本实施例能够极大降低计算量,保证时效性,还能够极大减少资源的消耗,同时,还能够保证所确定的关联结果的准确性。
92.图4为本技术实施例提供的实体关联处理方法的流程示意图,如图4所示,上述步骤s202中确定覆盖目标地理编码集合的一种可选方式包括:
93.s401、根据上述第一实体的地理编码以及上述关联范围,确定初始地理编码。
94.以地理编码为geohash编码为例,基于经纬度信息所得到的geohash编码可以为12位的哈希码。如前所述,地理编码的位数越多,表示的范围越小,位数越少,表示的范围越大。本实施例最终得到的目标地理编码集合是由初始地理编码扩展而来的,因此,需要选择合适的初始地理编码的大小,以避免由于初始地理编码位数过多所导致的扩展过程中需要计算的邻域地理编码过多,目标地理编码集合过大,同时,避免由于初始地理编码位数过少所导致的编码覆盖范围过大、误差过大。
95.基于上述的考虑,作为一种可选的实施方式,可以基于上述关联范围,从第一实体的地理编码中选择预设位数的编码,作为上述初始地理编码。其中,该预设位数小于第一实体的地理编码的位数。
96.可选的,上述预设位数的编码是连续位数的编码。例如,12位geohash编码中的前6位编码。
97.示例性的,如果关联范围较大,则可以选择位数较少的编码作为初始地理编码。如果关联范围较小,则可以选择位数较多的编码作为初始地理编码。
98.通过这种方式,可以选择出合理的适用于该场景的初始地理编码,可以降低后续运算的复杂度。
99.s402、对上述初始地理编码进行扩展,得到上述目标地理编码集合,该目标地理编码集合中各地理编码所覆盖的区域范围之和大于或等于所述关联范围。
100.对初始地理编码进行扩展,所得到的目标地理编码集合中,是以初始地理编码为中心。初始地理编码可以代表第一实体的位置,因此,通过对初始地理编码的扩展,得到以初始地理编码为中心的目标地理编码集合,即得到了第一实体为中心的覆盖上述关联范围的地理区域。
101.以下说明上述步骤s402中对初始地理编码扩展得到目标地理编码集合的一种可选方式。
102.可选的,可以通过循环处理方式扩展得到上述目标地理编码集合。
103.首先,将上述初始地理编码加入目标地理编码集合。
104.进而,循环执行下述步骤,直至目标地理编码集合中各地理编码所覆盖的区域范围大于或等于上述关联范围:
105.从上述初始地理编码的邻域地理编码中选择至少一个扩展地理编码,分别将每个扩展地理编码作为新的初始地理编码,并将扩展地理编码加入目标地理编码集合。
106.在本实施例执行之前,目标地理编码集合可以为空集,本实施例执行时,首先将初始地理编码加入目标地理编码集合中。进而,不断扩展初始地理编码并作为新的初始地理编码,对每个新的初始地理编码继续扩展,在此过程中,每当扩展得到扩展地理编码时,均将这些扩展得到的地理编码加入目标地理编码集合中,当目标地理集合中的地理编码拼接起来所代表的区域范围已经大于或等于关联范围时,不再进行扩展。
107.其中,上述的初始地理编码的邻域地理编码是指以该初始地理编码对应的地理区域为中心所构造的区域。
108.图5为对初始地理编码按照邻域地理编码扩展的示例图,如图5所述,假设初始地理编码为编码0,则编码1、编码2、编码3、编码4、编码5、编码6、编码7和编码8均为编码0的邻域编码。
109.应理解,初始地理编码对应的地理区域的邻域为邻域地理编码所对应的地理区域。
110.以循环过程中的某一次循环为例,在从本次循环的初始地理编码的邻域地理编码中选择扩展地理编码时,可以选择全部的邻域地理编码作为扩展地理编码,或者,也可以选择部分邻域地理编码作为扩展地理编码。
111.作为一种可选的实施方式,可以从上述初始地理编码的邻域地理编码中选择预设数量的扩展地理编码,该预设数量小于所述邻域地理编码的数量。
112.在该可选的实施方式中,继续参照图5,假设初始地理编码为编码0,则其全部的邻域地理编码包括:编码1、编码2、编码3、编码4、编码5、编码6、编码7和编码8,即共有8个邻域地理编码,可以从该8个邻域地理编码中选择4个邻域地理编码(具体为:编码1、编码3、编码5、编码7)作为扩展地理编码,再继续以该4个扩展地理编码分别作为新的初始地理编码进行扩展。
113.通过从全部的邻域地理编码中选择一部分预设数量的编码作为扩展地理编码,可以使得邻域扩展时的计算量达到极大减少,同时,这些预设数量的编码所代表的区域范围仍然能够表示预期的区域范围,因此,这种处理方式在极大减少计算量的同时还不会对计算结果的准确性造成影响。
114.以下说明在在上述步骤s201之前,基于实体的经纬度信息得到实体的地理编码的过程。
115.值得说明的是,具体实施时,基于实体的经纬度信息得到实体的地理编码可以是大规模批量执行的。以下实施例仅以第一实体和第二实体为例进行说明。
116.可选的,可以根据第一实体的经纬度信息,确定第一实体的地理编码,并且,根据第二实体的经纬度信息,确定第二实体的地理编码。
117.以第一实体为例,可以对第一实体的经纬度信息进行编码转换,得到第一实体的
地理编码。
118.具体的,实体的经纬度信息为二维数据,通过对该二维数据进行映射,可以得到一维的地理编码。以地理编码为前述的geohash编码为例,地理编码可以为一个字符串,对该字符串进行存储和计算,可以极大降低存储量和计算量。
119.可选的,在根据实体的经纬度信息得到实体的地理编码之前,可以首先采集实体的经纬度信息。
120.一种示例中,对于用户实体,经纬度信息获取方式为:首先根据用户浏览线上平台等时设备采集的经纬度信息,根据经纬度分布和用户浏览时间分布将经纬度信息进行分类。用户浏览时间分布划分使用上午九点至晚上七点为工作时间,晚上九点至第二天上午八点为在家时间,去除异常值后,采用聚类方法将两个阶段的经纬度进行聚类,并得到簇中心经纬度坐标,以此得到用户的居住地经纬度信息和工作地经纬度信息。在使用时,可以根据实际场景的需要选择居住地经纬度信息和/或工作地经纬度信息。对于位置实体,经纬度信息获取方式可以为:通过地图爬取技术,离线获取并解析,或者,还可以由特定应用场景中的业务方直接提供。
121.图6为本技术实施例提供的一种实体关联处理装置的模块结构图,如图6所示,该装置包括:
122.获取模块601,用于获取第一实体的地理编码和第二实体的地理编码,所述第一实体的地理编码基于所述第一实体的经纬度信息得到,所述第二实体的地理编码预先基于所述第二实体的经纬度信息得到。
123.处理模块602,用于根据所述第一实体的地理编码以及用户指示的所述第一实体的关联范围,确定覆盖所述关联范围的目标地理编码集合,所述目标地理编码集合中包括多个地理编码;以及,确定所述第二实体的地理编码是否属于所述目标地理编码集合;以及,若所述第二实体的地理编码属于所述目标地理编码集合,则根据所述第一实体的经纬度信息以及所述第二实体的经纬度信息确定所述第一实体与所述第二实体是否关联。
124.在一种可选的实施方式中,处理模块602具体用于:
125.根据所述第一实体的地理编码以及所述关联范围,确定初始地理编码;对所述初始地理编码进行扩展,得到所述目标地理编码集合,所述目标地理编码集合中各地理编码所覆盖的区域范围之和大于或等于所述关联范围。
126.在一种可选的实施方式中,处理模块602具体用于:
127.将所述初始地理编码加入所述目标地理编码集合;循环执行下述步骤,直至所述目标地理编码集合中各地理编码所覆盖的区域范围大于或等于所述关联范围:从所述初始地理编码的邻域地理编码中选择至少一个扩展地理编码,分别将每个所述扩展地理编码作为新的地理初始编码,并将所述扩展地理编码加入所述目标地理编码集合。
128.在一种可选的实施方式中,处理模块602具体用于:
129.从所述初始地理编码的邻域地理编码中选择预设数量的扩展地理编码,所述预设数量小于所述邻域地理编码的数量。
130.在一种可选的实施方式中,处理模块602具体用于:
131.根据所述关联范围,从所述第一实体的地理编码中选择预设位数的编码,作为所述初始地理编码,所述预设位数小于所述第一实体的地理编码的位数。
132.在一种可选的实施方式中,处理模块602还用于:
133.根据所述第一实体的经纬度信息,确定所述第一实体的地理编码;根据所述第二实体的经纬度信息,确定所述第二实体的地理编码。
134.在一种可选的实施方式中,处理模块602具体用于:
135.对所述第一实体的经纬度信息进行编码转换,得到所述第一实体的地理编码。
136.在一种可选的实施方式中,处理模块602具体用于:
137.根据所述第一实体的经纬度信息以及所述第二实体的经纬度信息,确定所述第一实体和所述第二实体之间的距离;若所述第一实体和所述第二实体之间的距离小于或等于所述关联范围所表征的距离,则确定所述第一实体和所述第二实体关联。
138.在一种可选的实施方式中,处理模块602具体用于:
139.若所述第一实体和所述第二实体关联,则根据所述第二实体的实体画像确定所述第一实体的实体画像。
140.本技术实施例提供的实体关联处理装置,可以执行上述方法实施例中的方法步骤,其实现原理和技术效果类似,在此不再赘述。
141.需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
142.例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,asic),或,一个或多个微处理器(digital signal processor,dsp),或,一个或者多个现场可编程门阵列(field programmable gate array,fpga)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(central processing unit,cpu)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,soc)的形式实现。
143.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或
数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
144.图7为本技术实施例提供的一种电子设备700的结构示意图。如图7所示,该电子设备可以包括:处理器71、存储器72、通信接口73和系统总线74,所述存储器72和所述通信接口73通过所述系统总线74与所述处理器71连接并完成相互间的通信,所述存储器72用于存储计算机执行指令,所述通信接口73用于和其他设备进行通信,所述处理器71执行所述计算机程序时实现如上述图2至图5所示实施例的方案。
145.该图7中提到的系统总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。所述系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
146.上述的处理器可以是通用处理器,包括中央处理器cpu、网络处理器(network processor,np)等;还可以是数字信号处理器dsp、专用集成电路asic、现场可编程门阵列fpga或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
147.可选的,本技术实施例还提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述图2至图5所示实施例的方法。
148.可选的,本技术实施例还提供一种运行指令的芯片,所述芯片用于执行上述图2至图5所示实施例的方法。
149.本技术实施例还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在存储介质中,至少一个处理器可以从所述存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序时可实现上述图2至图5所示实施例的方法。
150.在本技术实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
151.可以理解的是,在本技术实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本技术实施例的范围。
152.可以理解的是,在本技术的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
153.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽
管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献