一种基于异构图的个性化兴趣点推荐方法及系统与流程

2022-03-23 07:06:29 来源：中国专利 TAG：

1.本发明属于兴趣点推荐技术领域，具体涉及一种基于异构图的个性化兴趣点推荐方法及系统。

背景技术：

2.随着移动设备和无线网络的迅速发展，各种各样的基于位置的社交网络(location-based social networks，lbsns)，如微博，foursquare和yelp已经出现。兴趣点(point of interest，poi)推荐作为lbsn服务最受欢迎的应用之一，为用户提供访问地点的建议。与传统的电子商务推荐不同，poi推荐有其自身的特点。首先，poi推荐的目标是一个真实的地理位置，如餐厅或电影院，将用户的在线网络连接到现实世界。其次，传统的电子商务推荐通常利用用户的购买历史，而poi推荐则充分利用了用户的历史签到行为。
3.目前对poi推荐的研究虽然取得了很大的成果，用户个性化的poi推荐仍然面临挑战：如何利用有限的用户信息和位置信息提取更客观的特征以缓解poi推荐中的数据稀疏性；如何整合poi的相关内容特征，选择合适的学习模型，提取能够区分用户偏好的关键因素。以往的研究很少考虑用户在兴趣点所在地区的各种偏好。此外，大多数基于地理影响的研究没有考虑类别和人气的影响，而这两者实际上会影响签到行为。有效地整合这些主要方面仍然具有挑战性，但有助于改进poi推荐系统。

技术实现要素：

4.针对现有技术中存在的上述问题，本发明提供一种基于异构图的个性化兴趣点推荐方法及系统，充分利用用户签到序列，兴趣点类别、兴趣点流行度等内容来对用户进行个性化的兴趣点推荐。
5.本发明采用以下技术方案：
6.一种基于异构图的个性化兴趣点推荐方法，包括步骤：
7.s1、获取用户-兴趣点签到记录；
8.s2、基于用户-兴趣点签到记录，构建用户-兴趣点-时间异构子图以及用户-类别异构子图；
9.s3、基于用户-兴趣点-时间异构子图计算用户对于兴趣点的兴趣点偏好概率，基于用户-类别异构子图计算用户对于类别的类别偏好概率；
10.s4、基于用户-兴趣点签到记录计算用户对于兴趣点的一般签到概率，并基于一般签到概率计算兴趣点流行度；
11.s5、根据兴趣点的经纬度和签到记录，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率；
12.s6、基于兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率，预测用户对兴趣点的总体签到概率；
13.s7、基于总体签到概率，对用户进行兴趣点推荐。
14.作为优选方案，步骤s1中，用户-兴趣点签到记录信息f＝{ui,lj,ts,c
p
}；用户集合u＝{u1,u2,
…
un}；兴趣点集合l＝{l1,l2,
…
lm}；签到时间集合t＝{t1,t2,
…
tz}；类别集合c＝{c1,c2,
…cw
}；i＝1,2,3，...，n；j＝1,2,3，...，m；s＝1,2,3，...，z；p＝1,2,3，...，w。
15.作为优选方案，步骤s2中，用户-兴趣点-时间异构子图中节点为用户、兴趣点、时间，用户-类别异构子图中节点为用户、类别。
16.作为优选方案，步骤s3中，包括步骤：
17.s3.1、对于用户-兴趣点-时间异构子图、用户-类别异构子图中的每个节点，通过采样策略采样得到节点的近邻节点集合；
18.s3.2、将节点映射为embedding向量的映射函数；
19.s3.3、基于近邻节点集合、映射函数求解得到节点的近邻节点出现的概率公式；
20.s3.4、基于近邻节点出现的概率公式计算目标函数；
21.s3.5、基于目标函数得到各个节点的向量表示，包括用户向量兴趣点向量类别向量
22.s3.6、基于用户向量兴趣点向量计算兴趣点偏好概率，基于用户向量类别向量计算类别偏好概率。
23.作为优选方案，兴趣点偏好概率计算公式为：
[0024][0025]
score(ui,l)表示用户ui对于兴趣点l的兴趣点偏好概率，t表示转置；
[0026]
类别偏好概率计算公式为：
[0027][0028]
score(ui,c)表示用户ui对于类别c的类别偏好概率。
[0029]
作为优选方案，步骤s4中，用户ui在兴趣点l的一般签到概率计算公式为：
[0030][0031]
其中，代表用户ui在兴趣点l的签到频率，表示所有在用户集合中的用户在兴趣点l的签到频率。
[0032]
作为优选方案，步骤s4中，兴趣点l的流行度计算公式为：
[0033][0034]
作为优选方案，步骤s5中包括步骤：
[0035]
s5.1、计算用户的总签到次数；
[0036]
s5.2、初始化聚类半径∈、兴趣点聚类数；
[0037]
s5.3、输入用户的签到记录、聚类半径、一个聚类中拥有的最少兴趣点个数，计算得到兴趣点的聚类个数及兴趣点所在的聚类簇；
[0038]
s5.4、当兴趣点的聚类个数除以总签到次数小于预设阈值时，将∈ 0.1并且重复
步骤s5.3，否则转至步骤s5.5；
[0039]
s5.5、得到所有兴趣点所在的聚类簇，并基于兴趣点的经纬度计算用户对于每个聚类簇的访问中心；
[0040]
s5.6、基于计算得到的访问中心，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率。
[0041]
作为优选方案，步骤s6中：使用线性框架将兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率的影响结合，预测用户对兴趣点的总体签到概率；
[0042]
步骤s7中，具体为：将用户对所有兴趣点预测得到的总体签到概率进行排序，选择总体签到概率最高的兴趣点推荐给用户。
[0043]
还提供一种基于异构图的个性化兴趣点推荐系统，包括记录获取模块、子图构建模块、计算模块、推荐模块；计算模块包括第一计算单元、第二计算单元、第三计算单元、第四计算单元、第五计算单元；
[0044]
子图构建模块分别与记录获取模块、第一计算单元、第二计算单元连接，记录获取模块还分别与第三计算单元、第四计算单元连接，第一计算单元、第二计算单元、第三计算单元、第四计算单元分别与第五计算单元连接，第五计算单元还与推荐模块连接；
[0045]
记录获取模块，用于获取用户-兴趣点签到记录；
[0046]
子图构建模块，用于根据用户-兴趣点签到记录，构建用户-兴趣点-时间异构子图以及用户-类别异构子图；
[0047]
第一计算单元，用于根据用户-兴趣点-时间异构子图计算用户对于兴趣点的兴趣点偏好概率；
[0048]
第二计算单元，用于根据用户-类别异构子图计算得到用户对于类别的类别偏好概率；
[0049]
第三计算单元，用于根据用户-兴趣点签到记录计算用户对于兴趣点的一般签到概率，并基于一般签到概率计算兴趣点流行度；
[0050]
第四计算单元，用于根据兴趣点的经纬度和签到记录，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率；
[0051]
第五计算单元，用于根据兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率，预测用户对兴趣点的总体签到概率；
[0052]
推荐模块，用于根据总体签到概率，对用户进行兴趣点推荐。
[0053]
本发明的有益效果是：
[0054]
在推荐时综合考虑了用户偏好、用户类别偏好、兴趣点流行度、兴趣点之间的距离等重要因素。最后，设计线性融合框架将上述内容进行线性融合，预测用户对兴趣点的总体签到概率，基于总体签到概率，对用户进行兴趣点推荐，提高了兴趣点推荐的准确性。
附图说明
[0055]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0056]
图1是本发明所述一种基于异构图的个性化兴趣点推荐方法的流程图；
[0057]
图2是本发明所述一种基于异构图的个性化兴趣点推荐方法的框架图；
[0058]
图3是用户-兴趣点-时间异构子图和用户-类别异构子图；
[0059]
图4是用户、兴趣点、类别向量生成示意图；
[0060]
图5是本发明所述一种基于异构图的个性化兴趣点推荐系统的结构示意图。
具体实施方式
[0061]
以下通过特定的具体实施例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。
[0062]
实施例一：
[0063]
参照图1、2，本实施例提供一种基于异构图的个性化兴趣点推荐方法，包括步骤：
[0064]
s1、获取用户-兴趣点签到记录；
[0065]
s2、基于用户-兴趣点签到记录，构建用户-兴趣点-时间异构子图以及用户-类别异构子图；
[0066]
s3、基于用户-兴趣点-时间异构子图计算用户对于兴趣点的兴趣点偏好概率，基于用户-类别异构子图计算用户对于类别的类别偏好概率；
[0067]
s4、基于用户-兴趣点签到记录计算用户对于兴趣点的一般签到概率，并基于一般签到概率计算兴趣点流行度；
[0068]
s5、根据兴趣点的经纬度和签到记录，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率；
[0069]
s6、基于兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率，预测用户对兴趣点的总体签到概率；
[0070]
s7、基于总体签到概率，对用户进行兴趣点推荐。
[0071]
可见，本发明在推荐时综合考虑了用户偏好、用户类别偏好、兴趣点流行度、兴趣点之间的距离等重要因素。最后，将上述内容进行线性融合，预测用户对兴趣点的总体签到概率，基于总体签到概率，对用户进行兴趣点推荐，提高了兴趣点推荐的准确性。
[0072]
具体地：
[0073]
为叙述方便，定义相关符号如下：
[0074]
f＝{ui,lj,ts,c
p
}：用户-兴趣点签到记录信息；
[0075]
u＝{u1,u2,
…
un}：用户集合；
[0076]
l＝{l1,l2,
…
lm}：兴趣点集合；
[0077]
t＝{t1,t2,
…
tz}：签到时间集合；
[0078]
c＝{c1,c2,
…cw
}：类别集合；
[0079]
用户向量；
[0080]
兴趣点向量；
[0081]
类别向量；
[0082]
score(ui,l)：表示用户ui对于兴趣点l的兴趣点偏好概率；
[0083]
score(ui,c)：表示用户ui对于类别c的类别偏好概率；
[0084]
用户ui在兴趣点l的一般签到概率；
[0085]
兴趣点l的流行度；
[0086]
用户ui的兴趣点聚类簇集合；
[0087]
用户ui的兴趣点聚类簇访问中心集合；
[0088]
用户ui在簇ai的签到频率；
[0089]
待签到兴趣点l和簇ai的访问中心的距离；
[0090]
用户ui对于兴趣点l的地理位置偏好签到概率；
[0091]
用户ui对兴趣点l的总体签到概率。
[0092]
步骤s1中，用户-兴趣点签到记录信息f＝{ui,lj,ts,c
p
}；用户集合u＝{u1,u2,
…
un}；兴趣点集合l＝{l1,l2,
…
lm}；签到时间集合t＝{t1,t2,
…
tz}；类别集合c＝{c1,c2,
…cw
}；i＝1,2,3，...，n；j＝1,2,3，...，m；s＝1,2,3，...，z；p＝1,2,3，...，w。
[0093]
参照图3，步骤s2中，构建用户-兴趣点-时间异构子图，其中节点为用户、兴趣点和时间，若用户在某个时间点对某个兴趣点进行了访问，那么用户和这个兴趣点产生了用户兴趣点边及兴趣点时间边；构建用户-类别异构子图，其中节点为用户和类别，若用户对某个类别的兴趣点进行了访问，那么用户和这个类别产生了用户类别边。
[0094]
步骤s3中，计算用户对于兴趣点的兴趣点偏好概率和用户对于类别的类别偏好概率，其具体过程如下：
[0095]
对于用户-兴趣点-时间异构子图和用户-类别异构子图中的每个节点vi，ns(vi)为通过采样策略采样出的节点vi的近邻节点集合，采样策略依然延续了deepwalk算法，采用的是随机游走的方式获取节点的近邻序列，与随机游走稍有不同的是，这里采用的是一种有偏的随机游走。引入超参数p和q来控制随机游走的策略，假设随机游走节点vj来的的经过边(vj,vi)到达节点vi，节点vi的下一个访问顶点x的概率根据下面公式计算得：
[0096][0097]
其中，为下一个访问节点x和当前顶点vi的上一个顶点vj之间的距离，如果q较大，则顶点vi下一步游走倾向于访问节点vi上一步顶点近邻节点，构成了宽度游走策略，如果q较小，则顶点vi下一步游走倾向于访问节点vi上一步顶点距离远的节点，构成了深度游走策略；
[0098]
f(vi)为是将节点vi映射为embedding向量的映射函数,pro(ns(vi)|f(vi))为在给
定节点vi的情况下近邻节点集合ns(vi)出现的概率，v为图中的节点集合；利用node2vec算法计算用户向量和兴趣点向量node2vec优化的目标是给定每个节点条件下，令其近邻节点出现的概率最大，其公式如下所示：
[0099][0100]
假设给定源节点vi下，其近邻节点出现的概率与近邻集合中其余节点无关，通过引入朴素贝叶斯假设，那么pro(ns(vi)|f(vi))可表示成如下公式：
[0101][0102]
假设一个节点作为源节点和作为近邻节点的时候共享同一套嵌入向量，那么在给定节点vi的情况下，节点vj出现的概率为如下所示：
[0103][0104]
根据以上两个假设条件，最终的目标函数表示为如下公式：
[0105][0106]
其中为归一化因子，通过目标函数，可以得到各个节点的向量表示,用户向量表示为兴趣点向量表示为类别向量表示为
[0107]
将得到的用户向量兴趣点向量和类别向量利用cosine相似度函数计算用户ui对于兴趣点l的偏好和用户ui对于类别c的偏好，计算公式如下：
[0108][0109][0110]
score(ui,l)表示用户ui对于兴趣点l的兴趣点偏好概率，t表示转置；score(ui,c)表示用户ui对于类别c的类别偏好概率，上述过程可参照图4所示。
[0111]
步骤s4中，根据用户-兴趣点签到记录信息计算用户ui对于某个兴趣点l的一般签到概率，计算公式如下所示：
[0112][0113]
其中代表用户ui在兴趣点l的签到频率，表示所有在用户集合中的用户在兴趣点l的签到频率；通过用户对于某兴趣点的一般签到概率进一步计算兴趣点l的流行度计算公式如下所示：
[0114][0115]
步骤s5中，根据兴趣点的经纬度和签到记录，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率，具体过程如下：
[0116]
s5.1、对于用户集合中的每个用户ui，计算用户ui的总的签到次数，记为：
[0117]
s5.2、初始化聚类半径∈＝0.1，初始化兴趣点的聚类数clusternum＝0；
[0118]
s5.3、输入用户ui的签到记录、聚类半径∈、一个聚类中拥有的最少兴趣点个数minpts,利用dbscan算法将给定的兴趣点集合中所有兴趣点都被标记为“unvisited”，dbscan随机选择一个未访问的兴趣点p，标记p为“visited”，并检查p的∈-邻域是否至少包含minpts个对象。如果不是，则p被标记为噪声点。否则为p创建一个新的簇ai，并且把p的∈-邻域中所有对象都放在候选集合n中。dbscan迭代地把n中不属于其他簇的对象添加到ai中。在此过程中，对应n中标记为“unvisited”的对象p
′
,dbscan把它标记为“visited”，并且检查它的∈-邻域，如果p
′
的∈-邻域至少包含minpts个对象，则p
′
的∈-领域中的对象都被添加到n中。dbscan继续添加对象到ai，直到ai不能扩展，即直到n为空。此时簇ai完成生成，最后计算得到兴趣点的聚类个数clusternum及兴趣点所在的聚类簇；
[0119]
s5.4、当兴趣点的聚类个数clusternum除以小于某个阈值δ时，将∈ 0.1并且重复步骤s5.3，否则转步骤s5.5；
[0120]
s5.5、得到最终的用户ui的所有聚类簇进而得到用户ui对于每个聚类簇的访问中心对于每个聚类簇的访问中心其中的计算公式如下：
[0121][0122]
其中表示用户ui在兴趣点l的签到频率，表示用户ui在簇ai的签到频率，lat
l
表示兴趣点l的纬度，lon
l
表示兴趣点l的经度；
[0123]
s5.6、在地理位置影响下，计算用户ui对兴趣点l产生签到的地理位置偏好签到概率，其公式如下所示：
[0124][0125]
其中，表示用户ui在簇ai的签到频率，表示用户ui在各个簇的签到频率，表示待签到兴趣点l和簇ai的访问中心的距离，其计算公式如下所示：
[0126][0127]
其中，簇ai访问中心点的经度表示为纬度表示为
[0128]
步骤s6中：使用线性框架将兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率的影响结合，预测用户ui对兴趣点l的总体签到概率，其计算公式如下：
[0129][0130]
其中，α表示类别影响的相对重要性，β表示poi受欢迎程度的相对重要性，γ表示地理影响的相对重要性；
[0131]
步骤s7中，具体为：将用户对所有兴趣点预测得到的总体签到概率进行排序，选择总体签到概率最高的兴趣点推荐给用户。
[0132]
实施例二：
[0133]
参照图5，本实施例提供一种基于异构图的个性化兴趣点推荐系统，基于实施例一所述的推荐方法，包括记录获取模块、子图构建模块、计算模块、推荐模块；计算模块包括第一计算单元、第二计算单元、第三计算单元、第四计算单元、第五计算单元；
[0134]
子图构建模块分别与记录获取模块、第一计算单元、第二计算单元连接，记录获取模块还分别与第三计算单元、第四计算单元连接，第一计算单元、第二计算单元、第三计算单元、第四计算单元分别与第五计算单元连接，第五计算单元还与推荐模块连接；
[0135]
记录获取模块，用于获取用户-兴趣点签到记录；
[0136]
子图构建模块，用于根据用户-兴趣点签到记录，构建用户-兴趣点-时间异构子图以及用户-类别异构子图；
[0137]
第一计算单元，用于根据用户-兴趣点-时间异构子图计算用户对于兴趣点的兴趣点偏好概率；
[0138]
第二计算单元，用于根据用户-类别异构子图计算得到用户对于类别的类别偏好概率；
[0139]
第三计算单元，用于根据用户-兴趣点签到记录计算用户对于兴趣点的一般签到概率，并基于一般签到概率计算兴趣点流行度；
[0140]
第四计算单元，用于根据兴趣点的经纬度和签到记录，计算在地理位置偏好影响下用户对于兴趣点的地理位置偏好签到概率；
[0141]
第五计算单元，用于根据兴趣点偏好概率、类别偏好概率、兴趣点流行度、地理位置偏好签到概率，预测用户对兴趣点的总体签到概率；
[0142]
推荐模块，用于根据总体签到概率，对用户进行兴趣点推荐。
[0143]
需要说明的是，本实施例提供的一种基于异构图的个性化兴趣点推荐系统，与实施例一类似，在此不多做赘述。
[0144]
以上所述的实施例仅仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案作出的各种变形和改进，均应落入本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于懒加载提升安全大数据可视化响应的方法及装置与流程

一种基于异构图的个性化兴趣点推荐方法及系统与流程

相关文献

最热文献