一种基于浏览序列的相似物品推荐方法与流程

2021-10-24 07:16:00 来源：中国专利 TAG：序列社交物品特别方法

1.本发明涉及社交网络技术领域，特别涉及一种基于浏览序列的相似物品推荐方法。

背景技术：

2.近年来，推荐系统已经被研究者们广泛的研究并且成功应用于多个领域，例如电子商务、视频音频网站、个性化广告等。涉及到的推荐算法有协调过滤算法，基于内容的算法，内容识别的算法等等。现有的基于物质扩散的推荐算法不仅提高了推荐的效率同时提高了推荐结果的准确性和多样性。
3.与此同时，诸如facebook和twitter这两类社交网络在近几年飞速发展，网络用户数量成指数级增长。由于社交网络的兴起，人们的相互活动不在受时间和空间的影响，交互也越来越频繁。社交网站为从事复杂网络方向的研究者们提供了大量的真实数据，研究者们也开始将社交网络与推荐系统相结合，利用社交网络的特性来为用户提供个性化的物品推荐。
4.人类购物行为中，有三种理由可以解释用户为何选择了特定的物品。首先，是出于用户自身的兴趣；其次，是因为社会影响；最后，是因为周围朋友的影响。尤其是最后一种情况，得到了研究者们广泛的关注，纷纷开始研究如何定性及定量地权衡朋友间影响力的大小。
5.但是，上述的方法都是建立在我们能够捕获到用户间全部网络结构的前提下进行的，它们假设网络上的朋友因为存在边的关系所以会彼此影响。而在真实生活中，我们只能观察到在某个时刻某个用户做了某件事情，往往无法得到用户间准确及完备的网络关系结构。

技术实现要素：

6.针对上述问题，本发明提出一种基于浏览序列的相似物品推荐方法，以解决现有技术中存在的技术问题，能够通过用户的历史行为数据抽象出用户间的影响力大小，有效提高推荐记过的准确性，同时在短期预测中还能够得到更好的多样性指标。
7.为实现上述目的，本发明提供了如下方案：本发明提供一种基于浏览序列的相似物品推荐方法，包括以下步骤：
8.s1.获取用户购买物品的基础信息；
9.s2.通过所述基础信息获取用户购买物品的时间浏览序列；
10.s3.基于所述时间浏览序列构建用户间动态影响力模型；
11.s4.基于所述时间浏览序列对用户平均延迟时间系数进行计算，根据所述计算的结果更新所述用户间动态影响力模型；
12.s5.基于更新后的所述用户间动态影响力模型构建物质扩散网络，通过所述物质扩散网络完成相似物品的个性化推荐。
13.优选地，所述s3中的用户间动态影响力模型包括不考虑时间因素的影响力模型和考虑时间因素的影响力模型；所述用户间动态影响力模型通过影响力函数对用户之间的动态影响力进行衡量。
14.优选地，所述不考虑时间因素的影响力模型的影响力函数inf
j2i
具体为：
[0015][0016]
式中，a
j
表示用户u
j
购买的物品数量，a
j2i
表示用户u
i
跟随用户u
j
购买的物品数量。
[0017]
优选地，所述考虑时间因素的影响力模型的影响力函数inf
j2i’具体为：
[0018][0019]
式中，α为可调参数，α∈[0，1]；t
p
为预测时刻；t
jθ
为用户u
j
购买物品的时刻。
[0020]
优选地，所述s4中的用户平均延迟时间系数τ
j，i
具体为：
[0021][0022]
式中，a
j2i
表示用户u
i
跟随用户u
j
购买的物品数量；i
j2i
表示用户u
i
跟随用户u
j
购买的物品集合；t
iθ
和t
jθ
分别表示用户u
i
和用户u
j
购买物品的时刻。
[0023]
优选地，所述物质扩散网络采用将物质扩散算法与所述用户间动态影响力模型相结合的运算方法，完成相似人物的个性化推荐；所述物质扩散算法用于获取物品能量值。
[0024]
优选地，通过所述物质扩散算法获取所述物品能量值的具体过程为：先对用户所购买过的所有物品进行能量初始化；再将每个物品的能量平均分给所有购买的用户，每个用户的能量值为从所有购买的物品得到的能量值的总和；最后将每个用户的能量平均分给所述用户所有购买过的物品，物品能量值则是从所有用户收到的能量值的总和。
[0025]
优选地，所述能量初始化f
j
(u
i
)具体为：
[0026]
f
j
(u
i
)＝a
ij
，j＝1，2，
…
，n
[0027]
式中，u
i
表示用户；a
ij
表示用户u
i
是否购买过物品j，是等于1，否则等于0。
[0028]
优选地，最终所述物品的能量f
′
j
(u
i
)具体为：
[0029][0030]
式中，k(u
l
)表示用户u
l
已购买的物品数目；k(i
s
)表示物品i
s
被选购的次数；n表示物品的总数；m表示用户的总数；l表示某一个特定的用户；s表示某一个特定的物品；a
ls
表示用户u
l
是否购买过物品s，是等于1，否则等于0；a
lj
表示用户u
l
是否购买过物品j，是等于1，否则等于0。
[0031]
优选地，所述s5中获得的个性化推荐结果具体方法为：将所述用户间影响力模型的输出结果作为物质扩散网络的连边权重，对最终所述物品的能量进行排序，并根据所述排序结果进行相似物品的个性化推荐。
[0032]
本发明公开了以下技术效果：
[0033]
本发明能够通过用户的基础信息数据抽象出用户间的影响力大小，有效提高推荐
的准确性。
附图说明
[0034]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0035]
图1为本发明实施例中的方法流程图；
[0036]
图2为本发明实施例中物质扩散算法的方法示意图。
具体实施方式
[0037]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0038]
为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0039]
参照图1所示，本实施例提供一种基于浏览序列的相似物品推荐方法，包括以下步骤：
[0040]
s1.获取用户购买物品的基础信息；通过针对线上系统用户购买物品的日志数据进行处理，收集用户和物品的基本信息，以及用户和物品之间的行为信息。
[0041]
基础信息包括所有用户形成的集合u＝{u1，u2，
…
，u
m
}和所有物品形成的集合i＝{i1，i2，
…
，i
n
}；如果用户u
i
购买了物品i
q
，则a
iq
＝1，否则a
iq
＝0。
[0042]
s2.通过基础信息获取用户购买物品的时间浏览序列。
[0043]
用户购买物品的时间浏览序列：用户u
i
购买所有物品形成的时间集合为t
i
＝{t1，t2，
…
，t
m
}，若用户为购买过某个物品，则t等于负无穷大或者0。
[0044]
s3.基于时间浏览序列构建用户间动态影响力模型。
[0045]
用户之间的影响力是相互且有向的，以用户u
i
和u
j
为例，考虑用户u
j
对用户u
i
的影响力可以用两个因素来衡量：第一个是用户u
j
和用户u
i
共同购买的物品的数量num。第二个是用户跟随用户购买相同物品时的延迟时间δt。对于共同购买的物品i
θ
，只有t
jθ
＜t
iθ
时，用户u
j
才有可能对用户u
i
产生影响。可以直观的观察到，num越大或者δt越小，用户u
j
对用户u
i
的影响力就越大。
[0046]
用户间动态影响力模型包括不考虑时间因素的影响力模型和考虑时间因素的影响力模型；用户间动态影响力模型通过影响力函数对用户之间的动态影响力进行衡量。
[0047]
其中包括：
[0048]
a.不考虑时间因素的影响力模型：最基本的衡量用户间影响力发生的概率模型是bernoulli分布，发生概率利用公式p
j，i
衡量。
[0049]
[0050]
因此，不考虑时间因素的影响力模型的影响力函数inf
j2i
具体为：
[0051][0052]
式中，a
j
表示用户u
j
购买的物品数量，a
j2i
表示用户u
i
跟随用户u
j
购买的物品数量。
[0053]
b.考虑时间因素的影响力模型：用户间的影响力不可能是静态不变的，往往会随着时间改变。很多研究表明，这种影响力会随着时间成递减趋势。本发明将两个用户的购买物品时间集合按照购买物品的发生时间从前往后进行排序(剔除未购买过的记录)，假设这种递减趋势是服从指数分布的单调递减关系。
[0054]
因此，考虑时间因素的影响力模型的影响力函数inf
j2i
′
具体为：
[0055][0056]
式中，α为可调参数，α∈[0，1]；t
p
为预测时刻；t
jθ
为用户u
j
购买物品的时刻。当α＝0的时候，该公式回退到不考虑时间因素的影响力模型的影响力函数公式。
[0057]
s4.基于时间浏览序列对用户平均延迟时间系数进行计算，根据计算的结果更新用户间动态影响力模型。
[0058]
在s3中包含了一个可调参数α，如何确定α的大小是一件十分困难的事情。在真实生成环境中，如果有足够的前期运营数据，可以通过逐步增大的方式，在训练集中进行调优选取。为了应对没有足够数据的情况，本发明设计了一种基于用户间平均延迟时间系数的方式，来进行参数α的选取。
[0059]
将1/τ
j，i
来代替α，其中τ
j，i
表示用户u
i
跟随用户u
j
购买相同物品的期望延迟时间。影响力函数表示为：
[0060][0061]
因此，用户平均延迟时间系数τ
j，i
具体为：
[0062][0063]
式中，a
j2i
表示用户u
i
跟随用户u
j
购买的物品数量；i
j2i
表示用户u
i
跟随用户u
j
购买的物品集合；t
iθ
和t
jθ
分别表示用户u
i
和用户u
j
购买物品的时刻。
[0064]
物质扩散网络采用将物质扩散算法与用户间动态影响力模型相结合的运算方法，完成相似人物的个性化推荐；物质扩散算法用于获取物品能量值；所得能量为目标用户对该物品的兴趣值。
[0065]
物质扩散算法包括三部分，如图2所示：先对用户所购买过的所有物品进行能量初始化；再将每个物品的能量平均分给所有购买的用户，每个用户的能量值为从所有购买的物品得到的能量值的总和；最后将每个用户的能量平均分给用户所有购买过的物品，物品能量值则是从所有用户收到的能量值的总和。
[0066]
针对用户u
i
，能量初始化f
j
(u
i
)具体为：
[0067]
f
j
(u
i
)＝a
ij
，j＝1，2，
…
，n
[0068]
式中，u
i
表示用户；a
ij
表示用户u
i
是否购买过物品j，是等于1，否则等于0。
[0069]
最终物品的能量f
′
j
(u
i
)具体为：
[0070][0071]
式中，k(u
l
)表示用户u
l
已购买的物品数目；k(i
s
)表示物品i
s
被选购的次数；n表示物品的总数；m表示用户的总数；l表示某一个特定的用户；s表示某一个特定的物品；a
ls
表示用户u
l
是否购买过物品s，是等于1，否则等于0；a
lj
表示用户u
l
是否购买过物品j，是等于1，否则等于0。
[0072]
在上述算法中，假定用户u
j
会从第一次扩散中得到w大小的能量，由于它购买的物品数量为x，则在第二次扩散时，用户u
j
会把w份能量平分给它的邻居，每份能量为w/x。对于用户u
i
的两个朋友u
j
和u
w
，即使他们购买了相同的物品，但是对用户u
i
的影响结果和贡献度应该是不相同的。因此我们将每份能量作为第二次扩散时的新能力，来区别不同用户间的影响结果(第一次扩散的过程不变)。将用户间影响力作为连边权重进行赋值后，最终的能量向量可以表示为：
[0073][0074]
s5.基于更新后的用户间动态影响力模型构建物质扩散网络，通过物质扩散网络完成相似物品的个性化推荐。
[0075]
获得的个性化推荐结果具体方法为：将用户间影响力模型的输出结果作为物质扩散网络的连边权重，对最终物品的能量进行排序，并根据排序结果进行相似物品的个性化推荐。
[0076]
本发明公开了以下技术效果：
[0077]
本发明能够通过用户的基础信息数据抽象出用户间的影响力大小，有效提高物品推荐的准确性。
[0078]
最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种多芯片IGBT模块热安全运行域刻画方法与流程

一种基于浏览序列的相似物品推荐方法与流程

相关文献

最热文献