一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多级匹配的兴趣激活新闻推荐方法及系统与流程

2022-03-19 22:36:48 来源:中国专利 TAG:


1.本发明属于新闻的个性化推荐技术领域,尤其涉及一种基于多级匹配的兴趣激活新闻推荐方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.新闻推荐作为推荐系统研究领域的一个重要分支,旨在通过新闻内容和用户信息尽可能多的帮助用户找到与用户兴趣偏好相匹配的新闻。个性化的新闻推荐对帮助用户找到自己感兴趣的新闻、缓解信息过载至关重要。随着基于人工神经网络的深度学习取得了巨大的进步,人们开始尝试利用经典的神经网络架构处理新闻推荐问题。它们通常对每条新闻进行词嵌入获得新闻的表示,然后通过整合用户浏览过的历史新闻来学习每个用户的综合兴趣表示,最后,将该综合向量表示与候选新闻向量匹配来执行推荐。
4.虽然基于深度学习的方法在新闻推荐上取得了一定的成功,但是,也存在着一定的问题。由于新闻的重要语义特征隐含在不同粒度的文本片段中,然而现有的一些深度学习方法,将学习到的固定用户特征表示只有在最后一步才能与候选新闻匹配,缺乏文本对词语之间的交互,造成的信息损失难以衡量。此外,固定的向量也不能充分表达用户的不同兴趣。


技术实现要素:

5.为了解决上述背景技术中存在的技术问题,本发明提供一种基于多级匹配的兴趣激活新闻推荐方法及系统,在考虑候选新闻的情况下,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步加强用户的兴趣表示,增强了预测用户浏览每个候选新闻的概率的鲁棒性和可解释性。
6.为了实现上述目的,本发明采用如下技术方案:
7.本发明的第一个方面提供一种基于多级匹配的兴趣激活新闻推荐方法,其包括:
8.获取候选新闻和用户历史点击新闻,分别进行新闻编码,得到候选新闻表示和用户历史点击新闻表示;
9.基于用户历史点击新闻表示,获得用户全局兴趣特征;
10.基于候选新闻表示和用户历史点击新闻表示,采用目标注意力机制来计算每个用户历史点击新闻和每个候选新闻之间的注意力得分,使用注意力得分对用户历史点击新闻进行加权计算,获得用户动态兴趣特征;
11.基于候选新闻表示和用户历史点击新闻表示,在多个不同的相似度水平上捕捉被点击新闻和候选新闻在语义上的相关性,获得不同层次的每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征;
12.联合用户全局兴趣特征、动态兴趣特征和局部兴趣匹配排名特征,预测用户浏览
每个候选新闻的概率,基于预测概率向用户推荐候选新闻。
13.进一步的,所述新闻编码的具体步骤为:
14.获取新闻的标题;
15.使用新闻标题构建向量表示,得到新闻标题的单词向量序列;
16.将新闻标题单词向量序列输入卷积神经网络,得到上下文单词表示向量的序列;
17.将上下文单词表示向量的序列输入单词级注意力网络,得到新闻的最终表示。
18.进一步的,所述局部兴趣匹配排名特征的获取步骤为:
19.基于候选新闻表示和用户历史点击新闻表示,计算关联矩阵;
20.将关联矩阵使用高斯核函数池化,将关联矩阵中的单词交互转换成候选新闻的初步匹配排名特征;
21.基于候选新闻的初步匹配排名特征,应用卷积神经网络与最大池化函数得到每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征。
22.进一步的,所述预测用户浏览每个候选新闻的概率的具体步骤为:
23.基于所述用户全局兴趣特征、动态兴趣特征和候选新闻表示,计算基于用户全局兴趣的匹配分数和基于动态兴趣的匹配分数;
24.基于所述局部兴趣匹配排名特征,计算局部兴趣匹配分数;
25.联合基于用户全局兴趣的匹配分数、基于动态兴趣的匹配分数和局部兴趣匹配分数,计算用户浏览每个候选新闻的概率。
26.进一步的,所述基于用户全局兴趣的匹配分数为所述用户全局兴趣特征和候选新闻表示的内积。
27.进一步的,所述基于动态兴趣的匹配分数为所述动态兴趣特征和候选新闻表示的内积。
28.进一步的,所述用户全局兴趣特征为用户历史点击新闻表示的加权和。
29.本发明的第二个方面提供一种基于多级匹配的兴趣激活新闻推荐系统,其包括:
30.新闻编码模块,其被配置为:获取候选新闻和用户历史点击新闻,分别进行新闻编码,得到候选新闻表示和用户历史点击新闻表示;
31.用户编码模块,其被配置为:基于用户历史点击新闻表示,获得用户全局兴趣特征;
32.目标感知兴趣激活模块,其被配置为:基于候选新闻表示和用户历史点击新闻表示,采用目标注意力机制来计算每个用户历史点击新闻和每个候选新闻之间的注意力得分,使用注意力得分对用户历史点击新闻进行加权计算,获得用户动态兴趣特征;
33.多级匹配交互模块,其被配置为:基于候选新闻表示和用户历史点击新闻表示,在多个不同的相似度水平上捕捉被点击新闻和候选新闻在语义上的相关性,获得不同层次的每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征;
34.概率预测模块,其被配置为:联合用户全局兴趣特征、动态兴趣特征和局部兴趣匹配排名特征,预测用户浏览每个候选新闻的概率,基于预测概率向用户推荐候选新闻。
35.本发明的第三个方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的一种基于多级匹配的兴趣激活新闻推荐方法中的步骤。
36.本发明的第四个方面提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的一种基于多级匹配的兴趣激活新闻推荐方法中的步骤。
37.与现有技术相比,本发明的有益效果是:
38.本发明提供了一种基于多级匹配的兴趣激活新闻推荐方法,其通过多级匹配交互,保留文本的细粒度信息。从多个不同的相似度水平上对文本词对进行建模,使得编码表达的用户兴趣信息更加丰富。
39.本发明提供了一种基于多级匹配的兴趣激活新闻推荐方法,其提出基于候选新闻的注意力网络机制,能够自适应地激活不同用户对不同候选新闻的兴趣,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步加强了用户的兴趣表示,大大提高了模型的表现力。
40.本发明提供了一种基于多级匹配的兴趣激活新闻推荐方法,其有效分配每个模块得分的权重,有效的融合基于用户全局兴趣的匹配分数、基于动态兴趣的匹配分数、不同相似度水平的兴趣匹配分数,使模型能够更好的进行融合,从而在准确性和速度之间提供了改进的折衷。
附图说明
41.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
42.图1是本发明实施例一的一种基于多级匹配的兴趣激活新闻推荐方法流程图;
43.图2是本发明实施例一的一个用户新闻的阅读行为的示例图;
44.图3是本发明实施例一的全局用户兴趣编码示意图;
45.图4是本发明实施例一的目标感知动态兴趣激活示意图;
46.图5是本发明实施例一的高斯径向基函数核的变化情况图。
具体实施方式
47.下面结合附图与实施例对本发明作进一步说明。
48.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
49.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
50.实施例一
51.如图1所示,本实施例提供了一种基于多级匹配的兴趣激活新闻推荐方法,提出一种基于多级匹配的兴趣激活新闻推荐模型miar,将获取的候选新闻和用户历史点击新闻输入到该模型中,可以得到用户浏览每个候选新闻的概率,以解决新闻推荐点击预测问题。与先前工作将用户兴趣建模成单一固定的向量匹配候选新闻不同,本发明意识到用户的兴趣
通常是多样化和多粒度的,静态向量并不能充分表达出用户的兴趣;此外,融合成的用户兴趣向量会丢失文本细节的匹配信息;于是,通过目标感知注意网络机制,在考虑候选新闻的情况下,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步丰富用户的兴趣表示;此外,通过多级匹配交互模块,在多个不同的相似度水平上对文本词对进行建模,获取不同相似度水平的兴趣匹配信息;然后,通过卷积神经网络识别高阶显著信息;最后,,有效分配不同模块的得分的权重,使模型能够更好的进行融合,从而在准确性和速度之间提供了改进的折衷。本发明在mind真实的新闻数据集上进行了广泛的实验,结果表明与基线模型相比,miar模型在性能指标取得了实质性的提高,验证了该模型在新闻推荐方面的有效性。
52.如图2所示,为一个用户新闻的阅读行为的例子,该用户有各种兴趣,包括减肥、宠物、电器安全、体育问题,其中,粗体显示的文本片段是关键的语义线索。不同的历史浏览新闻可以揭示用户对不同主题或事件的兴趣。d1和d2历史新闻的主题分别是与“宠物狗”和“减肥”相关。自然的,它们提供了关键线索来选择候选新闻c1和c2。但是,它们之间的文本匹配片段粒度不同,如“dog”—“golden retriever”,“lose weight”—“lose 100pounds”;挖掘与用户兴趣相关的信息对提高用户兴趣多样性特征至关重要。从相关性匹配的角度考虑,d3历史点击新闻应该匹配候选新闻c3,它们是非常相关的,都反映了冬天设备的安全使用问题。如果将用户之前点击的不同历史新闻聚合成一个用户向量进行匹配,这种方法可能会造成文本词对间的软匹配信号丢失。即丢失了不同水平相似度的文本词对匹配信息。如“hand warmers”—“the little sun”之间的匹配。除此之外,用户点击过的历史新闻通常很丰富,用户的兴趣多种多样。若用一个固定大小的嵌入向量来表示用户的综合兴趣特征,固定大小的向量虽代表单个用户的所有兴趣,但是无法动态表达用户的不同兴趣。这会一定程度上限制推荐模型的表达能力。若是扩大该固定长度向量的维度来提高兴趣特征,可能会引起过度拟合的风险并降低模型的性能。然而,本发明观察到没有必要将所有用户兴趣嵌入到一个向量中,比如用户阅读的历史新闻中存在与以下语义线索相关的新闻(梅西,宠物狗,减肥),如果向用户推荐的新闻中出现金毛犬的线索,本发明会关注用户对宠物狗的兴趣,而不是减肥。因此,用户的不同兴趣可以在给出候选项目的情况下被具体激活。
53.如图1所述,本发明的一种基于多级匹配的兴趣激活新闻推荐方法,主要有两部分组成:局部表示匹配部分(左)与分布式匹配部分(右),该方法含有的两个部分包含以下几个主要的步骤,新闻编码、用户编码、目标感知兴趣激活、多级匹配交互以及计算用户点击候选新闻的概率的预测。
54.步骤1、如图1所示的新闻编码模块,获取候选新闻和用户的点击新闻,进行新闻编码。
55.步骤101、标题编码:获取用户的点击新闻以及候选新闻的标题,使用新闻标题构建向量表示,得到新闻标题单词向量序列。
56.(1)使用预先训练好的glove嵌入,用m个单词来表示新闻标题,得到新闻标题单词序列di=[w1,w2,

,wm],其中,m表示新闻标题中的单词数目;
[0057]
(2)通过一个词嵌入查找表将新闻标题单词序列转换成单词向量序列ew=[e1,e2,

,em],其中,v和d分别是词汇量和词嵌入维数。
[0058]
步骤102、将新闻标题单词向量序列输入卷积神经网络cnn,得到上下文单词表示
向量的序列。
[0059]
本发明使用cnn应用于新闻标题单词向量序列获得相应的嵌入,并使用最大池技术来保持最显著的特征。cnn是捕捉局部信息的有效神经架构,新闻中的上下文对于理解新闻语义非常重要。例如,“a man spent$2,100on an apple,but it was identified as a fake”。其中“apple”和“fake”这两个词的组合对理解该苹果为苹果手机而非水果非常重要。因此,本发明使用cnn通过捕捉单词的局部上下文来学习上下文单词表示,应用cnn之后的第i个单词表示为ci,其计算公式为:
[0060]ci
=relu(fw×e(i-k):(i k)
bw)
ꢀꢀꢀꢀꢀ
(1)
[0061]
其中,e(i-k):(i k)是从位置i-k到i k的单词嵌入的连接,和表示cnn过滤器的参数,nf是cnn过滤器的数量,2k 1是过滤器的窗口大小,relu用作激活的非线性函数,cnn层的输出是上下文单词表示向量的序列,表示为[c1,c2,

,cm]。
[0062]
步骤103、将上下文单词表示向量的序列输入单词级注意力网络,得到新闻的最终表示。
[0063]
不同的用户会有不同的兴趣,同时每个用户往往有多种兴趣。所以,不同的用户可能会因为新闻的不同方面而点击这个新闻。一个新闻标题中的不同单词往往会对用户产生不同的影响。因此,学习用户对每个单词的关注度有助于加强新闻的表示。本发明通过个性化注意力机制,得到新闻标题中的每个单词的嵌入权重αi,这些权重可以体现用户对每个单词的关注度,再将所有单词加权平均,得到新闻标题,即新闻的最终表示。
[0064][0065][0066]
其中,w
p
和b
p
是投影参数,qw是利用用户标识的嵌入作为单词注意力查询向量。
[0067]
将新闻编码器应用于用户所有的点击新闻,得到用户的点击新闻的表示[r1,r2,

,rn],其中,n为点击新闻数。
[0068]
将新闻编码器应用于候选新闻,得到用户的候选新闻的表示[r
′0,r
′1,

,r
′k],其中k 1为候选新闻数。
[0069]
步骤2、用户编码:基于用户的历史点击新闻的表示,采用个性化注意力机制,得到用户的全局兴趣特征。
[0070]
如图3所示,用户编码是从用户浏览的新闻中挖掘用户的兴趣表示,但是一个用户所浏览过的所有新闻并非都能反映他的偏好,并且同一个新闻对不同的用户的表示也是不同的,基于此,对用户点击的历史新闻也应用个性化注意力机制。
[0071][0072]
[0073]
其中,qd、bd、wd是新闻关注网络中的参数,α
′i是第i条新闻的关注权重表示。
[0074]
用户的全局兴趣特征为su,用户全局兴趣特征为用户历史点击新闻表示的加权和,通过它们的注意力权重来加权,即
[0075][0076]
步骤3、目标感知兴趣激活:基于候选新闻的表示和用户的历史点击新闻的表示,采用目标注意力机制来计算每个用户历史点击新闻和每个候选新闻之间的注意力得分,使用注意力得分对用户历史点击新闻进行加权计算,获得用户的动态兴趣特征。
[0077]
用户浏览过的历史新闻压缩成一个固定的表示向量会一定程度上限制用户的兴趣特征。简单来说,用户兴趣通常是多粒度的,固定大小的向量代表单个用户的所有兴趣,并不能动态表达不同的用户兴趣。此外,先前的工作仅使用用户点击的历史序列来捕获用户的兴趣,并没有考虑与候选新闻之间的联系。据此,本发明设计了一种基于候选新闻的注意力机制,该机制能够自适应地激活不同用户对不同候选新闻的兴趣,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步加强用户的兴趣表示,大大提高了模型的表现力。
[0078]
如图4所示,当得到每个候选新闻的嵌入向量,就开始构建候选目标嵌入,以自适应地考虑与候选新闻相关的用户兴趣。这里,将目标嵌入定义为所有要预测的候选新闻。通常,给定推荐的候选新闻只匹配用户的一部分兴趣。为了模拟这一过程,设计了一种新的目标注意力机制来计算用户历史点击新闻相对于每个候选新闻的软注意力分数。因此,引入了一个目标注意力机制来计算所有历史点击新闻ri和每个候选新闻r

t
之间的注意力得分。
[0079]
首先,将由一个参数共享的权重矩阵非线性变换应用于每个历史点击-候选新闻对;
[0080]
然后,使用softmax函数对自我关注得分进行标准化:
[0081][0082]
最后,基于用户的历史点击新闻序列,用户的动态兴趣特征由表示,如下所示:
[0083][0084]
所获得的用户动态兴趣特征因候选新闻嵌入的不同而不同。
[0085]
步骤4:多级匹配交互:基于候选新闻表示和用户历史点击新闻表示,获得每个候选新闻与用户历史点击新闻的在不同的相似度下的局部兴趣匹配排名特征。具体的,基于候选新闻表示和用户历史点击新闻表示,在多个不同的相似度水平上捕捉被点击新闻和候选新闻在语义上的相关性,获得不同层次的每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征。
[0086]
由于文本的多粒度的语义信息以及用户兴趣的多样性,单一的兴趣向量匹配候选新闻会丢失了文本蕴含的大量语义信息。用户点击新闻“谨防!暖手宝质量参差不齐引起安全隐患”,该新闻反应了冬天设备的安全使用问题。若按照现有的一些方法整合用户浏览过的历史新闻学习用户的综合表示,之后将该表示与候选新闻向量匹配计算预测得分,这丢失了细节的匹配信息。如候选新闻“小太阳简单便携,但潜在危险不容忽视”同样反应冬天设备的安全使用问题,但是得到较低的匹配分数。一方面由于学习到的用户特征只有在最后一步才能与候选新闻匹配,这使得文本词对之间缺乏信息交互,造成了细粒度的匹配信息丢失。另一方面,像“小太阳”和“暖手器”这样的匹配词对最终得分的贡献不大。它们的单词相似度处于不同的水平。在匹配中只有准确匹配的词语才会对结果产生较大的贡献,,这在处理新闻这种越来越趋于口语化的文本并不合理。本发明的多级匹配交互将从接下来的三个步骤来解决这个问题:
[0087]
步骤401、构造关联矩阵:基于候选新闻表示和用户历史点击新闻表示,计算关联矩阵。
[0088]
本发明不再是将cnn提取特征之后的词向量嵌入进行注意力加权聚合,而是构建关联矩阵m,m中的每个元素是标题词嵌入之间的相似度,公式如下:
[0089][0090]
其中,是第k个候选新闻标题的第i个词嵌入,是第n个历史点击新闻标题的第j个词嵌入。
[0091]
步骤402、核函数池化与获取软匹配特征:将得到的关联矩阵m使用高斯核函数池化,将关联矩阵中的单词交互转换成候选新闻的初步匹配排名特征φ(m):
[0092]
获取软匹配特征:
[0093][0094]
核函数池化:
[0095][0096]
其中,将k个核应用于关联矩阵的候选新闻的每一个单词对应的行,将其汇总成一个k维特征向量。每个候选新闻词的特征向量的对数和形成候选新闻排序特征向量φ。
[0097]
的效果取决于核函数的使用,它的工作使用高斯径向基函数核(rbf)
[0098][0099]
其中,μk为核函数中心,为m
ijn,k
和μk的平方欧几里得距离,随着两个向量的距离增大,高斯核函数单调递减。因为rbf核函数的值随距离增大而减小,并介于0(极限)和1(当m
ijk,n
=μk的时候)之间。kk通过计算单词对的相似性越接近它的平均μk,它的
值就越大。使用rbf内核的内核池化是对现有池化技术的推广。如图5所示,可以看出当σ比较大时,此时向量m
ijk,n-μk之间距离的变化对指数整体数值的影响就会变小,曲线比较平滑。当σ

∞时,内核池函数退化为均值池函数。同理,当σ比较小时,向量m
ijn,k-μk之间距离的变化对指数整体数值的影响变大了,那么高斯核函数对两点之间的距离就会很敏感。即μ=1和σ

0产生的内核只响应精确的匹配。否则,不同的内核关注不同的相似度水平,例如,μ=0.8的内核计算与新闻候选词相似度接近0.8的历史点击新闻中文档词的数量。例如,新闻候选词热水袋与暖手宝,小太阳等词语之间的相似度匹配。即在不同的相似度水平上,分别计算新闻标题内各个词的软词频(soft-tf),之后将各词的软词频加和得到用于排序的特征。
[0100]
步骤403、学习显著特征表示:基于候选新闻的初步匹配排名特征,应用卷积神经网络与最大池化函数得到每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征。
[0101]
基于反向传播中收到的梯度,内核将单词对的相似度拉近它的μ以增加其soft-tf计数,或将单词对相似度远离μ以减少soft-tf计数。在局部表示中,单词嵌入由glove初始化,并由内核进行训练,以提供有效的软匹配模式。词向量嵌入基于接收到的梯度并相应地更新。每个内核关注一组属于某个相似范围的词对,这个相似范围的重要性由模型学习。新的匹配模式被发现,将一些词对从接近于零的相似性移到了重要的核中。直观地,将学习到的词嵌入匹配形成多级soft-tf模式,将相关的新闻给找出来。学习到的嵌入参数用于记忆这些信息。之后采用1d-cnn和最大池化神经网络来识别组合出整个历史点击序列中与候选新闻匹配的较强显著信号作为用户和候选新闻之间的最终匹配向量。经过卷积之后的第k个候选新闻与历史点击新闻的不同相似度下的局部兴趣匹配排名特征表示为其计算公式为:
[0102][0103]
其中,和bh表示cnn过滤器的参数,relu用作激活的非线性函数。
[0104]
步骤5、点击预测:根据候选新闻的表示来预测用户浏览候选新闻的概率。联合用户全局兴趣特征、动态兴趣特征和不同相似度下的局部兴趣匹配排名特征,预测用户浏览每个候选新闻的概率。
[0105]
在分布式匹配中,候选新闻的全局兴趣匹配分数由候选新闻和用户全局兴趣特征的内积计算,基于动态兴趣的匹配分数为动态兴趣特征和所述候选新闻表示的内积,分别对用户编码与目标感知兴趣机制得到的用户兴趣表示跟候选新闻嵌入进行匹配,得到基于用户全局兴趣的匹配分数和基于候选新闻激活的动态兴趣匹配分数公式如下:
[0106][0107][0108]
基于局部兴趣匹配排名特征,计算不同相似度水平推导的局部兴趣匹配分数;在局部表示匹配中,推荐是基于根据候选新闻文章在印象中被用户点击的概率对其进行排名
而做出的,局部兴趣匹配分数为
[0109][0110]
其中,w
l
和b
l
为学习参数,为第i个候选新闻与历史点击新闻匹配的最终排名特征表示。
[0111]
最后,聚合不同方法的得分,将三个不同方法的匹配分数合计为总体匹配分数(即,用户浏览每个候选新闻的概率):
[0112][0113]
其中,λ,η是控制不同方法兴趣分数相对重要性的超参数,λ η《1。
[0114]
由于正面和负面新闻样本的数量是高度不平衡的。因此,在模型训练中应用负采样技术联合k 1新闻预测点击评分。k 1新闻由一个用户的正样本和随机选择的一个用户的负样本组成。共同预测正面新闻和k个负面新闻的预测得分。这样,将新闻点击预测问题转化为伪k 1分类任务。使用softmax对这些匹配分数进行归一化,以计算正样本的匹配分数,模型训练方法中的损失函数是所有正样本负对数似然,如下所示:
[0115][0116]
其中,y

表示第i条正面新闻的总体匹配分数,y
j-表示与第i条正面新闻处于同一时段的第j条负面新闻的总体匹配分数,s是正训练样本的集合。
[0117]
步骤6、基于预测概率向用户推荐候选新闻,选取预测概率较高的候选新闻,向用户推荐。
[0118]
本发明由两个独立的特征学习部分组成,一个使用局部表示部分捕获文本对词语之间的多级软匹配信号来实现不同相似度水平的新闻之间的匹配;另一个使用分布式表示部分动态的激活新闻兴趣特征。在局部表示部分中,构建每个新闻文章的表示,之后将用户候选新闻与历史点击新闻匹配形成词语之间的关联矩阵。在关联矩阵上应用多级匹配交互,使用多个不同的核函数在多种相似度水平上捕获软匹配信号,得到不同通道下的每个新闻的匹配得分。其通道表示不同相似度水平下的用户与候选新闻匹配的相关程度。最后,使用卷积神经网络识别出更高级别的显著信号来预测用户点击候选新闻的概率;在分布表示部分中,结合cnn网络以及注意力机制学习新闻标题的上下文表示,不再仅使用一个固定大小的嵌入向量来代表用户的所有兴趣,而是添加了一种新的目标注意网络,根据候选新闻动态的激活用户兴趣,从而加强用户的兴趣表示。这两个部分作为miar的一部分被联合训练。另外,新闻推荐中一个常见的观察是,大多数用户通常只点击曝光序列中显示的几条新闻。因此,正面和负面新闻样本的数量是高度不平衡的。本发明使用的mind数据集的一个重要特点是类别不均衡,正样本率很低只有4%。因此,本发明在模型训练过程中,联合k 1条新闻应用负采样技术预测点击评分。即新闻由一个用户的正样本和随机选择的一个用户
的负样本组成。之后,共同预测正面新闻和个负面新闻。
[0119]
本发明考虑到候选新闻的广泛性和用户的兴趣的多样性,单一的固定向量很难精确建模并且限制了推荐模型的表示能力。与先前工作将用户点击的历史新闻抽象成固定用户兴趣向量匹配候选新闻不同,本发明的模型联合了多级匹配交互,保留文本的细粒度信息。从多个不同的相似度水平上对文本词对进行建模,使得编码表达的用户兴趣信息更加丰富。
[0120]
此外,本发明意识到用户不同阶段的浏览新闻序列可以体现用户的兴趣变化,静态向量并不能充分表达出用户的兴趣。据此,设计了一种基于候选新闻的注意力网络,能够自适应地激活不同用户对不同候选新闻的兴趣,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步加强用户的兴趣表示,大大提高了模型的表现力。最后,有效的融合不同模块的得分的权重,从而在准确性和速度之间提供了改进的折衷。实验结果表明,在mind真实的新闻数据集上的进行了实验,验证了本发明的模型的有效性。此外,通过案例分析,目标注意力网络模块还增强了点击预测的鲁棒性和可解释性。
[0121]
实施例二
[0122]
本实施例提供了一种基于多级匹配的兴趣激活新闻推荐系统,其具体包括如下模块:
[0123]
本发明的一种基于多级匹配的兴趣激活新闻推荐系统,主要有两部分组成:局部表示匹配模块与分布式匹配模块,该系统含有的两个核心模块包含以下几个主要的组件:新闻编码模块、用户编码模块、目标感知兴趣激活模块、多级匹配交互模块以及计算用户点击候选新闻的概率的预测模块。
[0124]
新闻编码模块,其被配置为:获取候选新闻和用户历史点击新闻,分别进行新闻编码,得到候选新闻表示和用户历史点击新闻表示;
[0125]
用户编码模块,其被配置为:基于用户历史点击新闻表示,获得用户全局兴趣特征;
[0126]
目标感知兴趣激活模块,其被配置为:基于候选新闻表示和用户历史点击新闻表示,采用目标注意力机制来计算每个用户历史点击新闻和每个候选新闻之间的注意力得分,使用注意力得分对用户历史点击新闻进行加权计算,获得用户动态兴趣特征;
[0127]
多级匹配交互模块,其被配置为:基于候选新闻表示和用户历史点击新闻表示,在多个不同的相似度水平上捕捉被点击新闻和候选新闻在语义上的相关性,获得不同层次的每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征;
[0128]
概率预测模块,其被配置为:联合用户全局兴趣特征、动态兴趣特征和局部兴趣匹配排名特征,预测用户浏览每个候选新闻的概率,基于预测概率向用户推荐候选新闻。
[0129]
此处需要说明的是,本实施例中的各个模块与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
[0130]
实施例三
[0131]
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的一种基于多级匹配的兴趣激活新闻推荐方法中的步骤。
[0132]
实施例四
[0133]
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的一种基于多级匹配的兴趣激活新闻推荐方法中的步骤。
[0134]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0135]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0136]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0137]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0138]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random accessmemory,ram)等。
[0139]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献