一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种媒体内容推荐方法、装置、电子设备及存储介质与流程

2022-03-19 20:51:17 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,尤其涉及一种媒体内容推荐方法、装置、电子设备及存储介质。


背景技术:

2.推荐系统是一种信息过滤系统,能根据用户的档案或者历史行为记录,学习出用户的兴趣爱好,预测出用户对给定物品的评分或偏好,改变了平台与用户的沟通方式,加强了平台和用户之间的交互性,为用户推荐可能感兴趣的作品。目前,推荐系统广泛应用于电商平台、新闻软件、音乐软件以及短视频等领域。
3.以短视频的推荐系统为例,推荐过程主要分为召回和排序两个阶段,召回阶段是从数以百万计的视频池中捞取数千个用户可能感兴趣的视频;排序阶段根据用户的兴趣偏好对召回的视频进行排序,然后将得分最高的若干个视频推送给用户。
4.其中,召回阶段能否从海量视频池中召回用户感兴趣的内容决定了推荐效果的上限。召回阶段使用的召回算法一般通过分析用户的历史行为数据,推断出用户对哪些视频感兴趣,然后将相似的视频推荐给用户。
5.协同过滤算法是最经典也是应用最多的一种召回算法。协同过滤算法的核心点是如何根据用户的历史行为计算视频间的相似度。提高视频相似度的准确率,就可以提升推荐效果。
6.然而,目前常用的协同过滤算法例如common neighbors算法、adamic/adar算法和swing算法,其中common neighbors和adamic/adar算法的优点是算法复杂度低、容易实时训练、召回率高,缺点是准确率较差;而swing算法的优点是准确率高,缺点是算法复杂度高、不容易实时训练、召回率低;可见,目前常用的协同过滤算法均很难权衡准确率和计算复杂度的关系;此外,目前常用的协同过滤算法缺少针对个性化用户的召回方式,容易推荐热门视频,不能为不同的用户提供个性化的视频推荐。


技术实现要素:

7.本公开提供一种媒体内容推荐方法、装置、电子设备及存储介质,对热门媒体内容降权,可以提高推荐的准确率,且复杂度低、实时效果好。本公开的技术方案如下:
8.根据本公开实施例的第一方面,提供一种媒体内容推荐方法,包括:
9.响应于目标用户账户的媒体内容推荐请求,确定目标用户账户的偏好媒体内容以及偏好媒体内容对应的多个第一媒体内容;第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容;
10.从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标;
11.基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容;
12.向目标用户账户发送目标媒体内容。
13.可选的,方法还包括按照预设周期执行以下步骤:
14.获取访问推荐系统的各个用户账户在当前周期内操作过的媒体内容;
15.针对当前周期内被同一用户账户连续操作的第二媒体内容和第三媒体内容:根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标;其中,第三媒体内容是在第二媒体内容之后被用户账户操作的;
16.将第二媒体内容和第三媒体内容之间的相关性指标存储于预设存储区域。
17.可选的,共现用户账户的历史操作数据包括共现用户账户在预设历史时间段内操作过的媒体内容的数量;
18.根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标,包括:
19.获取在预设历史时间段内访问过推荐系统的第一用户账户数量,以及在预设历史时间段内操作过第三媒体内容的第二用户账户数量;
20.根据第一用户账户数量和第二用户账户数量确定第一参数值;第一参数值表征第三媒体内容的热门程度;
21.根据每个共现用户账户在预设历史时间段内操作过的媒体内容的数量确定第二参数值;
22.对第三媒体内容的用户历史操作信息中不同类型的操作行为进行加权求和,得到第三参数值;
23.基于第一参数值、第二参数值和第三参数值,确定第二媒体内容与第三媒体内容之间的相关性指标。
24.可选的,第二媒体内容与第三媒体内容之间的相关性指标与第二参数值负相关,第二媒体内容与第三媒体内容之间的相关性指标分别与第一参数值、第三参数值正相关。
25.可选的,当前周期的上一个周期内确定的第二媒体内容与第三媒体内容之间的相关性指标为第一相关性指标时,方法还包括:
26.若当前周期内确定第二媒体内容和第三媒体内容之间的相关性指标为第二相关性指标,则使用第二相关性指标替换第一相关性指标;
27.或者;
28.若当前周期内不存在第二媒体内容与第三媒体内容之间的相关性指标时,则将第一相关性指标以指数衰减的方式进行降权得到更新后的第一相关性指标。
29.可选的,当预设存储区域中第二媒体内容和第三媒体内容之间的相关性指标低于预设值时,将低于预设值的相关性指标删除。
30.可选的,基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容,包括:
31.对偏好媒体内容与各第一媒体内容之间的相关性指标进行排序,将满足预设条件的第一媒体内容确定为待推荐的目标媒体内容;
32.其中,预设条件包括相关性指标大于等于阈值或者前n个排名位数。
33.可选的,偏好媒体内容是指被目标用户账户执行过正向操作的媒体内容;
34.其中,正向操作包括点赞操作、关注操作、评论操作和播放时长大于预设时长的播放操作中的任意一个或者多个的组合。
35.根据本公开实施例的第二方面,提供一种媒体内容推荐装置,包括:
36.第一确定模块,被配置为执行响应于目标用户账户的媒体内容推荐请求,确定目标用户账户的偏好媒体内容以及偏好媒体内容对应的多个第一媒体内容;第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容;
37.获取模块,被配置为执行从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标;
38.第二确定模块,被配置为执行基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容;
39.发送模块,被配置为执行向目标用户账户发送目标媒体内容。
40.可选的,装置还包括循环模块;
41.循环模块,被配置为执行按照预设周期执行以下步骤:获取访问推荐系统的各个用户账户在当前周期内操作过的媒体内容;针对当前周期内被同一用户账户连续操作的第二媒体内容和第三媒体内容:根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标;其中,第三媒体内容是在第二媒体内容之后被用户账户操作的;将第二媒体内容和第三媒体内容之间的相关性指标存储于预设存储区域。
42.可选的,共现用户账户的历史操作数据包括共现用户账户在预设历史时间段内操作过的媒体内容的数量;
43.循环模块,被配置为执行获取在预设历史时间段内访问过推荐系统的第一用户账户数量,以及在预设历史时间段内操作过第三媒体内容的第二用户账户数量;根据第一用户账户数量和第二用户账户数量确定第一参数值;第一参数值表征第三媒体内容的热门程度;根据每个共现用户账户在预设历史时间段内操作过的媒体内容的数量确定第二参数值;对第三媒体内容的用户历史操作信息中不同类型的操作行为进行加权求和,得到第三参数值;基于第一参数值、第二参数值和第三参数值,确定第二媒体内容与第三媒体内容之间的相关性指标。
44.可选的,第二媒体内容与第三媒体内容之间的相关性指标与所述第二参数值负相关,所述第二媒体内容与所述第三媒体内容之间的相关性指标分别与所述第一参数值、所述第三参数值正相关。
45.可选的,当前周期的上一个周期内确定的第二媒体内容与第三媒体内容之间的相关性指标为第一相关性指标时,装置还包括:
46.替换模块,被配置为执行若当前周期内确定第二媒体内容和第三媒体内容之间的相关性指标为第二相关性指标,则使用第二相关性指标替换第一相关性指标;
47.或者;
48.更新模块,被配置为执行若当前周期内不存在第二媒体内容与第三媒体内容之间的相关性指标时,则将第一相关性指标以指数衰减的方式进行降权得到更新后的第一相关性指标。
49.可选的,装置还包括:
50.删除模块,被配置为执行当预设存储区域中第二媒体内容和第三媒体内容之间的相关性指标低于预设值时,将低于预设值的相关性指标删除。
51.可选的,第二确定模块,被配置为执行对偏好媒体内容与各第一媒体内容之间的相关性指标进行排序,将满足预设条件的第一媒体内容确定为待推荐的目标媒体内容;其中,预设条件包括相关性指标大于等于阈值或者前n个排名位数。
52.可选的,偏好媒体内容是指被目标用户账户执行过正向操作的媒体内容;
53.其中,正向操作包括点赞操作、关注操作、评论操作和播放时长大于预设时长的播放操作中的任意一个或者多个的组合。
54.根据本公开实施例的第三方面,提供一种电子设备,包括:
55.处理器;
56.用于存储处理器可执行指令的存储器;
57.其中,处理器被配置为执行指令,以实现上述第一方面的媒体内容推荐方法。
58.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面的媒体内容推荐方法。
59.根据本公开实施例的第五方面,提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序存储在可读存储介质中,计算机设备的至少一个处理器从可读存储介质读取并执行计算机程序,使得计算机设备执行上述第一方面的媒体内容推荐方法。
60.本公开的实施例提供的技术方案至少带来以下有益效果:
61.通过响应于目标用户账户的媒体内容推荐请求,确定目标用户账户的偏好媒体内容以及偏好媒体内容对应的多个第一媒体内容;第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容;从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标;基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容;向目标用户账户发送目标媒体内容。上述技术方案中偏好媒体内容与各第一媒体内容之间的相关性指标是预先进行计算并存储在预设存储区域中的,从而在接收到目标用户账户的内容推荐请求时,可以直接从预设存储区域中获得相关性指标,基于该相关性指标确定出目标媒体内容,如此可以提高推荐效率,实时效果好;且由于第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容,即第一媒体内容与偏好媒体内容之间存在较强的时间关联性,基于大数据分析可知在时间上连续被操作的媒体内容之间的内容相似度较高,从而本公开向目标用户账户推荐的目标媒体内容与偏好媒体内容的相似程度较高,可以使得推荐的媒体内容更加符合目标用户账户的偏好,从而可以提高媒体内容推荐的准确性。
62.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
63.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
64.图1是根据一示例性实施例示出的一种媒体内容推荐方法的应用环境示意图;
65.图2是根据一示例性实施例示出的一种媒体内容推荐方法的流程图;
66.图3是根据一示例性实施例示出的确定相关性指标的一种流程图;
67.图4是根据一示例性实施例示出的确定第二媒体内容和第三媒体内容之间的相关性指标的一种流程图;
68.图5是根据一示例性实施例示出的一种媒体内容推荐装置的框图;
69.图6是根据一示例性实施例示出的一种用于媒体内容推荐的电子设备的框图。
具体实施方式
70.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
71.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
72.目前在短视频推荐领域,常用的协同过滤算法在计算两个视频之间的相似度时,通常是计算两个视频的共现用户数,共现用户数越大则计算的相似度越高,共现用户数指的是对两个视频有过操作(点击、观看等)的用户集合。现有协同过滤算法存在的问题是,在保证计算复杂度的情况下无法做到高准确率,在保证准确率的情况下又将导致计算复杂度比较高,即,很难权衡准确率和计算复杂度的关系;另一方面,现有协同过滤算法向用户推荐短视频时,均倾向于推荐热门视频,久而久之,系统推送的内容将千篇一律,容易招致审美疲劳。因而,推荐系统需要针对不同用户挖掘其兴趣点,向其推荐其更可能喜爱的内容,拓宽内容宽广性。
73.鉴于此,本公开实施例提供了一种媒体内容推荐方法,该方法响应于目标用户账户的媒体内容推荐请求,首先确定该目标用户账户的偏好媒体内容,然后确定出偏好媒体内容对应的多个第一媒体内容,基于各第一媒体内容与偏好媒体内容之间预先计算好的相似性指标,确定出向目标用户账户推荐的目标媒体内容。其中,第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容,即第一媒体内容与偏好媒体内容之间存在较强的时间关联性,基于大数据分析可知在时间上连续被操作的媒体内容之间的内容相似度较高,从而本公开向目标用户账户推荐的目标媒体内容与偏好媒体内容的相似程度较高,可以使得推荐的媒体内容更加符合目标用户账户的偏好,从而可以提高媒体内容推荐的准确性。此外,本公开相似性指标是预先计算好存储于预设存储区域中的,从而在接收到目标用户账户的推荐请求时,可以直接调用相似性指标以确定目标媒体内容,如此,可以降低推荐过程的计算复杂度且实时效果好。
74.请参阅图1,其所示为根据一示例性实施例示出的一种媒体内容推荐方法的应用环境示意图,该应用环境可以包括终端110和服务器120,该终端110和服务器120之间可以通过有线网络或者无线网络连接。
75.终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110中可以安装有提供人机交互功能的客户端软件如应用程序(application,简称为app),该应用程序可以是独立的应用程序,也可以是应用程序中的子程序。示例性的,该应用程序可以是新闻类应用程序、直播类应用程序或者视频类应用程序等。终端110的用户可以通过预先注册的用户信息登录应用程序,该用户信息可以包括账号和密码。
76.服务器120可以是为终端110中的应用程序提供后台服务的服务器,具体的,服务器120提供的服务可以是媒体内容推荐服务,该媒体内容可以根据具体的应用场景确定,例如可以包括但不限于短视频、新闻资讯、广告等等。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
77.在一个具体的应用场景中,终端110可以响应于媒体内容推荐指令向服务器120发送媒体内容推荐请求,其中媒体内容推荐指令可以是在终端110的用户账户(即目标用户账户)刷新当前页面时基于该刷新操作生成的。
78.服务器120在接收到来自目标用户账户的媒体内容推荐请求后,可以获取该目标用户账户的偏好媒体内容,以及确定其偏好媒体内容对应的多个第一媒体内容;第一媒体内容是指在任一用户账户操作偏好媒体内容的过程中被该用户账户连续操作的媒体内容;这里,上述任一用户账户可以是该目标用户账户,也可以是访问推荐系统的其他用户账户;然后,服务器120从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标,这里,偏好媒体内容与各第一媒体内容之间的相关性指标是预先计算好的,因此,可以直接从预设存储区域中调用即可;然后,服务器120基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容,将该目标媒体内容发送至目标用户账户对应的终端110,以使得终端110展示该目标媒体内容。
79.应理解的,图1所示的应用环境仅为示例,在实际应用中,可以由终端或者服务器独立执行本公开实施例的兴趣概率确定方法,也可以由终端和服务器配合执行本公开实施例的兴趣概率确定方法,本公开实施例对具体的应用环境不作限定。
80.本公开实施例中,服务器可以接收多个终端上登录的多个用户账户的媒体内容推荐请求,针对每个用户账户的媒体内容推荐请求,个性化的为该用户账户进行媒体内容推荐。下面以多个用户账户中的一个用户账户作为目标用户账户进行说明,具体推荐方法如图2所示,图2是根据一示例性实施例示出的一种媒体内容推荐方法的流程图,以媒体内容推荐方法用于图1的服务器为例,包括以下步骤:
81.在步骤s201中,响应于目标用户账户的媒体内容推荐请求,确定目标用户账户的偏好媒体内容以及偏好媒体内容对应的多个第一媒体内容。
82.其中,第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容。
83.本公开实施例中,媒体内容可以包括视频、图片、广告、新闻等可以在互联网上传播的内容。目标用户账户可以在终端的预设应用程序中基于预设操作触发媒体内容推荐指令的生成,终端基于该媒体内容推荐指令向推荐服务器发送媒体内容推荐请求,该媒体内容推荐请求中可以携带有目标用户账户的标识。服务器响应于该媒体内容推荐请求,根据
目标用户账户的标识确定该目标用户账户的偏好媒体内容。
84.需要说明的是,本公开实施例中服务器可以为每个访问推荐系统的用户账户提供推荐服务,服务器需要对每个用户账户的行为日志进行采集,该行为日志包括每个用户账户的媒体内容操作数据,基于该媒体内容操作数据为目标用户账户进行媒体内容的推荐,因此,本文所说的目标用户账户指的是访问推荐系统且向服务器发送了媒体内容推荐请求的用户账户。
85.一种可选的实施方式中,上述偏好媒体内容是指被目标用户账户执行过正向操作的媒体内容;其中,正向操作包括点赞操作、关注操作、评论操作和播放时长大于预设时长的播放操作中的任意一个或者多个的组合。以短视频应用场景为例,偏好媒体内容可以包括被目标用户账户点赞过的短视频,也可以包括被目标用户账户评论过的短视频。
86.一种可选的实施方式中,偏好媒体内容的数量可以根据实际需求确定,例如,可以随机获取预设数量的偏好媒体内容,该预设数量的偏好媒体内容中被目标用户账户执行过某正向操作的媒体内容的数量是随机数,如随机获取200个偏好视频,该200个偏好视频中被目标用户账户执行过点赞操作的视频的数量是随机的,被目标用户账户执行过关注操作的视频的数量也是随机的;又例如,可以针对不同类型的正向操作,获取每个类型的正向操作对应的预设数量的偏好媒体内容,如获取目标用户账户最近执行过点赞操作的50个视频,执行过关注操作的50个视频、执行过评论操作的50个视频以及播放时长大于20s的50个视频。
87.当偏好媒体内容的数量为多个时,上述步骤s201中,需要针对每个偏好媒体内容,确定其对应的多个第一媒体内容。
88.本公开实施例中,第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容,这里,用户账户指的是访问推荐系统的任一用户账户,可以理解的,该用户账户包括目标用户账户,也包括其他操作过偏好媒体内容和第一媒体内容的用户账户。第一媒体内容与偏好媒体内容在时间上连续被同一用户账户操作,第一媒体内容可以是在用户账户先操作偏好媒体内容之后,被连续操作的媒体内容;第一媒体内容也可以是用户账户在操作偏好媒体内容之前操作的媒体内容,换句话说,第一媒体内容可以先被用户账户操作,偏好媒体内容是在第一媒体内容之后被用户账户连续操作的媒体内容;举个例子,目标用户账户a的偏好媒体内容为视频x,该视频x对应的第一媒体内容包括视频y,其中,视频y是用户账户b在观看视频x的过程中被其连续观看的视频,即用户账户b先观看了视频x,紧接着又观看了视频y;或者,用户账户b先观看了视频y,紧接着观看了视频x;这两种情况下,均可以称视频y是视频x的第一媒体内容。
89.本公开实施例的推荐方法,基于目标用户账户的媒体内容推荐请求,首先确定目标用户账户的偏好媒体内容,在偏好媒体内容的基础上进行媒体内容推荐,由于偏好媒体内容是被目标用户账户执行过点赞操作、关注操作、评论操作和播放时长大于预设时长的播放操作等正向操作的媒体内容,因此可以提高目标媒体内容的计算准确度,使得向目标用户账户推荐的媒体内容更加符合目标用户账户的偏好;且,目标媒体内容来源于偏好媒体内容对应的多个第一媒体内容,由于第一媒体内容与偏好媒体内容之间存在较强的时间关联性,在这种时间关联性下第一媒体内容与偏好媒体内容之间,相较于普通的媒体内容与偏好媒体内容之间,前者的内容相似度往往更高,如此,可以进一步提升媒体内容推荐的
准确度。
90.在步骤s203中,从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标。
91.本公开实施例中,偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标是预先计算好并存储于预设存储区域中的,因此,服务器响应于目标用户账户的媒体内容推荐请求,可以直接从预设存储区域中获取偏好媒体内容对应的多个第一媒体内容,以及偏好媒体内容与各第一媒体内容之间的相关性指标。
92.一种可选的实施方式中,相关性指标可以由以下步骤s301~s303计算得到。如图3所示,本公开实施例的方法还可以包括:按照预设周期执行以下步骤:
93.在步骤s301中,获取访问推荐系统的各个用户账户在当前周期内操作过的媒体内容。
94.该步骤中,服务器实时落盘访问推荐系统的各个用户账户的行为日志,以预设时间间隔获取各个用户账户在当前周期内操作过的媒体内容。以媒体内容是视频为例,行为日志包括用户账户的标识、用户账户操作过的各视频标识,以及用户账户播放视频的时长、用户账户是否点赞、是否关注以及是否评论等;预设时间间隔可以根据实际需求进行设定,通过预设的时间长度来表征,例如预设时间间隔可以是5分钟。
95.在步骤s303中,针对当前周期内被同一用户账户连续操作的第二媒体内容和第三媒体内容:根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标;其中,第三媒体内容是在第二媒体内容之后被用户账户操作的。
96.在步骤s305中,将第二媒体内容和第三媒体内容之间的相关性指标存储于预设存储区域。
97.上述步骤中,针对当前周期内被同一用户账户连续操作的第二媒体内容和第三媒体内容,即只要存在一用户账户,其先操作了第二媒体内容,后操作了第三媒体内容,则计算该第二媒体内容和该第三媒体内容之间的相关性指标。以媒体内容是视频为例,假设当前周期访问推荐系统的用户账户包括a,则服务器可以获取该用户账户a在在5分钟内先后播放了视频p1、p2、p3、p4,此时,需要计算p1与p2、p2与p3、p3与p4之间的相关性指标;其中,先被观看的视频为第二媒体内容,后被观看的视频为第三媒体内容,例如,计算p1与p2之间的相关性指标时,p1为第二媒体内容,p2为第三媒体内容。
98.在一个可选的实施方式中,上述共现用户账户的历史操作数据包括共现用户账户在预设历史时间段内操作过的媒体内容的数量;其中,预设历史时间段通过预设的时间长度来表征,例如预设历史时间段为3天。
99.对应的,上述步骤s303中根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标,具体可以包括如图4所示的以下步骤:
100.在步骤s401中,获取在预设历史时间段内访问过推荐系统的第一用户账户数量,以及在预设历史时间段内操作过第三媒体内容的第二用户账户数量。
101.在步骤s403中,根据第一用户账户数量和第二用户账户数量确定第一参数值;第一参数值表征第三媒体内容的热门程度。
102.该步骤中,为了实现对热门媒体内容的降权,减少推荐热门媒体内容的频率,在计算相关性指标时,降低热门媒体内容与其他媒体内容之间的相关性指标,因而通过定义一表征第三媒体内容的热门程度的第一参数值,该第一参数值与在预设历史时间段内操作过第三媒体内容的第二用户账户数量呈正相关。具体的,对第一用户账户数量与第二用户账户数量的比值进行预设函数的处理,将经过预设函数处理的值作为第一参数值。比如,在一个具体的实施中,该预设函数为log函数,对应的,第一参数值的计算方式如下述公式(1):
[0103][0104]
其中,idfy表示第三媒体内容y对应的第一参数值;u表示预设历史时间段内访问过推荐系统的第一用户账户数量;γ(y)表示预设历史时间段内操作过第三媒体内容y的第二用户账户数量;其中,γ(y)越大,表示第三媒体内容y越热门。
[0105]
该具体的实施中,在确定相关性指标的过程中,引入逆向文件频率(inverse document frequency,idf)的概念,idf在自然语言处理领域中常用来表征一个词语普遍重要性。某一特定词语的idf值,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。如果包含词条t的文档数越少,该词条t的idf值越大,则说明词条t具有很好的类别区分能力。如果某一类文档c中包含词条t的文档数为m,而其它类包含t的文档总数为k,显然所有包含t的文档数n=m k,当m大的时候,文档总数n也大,则词条t的idf值会小,说明该词条t类别区分能力不强。
[0106]
类似的,由上述公式(1)的定义可见,函数中的分子为访问过推荐系统的第一用户账户数量,分母为操作过第三媒体内容y的第二用户账户数量,从而,对于一较热门的第三媒体内容y而言,其γ(y)较大,对应的idfy将较小。可见,第三媒体内容越热门,第一参数值将越小,如此带来的好处是,在后续计算相关性指标时,热门的第三媒体内容将获得较低的相关性指标,这可以实现对热门内容的降权,进而可以降低推荐热门视频的倾向,有助于实现推荐服务的个性化。
[0107]
在步骤s405中,根据每个共现用户账户在预设历史时间段内操作过的媒体内容的数量确定第二参数值。
[0108]
共现用户账户指的是在预设时间内先操作过第二媒体内容后操作过第三媒体内容的用户账户,共现用户账户可能存在多个,对于任一共现用户账户,其在预设历史时间段内操作过的媒体内容的数量越多,则表示该共现用户账户属于热门用户,由于热门用户操作媒体内容较频繁,其操作数据的可参考性较低,因此在后续的相关性指标计算时,将第二参数值作为负相关参数,可以实现对热门用户进行降权,可以避免热门用户的操作数据对相关性指标的准确度的负面影响。
[0109]
在步骤s407中,对第三媒体内容的用户历史操作信息中不同类型的操作行为进行加权求和,得到第三参数值。
[0110]
用户历史操作信息指的是,共现用户账户在预设历史时间段内对第三媒体内容执行过的具体操作信息,该具体操作信息包括不同类型的操作行为。以媒体内容为视频为例,不同类型的操作行为可以包括播放视频时长超过预设时长的播放操作、点赞操作、关注操
作以及评论操作。
[0111]
在一个具体的实施中,可以对上述不同类型的操作行为设置不同的权重,再通过线性加权的方式融合共现用户账户对某第三媒体内容的操作行为得到第三参数值,第三参数值可以定义为∑iω
yi
action
yi
,其中,action
yi
表示任一共现用户账户针对第三媒体内容y的不同类型的操作行为,ω
yi
为超参数,表示对应的操作行为的权重。通过对第三媒体内容的操作行为进行加权求和,得到任一共现用户账户对应的第三参数值。从而,在后续计算相关性指标时,对每个共现用户账户对应的第三参数值进行求和,可以融合多个共现用户账户的操作行为,如此,有利于提高媒体内容推荐的准确度。
[0112]
以媒体内容为视频为例,任一共现用户账户对于某视频的不同类型的操作行为可以包括播放视频时长超过预设时长的播放操作action
y1
、点赞操作action
y2
、关注操作action
y3
以及评论操作action
y4
,各操作对应的权重可以为ω
y1
=0.4,ω
y2
=0.2,ω
y3
=0.3,ω
y4
=0.1;则,该该共现用户账户对应的第三参数值为0.4*action
y1
0.2*action
y2
0.3*action
y3
0.1*action
y4

[0113]
在步骤s409中,基于第一参数值、第二参数值和第三参数值,确定第二媒体内容与第三媒体内容之间的相关性指标。
[0114]
在一个具体的实施中,第二媒体内容与第三媒体内容之间的相关性指标与第二参数值负相关。第二媒体内容与第三媒体内容之间的相关性指标分别与第一参数值、第三参数值正相关。实际应用中,第二媒体内容与第三媒体内容之间可能存在成千上百万个共现用户账户,通过对每个共现用户账户在预设历史时间段内操作过的媒体内容的数量进行预设函数的处理,将经过预设函数处理后的值作为每个共现用户账户对应的第二参数值。在计算相关性指标时,对每个共现用户账户对应的第二参数值取倒数,再乘以该共现用户账户对应的第三参数值,即以该共现用户账户对应的第三参数值作为分子,该共现用户账户对应的第二参数值作为分母,得到该共现用户账户对应的分数值,再对所有共现用户数的分数值进行求和,与第一参数值相乘后即可得到相关性指标。其中,预设函数可以是log函数;例如,相关性指标可以根据下述公式(2)确定:
[0115][0116]
其中,simscore
xy
表示第二媒体内容x和第三媒体内容y的相关性指标;u表示既操作过第二媒体内容x又操作过第三媒体内容y的共现用户账户;idfy表示第一参数值;φ(u)表示共现用户账户u在预设历史时间段内操作过的媒体内容的数量,log(|φ(u)|)表示经过预设函数处理的共现用户账户对应的第二参数值;∑iω
yi
action
yi
表示某共现用户账户对应的第三参数值,action
yi
表示某贡献用户账户针对第三媒体内容y的不同类型的操作行为,ω
yi
为超参数,表示对应的操作行为的权重。
[0117]
一种可选的实施方式中,当前周期的上一个周期内确定的第二媒体内容与第三媒体内容之间的相关性指标为第一相关性指标时,本公开实施例的方法还包括:
[0118]
若当前周期内确定第二媒体内容和第三媒体内容之间的相关性指标为第二相关性指标,则使用第二相关性指标替换第一相关性指标;
[0119]
或者;
[0120]
若当前周期内不存在第二媒体内容与第三媒体内容之间的相关性指标时,则将第一相关性指标以指数衰减的方式进行降权得到更新后的第一相关性指标。
[0121]
例如,第一种情况下,当前周期的上一个周期的5分钟内,确定视频p1与p2之间的第一相关性指标为0.9,当前周期的5分钟内,确定p1与p2之间的第二相关性指标为0.8,则使用0.8替换0.9,完成相关性指标的替换;第二种情况下,上一个周期内的5分钟内,计算得到p1与p2之间的第一相关性指标为0.9,当前周期的5分钟内不存在p1与p2之间的相关性指标,则以指数衰减的方式对0.9进行降权,得到更新后的第一相关性指标,其中,指数衰减时采用的衰减因子可以是0.95。
[0122]
进一步可选的实施方式中,当预设存储区域中第二媒体内容和第三媒体内容之间的相关性指标低于预设值时,将低于预设值的相关性指标删除。
[0123]
其中,预设值可以是0.1;如此,若对某一相关性指标多次以指数衰减进行降权后,最终将其进行删除,以节省预设存储区域的存储空间。
[0124]
如此,本公开通过周期性确定相关性指标并对相关性指标进行更新,使得预设存储区域中存储的相关性指标具备良好的时效性,这有利于后续向目标用户账户推荐更加准确的媒体内容。
[0125]
在步骤s205中,基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容。
[0126]
在步骤s207中,向目标用户账户发送目标媒体内容。
[0127]
本公开实施例中,偏好媒体内容与第一媒体内容之间的相关性指标由上述步骤s301~s303预先计算得到,基于前文介绍的,第一媒体内容可以是上文中的第二媒体内容,也可以是第三媒体内容。在推荐时,直接从预设存储区域中直接获取偏好媒体内容对应的多个第一媒体内容,以及偏好媒体内容与各第一媒体内容之间的相关性指标。
[0128]
一种可选的实施方式中,上述步骤基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容,具体可以包括:
[0129]
对偏好媒体内容与各第一媒体内容之间的相关性指标进行排序,将满足预设条件的第一媒体内容确定为待推荐的目标媒体内容;
[0130]
其中,预设条件包括相关性指标大于等于阈值或者前n个排名位数。
[0131]
在实际应用中,基于偏好媒体内容确定的第一媒体内容的数量是成千上万的,因此,需要从成千上万个中第一媒体内容中,基于各第一媒体内容对应的相关性指标进行筛选,将满足预设条件的第一媒体内容作为待推荐的目标媒体内容。其中,预设条件可以包括一个具有固定的阈值,也可以包括动态可调的阈值,该动态可调的阈值可以根据各第一媒体内容对应的相关性指标计算得到。或者,预设条件可以是按从大到小进行排序后位于前n个排名位置的相关性指标,例如,对各第一媒体内容对应的相关性指标进行排序之后,将排名前1000的相关性指标对应的第一媒体内容作为目标媒体内容,推荐给目标用户账户。
[0132]
本公开实施例提供的一种媒体内容推荐方法,应用到短视频推荐系统中进行测试,由测试结果可得,本公开向目标用户账户推荐的候选视频,相比于现有算法推荐的视频,播放时长提升3.2%,点赞率提升1.4%,关注率提升4.6%,评论率提升2.1%,热门视频曝光占比下降8.4%,可见,本公开可以显著提升推荐效果。
[0133]
图5是根据一示例性实施例示出的一种媒体内容推荐装置的框图。参照图5,该媒
体内容推荐装置500包括第一确定模块510、获取模块520、第二确定模块530和发送模块540,其中:
[0134]
第一确定模块510,被配置为执行响应于目标用户账户的媒体内容推荐请求,确定目标用户账户的偏好媒体内容以及偏好媒体内容对应的多个第一媒体内容;第一媒体内容是指在用户账户操作偏好媒体内容的过程中被用户账户连续操作的媒体内容;
[0135]
获取模块520,被配置为执行从预设存储区域中获取偏好媒体内容与多个第一媒体内容中各第一媒体内容之间的相关性指标;
[0136]
第二确定模块530,被配置为执行基于相关性指标,从多个第一媒体内容中确定待推荐的目标媒体内容;
[0137]
发送模块540,被配置为执行向目标用户账户发送目标媒体内容。
[0138]
一种可选的实施方式中,装置还包括循环模块;
[0139]
循环模块,被配置为执行按照预设周期执行以下步骤:获取访问推荐系统的各个用户账户在当前周期内操作过的媒体内容;针对当前周期内被同一用户账户连续操作的第二媒体内容和第三媒体内容:根据对第二媒体内容和第三媒体内容有过操作的共现用户账户的历史操作数据、第三媒体内容对应的用户历史操作信息和第三媒体内容的热门程度,确定第二媒体内容和第三媒体内容之间的相关性指标;其中,第三媒体内容是在第二媒体内容之后被用户账户操作的;将第二媒体内容和第三媒体内容之间的相关性指标存储于预设存储区域。
[0140]
一种可选的实施方式中,共现用户账户的历史操作数据包括共现用户账户在预设历史时间段内操作过的媒体内容的数量;
[0141]
循环模块,被配置为执行获取在预设历史时间段内访问过推荐系统的第一用户账户数量,以及在预设历史时间段内操作过第三媒体内容的第二用户账户数量;根据第一用户账户数量和第二用户账户数量确定第一参数值;第一参数值表征第三媒体内容的热门程度;根据每个共现用户账户在预设历史时间段内操作过的媒体内容的数量确定第二参数值;对第三媒体内容的用户历史操作信息中不同类型的操作行为进行加权求和,得到第三参数值;基于第一参数值、第二参数值和第三参数值,确定第二媒体内容与第三媒体内容之间的相关性指标。
[0142]
一种可选的实施方式中,第二媒体内容与第三媒体内容之间的相关性指标与第二参数值负相关,第二媒体内容与第三媒体内容之间的相关性指标分别与第一参数值、第三参数值正相关。
[0143]
一种可选的实施方式中,当前周期的上一个周期内确定的第二媒体内容与第三媒体内容之间的相关性指标为第一相关性指标时,装置还包括:
[0144]
替换模块,被配置为执行若当前周期内确定第二媒体内容和第三媒体内容之间的相关性指标为第二相关性指标,则使用第二相关性指标替换第一相关性指标;
[0145]
或者;
[0146]
更新模块,被配置为执行若当前周期内不存在第二媒体内容与第三媒体内容之间的相关性指标时,则将第一相关性指标以指数衰减的方式进行降权得到更新后的第一相关性指标。
[0147]
一种可选的实施方式中,装置还包括:
[0148]
删除模块,被配置为执行当预设存储区域中第二媒体内容和第三媒体内容之间的相关性指标低于预设值时,将低于预设值的相关性指标删除。
[0149]
一种可选的实施方式中,第二确定模块530,被配置为执行对偏好媒体内容与各第一媒体内容之间的相关性指标进行排序,将满足预设条件的第一媒体内容确定为待推荐的目标媒体内容;其中,预设条件包括相关性指标大于等于阈值或者前n个排名位数。
[0150]
一种可选的实施方式中,偏好媒体内容是指被目标用户账户执行过正向操作的媒体内容;
[0151]
其中,正向操作包括点赞操作、关注操作、评论操作和播放时长大于预设时长的播放操作中的任意一个或者多个的组合。
[0152]
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0153]
在一个示例性的实施方式中,还提供了一种电子设备,包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现本公开实施例中提供的任意一种媒体内容推荐方法。
[0154]
该电子设备可以是终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图6是根据一示例性实施例示出的一种用于媒体内容推荐的电子设备的框图,如图6所示,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)610(处理器610可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器630,一个或一个以上存储应用程序623或数据622的存储介质620(例如一个或一个以上海量存储设备)。其中,存储器630和存储介质620可以是短暂存储或持久存储。存储在存储介质620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器610可以设置为与存储介质620通信,在服务器600上执行存储介质620中的一系列指令操作。服务器600还可以包括一个或一个以上电源660,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口640,和/或,一个或一个以上操作系统621,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0155]
输入输出接口640可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器600的通信供应商提供的无线网络。在一个实例中,输入输出接口640包括一个网络适配器(network interface controller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口640可以为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0156]
本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器600还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
[0157]
在一个示例性的实施方式中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器630,上述指令可由装置600的处理器610执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0158]
在一个示例性的实施方式中,还提供了一种计算机程序产品,包括计算机程序,计
算机程序存储在可读存储介质中,计算机设备的至少一个处理器从可读存储介质读取并执行计算机程序,使得计算机设备执行本公开实施例中提供的任意一种媒体内容推荐方法。
[0159]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
[0160]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献