一种声音推荐方法、装置、计算机设备和存储介质与流程

2022-06-05 14:19:41 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，具体是涉及一种声音推荐方法、装置、计算机设备和存储介质。

背景技术：

2.随着计算机技术的不断发展，在线音频平台也得到了日益广泛的应用，用户可以通过在线音频平台收听各种各样的声音。在线音频平台会为用户推荐声音，传统的声音推荐方法包括基于索引推荐、item2vec、基于graph。
3.其中，基于索引推荐方法，其通过用户行为，收集用户标签偏好，然后推荐含有该标签的声音。
4.缺点：
5.考虑粒度太粗，仅仅是考虑到用户对标签的偏好，没有考虑用户更细维度的偏好。
6.item2vec，其将用户的行为序列视作一个句子，序列中的声音视作词，然后用word2vec模型进行训练，就得到了声音的embedding。
7.缺点：
8.马太效应严重，用户对长尾的声音行为比较少，这些长尾声音的embedding效果不理想；
9.声音冷启动问题严重，新的声音还没有用户产生行为，因而新声音不会出现在用户的行为序列中，这样就得不到新声音的embedding。
10.基于graph，其基于用户对声音的行为构建graph，然后从每个结点为出发点，根据权重做随机游走，这样就可以形成新的声音序列，最后对这些不同的声音序列继续使用word2vec模型，得到声音的embedding向量。
11.缺点：
12.随机游走策略，会引入比较大的噪声；
13.马太效应严重，用户对长尾的声音行为比较少，这些长尾声音的embedding效果不理想；
14.声音冷启动问题严重，新的声音还没有用户产生行为，因而新声音不会出现在graph中，这样就得不到新声音的embedding。

技术实现要素：

15.鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种声音推荐方法、装置、计算机设备和存储介质，提高了声音推荐的准确性。
16.第一方面，本发明实施例提供了一种声音推荐方法，所述方法包括以下步骤：
17.获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数；所述历史行为数据包括播放行为数据、正反馈行为数据；
18.基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重；基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重；基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合；
19.基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合；
20.过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。
21.可选地，所述每个预设时间周期内对主播所发布声音的播放行为的权重基于目标对象在相应预设时间周期内对相应主播所发布声音的播放时长，以及目标对象在相应预设时间周期内曝光相应主播所发布声音的总时长确定。
22.可选地，所述每个预设时间周期内时间衰减系数基于相应预设时间周期于历史时间段内的排序确定。
23.可选地，所述每个预设时间周期内对主播所发布声音的播放行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的播放次数，目标对象在相应预设时间周期内对所有主播所发布声音的播放次数，所有用户在相应预设时间周期内对所有主播所发布声音的播放次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的播放次数确定。
24.可选地，所述每个预设时间周期内对主播所发布声音的正反馈行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的正反馈行为次数，目标对象在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，所有用户在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的正反馈行为次数确定。
25.可选地，所述正反馈行为的类型包括点赞行为、收藏行为。
26.可选地，所述的方法还包括：
27.若目标对象没有播放行为，则获取目标对象被投放的声音所对应主播的信息，并赋目标对象对相应主播的偏好权重为预设权重值，并将相应主播作为目标对象的偏好主播；
28.若目标对象没有播放行为，也没有被投放声音，则计算与目标对象的基础用户画像相同的用户群体对各主播的偏好权重，基于用户群体对各主播的偏好权重确定各主播的基本偏好权重，并将基本偏好权重最高的前m个主播作为目标对象的偏好主播集合，以及将相应主播的基本偏好权重作为目标对象对应主播的偏好权重。
29.第二方面，本发明实施例提供了一种声音推荐装置，所述装置包括：
30.获取模块，用于获取目标对象在设定的历史时间段内播放声音的历史行为数据、
目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数；所述历史行为数据包括播放行为数据、正反馈行为数据；
31.偏好主播集合确定模块，用于基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重；基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重；基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合；
32.实时负反馈主播集合确定模块，用于基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合；
33.推荐模块，用于过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。
34.可选地，所述每个预设时间周期内对主播所发布声音的播放行为的权重基于目标对象在相应预设时间周期内对相应主播所发布声音的播放时长，以及目标对象在相应预设时间周期内曝光相应主播所发布声音的总时长确定。
35.可选地，所述每个预设时间周期内时间衰减系数基于相应预设时间周期于历史时间段内的排序确定。
36.可选地，所述每个预设时间周期内对主播所发布声音的播放行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的播放次数，目标对象在相应预设时间周期内对所有主播所发布声音的播放次数，所有用户在相应预设时间周期内对所有主播所发布声音的播放次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的播放次数确定。
37.可选地，所述每个预设时间周期内对主播所发布声音的正反馈行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的正反馈行为次数，目标对象在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，所有用户在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的正反馈行为次数确定。
38.可选地，所述正反馈行为的类型包括点赞行为、收藏行为。
39.可选地，所述偏好主播集合确定模块还用于：
40.若目标对象没有播放行为，则获取目标对象被投放的声音所对应主播的信息，并赋目标对象对相应主播的偏好权重为预设权重值，并将相应主播作为目标对象的偏好主播；
41.若目标对象没有播放行为，也没有被投放声音，则计算与目标对象的基础用户画像相同的用户群体对各主播的偏好权重，基于用户群体对各主播的偏好权重确定各主播的
基本偏好权重，并将基本偏好权重最高的前m个主播作为目标对象的偏好主播集合，以及将相应主播的基本偏好权重作为目标对象对应主播的偏好权重。
42.第三方面，本发明实施例提供了一种计算机设备，所述计算机设备包括：
43.一个或多个处理器；
44.存储器，用于存储一个或多个程序；
45.当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面中任一项所述的声音推荐方法。
46.第四方面，本发明实施例提供了一种计算机可读存储介质。
47.所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如第一方面中任一项所述的声音推荐方法。
48.在本实施例中，获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数；所述历史行为数据包括播放行为数据、正反馈行为数据；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重；基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重；基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合；基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合；过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。采集播放行为数据、正反馈行为数据并结合牛顿热力学定律确定目标对象偏好画像，根据目标对象偏好画像确定偏好主播集合，然后对偏好主播集合、关注主播集合进行过滤，过滤后的偏好主播集合、关注主播集合可有效命中目标对象所感兴趣的主播，大大提高声音推荐的准确性。
附图说明
49.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
50.图1为本发明实施例一提供的一种声音推荐方法的流程图；
51.图2为本发明实施例二提供的一种声音推荐装置的结构示意图；
52.图3为本发明实施例三提供的一种计算机设备的结构示意图。
具体实施方式
53.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。
54.随着计算机技术的不断发展，在线音频平台也得到了日益广泛的应用，用户可以通过在线音频平台收听各种各样的声音。在线音频平台会为用户推荐声音，传统的声音推荐方法包括基于索引推荐、item2vec、基于graph。
55.其中，基于索引推荐方法，其通过用户行为，收集用户标签偏好，然后推荐含有该标签的声音。
56.缺点：
57.考虑粒度太粗，仅仅是考虑到用户对标签的偏好，没有考虑用户更细维度的偏好。
58.item2vec，其将用户的行为序列视作一个句子，序列中的声音视作词，然后用word2vec模型进行训练，就得到了声音的embedding。
59.缺点：
60.马太效应严重，用户对长尾的声音行为比较少，这些长尾声音的embedding效果不理想；
61.声音冷启动问题严重，新的声音还没有用户产生行为，因而新声音不会出现在用户的行为序列中，这样就得不到新声音的embedding。
62.基于graph，其基于用户对声音的行为构建graph，然后从每个结点为出发点，根据权重做随机游走，这样就可以形成新的声音序列，最后对这些不同的声音序列继续使用word2vec模型，得到声音的embedding向量。
63.缺点：
64.随机游走策略，会引入比较大的噪声；
65.马太效应严重，用户对长尾的声音行为比较少，这些长尾声音的embedding效果不理想；
66.声音冷启动问题严重，新的声音还没有用户产生行为，因而新声音不会出现在graph中，这样就得不到新声音的embedding。
67.为克服上述问题或者至少部分地解决上述问题，本技术实施例提供一种声音推荐方法，该方法能够提高声音推荐的准确性。
68.下面通过实施例进行详细说明。
69.实施例一
70.图1为本发明实施例一提供的一种声音推荐方法的流程图，该方法可以由声音推荐装置来执行，该声音推荐装置可以由软件和/或硬件实现，可以配置在计算机设备中，例如，服务器、个人电脑，等等。所述声音推荐方法具体包括如下步骤：
71.步骤101、获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数。
72.所述历史行为数据包括播放行为数据、正反馈行为数据。
73.用户于在线音频平台收听声音的过程中会产生各种行为数据，如播放行为数据，
正反馈行为数据，同时也会曝光声音。其中，正反馈行为是指能够表达用户对声音的认可、喜好等积极情感的行为，如点赞、收藏等。
74.设定的历史时间段、预设时间周期可根据实际情况而调整，设定的历史时间段可以为最近一个月，可以为最近两个月，可以为最近一年，或其它时间段，本实施例对此不进行限定。同样的，预设时间周期可以为一小时为一个周期，可以以一天为一个周期，可以以一周为一个周期，或其它时间周期，本实施例对此不进行限定。
75.例如，获取用户在最近一段时间内，如最近180天内播放声音的历史行为数据、用户曝光的声音数据、关注的主播、取消关注主播，以及用户在最近一小时间段内，如最近3天内对主播曝光次数。
76.步骤102、基于目标对象在历史时间段内播放声音的播放行为数据、正反馈行为数据、目标对象曝光的声音数据确定目标对象对各主播的偏好权重，并基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合。
77.具体的，步骤102包括：
78.子步骤1021、基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重。
79.例如，用户usera在第t天对主播nja的播放行为权重
80.w(usera，nja，t，type＝播放)
81.＝f(play_time，total_time)*g(t)*tf-idf(usera，nja，t，type＝播放)
82.其中，f(play_time，total_time)为用户usera在第t天对主播nja所发布声音的播放行为的权重，g(t)为第t天的时间衰减系数、tf-idf(usera，nja，t，type＝播放)为用户usera对在第t天主播nja所发布声音的播放行为tf-idf值。
83.在一种实施方式中，所述每个预设时间周期内对主播所发布声音的播放行为的权重基于目标对象在相应预设时间周期内对相应主播所发布声音的播放时长，以及目标对象在相应预设时间周期内曝光相应主播所发布声音的总时长确定。
84.例如，用户usera第t天播放主播nja的声音(节目)总时长为play_time，第t天给用户usera曝光的主播nja声音(节目)总时长为total_time，
85.用户usera在第t天对主播nja所发布声音的播放行为的权重
86.。
87.在一种实施方式中，所述每个预设时间周期内时间衰减系数基于相应预设时间周期于历史时间段内的排序确定。
88.例如，第t天的时间衰减系数
89.。
90.在一种实施方式中，所述每个预设时间周期内对主播所发布声音的播放行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的播放次数，目标对象
在相应预设时间周期内对所有主播所发布声音的播放次数，所有用户在相应预设时间周期内对所有主播所发布声音的播放次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的播放次数确定。
91.例如，用户usera在第t天对主播nja所发布声音的播放行为tf-idf值
92.tf-idf(usera，nja，t，type＝播放)
93.＝tf(usera，nja，t，type＝播放)*idf(usera，nja，t，type＝播放)
94.其中，
[0095][0096][0097]
c(usera，nja)表示用户usera在第t天对主播nja的声音(节目)的播放次数，∑∑c(user_i，nj_j)表示所有用户在第t天对所有主播的声音(节目)的播放次数。
[0098]
需要说明的是，在以上示出的实施方式中，关于目标对象在每个预设时间周期内对相应主播所发布声音的播放行为权重的计算、目标对象在每个预设时间周期内对主播所发布声音的播放行为的权重计算、每个预设时间周期内时间衰减系数计算、目标对象在每个预设时间周期内对主播所发布声音的播放行为tf-idf值计算，以上仅仅是一种示例性的描述，并不对本说明书做限制。在实际应用中，可以根据具体业务背景对上述计算中的超参数进行调整。
[0099]
子步骤1022、基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重。
[0100]
例如，用户usera在在线音频平台收听声音(节目)的过程有点赞行为，用户usera在第t天对主播nja的正反馈行为权重(正反馈行为为点赞)
[0101]
w(usera，nja，t，type＝点赞)＝0.8*g(t)*tf-idf(usera，nja，t，type＝点赞)*log2(点赞该主播声音数与1)
[0102]
其中，0.8为目标对象对主播所发布声音的正反馈行为的权重(正反馈行为为点赞)，g(t)为第t天的时间衰减系数，tf-idf(usera，nja，t，type＝点赞)为用户usera对在第t天主播nja所发布声音的正反馈行为tf-idf值(正反馈行为为点赞)。
[0103]
又例如，用户usera在在线音频平台收听声音(节目)的过程有收藏行为，用户usera在第t天对主播nja的正反馈行为权重(正反馈行为为收藏)
[0104]
w(usera，nja，t，type＝收藏)＝1.0*g(t)*tf-idf(usera，nja，t，type＝收藏)*log2(收藏该主播声音数与1)
[0105]
其中，1.0为目标对象对主播所发布声音的正反馈行为的权重(正反馈行为为收藏)，g(t)为第t天的时间衰减系数，tf-idf(usera，nja，t，type＝收藏)为用户usera对在第t天主播nja所发布声音的正反馈行为tf-idf值(正反馈行为为收藏)。
[0106]
在一种实施方式中，所述每个预设时间周期内时间衰减系数基于相应预设时间周期于历史时间段内的排序确定。
[0107]
例如，第t天的时间衰减系数
[0108]
。
[0109]
在一种实施方式中，所述每个预设时间周期内对主播所发布声音的正反馈行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的正反馈行为次数，目标对象在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，所有用户在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的正反馈行为次数确定。
[0110]
例如，用户usera对在第t天主播nja所发布声音的正反馈行为tf-idf值(正反馈行为为点赞)
[0111]
tf-idf(usera，nja，t，type＝点赞)
[0112]
＝tf(usera，nja，t，type＝点赞)*idf(usera，nja，t，type＝点赞)
[0113]
其中，
[0114][0115][0116]
c(usera，nja)表示用户usera在第t天对主播nja的声音(节目)的点赞次数，∑∑c(user_i，nj_j)表示所有用户在第t天对所有主播的声音(节目)的点赞次数。
[0117]
又例如，用户usera对在第t天主播nja所发布声音的正反馈行为tf-idf值(正反馈行为为收藏)
[0118]
tf-idf(usera，nja，t，type＝收藏)
[0119]
＝tf(usera，nja，t，type＝收藏)*idf(usera，nja，t，type＝收藏)
[0120]
其中，
[0121][0122][0123]
c(usera，nja)表示用户usera在第t天对主播nja的声音(节目)的收藏次数，∑∑c(user_i，nj_j)表示所有用户在第t天对所有主播的声音(节目)的收藏次数。
[0124]
需要说明的是，在以上示出的实施方式中，关于目标对象在每个预设时间周期内对相应主播所发布声音的正反馈行为的权重赋值、每个预设时间周期内时间衰减系数计算、目标对象在每个预设时间周期内对主播所发布声音的正反馈行为tf-idf值计算，以上仅仅是一种示例性的描述，并不对本说明书做限制。在实际应用中，可以根据具体业务背景对上述赋值、计算中的超参数进行调整。
[0125]
子步骤1023、基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重。
[0126]
例如，用户usera对主播nja的偏好权重
[0127][0128]
同理，可以得到用户usera其它主播的偏好权重。
[0129]
需要说明的是，在以上示出的实施方式中，关于目标对象对各主播的偏好权重计算，以上仅仅是一种示例性的描述，并不对本说明书做限制。在实际应用中，可以采用其它公式计算。
[0130]
基于用户usera对各主播的偏好权重能够确定用户usera的偏好主播集合。
[0131]
在一种实施方式中，若目标对象没有播放行为，则获取目标对象被投放的声音所对应主播的信息，并赋目标对象对相应主播的偏好权重为预设权重值，并将相应主播作为目标对象的偏好主播。
[0132]
例如，如果用户usera没有播放行为，则获取用户的投放素材画像，获取其投放声音的主播，令用户usera对相应主播的偏好权重为1，同时将相应主播作为用户usera的偏好主播。
[0133]
在又一种实施方式中，若目标对象没有播放行为，也没有被投放声音，则计算与目标对象的基础用户画像相同的用户群体对各主播的偏好权重，基于用户群体对各主播的偏好权重确定各主播的基本偏好权重，并将基本偏好权重最高的前m个主播作为目标对象的偏好主播集合，以及将相应主播的基本偏好权重作为目标对象对应主播的偏好权重。
[0134]
例如，获取用户usera的年龄段、性别、手机品牌、所在城市、用户类型，找出年龄段、性别、手机品牌、所在城市、用户类型都一样的用户群体，计算用户群体对各主播的偏好权重，并对用户群体的主播画像偏好累加求和后平均得到各主播的基本偏好权重，在该群体的主播画像偏好中，如果主播nja在该用户群体中出现次数少于100，则将nja的主播画像偏好去掉，然后选取基本偏好权重最高的前20个主播作为用户usera的偏好主播集合，并赋用户usera对该前20个主播的偏好权重值为相应主播的基本偏好权重。
[0135]
步骤103、基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合。
[0136]
用户对主播的偏好权重小，并且最近累计曝光次数多或者已取消对主播的关注，则可以代表用户对该主播已不再感兴趣，从而确定该主播为用户的实时负反馈主播。
[0137]
例如，用户usera对主播nja的偏好权重小于0.2，同时主播nja最近3天累计曝光次数超过20次或者用户usera已取消关注主播nja，则认为nja是用户usera的实时负反馈主播。
[0138]
步骤104、过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。
[0139]
过滤用户的负反馈主播后，将偏好主播集合、关注主播集合进行去重。去重逻辑可以为：如果某个主播既在偏好主播集合，又在关注主播集合，则将偏好主播集合里该主播去掉。
[0140]
声音推荐逻辑可以为：
[0141]
策略一：对于用户的关注主播集合中的任一主播，将该主播的最新发布的10个声
音(节目)召回，同时之前发布的声音(节目)也召回10个；
[0142]
策略二：对于用户的偏好主播集合中的任一主播，先将该主播发布的声音(节目)按照质量分排序，然后去除top100节目，最后随机取出20个声音(节目)作为召回的声音(节目)。
[0143]
需要说明的是，在以上示出的实施方式中，关于去重逻辑、声音推荐逻辑，以上仅仅是一种示例性的描述，并不对本说明书做限制。在实际应用中，可以根据具体业务背景进行调整。
[0144]
在本实施例中，获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数；所述历史行为数据包括播放行为数据、正反馈行为数据；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重；基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重；基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合；基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合；过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。
[0145]
采集播放行为数据、正反馈行为数据并结合牛顿热力学定律确定目标对象偏好画像，根据目标对象偏好画像确定偏好主播集合，然后对偏好主播集合、关注主播集合进行过滤，过滤后的偏好主播集合、关注主播集合可有效命中目标对象所感兴趣的主播，大大提高声音推荐的准确性。将用户行为画像、素材画像、基础属性进行了级联，能有效解决声音冷启动问题。
[0146]
需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。
[0147]
实施例二
[0148]
图2为本发明实施例二提供的一种声音推荐装置的结构示意图，所述声音推荐装置具体可以包括如下模块：
[0149]
获取模块201，用于获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合，以及目标对象在历史时间段内最后n个预设时间周期内对主播曝光次数；所述历史行为数据包括播放行为数据、正反馈行为数据；
[0150]
偏好主播集合确定模块202，用于基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为tf-idf值确定目标对象在相应预设时间周期内对相应主播的播放行为权重；基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为tf-idf值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重；基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重；基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合；
[0151]
实时负反馈主播集合确定模块203，用于基于目标对象对各主播的偏好权重、最后n个预设时间周期内对主播曝光次数，以及取消关注主播集合确定目标对象的实时负反馈主播集合；
[0152]
推荐模块204，用于过滤目标对象的偏好主播集合中实时负反馈主播集合的主播，以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播，并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。
[0153]
在一种实施方式中，所述每个预设时间周期内对主播所发布声音的播放行为的权重基于目标对象在相应预设时间周期内对相应主播所发布声音的播放时长，以及目标对象在相应预设时间周期内曝光相应主播所发布声音的总时长确定。
[0154]
在一种实施方式中，所述每个预设时间周期内时间衰减系数基于相应预设时间周期于历史时间段内的排序确定。
[0155]
在一种实施方式中，所述每个预设时间周期内对主播所发布声音的播放行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的播放次数，目标对象在相应预设时间周期内对所有主播所发布声音的播放次数，所有用户在相应预设时间周期内对所有主播所发布声音的播放次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的播放次数确定。
[0156]
在一种实施方式中，所述每个预设时间周期内对主播所发布声音的正反馈行为tf-idf值基于目标对象在相应预设时间周期内对相应主播所发布声音的正反馈行为次数，目标对象在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，所有用户在相应预设时间周期内对所有主播所发布声音的正反馈行为次数，以及所有用户在相应预设时间周期内对相应主播所发布声音的正反馈行为次数确定。
[0157]
在一种实施方式中，所述正反馈行为的类型包括点赞行为、收藏行为。
[0158]
在一种实施方式中，所述偏好主播集合确定模块202还用于：
[0159]
若目标对象没有播放行为，则获取目标对象被投放的声音所对应主播的信息，并赋目标对象对相应主播的偏好权重为预设权重值，并将相应主播作为目标对象的偏好主播；
[0160]
若目标对象没有播放行为，也没有被投放声音，则计算与目标对象的基础用户画像相同的用户群体对各主播的偏好权重，基于用户群体对各主播的偏好权重确定各主播的基本偏好权重，并将基本偏好权重最高的前m个主播作为目标对象的偏好主播集合，以及将相应主播的基本偏好权重作为目标对象对应主播的偏好权重。
[0161]
本发明实施例所提供的声音推荐装置可执行本发明任意实施例所提供的声音推
荐方法，具备执行方法相应的功能模块和有益效果。
[0162]
实施例三
[0163]
图3为本发明实施例三提供的一种计算机设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图3显示的计算机设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
[0164]
如图3所示，计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0165]
总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0166]
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。
[0167]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示，通常称为“硬盘驱动器”)。尽管图3中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。
[0168]
具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0169]
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机设备12交互的设备通信，和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0170]
处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的声音推荐方法。
[0171]
实施例四
[0172]
本发明实施例四还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述声音推荐方法的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
[0173]
其中，计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0174]
注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种盾构机刀盘综合性能评价方法与流程

一种声音推荐方法、装置、计算机设备和存储介质与流程

相关文献

最热文献