多媒体数据推送方法及装置与流程

2021-12-07 20:32:00 来源：中国专利 TAG：

1.本技术涉及计算机技术领域，涉及但不限定于多媒体数据推送方法及装置。

背景技术：

2.目前的多媒体数据推送平台中，不可避免地存在数据推送者如商家和数据受众之间的信息阻塞。一方面，商家推送或投放多媒体数据后不知道有没有人喜欢、多少人喜欢、什么人喜欢，使推荐多媒体数据的效果难于评估，从而仅凭任务经验进行多媒体数据推送时推荐准确性不高。另一方面，由于推送终端布放位置的差异，其多媒体数据受众由于性别、年龄、群体的不同，关注点和兴趣有着很大的差异，往往观看多媒体数据后发现并没有自己想要的信息，导致投放成功率不高。

技术实现要素：

3.本技术实施例提供一种多媒体数据推送方法及装置。
4.本技术实施例的技术方案是这样实现的：
5.第一方面，本技术实施例提供一种多媒体数据推送方法，所述方法包括：
6.获取待推荐数据和候选的一组用户；
7.确定所述待推荐数据针对所述一组用户中每一用户的目标特征向量；
8.基于针对每一所述用户的目标特征向量，利用已训练的推荐模型，确定所述待推荐数据针对每一所述用户的第一分类标签；
9.所述已训练的推荐模型是基于同一用户对同一主题类型下兴趣度满足预设条件的第一类多媒体数据的特征向量，和兴趣度不满足所述预设条件的第二类多媒体数据的特征向量训练得到的；
10.基于所述一组用户中每一所述用户对应的第一分类标签，从所述一组用户中筛选出目标用户；
11.向所述目标用户推送所述待推荐数据。
12.第二方面，本技术实施例提供一种多媒体数据推送装置，包括第一获取模块、第一确定模块、第二确定模块、筛选模块和推送模块，其中：
13.所述第一获取模块，用于获取待推荐数据和候选的一组用户；
14.所述第一确定模块，用于确定所述待推荐数据针对所述一组用户中每一用户的目标特征向量；
15.所述第二确定模块，用于基于针对每一所述用户的目标特征向量，利用已训练的推荐模型，确定所述待推荐数据针对每一所述用户的第一分类标签；所述已训练的推荐模型是基于同一用户对同一主题类型下兴趣度满足预设条件的第一类多媒体数据的特征向量，和兴趣度不满足所述预设条件的第二类多媒体数据的特征向量训练得到的；
16.所述筛选模块，用于基于所述一组用户中每一所述用户对应的第一分类标签，从所述一组用户中筛选出目标用户；
17.所述推送模块，用于向所述目标用户推送所述待推荐数据。
18.本技术实施例提供的技术方案带来的有益效果至少包括：
19.在本技术实施例中，首先确定待推荐数据针对候选的一组用户中每一用户的目标特征向量，然后利用已训练的推荐模型确定针对每一用户的第一分类标签，再基于每一用户对应的第一分类标签从一组用户中筛选出目标用户，最后向目标用户推送该待推荐数据；如此，通过训练好的推荐模型输出的第一分类标签，能够准确判断每一用户对待推荐数据是否可能感兴趣；同时通过第一分类标签对一组用户进行分类，可以筛选出核心用户改变推荐策略，提高多媒体数据推送的成功率。
附图说明
20.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图，其中：
21.图1为本技术实施例提供的一种多媒体数据推送方法的流程示意图；
22.图2为本技术实施例提供的一种多媒体数据推送方法的流程示意图；
23.图3为本技术实施例提供的一种多媒体数据推送方法的流程示意图；
24.图4为本技术实施例提供的一种多媒体数据推送方法的流程示意图；
25.图5为本技术实施例提供的一种多媒体数据推送方法的流程示意图；
26.图6为本技术实施例提供的一种多媒体数据推送方法的逻辑流程图；
27.图7为本技术实施例提供的一种多媒体数据推送装置的组成结构示意图；
28.图8为本技术实施例提供的一种电子设备的硬件实体示意图。
具体实施方式
29.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。以下实施例用于说明本技术，但不用来限制本技术的范围。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
30.在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。
31.需要指出，本技术实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本技术实施例能够以除了在这里图示或描述的以外的顺序实施。
32.本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本技术实施例所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下
文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。
33.本技术实施例提供一种多媒体数据推送方法、装置、电子设备和存储介质。其中，该多媒体数据推送装置具体可以集成在终端或服务器中。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器，本技术在此不做限制。
34.图1为本技术实施例提供的一种多媒体数据推送方法的流程示意图，如图1所示，所述方法至少包括以下步骤：
35.步骤s110，获取待推荐数据和候选的一组用户；
36.这里，多媒体数据是由内容上相互关联的文本、图形、图像、声音、动画、活动图像等媒体的数据所形成的复合数据。待推荐数据可以是文本、图像、动画、音频、视频等形式的多媒体数据。待推荐数据可以是从互联网中获取的，也可以是从多媒体数据库中获取的。本技术实施例对待推荐数据的形式以及来源不作限定。
37.所述候选的一组用户可以是根据历史推荐经验分析的所述待推荐视频可能合适的一类人群，从而增加视频推荐的成功率。
38.步骤s120，确定所述待推荐数据针对所述一组用户中每一用户的目标特征向量；
39.这里，所述目标特征向量为表征待推荐数据与每一所述用户之间相关性的特征信息。以待推荐数据为视频为例，在一些实施方式中该特征信息可以包括待推荐视频中是否包括相应视频主题的关键词，以及用户与相应视频主题的关联关系；在另一些实施方式中，该特征信息还可以包括待推荐视频的题材、时长等属性信息。
40.步骤s130，基于针对每一所述用户的目标特征向量，利用已训练的推荐模型，确定所述待推荐数据针对每一所述用户的第一分类标签；
41.这里，所述待推荐数据针对每一所述用户的第一分类标签用于表征相应用户对待推荐数据是否感兴趣，例如第一分类标签可以感兴趣、一般感兴趣和不感兴趣。
42.所述已训练的推荐模型是基于同一用户对同一主题类型下兴趣度满足预设条件的第一类多媒体数据的特征向量，和兴趣度不满足所述预设条件的第二类多媒体数据的特征向量训练得到的。也就是说，针对同一用户，基于该用户感兴趣的多媒体针对该用户的特征向量和不感兴趣的多媒体数据针对该用户的特征向量，一起训练得到推荐模型。
43.值得注意的是，通过提取用户感兴趣的第一类多媒体数据和不感兴趣的第二类多媒体数据各自的关键信息，并在推荐模型进行聚类分析，可以得到针对某一特定用户偏好数据的模型参数。从而在预测过程中，利用该参数模型可以判断同一主题下的待推荐数据，得到某用户对待推荐数据是否感兴趣的第一分类标签。
44.在实施中，依次将待推荐数据针对一组用户中每一用户的目标特征向量输入到针对相应用户训练的推荐模型中，可以得到各用户各自对应的第一分类标签，例如用户a对应的第一分类标签为感兴趣，用户b对应的第一分类标签为一般感兴趣，用户c对应的第一分
类标签为不感兴趣。
45.步骤s140，基于所述一组用户中每一所述用户对应的第一分类标签，从所述一组用户中筛选出目标用户；
46.这里，在实施中可以基于数据推送的成本或推送任务要求，选出第一分类标签为对待推荐数据感兴趣和一般感兴趣的目标用户。
47.步骤s150，向所述目标用户推送所述待推荐数据。
48.这里，例如在感兴趣和一般感兴趣的目标用户所在终端中推送待推荐数据。例如多媒体数据为视频，则视频推送的方式可以包括但不局限于在特定应用程序中添加所述待推荐视频，或者在目标用户当前浏览的视频结尾处添加待推荐视频等。
49.在本技术实施例中，首先确定待推荐数据针对候选的一组用户中每一用户的目标特征向量，然后利用已训练的推荐模型确定针对每一用户的第一分类标签，再基于每一用户对应的第一分类标签从一组用户中筛选出目标用户，最后向目标用户推送该待推荐数据；如此，通过训练好的推荐模型输出的第一分类标签，能够准确判断每一用户对待推荐数据是否可能感兴趣；同时通过第一分类标签对一组用户进行分类，可以筛选出核心用户改变推荐策略，提高多媒体数据推送的成功率。
50.在一些实施例中，所述待推荐数据为待推荐视频，图2为本技术实施例提供的一种多媒体数据推送方法的流程示意图，如图2所示，所述方法可以通过以下步骤实现：
51.步骤s210，获取待推荐视频和候选的一组用户；
52.这里，所述待推荐视频可以是视频网站播放的视频，或者网页中插入的视频等。例如可以是各种影视视频、直播视频、节目视频以及广告短视频等等。
53.视频泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。网络技术的发达也促使视频的纪录片段以串流媒体的形式存在于因特网之上并可被电脑接收与播放。视频数据是随时间变化的图像流，含有更为丰富的其他媒体所无法表达的信息和内容。以视频的形式来传递信息，能够直观、生动、真实、高效地表达所要传递的内容。
54.步骤s220，确定所述待推荐视频与每一所述用户之间的关联特征向量；
55.这里，所述关联特征向量表征所述待推荐视频与每一所述用户的相关度信息。
56.在一些实施方式中，可以根据待推荐视频中是否包括用户感兴趣的视频主题的目标关键词，确定所述关联特征向量。其中，目标关键词是从待推荐视频所属的视频主题中提取的有区分度的关键词。
57.在一些实施方式中，可以根据用户偏好视频与特定主题之间的相关程度，确定所述关联特征向量。其中，某个用户与特定主题之间的相关程度可以通过计算用户偏好视频中出现目标关键词的频率体现，其中，用户偏好视频可以表现为用户近期收藏或浏览的视频。
58.步骤s230，确定所述待推荐视频的属性特征向量；
59.这里，所述属性特征向量为基于所述待推荐视频的属性信息提取的特征向量。其中，所述待推荐视频的属性信息包括所述待推荐视频的题材信息和时长信息等，例如针对数码类产品，相关的题材信息可以是知识科普、评测、购买建议等，时长信息则为待推荐视频本身的持续时长，如15秒、30秒等。
60.步骤s240，基于所述关联特征向量和所述属性特征向量，确定所述待推荐视频针对每一所述用户的目标特征向量；
61.这里，将关联特征向量和属性特征向量连接，共同组成所述待推荐视频针对每一所述用户的目标特征向量。
62.步骤s250，基于针对每一所述用户的目标特征向量，利用已训练的推荐模型，确定所述待推荐视频针对每一所述用户的第一分类标签；
63.这里，所述已训练的推荐模型是基于同一用户对同一主题类型下兴趣度满足预设条件的第一类视频的特征向量，和兴趣度不满足所述预设条件的第二类视频的特征向量训练得到的。
64.步骤s260，基于所述一组用户中每一所述用户对应的第一分类标签，从所述一组用户中筛选出目标用户；
65.步骤s270，向所述目标用户推送所述待推荐视频。
66.在本技术实施例中，通过提取待推荐视频与每一所述用户的相关度信息以及所述待推荐视频的自身的属性信息，确定待推荐视频针对每一所述用户的目标特征向量；进一步基于目标特征向量，通过训练好的推荐模型实现针对合适的目标用户推送待推荐视频，从而提供视频推送的成功率。
67.在一些实施例中，所述关联特征向量包括第一特征向量和第二特征向量，图3为本技术实施例提供的一种多媒体数据推送方法的流程示意图，如图3所示，所述步骤s220“基于所述关联特征向量和所述属性特征向量，确定所述待推荐视频针对每一所述用户的目标特征向量”可以通过以下步骤实现：
68.步骤s310，确定所述待推荐视频所属主题对应的目标关键词；
69.这里，获取大量与投放视频主题相关的初始关键词，并从中提取有区分度的词作为目标关键词。其中，初始关键词可以从视频简介中直接获取，也可以对待推荐视频进行特征提取得到，本技术实施例对此不作限定。
70.在一些实施方式中，获取与所述待推荐视频所属主题相关的至少两个初始关键词；确定每一所述初始关键词的词频
‑
逆文档频率值(term frequency inverse document frequency，tf
‑
idf)；将词频
‑
逆文档频率值满足第一阈值的初始关键词作为所述目标关键词。
71.需要说明的是，tf
‑
idf可以用来表征对区别文档最有意义的词语，也就是那些在文档中出现频率高，而在整个文档集合的其他文档中出现频率少的词语。在实施中，可以先将视频转化为音频，再将音频提取为对应的文档，进行文档进行分词处理，计算并统计得到tf
‑
idf。
72.示例地，短视频广告的主题为数码类产品，推荐的短视频广告总数是100000，出现过“小米手机”的有10条；则逆文档频率(inverse document frequency，idf)为lg(100000/10)＝4；对某一短视频广告对应的文档进行分词处理，得到总词数为100个，而“小米手机”这一词汇出现了3次，则“小米手机”一词在相应文档中的词频(term frequency，tf)是0.03。从而tf
‑
idf＝0.03*4＝0.12。选取tf
‑
idf值为前3的词作为该视频主题的目标关键词。
73.步骤s320，基于所述待推荐视频中是否包括所述目标关键词，确定第一特征向量；
74.这里，假设目标关键词有三个，在待推荐视频含有目标关键词1、目标关键词2、不含有目标关键词3的情况下，则第一特征向量可以表示为[1,1,0]。
[0075]
步骤s330，基于所述目标关键词与每一所述用户的兴趣偏好之间的关联关系，确定第二特征向量；
[0076]
在一些实施方式中，确定每一所述用户在第一时间段内收藏的至少一个待浏览视频；所述第一时间段为以当前时刻为终止时刻且固定时长的时间段；确定所述目标关键词在所述至少一个待浏览视频中出现的频次；基于所述频次，确定所述第二特征向量。
[0077]
步骤s340，基于所述待推荐视频的题材类别和时长信息，确定所述待推荐视频的属性特征向量；
[0078]
示例地，题材信息为数码类产品的分类可以为知识科普、评测、购买建议等，可以分别为用属性特征向量“a”、“b”、“c”进行标记。同时根据时长的区间分类，例如时长小于30秒(s)，30至60秒，60秒以上的短视频，分别用属性特征向量“x”、“y”、“z”进行标记。
[0079]
上述步骤s310至步骤s330实现了“确定所述待推荐视频与每一所述用户之间的关联特征向量”；步骤s340实现了“确定所述待推荐视频的属性特征向量”，步骤s310至步骤s330与步骤s340之间的执行顺序不限定。
[0080]
步骤s350，基于所述第一特征向量、所述第二特征向量和所述属性特征向量，确定所述待推荐视频针对每一所述用户的目标特征向量。
[0081]
这里，所述第一特征向量、所述第二特征向量和所述属性特征向量共同组成待推荐视频的一组目标特征向量。如果给同一个用户推荐n个视频，则对应生成了n组目标特征向量。
[0082]
在本技术实施例中，通过提取用户与待推荐视频的相关度信息即第一特征向量和第二特征向量，以及待推荐视频自身特征信息即属性特征向量，共同组成待推荐视频的一组目标特征向量，便于后续基于目标特征向量，通过训练好的推荐模型实现针对合适的目标用户推送待推荐视频，从而提供视频推送的成功率。
[0083]
图4为本技术实施例提供的一种多媒体数据推送方法的流程示意图，如图4所示，所述待训练的推荐模型的训练过程可以通过以下步骤实现：
[0084]
步骤s410，获取同一主题类型下的至少两个视频；
[0085]
这里，所述至少两个视频中可以包括针对某一用户可能感兴趣的视频和不感兴趣的视频。
[0086]
步骤s420，确定每一所述视频针对每一用户的第二分类标签；
[0087]
这里，所述第二分类标签用于表征用户对相应视频是否感兴趣。可以在随机投放过程中用户对视频a的反馈信息，设定视频a对该用户的第二分类标签。
[0088]
在实施中，确定用户对相应视频的浏览时长或点击次数，确定兴趣阈值，在用户对相应视频的兴趣度大于等于设定的兴趣阈值时，设定所述视频对所述用户的第二分类标签为感兴趣；在用户对相应视频的兴趣度小于兴趣阈值时，设定所述视频对所述用户的第二分类标签为不感兴趣。
[0089]
步骤s430，确定每一所述视频针对每一所述用户的目标特征向量；
[0090]
步骤s440，将每一所述视频针对每一所述用户的目标特征向量和相应用户的所述第二分类标签作为一组训练数据，对待训练的推荐模型进行训练；
[0091]
这里，所述第二分类标签包括感兴趣和不感兴趣，提取同一用户感兴趣视频和不兴趣视频各自的目标特征向量即两类关键信息，在推荐模型中对两类关键信息进行聚类分析，可以得到某一特定用户感兴趣的视频的共同特征参数即模型参数。
[0092]
在实施中，可以利用机器学习中的决策树模型(例如xgboost)构建模型预测。具体方法为将一组训练数据导入相关库，读取据；划分数据集(选取部分数据作为训练集、部分作为测试集)；调整构建决策树的深度(越大越容易过拟合)、随机采样训练样本的比例、生成决策树时进行的列采样比例、迭代次数等模型参数；模型训练后每个用户得到对应视频主题的一个自身偏好视频的模型参数，保存该模型参数。
[0093]
决策树(decision tree，dt)是一种简单的机器学习方法，其本质是一堆决策结构以树形组合起来，叶子节点代表最终的预测值或类别。决策树本质上是在做若干个决策，以判定输入的数据对应的类别(分类)或数值(回归)。每一次决策其实是一次划分，划分的方法成为了关键，不同的决策树对应不同的划分方法。
[0094]
步骤s450，针对每一所述用户，在所述待训练的推荐模型的模型参数收敛的情况下，得到所述已训练的推荐模型。
[0095]
这里，保存所述已训练的推荐模型针对每一用户的模型参数。
[0096]
在本技术实施例中，通过提取同一主题类型下不同类视频针对每一用户的特征向量进行推荐模型的训练，使得训练好的推荐模型能够准确判断每一用户对待推荐视频是否可能感兴趣，进而实现针对合适的目标用户推送待推荐视频。本技术实施例提供的方案使得视频推荐过程利用模型自动化实现，提高了视频推荐的准确性和可靠性。
[0097]
图5为本技术实施例提供的一种多媒体数据推送方法的流程示意图，如图5所示，所述步骤s420“确定每一所述视频针对每一用户的第二分类标签”通过以下步骤实现：
[0098]
步骤s510，在视频推荐平台上随机投放属于所述主题类型的第一视频；
[0099]
这里，所述视频推荐平台可以为户外广告机、数字标牌货架、智能售卖机、联网商店、交互式广告牌等视频广告终端中的应用界面。
[0100]
需要说明的是，由于不同主题类型的视频的关键词和题材信息差距过大、影响推荐模型的有效性，因此对某一用户随机投放同一主题类型的视频并提取特征向量进行模型训练，使得推荐模型在预测过程中针对该主题类型下的待推荐视频的推荐更准确和高效。
[0101]
步骤s520，响应于接收到每一所述用户的反馈信息，确定所述第一视频针对相应用户的第二分类标签。
[0102]
这里，所述用户的反馈信息可以包括浏览时长、点击次数、是否关注以及评论信息等信息，所述第二分类标签包括感兴趣、一般感兴趣和不感兴趣；
[0103]
在一些实施方式中，上述步骤s520可以通过以下过程实现：在每一所述用户的浏览时长大于第二阈值的情况下，确定所述第一视频针对相应用户的第二分类标签为感兴趣；在每一所述用户的浏览时长大于第三阈值且小于所述第二阈值的情况下，确定所述第一视频针对相应用户的第二分类标签为一般感兴趣；在每一所述用户的浏览时长小于所述第三阈值的情况下，确定所述第一视频针对相应用户的第二分类标签为不感兴趣。
[0104]
示例地，设第二阈值为短视频广告总时长的80％，第三阈值为短视频广告总时长的50％，在用户点击并完整观看了短视频广告的情况下，将该短视频广告针对该用户的第二分类标签确定为感兴趣；在用户点击并观看该短视频广告的进度超过了短视频广告总时
长的1/2的情况下，则将该短视频广告针对该用户的第二分类标签确定为一般感兴趣；其余情况将第二分类标签确定为不感兴趣。
[0105]
在本技术实施例中，通过随机投放相关主题的第一视频给用户，获取用户的点击次数、预览时长等反馈信息，并基于用户的反馈信息和设定的阈值，确定第二分类标签，从而将用户对该类视频的反馈标记为第二分类标签。这样，将获得的第二分类标签和每一视频针对该用户的目标特征向量作为训练数据导入模型训练，可以得到相应用户对同类视频主题的自身偏好视频的模型参数。
[0106]
下面结合一个具体实施例对上述多媒体数据推送方法进行说明，然而值得注意的是，该具体实施例仅是为了更好地说明本技术，并不构成对本技术的不当限定。
[0107]
在电商广告运营的过程中，往往需要根据用户的行为反馈对用户进行标签分类，利用数据分析的技术手段判断筛选出核心用户(对产品感兴趣、有购买意愿的用户)，在投放短视频广告(一种多媒体数据)时，可以根据用户的点击信息和用户的关注信息、评论信息等用户反馈信息进行用户分类，针对筛选出的核心用户改变投放策略，提高广告投放的成功率。
[0108]
图6为本技术实施例提供的一种多媒体数据推送方法的逻辑流程图，如图6所示，所述方法至少包括以下步骤：
[0109]
步骤s610，随机投放短视频广告，获取用户偏好信息并确定第二分类标签；
[0110]
这里，用户偏好信息可以表现为用户对随机投放的短视频广告的反馈标记。
[0111]
选取某一用户，由于不同类型广告关键词和题材信息差距过大、影响模型的有效性，因此随机投放同一主题类型(例如都是电子产品相关的主题、或者都是服装购物类型)的短视频广告。
[0112]
根据用户浏览短视频广告的时长和点击反馈次数共同设定第二阈值，判断该用户对短视频广告的喜好程度，将该短视频广告针对该用户的第二分类标签标记为感兴趣或不感兴趣。
[0113]
步骤s620，提取用户对短视频广告的反馈特征信息；
[0114]
这里，提取步骤s610中随机投放的短视频广告和用户之间相关性的反馈特征信息(相当于目标特征向量)，每个短视频广告均提取该反馈特征信息。
[0115]
在一些实施方式中，提取的反馈特征信息主要分为两类：用户与短视频广告的相关度信息(相当于关联特征向量)以及短视频广告自身的特征信息(相当于属性特征向量)。其中，用户与短视频广告的关联特征向量包括表征短视频广告中是否包含关键词的第一特征向量和表征一个用户与短视频广告对应主题之间相关程度的第二特征向量。
[0116]
对于第一特征向量，获取大量与投放短视频广告主题相关的关键词(可以从短视频广告简介的关键词中直接获取)，计算统计词频
‑
逆文档频率(term frequency
–
inverse document frequency，tf
‑
idf)，提取有区分度的词作为关键词。基于该短视频广告是否包含该关键词，确定第一特征向量。
[0117]
对于第二特征向量即视频主题相关度，表示用户本身的偏好和视频主题之间的相关性。可以通过用户近期所收藏的待预览视频的总数中相关主题词出现的频率来计算第二特征向量，例如用户近期收藏了10个待预览视频，“手机”、“电脑”等相关主题词在3个待预览视频中出现，那么视频主题相关度的取值为0.3。
[0118]
对视频自身的特征信息如题材信息、时长信息进行分类，得到属性特征向量。以上特征向量共同组成某视频的一组目标特征向量，是否感兴趣作为目标特征向量分类的标签。如果给同一个用户推荐n个视频，则对应生成了n组目标特征向量。
[0119]
步骤s630，利用反馈特征信息和第二分类标签作为训练数据进行训练，得到已训练的推荐模型；
[0120]
这里，将步骤s620得到的反馈特征信息和步骤s610中得到的用户偏好信息作为训练数据导入模型训练。经过训练后，每个用户得到对应视频主题的一个自身偏好视频的模型参数。
[0121]
步骤s640，利用已训练的推荐模型预测待推荐视频对一组用户的第一分类标签；
[0122]
这里，当准备在短视频平台投放新的视频即待推荐视频时，提取准备推荐的一组用户中每一用户对该待推荐视频的反馈特征信息(包括上述第一特征向量、第二特征向量和属性特征向量)，利用训练好的推荐模型，预测该待推荐视频对一组用户的分类标签，该分类标签至少分为感兴趣、一般感兴趣和不感兴趣等。
[0123]
步骤s650，基于第一分类标签，筛选出目标用户进行推荐。
[0124]
这里，根据投放成本，从一组用户中筛选出目标用户，例如在感兴趣和一般感兴趣的用户中选择目标用户实现待推荐视频向目标用户定向投放。
[0125]
在一些实施方式中，待推荐视频可以为短视频广告，可以与视频作者合作，在目标用户当前浏览的视频结尾部分插入短视频广告，从而提高广告投放的成功率。
[0126]
在本技术实施例中，在投放待推荐视频(可以为短视频广告)时，可以根据用户对视频的反馈特征信息训练推荐模型，通过推荐模型预测待推荐视频对一组用户的分类标签，进而基于分类标签筛选出目标用户。这样针对目标用户改变投放策略，可以提高广告投放的成功率。本技术实施例利用数据分析的技术手段提高广告投放成功的针对性通过，同时简化核心用户筛选流程，可以广泛适用于短视频平台的广告推送场景中。
[0127]
基于前述的实施例，本技术实施例再提供一种多媒体数据推送装置，所述装置包括所包括的各模块、以及各模块所包括的各子模块及各单元，可以通过电子设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(central processing unit，cpu)、微处理器(micro processing unit，mpu)、数字信号处理器(digital signal processor，dsp)或现场可编程门阵列(field programmable gate array，fpga)等。
[0128]
图7为本技术实施例提供的一种多媒体数据推送装置的组成结构示意图，如图7所示，所述包括第一获取模块710、第一确定模块720、第二确定模块730、筛选模块740和推送模块750，其中：
[0129]
所述第一获取模块710，用于获取待推荐数据和候选的一组用户；
[0130]
所述第一确定模块720，用于确定所述待推荐数据针对所述一组用户中每一用户的目标特征向量；
[0131]
所述第二确定模块730，用于基于针对每一所述用户的目标特征向量，利用已训练的推荐模型，确定所述待推荐数据针对每一所述用户的第一分类标签；所述已训练的推荐模型是基于同一用户对同一主题类型下兴趣度满足预设条件的第一类多媒体数据的特征向量，和兴趣度不满足所述预设条件的第二类多媒体数据的特征向量训练得到的；
[0132]
所述筛选模块740，用于基于所述一组用户中每一所述用户对应的第一分类标签，从所述一组用户中筛选出目标用户；
[0133]
所述推送模块750，用于向所述目标用户推送所述待推荐数据。
[0134]
在一些可能的实施例中，所述待推荐数据为待推荐视频，所述第二确定模块730包括第一确定子模块、第二确定子模块和第三确定子模块，其中：所述第一确定子模块，用于确定所述待推荐视频与每一所述用户之间的关联特征向量；所述第二确定子模块，用于确定所述待推荐视频的属性特征向量；所述第三确定子模块，用于基于所述关联特征向量和所述属性特征向量，确定所述待推荐视频针对每一所述用户的目标特征向量。
[0135]
在一些可能的实施例中，所述关联特征向量包括第一特征向量和第二特征向量，所述第一确定子模块包括第一确定单元、第二确定单元和第三确定单元，其中：所述第一确定单元，用于确定所述待推荐视频所属主题对应的目标关键词；所述第二确定单元，用于基于所述待推荐视频中是否包括所述目标关键词，确定第一特征向量；所述第三确定单元，用于基于所述目标关键词与每一所述用户的兴趣偏好之间的关联关系，确定第二特征向量
[0136]
在一些可能的实施例中，所述第三确定单元包括第一确定子单元、第二确定子单元和第三确定子单元，其中：所述第一确定子单元，用于确定每一所述用户在第一时间段内收藏的至少一个待浏览视频；所述第一时间段为以当前时刻为终止时刻且固定时长的时间段；所述第二确定子单元，用于确定所述目标关键词在所述至少一个待浏览视频中出现的频次；所述第三确定子单元，用于基于所述频次，确定所述第二特征向量。
[0137]
在一些可能的实施例中，所述第三确定子模块还用于基于所述待推荐视频的题材类别和时长信息，确定所述待推荐视频的属性特征向量。
[0138]
在一些可能的实施例中，所述第一确定单元包括获取子单元、第四确定子单元和第五确定子单元，其中：所述获取子单元，用于获取与所述待推荐视频所属主题相关的至少两个初始关键词；所述第四确定子单元，用于确定每一所述初始关键词的词频
‑
逆文档频率值；所述第五确定子单元，用于将词频
‑
逆文档频率值满足第一阈值的初始关键词作为所述目标关键词。
[0139]
在一些可能的实施例中，所述装置还包括第二获取模块、第三确定模块、第四确定模块、训练模块和第五确定模块，其中：所述第二获取模块，用于获取同一主题类型下的至少两个视频；所述第三确定模块，用于确定每一所述视频针对每一用户的第二分类标签；所述第四确定模块，用于确定每一所述视频针对每一所述用户的目标特征向量；所述训练模块，用于将每一所述视频针对每一所述用户的目标特征向量和相应用户的所述第二分类标签作为一组训练数据，对待训练的推荐模型进行训练；所述第五确定模块，用于针对每一所述用户在所述待训练的推荐模型的模型参数收敛的情况下，得到所述已训练的推荐模型。
[0140]
在一些可能的实施例中，所述第三确定模块包括投放子模块和第四确定子模块，其中：所述投放子模块，用于在视频推荐平台上随机投放属于所述主题类型的第一视频；所述第四确定子模块，用于响应于接收到每一所述用户的反馈信息，确定所述第一视频针对相应用户的第二分类标签。
[0141]
在一些可能的实施例中，所述反馈信息至少包括浏览时长，所述第二分类标签包括感兴趣、一般感兴趣和不感兴趣；所述第四确定子模块包括第四确定单元、第五确定单元和第六确定单元，其中：所述第四确定单元，用于在每一所述用户的浏览时长大于第二阈值
的情况下，确定所述第一视频针对相应用户的第二分类标签为感兴趣；所述第五确定单元，用于在每一所述用户的浏览时长大于第三阈值且小于所述第二阈值的情况下，确定所述第一视频针对相应用户的第二分类标签为一般感兴趣；所述第六确定单元，用于在每一所述用户的浏览时长小于所述第三阈值的情况下，确定所述第一视频针对相应用户的第二分类标签为不感兴趣。
[0142]
这里需要指出的是：以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本技术装置实施例中未披露的技术细节，请参照本技术方法实施例的描述而理解。
[0143]
需要说明的是，本技术实施例中，如果以软件功能模块的形式实现上述多媒体数据推送方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得电子设备(可以是具有摄像头的智能手机、平板电脑等)执行本技术各个实施例所述方法的全部或部分。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read only memory，rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本技术实施例不限制于任何特定的硬件和软件结合。
[0144]
对应地，本技术实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中任一所述多媒体数据推送方法中的步骤。对应地，本技术实施例中，还提供了一种芯片，所述芯片包括可编程逻辑电路和/或程序指令，当所述芯片运行时，用于实现上述实施例中任一所述多媒体数据推送方法中的步骤。对应地，本技术实施例中，还提供了一种计算机程序产品，当该计算机程序产品被电子设备的处理器执行时，其用于实现上述实施例中任一所述多媒体数据推送方法中的步骤。
[0145]
基于同一技术构思，本技术实施例提供一种电子设备，用于实施上述方法实施例记载的多媒体数据推送方法。图8为本技术实施例提供的一种电子设备的硬件实体示意图，如图8所示，所述电子设备800包括存储器810和处理器820，所述存储器810存储有可在处理器820上运行的计算机程序，所述处理器820执行所述程序时实现本技术实施例任一所述多媒体数据推送方法中的步骤。
[0146]
存储器810配置为存储由处理器820可执行的指令和应用，还可以缓存待处理器820以及电子设备中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(flash)或随机访问存储器(random access memory，ram)实现。
[0147]
处理器820执行程序时实现上述任一项的多媒体数据推送方法的步骤。处理器820通常控制电子设备800的总体操作。
[0148]
上述处理器可以为特定用途集成电路(application specific integrated circuit，asic)、数字信号处理器(digital signal processor，dsp)、数字信号处理装置(digital signal processing device，dspd)、可编程逻辑装置(programmable logic device，pld)、现场可编程门阵列(field programmable gate array，fpga)、中央处理器(central processing unit，cpu)、控制器、微控制器、微处理器中的至少一种。可以理解地，实现上述处理器功能的电子器件还可以为其它，本技术实施例不作具体限定。
[0149]
上述计算机存储介质/存储器可以是只读存储器(read only memory，rom)、可编程只读存储器(programmable read
‑
only memory，prom)、可擦除可编程只读存储器(erasable programmable read
‑
only memory，eprom)、电可擦除可编程只读存储器(electrically erasable programmable read
‑
only memory，eeprom)、磁性随机存取存储器(ferromagnetic random access memory，fram)、快闪存储器(flash memory)、磁表面存储器、光盘、或只读光盘(compact disc read
‑
only memory，cd
‑
rom)等存储器；也可以是包括上述存储器之一或任意组合的各种电子设备，如移动电话、计算机、平板设备、个人数字助理等。
[0150]
这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本技术存储介质和设备实施例中未披露的技术细节，请参照本技术方法实施例的描述而理解。
[0151]
应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本技术的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本技术的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术实施例的实施过程构成任何限定。上述本技术实施例序号仅仅为了描述，不代表实施例的优劣。
[0152]
需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0153]
在本技术所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。
[0154]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本技术实施例方案的目的。另外，在本技术各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。
[0155]
或者，本技术上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得设备自动测试线执行本
申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。
[0156]
本技术所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。本技术所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。
[0157]
以上所述，仅为本技术的实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应以所述权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：物品信息的存储方法、装置、电子设备和存储介质与流程

多媒体数据推送方法及装置与流程

相关文献

最热文献