一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

推荐模型训练方法、内容推荐方法、装置及电子设备与流程

2022-11-13 12:55:29 来源:中国专利 TAG:


1.本发明涉及机器学习领域,具体而言,涉及一种推荐模型训练方法、内容推荐方法、装置及电子设备。


背景技术:

2.推荐系统是社交平台、短视频平台或知识付费平台等互联网平台向用户提供内容推荐的智能化系统。推荐系统一般包含推荐算法模型、算法数据加工、算法模型训练、算法模型线上推理和策略控制等主要部分。
3.衡量一个推荐系统效果好坏的指标之一是点击率,推荐系统通过算法模型预测用户点击内容的概率,把概率高的内容排在前面展示给用户,从而提升整体的点击率。
4.近些年随着互联网技术的迅猛发展,互联网平台上的内容信息海量化,每天都有新的内容被创造出来。对于被创造出来的新推荐内容,由于新推荐内容对应的业务场景初始流量少,导致推荐系统的精确度较差。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种推荐模型训练方法、内容推荐方法、装置及电子设备,其能够提供一种精确度高的推荐系统,并提高新内容推荐的精确度。
6.为了实现上述目的,本发明实施例采用的技术方案如下:
7.第一方面,本发明实施例提供一种推荐模型训练方法,所述方法包括:
8.根据各用户对曝光的新推荐内容的点击情况,构建初始样本集;其中,所述初始样本包括与用户一一对应的多个子样本集,每个所述子样本集包括在所对应的用户为推荐对象的情况下,每个所述新推荐内容为正样本或负样本;
9.从各用户的历史点击内容中获取成熟内容;其中,每个用户的成熟内容至少为一个;
10.根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集;
11.基于所述迁移后的样本集,对点击率预估模型进行训练,得到成熟的推荐模型。
12.进一步地,所述根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集的步骤,包括:
13.针对每个所述子样本集,计算所述子样本集对应的用户的成熟内容与所述子样本集中的每个负样本之间的匹配度;
14.将每个所述子样本集中所述匹配度达到预设阈值的负样本迁移为正样本,得到迁移后的样本集。
15.进一步地,所述计算所述子样本集对应的用户的成熟内容与所述子样本集中的每个负样本之间的匹配度的步骤,包括:
16.针对所述子样本集中的每个负样本,计算所述负样本与每个关联成熟内容之间的
内容交集度,并将最大的内容交集度作为所述负样本的匹配度;
17.其中,所述关联成熟内容为所述子样本集对应的用户的成熟内容。
18.进一步地,所述计算所述子样本集对应的用户的成熟内容与所述子样本集中的每个负样本之间的匹配度的步骤,包括:
19.针对所述子样本集,将所述子样本集对应的用户的每个所述成熟内容向量化得到多个成熟向量;
20.针对所述子样本集中的每个负样本,将所述负样本向量化得到所述负样本的样本向量,计算所述样本向量与每个所述成熟向量间的余弦值,并将最优的余弦值作为所述负样本的匹配度。
21.进一步地,所述从各用户的历史点击内容中获取成熟内容的步骤,包括:
22.统计各用户对历史点击内容的点击次数,将各用户的历史点击内容中点击次数达到次数阈值的内容作为成熟内容;
23.或者,将各用户的历史点击内容中阅读时长或播放时长达到时长阈值的内容作为成熟内容。
24.进一步地,所述基于所述迁移后的样本集,对点击率模型进行训练,得到成熟的推荐模型的步骤,包括:
25.对每个所述迁移后的子样本集的每个样本进行内容特征添加,并为每个样本关联所对应的用户的属性特征,得到目标样本集;
26.将所述目标样本集分为训练样本和测试样本,以所述训练样本对初始点击率模型进行迭代训练,以所述测试样本对迭代训练的点击率模型进行测试,得到成熟的推荐模型。
27.第二方面,本发明实施例提供一种内容推荐方法,所述方法包括:
28.将新推荐内容输入预先训练的推荐模型,得到所述推荐模型输出的预估点击率;其中,所述推荐模型采用如第一方面所述的推荐模型训练方法训练得到,所述预估点击率包括各用户对每个所述新推荐内容的预估点击率;
29.在任一所述用户为推荐对象时,根据所述用户的所对应的预估点击率,对所有所述新推荐内容进行排序,并依据排序顺序,将所有所述新推荐内容在用户界面上显示。
30.第三方面,本发明实施例提供一种推荐模型训练装置,所述装置包括第一获取模块、第二获取模块、样本处理模块和训练模块;
31.所述第一获取模块,用于根据各用户对曝光的新推荐内容的点击情况,构建初始样本集;其中,所述初始样本包括与用户一一对应的多个子样本集,每个所述子样本集包括在所对应的用户为推荐对象的情况下,每个所述新推荐内容为正样本或负样本;
32.所述第二获取模块,用于从各用户的历史点击内容中获取成熟内容;其中,每个用户的成熟内容至少为一个;
33.所述样本处理模块,根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集;
34.所述训练模块,用于基于所述迁移后的样本集,对点击率预估模型进行训练,得到成熟的推荐模型。
35.第四方面,本发明实施例提供一种内容推荐装置,所述装置包括预估模块和推荐显示模块;
36.所述预估模块,将新推荐内容输入预先训练的推荐模型,得到所述推荐模型输出的预估点击率;其中,所述推荐模型采用如第一方面所述的推荐模型训练方法训练得到,所述预估点击率包括各用户对每个所述新推荐内容的预估点击率;
37.所述推荐显示模块,用于在任一所述用户为推荐对象时,根据所述用户所对应的预估点击率,对所有所述新推荐内容进行排序,并依据排序顺序,将所有所述新推荐内容在用户界面上显示。
38.第五方面,本发明实施例提供一种电子设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行所述计算机程序时实现如第一方面所述的推荐模型训练方法,或实现如第二方面所述的内容推荐方法。
39.本发明实施例提供的推荐模型训练方法、内容推荐方法、装置及电子设备,通过各用户对曝光的新推荐内容的点击情况,构建初始样本集,从而根据从各用户的历史点击内容中获取的成熟内容,将初始样本集的每个子样本中达到预设条件的负样本迁移为正样本,以扩大新推荐内容的正样本量,并根据迁移后的样本集训练出成熟的推荐模型,从而能够提高推荐系统对新推荐内容的推荐精确度。
40.为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
41.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
42.图1示出了本发明实施例提供的内容推荐系统的方框示意图。
43.图2示出了本发明实施例提供的内容推荐方法的流程示意图。
44.图3示出了本发明一实施例提供的用户界面的结构示意图。
45.图4示出了本发明实施例提供的推荐模型训练系统的结构示意图。
46.图5示出了本发明实施例提供的推荐模型训练方法的流程示意图。
47.图6示出了图5中步骤s25的部分子步骤的流程示意图之一。
48.图7示出了图5中步骤s25的部分子步骤的流程示意图之二。
49.图8示出了图6中步骤s251的部分子步骤的流程示意图。
50.图9示出了图5中步骤s27的部分子步骤的流程示意图。
51.图10示出了本发明实施例提供的内容推荐装置的方框示意图。
52.图11示出了发明实施例提供的推荐模型训练装置的方框示意图。
53.图12示出了本发明实施例提供的电子设备的方框示意图。
54.附图标记:100-内容推荐系统;110-推荐服务器;120-客户端;130-推荐模型训练系统;140-训练服务器;150-管理客户端;160-内容推荐装置;170-预估模块;180-推荐显示模块;190-推荐模型训练装置;200-第一获取模块;210-第二获取模块;220-样本处理模块;230-训练模块;240-电子设备。
具体实施方式
55.下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
56.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
57.需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
58.近些年随着互联网技术的迅猛发展,互联网平台上的内容信息海量化,每天都有新的内容被创造出来。对于被创造出来的新推荐内容,由于新推荐内容对应的业务场景初始流量少,导致推荐模型(算法模型)可用来训练的样本数据量少。并且,由于用户对新内容不熟,初始转化率过低,导致训练样本中正样本数据非常少,数据倾斜非常严重。在样本数据量少,且样本时中的正样本数据少所存在的数据倾斜,导致互联网平台的推荐模型对新内容的推荐精确度差。
59.对于样本数量少的情况,目前有两种解决方案:对正样本进行上采样和新内容跨域迁移训练。第一种方案在初始化转化率过低的情况下并不适用,对用户误触的点击行为进行上采样,会带来过多的噪声,依旧会导致推荐模型的精确度差。第二种方案无法解决样本倾斜严重的问题,同时忽略内容id特征,以及无法精细刻画用户对内容是否感兴趣,导致训练出来的模型依旧精确度低。
60.基于上述考虑,本发明实施例提供一种内容推荐方法,以及内容推荐方法所使用的推荐模型的训练方法,其能够在新推荐内容的样板数据量少且样本倾斜严重的情况下,训练出精确度更高的推荐模型,从而提高推荐系统对新推荐内容的推荐精确度。
61.本发明实施例提供的内容推荐方法,可以应用于如图1所示的内容推荐系统100中,该内容推荐系统100包括推荐服务器110和多个客户端120,客户端120可以通过网络与推荐服务器110通信连接。推荐服务器110上部署有互联网平台。
62.客户端120可以通过网络登录互联网平台。其中,每个客户端120对应至少一个用户,客户端120以用户的形式登录互联网平台。互联网平台可以是短视频平台、知识付费平台和社交平台等。
63.在实际应用中,用户可以是互联网平台的会员或普通用户。
64.在一种实施方式中,提供一种内容推荐方法,参照图2,包括以下步骤,在本实施方式中,以该内容推荐方法应用于图1中的推荐服务器110来举例说明。
65.s11,将新推荐内容输入预先训练的推荐模型,得到推荐模型输出的预估点击率。
66.其中,新推荐内容至少为一个,推荐模型可以采用本发明实施例提供的推荐模型
训练方法训练得到。预估点击率包括各用户对每个新推荐内容的预估点击率。
67.s12,在任一用户为推荐对象时,根据用户的所对应的预估点击率,对所有新推荐内容进行排序,并依据排序顺序,将所有新推荐内容在用户界面上显示。
68.其中,可以将带有内容特征的新推荐内容输入预先训练的推荐模型,也可以由推荐模型对新推荐内容进行内容特征提取后,再进行预估。
69.并且可以是自动获取预存的用户的属性特征(包括但不限于是:用户注册时间,是否付费用户和用户兴趣类别等),也可以是将用户的属性特征输入至推荐模型,从而推荐模型根据各用户的属性特征以及新推荐内容的内容特征,预测出每个用户对各新推荐内容的预估点击率。
70.在用户界面上进行各新推荐内容的展示时,每个新推荐内容可以包括多个维度数据,例如,参照图3,每个内容的展示维度可以包括内容形式(例如,声音听单),内容标题:听单标题,内容播放量:新内容累计的播放量,时间发生时间戳:记录曝光数据展示的时间,用户id与新的内容id。
71.与现有的推荐方法相比,本发明提供的内容推荐方法基于本发明实施例提供推荐模型训练方法训练出的推荐模型,预估出各用户对每个新推荐内容的预估点击率,能够极大地提高新推荐内容的推荐精确度。
72.本发明实施例提供的推荐模型训练方法,可以应用于如图4所示的推荐模型训练系统130中,该推荐模型训练系统130包括训练服务器140和管理客户端150,训练服务器140和管理客户端150之间可以通过网络通信连接。
73.管理客户端150,用于将待训练的点击量预估模型输入至训练服务器140。
74.训练服务器140,用于在接收到点击量预估模型之后,采用本发明实施例提供的推荐模型训练方法训练出推荐模型,并将成熟的推荐模型输入至体推荐服务器110。
75.需要说明的是,训练服务器140和推荐服务器110也可以是同一台服务器,也可以是同一个服务器集群中的服务器。
76.在一个实施方式中,参照图5,提供一种推荐模型训练方法,本实施方式中以该推荐模型训练方法应用于图4中的训练服务器140来举例说明,该推荐模型训练方法包括以下步骤。
77.s21,根据各用户对曝光的新推荐内容的点击情况,构建初始样本集。
78.在本实施方式中,用户指的是新推荐内容所属的互联网平台的用户。初始样本包括与用户一一对应的多个子样本集。并且,初始样本集中的每个子样本集包括在所对应的用户为推荐对象的情况下,每个新推荐内容为正样本或负样本。
79.s23,从各用户的历史点击内容中获取成熟内容。
80.在本实施方式中,历史点击内容指的是用户曾经在互联网平台上点击浏览的内容,成熟内容指的是用户深度感兴趣的历史点击内容。其中,每个用户的成熟内容至少为一个。
81.s25,根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集。
82.s27,基于迁移后的样本集,对点击率预估模型进行训练,得到成熟的推荐模型。
83.训练服务器140可以通过大数据计算引擎获取互联网平台曝光给各用户的新推荐
内容,以及用户对新推荐内容的点击情况。也可以为人工获取互联网平台曝光给各用户的新推荐内容,以及用户对新推荐内容的点击情况,并通过管理客户端150将获取数据传输至训练服务器140。
84.训练服务器140获取到新推荐内容,以及各用户对新推荐内容的点击情况后,构建初始样本集。在一个示例中,假设有3个用户和3个新推荐内容(实际应用中,远远大于这些数),3个用户分别是用户a、用户b和用户c,3个新推荐内容分别是1号新推荐内容,2号新推荐内容和3号新推荐内容。用户a仅对1号新推荐内容进行点击,用户b点击了2号新推荐内容和3号新推荐内容,用户c每个点击任一个新推荐内容,则在用户a的子样本集中,1号新推荐内容是正样本,其余是负样本,对于用户b的子样本集,1号新推荐内容是负样本,其余是正样本,对于用户c的子样本集,3个新推荐内容均为负样本。
85.与传统方法相比,本发明实施例提供的推荐模型训练方法根据各用户的历史点击内容中获取的成熟内容,将初始样本集的每个子样本中达到预设条件的负样本迁移为正样本,以扩大新推荐内容的正样本量,实现在不降低样本数据量的情况下,提升了正样本的数据量,同时克服了正样本上采样可能引入过多噪声的问题,进而根据迁移后的样本集训练出成熟的推荐模型,极大地提高了推荐系统对新推荐内容的推荐精确度。
86.针对步骤s21,其中,新推荐内容可以是曝光内容,也可以是曝光内容的子内容。
87.如图3所示,曝光内容指的是一级页面上的新内容,子内容是指次级页面上的内容。其中,次级页面指的是一级页面的下属页面(二级页面、三级页面等),例如,一本书的标题属于一级页面,目录属于二级页面,每个章节的内容属于三级页面,目录和章节内容属于标题的子内容。曝光内容和子内容若被点击,则为正样本(也就是样本标签label=1),若未被点击则均为负样本(也就是样本标签label=0)。
88.进一步地,针对步骤s23中的成熟内容指的是用户深度感兴趣的历史点击内容。评估深度感兴趣的方式可以灵活设置,例如,可以是按照预设规则进行评估,也可以是采用神经网络进行判定。在本实施方式中,步骤s23可以通过以下方式实现:统计各用户对历史点击内容的点击次数,将各用户的历史点击内容中点击次数达到次数阈值的内容作为成熟内容。
89.或者,步骤s23还可以通过以下方式实现:将各用户的历史点击内容中阅读时长或播放时长达到时长阈值的内容作为成熟内容。
90.需要说明的是,上述以点击次数、阅读时长和播放时长作为成熟内容判定的方式仅仅是一种举例,而非仅此限定。
91.针对步骤s25,预设条件的设定可以灵活设置,例如,可以是相似度达到匹配度阈值。为了在不降低样本数据量的情况下,提升正样本的数据量,在一种实施方式中,参照图6,步骤s25可以包括以下步骤。
92.s251,针对每个子样本集,计算子样本集对应的用户的成熟内容与子样本集中的每个负样本之间的匹配度。
93.s252,将每个子样本集中匹配度达到预设阈值的负样本迁移为正样本,得到迁移后的样本集。
94.每个用户的成熟内容至少为一条,在本实施方式中,预设阈值可以是根据历史经验设置的一个值。
95.匹配度的计算方式可以灵活设置,例如,可以是采用神经网络计算得到,也可以是按照预设规则计算得到,在本实施例中不作具体限定。在一种可能的实时方式中,参照图7,可以通过以下步骤得到匹配度。
96.s2511,针对子样本集中的每个负样本,计算负样本与每个关联成熟内容之间的内容交集度,并将最大的内容交集度作为负样本的匹配度。
97.其中,关联成熟内容为子样本集对应的用户的成熟内容。
98.在一个示例中,新推荐内容的内容集合a,一个关联成熟内容的内容集合b,二者的匹配度计算公式为:s=size(a∩b)。其中,a∩b指的是集合a与集合b的交集的子元素的个数。
99.在另一种实施方式中,参照图8,还可以通过以下步骤得到匹配度。
100.s2512,针对子样本集,将子样本集对应的用户的每个成熟内容向量化得到多个成熟向量。
101.s2513,针对子样本集中的每个负样本,将负样本向量化得到负样本的样本向量,计算样本向量与每个成熟向量间的余弦值,并将最优的余弦值作为负样本的匹配度。
102.在本实施方式中,采用word2vec算法得到:每个成熟内容的成熟向量,以及每个负样本的样本向量。其中,word2vec算法通过学习文本,并用向量的方式表征词的语义信息。
103.通过上述步骤s251-s252及其子步骤,将与用户的成熟内容的匹配度达到预设阈值的负样本迁移为正样本,能够在不更改样本数据量的情况下,减小样本倾斜度,有助于提高推荐模型的准确度。
104.对初始样本集的所有子样本集中的负样本的迁移结束后,得到迁移后的样本集,基于迁移后的样本集训练出推荐模型。在一种实施方式中,为了进一步提高推荐模型的推荐精确度,在迁移后的样本集中引入用户对内容是否感兴趣的刻画。参照图9,上述步骤s27可以包括以下子步骤。
105.s271,对每个迁移后的子样本集的每个样本进行内容特征添加,并为每个样本关联所对应的用户的属性特征,得到目标样本集。
106.其中,内容特征包括但不限于是:内容分类和内容点击率(内容播放率)。用户的属性特征包括用户注册时间,是否付费用户和用户兴趣类别。
107.s272,将目标样本集分为训练样本和测试样本,以训练样本对初始点击率模型进行迭代训练,以测试样本对迭代训练的点击率模型进行测试,得到成熟的推荐模型。
108.通过上述步骤s271对样本集中的正样本和负样本进行特征刻画,同时对用户进行精细刻画,实现关联用户和新推荐内容的部分画像数据,通过s272基于特征刻画后的目标样本集,训练出的成熟的推荐模型,该推荐模型能够根据新推荐内容的内容特征以及各用户的属性特征,预测出每个用户对各新推荐内容的预估点击率,从而能够提高推荐模型的推荐准确度。
109.需要说明的是,本发明实施例提供的内容推荐方法和推荐模型训练方法中的新推荐内容可以是同一组内容,也可以是不同的内容。
110.对采用本发明实施例提供的推荐模型训练方法训练出的推荐模型的应用进行验证评估,将采用推荐模型训练方法训练出的推荐模型在互联网平台上线前与上线后作对比,上线后的转化率的提升幅度为61.45%。显然,推荐精确度得到了大幅提升。
111.需要说明的是,本发明实施例提供的推荐模型训练方法也可以作为本发明实施例提供的内容推荐方法的一个步骤。
112.本发明实施例提供的推荐模型训练方法,以更贴合用户兴趣的方式,将与用户的成熟内容的匹配度达到预设阈值的负样本迁移为正样本,实现在不更改样本数据量的情况下,增加正样本量并降低样本倾斜度,并对迁移后的新推荐内容添加内容特征和用户属性特征,实现在样本集上刻画用户对内容是否感兴趣,从而基于迁移后刻画后的目标样本集,训练出点击率预估更为精确的推荐模型。
113.从而使得本发明实施例提供的内容推荐方法在使用上述训练出的推荐模型进行点击率预估,根据预估点击率实现将新推荐内容更为精确地推荐给各用户。
114.基于上述内容推荐方法的构思,本发明实施例还提供了一种内容推荐装置160,该内容推荐装置160可以应用于图1中的推荐服务器110。参照图10,该内容推荐装置160可以包括预估模块170和推荐显示模块180。
115.预估模块170,将新推荐内容输入预先训练的推荐模型,得到推荐模型输出的预估点击率。
116.推荐模型采用推荐模型训练方法训练得到,预估点击率包括各用户对每个新推荐内容的预估点击率。
117.推荐显示模块180,用于在任一用户为推荐对象时,根据用户所对应的预估点击率,对所有新推荐内容进行排序,并依据排序顺序,将所有新推荐内容在用户界面上显示。
118.上述内容推荐装置160中,通过预估模块170和推荐显示模块180的协同作用,基于本发明实施例提供推荐模型训练方法训练出的推荐模型,预估出各用户对每个新推荐内容的预估点击率,能够极大地提高新推荐内容的推荐精确度。
119.关于内容推荐装置160的具体限定可以参见上文中对于内容推荐方法的限定,在此不再赘述。上述内容推荐装置160中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备的存储器中,以便于处理器调用执行以上各个模块对应的操作。
120.基于上述推荐模型训练方法的构思,本发明实施例还提供一种推荐模型训练装置190,该装置可以应用于图4中的训练服务器140中,参照图11,该装置可以包括第一获取模块200、第二获取模块210、样本处理模块220和训练模块230。
121.第一获取模块200,用于根据各用户对曝光的新推荐内容的点击情况,构建初始样本集。其中,初始样本包括与用户一一对应的多个子样本集,每个子样本集包括在所对应的用户为推荐对象的情况下,每个新推荐内容为正样本或负样本。
122.第二获取模块210,用于从各用户的历史点击内容中获取成熟内容。其中,每个用户的成熟内容至少为一个。
123.样本处理模块220,根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集。
124.训练模块230,用于基于迁移后的样本集,对点击率预估模型进行训练,得到成熟的推荐模型。
125.上述推荐模型训练装置190中,通过第一获取模块200、第二获取模块210、样本处理模块220和训练模块230的协同作用,实现在不降低样本数据量的情况下,提升了正样本
的数据量,同时克服了正样本上采样可能引入过多噪声的问题,进而根据迁移后的样本集训练出成熟的推荐模型,极大地提高了推荐系统对新推荐内容的推荐精确度。
126.在一个实施例中,提供了一种电子设备240,该电子设备240可以是训练服务器140,也可以是推荐服务器110,该电子设备240的其、内部结构图可以如图12所示。该电子设备240包括通过系统总线连接的处理器、存储器和网络接口。其中,该电子设备240的处理器用于提供计算和控制能力。该电子设备240的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备240的数据库用于存储推荐模型或目标样本集。该电子设备240的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种内容推荐方法或推荐模型训练方法。
127.本领域技术人员可以理解,图12中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的电子设备240的限定,具体的电子设备240可以包括比图12中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
128.在一个实施例中,本发明提供的内容推荐装置160或推荐模型训练装置190可以实现为一种计算机程序的形式,计算机程序可在如图12所示的电子设备240上运行。电子设备240的存储器中可存储组成该内容推荐装置160或推荐模型训练装置190的各个程序模块,比如,图10所示的预估模块170和推荐显示模块180,图11所示的第一获取模块200、第二获取模块210、样本处理模块220和训练模块230。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的内容推荐方法或推荐模型训练方法中的步骤。
129.例如,图12所示的电子设备240可以通过如图10所示的内容推荐装置160中的预估模块170执行步骤s11,电子设备240可以通过推荐显示模块180执行步骤s12,图12所示的电子设备240也可以通过如图11所示的推荐模型训练装置190中的第一获取模型执行步骤s21,电子设备240可以通过第二获取模块210执行步骤s23,电子设备240可以通过样本处理模块220执行步骤s25,电子设备240可以通过训练模块230执行步骤s27。
130.在一个实施例中,提供了一种电子设备240,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:将新推荐内容输入预先训练的推荐模型,得到推荐模型输出的预估点击率;在任一用户为推荐对象时,根据用户的所对应的预估点击率,对所有新推荐内容进行排序,并依据排序顺序,将所有新推荐内容在用户界面上显示。
131.在一个实施例中,提供了一种电子设备240,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:根据各用户对曝光的新推荐内容的点击情况,构建初始样本集;从各用户的历史点击内容中获取成熟内容;根据每个用户的成熟内容,将每个用户对应的子样本集中达到预设条件的负样本迁移为正样本,得到迁移后的样本集;基于迁移后的样本集,对点击率预估模型进行训练,得到成熟的推荐模型。
132.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一
部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
133.另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
134.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者电子设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
135.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献