一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

广告转化率预估模型构建方法、装置、设备及其介质与流程

2021-10-19 23:20:00 来源:中国专利 TAG:预估 介质 转化 装置 构建


1.本技术一般涉及人工智能技术领域,尤其涉及广告转化率预估模型构建方法、装置、设备及其介质。


背景技术:

2.随着互联网广告投放量急剧增加,针对互联网广告转化效率的研究显得尤为重要。例如,用户可以通过各种基于互联网的应用程序观看广告,用户观看广告的用户行为可以被记录下来,在移动场景下,还可以采集到用户的设备标识等,其中,用户观看广告相关的数据;可以包括观看广告行为数据、点击广告行为数据等相关信息。在用户看过广告之后,实际发生转化的数据可以是线上的数据,也可以是线下的数据,这种转化是广告主极其关注的。
3.但是,目前的广告转化率预估模型都是针对通用行业的,其预估效果在某些行业并不理想。例如,购买犹豫期长、复购周期特别长的行业(典型的如汽车、商品房)。


技术实现要素:

4.鉴于现有技术中的上述缺陷或不足,期望提供一种广告转化率预估模型构建方法、装置、设备及其介质,来提高垂直类行业广告转化效率。
5.一方面,本技术实施例提供了一种广告转化率预估模型构建方法,该方法包括:
6.获取样本数据集,该样本数据集包括浏览垂直类行业资讯的历史日志数据、垂直类行业广告的历史点击数据和第三方平台提供的投放所述垂直类行业广告的历史投放数据;
7.根据样本数据集提取通用特征组和垂直类行业特征组,该垂直类行业特征组是指用于表征影响垂直类行业广告转化能力的至少一个特征;
8.利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,该垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。
9.一方面,本技术实施例提供了一种广告转化率预估模型构建装置,该装置包括:
10.样本数据获取模块,用于获取样本数据集,该样本数据集包括浏览垂直类行业资讯的历史记录数据、垂直类行业广告的历史点击数据和第三方平台提供的投放所述垂直类行业广告的历史投放数据;
11.特征提取模块,用于根据样本数据集提取通用特征组和垂直类行业特征组,该垂直类行业特征组是指用于表征影响垂直类行业广告转化能力的至少一个特征;
12.模型训练模块,用于利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,该垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。
13.一方面,本技术实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本技术实施例描
述的方法。
14.一方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于:
15.该计算机程序被处理器执行时实现如本技术实施例描述的方法。
16.本技术实施例提供的广告转化率预估模型构建方法、装置、设备及其介质,该方法通过获取包括浏览垂直类行业资讯的历史记录数据、垂直类行业广告的历史点击数据和第三方平台提供的投放所述垂直类行业广告的历史投放数据的样本数据集;然后,根据样本数据集提取通用特征组和垂直类行业特征组,该垂直类行业特征组是指用于表征影响垂直类行业广告转化能力的至少一个特征;最后,利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,该垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。本技术实施例提供的技术方案通过提取垂直类行业特征组与通用特征组进行训练来构建垂直类广告转化率预估模型,可以有效地提高垂直类广告转化率,并提升垂直类广告投放的精准度。
附图说明
17.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:
18.图1示出了本技术实施例提供的广告转化率预估模型构建方法的应用场景示意图;
19.图2示出了本技术实施例提供的广告转化率预估模型构建方法的流程示意图;
20.图3示出了本技术实施例提供的广告转化率预估模型构建方法的流程示意图;
21.图4示出了本技术实施例提供的广告转化率预估模型构建方法的流程示意图;
22.图5示出了本技术实施例提供的垂直类广告转化率预估模型构建方法的原理图;
23.图6示出了根据本技术实施例提供的广告转化率预估模型构建装置的示例性结构框图;
24.图7示出了根据本技术实施例提供的广告转化率预估模型构建装置的示例性结构框图;
25.图8示出了适于用来实现本技术实施例的服务器的计算机系统的结构示意图。
具体实施方式
26.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关公开,而非对该公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与公开相关的部分。
27.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
28.相关技术术语解释
29.垂直类行业是指与具体的技术领域相关的某个行业。垂直类行业的产品具有购买犹豫期长、复购周期特别长的特点。例如,汽车领域或商品房领域。
30.广告转化率是指是用来反映互联网广告对产品销售情况影响程度的指标,主要是
指受互联网广告影响而发生购买、注册或信息需求行为的广告浏览者人数与广告点击总人数的比例。
31.广告转化率预估模型,是对广告转化率进行预估的人工智能算法模型。
32.请参考图1,图1示出了本技术实施例提供的广告转化率预估模型构建方法的应用场景示意图。如图1所示,用户终端101用于接收用户针对垂直类行业资讯的查看操作,用户点击垂直类行业广告的点击操作。例如,用户通过用户终端上预先安装的应用程序观看垂直类行业广告相关的数据,可以是观看垂直类行业广告、点击垂直类行业广告等相关信息。
33.用户在看过垂直类行业广告之后,实际发生转化的数据存在广告主系统里。例如线上数据可以包括用户在应用程序内发生的激活、注册、付费等行为;线下数据包括用户是否到店、发生购买、参与某项活动等行为。
34.广告平台102,用于存储用户标识和线上线下的广告转化数据,以及用户终端采集得到的历史数据,例如历史日志数据、历史点击数据和历史投放数据等。
35.广告平台102可以被配置在独立的服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
36.相关技术中,广告转化率预估模型是针对通用行业的历史数据构建,通用行业例如可以是某宝购物平台,如果一个用户刚买了某个商品,那么广告系统就会更容易推荐该商品。通用行业的商品例如,奶粉、衣服等。但是,在很多垂直类行业如果仍基于通用行业的历史数据构建的广告转化率预估模型,则针对垂直类行业广告的转化率就会出现明显偏差。例如,汽车、商品房等,用户不会在短期内复购的商品。采用上述通用行业的广告转化率预估模型,由于其训练样本是基于通用行业的商品、用户之间的相似性进行广告投放的,如果对已经购汽车的用户重复推荐汽车显然不能满足广告精准投放的需求。
37.本技术提出一种广告转化率预估模型,可以在广告转化率通用模型之外,针对汽车等复购周期长的垂直类行业产品可以有效地提高垂直类行业产品的投放精准度。本技术提出的广告转化率预估模型可以设置在广告投放系统中的广告平台中。
38.为进一步说明本技术实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本技术实施例提供了如下述实施例或附图所示的方法操作指令步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作指令步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本技术实施例提供的执行顺序。所述方法在实际的处理过程中或者装置执行时,可按照实施例或者附图所示的方法顺序执行或者并行执行。
39.下面结合图2来描述本技术实施例提供的广告转化率预估模型构建方法。请参考图2,图2示出了本技术实施例提供的广告转化率预估模型构建方法的流程示意图。如图2所示,该方法包括:
40.步骤201,获取样本数据集;
41.上述样本数据集包括浏览垂直类行业资讯的历史日志数据、垂直类行业广告的历史点击数据和第三方平台提供的投放所述垂直类行业广告的历史投放数据。
42.步骤202,根据样本数据集提取通用特征组和垂直类行业特征组;
43.步骤203,利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,该垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。
44.在上述步骤中,垂直类行业资讯是指与垂直类行业相关资讯信息,可以是通过垂直类行业的资讯应用程序获取,也可以通过交互类平台的垂直类行业的资讯板块获取。例如,与汽车相关的应用程序,通过综合搜索平台提供的汽车资讯信息。
45.垂直类行业广告是指通过互联网投放的与垂直类行业的产品相关的各种形式的广告。例如,在交互类平台投放的与垂直类行业的产品有关的广告,在应用程序启动时投放与垂直类行业的产品相关的广告。
46.第三方平台是指广告主的其他广告投放渠道,例如,a公司的应用程序,b公司的应用程序,第三方平台可以是与a公司的应用程序不同的b公司的应用程序。第三方平台可以是广告主提供的其他渠道。
47.上述步骤中,在样本数据采集阶段,可以获取不同的通过互联网通信的各类应用程序提供的历史数据。然后,对历史数据进行预处理,预处理可以包括清洗处理、采样处理。还可以包括数据类型变化处理、数据集划分处理、数据归一化处理等。其中数据集划分处理根据历史数据是否已经发生转化进行分类,例如已经发生转化的历史数据作为正样本数据,未发生转化的历史数据为负样本数据。
48.可以通过用户终端上预先的垂直类行业的资讯应用程序和交互类应用程序,获取预设时间范围内用户浏览垂直类行业资讯的历史日志数据。
49.还可以采集不同应用程序上用户点击垂直类行业广告次数,获取预设时间范围内的点击垂直类行业广告次数大于等于阈值的历史点击数据。该阈值可以数据处理能力预先设置。
50.在广告主采用多种投放渠道进行广告投放时,可以采集广告主提供的其他投放渠道提供的相同的垂直类行业广告的历史投放数据。例如,可以通过采集在其他投放渠道采集得到的用户点击垂直类行业广告的设备号。
51.在上述步骤中,获取预设时间范围内点击垂直类行业广告次数大于等于阈值的历史点击数据可以通过获取预设时间范围内点击垂直类行业广告的广告数量;获取预设时间范围内点击垂直类行业广告的日志数量;获取垂直类行业广告的优化目标表单和购买记录数量等。还可以从广告推荐系统中获取物品特征,例如物品对应的行业分类、与物品广告对应的投放方式、广告推荐的物品的分类等级等。这些商品特征可以是通用行业的物品在广告推荐系统中提取得到的。
52.上述通用特征组是指通过与通用行业的物品相关的历史数据提取得到的通用行业物品的特征。例如可以包括用户特征组、样本属性特征组和广告特征组等。
53.其中,用户特征组可以包括用户属性特征、用户偏好特征、用户需求特征等,用户属性特征例如可以是人口统计学特征,如性别、年龄、学历、婚姻状态、常驻地等。用户偏好特征,用于反映用户对某类应用程序广告的喜好程度,可以通过用户点击广告的行为来表示。用户需求特征,是用户对广告营销的某类商品或服务的具体徐秀,通过用户点击广告一段时间内转化成购买或使用行为来表现。
54.广告特征组,例如可以是广告营销的商品的行业分类特征、广告营销的商品的分
类等级特征等。也可以理解为广告展现形式特征,广告是动态的,还是动态与静态结合的特征、视觉特征等;内容特征,广告的内容形式,所用素材,广告主特征,商家所属行业领域、企业规模、经营情况、知名度等。
55.在上述基础上,通用特征组还可以包括用户标签特征,例如可以是用户关注物品对象确定的用户标签属性,例如用户关注信息的标签可以是汽车类标签,例如采用数值1表示,母婴用品类标签,例如可以采用数值2表示等。
56.在上述基础上,还可以包括广告位特征、用户情境特征等。
57.在不同的广告推广场景中,可以获取不同的数据,例如在移动终端中推广时,可以获取设备标识和用户标识,设备标识例如是移动终端的唯一识别码等,用户标识可以是将设备终端加上一系列的字段,然后通过算法组合得到的用户标识。
58.上述垂直类行业特征组是指用于表征影响垂直类行业广告转化能力的一个或多个特征。其可以基于历史点击数据和历史投放数据提取得到,这些特征对于垂直类行业广告的转化有着重要影响作用。例如,点击垂直类行业广告后购买垂直类行业产品特征、已购买垂直类产业产品的特征、转化犹豫期特征、近期点击垂直类行业的广告数量、广告优化目标表单、下载垂直类行业应用程序特征、关注垂直类行业公众号特征等。
59.可以根据历史点击数据提取垂直类行业属性特征,垂直类行业属性特征至少包括垂直类行业的转化周期、垂直类行业的点击频率。
60.根据历史投放数据提取垂直类行业标签特征,垂直类行业标签特征包括:与垂直类行业购买能力相关的标签。
61.垂直类行业的转化周期是指垂直类行业物品从用户接触广告,到用户通过线上或线下方式转化购买的时间。
62.垂直类行业的点击频率是指通过采集用户点击垂直类行业的广告在预设时间段的次数来统计。
63.垂直类行业购买能力相关的标签是指通过用户的相关信息获取的用户是否在营销平台上绑定支付方式、是否拥有移动产权和不动产产权等信息,是否有近期游戏内支付的记录等。垂直类行业购买能力相关的标签对广告转化率的影响极其重要。
64.在获取上述特征组之后,利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型。机器学习算法包括深度学习算法,例如概率神经网络(英文全称probabilistic neural networks,英文缩写pnn),概率神经网络由输入层、隐含层、求和层和输出层组成。
65.深度因子分解机(英文全称deep factorization machines,英文缩写deepfm),deepfm模型大体分为两部分:fm模块和dnn模块。首先利用fm进行embedding得到dense embeddings的输出。将dense embeddings的结果作为fm模块和dnn模块的输入。通过一定方式组合后,模型fm模块的输出完全模拟出了fm的效果,而右边的dnn模块则学到了比fm模块更加高阶的特征交叉。最后将dnn和fm的结果组合后激活输出。混合逻辑递归(英文全称mixture of logistic regression,英文缩写mlr),是在模型侧添加非线性特性的方法。主要通过将训练数据划分不同的区域,这对每个区域分别建立与之对应的递归函数。以及其他的深度学习算法。
66.本技术实施例提出的上述方法,通过从样本数据集中提取垂直类行业特征组,来
构建垂直类广告转化率预估模型,相对于相关技术利用通用广告转化率预估模型对垂直类广告的预估而言,本技术提供的实施例有效地提升了垂直类广告转化率,进一步提升广告推荐的精准度。
67.请参考图3,图3示出了本技术实施例提供的广告转化率预估模型构建方法的流程示意图。如图3所示,该方法包括:
68.步骤301,获取样本数据集。
69.样本数据集包括浏览垂直类行业资讯的历史日志数据、垂直类行业广告的历史点击数据和第三方平台提供的投放所述垂直类行业广告的历史投放数据。
70.步骤302,根据样本数据集提取通用特征组和垂直类行业特征组;
71.步骤303,利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,所述垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。
72.步骤304,利用通用特征组,按照机器学习算法进行训练,得到通用广告转化率预估模型,所述通用广告转化率预估模型用于预估通用行业的广告转化率。
73.在上述步骤中,步骤301-步骤303的处理与上述实施例相同,在利用通用特征组合垂直类行业特征组按照机器学习算法进行训练构建垂直类广告转化率预估模型的同时,还进一步通过通用特征组,按照机器学习算法进行训练来构建通用广告转化率预估模型。
74.如图4所示,通过各类交互类应用程序和广告平台,获取用户浏览垂直类行业的资讯的历史日志数据;用户在通用购物平台上记录的历史日志数据等。例如,通过第三方平台提供的用户消费能力标签信息,消费能力标签信息是指用户是否在第三方平台绑定信用卡,是否固定房产等。这里的第三方平台可以是营销咨询平台中相关行业或者近似行业。消费能力标签可以通过第三方平台提供的历史数据进行提取。又例如,第三方平台提供的用户点击垂直类行业广告的数据,例如在各个应用程序中投放垂直类行业广告,用户标识对应的点击垂直了行业广告的总数量,或者点击频率等。这些都是与垂直类行业相关的特征。而通用行业的特征,例如包括:各级商品类目,商品属性,上下文信息等,以及通过用户历史日志数据按照统计方法提取得到的统计特征,例如商品、用户、店铺、类目、品牌等维度的点击率、交易率、转化率,统计时长可以是预设时间范围的全部历史统计数据。。
75.广告特征可以是各类应用程序提供的特征。例如通过用户历史日志数据提取用户的广告行为特征:例如,用户上次点击垂直类广告的时间,距离下次点击垂直类广告的时间,预设周期内点击垂直类广告的频率、预设时间广告主投放同品类广告中用户留下的信息等。预设时间可以是根据历史日志数据统计分析得到的复购周期的冗余范围,例如在复购周期基础上增加百分比阈值,作为预设时间范围。
76.在获取通用行业特征组和垂直类行业特征组,以及广告特征之后,通过训练算法,例如机器学习算法、深度学习算法,或者二者的组合训练得到通用广告转化率预估模型和垂直类广告转换率模型。
77.本技术提供的上述实施例,可以在通用广告转化率预估模型的基础上,通过提取与垂直类行业相关的垂直类行业特征,构建用于预测垂直类行业广告转化率的新模型,通过该新模型可以有效地提升垂直类行业广告转化率。
78.为了更清楚地理解,下面以attention机制构建垂直类广告转化率预估模型为例,
结合图5说明本技术实施例提供的垂直类广告转化率预估模型构建方法。例如以构建汽车广告转换率预估模型为例。
79.获取各类应用程序提供的广告数据,选取80%作为训练数据集,20%作为测试数据集,将训练数据集中已经发生广告转化的数据作为正样本,训练数据集中未发生广告转化的数据作为负样本,同样地将测试数据集也按照是否发生广告转化划分为测试数据集中的正样本和负样本。
80.采用梯度提升决策树对初始特征进行筛选,提取得到通用特征组和垂直类行业特征组即人口统计学特征组、样本属性特征组、用户标签特征组和行业特征。例如提取通用特征组包括用户的年龄、性别、常驻地、用户安装汽车类app的数量,用户点击汽车类app的次数、用户在通用交互平台中浏览汽车资讯的次数、用户在通用交互平台中点击推广的汽车类广告的次数、用户使用移动终端设备的联网方式等,以及广告主标识,广告投放商家的归类属性,广告标识,广告素材标识,广告在汽车类app投放的具体位置编号等。垂直类行业特征组包括用户在营销平台是否绑定信用卡的标签、是否有车的标签、是否有房产的标签、近期是否有游戏内支付的标签等。
81.将上述垂直类行业特征组进行融合层处理(即concat)后输入到全连接层(即multi fc)进行分类处理;同步地将上述通用特征组通过embedding处理,然后将经过全连接层处理的垂直类行业特征组与通用特征组输入到注意力机制层,通过注意力机制层学习每一类特征的重要程度,然后根据重要程度将多个特征进行合并。通过注意力机制层可以很好地关注训练垂直类广告转化率预估模型所需的特征。例如,汽车行业中男性更偏好汽车,是否拥有支付能力是广告转化的重要影响指标,通过汽车类应用程序采集到的与垂直类行业相关的用户标签。
82.在将注意力机制层输出的特征向量输入到全连接层进行处理,然后通过归一化函数处理,将预估值映射到相同的固定范围中。例如[0,1]的范围。归一化函数例如可以是softmax函数,又称归一化指数函数。逻辑斯谛函数和二分类函数等。
[0083]
通过归一化指数函数处理后的广告转化率预估值new_pcvr大于真实的广告转化率预估值pcvr。在将广告推荐系统中,可以通过将广告转化率预估值new_pcvr与真实广告转化率预估值pcvr的比值,作为影响因子,用于影响垂直类行业广告的排序结果。
[0084]
假设用户打开已集成广告系统的sdk的汽车资讯应用程序,在汽车资讯应用程序启动页面上用户点击或者观看某品牌的汽车广告之后,广告系统会接收到汽车资讯应用程序的sdk上报的当前用户信息及广告位信息。当前用户信息,例如可以包括用户标识、设备标识等。广告系统获取当前用户信息、广告位信息,以及用户是否有固定资产、是否绑定信用卡,仅一个月内是否有游戏内支付等标签数据。
[0085]
将获取得到的当前用户信息发送至广告系统的广告召回模块,从广告倒排索引中召回符合定向的汽车类广告。
[0086]
根据获取的当前用户信息、召回得到的汽车类广告的广告位信息输入到广告粗排序模块,在广告粗排序模块中对每个召回得到的汽车类广告进行对应的点击率和转化率预估。
[0087]
例如,将获取到的当前用户信息、召回得到的汽车类广告的广告位信息,输入到广告粗排序模块中预先构建的汽车类广告转化率预估模型和通用广告转化率预估模型,得到
汽车类广告转化率预估模型输出的每个召回的汽车类广告对应转化率预估值new_pcvr,以及通用广告转化率预估模型输出的每个召回的汽车类广告对应转化率预估值pcvr。
[0088][0089]
根据下述公式计算每条广告的转化率影响因子,然后根据下述公式计算与每个汽车类广告对应的初步竞价得分ecpm
垂直

[0090]
ecpm
垂直
=ecpm
通用
*factor
[0091]
其中,ecpm
通用
通过以下公式确定:
[0092]
ecpm
通用
=ocpa_bid(广告出价)*litectr(预估点击率)*litecvr(预估转化率)
[0093]
其中,ocpa_bid(广告出价)是预设的广告出价;litectr(预估点击率)是通过点击预估模型预估的点击率,litecvr(预估转化率)是通过通用广告转化率预估模型预估的转化率。
[0094]
然后,在广告粗排序模块中根据初步竞价得分ecpm
垂直
进行排序,得到排序结果中前n条广告,将前n条广告进一步推送到广告精排模块。其中n的取值为自然数。
[0095]
将获取到的当前用户信息、广告粗排序模块推送的n条广告的广告位信息,输入到预先构建的汽车类广告转化率预估模型和通用广告转化率预估模型,得到汽车类广告转化率预估模型输出的每个的汽车类广告对应转化率预估值new_pcvr

,以及通用广告转化率预估模型输出的每个召回的汽车类广告对应转化率预估值pcvr

。根据下述公式计算每条广告的转化率影响因子:
[0096][0097]
然后根据下述公式计算与每个汽车类广告对应的最终竞价得分ecpm
垂直


[0098]
ecpm
垂直

=ecpm
通用

*factor

[0099]
其中,ecpm
通用

通过以下公式确定:
[0100]
ecpm
通用

=ocpa_bid(广告出价)

*litectr(预估点击率)

*litecvr(预估转化率)

[0101]
其中,ocpa_bid(广告出价)

是预设的广告出价;litectr(预估点击率)

是通过点击预估模型预估的点击率,litecvr(预估转化率)

是通过通用广告转化率预估模型预估的转化率。
[0102]
然后,在广告精排序模块中根据最终竞价得分ecpm
垂直

进行排序,得到排序结果中前m条广告,将前m条广告推送到客户端。其中,m为自然数。可选地,也可以仅在广告精排序模块中利用上述实施例提供的汽车类广告转化率预估模型预估的广告对应转化率new_pcvr

和通用广告转化率预估模型预估的广告对应转化率pcvr

,然后计算与每个汽车类广告对应的最终竞价得分。根据最终竞价得分的排序结果,推送m条广告至客户端。
[0103]
本技术实施例中广告排序结果,是基于构建的垂直类广告转化率预估模型预估得到的,相对于现有的通用广告转化率预估模型,可以有效地提升广告的曝光度和广告的转化率。
[0104]
进一步地,本技术实施例在构建通用广告转化率预估模型的基础上,还可以通过与垂直类行业相关的行业特征与通用特征组共同构建垂直类广告转化率预估模型,通过两
个广告转化率预估模型相互弥补,来提升广告的曝光度和与垂直类行业广告的转化率。
[0105]
进一步地请参考图6,图6示出了根据本技术实施例提供的广告转化率预估模型构建装置的示例性结构框图。如图6所示,该装置包括:
[0106]
样本数据获取模块501,用于获取样本数据集。该样本数据集包括浏览垂直类行业资讯的历史记录数据、垂直类行业广告的历史点击数据和第三方平台提供的投放垂直类行业广告的历史投放数据。
[0107]
特征提取模块502,用于根据样本数据集提取通用特征组和垂直类行业特征组。
[0108]
模型训练模块503,用于利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,垂直类广告转化率预估模型用于预测垂直类行业的广告转化率。
[0109]
样本数据获取模块还用于:
[0110]
获取预设时间范围内通过不同的交互类平台、不同的与垂直类行业相关的应用程序采集得到的浏览垂直类行业资讯的历史日志数据;
[0111]
获取预设时间范围内点击垂直类行业广告次数大于等于阈值的历史点击数据;
[0112]
获取预设时间范围内第三方平台提供的相同的垂直类行业广告的历史投放数据。
[0113]
样本数据获取模块还用于:
[0114]
获取预设时间范围内点击垂直类行业广告的广告数量;
[0115]
获取预设时间范围内点击垂直类行业广告的日志数量;
[0116]
获取所述垂直类行业广告的优化目标表单和购买记录数量。
[0117]
特征提取模块还用于:
[0118]
根据样本数据集提取通用特征组包括:用户特征组、样本属性特征组和广告特征组;
[0119]
根据历史点击数据和历史投放数据提取垂直类行业特征组。
[0120]
特征提取模块还用于:
[0121]
根据历史点击数据提取垂直类行业属性特征,该垂直类行业属性特征至少包括垂直类行业的转化周期、垂直类行业的点击频率;
[0122]
根据历史投放数据提取垂直类行业标签特征,该垂直类行业标签特征包括:与垂直类行业购买能力相关的标签。
[0123]
机器学习算法为深度神经网络算法,该模型训练模块,还用于:
[0124]
将垂直类行业特征组进行特征融合,得到垂直类行业融合特征;
[0125]
基于垂直类行业融合特征和通用技术特征的注意力概率分布,得到垂直类行业特征向量;
[0126]
按照目标函数对垂直类行业特征向量进行训练,得到垂直类广告转化率预估模型。
[0127]
本技术实施例提出的上述装置,从样本数据集中提取垂直类行业特征组,来构建垂直类广告转化率预估模型,相对于相关技术利用通用广告转化率预估模型对垂直类广告的预估而言,本技术提供的实施例有效地提升了垂直类广告转化率,进一步提升广告推荐的精准度。
[0128]
进一步地请参考图7,图7示出了根据本技术实施例提供的广告转化率预估模型构
建装置的示例性结构框图。如图7所示,该装置包括:
[0129]
样本数据获取模块601,用于获取样本数据集。该样本数据集包括浏览垂直类行业资讯的历史记录数据、垂直类行业广告的历史点击数据和第三方平台提供的投放垂直类行业广告的历史投放数据。
[0130]
特征提取模块602,用于根据样本数据集提取通用特征组和垂直类行业特征组。
[0131]
第一模型训练模块603,用于利用通用特征组和垂直类行业特征组,按照机器学习算法进行训练,得到垂直类广告转化率预估模型,垂直类广告转化率预估模型用于预测垂直类行业的广告转化率;以及
[0132]
第二模型训练模块604,用于利用通用特征组,按照机器学习算法进行训练,得到通用广告转化率预估模型,该通用广告转化率预估模型用于预估通用行业的广告转化率。
[0133]
在上述实施例基础上,可以通过图2-3描述的方法来实现,即在图6的基础上,模型训练模块可以得到通用广告转化率预估模型和垂直类广告转化率预估模型,并分别利用通用广告转化率预估模型用于预估通用行业的广告转化率,利用垂直类广告转化率预估模型用于预估垂直类行业的广告转化率。通用行业是指常见的与用户消费领域相关的行业。例如生活用品、办公材料、影视作品等。
[0134]
本技术实施例在构建通用广告转化率预估模型的基础上,还可以通过与垂直类行业相关的行业特征与通用特征组共同构建垂直类广告转化率预估模型,通过两个广告转化率预估模型相互弥补,来提升广告的曝光度和与垂直类行业广告的转化率。
[0135]
应当理解,装置中记载的诸单元或模块与上述描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作指令和特征同样适用于装置及其中包含的单元,在此不再赘述。装置可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置中的相应单元可以与电子设备中的单元相互配合以实现本技术实施例的方案。
[0136]
在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0137]
下面参考图8,图8示出了适于用来实现本技术实施例的服务器的计算机系统的结构示意图。
[0138]
如图8所示,计算机系统包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中,还存储有系统700操作指令所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0139]
以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出
的计算机程序根据需要被安装入存储部分708。
[0140]
特别地,根据本公开的实施例,上文参考流程图图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时,执行本技术的系统中限定的上述功能。
[0141]
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0142]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作指令。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作指令的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0143]
描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括样本数据获取模块、特征提取模块以及模型训练模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,样本数据获取模块,还可以被描述为“用于获取样本数据集的模块”。
[0144]
作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个
或者一个以上的处理器用来执行描述于本技术的广告转化率预估模型构建方法。
[0145]
以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜