一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

点击率预估方法、装置、设备和存储介质与流程

2022-06-01 12:58:09 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域,尤其涉及大数据和智能推荐等技术,具体涉及一种点击率预估方法、装置、设备和存储介质。


背景技术:

2.随着互联网技术的不断发展,大数据技术凭借着优异的数据收集和分析技术,给互联网资源带来了创新和进步。目前在智能推荐领域中,已有越来越多的资源提供方采用大数据营销,以提高所推荐资源的点击率。


技术实现要素:

3.本公开提供了一种点击率预估方法、装置、设备和存储介质。
4.根据本公开的一方面,提供了一种点击率预估方法,包括:
5.根据资源需求方的交互行为数据,确定预估参考数据;其中,所述预估参考数据包括需求方属性数据和需求方偏好数据;
6.根据所述预估参考数据,确定预估参考特征;
7.根据所述预估参考特征,预估所述资源需求方对可推荐资源的点击率。根据本公开的另一方面,还提供了一种电子设备,包括:
8.至少一个处理器;以及
9.与所述至少一个处理器通信连接的存储器;其中,
10.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例提供的任意一种点击率预估方法。
11.根据本公开的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开实施例提供的任意一种点击率预估方法。
12.根据本公开的技术,提高了点击率预估结果的准确度。
13.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
14.附图用于更好地理解本方案,不构成对本公开的限定。其中:
15.图1是本公开实施例提供的一种点击率预估方法的流程图;
16.图2是本公开实施例提供的另一种点击率预估方法的流程图;
17.图3是本公开实施例提供的另一种点击率预估方法的流程图;
18.图4是本公开实施例提供的一种点击率预估装置的结构图;
19.图5是实现本公开实施例的点击率预估方法的电子设备的框图。
具体实施方式
20.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
21.本公开实施例提供的各点击率预估方法和点击率预估装置,适用于在想资源需求方进行资源推荐时,对可推荐资源进行点击率预估的场景中。本公开实施例所提供的各点击率预估方法,可以由点击率预估装置执行,该装置可以采用软件和/或硬件实现,并具体配置于电子设备中,该电子设备可以是终端设备或服务器,本公开对此不作任何限定。
22.为了便于理解,首先对点击率预估方法进行详细说明。
23.参见图1所示的一种点击率预估方法,包括:
24.s101、根据资源需求方的交互行为数据,确定预估参考数据;其中,预估参考数据包括需求方属性数据和需求方偏好数据。
25.其中,交互行为可以是对资源展示页面相应网址的网址访问行为、资源点击行为、资源询盘行为、资源收藏行为、资源加购行为和资源分享行为等中的至少一种。相应的,交互行为数据可以是资源需求方的不同交互行为所生成的数据。
26.其中,预估参考数据可以理解为进行点击率(click-through-rate,ctr)预估时的预估依据。需求方属性数据用于表征资源需求方自身属性,例如可以包括地域属性和需求属性等中的至少一种。需求方偏好数据用于表征资源需求方的需求偏好,例如可以包括资源查询偏好和资源偏好等中的至少一种。
27.需要说明的是,上述资源需求方可以是个体需求方或企业需求方,本公开对此不作任何限定。
28.s102、根据预估参考数据,确定预估参考特征。
29.其中,预估参考特征可以理解为结构化后的预估参考数据,其中携带有预估参考数据中的重要信息,同时也可以由计算设备直接进行自动化计算。
30.示例性的,可以对预估参考数据进行特征提取,得到初始参考特征;根据初始参考特征,确定预估参考特征。
31.可选的,根据初始参考特征,确定预估参考特征,可以是直接将初始参考特征作为预估参考特征。或者,可以对初始参考特征进行二次处理,得到预估参考特征。例如,二次处理可以包括统计处理、去重处理和去噪处理等中的至少一种。其中,二次处理所依照的参数可以由技术人员根据需要或经验值进行设定或调整,本公开对此不作任何限定。
32.在一个可选实施例中,针对预估参考数据中的离散数据,可以采用预设编码方式对离散数据进行编码处理,得到相应的预估参考特征。其中,预设编码方式可以采用现有技术中的至少一种编码方式加以实现,本公开对此不作任何限定。例如,预设编码方式可以采用one-hot encode(独热编码)或label encoder(标签编码)等。
33.在另一可选实施例中,针对预估参考数据中的连续数据,可以对连续数据进行缩放处理,从而将连续数据映射到预设数值区间中,得到相应的预估参考特征。
34.在又一可选实施例中,还可以对预估参考数据中的不定长特征按照预设排序规则进行排序后,基于预设长度进行阶段,并根据截断结果,生成定长向量作为相应的预估参考
特征。其中,截断结果长度小于预设长度时,进行预设数据填充。其中,预设数据可以由技术人员根据需要或经验值进行确定或调整。例如,预设数据可以是空值。
35.需要说明的是,上述各预估参考特征的生成方式仅作为示例性说明,不应作为对预估参考特征确定过程的具体限定。
36.在又一可选实施例中,可以根据需求方偏好数据的数据长度,生成偏好统计特征;生成包括偏好统计特征的预估参考特征。
37.示例性的,可以确定不同偏好维度下的需求方偏好数据的数据长度;将不同偏好维度下的数据长度组合,生成偏好统计特征;生成包括偏好统计特征的预估参考特征。
38.可以理解的是,在预估参考特征中,引入基于需求方偏好数据所确定的偏好统计特征,增加了需求方偏好数据所生成预测参考特征的丰富性,从而提高了预估参考特征所携带信息的丰富性,进而日高了点击率预估结果的准确度。
39.在再一可选实施例中,可以根据预估参考数据,统计资源需求方对已推荐资源产生交互行为的累计交互次数;根据预估参考数据,统计向资源需求方推荐已推荐资源的累计推荐次数;根据预估参考数据统计资源需求方的资源转化率;生成包括累计交互次数、累计推荐次数和资源转化率中的至少一种的预估参考特征。
40.其中,累计交互次数用于衡量资源需求方对已推荐资源的兴趣程度。若资源需求方对某一已推荐资源的累计交互次数越多,则表明资源需求方对该已推荐资源的兴趣程度越高;若资源需求方对某一已推荐资源的累计交互次数越少,则表明资源需求方对该已推荐资源的兴趣程度越低。其中,交互行为可以是浏览、点击、收藏、加购、分享、和询盘等行为中的至少一种。
41.其中,累计推荐次数用于表征向资源需求方的资源推荐情况。若某一已推荐资源的累计推荐次数为0,则表明未向该资源需求方进行资源推荐;若某一已推荐资源的累计推荐次数大于0,则表明该资源需求方进行该已推荐资源的推荐程度。若累计推荐次数越多,则表明推荐程度越高,也即资源需求方与该已推荐资源的匹配度越高;若累计推荐次数月底,则表明推荐程度越低,也即资源需求方与该已推荐资源的匹配度越低。
42.其中,资源转化率用于表征资源需求方对已推荐资源产生转化行为占推荐行为的比例。其中,转化行为可以理解为推荐成功行为,例如可以包括浏览停留时长大于预设时长阈值、资源加购、和资源询盘等中的至少一种。其中,预设时长阈值可以由技术人员根据需要或经验值进行设定或调整。
43.可以理解的是,通过在预估参考特征中引入累计交互次数、累计推荐次数和资源转化率等统计特征,进行预估参考特征生成,使得预估参考特征中能够包括多维度特征数据,提高了预设参考特征的丰富性和多样性,从而提高了预估参考特征所携带信息的丰富性,进而日高了点击率预估结果的准确度。
44.s103、根据预估参考特征,预估资源需求方对可推荐资源的点击率。
45.示例性的,可以采用训练好的点击率预估模型,根据预估参考特征,确定资源需求方对可推荐资源的点击率。其中,点击率预估模型可以基于现有的深度学习模型加以实现,本公开对点击率预估模型的具体网络结构不做任何限定。
46.在一个具体实现方式中,点击率预估模型可以采用nffm(neural field-aware factorization machines,神经场感知因子分解机)模型。具体的,可以在嵌入层使用ffm
(field-aware factorization machines,场感知因子分解机)替换fm(factorization machines,因子分解机),由于ffm相较于fm的改进就在于增加了特征域的改进,对不同的特征域使用不同的向量,使得不同特征之间的交叉更灵活、更合理。fm对于每一个特征只会生成一个连续值特征向量,与其他特征做交叉时,都会使用这一个特征向量。而ffm中,每一个特征会生成多个特征向量,与不同的特征做组合时,会生成不同的特征向量,从而提高了模型所提取特征的丰富性,有助于进一步提高点击率预估结果的准确度。
47.在一个可选实施例中,可以确定不同资源需求方对不同可推荐资源的点击率;针对每一可推荐资源,对不同资源需求方的点击率进行排序;将点击率较高的资源需求方作为该可推荐资源的意向需求方,用于定向推荐该可推荐资源。
48.在另一可选实施例中,可以确定不同资源需求方对不同可推荐资源的点击率;针对每一资源需求方,对不同可推荐资源的点击率进行排序;将点击率较高的可推荐资源作为该资源需求方的意向资源,以便向该资源需求方推荐该意向资源。
49.本公开实施例通过引入包括需求方属性数据和需求方偏好数据的预估参考数据,从而确定需求方属性维度和需求方偏好维度下的预估参考特征,提高了预估参考特征的丰富性。相应的,通过多维度的预估参考特征进行点击率预估,提高了点击率预估结果的准确度。进一步的,当基于点击率预估结果进行资源推荐时,能够提高所推荐资源与资源需求方的匹配度,进而有助于提高资源转化率。
50.在上述各技术方案的基础上,本公开还提供了一个可选实施例,在该实施例中,将需求方属性数据进一步细化为包括地域属性标签和/或个体属性标签,从而完善了点击率预估机制。需要说明的是,在本公开实施例中未详述部分,可参见其他实施例中的相关表述,在此不再赘述。
51.参见图2所示的一种点击率预估方法,包括:
52.s201、根据资源需求方的交互行为数据,确定预估参考数据;其中,预估参考数据包括需求方偏好数据;预估参考数据还包括地域属性标签和/或个体属性标签。
53.s202、根据预估参考数据,确定预估参考特征。
54.s203、根据预估参考特征,预估资源需求方对可推荐资源的点击率。
55.其中,地域属性标签用于表征资源需求方产生交互行为数据的地域信息。个体属性标签用于表征资源需求方自身基本信息。
56.在一个可选实施例中,根据资源需求方的交互行为数据,确定地域属性标签,可以是:根据资源需求方产生的网络地址访问数据,确定各候选网络地址的访问频次;根据访问频次,从各候选网络地址中选取目标网络地址,并根据目标网络地址所属地域信息,确定地域属性标签。
57.其中,网络地址可以是ip地址(internet protocol address,网际协议地址)。其中,网络地址访问数据可以是对资源展示页面进行链接访问时所产生的数据。其中,访问频次可以包括访问频率和/或访问次数,用于表征访问资源展示页面的频繁程度。目标网络地址所属地域信息可以是目标网络地址所属地域的行政区划信息,例如所属城市的城市标识。
58.示例性的,地域属性标签可以包括访问地域标签,用于表征资源需求方产生交互行为数据时的访问地。相应的,可以选取访问频次较高(例如最高,或大于预设频次阈值)的
候选网络地址作为目标网络地址,并直接将该目标网络地址所属的地域信息,作为访问地域标签。其中,预设频次阈值可以由技术人员根据需要或经验值进行设定或调整。
59.可以理解的是,若资源需求方通过某一登录标识访问资源展示页面时,可以通过访问地进行访问行为的定位,从而映射出资源需求方的资源需求情况。例如若访问地为经济发达地区,则隐含表明资源需求量可能较高;若访问地为经济薄弱地区,则隐含表明资源需求量可能较低。
60.上述技术方案通过将地域属性标签细化为包括访问地域标签,并通过引入访问频次进行目标网络地址的选取,将目标网络地址所属地域信息作为访问地域标签,提供了一种地域属性标签的确定方式,有助于丰富地域属性标签的确定机制,为预估参考数据的确定提供数据支撑,进而有助于提高预估参考特征的丰富性和多样性,为资源需求方对可推荐资源的点击率预估结果的准确度的提高,奠定了基础。
61.示例性的,地域属性标签可以包括常驻地域标签,用于表征资源需求方产生交互行为数据时的常驻地。相应的,可以选取访问频次较高(例如最高,或大于预设频次阈值)的候选网络地址作为目标网络地址,并将目标网络地址所属地域信息中,满足预设常驻条件的地域信息作为常驻地域标签。其中,预设常驻条件可以由技术人员根据常驻地选取需求进行设定或调整。
62.可以理解的是,若资源需求方通过某一登录标识访问资源展示页面时,可以通过访问地是否为常驻地进行地域类别划分,从而映射出资源需求方的资源需求情况。例如,若访问地为常驻地,则隐含表明资源需求量可能较高;若访问地为非常驻地,则隐含表明资源需求量可能较低。
63.上述技术方案通过将地域属性标签细化为包括常驻地域标签,并通过引入访问频次仅进行目标网络地址的选取,将目标网络地址所属地域信息中,满足预设常驻条件的地域信息作为常驻地域标签,提供了另一种地域属性标签的确定方式,有助于丰富地域属性标签的确定机制,为预估参考数据的确定提供数据支撑,进而有助于提高预估参考特征的丰富性和多样性,为资源需求方对可推荐资源的点击率预估结果的准确度的提高,奠定了基础。
64.在一个具体实现方式中,预设常驻条件可以包括下述至少一种:地域信息对应目标网络地址的访问时长满足预设时长条件;地域信息对应目标网络地址在工作日的访问次数满足第一预设次数条件;地域信息对应目标网络地址在休息日的访问次数满足第二预设次数条件。其中,第一预设次数条件与第二预设次数条件可以相同或不同,本公开对此不作任何限定。其中,休息日可以理解为非工作日,如法定节假日或周末等。
65.可选的,访问时长满足预设时长条件,可以是访问时长较长(例如最长)、或者访问时长大于预设时长阈值等。其中,预设时长阈值可以由技术人员根据需要或经验值进行设定或调整,还可以是历史访问时长的统计值,例如历史访问时长均值。
66.可选的,在工作日的访问次数满足第一预设次数条件,可以是在工作日的访问次数较大(例如最大)、或者访问次数大于第一预设次数阈值等。其中,第一预设次数阈值可以由技术人员根据需要或经验值进行设定或调整,还可以是工作日下的历史访问次数的统计值,例如均值。
67.可选的,在休息日的访问次数满足第二预设次数条件,可以是在休息日的访问次
数较大(例如最大)、或者访问次数大于第二预设次数阈值等。其中,第二预设次数阈值可以由技术人员根据需要或经验值进行设定或调整,还可以是休息日下的历史访问次数的统计值,例如均值。需要说明的是,第二预设次数阈值与第一预设次数阈值可以相同或不同。通常情况下,由于工作日在常驻地的情况明显高于休息日在常驻地的情况,因此第一预设次数阈值会高于第二预设次数阈值。
68.可以理解的是,本公开通过将预设常驻条件进行多维度细化,提高了预设常驻条件的丰富性,从而提高了常驻地域标签的确定方式,有助于提高点击率预估方法的丰富性和多样性。
69.需要说明的是,上述技术方案在进行地域属性标签确定时,可以获取预设时间周期内的网络地址访问数据,进行预设时间周期所对应地域属性标签的确定。其中,预设时间周期的时间长度可以由技术人员根据需要或经验值进行设定或调整,或通过大量试验确定,本公开对此不作任何限定。此外,本公开对预设时间周期的数量也不作任何限定,可以是一个或至少两个。例如,预设时间周期可以包括7天、30天和90天。
70.本公开实施例通过将交互行为数据细化为包括网络地址访问数据,并根据网络地址访问数据,确定候选网络地址的访问频次,从而根据访问频次进行目标网络地址的选取,进而根据目标网络地址所属地域信息,进行地域属性标签的确定。上述技术方案丰富并完善了地域属性标签的确定机制,从而提高了需求方属性数据的丰富性,有助于提高预估参考数据的丰富性和多样性,为资源需求方对可推荐资源的点击率预估结果的准确度的提高,奠定了基础。
71.在另一可选实施例中,根据资源需求方的交互行为数据,确定地域属性标签,可以是:根据资源需求方产生交互行为的可推荐资源的交互体量数据,确定需求能力标签;根据资源需求方产生交互行为的时间间隔数据,确定需求周期标签;根据资源需求方产生交互行为的身份类别,确定需求身份标签;根据需求能力标签、需求周期标签和需求身份标签中的至少一种,确定个体属性标签。
72.其中,交互体量数据可以是交互行为对应的体量数据,用于表征资源需求方的资源需求能力。例如,体量数据可以包括交互数量和交互金额等中的至少一种。其中,不同交互行为对应交互体量数据不同。例如,资源询盘行为对应的交互体量数据可以是询盘体量数据、资源加购行为对应的交互体量数据可以是加购体量数据、以及资源收藏行为对应的交互体量数据可以是收藏体量数据等。
73.其中,身份类别用于表征资源需求方产生交互行为的主体(例如登录标识)对应的身份信息,例如可以是个人身份、个体身份或企业身份等。其中,企业身份可以包括负责人身份、财务身份和采购身份等中的至少一种。
74.需要说明的是,身份类别能够反映资源需求方在进行资源转化(例如购买)时的决策速度以及转化体量(如转化数量或转化金额等)等,侧面表征了资源需求方的资源需求情况。
75.示例性的,可以针对相同资源类目,选取资源需求方在预设时间周期内产生交互行为的可推荐资源的交互体量数据中的较大(例如最大)交互体量数据,作为该预设时间周期的需求能力标签。可以针对相同资源类目,确定资源需求方在预设时间周期内产生交互行为的时间间隔数据的统计值,将该统计值作为该预设时间周期的需求周期标签。其中,统
计值可是中值、最值或均值等。可以直接将资源需求方产生交互行为的身份类别,作为需求身份标签。相应的,生成包括需求能力标签、需求周期标签和需求身份标签中的至少一种的个体属性标签。
76.其中,上述预设时间周期的时间长度可以由技术人员根据需要或经验值进行设定或调整,或通过大量试验确定,本公开对此不作任何限定。此外,本公开对预设时间周期的数量也不作任何限定,可以是一个或至少两个。例如,预设时间周期可以包括7天、30天和90天。
77.上述技术方案通过引入需求能力标签、需求周期标签和需求身份标签进行个人属性标签的生成,完善了个体属性标签的确定机制,从而提高了需求方属性数据的丰富性和多样性,有助于提高预估参考数据的丰富性和多样性,为资源需求方对可推荐资源的点击率预估结果的准确度的提高,奠定了基础。
78.在上述各技术方案的基础上,本公开还提供了一个可选实施例,在该是实力中,将需求方偏好数据进一步细化为包括查询偏好数据和/或资源偏好数据,从而完善了点击率预估机制。需要说明的是,在本公开实施例中未详述部分,可参见其他实施例中的相关表述,在此不再赘述。
79.参见图3所示的一种点击率预估方法,包括:
80.s301、根据资源需求方的交互行为数据,确定预估参考数据;其中,预估参考数据包括需求方属性数据;预估参考数据还包括查询偏好数据和/或资源偏好数据。
81.s302、根据预估参考数据,确定预估参考特征。
82.s303、根据预估参考特征,预估资源需求方对可推荐资源的点击率。
83.其中,查询偏好数据用于表征资源需求方进行资源查询或资源搜索时的偏好情况;资源偏好数据用于表征资源需求方所偏好资源的情况。
84.在一个可选实施例中,根据资源需求方的交互行为数据,确定查询偏好数据,可以是:根据资源需求方进行资源查询时的查询语句,人确定查询偏好参考数据;根据查询偏好参考数据,确定查询偏好数据。
85.其中,查询偏好参考数据可以理解为进行查询偏好数据确定时的参照依据。例如,查询偏好参考数据可以包括查询关键词和/或查询关键词所属类目。
86.可选的,可以对查询语句进行关键词提取,得到查询关键词;将查询关键词作为查询偏好数据,或者,将查询关键词所属类目,作为查询偏好数据;或者,生成包括查询关键词和查询关键词所属类目的查询偏好数据,从而提高查询偏好数据的丰富性和多样性。
87.其中,查询关键词所属类目可以根据实际需求设置为包括不同级别的至少一个类目。例如可以包括一级类目、二级类目和三级类目等。其中,查询关键词所属类目的划分情况可以由技术人员根据实际需求、行业标准或企业标准等进行设定,本公开对关键词所属类目的划分方式不作任何限定。
88.可以理解的是,上述技术方案通过引入查询语句进行查询偏好参考数据的确定,进而根据查询偏好参考数据进行查询偏好数据确定,完善了查询偏好数据的确定机制,从而提高了需求方偏好数据的丰富性和多样性,有助于提高预估参考数据的丰富性和多样性,为资源需求方对可推荐资源的点击率预估结果的准确度的提高,奠定了基础。
89.在一个可选实施例中,根据资源需求方的交互行为数据,确定查询偏好数据,可以
是:根据资源需求方对可推荐资源所属资源提供方产生的交互行为数据,确定提供方偏好数据;根据资源需求方产生交互行为的可推荐资源的资源属性信息,确定资源自身偏好数据;根据提供方偏好数据和/或资源自身偏好数据,确定资源偏好数据。
90.其中,提供方偏好数据用于表征资源需求方所青睐的资源提供方的相关信息;资源自身偏好数据用于表征资源需求方所青睐可推荐资源的相关信息。
91.示例性的,可以统计资源需求方对不同可推荐资源所属资源提供方产生的不同交互行为类型对反映的交互行为次数;根据各交互行为类型的交互行为次数,确定提供方偏好得分;根据提供方偏好得分方,生成提供方偏好数据。其中,交互行为类型可以包括搜索行为和点击行为。其中,点击行为可以包括点击查看、点击询盘、和点击电话等中的至少一种。
92.可选的,可以分别针对不同交互行为类型,设置交互权重,并根据各交互行为类型的交互权重和交互行为次数,确定对资源提供方的综合交互行为次数;根据对不同资源提供方的综合交互行为次数,确定对各资源提供方的提供方偏好得分。
93.在一个具体实现方式中,针对任一资源提供方,根据该资源提供方的综合交互行为次数在全部资源提供方的综合交互行为次数和值的占比,确定资源需求方交互频率;根据不同资源需求方在该资源提供方的综合交互行为次数的和值,在不同资源需求方在不同资源提供方的综合交互行为次数的和值的占比,确定资源提供方重要程度;根据资源需求方交互频率和资源提供方重要程度的比值,确定该资源提供方的提供方偏好得分。
94.具体的,可以采用以下公式,确定提供方偏好得分:
[0095][0096]
其中,为资源需求方ui对资源提供方cj的提供方偏好得分;f(ui,cj)为资源需求方ui对资源提供方cj的综合交互行为次数;b1和b2为预先设定的平滑项。
[0097]
需要说明的是,在进行提供方偏好得分确定时,也可以引入预设时间周期,也即根据预设时间周期内资源提供方对可推荐资源所属资源提供方产生的交互行为数据,确定预设时间周期对应的提供方偏好数据。其中,预设时间周期的时间长度可以由技术人员根据需要或经验值进行设定或调整,或通过大量试验确定,本公开对此不作任何限定。此外,本公开对预设时间周期的数量也不作任何限定,可以是一个或至少两个。例如,预设时间周期可以包括7天、30天和90天。
[0098]
其中,资源属性信息可以包括资源主题词和/或资源所属类目。其中,资源主题词可以是资源描述信息的关键词提取结果;资源所属类目可以包括不同级别的至少一个类目。例如可以包括一级类目、二级类目和三级类目等。
[0099]
示例性的,可以生成包括提供方偏好数据和/或资源自身偏好数据的资源偏好数据,以提高资源偏好数据的丰富性和多样性。
[0100]
可以理解的是,上述技术方案通过引入提供方偏好数据和资源自身偏好数据,确定资源偏好数据,完善了资源偏好数据的确定机制,从而提高了需求方偏好数据的丰富性和多样性,有助于提高预估参考数据的丰富性和多样性,为资源需求方对可推荐资源的点
击率预估结果的准确度的提高,奠定了基础。
[0101]
作为上述各点击率预估方法的实现,本公开还提供了一种实施上述各点击率预估方法的执行装置的可选实施例。进一步参见图4所示的一种点击率预估装置400,包括:预估参考数据确定模块401、预估参考特征确定模块402和点击率预估模块403。其中,
[0102]
预估参考数据确定模块401,用于根据资源需求方的交互行为数据,确定预估参考数据;其中,所述预估参考数据包括需求方属性数据和需求方偏好数据;
[0103]
预估参考特征确定模块402,用于根据所述预估参考数据,确定预估参考特征;
[0104]
点击率预估模块403,用于根据所述预估参考特征,预估所述资源需求方对可推荐资源的点击率。
[0105]
本公开实施例通过引入包括需求方属性数据和需求方偏好数据的预估参考数据,从而确定需求方属性维度和需求方偏好维度下的预估参考特征,提高了预估参考特征的丰富性。相应的,通过多维度的预估参考特征进行点击率预估,提高了点击率预估结果的准确度。进一步的,当基于点击率预估结果进行资源推荐时,能够提高所推荐资源与资源需求方的匹配度,进而有助于提高资源转化率。
[0106]
在一个可选实施例中,所述需求方属性数据包括地域属性标签;
[0107]
所述预估参考数据确定模块401,包括:
[0108]
访问频次确定单元,用于根据资源需求方产生的网络地址访问数据,确定各候选网络地址的访问频次;
[0109]
地域属性标签确定单元,用于根据所述访问频次,从各所述候选网络地址中选取目标网络地址,并根据所述目标网络地址所属地域信息,确定所述地域属性标签。
[0110]
在一个可选实施例中,所述地域属性标签包括访问地域标签;
[0111]
所述地域属性标签确定单元,包括:
[0112]
目标网络地址选取子单元,用于选取访问频次较高的候选网络地址作为所述目标网络地址;
[0113]
访问地域标签确定子单元,用于将所述目标网络地址所属地域信息,作为所述访问地域标签。
[0114]
在一个可选实施例中,所述地域属性标签包括常驻地域标签;
[0115]
所述地域属性标签确定单元,包括:
[0116]
目标网络地址选取子单元,用于选取访问频次较高的候选网络地址作为所述目标网络地址;
[0117]
常驻地域标签确定子单元,用于将所述目标网络地址所属地域信息中,满足预设常驻条件的地域信息作为所述常驻地域标签。
[0118]
在一个可选实施例中,所述预设常驻条件包括下述至少一种:
[0119]
所述地域信息对应目标网络地址的访问时长满足预设时长条件;
[0120]
所述地域信息对应目标网络地址在工作日的访问次数满足第一预设次数条件;
[0121]
所述地域信息对应目标网络地址在休息日的访问次数满足第二预设次数条件。
[0122]
在一个可选实施例中,所述需求方属性信息包括个体属性标签;
[0123]
所述预估参考数据确定模块401,包括:
[0124]
需求能力标签确定单元,用于根据所述资源需求方产生交互行为的可推荐资源的
交互体量数据,确定需求能力标签;
[0125]
需求周期标签确定单元,用于根据所述资源需求方产生交互行为的时间间隔数据,确定需求周期标签;
[0126]
需求身份标签确定单元,用于根据所述资源需求方产生交互行为的身份类别,确定需求身份标签;
[0127]
个体属性标签确定单元,用于根据所述需求能力标签、所述需求周期标签和所述需求身份标签中的至少一种,确定所述个体属性标签。
[0128]
在一个可选实施例中,所述需求方偏好数据包括查询偏好数据;
[0129]
所述预估参考数据确定模块401,包括:
[0130]
查询偏好参考数据确定单元,用于根据所述资源需求方进行资源查询时的查询语句,确定查询偏好参考数据;其中,所述查询偏好参考数据包括查询关键词和/或查询关键词所属类目;
[0131]
查询偏好数据确定单元,用于根据所述查询偏好参考数据,确定所述查询偏好数据。
[0132]
在一个可选实施例中,所述需求方偏好数据包括资源偏好数据;
[0133]
所述预估参考数据确定模块401,包括:
[0134]
提供方偏好数据确定单元,用于根据所述资源需求方对可推荐资源所属资源提供方产生的交互行为数据,确定提供方偏好数据;
[0135]
资源自身偏好数据确定单元,用于根据所述资源需求方产生交互行为的可推荐资源的资源属性信息,确定资源自身偏好数据;
[0136]
资源偏好数据确定单元,用于根据所述提供方偏好数据和/或资源自身偏好数据,确定所述资源偏好数据。
[0137]
在一个可选实施例中,所述预估参考特征确定模块402,包括:
[0138]
偏好统计特征生成单元,用于根据所述需求方偏好数据的数据长度,生成偏好统计特征;
[0139]
预估参考特征生成单元,用于生成包括所述偏好统计特征的预估参考特征。
[0140]
在一个可选实施例中,所述预估参考特征确定模块402,包括:
[0141]
累计交互次数统计单元,用于根据所述预估参考数据,统计所述资源需求方对已推荐资源产生交互行为的累计交互次数;
[0142]
累计推荐次数统计单元,用于根据所述预估参考数据,统计向所述资源需求方推荐已推荐资源的累计推荐次数;
[0143]
资源转化率统计单元,用于根据所述预估参考数据,统计所述资源需求方的资源转化率;
[0144]
预估参考特征确定单元,用于生成包括所述累计交互次数、所述累计推荐次数和所述资源转化率中的至少一种的预估参考特征。
[0145]
上述点击率预估装置可执行本公开任意实施例所提供的点击率预估方法,具备执行各点击率预估方法相应的功能模块和有益效果。
[0146]
本公开的技术方案中,所涉及的交互行为数据的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0147]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0148]
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0149]
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
[0150]
设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0151]
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如点击率预估方法。例如,在一些实施例中,点击率预估方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram 503并由计算单元501执行时,可以执行上文描述的点击率预估方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行点击率预估方法。
[0152]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0153]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0154]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0155]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0156]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0157]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0158]
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
[0159]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
[0160]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献