一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于大数据的消息推送方法及装置、存储介质与流程

2021-12-04 01:33:00 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,尤其是涉及到一种基于大数据的消息推送方法及装置、存储介质、计算机设备。


背景技术:

2.随着互联网的发展,线上传播变成了消息传播的主要途径。当前很多用户接收的线上消息都是消息商主动推送给用户的消息,例如广告消息、新闻消息等。在线上消息推送前,消息商需要对用户进行圈定。现今在圈定用户时,使用的圈定方法往往是根据用户的特征直接圈定的方法,却没有考虑其他方面的影响因素,而且在消息推送后大多只关注消息的点击率,这样会大大增加消息推送的成本,而且容易造成无效的消息推送。


技术实现要素:

3.有鉴于此,本技术提供了一种基于大数据的消息推送方法及装置、存储介质、计算机设备,可以排除目标用户一部分可能对目标推送消息不感兴趣的用户,有利于提升目标用户圈定的准确性,提高消息推送的有效性,提升目标推送消息的转化率。
4.根据本技术的一个方面,提供了一种基于大数据的消息推送方法,其特征在于,包括:
5.依据预设多维用户标签,从待处理用户数据中提取每个目标用户对应的多维用户特征;
6.基于预设过滤特征对所述目标用户进行过滤,以过滤掉具有所述预设过滤特征的用户,其中,所述预设过滤特征包括基于样本用户对应的样本用户特征提取出的出现频率高于预设频率的特征,所述样本用户包括对历史推送消息的评分小于预设评分的用户;
7.获取目标推送消息对应的目标圈定方法,并基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户;
8.向所述目标推送用户进行所述目标推送消息的推送。
9.可选地,所述获取目标推送消息对应的目标圈定方法之前,所述方法还包括:
10.依据所述目标推送消息,确定与所述目标推送消息相对应的预设推送周期,从过滤后的目标用户中剔除在所述预设推送周期内接收过所述目标推送消息的用户;和/或,
11.依据所述目标推送消息,获取所述目标推送消息对应的预设接收时间内的接收频次阈值,并分别确定每个过滤后的目标用户在所述预设接收时间内接收到所述目标推送消息的实际接收次数,并过滤掉所述实际接收次数大于所述接收频次阈值的用户。
12.可选地,所述获取目标推送消息对应的目标圈定方法之前,所述方法还包括:
13.依据所述目标推送消息对应的消息类型,确定与所述目标推送消息相对应的同类推送消息;
14.提取所述同类推送消息对应的用户特征,并当过滤后的所述任一目标用户对应的多维用户特征中包括所述同类推送消息对应的用户特征时,过滤掉该用户。
15.可选地,所述向所述目标推送用户进行所述目标推送消息的推送,具体包括:
16.基于预设时间段,分别确定每个目标推送用户对应的消息搜索次数最高的时间段所属的预设时间段,并将所述目标推送用户分别按照所述预设时间段进行分组;
17.按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息。
18.可选地,所述按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息之后,所述方法还包括:
19.在当前时间距离所述目标推送消息的推送结束时间超过预设点击时长时,获取每组所述目标推送用户对所述目标推送信息的点击数据;
20.依据所述点击数据,分别计算每组所述目标推送用户对所述目标推送消息的点击比例,并当任一组对应的点击比例小于预设点击比例时,对所述任一组组内的所述目标推送用户进行调整。
21.可选地,当所述目标圈定方法为用户画像圈定方法时,所述基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户,具体包括:
22.基于每个目标用户对应的所述多维用户特征中的用户行为特征,确定与所述用户行为特征一一对应的行为特征权重,并依据所述多维用户特征以及所述行为特征权重,构建用户画像;
23.确定与所述目标推送消息相对应的目标推送特征,并基于所述目标推送特征,在所述目标用户中筛选具有所述目标推送特征的目标推送用户;
24.当所述目标推送特征为用户行为特征时,所述在所述目标用户中筛选具有所述目标推送特征的目标推送用户之后,所述方法还包括:
25.依据所述目标推送特征对应的用户行为特征以及与所述用户行为特征对应的行为特征权重,分别确定每个所述目标推送用户对应的目标推送特征权重;
26.当任一目标推送用户对应的所述目标推送特征权重小于预设权重时,删除所述任一目标推送用户。
27.可选地,所述确定与所述用户行为特征一一对应的行为特征权重,具体包括:
28.基于任一目标用户的用户行为特征,确定所述目标用户对应的任一用户行为特征对应的特征行为次数,以及所述目标用户对应的全部行为特征对应的总行为次数,并计算所述特征行为次数与所述总行为次数的第一比值;
29.统计全部目标用户对应的全部用户行为特征的特征行为次数总和,以及具有所述任一用户行为特征的所述目标用户的用户总和,并计算所述特征行为次数总和与所述用户总和的第二比值;
30.获取所述任一用户行为特征相对应的用户行为类型权重以及时间衰减函数;
31.基于所述第一比值、所述第二比值、所述用户行为类型权重、所述时间衰减函数以及所述特征行为次数,分别确定每个所述用户行为特征对应的行为特征权重。
32.根据本技术的另一方面,提供了一种基于大数据的消息推送装置,其特征在于,包括:
33.用户特征提取模块,用于依据预设多维用户标签,从待处理用户数据中提取每个目标用户对应的多维用户特征;
34.过滤模块,用于基于预设过滤特征对所述目标用户进行过滤,以过滤掉具有所述预设过滤特征的用户,其中,所述预设过滤特征包括基于样本用户对应的样本用户特征提取出的出现频率高于预设频率的特征,所述样本用户包括对历史推送消息的评分小于预设评分的用户;
35.用户圈定模块,用于获取目标推送消息对应的目标圈定方法,并基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户;
36.消息推送模块,用于向所述目标推送用户进行所述目标推送消息的推送。
37.可选地,所述装置还包括:
38.用户剔除模块,用于所述获取目标推送消息对应的目标圈定方法之前,依据所述目标推送消息,确定与所述目标推送消息相对应的预设推送周期,从过滤后的目标用户中剔除在所述预设推送周期内接收过所述目标推送消息的用户;和/或,依据所述目标推送消息,获取所述目标推送消息对应的预设接收时间内的接收频次阈值,并分别确定每个过滤后的目标用户在所述预设接收时间内接收到所述目标推送消息的实际接收次数,并过滤掉所述实际接收次数大于所述接收频次阈值的用户。
39.可选地,所述装置还包括:
40.同类消息获取模块,用于所述获取目标推送消息对应的目标圈定方法之前,依据所述目标推送消息对应的消息类型,确定与所述目标推送消息相对应的同类推送消息;
41.用户过滤模块,用于提取所述同类推送消息对应的用户特征,并当过滤后的所述任一目标用户对应的多维用户特征中包括所述同类推送消息对应的用户特征时,过滤掉该用户。
42.可选地,所述消息推送模块,具体用于:
43.基于预设时间段,分别确定每个目标推送用户对应的消息搜索次数最高的时间段所属的预设时间段,并将所述目标推送用户分别按照所述预设时间段进行分组;按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息。
44.可选地,所述装置还包括:
45.点击数据获取模块,用于所述按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息之后,在当前时间距离所述目标推送消息的推送结束时间超过预设点击时长时,获取每组所述目标推送用户对所述目标推送信息的点击数据;
46.用户调整模块,用于依据所述点击数据,分别计算每组所述目标推送用户对所述目标推送消息的点击比例,并当任一组对应的点击比例小于预设点击比例时,对所述任一组组内的所述目标推送用户进行调整。
47.可选地,当所述目标圈定方法为用户画像圈定方法时,所述用户圈定模块,具体包括:
48.用户画像构建单元,用于基于每个目标用户对应的所述多维用户特征中的用户行为特征,确定与所述用户行为特征一一对应的行为特征权重,并依据所述多维用户特征以及所述行为特征权重,构建用户画像;
49.目标推送用户确定单元,用于确定与所述目标推送消息相对应的目标推送特征,并基于所述目标推送特征,在所述目标用户中筛选具有所述目标推送特征的目标推送用户;
50.当所述目标推送特征为用户行为特征时,所述装置还包括:
51.权重确定模块,用于所述在所述目标用户中筛选具有所述目标推送特征的目标推送用户之后,依据所述目标推送特征对应的用户行为特征以及与所述用户行为特征对应的行为特征权重,分别确定每个所述目标推送用户对应的目标推送特征权重;
52.用户删除模块,用于当任一目标推送用户对应的所述目标推送特征权重小于预设权重时,删除所述任一目标推送用户。
53.可选地,所述用户画像构建模块,具体包括:
54.第一比值计算单元,用于基于任一目标用户的用户行为特征,确定所述目标用户对应的任一用户行为特征对应的特征行为次数,以及所述目标用户对应的全部行为特征对应的总行为次数,并计算所述特征行为次数与所述总行为次数的第一比值;
55.第二比值计算单元,用于统计全部目标用户对应的全部用户行为特征的特征行为次数总和,以及具有所述任一用户行为特征的所述目标用户的用户总和,并计算所述特征行为次数总和与所述用户总和的第二比值;
56.获取单元,用于获取所述任一用户行为特征相对应的用户行为类型权重以及时间衰减函数;
57.行为特征权重确定单元,用于基于所述第一比值、所述第二比值、所述用户行为类型权重、所述时间衰减函数以及所述特征行为次数,分别确定每个所述用户行为特征对应的行为特征权重。
58.依据本技术又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于大数据的消息推送方法。
59.依据本技术再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于大数据的消息推送方法。
60.借由上述技术方案,本技术提供的一种基于大数据的消息推送方法及装置、存储介质、计算机设备,以预设多维用户标签为基础,针对每个目标用户,从待处理用户数据中提取与该目标用户对应的多维用户特征,进一步,可以利用预设过滤特征对目标用户进行过滤,过滤掉目标用户中具有预设过滤特征的用户。其中,预设过滤特征可以通过样本用户对应的样本用户特征进行提取,具体可以从样本用户特征中提取出现频率高于预设频率的特征,样本用户可以包括对历史推送消息的评分小于预设评分的用户。之后,确定与目标推送消息对应的目标圈定方法,以目标圈定方法为基础,从过滤后的目标用户中圈定目标推送用户,并将目标推送消息推送给目标推送用户。本技术实施例可以基于样本用户特征中归纳出对目标推送消息评分较低的用户具有的普遍特征即预设过滤特征,并通过预设过滤特征对目标用户进行过滤,可以排除目标用户一部分可能对目标推送消息不感兴趣的用户,并且针对不同的目标推送消息确定对应的目标圈定方法,有利于提升目标用户圈定的准确性,提高消息推送的有效性,提升目标推送消息的转化率。
61.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
62.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
63.图1示出了本技术实施例提供的一种基于大数据的消息推送方法的流程示意图;
64.图2示出了本技术实施例提供的另一种基于大数据的消息推送方法的流程示意图;
65.图3示出了本技术实施例提供的一种基于大数据的消息推送装置的结构示意图。
具体实施方式
66.下文中将参考附图并结合实施例来详细说明本技术。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
67.在本实施例中提供了一种基于大数据的消息推送方法,如图1所示,该方法包括:
68.步骤101,依据预设多维用户标签,从待处理用户数据中提取每个目标用户对应的多维用户特征;
69.本技术实施例提供的消息推送方法可以应用于广告消息推送等场景中。待处理用户数据中可以包括多个目标用户对应的待处理数据。以预设多维用户标签为基础,针对每个目标用户,从待处理用户数据中提取与该目标用户对应的多维用户特征。在这里,多维用户标签可以是预先设定的标签,例如,性别标签、年龄标签、职业标签等用户静态特征标签,以及阅读标签、游戏标签等用户行为特征标签。而根据不同的预设用户标签提取对应的用户特征,具体可以根据预设用户性别标签,从待处理用户数据中提取出对应目标用户的用户特征是男;还可以根据预设用户游戏标签,从待处理用户数据中提取出对应的目标用户的用户特征是王者荣耀、和平精英等。在根据预设多维用户标签提取目标用户的多维用户特征时,可以利用关键词匹配法、结构化高频模板信息抽取法以及回归模型预测法。例如,利用关键词匹配法,如果待处理用户数据中含有“胎动”、“胎儿”、“胎心”、“产检”等关键词,那么可以根据预设用户标签“人生阶段”,提取目标用户对应的用户特征为“孕产时期”;利用结构化高频模板信息抽取法,可以从待处理用户数据中确定对应的结构化高频模板,如国民教育表和培训机构表,并且其中含有中考等信息,那么可以根据预设用户标签“学生阶段”,提取目标用户对应的用户特征为“中学阶段”;还可以利用历史样本数据构建与预设标签对应的预测模型,将待处理用户数据输入模型,可以得出对应的用户特征。
70.步骤102,基于预设过滤特征对所述目标用户进行过滤,以过滤掉具有所述预设过滤特征的用户,其中,所述预设过滤特征包括基于样本用户对应的样本用户特征提取出的出现频率高于预设频率的特征,所述样本用户包括对历史推送消息的评分小于预设评分的用户;
71.在该实施例中,确定每个目标用户对应的多维用户特征后,可以进一步对目标用户进行过滤,可以利用预设过滤特征,过滤掉目标用户中具有预设过滤特征的用户。预设过滤特征可以通过样本用户对应的样本用户特征进行提取,具体可以从样本用户特征中提取出现频率高于预设频率的特征。例如,对于样本用户特征中的投诉特征,当投诉特征的出现频率高于预设频率时,可以将投诉特征作为预设过滤特征;对于样本用户特征中的借贷特征,当借贷特征出现的频率高于预设频率时,可以将借贷特征作为预设过滤特征。对于没有
预设频率的样本用户特征,则可以直接默认这些样本用户特征不能作为预设过滤特征。有些接收过历史推送消息的用户,对历史推送消息的评分小于预设评分,可以将这些用户作为样本用户,进而对这些样本用户的样本用户特征进行提取时,可以更高效地避免目标用户中包括高投诉率、高负债率等高风险类人群。
72.步骤103,获取目标推送消息对应的目标圈定方法,并基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户;
73.在该实施例中,由于不同的目标推送消息可能对应不同的业务,因此对应的目标圈定方法也可以不同,目标圈定方法可以包括用户画像圈定方法、目标群体指数圈定方法以及机器学习模型圈定方法等。例如,当需要根据用户特征进行目标推送用户的圈定时,可以选择用户画像圈定方法;当需要根据某消息用户感兴趣的其他消息,并进而根据其他消息粗筛出目标推送用户时,可以选择目标群体指数圈定方法;当需要根据待处理用户数据的输入直接判断该用户是否属于目标推送用户时,可以选择机器学习模型圈定方法。确定与目标推送消息对应的目标圈定方法后,可以进一步从过滤后的目标用户中圈定目标推送用户。
74.步骤104,向所述目标推送用户进行所述目标推送消息的推送。
75.在该实施例中,圈定目标推送用户后,可以将目标推送消息推送给目标推送用户。
76.通过应用本实施例的技术方案,以预设多维用户标签为基础,针对每个目标用户,从待处理用户数据中提取与该目标用户对应的多维用户特征,进一步,可以利用预设过滤特征对目标用户进行过滤,过滤掉目标用户中具有预设过滤特征的用户。其中,预设过滤特征可以通过样本用户对应的样本用户特征进行提取,具体可以从样本用户特征中提取出现频率高于预设频率的特征,样本用户可以包括对历史推送消息的评分小于预设评分的用户。之后,确定与目标推送消息对应的目标圈定方法,以目标圈定方法为基础,从过滤后的目标用户中圈定目标推送用户,并将目标推送消息推送给目标推送用户。本技术实施例可以基于样本用户特征中归纳出对目标推送消息评分较低的用户具有的普遍特征即预设过滤特征,并通过预设过滤特征对目标用户进行过滤,可以排除目标用户一部分可能对目标推送消息不感兴趣的用户,并且针对不同的目标推送消息确定对应的目标圈定方法,有利于提升目标用户圈定的准确性,提高消息推送的有效性,提升目标推送消息的转化率。
77.进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种基于大数据的消息推送方法,如图2所示,该方法包括:
78.步骤201,依据预设多维用户标签,从待处理用户数据中提取每个目标用户对应的多维用户特征;
79.步骤202,基于预设过滤特征对所述目标用户进行过滤,以过滤掉具有所述预设过滤特征的用户,其中,所述预设过滤特征包括基于样本用户对应的样本用户特征提取出的出现频率高于预设频率的特征,所述样本用户包括对历史推送消息的评分小于预设评分的用户;
80.在上述实施例中,以预设多维用户标签为基础,针对每个目标用户,从待处理用户数据中提取与该目标用户对应的多维用户特征,进一步,可以利用预设过滤特征对目标用户进行过滤,过滤掉目标用户中具有预设过滤特征的用户。其中,预设过滤特征可以通过样本用户对应的样本用户特征进行提取,具体可以从样本用户特征中提取出现频率高于预设
频率的特征。有些接收过历史推送消息的用户对历史推送消息的评分小于预设评分,可以将这些用户作为样本用户。
81.步骤203,依据所述目标推送消息,确定与所述目标推送消息相对应的预设推送周期,从过滤后的目标用户中剔除在所述预设推送周期内接收过所述目标推送消息的用户;和/或,依据所述目标推送消息,获取所述目标推送消息对应的预设接收时间内的接收频次阈值,并分别确定每个过滤后的目标用户在所述预设接收时间内接收到所述目标推送消息的实际接收次数,并过滤掉所述实际接收次数大于所述接收频次阈值的用户;
82.在该实施例中,不同的目标推送消息对应不同的预设推送周期。例如,当目标推送消息为日用品广告消息时,预设推送周期可以是每月推送一次;当目标推送消息为家用电器广告消息时,预设推送周期可以是一年推送一次。根据目标推送消息,先确定对应的预设推送周期,之后判断过滤后的目标用户中是否存在在预设推送周期内接收过目标推送消息的用户,如果存在预设周期内已经接收过目标推送消息的用户,那么将这些用户过滤掉。
83.此外,还可以根据目标推送消息,获取该目标推送消息对应的预设接收时间,以及预设接收时间内的接收频次阈值。过滤后的目标用户中有些可能已经接收过这一目标推送消息,所以分别确定这些目标用户在第一预设事件内接收目标推送消息的实际接收次数。当过滤后的目标用户中存在接收过目标推送消息的用户,并且该用户在预设接收时间内目标推送消息的实际接收次数大于接收频次阈值时,将该用户过滤掉。本技术通过利用预设推送周期以及预设接收时间内的接收频次阈值,对过滤后的目标用户进行进一步过滤,可以有效避免在短时间内重复对同样的用户多次投放同样的目标推送消息,防止引起用户的反感,减少多余的成本投入。
84.步骤204,依据所述目标推送消息对应的消息类型,确定与所述目标推送消息相对应的同类推送消息;
85.在该实施例中,以目标推送消息为基础,确定与目标推送消息相对应的消息类型,消息类型可以是广告消息等。确定目标推送消息对应的消息类型后,进一步确定该消息类型的同类推送消息。
86.步骤205,提取所述同类推送消息对应的用户特征,并当过滤后的所述任一目标用户对应的多维用户特征中包括所述同类推送消息对应的用户特征时,过滤掉该用户;
87.在该实施例中,由于不同的推送消息都对应着不同的消息内容,为了能够了解与目标推送消息相对应的同类推送消息的消息内容,可以通过提取同类推送消息的用户特征来实现。例如,目标推送消息为京东推送消息,同类推送消息为淘宝推送消息,那么从同类推送消息中提取的用户特征可以是淘宝平台用户特征。提取同类推送消息对应的用户特征后,如果过滤后的任一目标用户对应的多维用户特征中,包括从同类推送消息中提取出来的用户特征时,那么可以将此用户过滤掉。例如,如果过滤后的任一目标用户对应的多维用户特征中包括网易平台用户特征,那么可以说明该用户属于网易平台的稳定用户,对这一用户进行目标推送消息的推送很可能是一种浪费成本的无用行为。本技术通过提取同类推送消息对应的用户特征,对过滤后的目标用户进行进一步过滤,能够有效避免将目标推送消息推送到其他平台等的稳定用户中,减少成本的浪费,提升目标推送消息的推送准确性。
88.步骤206,获取目标推送消息对应的目标圈定方法,并基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户;
89.在该实施例中,确定与目标推送消息对应的目标圈定方法,以目标圈定方法为基础,从过滤后的目标用户中圈定目标推送用户,并将目标推送消息推送给目标推送用户。
90.步骤207,基于预设时间段,分别确定每个目标推送用户对应的消息搜索次数最高的时间段所属的预设时间段,并将所述目标推送用户分别按照所述预设时间段进行分组;按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息;
91.在该实施例中,不同的目标推送用户可能存在不同的消息搜索次数最高的时间段。例如,对于上班族来说,消息搜索次数最高的时间段可能是中午午休11:30~13:30这一时间段和晚间睡觉之前21:00~23:00这一时间段,而对于退休老年人来说,消息搜索次数最高的时间段可能是早间05:30~07:30这一时间段。所以,可以先确定每个目标推送用户对应的消息搜索次数最高的时间段,并查看这些时间段所属的预设时间段,进而对目标推送用户进行分组。之后根据每一组目标推送用户对应的预设时间段,在预设时间段内向这些目标推送用户推送目标推送消息。本技术实施例通过在不同的预设时间段内对不同分组的目标推送用户进行目标推送消息的推送,有利于提升目标推送消息的点击率,提高推送的效果。
92.步骤208,在当前时间距离所述目标推送消息的推送结束时间超过预设点击时长时,获取每组所述目标推送用户对所述目标推送信息的点击数据;依据所述点击数据,分别计算每组所述目标推送用户对所述目标推送消息的点击比例,并当任一组对应的点击比例小于预设点击比例时,对所述任一组组内的所述目标推送用户进行调整。
93.在该实施例中,将目标推送消息推送至目标推送用户后,如果当前时间距离目标推送消息的推送结束时间已经超过预设点击时长时,说明目标推送用户最可能查看目标推送消息的时间已经过去。此时可以分别获取不同分组内的目标推送用户对目标推送消息的点击数据,可以从点击数据中确定目标推送用户是否对目标推送消息进行了查看。之后,根据点击数据,计算不同分组内的目标推送用户对目标推送消息的点击比例,点击比例具体可以是该分组内已经查看目标推送消息的目标推送用户与该分组内全部目标推送用户的比值。如果某一组对应的点击比例小于预设点击比例时,说明该分组内存在较多对目标推送消息不感兴趣的目标推送用户,因而可以对该分组内的目标推送用户进行进一步调整。本技术实施例通过计算目标推送消息的点击比例,并根据该点击比例调整对应分组内的目标推送用户,可以有效避免将目标推送消息再次推送给对此消息不感兴趣的目标推送用户,使得目标推送消息的再次推送更加精准。
94.在上述任一实施例中,可选地,当所述目标圈定方法为用户画像圈定方法时,步骤206中所述“基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户”,具体包括:基于每个目标用户对应的所述多维用户特征中的用户行为特征,确定与所述用户行为特征一一对应的行为特征权重,并依据所述多维用户特征以及所述行为特征权重,构建用户画像;确定与所述目标推送消息相对应的目标推送特征,并基于所述目标推送特征,在所述目标用户中筛选具有所述目标推送特征的目标推送用户;当所述目标推送特征为用户行为特征时,所述“在所述目标用户中筛选具有所述目标推送特征的目标推送用户”之后,所述方法还包括:依据所述目标推送特征对应的用户行为特征以及与所述用户行为特征对应的行为特征权重,分别确定每个所述目标推送用户对应的目标推送特征权重;当任一目标推送用户对应的所述目标推送特征权重小于预设权重时,删除所述任一目标推送用户。
95.在该实施例中,每个目标用户对应的多维用户特征可以包括用户静态特征、用户行为特征等,其中,用户静态特征是每个目标用户对应的属性特征,不存在对应的特征权重,例如性别特征、年龄特征、人生阶段特征等。如果根据目标推送消息获取的目标圈定方法是用户画像圈定方法时,可以先构建不同目标用户对应的用户画像。用户画像的具体构建方法可以为:根据每个目标用户对应的用户行为特征,确定与这些用户行为特征一一对应的行为特征权重,之后根据每个目标用户对应的多维用户特征和与用户行为特征相对应的行为特征权重,构建与每个目标用户对应的用户画像。构建用户画像后,确定目标推送消息对应的目标推送特征,并从目标用户中筛选出具有目标推送特征的目标用户作为目标推送用户。例如,根据目标推送消息,确定对应的目标推送特征为篮球赛爱好者特征,进而,可以从目标用户中筛选具有篮球赛爱好者特征的目标用户作为目标推送用户。
96.当目标推送消息对应的目标推送特征为用户行为特征时,从目标用户中筛选出目标推送用户后,还可以根据不同用户的用户行为特征从用户画像中确定对应的行为特征权重,并分别确定每个目标推送用户的目标推送权重,具体地,目标推送权重可以是与之对应的行为特征权重。当存在目标推送权重小于预设权重的目标推送用户时,说明该目标推送用户非常有可能对该目标推送消息并不感兴趣,或者是只有微弱的兴趣,所以,删除这些目标推送用户。
97.在上述实施例中,所述“确定与所述用户行为特征一一对应的行为特征权重”,具体包括:基于任一目标用户的用户行为特征,确定所述目标用户对应的任一用户行为特征对应的特征行为次数,以及所述目标用户对应的全部行为特征对应的总行为次数,并计算所述特征行为次数与所述总行为次数的第一比值;统计全部目标用户对应的全部用户行为特征的特征行为次数总和,以及具有所述任一用户行为特征的所述目标用户的用户总和,并计算所述特征行为次数总和与所述用户总和的第二比值;获取所述任一用户行为特征相对应的用户行为类型权重以及时间衰减函数;基于所述第一比值、所述第二比值、所述用户行为类型权重、所述时间衰减函数以及所述特征行为次数,分别确定每个所述用户行为特征对应的行为特征权重。
98.在该实施例中,根据任一目标用户的用户行为特征,可以确定该目标用户的任一用户行为特征对应的特征行为次数,还可以确定该目标用户对应的全部行为特征对应的总行为次数。例如,某目标用户的用户行为特征可以包括淘宝购物特征、酒吧喝酒特征、网吧上网特征以及泳池游泳特征,该目标用户的任一用户行为特征可以是淘宝购物特征,对应的特征行为次数可以是淘宝购物的次数,总特征行为次数则是淘宝购物的次数、酒吧喝酒的次数、网吧上网的次数以及泳池游泳的次数之和。之后可以根据特征行为次数和总特征行为次数确定第一比值。
99.进一步,对全部目标用户对应的全部用户行为特征的特征行为次数总和进行统计,并统计具有上面所说的任一用户行为特征的目标用户的用户总和。例如,目标用户的任一用户行为特征是淘宝购物特征,那么在统计完全部目标用户对应的全部用户行为特征对应的特征行为次数总和后,统计具有淘宝购物特征的目标用户的用户总和。之后可以根据特征行为次数总和和用户总和确定第二比值。
100.接着,获取任一用户行为特征对应的用户行为类型权重和时间衰减函数。针对目标用户的不同用户行为特征,对应的用户行为类型权重也是各不相同的。一般来说,用户行
为类型权重可以直接表征目标用户对某种行为类型的意愿强度,例如,购买某产品>下单某产品>收藏某产品>搜索某产品>浏览某产品。用户行为类型权重可以是根据经验预设的,也可以是根据该目标用户对应的历史用户数据计算出来的。此外,目标用户的有些行为受到时间的影响,随着时间的增长不断衰减,所以需要获取对应的时间衰减函数。具体可以先查看任一用户行为特征是否存在时间衰减特性,当存在时间衰减特性时,获取对应的时间衰减函数,当不存在时间衰减特性时,将时间衰减函数默认取1。
101.最后,根据第一比值、第二比值、用户行为类型权重、时间衰减函数以及特征行为次数的乘积,分别确定每个用户行为特征对应的行为特征权重。
102.在上述实施例中,可选地,在步骤201之前,所述方法还可以包括:接收原始用户数据,识别所述原始用户数据中的用户标识,并将同一用户标识对应的所述原始用户数据进行整合,生成整合用户数据;对所述整合用户数据进行数据清洗,生成待处理用户数据。
103.在该实施例中,通过对接收的原始用户数据进行整合,可以形成维度更全的数据,以运营商数据为例,用户标识可以是用户手机号码,运营商通常通过用户手机号码将用户基础信息数据、通话信息数据、上网信息数据以及位置信息数据等等进行关联,形成一个全维度的用户数据体系。此外,通过对整合后的用户数据进行数据清洗,可以去除无效数据,保留有价值数据。
104.进一步的,作为图1方法的具体实现,本技术实施例提供了一种基于大数据的消息推送装置,如图3所示,该装置包括:
105.用户特征提取模块,用于依据预设多维用户标签,从待处理用户数据中提取每个目标用户对应的多维用户特征;
106.过滤模块,用于基于预设过滤特征对所述目标用户进行过滤,以过滤掉具有所述预设过滤特征的用户,其中,所述预设过滤特征包括基于样本用户对应的样本用户特征提取出的出现频率高于预设频率的特征,所述样本用户包括对历史推送消息的评分小于预设评分的用户;
107.用户圈定模块,用于获取目标推送消息对应的目标圈定方法,并基于所述目标圈定方法,在过滤后的目标用户中圈定目标推送用户;
108.消息推送模块,用于向所述目标推送用户进行所述目标推送消息的推送。
109.可选地,所述装置还包括:
110.用户剔除模块,用于所述获取目标推送消息对应的目标圈定方法之前,依据所述目标推送消息,确定与所述目标推送消息相对应的预设推送周期,从过滤后的目标用户中剔除在所述预设推送周期内接收过所述目标推送消息的用户;和/或,依据所述目标推送消息,获取所述目标推送消息对应的预设接收时间内的接收频次阈值,并分别确定每个过滤后的目标用户在所述预设接收时间内接收到所述目标推送消息的实际接收次数,并过滤掉所述实际接收次数大于所述接收频次阈值的用户。
111.可选地,所述装置还包括:
112.同类消息获取模块,用于所述获取目标推送消息对应的目标圈定方法之前,依据所述目标推送消息对应的消息类型,确定与所述目标推送消息相对应的同类推送消息;
113.用户过滤模块,用于提取所述同类推送消息对应的用户特征,并当过滤后的所述任一目标用户对应的多维用户特征中包括所述同类推送消息对应的用户特征时,过滤掉该
用户。
114.可选地,所述消息推送模块,具体用于:
115.基于预设时间段,分别确定每个目标推送用户对应的消息搜索次数最高的时间段所属的预设时间段,并将所述目标推送用户分别按照所述预设时间段进行分组;按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息。
116.可选地,所述装置还包括:
117.点击数据获取模块,用于所述按照所述预设时间段,分别向相应分组内的目标推送用户推送所述目标推送消息之后,在当前时间距离所述目标推送消息的推送结束时间超过预设点击时长时,获取每组所述目标推送用户对所述目标推送信息的点击数据;
118.用户调整模块,用于依据所述点击数据,分别计算每组所述目标推送用户对所述目标推送消息的点击比例,并当任一组对应的点击比例小于预设点击比例时,对所述任一组组内的所述目标推送用户进行调整。
119.可选地,当所述目标圈定方法为用户画像圈定方法时,所述用户圈定模块,具体包括:
120.用户画像构建单元,用于基于每个目标用户对应的所述多维用户特征中的用户行为特征,确定与所述用户行为特征一一对应的行为特征权重,并依据所述多维用户特征以及所述行为特征权重,构建用户画像;
121.目标推送用户确定单元,用于确定与所述目标推送消息相对应的目标推送特征,并基于所述目标推送特征,在所述目标用户中筛选具有所述目标推送特征的目标推送用户;
122.当所述目标推送特征为用户行为特征时,所述装置还包括:
123.权重确定模块,用于所述在所述目标用户中筛选具有所述目标推送特征的目标推送用户之后,依据所述目标推送特征对应的用户行为特征以及与所述用户行为特征对应的行为特征权重,分别确定每个所述目标推送用户对应的目标推送特征权重;
124.用户删除模块,用于当任一目标推送用户对应的所述目标推送特征权重小于预设权重时,删除所述任一目标推送用户。
125.可选地,所述用户画像构建模块,具体包括:
126.第一比值计算单元,用于基于任一目标用户的用户行为特征,确定所述目标用户对应的任一用户行为特征对应的特征行为次数,以及所述目标用户对应的全部行为特征对应的总行为次数,并计算所述特征行为次数与所述总行为次数的第一比值;
127.第二比值计算单元,用于统计全部目标用户对应的全部用户行为特征的特征行为次数总和,以及具有所述任一用户行为特征的所述目标用户的用户总和,并计算所述特征行为次数总和与所述用户总和的第二比值;
128.获取单元,用于获取所述任一用户行为特征相对应的用户行为类型权重以及时间衰减函数;
129.行为特征权重确定单元,用于基于所述第一比值、所述第二比值、所述用户行为类型权重、所述时间衰减函数以及所述特征行为次数,分别确定每个所述用户行为特征对应的行为特征权重。
130.需要说明的是,本技术实施例提供的一种基于大数据的消息推送装置所涉及各功
能单元的其他相应描述,可以参考图1至图2方法中的对应描述,在此不再赘述。
131.基于上述如图1至图2所示方法,相应的,本技术实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1至图2所示的基于大数据的消息推送方法。
132.基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd

rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施场景所述的方法。
133.基于上述如图1至图2所示的方法,以及图3所示的虚拟装置实施例,为了实现上述目的,本技术实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的基于大数据的消息推送方法。
134.可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(radio frequency,rf)电路,传感器、音频电路、wi

fi模块等等。用户接口可以包括显示屏(display)、输入单元比如键盘(keyboard)等,可选用户接口还可以包括usb接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、wi

fi接口)等。
135.本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
136.存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
137.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本技术可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。以预设多维用户标签为基础,针对每个目标用户,从待处理用户数据中提取与该目标用户对应的多维用户特征,进一步,可以利用预设过滤特征对目标用户进行过滤,过滤掉目标用户中具有预设过滤特征的用户。其中,预设过滤特征可以通过样本用户对应的样本用户特征进行提取,具体可以从样本用户特征中提取出现频率高于预设频率的特征,样本用户可以包括对历史推送消息的评分小于预设评分的用户。之后,确定与目标推送消息对应的目标圈定方法,以目标圈定方法为基础,从过滤后的目标用户中圈定目标推送用户,并将目标推送消息推送给目标推送用户。本技术实施例可以基于样本用户特征中归纳出对目标推送消息评分较低的用户具有的普遍特征即预设过滤特征,并通过预设过滤特征对目标用户进行过滤,可以排除目标用户一部分可能对目标推送消息不感兴趣的用户,并且针对不同的目标推送消息确定对应的目标圈定方法,有利于提升目标用户圈定的准确性,提高消息推送的有效性,提升目标推送消息的转化率。
138.本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本技术所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一
步拆分成多个子模块。
139.上述本技术序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本技术的几个具体实施场景,但是,本技术并非局限于此,任何本领域的技术人员能思之的变化都应落入本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献