一种数据处理方法和装置，存储介质和电子设备与流程

2021-10-24 09:57:00 来源：中国专利 TAG：数据处理电子设备计算机应用装置计算机

1.本技术涉及计算机应用技术领域，具体涉及一种数据处理方法和装置。本技术同时涉及一种计算机存储介质和电子设备。

背景技术：

2.随着互联网和计算机技术的不断发现，应用软件已被广泛的使用在日常生活中，定制化的专属服务可以针对不同人群提供相应的服务。因此，将不同推送信息提供给相应人群能够有效提高推送信息的转换率。

技术实现要素：

3.本技术提供一种数据处理方法，以解决现有技术中资源对象圈选效率的问题。
4.本技术提供一种数据处理方法，包括：
5.响应于资源对象圈选推荐提示的触发，确定是否存在所述资源对象的历史圈选数据；
6.若是，则根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征；
7.对所述推荐圈选特征进行圈选效果预测；
8.根据所述圈选效果预测的预测值，将选取的满足预先设置的预测要求的所述推荐圈选特征确定为目标圈选特征；
9.根据目标圈选特征生成目标资源对象集。
10.在一些实施例中，所述根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征，包括：
11.根据所述历史圈选数据，选择圈选效果推荐类型；
12.根据所述圈选效果推荐类型，从所述历史圈选数据的效果排名中提取满足效果提取要求的圈选特征作为所述推荐圈选特征。
13.在一些实施例中，所述根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征，包括：
14.根据所述历史圈选数据，选择圈选热度推荐类型；
15.根据所述圈选热度推荐类型，从所述历史圈选数据的热度排名中提取满足热度提取要求的圈选特征作为所述推荐圈选特征。
16.在一些实施例中，所述根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征，包括：
17.根据所述历史圈选数据，选择圈选自适应推荐类型；
18.根据所述圈选自适应推荐类型，基于对所述历史圈选数据中圈选特征的选择，确定所述推荐圈选特征。
19.在一些实施例中，所述根据所述圈选自适应推荐类型，基于对所述历史圈选数据
中圈选特征的选择，确定所述推荐圈选特征，包括：
20.在提供的特征圈选列表中，选择第一圈选特征集；
21.根据设置时间范围内确定的所述历史圈选数据和与所述历史圈选数据对应的效果数据，查找与所述第一圈选特征集匹配的资源对象集圈选数据以及所述资源对象集圈选数据对应的效果数据；
22.根据所述资源对象集圈选数据和所述效果数据，确定所述推荐圈选特征。
23.在一些实施例中，所述根据所述资源对象集圈选数据和所述效果数据，确定所述推荐圈选特征，包括：
24.根据所述效果数据的效果排名，从所述资源对象集中选取满足选取要求的候选资源对象集；
25.将所述候选资源对象集的圈选特征中去除所述第一圈选特征集中的圈选特征后，剩余的圈选特征，确定为所述推荐圈选特征。
26.在一些实施例中，所述根据所述圈选自适应推荐类型，基于对所述历史圈选数据中圈选特征的选择，确定圈选推荐特征，包括：
27.在提供的圈选特征序列中，选择第一圈选特征集；
28.将选择的设置时间范围内的所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中，获取满足选取条件的候选特征集和与所述候选特征集对应的效果数据；
29.根据所述候选特征集和所述候选特征集对应的效果数据，构建用于存储所述候选特征集中候选特征的枚举值组合和与所述枚举值组合对应的效果数据的矩阵；
30.根据获取的所述第一圈选特征集和所述候选特征集的特征交集，在所述矩阵中查找满足效果数据筛选条件的候选特征序列；
31.将所述候选特征序列中的候选特征确定为所述推荐圈选特征。
32.在一些实施例中，所述将选择的设置时间范围内的所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中，获取满足选取条件的候选特征集和与所述候选特征集对应的效果数据，包括：
33.将所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中进行训练，获得按照特征重要性排序的特征集和与所述特征集对应的效果数据；
34.将从所述特征集中选取的满足特征重要性选取条件的特征，确定为候选特征集以及与所述候选特征集对应的效果数据。
35.在一些实施例中，所述根据所述候选特征集和所述候选特征集对应的效果数据，构建用于存储所述候选特征集中特征内枚举值组合和与所述枚举值组合对应的效果数据的矩阵，包括：
36.将所述候选特征集中候选特征的枚举值组合输入到所述梯度提升树模型中，获取所述枚举值组合对应的效果数据；
37.将所述枚举值组合和所述效果数据以矩阵形式进行存储。
38.在一些实施例中，所述根据获取的所述第一圈选特征集和所述候选特征集的交集，在所述矩阵中查找满足效果数据筛选条件的候选特征序列，包括：
39.获取所述第一圈选特征集和所述候选特征集的特征交集；
40.在所述矩阵中查找除所述特征交集之外的所述候选特征集中候选特征以及与所述候选特征对应的效果数据；
41.根据所述候选特征的效果数据中效果预测值，在所述候选特征中选取满足效果预测值选取要求的候选特征序列。
42.在一些实施例中，所述将所述候选特征序列中的候选特征确定为所述推荐圈选特征，包括：
43.将从所述候选特征序列中选择的候选特征出现次数与所述枚举值组合种类数量的乘积大于设置阈值的的候选特征，确定为所述推荐圈选特征。
44.在一些实施例中，还包括：
45.若响应于资源对象圈选推荐提示的触发，确定不存在所述资源对象的历史圈选数据时，则响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集；
46.将所述第一资源对象集和/或所述第二资源对象集对应的特征数据，确定为所述推荐圈选特征。
47.在一些实施例中，所述响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集，包括：
48.获取设置时间范围内资源对象的行为数据；
49.将所述行为数据输入到探索性分析模型中，获取活跃类型资源对象和/或忠诚类型资源对象；
50.将所述活跃类型资源对象确定为所述第一资源对象集，将所述忠诚类型资源对象确定为所述第二资源对象集。
51.在一些实施例中，所述将所述第一资源对象集和/或所述第二资源对象集对应的特征数据，确定为所述推荐圈选特征，包括：
52.对所述活跃类型资源对象和/或所述忠诚类型资源对象的特征数据进行重要性统计排序；
53.从所述统计排序中选取的满足重要性选取要求的特征数据，确定为所述推荐圈选特征。
54.在一些实施例中，还包括：
55.根据推荐数据投放的所述目标资源对象集，按照设置的周期回收与投放的所述目标资源对象集对应的效果数据。
56.本技术还提供一种数据处理装置，包括：
57.第一确定单元，用于响应于资源对象圈选推荐提示的触发，确定是否存在所述资源对象的历史圈选数据；
58.第二确定单元，用于根据所述第一确定单元中的确定结果为是时，根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征；
59.预测单元，用于对所述推荐圈选特征进行圈选效果预测；
60.第三确定单元，用于根据所述预测单元中的所述圈选效果预测的预测值，将选取的满足预先设置的预测要求的所述推荐圈选特征确定为目标圈选特征；
61.生成单元，用于根据目标圈选特征生成目标资源对象集。
62.本技术还提供一种计算机存储介质，用于存储网络平台产生数据，以及对应所述网络平台产生数据进行处理的程序；
63.所述程序在被处理器读取执行时，执行如上述数据处理方法的步骤。
64.本技术还提供一种电子设备，包括：
65.处理器；
66.存储器，用于存储对网络平台产生数据进行处理的程序，所述程序在被所述处理器读取执行时，执行如上述数据处理方法的步骤。
67.与现有技术相比，本技术具有以下优点:
68.本技术提供的数据处理方法通过响应于资源对象圈选推荐提示的触发，当获取到历史圈选数据后，可以根据历史圈选数据选择的针对所述资源对象圈选推荐类型，确定不同资源对象圈选推荐类型下的推荐圈选特征，基于对推荐圈选特征的圈选效果预测，能够将选取的满足预先设置的预测要求的所述推荐圈选特征确定为目标圈选特征，再根据目标圈选特征生成目标资源对象集；可以不依赖于人工的主观圈选或者需要大量圈选经验来确定资源对象集，且本实施例在确定推荐圈选特征的过程中结合圈选特征对应的效果数据，因此，进一步提高后期在投放推荐信息时的转换率；另一方面，在没有历史圈选数据的情况下，还可以根据响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集，将所述第一资源对象集和/或所述第二资源对象集对应的特征数据，确定为所述推荐圈选特征；因此，在没有历史圈选数据的情况下，也可以不依赖于人工经验进行资源对象集的确定。
附图说明
69.图1是本技术提供的一种数据处理方法实施例的流程图；
70.图2是本技术提供的一种数据处理装置实施例的结构示意图；
71.图3是本技术提供的一种电子设备实施例的结构示意图。
具体实施方式
72.在下面的描述中阐述了很多具体细节以便于充分理解本技术。但是本技术能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本技术内涵的情况下做类似推广，因此本技术不受下面公开的具体实施的限制。
73.本技术中使用的术语是仅仅出于对特定实施例描述的目的，而非旨在限制本技术。在本技术中和所附权利要求书中所使用的描述方式例如：“一种”、“第一”、和“第二”等，并非对数量上的限定或先后顺序上的限定，而是用来将同一类型的信息彼此区分。
74.基于上述背景技术中的描述可知，为将不同推送信息提供给相应人群提高推送信息的转换率，故此，现有技术对人群包的划分通常通过人工凭借经验或者根据消费洞察的分析。基于人群包消费洞察和分析的人群包分析方式是目前用户关系管理(crm：customer relationship management)在使用的一种方法，主要通过对所选人群包的消费行为进行洞察分析，包括该人群包的消费人数、消费笔数、消费金额、消费频次分布、平均消费客单价分布和平均消费总金额分布、购买商品排行和权益使用排行等进行分析和人群包之间的对比分析。也对人群包进行画像洞察分析和对比分析。计算每一个对应人群的画像标签对应的
tgi值，所述tgi值表征人群对应标签的重要性，进而推断出相关的人群包圈选标签的重要性，进而帮助人工实现人群包的圈选。而此种方式由于依赖于人工圈选的主观性，所以圈选的人群包对于后续推荐信息的转换率并没有较为显著的提升作用。
75.鉴于此，本技术提供一种数据处理方法，能够不依赖于人工圈选摈弃人为主观性实现人群包的圈选特征的确定，为了便于理解本技术技术方案的内容，先对结合应用场景进行初步介绍，本技术提供的一种数据处理方法实施例可以理解为是基于用户关系管理(crm：customer relationship management)对人群圈选的一种辅助圈选过程，即用户关系管理系统可以提供人群圈选工具，通过人群圈选工具输出推荐的圈选数据，从而便于圈选避免人工圈选主观性而导致的后期转换率低的问题，当然人群圈选工具可以用在用户关系管理系统中也可以用在任何需要进行人群划分的应用场景下。下面对本技术提供的数据处理方法实施例进行具体描述。
76.请参考图1所示，图1是本技术提供的一种数据处理方法实施例的流程图，所述方法实施例包括：
77.步骤s101：响应于资源对象圈选推荐提示的触发，确定是否存在所述资源对象的历史圈选数据；
78.所述步骤s101的目的在于，确定是否存在历史圈选数据，在本实施例中，可以通过对资源对象圈选推荐提示的触发，确定是否存在历史圈选数据。也就是说，在需要进行资源对象圈选时，可以通过提供的资源对象圈选推荐提示的信息或控件等触发，响应于触发则会确定是否存在资源对象的历史圈选数据。从应用场景的角度理解则是在终端设备上输出资源对象圈选推荐提供的信息或触控按钮等，对所述资源对象圈选推荐提供的信息或触控按钮等的触控操作，进行查找资源对象的历史圈选数据的操作。
79.本实施例中，所述资源对象可以理解为是人群数据或者用户数据，当然也可以其他需要进行分类的数据；圈选数据可以理解为是针对人群的分类数据，可以包括人群特征，每个人群特征还可以包括特征枚举类型等信息，例如：人群特征维度可以是老年、中年、青年等特征，进一步的每个特征维度还可以包括男和女的枚举类型或者也可以称为属性值。通常情况下，在本实施例中可以将资源对象的历史圈选数据称之为历史人群包数据，人群包是将用户进行分类，对人群进行定向以便广告、活动等信息的投放，特征维度包括用户信息特征和用户行为特征等，用户信息特征例如：年龄、婚姻状况等，用户行为特征例如：消费喜好、消费等级等，也可以理解为用户画像。当然还可以用户的设备号、手机号等。将用户分为几个类别，类别之间的特征可以重复。例如常用的人群包种类包括：电商人群包、学生人群包、美容人群包等等。活动方可以选某种人群进行定向投放。对于人群包属于现有技术，此处不做过多阐述。
80.步骤s102：若是，则根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征；
81.所述步骤s102的目的在于确定推荐圈选特征。
82.本实施例中，推荐圈选特征可以根据资源对象圈选推荐类型确定，具体可以包括：圈选效果推荐类型、圈选热度推荐类型、圈选自适应推荐类型和冷启动推荐类型，推荐圈选特征的确定可以根据这些推荐类型中的至少一个或多个组合来确定。当为多个组合时，可以通过在组合中选择出效果较好的作为确定推荐圈选特征的目标资源对象圈选推荐类型。
下面依次对资源对象圈选推荐类型进行描述。
83.所述步骤s102的具体实现过程可以包括：
84.步骤s102
‑
11：根据所述历史圈选数据，选择圈选效果推荐类型；
85.步骤s102
‑
12：根据所述圈选效果推荐类型，从所述历史圈选数据的效果排名中提取满足效果提取要求的圈选特征作为所述推荐圈选特征。
86.其中，所述步骤s102
‑
12是基于对所述圈选效果推荐类型的触发，从所述历史圈选数据的效果排名中提取满足效果提取要求的圈选特征作为所述推荐圈选特征。其中，效果提取要求可以理解为是效果排名的top10或5等，即排名靠前的，具体选取多少个可以根据需求设定。
87.步骤s102
‑
21：根据所述历史圈选数据，选择圈选热度推荐类型；
88.步骤s102
‑
22：根据所述圈选热度推荐类型，从所述历史圈选数据的热度排名中提取满足热度提取要求的圈选特征作为所述推荐圈选特征。
89.其中，所述步骤s102
‑
22是基于对所述圈选热度推荐类型的触发，从所述历史圈选数据的热度排名中提取满足热度提取要求的圈选特征作为所述推荐圈选特征。其中，热度排名可以理解为是按照圈选次数的排名，同一特征圈选次数越多说明被圈选越频繁，热度也越高；热度提取要求可以理解为是热度排名的top10或5等，即排名靠前的，具体选取多少个可以根据需求设定。
90.步骤s102
‑
31：根据所述历史圈选数据，选择圈选自适应推荐类型；
91.步骤s102
‑
32：根据所述圈选自适应推荐类型，基于对所述历史圈选数据中圈选特征的选择，确定所述推荐圈选特征。
92.所述步骤s102
‑
32是基于对所述自适应推荐类型的触发，将从所述历史圈选数据中圈选的圈选特征作为所述推荐圈选特征，具体实现过程可以包括至少两种方式：
93.方式一：
94.步骤s102
‑
32
‑
11：在提供的特征圈选列表中，选择第一圈选特征集；其中，所述特征圈选列表可以理解是为基于基础资源对象具有的特征及特征对应的枚举值的列表，针对列表中特征和枚举值的选取实现圈选特征选择。所述第一圈选特征集中可以包括：至少一个从特征圈选列表中圈选的第一圈选特征。
95.步骤s102
‑
32
‑
12：根据设置时间范围内确定的所述历史圈选数据和与所述历史圈选数据对应的效果数据，查找与所述第一圈选特征集匹配的资源对象集圈选数据以及所述资源对象集圈选数据对应的效果数据；所述步骤s102
‑
32
‑
12的目的在于查找与第一圈选特征集中圈选特征匹配的资源对象集的圈选数据以及相应的效果数据，即从历史圈选数据中获取与所述第一圈选特征集中圈选特征相匹配的历史圈选数据，所述历史圈选数据包括历史资源对象集以及对应的历史圈选特征，所谓匹配可以理解为第一圈选特征集中的圈选特征在历史人群包(历史资源对象集)中的特征中出现。例如：第一圈选特征集中第一圈选特征包括：特征1、特征2和特征3，在历史圈选数据中查找包括有特征1、特征2和特征3的历史人群包，并获取历史人群包的效果数据。所述步骤s102
‑
32
‑
12设置的时间范围可以是距离当前时间的前10天，当然具体时间范围的设置可以根据实际需求进行设置，并不限于上述示例给出的内容。
96.步骤s102
‑
32
‑
13：根据所述资源对象集和所述效果数据，确定所述推荐圈选特征；
97.所述步骤s102
‑
32
‑
13可以包括：
98.步骤s102
‑
32
‑
131：根据所述效果数据的效果排名，从所述资源对象集中选取满足选取要求的候选资源对象集；
99.步骤s102
‑
32
‑
132：将所述候选资源对象的圈选特征中去除所述第一圈选特征集中的圈选特征后，剩余的圈选特征，确定为所述推荐圈选特征。例如：第一圈选特征集中包括：特征1、特征2和特征3，查找到的人群包1包括：特征1、特征2、特征3、特征4、特征5、特征6、特征7；人群包2包括：特征1、特征2、特征3、特征4、特征5；人群包3包括：特征1、特征2、特征3、特征8、特征9、特征10；
…
人群包20，包括：特征1、特征2、特征3，
…
。对人群包1到人群包20对应的效果数据按照降序进行排序，效果数据越大的排名越靠前，则选取排名靠前的10个或者5个人群包中去除特征1、特征2和特征3以外的其他圈选特征作为推荐圈选特征，其他圈选特征对应的效果数据作为推荐圈选特征对应的推荐效果数据。为避免对推荐圈选特征选取的主观性，可以对其他圈选特征按照在人群包中的共有次数，选取人群包中其他圈选特征的共有次数大于设置的阈值时，将作为推荐圈选特征。
100.方式二：
101.步骤s102
‑
32
‑
21：在提供的圈选特征序列中，选择第一圈选特征集；所述步骤s102
‑
32
‑
21可以参考上述步骤s102
‑
32
‑
11的描述，此处不再重复赘述。
102.步骤s102
‑
32
‑
22：将选择的设置时间范围内的所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中，获取满足选取条件的候选特征集和与所述候选特征集对应的效果数据。
103.步骤s102
‑
32
‑
23：根据所述候选特征集和所述候选特征集对应的效果数据，构建用于存储所述候选特征集中特征的枚举值组合和与所述枚举值组合对应的效果数据的矩阵。
104.步骤s102
‑
32
‑
24：根据获取的所述第一圈选特征集和所述候选特征集的特征交集，在所述矩阵中查找满足效果数据筛选条件的候选特征序列。
105.步骤s102
‑
32
‑
25：将所述候选特征序列中的候选特征确定为所述推荐圈选特征。
106.所述步骤s102
‑
32
‑
22可以包括：
107.步骤s102
‑
32
‑
221：将设置时间范围的所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中进行训练，获得按照特征重要性排序的特征集和与所述特征集对应的效果数据；所述设置时间范围方式与所述步骤s102
‑
32
‑
12中可以相同。在设置时间范围内的历史圈选数据和效果数据输入到梯度提升树(gbdt：gradient boosting decision tree)模型中进行训练，其中历史圈选数据可以包括资源对象集(人群包)以及对应的圈选特征，不同的人群包可以包括部分相同的圈选特征和对应的效果数据，将每个人群包的圈选特征输入到gbdt模型进行训练，即可对输入的圈选特征实现按照特征重要性排序并输出排序后的特征集。此处的特征重要性可以是根据圈选特征对应的效果数据确定，效果数据的效果值越大则说明重要性越高。
108.步骤s102
‑
32
‑
222：将从所述特征集中选取的满足特征重要性选取条件的特征，确定为候选特征集以及与所述候选特征集对应的效果数据。如果特征重要性排序为降序，则选取前10个或5个作为候选圈选特征集，反之则后10个或5个，具体选取圈选特征的数量可以根据实际需要进行确定，此处仅为示例，那么特征重要性选取条件可以是设置的门槛值
或阈值等。
109.所述步骤s102
‑
32
‑
23可以包括：
110.步骤s102
‑
32
‑
231：将所述候选特征集中候选特征的枚举值组合输入到所述梯度提升树模型中，获取所述枚举值组合对应的效果数据；候选特征集中候选特征存在多个枚举值，进而会存在多种不同的候选特征枚举值不同的组合情况，因此，可以通过枚举值数量累乘来确定存在的多种组合情况。例如：候选特征1对应枚举值包括a和b，候选特征2对应枚举值包括c和d，候选特征3对应枚举值包括e、f、g；其存在组合情况的数据可以12种组合，即：a/c/e，a/c/f，a/c/g，a/d/e，a/d/f，a/d/g，b/c/e，b/c/f，b/c/g，b/d/e，b/d/f，b/d/g共12种组合。将每种组合输入到gbdt模型中，获取每种枚举值组合对应的效果数据。在将枚举值组合输入到gbdt模型中时，可以保持其他特征不变，例如：当候选特征集中的候选特征为m个，输入到gbdt模型中训练的历史圈选特征为n个，则保持n
‑
m个其余特征不变，可以采用n
‑
m的平均值来保持其不变。
111.步骤s102
‑
32
‑
232：将所述枚举值组合和所述效果数据以矩阵(m)形式进行存储。
112.所述步骤s102
‑
32
‑
24可以包括：
113.步骤s102
‑
32
‑
241：获取所述第一圈选特征集(a)和所述候选特征集(b)的特征交集(j)；
114.步骤s102
‑
32
‑
242：在所述矩阵(m)中查找除所述特征交集(j)之外的所述候选特征集中候选特征以及与所述候选特征对应的效果数据；
115.步骤s102
‑
32
‑
243：根据所述候选特征的效果数据中效果预测值，在所述候选特征中选取满足效果预测值选取要求的候选特征序列；其中，所述效果预测值选取要求可以是效果预测值按照降序排列时，排列靠前的k个候选特征序列，即效果排名较好的前k个。
116.所述步骤s102
‑
32
‑
25的具体实现过程可以是：将从所述候选特征序列中选择的候选特征出现次数与枚举值组合种类数量的乘积大于设置阈值的候选特征，确定为所述推荐圈选特征。
117.步骤s103：对所述推荐圈选特征进行圈选效果预测；所述步骤s103的目的在于进一步核实根据推荐圈选特征确定的人群包所对应的效果是否能够满足推送信息时所能够达到的需求，进而有利于提高推送信息的转换率。具体可以将推荐圈选特征和推送信息的相关数据输入到gbdt模型获得推荐圈选特征对应人群包的效果预测。推送信息可以是活动投放数据。
118.步骤s104：根据所述圈选效果预测的预测值，将选取的满足预先设置的预测要求的所述推荐圈选特征确定为目标圈选特征；其中所述预测要求可以是满足设置的阈值，例如大于或等于所述阈值时的预测值对应的推荐圈选特征，确定为目标圈选特征。
119.步骤s105：根据目标圈选特征生成目标资源对象集；具体为根据目标圈选特征生成相应的目标人群包，从而便于向所述目标人群包投放推荐活动或信息。
120.进一步还可以包括：
121.向所述目标人群包投放推荐信息，和/或，按照设定的周期回收所述目标人群包投放后的效果数据，以为为后续人群包中圈选特征的调整做参考。
122.当本实施例中，所述步骤s101响应于资源对象圈选推荐提示的触发，确定不存在资源对象的历史圈选数据时，则包括：
123.步骤s201：若响应于资源对象圈选推荐提示的触发，确定不存在所述资源对象的历史圈选数据时，则响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集。
124.步骤s202：将所述第一资源对象集和/或所述第二资源对象集对应的特征数据，确定为所述推荐圈选特征。
125.所述步骤s201中所述响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集，包括：
126.步骤s201
‑
1：获取设置时间范围内资源对象的行为数据；所述行为数据可以是消费行为数据，例如：消费时间、消费金额、消费次数等，当然，获取行为数据可以是在获得获取权限的情况下进行获取；时间范围可以是近180天或者是5个月等方式，具体时间范围的设置方式不限。
127.步骤s201
‑
2：将所述行为数据输入到探索性分析模型(rfm模型)中，获取活跃类型资源对象和/或忠诚类型资源对象；其中，活跃类型资源对象可以理解为是消费行为数据属于上升趋势或者一直维持在中等水平的人群；所述忠诚类型资源对象可以理解为是消费行为数据一直维持在较高或较好的水平。本实施例中可以根据通过rfm模型也可以称为用户行为分析模型，获取消费行为特征数据在设置时间范围内的变化斜率来获取活跃类型资源对象和/或忠诚类型资源对象。其中rfm模型中的r为recency(近期消费)：最近一次交易时间间隔。基于最近一次交易日期计算的得分，距离当前日期越近，得分越高；可以反映用户交易活跃度。f(frequency：消费频率或消费次数)：用户在最近一段时间内交易次数。基于交易频率计算的得分，交易频率越高，得分越高；也可以反映用户交易活跃度。m(消费金额)：用户最近一段时间内交易金额。基于交易金额计算的得分，交易金额越高，得分越高，可以反映用户价值。因为rfm模型属于现有技术，上述仅为概要性描述。
128.步骤s201
‑
3：将所述活跃类型资源对象确定为所述第一资源对象集，将所述忠诚类型资源对象确定为所述第二资源对象集。本实施例中，为进一步提高人群包圈选特征对应效果数据，对于获取的活跃类型资源对象和/或忠诚类型资源对象还可以进一步进行筛选，因此，所述步骤s201
‑
3的具体实现过程可以包括：
129.步骤s201
‑
31：对所述活跃类型资源对象和/或所述忠诚类型资源对象的特征数据进行重要性统计排序；
130.步骤s201
‑
31：从所述统计排序中选取的满足重要性选取要求的特征数据，确定为所述推荐圈选特征。
131.在没有历史圈选数据或者说没有历史人群包数据的情况下，可以通过对冷启动推荐类型进行圈选特征的选取。因此，不论是存在历史圈选数据或不存在历史圈选数据的情况下，均可以不依赖于人工的主观圈选或者需要大量圈选经验来确定人群包，且本实施例在确定推荐圈选特征的过程中结合圈选特征对应的效果数据，因此，进一步提高后期在投放推荐信息时的转换率。
132.以上是对本技术提供的一种数据处理方法实施例的具体描述，与前述提供的一种数据处理方法实施例相对应，本技术还公开一种数据处理装置实施例，请参看图2，由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
133.如图2所示，图2是本技术提供的一种数据处理装置实施例的结构示意图，该装置实施例包括：
134.第一确定单元201，用于响应于资源对象圈选推荐提示的触发，确定是否存在所述资源对象的历史圈选数据；关于所述第一确定单元201的具体实现过程可以参考上述步骤s101的描述，此处不再赘述。
135.第二确定单元202，用于根据所述第一确定单元中的确定结果为是时，根据所述历史圈选数据选择的针对所述资源对象圈选推荐类型，确定推荐圈选特征；所述第二确定单元202可以采用三种方式中的至少一种或多种组合确定所述推荐圈选特征，具体可以参考所述步骤s102的描述。所述第二确定单元202可以包括：效果类型子单元、热度类型子单元和自适应类型子单元中的至少一种或多种；所述效果类型子单元，用于根据所述历史圈选数据，选择圈选效果推荐类型，所述第二确定单元202具体用于根据所述圈选效果推荐类型，从所述历史圈选数据的效果排名中提取满足效果提取要求的圈选特征作为所述推荐圈选特征。所述热度类型子单元，用于根据所述历史圈选数据，选择圈选热度推荐类型；所述第二确定单元202具体用于根据所述圈选热度推荐类型，从所述历史圈选数据的热度排名中提取满足热度提取要求的圈选特征作为所述推荐圈选特征。所述自适应类型子单元，用于根据所述历史圈选数据，选择圈选自适应推荐类型；所述第二确定单元202具体用于根据所述圈选自适应推荐类型，基于对所述历史圈选数据中圈选特征的选择，确定所述推荐圈选特征。
136.当所述第二确定单元202用于根据所述圈选自适应推荐类型，基于对所述历史圈选数据中圈选特征的选择，确定所述推荐圈选特征时，包括两种方式。
137.方式一中所述第二确定单元202包括：
138.选择子单元，用于在提供的特征圈选列表中，选择第一圈选特征集；
139.查找子单元，用于根据设置时间范围内确定的所述历史圈选数据和与所述历史圈选数据对应的效果数据，查找与所述第一圈选特征集匹配的资源对象集圈选数据以及所述资源对象集圈选数据对应的效果数据；
140.确定子单元，用于根据所述资源对象集圈选数据和所述效果数据，确定所述推荐圈选特征。
141.所述确定子单元包括：选取子单元和去除子单元，所述选择子单元，用于根据所述效果数据的效果排名，从所述资源对象集中选取满足选取要求的候选资源对象集；所述去除子单元，用于将所述候选资源对象集的圈选特征中去除所述第一圈选特征集中的圈选特征后，剩余的圈选特征，确定为所述推荐圈选特征。
142.方式二中所述第二确定单元202包括：
143.选择子单元，用于在提供的圈选特征序列中，选择第一圈选特征集；
144.获取子单元，用于将选择的设置时间范围内的所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中，获取满足选取条件的候选特征集和与所述候选特征集对应的效果数据；
145.构建子单元，用于根据所述候选特征集和所述候选特征集对应的效果数据，构建用于存储所述候选特征集中特征的枚举值组合和与所述枚举值组合对应的效果数据的矩阵；
146.查找子单元，用于根据获取的所述第一圈选特征集和所述候选特征集的特征交集，在所述矩阵中查找满足效果数据筛选条件的候选特征序列；
147.确定子单元，用于将所述候选特征序列中的候选特征确定为所述推荐圈选特征。
148.其中，所述获取子单元包括：训练子单元和候选确定子单元，所述训练子单元，用于将所述历史圈选数据和与所述历史圈选数据对应的效果数据输入到梯度提升树模型中进行训练，获得按照特征重要性排序的特征集和与所述特征集对应的效果数据；所述候选确定子单元，用于将从所述特征集中选取的满足特征重要性选取条件的特征，确定为候选特征集以及与所述候选特征集对应的效果数据。
149.所述构建子单元包括：输入子单元和存储子单元，所述输入子单元，用于将所述候选特征集中候选特征的枚举值组合输入到所述梯度提升树模型中，获取所述枚举值组合对应的效果数据；所述存储子单元，用于将所述枚举值组合和所述效果数据以矩阵形式进行存储。
150.所述查找子单元包括：交集获取子单元，候选查找子单元、序列选取子单元和序列确定子单元；所述交集获取子单元，用于获取所述第一圈选特征集和所述候选特征集的特征交集；所述候选查找子单元，用于在所述矩阵中查找除所述特征交集之外的所述候选特征集中候选特征以及与所述候选特征对应的效果数据；所述序列选取子单元，用于根据所述候选特征的效果数据中效果预测值，在所述候选特征中选取满足效果预测值选取要求的候选特征序列；所述确定子单元具体用于将从所述候选特征序列中选择的候选特征出现次数与枚举值组合种类数量的乘积大于设置阈值的候选特征，确定为所述推荐圈选特征。
151.本实施例中，当所述第一确定单元201确定不存在所述资源对象的历史圈选数据时，还包括：对象集确定单元，用于响应于冷启动推荐类型，获取的设置时间范围内资源对象的行为数据，确定第一资源对象集和/或第二资源对象集；推荐特征确定单元，用于将所述第一资源对象集和/或所述第二资源对象集对应的特征数据，确定为所述推荐圈选特征。
152.所述对象集确定单元包括：
153.行为数据获取子单元，用于获取设置时间范围内资源对象的行为数据；
154.类型对象获取子单元，用于将所述行为数据输入到探索性分析模型中，获取活跃类型资源对象和/或忠诚类型资源对象；
155.确定子单元，用于将所述活跃类型资源对象确定为所述第一资源对象集，将所述忠诚类型资源对象确定为所述第二资源对象集。
156.预测单元203，用于对所述推荐圈选特征进行圈选效果预测；
157.第三确定单元204，用于根据所述预测单元中的所述圈选效果预测的预测值，将选取的满足预先设置的预测要求的所述推荐圈选特征确定为目标圈选特征；
158.生成单元205，用于根据目标圈选特征生成目标资源对象集。
159.基于上述内容，本实施例进一步还可以包括：投放单元和/或回收单元；
160.所述投放单元，用于将向所述目标人群包投放推荐信息；
161.所述回收单元，用于按照设置的周期回收与投放的所述目标资源对象集对应的投放效果数据，以为为后续人群包中圈选特征的调整做参考。
162.基于上述内容，本技术还提供一种计算机存储介质，用于存储网络平台产生数据，以及对应所述网络平台产生数据进行处理的程序；
163.所述程序在被处理器读取执行时，执行上述数据处理方法的步骤。
164.基于上述内容本技术还提供一种电子设备，如图3所示，包括：
165.处理器301；
166.存储器302，用于存储对网络平台产生数据进行处理的程序，所述程序在被所述处理器读取执行时，执行如上述数据处理方法的步骤。
167.在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
168.内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
169.1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd
‑
rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
170.2、本领域技术人员应明白，本技术的实施例可提供为方法、系统或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd
‑
rom、光学存储器等)上实施的计算机程序产品的形式。
171.本技术虽然以较佳实施例公开如上，但其并不是用来限定本技术，任何本领域技术人员在不脱离本技术的精神和范围内，都可以做出可能的变动和修改，因此本技术的保护范围应当以本技术权利要求所界定的范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：DIY参与式汽车设计硬件结构的制作方法

一种数据处理方法和装置，存储介质和电子设备与流程

相关文献

最热文献