一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用户群组划分方法、装置、电子设备及可读存储介质与流程

2022-07-10 05:54:37 来源:中国专利 TAG:


1.本发明实施例涉及计算机技术领域,尤其涉及一种用户群组划分方法、装置、电子设备及可读存储介质。


背景技术:

2.用户价值是企业对客户资源进行管理的重要参考因素之一,不同用户对企业贡献的价值具有差异性,企业可以针对不同的用户采取不同的服务与营销策略,以对企业有限的资源进行优化配置。目前,通常是基于用户的主观判断来评价用户价值,以对用户资源进行群组划分,导致划分的用户群组与实际用户情况存在差异,用户群组的划分准确性较低。


技术实现要素:

3.本发明实施例提供一种用户群组划分方法、装置、电子设备及可读存储介质、装置及相关设备,以解决相关技术中用户群组划分准确性较低的问题。
4.为解决上述问题,本发明是这样实现的:
5.第一方面,本发明实施例提供了一种用户群组划分方法,所述方法包括:
6.获取目标用户的m个用户特征信息,所述m为大于等于1的整数;
7.对每一个所述用户特征信息分别进行聚类划分,以使得每一个所述用户特征信息生成k个聚类簇,所述k为大于等于1的整数;
8.基于m个所述用户特征信息各自对应的k个聚类簇,生成预设数量的细分群,并对所述细分群进行初始层级判定;
9.基于所述目标用户的用户特征信息,确定所述目标用户对应的目标细分群;
10.获取所述用户特征信息对应的集成权重,基于所述集成权重及所述初始层级获取所述目标细分群的目标层级,基于所述目标层级确定所述目标用户的用户群组。
11.第二方面,本发明实施例还提供一种用户群组划分装置,所述装置包括:
12.获取模块,用于获取目标用户的m个用户特征信息,所述m为大于等于1的整数;
13.第一生成模块,用于对每一个所述用户特征信息分别进行聚类划分,以使得每一个所述用户特征信息生成k个聚类簇,所述k为大于等于1的整数;
14.第二生成模块,用于基于m个所述用户特征信息各自对应的k个聚类簇,生成预设数量的细分群,并对所述细分群进行初始层级判定;
15.第一确定模块,用于基于所述目标用户的用户特征信息,确定所述目标用户对应的目标细分群;
16.第二确定模块,用于获取所述用户特征信息对应的集成权重,基于所述集成权重及所述初始层级获取所述目标细分群的目标层级,基于所述目标层级确定所述目标用户的用户群组。
17.第三方面,本发明实施例还提供一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实
现如第一方面中所述的用户群组划分方法的步骤。
18.第四方面,本发明实施例还提供一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如第一方面中所述用户群组划分方法的步骤。
19.在本发明实施例中,通过获取目标用户的特征信息,对用户的特征信息进行聚类划分以生成聚类簇,基于聚类簇来生成细分群,并对细分群进行初始层级判定,再基于用户特征信息对应的集成权重及细分群的初始价值层级来获得用户的目标层级,进而根据目标层级来确定用户对应的用户群组。相对于通过主观判断来对用户进行群组划分,评价用户价值,本技术提供的方案能够避免主观评价造成的误差影响,使得对于用户群组的划分更加准确、客观。
附图说明
20.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
21.图1是本发明实施例提供的一种用户群组划分方法的流程图;
22.图1a是本发明实施例提供的一种用户群组划分方法中生成细分群的流程图;
23.图1b是本发明实施例提供的一种用户群组划分方法中获取集成权重的流程图;
24.图2是本发明实施提供的一种用户群组划分装置的结构图;
25.图3是本发明实施提供的一种电子设备的结构图。
具体实施方式
26.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.本发明实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,本技术中使用“和/或”表示所连接对象的至少其中之一,例如a和/或b和/或c,表示包含单独a,单独b,单独c,以及a和b都存在,b和c都存在,a和c都存在,以及a、b和c都存在的7种情况。
28.本发明实施例提供了一种用户群组划分方法。
29.参见图1,图1是本发明实施例提供的用户群组划分方法的流程图。如图1所示,所述用户群组划分方法包括以下步骤:
30.步骤101、获取目标用户的m个用户特征信息,所述m为大于等于1的整数。
31.需要说明的是,本发明实施例提供的用户群组划分方法可以是由用户群组划分装置执行,所述用户群组划分装置可以是如手机、平板电脑、笔记本计算机、台式计算机等电
子设备,此处不做过多举例。为更好地对本发明实施例所提供的方案进行说明,以下将以电子设备作为执行主体对本发明实施例中的具体步骤进行说明。
32.本发明实施例中,所述目标用户可以是任意一个用户,所述用户特征信息可以是预先设置的用于评价客户特征的参数或者特征数据,在一些实施例中,所述用户特征信息也可以称之为客户价值指标。例如,假设本发明实施例的应用场景为对电信运营商的用户进行用户群组划分,或者说进行客户价值评价,则所述目标用户也就是电信运营商的任意一个入网用户,或者说使用电信运营商提供的电信服务的任意一个用户;所述用户特征信息也就是与电信服务相关的用户特征,或者称之为客户指标,如在网时长、月均上网流量、最近一次缴费时间等。
33.例如在一种可选的实施方式中,所述m为7,这7个用户特征信息可以分别是:在网时长、客户积分、月均上网流量、月均通话总时长、最近一次缴费时间、月均缴费次数、月均缴费总金额。
34.可选地,本发明实施例所提供的用户群组划分方法还可以是应用于其他的场景,则所述用户特征信息也可以是其他的形式,本发明实施例不做具体列举。
35.步骤102、对每一个所述用户特征信息分别进行聚类划分,以使得每一个所述用户特征信息生成k个聚类簇,所述k为大于等于1的整数。
36.本发明实施例中,可以是基于孤立森林法与kmeans 算法相结合的方式,来对每一个所述用户特征信息分别进行聚类划分,以使得每一个所述用户特征信息均生成固定数量的聚类簇。
37.例如,以上述电信运营商的实施场景为例,对应有7个用户特征信息,也就是对这7个用户特征信息分别进行聚类划分,每一个用户特征信息均生成k个聚类簇,假设k为3,也就会生成总共21个聚类簇。
38.可选地,所述步骤102可以包括:
39.建立每一个所述用户特征信息对应的样本数据集,基于所述样本数据集生成对应于每一个所述用户特征信息的聚类簇,其中,所述样本数据集中的样本数据为用户特征信息,所述样本数据包括所述目标用户的用户特征信息;
40.基于孤立森林法确定异常样本数据;
41.剔除每一个所述聚类簇中的异常样本数据,得到目标聚类簇;
42.基于平均轮廓系数法确定所述目标聚类簇的目标类别数目,计算不同目标类别数目下所有目标样本数据的平均轮廓系数,并获取平均轮廓系数最大的值对应的目标类别数目k,以生成k个聚类簇。
43.具体地,电子设备建立每一个用户特征信息对应的样本数据集,所述样本数据集中的样本数据也就是所述用户特征信息,所述目标用户的用户特征信息也就包括在所述样本数据集中。
44.例如,以上述电信运营商的实施场景为例,对应有7个用户特征信息,则可以是获取电信运营商的预设数量用户,及这些用户中每一个用户对应于这7个用户特征信息的样本数据,以建立每一个所述用户特征信息对应的样本数据集,例如在网时长对应的样本数据集,该样本数据集中也就包括多个用户的在网时长信息。
45.进一步地,基于所述样本数据集生成对应于每一个所述用户特征信息的聚类簇。
可选地,可以是基于孤立森林法来生成每一个用户特征信息的聚类簇。例如以一个用户特征信息对应的样本数据集为例,基于该样本数据集中的所有样本数据的数值范围确定二叉树划分的分割点以进行分支划分,重复该步骤以生成预设数量的孤立树itree。
46.进一步地,在生成聚类簇后,基于该聚类簇中的样本数据也就能够确定聚类中心,所述聚类中心可以是聚类簇所包括的样本数据的平均数值,进而通过计算每一个样本数据与聚类中心的距离来确定异常样本数据,例如将与所述聚类中心的距离大于预设距离的样本数据确定为异常样本数据。基于这样的方法,也就能够获取每一个聚类簇中的异常样本数据,剔除每一个所述聚类簇中的异常样本数据,得到目标聚类簇,则所述目标聚类簇也就是剔除了异常样本数据后的聚类簇。这样,也就能够降低异常样本数据的干扰,以提高k值计算的准确性,也能够提高用户群组划分的准确性。
47.可选地,所述基于孤立森林法确定异常样本数据包括:
48.基于孤立森林法计算每个样本数据在孤立森林中的平均高度,以获取所述样本数据的异常分数值;
49.获取异常分数阈值,将所述异常分数值大于所述异常分数阈值的样本数据确定为异常样本数据。
50.本发明实施例中,可以是预先设置异常分数阈值。基于上述孤立森林法生成预设数量的孤立树后,计算每个样本数据xi在孤立森林中的平均高度h(xi),并对所有样本数据的平均高度h(xi)进行归一化处理,样本数据x的异常分数值的计算公式如下:
[0051][0052][0053]
其中,为样本数据x在孤立森林中的平均高度,n为所有样本数据的数量。这样,也就能够计算出每一个样本数据对应的异常分数值。
[0054]
进一步地,可以是预先设置异常剔除比例,基于所述异常剔除比例来确定异常分数阈值,计算公式如下:
[0055]
s=score
max-(score
max-score
min
)*outlier_rate;
[0056]
其中,s为异常分数阈值,outlier_rate为异常剔除比例,score
max
为最大异常分数值,score
min
为最小异常分数值。通过设置异常剔除比例,也就能够避免由于剔除样本数据过多而造成的聚类误差。在确定异常分数阈值及每一个样本数据对应的异常分数值后,将所述异常分数值大于所述异常分数阈值的样本数据确定为异常样本数据。
[0057]
进一步地,在确定出异常样本数据后,剔除每一个所述聚类簇中的异常样本数据,进而得到不包含异常样本数据的目标聚类簇。采用平均轮廓系数法衡量聚类结果的质量,确定所述目标聚类簇的目标类别数目k,计算k在取不同值的情况下目标聚类簇中所有样本数据的平均轮廓系数,将其中平均轮廓系数最大值对应的k值作为最优的聚类簇个数,进而也就确定出要生成k个聚类簇。这样,对于m个用户特征信息,通过单独聚类的方式,使得每一个用户特征信息均生成k个聚类簇。
[0058]
步骤103、基于m个所述用户特征信息各自对应的k个聚类簇,生成预设数量的细分群,并对所述细分群进行初始层级判定。
[0059]
本发明实施例中,在每一个用户特征信息均生成k个聚类簇后,将m个用户特征信息各自生成的k个聚类簇进行相互组合,进而也就能够生成km个细分群。
[0060]
可选地,所述获取平均轮廓系数最大的值对应的目标类别数目k,以生成k个聚类簇之后,所述步骤103之前,还可以包括:
[0061]
计算所述异常样本数据与所述k个聚类簇中每一个聚类中心的距离,并将距离最小对应的聚类簇确定为目标聚类簇;
[0062]
将所述异常样本数据划分到所述目标聚类簇中。
[0063]
其中,在确定出异常样本数据,也就能够得到不含异常样本数据的第一数据集ds和异常样本数据形成的第二数据集de。本发明实施例中,基于平均轮廓系数法确定出目标类别数目k,生成k个聚类簇后,进一步地,可以是基于第一数据集ds进行kmeans 的初始聚类中心的计算和聚类迭代收敛,将第二数据集de中的异常样本数据归类到这k个聚类簇中。
[0064]
具体地,在生成k个聚类簇后,可以获取这k个聚类簇中每一个聚类簇的聚类中心,例如所述聚类中心可以是聚类簇中所有样本数据的平均值,由于k个聚类簇是基于剔除了异常样本数据的样本数据集生成的,也就能够避免异常样本数据对聚类计算造成的影响,使得这这k个聚类簇中每个聚类簇计算出来的聚类中心准确性更高;进一步计算异常样本数据与所述k个聚类簇中每一个聚类中心的距离,并将其中距离最小所对应的聚类簇确定为目标聚类簇,并将所述异常样本数据划分到该目标聚类簇中。需要说明的是,异常样本数据可能为多个,可以是基于上述方式一一确定出每一个异常样本数据对应的目标聚类簇,进而将该异常样本数据划分到对应的目标聚类簇中,进而不同的异常样本数据也就可能划分到不同的目标聚类簇中。
[0065]
可以理解地,目标聚类簇也就是k个聚类簇的其中一个,进而在剔除异常样本数据确定出k的取值,生成k个聚类簇后,再将异常样本数据划分到这k个聚类簇中,再根据m个用户特征信息以及包括异常样本数据的k个聚类簇,来生成预设数量的细分群,并对细分群进行初始层级判定。这样,在剔除异常样本数据,以提高k值准确性的同时,细分群依然是基于包含异常样本数据的聚类簇来生成的,也就能够确保用户特征信息的完整性,避免因某个样本数据的缺失而造成初始层级判定的不准确。
[0066]
本发明实施例中,在生成预设数量的细分群后,对每一个细分群的初始层级进行判定。其中,细分群基于聚类簇生成,聚类簇基于用户特征信息生成,细分群也就包括用户特征信息,基于细分群的用户特征信息也就能够对细分群进行初始层级判定。例如,可以是将细分群中每一个用户特征信息的均值与所有的用户特征信息的整体均值进行比对,若高于整体均值,则判定细分群的初始层级为高(可以是标注为1),若低于整体均值,则判定细分群的初始层级为低(可以是标注为0),这样也就能够得到每一个细分群的初始层级。
[0067]
可选地,请参照图1a,图1a为本发明实施例中根据样本数据集生成细分群的流程图。如图1a所示,构造每一个所述用户特征信息对应的样本数据集,基于该样本数据集中的所有样本数据的数值范围确定划分特征分割点,以进行分支划分,并生成孤立树;设定异常剔除比例,基于异常剔除比例在计算异常分数阈值,并根据样本数据在孤立森林中的平均高度计算每一个样本数据的异常分数值,具体的计算过程可以是参考上述实施例中的描述;基于异常分数阈值,将异常分数值大于异常分数阈值的样本数据作为异常样本数据并剔除,进而以得到不包括异常样本数据的数据集;采用平均轮廓系数法确定聚类簇数目k,
进而通过单独聚类的方式,对每一个用户特征信息生成k个聚类簇,根据每一个用户特征信息的k个聚类簇进行组合以形成细分群。需要说明地,图1a所示的流程步骤可以是结合上述实施例中的具体描述来实现,此处不再具体赘述。
[0068]
步骤104、基于所述目标用户的用户特征信息,确定所述目标用户对应的目标细分群。
[0069]
可以理解地,细分群包括用户特征信息,每一个细分群的用户特征信息的数值不同,根据目标用户的用户特征信息的数值,进而能够确定出与其匹配的目标细分群,目标细分群的用户特征信息的数值可以是与目标用户的用户特征信息的数值相同。
[0070]
步骤105、获取所述用户特征信息对应的集成权重,基于所述集成权重及所述初始层级获取所述目标细分群的目标层级,基于所述目标层级确定所述目标用户的用户群组。
[0071]
需要说明的是,在所述步骤105之前,还需要确定用户特征信息对应的集成权重,所述集成权重可以是基于主观权重及客观权重获得。
[0072]
请参照图1b,可以是采用层次分析法(analytic hierarchy process,ahp)计算用户特征信息的主观权重,形成用户特征信息权重向量w
ahp
=(w
11
,w
12
,w
13

,w
1n
)。
[0073]
基于熵值法和客观权重赋权法(criteria importance though intercrieria correlation,critic)相结合的方式,来计算用户特征信息的客观权重。具体地,计算各个用户特征信息的信息熵、变异性(用户特征信息标准差)和冲突差(用户特征信息之间的相关系数),并按照如下公式计算客观权重,并形成客观组合赋权向量w
ce
=(w
21
,w
22
,w
23

,w
2n
),
[0074][0075]
其中,wj是第j个用户特征信息权重,c
ij
是用户特征信息i与j的相关系数,σj是用户特征信息j的标准差,ej是用户特征信息j的信息熵。
[0076]
将上述计算得到的主观权重及客观权重基于如下公式进行集成融合,以得到集成权重:
[0077]
wj=αw
1j
βw
2j

[0078]
其中,wj是第j个用户特征信息的集成权重,w
1j
是第j个用户特征信息的主观权重,w
2j
是第j个用户特征信息的客观权重,α和β分别表示主观权重和客观权重的权重系数,二者之和为1。本发明实施例中,可以是根据集成权重与主观权重、客观权重的偏差最小化进行迭代计算,最终得到最优的α和β以及集成权重wj。
[0079]
本发明实施例中,在获得每一个用户特征信息对应的集成权重后,基于所述集成权重及目标细分群对应的初始层级,计算目标细分群的目标层级,进而基于所述目标层级来确定目标用户的用户群组。例如,可以是基于目标细分群的初始层级与集成权重的乘积,来获得目标细分群的目标层级。
[0080]
可选地,所述基于所述集成权重及所述初始层级获取所述目标细分群的目标层级包括:
[0081]
基于所述集成权重及所述初始层级,计算所述预设数量的细分群中每一个细分群
的特征分数,并获取所述目标细分群的目标特征分数;
[0082]
基于所述每一个细分群的特征分数获取平均特征分数;
[0083]
将所述目标特征分数与所述平均特征分数比对,以确定所述目标细分群的目标层级。
[0084]
具体地,在获得每一个用户特征信息对应的集成权重后,可以是基于所述集成权重与初始层级的乘积来计算每一个细分群的特征分数,进而也就能够获得细分群中目标细分群的目标特征分数。例如,假设用户特征信息分别为在网时长、月均上网流量、月均缴费总金额,这三个用户特征信息各自对应的权重分别为0.3、0.2、0.5,每一个细分群中可以是包括这三个用户特征信息中的至少一个或者是不包括任何用户特征信息,不包括的用户特征信息以数值0代替;假设目标细分群的用户特征信息对应的数值为1、0、2,则目标细分群的目标特征分数为0.3
×
1 0.2
×
0 0.5
×
2=1.3;依此方式计算每一个细分群的特征分数,并基于每一个细分群的特征分数来计算获得平均特征分数;将目标细分群的目标特征分数与平均特征分数比对,以确定目标细分群的目标层级。例如,若目标特征分数与平均特征分数的差值大于第一预设值,则可以判定为高价值目标层级,若目标特征分数与平均特征分数的差值小于第二预设值,则可以判定为低价值目标层级,若目标特征分数与平均特征分数的差值大于第二预设值且小于第一预设值,则可以判定为中等价值目标层级,其中第一预设值大于第二预设值。
[0085]
这样,在确定目标细分群的初始层级后,进一步基于集成权重来计算目标细分群的目标特征分数,并通过与基于每一个细分群的特征分数得到的平均特征分数进行比对,来确定目标细分群的目标层级,使得目标层级的评判更加准确、可靠。
[0086]
本发明实施例中,所述群组包括n个特征指标,所述n个特征指标包括所述m个用户特征信息,n为小于m的正整数,所述获取所述用户特征信息对应的集成权重,基于所述集成权重及所述初始层级获取所述目标细分群的目标层级包括:
[0087]
获取特征指标对应的集成权重,基于每一个所述特征指标对应的集成权重及所述初始价值层级,计算所述预设数量的细分群中每一个细分群对应于所述n个特征指标各自的特征分数,并获取所述目标细分群对应于所述n个特征指标的n个目标特征分数;
[0088]
基于所述每一个细分群对应于所述n个特征指标各自的特征分数,获取所述n个特征指标的平均特征分数;
[0089]
将所述n个目标特征分数与所述n个特征指标的平均特征分数比对,以确定所述目标细分群分别对应于所述n个特征指标的目标层级。
[0090]
本发明实施例中,m个用户特征信息隶属于n个特征指标,所述n个特征指标,以及n各特征指标与m个用户特征信息之间的关系可以是电子设备预先设置保存。例如,假设本发明实施例的应用场景为对电信运营商的用户进行用户群组划分,其中n为3,m为7,这三个特征指标可以分别是用户年限、用户消费指标和用户缴费指标,其中,用户年限包括的用户特征信息可以是用户在网时长和用户积分,用户消费指标包括的用户特征信息可以是月均上网流量和月均通话总时长,用户缴费指标包括的用户特征信息可以是最近一次缴费时间、月均缴费次数和月均缴费总金额。当然,本发明实施例还可以是其他应用场景,所述特征指标和用户特征信息也可以是其他具体形式,此处不做具体限定。
[0091]
本发明实施例中,在获取到每一个用户特征信息对应的集成权重后,基于用户特
征信息对应的集成权重及初始价值层级,也就能够计算每一个细分群对应于n个特征指标各自的特征分数,这其中也就包括目标细分群对应于n个特征指标的n个目标特征分数。例如,以上述n为3,m为7为例,第一个特征指标包括两个用户特征信息,第一特征指标的特征分数可以是这两个用户特征信息的集成权重以及对应的初始价值层级的乘积之和,基于同样的方式也就能够获得另外两个特征指标的特征分数。这样,也就能够计算出每一个细分群分别对应于这3个特征指标的3个特征分数,同样目标细分群也包括对应于这3个特征指标的3个特征分数。进一步地,根据每一个细分群对应于这3个特征指标各自的特征分数,计算这3个特征指标的平均特征分数,例如以第一个特征指标为例,也就是根据所有细分群对应于第一个特征指标的分数求和后再求平均值,进而得到第一个特征指标的平均特征分数。将目标细分群中每一个特征指标的目标特征分数与对应的平均特征分数进行比对,以确定目标细分群对应于n个特征指标各自的目标层级。
[0092]
例如,以n为3为例,若目标细分群中第一个特征指标的目标特征分数高于该特征指标的平均特征分数,则判定目标细分群对应于第一个特征指标的目标层级为高层级,若目标细分群中第二个特征指标的目标特征分数低于该特征指标的平均特征分数,则判定目标细分群对应于第二个特征指标的目标层级为低层级,若目标细分群中第三个特征指标的目标特征分数低于该特征指标的平均特征分数,则判定目标细分群对应于第三个特征指标的目标层级为低层级,这样也就确定了目标细分群对应于这三个特征指标的目标层级分别为高、低、低。通过这样的方式,也就使得对于细分群的目标层级的划分更加精细,也就使得对于目标用户的群组划分也更为精准、全面。
[0093]
进一步地,所述基于所述目标层级确定所述目标用户的群组包括:
[0094]
基于所述n个特征指标的目标层级确定所述目标用户的群组。
[0095]
本发明实施例中,可以是预先根据n个特征指标设置多个群组,例如以上述n为3,这三个特征指标分别为用户年限指标、用户消费指标和用户缴费指标,每一个特征指标对应的层级都分为高层级和低层级,则根据这3个特指指标及各自的层级可以划分为如下表1所示的群组。
[0096]
表1.群组分类
[0097][0098]
可以理解地,在获得目标细分群对应于上述三个特征指标的目标层级后,基于上表,也就能够找到目标层级对应的群组,进而以确定目标用户的群组。例如,目标用户对应的目标层级为高、低、低,进而目标用户对应的群组也就是低层级保持用户群组。这样,也就
能够基于根据目标细分群对应于各个特征指标的层级,以确定目标用户的群组,使得对于用户群组的划分更为精细、全面,能够更好地评价用户价值。
[0099]
本发明实施例中,通过获取目标用户的特征信息,对用户的特征信息进行聚类划分以生成聚类簇,基于聚类簇来生成细分群,并对细分群进行初始层级判定,再基于用户特征信息对应的集成权重及细分群的初始价值层级来获得用户的目标层级,进而根据目标层级来确定用户对应的用户群组。相对于通过主观判断来对用户进行群组划分,评价用户价值,本技术提供的方案能够避免主观评价造成的误差影响,使得对于用户群组的划分更加准确、客观。
[0100]
可选地,本技术提供的方案可以是应用于对企业客户的用户群组划分,进而能够更好地评价企业客户价值,针对不同用户群组进行特征分析,进行价值客户的特征标签化,从而构建企业客户画像,使得企业能够根据用户群组的特征进行个性化营销服务和业务提升,从而提升企业服务质量和用户满意度。
[0101]
参见图2,图2是本发明实施例提供的一种用户群组划分装置的结构图。如图2所示,用户群组划分装置200包括:
[0102]
获取模块201,用于获取目标用户的m个用户特征信息,所述m为大于等于1的整数;
[0103]
第一生成模块202,用于对每一个所述用户特征信息分别进行聚类划分,以使得每一个所述用户特征信息生成k个聚类簇,所述k为大于等于1的整数;
[0104]
第二生成模块203,用于基于m个所述用户特征信息各自对应的k个聚类簇,生成预设数量的细分群,并对所述细分群进行初始层级判定;
[0105]
第一确定模块204,用于于所述目标用户的用户特征信息,确定所述目标用户对应的目标细分群;
[0106]
第二确定模块205,用于获取所述用户特征信息对应的集成权重,基于所述集成权重及所述初始层级获取所述目标细分群的目标层级,基于所述目标层级确定所述目标用户的用户群组。
[0107]
可选地,第一生成模块202还用于:
[0108]
建立每一个所述用户特征信息对应的样本数据集,基于所述样本数据集生成对应于每一个所述用户特征信息的聚类簇,其中,所述样本数据集中的样本数据为用户特征信息,所述样本数据包括所述目标用户的用户特征信息;
[0109]
基于孤立森林法确定异常样本数据;
[0110]
剔除每一个所述聚类簇中的异常样本数据,得到目标聚类簇;
[0111]
基于平均轮廓系数法确定所述目标聚类簇的目标类别数目,计算不同目标类别数目下所有样本数据的平均轮廓系数,并获取平均轮廓系数最大的值对应的目标类别数目k,以生成k个聚类簇。
[0112]
可选地,用户群组划分装置200还包括划分模块,用于:
[0113]
计算所述异常样本数据与所述k个聚类簇中每一个聚类中心的距离,并将距离最小对应的聚类簇确定为目标聚类簇;
[0114]
将所述异常样本数据划分到所述目标聚类簇中。
[0115]
可选地,第一生成模块202还用于:
[0116]
基于孤立森林法计算每个样本数据在孤立森林中的平均高度,以获取所述样本数
据的异常分数值;
[0117]
获取异常分数阈值,将所述异常分数值大于所述异常分数阈值的样本数据确定为异常样本数据。
[0118]
可选地,第二确定模块205还用于:
[0119]
基于所述集成权重及所述初始层级,计算所述预设数量的细分群中每一个细分群的特征分数,并获取所述目标细分群的目标特征分数;
[0120]
基于所述每一个细分群的特征分数获取平均特征分数;
[0121]
将所述目标特征分数与所述平均特征分数比对,以确定所述目标细分群的目标层级。
[0122]
可选地,所述群组包括n个特征指标,所述n个特征指标包括所述m个用户特征信息,n为小于m的正整数;
[0123]
第二确定模块205还用于:
[0124]
基于用户特征信息对应的集成权重及所述初始价值层级,计算所述预设数量的细分群中每一个细分群对应于所述n个特征指标各自的特征分数,并获取所述目标细分群对应于所述n个特征指标的n个目标特征分数;
[0125]
基于所述每一个细分群对应于所述n个特征指标各自的特征分数,获取所述n个特征指标的平均特征分数;
[0126]
将所述n个目标特征分数与所述n个特征指标的平均特征分数比对,以确定所述目标细分群分别对应于所述n个特征指标的目标层级。
[0127]
可选地,第二确定模块205还用于:
[0128]
基于所述n个特征指标的目标层级确定所述目标用户的用户群组。
[0129]
需要说明的是,用户群组划分装置200能够实现上述图1用户群组划分方法实施例的各个过程,以及达到相同的技术效果,为避免重复,这里不再赘述。
[0130]
本发明实施例还提供一种电子设备。请参见图3,电子设备300可以包括处理器301、存储器302及存储在存储器302上并可在处理器301上运行的程序或指令,所述程序或指令被处理器301执行时可实现上述图1所述的用户群组划分方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
[0131]
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成,所述的程序可以存储于一可读取介质中。本发明实施例还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时可实现上述图1所述用户群组划分方法实施例中的任意步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0132]
所述的存储介质,如只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
[0133]
以上所述是本发明实施例的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献