一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种智能电视用户生命周期的划分方法与流程

2022-10-26 15:07:08 来源:中国专利 TAG:


1.本发明涉及大数据和人工智能技术领域,具体涉及一种智能电视用户生命周期的划分方法。


背景技术:

2.随着智能电视产品不断被使用,用户数量也会跟着增长。当用户量增长到十万、百万、千万的时候,怎样精细化运营和管理,怎样给用户打上符合他们特征的标签,怎样组合各种标签形成用户的画像,这些对于企业管理用户至关重要。智能电视用户生命周期描绘了用户从接触智能电视到离开该智能电视的整个过程,一般定义为5个阶段:新客期、成长期、成熟期、衰退期、流失期,每个阶段体现了用户不同的参与程度。准确判断出用户所处的生命周期阶段,对于企业在内容推荐及产品销售方面都有很大的帮助。
3.当前,智能电视用户生命周期大多基于经验规则定义,随着用户增长,用户与电视的交互习惯改变时,规则会从新被定义,这些都需要具有丰富经验的运营人员或者产品经理才能比较准确的定义。基于规则的方法固然好用,效率也高,除了对规则定义要求高外,可能定义的规则并没有覆盖到所有用户,这样就会出现某个用户一直停留在一个时期。早期,数据挖掘技术并未发展成熟,在智能电视用户生命周期划分时,大多还是依靠经验规则,近些年,数据挖掘技术已经广泛应用在各行各业,而智能电视用户的生命周期符合数据挖掘特点,生命周期不同阶段对应了用户不同习惯。随着用户增长和用户习惯改变,基于规则的方法无法准确划分出智能电视用户的生命周期。


技术实现要素:

4.为了解决上述技术问题,本发明提供了一种智能电视用户生命周期的划分方法,该方法能够有效完成智能电视成用户生命周期划分,同时能够适应数据增长及用户习惯改变的需求。
5.为了达到上述技术效果,本发明提供了如下技术方案:
6.一种智能电视用户生命周期的划分方法,包括以下步骤:(1)数据准备;(2)特征工程,对数据进行标准化处理;(3)训练聚类模型;(4)将聚类结果与用户生命周期进行匹配;(5)将用户的生命周期数据更新至hbase表,并通过用户画像平台展示。
7.进一步的技术方案为,步骤(1)中所述数据包括智能电视激活时间以及用户与智能电视的交互数据。
8.具体的,通过云端数据平台,得到智能电视的激活日期,及近1个月用户与电视的交互数据,得到基础数据集。
9.进一步的技术方案为,步骤(2)具体为先对基础数据进行处理,将近1个月用户交互数据按4周划分,对每周单独计算用户总交互次数,得到4组交互数据《周数,总交互次数》,再关联产品激活时间,计算得到产品激活年限。
10.由于产品激活年限与交互次数的数值分布区间不一样,产品激活年限一般为(0,
n),n通常小于10,而交互次数通常从几次到上百次不等。因此将产品激活年限除以10(即n/10),交互次数采用时间衰减,最近1周影响最大,影响依次减弱,公式如下所示:
11.interaction_times=first*math.exp(-0.0719*4) second*math.exp(-0.0719*3) third*math.exp(-0.0719*2) fourth*math.exp(-0.0719*1)
12.其中interaction_times为近1月交互次数,first为近1月第1周交互次数,second为最近第2周交互次数,third为近1月第3周交互次数,fourth为近1月第4周交互次数,-0.0719为衰减因子(first第一周交互次数衰减至3/4),最后将interaction_times/400得到交互属性值。通过特征工程,最终形成了模型需要的数据集《user:《year,interaction_times》》,特征为2元组,产品激活年限和用户交互次数。
13.进一步的技术方案为,步骤(3)中使用机器学习算法kmeans完成用户群体划分,创建k个划分,然后迭代地将样本从一个划分转移到另一个划分来改善最终聚类的质量。
14.kmeans是一个迭代求解的聚类算法,其属于划分型的聚类方法,创建k个划分,然后迭代地将样本从一个划分转移到另一个划分来改善最终聚类的质量,通过setk(5)方法设置聚类结果为5类。
15.进一步的技术方案为,根据聚类结果得到5个聚类中心,电视激活年限year最小,交互次数也最小的类别为新客期;电视激活年限year次之,交互次数有所增长的为成长期;电视激活年限year为中位数,交互次较成长期有略微增长的为成熟期;电视激活年限year为最大,交互次最小的为流失期;衰退期较成熟期交互次数有所下降,电视激活年限小于流失期。
16.进一步的技术方案为,步骤(5)具体为将得到的电视用户生命周期数据写入hbase表,数据结构为《user,life_period》;user表示用户,life_period表示智能电视用户的生命周期阶段,通过智能电视用户画像平台展示用户生命周期状态。
17.与现有技术相比,本发明具有如下有益效果:该技术方案首先基于智能电视激活时间、用户近1个月的交互数据,通过对数据进行关联、标准化处理等一系列操作,得到了模型需要的数据集;然后使用机器学习聚类算法训练数据集,将数据分成5类;再将5类数据分别与用户生命周期的5个阶段相对应;最后将结果数据《user,life_period》更新至hbase表,并通过用户画像平台展示用户的生命周期状态。本发明能够有效完成智能电视成用户生命周期划分,同时能够适应数据增长及用户习惯改变的需求。
附图说明
18.图1为智能电视用户生命周期判断流程图。
具体实施方式
19.下面结合附图和具体实施例对本发明进行进一步的解释和说明。
20.实施例1
21.如图1所示,本发明提供了一种智能电视用户生命周期的划分方法,包括以下步骤:(1)数据准备;(2)特征工程,对数据进行标准化处理;(3)训练聚类模型;(4)将聚类结果与用户生命周期进行匹配;(5)将用户的生命周期数据更新至hbase表,并通过用户画像平台展示。具体如下:
22.获取数据:当智能电视被购买,出厂后,用户会激活电视,激活以后,用户会浏览或者点击电视上的影视内容,电视终端采集到激活时间与交互数据,通过加密协议将数据上传云端。
23.特征工程:基础数据包含2类数据,智能电视激活年限、用户在电视页面上的点击次数。用户与电视的交互考虑近1个月数据,划分成4周,每周单独计算点击次数,4组点击数据采用时间衰减加权,将4组点击数据合并为1个值,相当于对特征进行了压缩。考虑到不同特征值的值域不一样,为了避免某个特征值较大,对聚类效果影响太大,故对特征进行了类似于归一化的方法处理。
24.模型训练:将业务目标转化为机器学习任务,即是对用户进行划分,只有特征项,没有标签,属于无监督任务,机器学习里面的聚类算法刚好可以完成这种需求。基于spark的ml包里面的kmeans方法提供了kmeans 并行化,可以让初始聚类中心尽可能相互远离,通过创建k个划分,然后迭代地将样本从一个划分转移到另一个划分,最终完成用户划分。
25.聚类结果与智能电视用户生命周期5个阶段对应:基于选定的聚类k值,得到k个聚类中心,对每个特征维度进行评估,综合特征数据,确定所处的生命周期阶段。如表1所示:k为5,得到5组聚类中心,与用户生命周期的5个阶段相对应。新客期表现为用户刚买电视不久,开始熟悉电视,使用电视,对应类别2;成长期较新客期使用电视更加频繁,对应类别4;成熟期表现为电视年龄居中,用户对电视使用频次稳定,对应类别0;衰退期表现为使用电视频率降低,且电视年龄较大,对应类别3;流失期表现在用户基本不使用电视了,一般电视年龄很大,对应类别1。
26.数据更新至hbase表:将用户的生命周期数据保存到hbase,列簇为用户标识(通常为用户id),值为用户对应的生命周期阶段(新客期、成长期、成熟期、衰退期、流失期)。
27.尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本技术公开的原则范围和精神之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献