一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多业态企业潜在客户识别方法与流程

2022-11-19 16:58:02 来源:中国专利 TAG:


1.本发明属于数据处理技术领域,具体涉及一种多业态企业潜在客户识别方法。


背景技术:

2.随着互联网信息技术的高速发展,计算机处理能力得到极大提升,数据存储成本也大幅度削减,使得企业更容易收集并存储客户的大量数据信息,同时客户较为丰富的画像数据得以计算并保存。为达到增加企业投入产出比,同时提升顾客满意度的目标,基于客户消费行为等画像信息对其进行价值分析进而进行有针对性的精准营销是最为有效的实现途径。然而目前对于某一业态客户群体,可以根据其价值属性类的标签信息对客户进行细分,从而识别出较高价值客户群体和较低价值客户群体。目前,对于一些已经站稳市场脚跟的企业来说,多业态产品共同运营成为扩大资产规模的重要途经,对于融合会员群体,例如同一企业下的多个业态融合后的会员群体,当前业态如何借助客户在其它业态的价值表现,判断客户是否具有潜在价值,成为目前重点研究的问题。


技术实现要素:

3.针对现有技术的上述不足,本发明提供一种多业态企业潜在客户识别方法,以解决上述技术问题。
4.本发明提供一种多业态企业潜在客户识别方法,包括:将各业态的会员数据进行数据融合,包括:利用用户唯一标识技术,将各业态的会员数据进行数据融合,确定至少共同存在于任意两个业态的融合会员,以及仅存在于任意一业态中的单一会员;利用文本识别技术实现标签统一,根据融合会员的会员标签构造全业态会员全方位画像;基于机器学习算法技术识别目标业态的潜在价值的融合会员,包括:根据融合会员的全方位画像,采用k-means聚类算法对融合会员分配价值等级;根据分配的融合会员的价值等级,确定目标业态中具有潜在价值的融合会员;基于深度学习预测目标业态中单一会员的潜在价值,包括:以融合会员群体为训练集、测试集,以目标业态的会员标签为特征变量,以融合会员在目标业态的价值等级为响应变量,在训练集上基于stacking建立多分类预测模型,使用xgboost、lightgbm、gdbt算法,利用训练集进行建模、拟合、预测,完成第一层模型,再将第一层模型的预测结果作为输入特征变量,且将价值等级作为响应变量,以bayes分类器作为元分类器,bayes分类器经过训练之后,得到完整的多分类预测模型;在测试集上对所建预测模型进行验证,并将验证通过的预测模型运用到目标业态中的单一会员上,以单一会员在目标业态的价值等级为响应变量,以目标业态的会员标签为特征变量,预测目标业态中单一会员的价值等级;建立推荐模型,根据会员的价值等级向目标业态中的会员发送推荐信息;根据用户针对推荐信息的反馈内容和反馈数量,更新会员在目标业态的价值等级;根据价值等级
变化情况,对反馈的多篇推荐信息的相似度进行分析,根据相似推荐信息更新会员全方位画像。
5.进一步的,所述利用文本识别技术实现标签统一,根据融合会员的会员标签构造全业态会员全方位画像,包括:基于全业态数据构建会员全方位的画像,设定会员标签包括事实标签和分析类标签,所述事实标签包括属性标签和行为标签,属性标签包括性别和年龄;行为标签包括消费频次和客单价;分析类标签包括类别偏好和活动敏感度;针对各业态存储会员信息的数据库进行文本识别,通过字符特征提取的方式获取符合会员标签的内容,填充到对应的会员标签中。
6.进一步的,所述采用k-means聚类算法对融合会员分配价值等级,包括:步骤1、获取任意一个业态的数据集data1数据,利用归一化公式进行归一化处理,归一化公式为:;其中,x为data1中t个标签中的任一标签,n为数据集data1中样本数量,归一化处理后的样本为m1,m2,

,mn,其中mi=(m
i1
,m
i2
,...,m
it
);步骤2、获取预设的聚类类别个数k;步骤3、随机选定一个样本点作为第一个聚类中心c1,其值记作m1计算第一个聚类中心c1与其余n-1个样本点的欧氏距离:;从这n-1个距离中选择最大距离所对应的样本点即所对应样本点作为第二个聚类中心c2,即,其值记作m2,计算c2与n-2个样本m3,

,mn的欧式距离d(c2,mi),i=3,4,n;分别比较m3,

,mn到c1和c2的距离,选m3,

,mn到c1和c2的最小距离的最大值所对应的样本点作为第三个聚类中心c3,,依次进行下去,直到选取出k个聚类中心{c1,c2,

,ck}为止,并将这k个聚类中心所对应的类记为{c1,c2,

,ck};步骤4、分别计算每个样本点与k个聚类中心的欧式距离d(ck,mi),将样本点归到最小距离所对应的类别中,即归到所对应的类别中,重新分配后的类别仍记为{c1,c2,

,ck},此时每个类别中样本的个数记为{n1,n2,

,nn};步骤5、计算每个类别中所有样本点的平均值,并将其作为新的聚类中心,仍记为{c1,c2,

,ck};步骤6、给定容忍阈值ε,计算代价函数值: ;
其中m
i(k)
的上标(k)表示第k类,计算前后两次迭代的代价函数值的减少量,若减少量低于容忍阈值ε,则判断算法收敛,则该聚类算法结束;若不低于容忍阈值ε,则算法不收敛,转到步骤4进行循环迭代,直到聚类算法收敛,最终所得{c1,c2,

,ck}作为k个融合会员价值等级。
7.进一步的,所述建立推荐模型,根据会员的价值等级向目标业态中的会员发送推荐信息,包括:建立推荐模型,根据目标业态中会员的价值等级确定推荐信息的发送渠道和发送周期,所述推荐模型为s=w*x e*y,其中,s为价值等级,w为预设的发送渠道的权重值,e为发送周期的权重值;x为输出的发送渠道的预设值,y为输出的发送周期对应的预设值,x、y为正整数;得到至少一个组合解的x、y,在多个组合解中选择x、y差值最小的一组作为最终xy进行输出。
8.进一步的,所述根据用户针对推荐信息的反馈内容和反馈数量,更新会员在目标业态的价值等级,包括:对反馈内容设定至少一个反馈等级r,并设置反馈等级r的标记a,标记a为“ ”表示接受推荐,标记a为
“‑”
表示不接收推荐;定期接收用户在上一周期内针对该推荐信息的反馈内容和反馈次数f,根据反馈内容确定反馈等级r,输入反馈模型: t=[(a*r*f)/e],其中,[]表示取整函数,e为等级变化阈值,t为该周期用户在目标业态中价值等级的变化量。
[0009]
进一步的,所述根据价值等级变化情况,对反馈的多篇推荐信息的内容相似度进行分析,包括:记录价值等级变化量,将变化量或变化次数超过预设范围的目标推荐信息进行分析;内容相似度包括包括针对推荐信息的标题基于n-gram语言模型和one-hot编码的相似度、针对推荐信息的内容基于lstm模型进行词性分析的相似度;标题相似度的计算方法包括:基于目标推荐信息的标题的短文本特性,通过n-gram语言模型对目标推荐信息的标题进行文本切割,基于one-hot编码语义词典得到稀疏的词语向量;通过计算词语向量之间余弦相似度,计算目标推荐信息的标题相似度;利用句法分析工具词性对目标推荐信息的内容中进行词项切分,将切分后的词项及其句法位置,基于one-hot编码语义词典生成词项向量,将词项向量输入lstm模型,lstm模型该词项向量的词性判断结果;根据词项向量及其词性判断结果,生成词义向量,计算词义向量之间相似度,作为内容相似度的结果。
[0010]
进一步的,所述利用用户唯一标识技术,将各业态的会员数据进行数据融合,包括:利用oneid技术,基于各业态的业务实体手机号、身份证号、邮箱地址、移动端pc端设备id,结合业务规则、机器学习、图计算算法,进行id-mapping,将各业态uniqueid都映射到一个统一的id上,通过所述统一的id关联各个数据孤岛的数据。
[0011]
本发明的有益效果在于,本发明针对多业态独立运营的企业管理经营模式,首先利用用户唯一标识技术,打破数据孤岛,实现多产业数据的融合,加之各业态会员标签构造会员全方位画像。其次,基于机器学习算法技术识别或预测目标业态的潜在价值会员,这一
识别过程分为两个方面:一方面基于融合会员的价值等级采用聚类算法对各业态会员进行分类,对于融合会员群体,根据会员在各业态内的价值表现,筛选出对目标业态来说具有潜在价值的会员;另一方面建立多分类预测模型,以融合会员群体为样本数据集,以融合会员在目标业态的价值等级为响应变量,以融合会员在其它业态的会员标签为特征变量,对目标业态的会员等级进行预测。从而为产业提供一种能够识别出目标业态潜在价值会员的愿景的可行性方法,帮助产业进行更精准的会员营销。此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
[0012]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]
图1是本发明一个实施例的方法的示意性流程图;图2是本发明一个实施例的价值等级的分布示意图。
具体实施方式
[0014]
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0015]
本发明以零售、旅游、酒店三产业为例,对本身发明实施例提供的技术方案进行说明。
[0016]
如图1所示,本发明实施例提供一种多业态企业潜在客户识别方法,包括:s1、将各业态的会员数据进行数据融合。
[0017]
s2、基于机器学习算法技术识别目标业态的潜在价值的融合会员。
[0018]
s3、基于深度学习预测目标业态中单一会员的潜在价值。
[0019]
s4、建立推荐模型,根据会员的价值等级向目标业态中的会员发送推荐信息。
[0020]
s5、根据用户针对推荐信息的反馈内容和反馈数量,更新会员在目标业态的价值等级。
[0021]
s6、根据价值等级变化情况,对反馈的多篇推荐信息的相似度进行分析,根据相似推荐信息更新会员全方位画像。
[0022]
可选地,作为本发明一个实施例,s1包括:具体包括:利用用户唯一标识技术,将各业态的会员数据进行数据融合,确定至少共同存在于任意两个业态的融合会员,以及仅存在于任意一业态中的单一会员;利用文本识别技术实现标签统一,根据融合会员的会员标签构造全业态会员全方位画像;所述利用用户唯一标识技术,将各业态的会员数据进行数据融合,包括:利用oneid技术,基于各业态的业务实体手机号、身份证号、邮箱地址、移动端pc端设备id,结合业务规则、机器学习、图计算算法,进行id-mapping,将各业态uniqueid都映射到一个统一
的id上,通过所述统一的id关联各个数据孤岛的数据。
[0023]
例如:在零售业态和旅游业态的场景下,经业务系统数据探查,零售业态会员的uniqueid有会员姓名、会员卡号、身份证号、手机号、座机号、邮箱地址、家庭 住址和车牌号;旅游业态会员的uniqueid有会员姓名、会员卡号、会员档案号、身份证号、手机号、座机号、邮箱地址、qq号、家庭住址和驾驶证。将两业态数据上云之后,结合各uniqueid的重要性程度通过阿里数据中台dataphin的oneid模块计算得到统一id,通过这一统一的id即可关联零售数据也可关联旅游数据,从而实现了零售业态和旅游业态之间的数据关联,进而可识别出既是零售会员又是旅游会员的融合会员群体。
[0024]
可选地,作为本发明一个实施例,所述利用文本识别技术实现标签统一,根据融合会员的会员标签构造全业态会员全方位画像,包括:基于全业态数据构建会员全方位的画像,设定会员标签包括事实标签和分析类标签,所述事实标签包括属性标签和行为标签,属性标签包括性别和年龄;行为标签包括消费频次和客单价;分析类标签包括类别偏好和活动敏感度;针对各业态存储会员信息的数据库进行文本识别,通过字符特征提取的方式获取符合会员标签的内容,填充到对应的会员标签中。
[0025]
各产业数据打通之后,可以基于全产业数据构建会员全方位的画像。s2具体包括:根据融合会员的全方位画像,采用k-means聚类算法对融合会员分配价值等级;根据分配的融合会员的价值等级,确定目标业态中具有潜在价值的融合会员。
[0026]
通常,会员标签有三类,第一类是事实标签,这一类标签又可分为两小类,第一小类是如性别和年龄等的属性标签,第二小类是如消费频次和客单价等的行为标签;第二类是如类别偏好和活动敏感度等的分析类标签;第三类是如下次购买时间和有可能买的商品等的预测类标签。由于发明目的为识别具有潜在价值的会员,故研究仅考虑描述客观事实类的标签,即第一类事实标签和第二类分析类标签。最终确定的标签展示如下:零售事实标签之属性标签:年龄rt1、性别rt2、入会渠道rt3、入会方式rt4、入会时间rt5、会员等级rt6。
[0027]
零售事实标签之行为标签:超市近一个月消费频次、百货近一个月消费频次、超市近三个月消费频次、百货近三个月消费频次、超市近六个月消费频次、百货近六个月消费频次、超市近一年消费频次、百货近一年消费频次、超市近一个月消费金额、百货近一个月消费金额、超市近三个月消费金额、百货近三个月消费金额、超市近六个月消费金额、百货近六个月消费金额、超市近一年消费金额、百货近一年消费金额、超市近一年最大单笔消费金额、百货近一年最大单笔消费金额、超市最后一次消费时间间隔、百货最后一次消费时间间隔、是否超市活跃会员、是否百货活跃会员、是否超市忠诚会员、是否百货忠诚会员、是否超市极度忠诚会员、是否百货极度忠诚会员、是否超市即将沉睡会员、是否百货即将沉睡会员、是否超市沉睡会员、是否百货沉睡会员、是否超市流失会员、是否百货流失会员、是否超市高贡献会员(含券)、是否百货高贡献会员(含券)、是否超市高贡献会员(不含券)、是否百货高贡献会员(不含券)、超市近一年特价商品消费占比、百货近一年特价商品消费占比、超市近一年高特价商品消费占比、百货近一年高特价商品消费占比。
[0028]
零售分析类标签:超市近一个月偏好品类、百货近一个月偏好品类、超市近三个月偏好品类、百货近三个月偏好品类、超市近六个月偏好品类、百货近六个月偏好品类、超市近一年偏好品类、百货近一年偏好品类。
[0029]
旅游事实标签之属性标签:性别、年龄段、会员等级、入会时间、注册周年。
[0030]
旅游事实标签之行为标签:会员活跃状态、年财务贡献级别、年入住频次、累计房晚数、点评次数、差评数、投诉数、是否登录过app、会员当下可用储值、会员当下可用积分、会员价值(近24个月)、最后一次消费时间间隔、是否关注微信。
[0031]
旅游分析类标签:品牌偏好、消费价格带偏好、预定渠道偏好、消费房价区间偏好、常驻房型。
[0032]
本方案以任意两产业com1和com2为例,针对存在于两个产业中的融合会员群体,对会员在com1和com2内分别进行价值分析,将com1内的会员分类类别按其价值等级由底到高记为l
11
、l
12
、l
13
、l
14
和l
15
;将com2内的会员分类类别按其价值等级由底到高记为l
21
、l
22
、l
23
、l
24
和l
25

[0033]
由此融合会员群体中的每个个体都可在l
11
、l
12
、l
13
、l
14
和l
15
中找到对应所属第一等级l1,也可在l
21
、l
22
、l
23
、l
24
和l
25
中找到对应所属的第二等级l2。最终通过比较l1和l2的等级属性,识别具有潜在价值的会员群体。比如若某会员个体m1的l1取值为l
15
,l2取值为l
21
,则l1》 l2,从而对com2来说,m1是其潜在价值会员,如图2所示,l
12、
l
13、
l
14
和l
15
分别对应的共10种会员群体,即为com2的具有潜在价值的会员群体。
[0034]
下面对会员在com1和com2内进行分类的策略做详细阐述。在零售产业com1和旅游产业com2的场景下,首先从零售画像标签体系中提取衡量零售业态会员价值表现的标签共6个,分别为最后一次消费时间间隔r1、近一年消费金额m1、近一年消费频次f1、近一年最大单笔消费金额p1、近一年特价商品消费占比s1、近一年高贡献商品消费占比c1;从旅游画像标签体系中提取衡量旅游业态会员价值表现的标签共4个:年入住频次f2、累计房晚数h2、最后一次消费时间间隔r2、会员近24个月消费金额m2。导出融合会员群体数据集,融合会员的零售业态相关数据集记为data1,旅游业态相关数据集记为data2。
[0035]
在传统的客户价值分析中,一般仅使用消费时间间隔、消费频次和消费金额三个标签。但考虑到这三个标签在衡量会员价值方面的局限性,不能较为全面的刻画会员的价值属性,也考虑到各业态之间其业务的异质性,故对传统客户价值分析的标签进行了调整。最终确定了如上所述的零售业态的6个标签r1f1m1p1s1c1,旅游业态的4个标签r2f2m2h2。在传统的客户细分中,一般是通过对各标签取值区间的划分来达到对客户分类的目的,但是这种方法所得的分类结果过多,并且随着分析标签的增加分类结果呈指数级增加,这就加大了结果分析的难度。另外,这种方法区间划分临界值的确定也较为主观,客户之间的边界较为模糊,所以对企业实际应用的指导意义不是很大。因此,本发明实施例采用聚类算法实现客户价值等级的分类,根据数据本身结构和数据的接近及疏离程度来进行客户类别的划分,类与类之间的距离较为清晰,细分结果也相对简单明了,能够很好的克服上述传统客户细分方法所存在的问题。在聚类算法的选择上,可采用k-means算法。传统k-means算法的步骤是:步骤(1)初始化:随机选取k个样本点作为初始聚类中心;步骤(2)更新分区:针对每个数据点,计算其到每个聚类中心的距离,并将其归至最近的类中;步骤(3)更新聚类中心:计算每个类别中所有点的坐标平均值,并将这个平均值作为新的聚类中心;
步骤(4)判断是否收敛:假如聚类中心的改变不高出预先设定的阈值,或者代价函数的改变没有高出设定的阈值,则收敛;否则转向步骤(2)。其中代价函数的概念为:设数据集为d={x1,x2,...,xm},d分成k个类,{ci,i=1,2,...,k}其中分别包含n1,n2,...,nk个样本,并且。假定每个类的聚类中心是qi,那么,其中,xj∈ci且i=1,2,...,k;假定s为ci的样本点,那么代价函数为。故代价函数为总误差平方和,其值越小则误差越小,证明聚类效果就越好。
[0036]
这种k-means算法具有比较显著的优点,比如算法简单,原理易懂,计算量较小;算法收敛速度快,效率高;在处理大数据集时具有高效和可伸缩性的特点,算法的适应性较强;当数据集的分布状态为球状或突起状时其聚类效果较好。但k-means算法也存在其局限性,其对初始聚类中心的敏感度较高,选择不同的初始聚类中心可能会有不同的聚类结果,若初始聚类中心选择不合适,聚类效果就会大大降低;其对噪声较大的点或孤立点也比较敏感,因为在每次迭代中都会计算类别内点的平均值并将其作为新的聚类中心,所以即使是较少的异常点也会对平均值产生较大的影响,从而导致结果不稳定;该算法需要预先设定聚类个数k,然而在无监督类任务上,由于不知道数据集究竟有多少类别,所以很难确定k的取值。
[0037]
考虑到k-means算法的局限性和研究场景的特殊性,针对初始聚类中心的选择,选取聚类尽可能远的k个点作为聚类中心。由于客户细分的最终目的是对比两产业各细分群体的价值类别来识别潜在价值客户群体,为了使对比具有可操作性和可解释性,对于类别k的取值事先给定。另外,在零售和旅游业态融合的场景下,考虑到零售业态标签r1f1m1p1s1c1和旅游业态标签r2f2m2h2的数据量纲的不同,所以需要对数据进行归一化处理,将数据映射到 [0,1]范围之间。
[0038]
综上,下面给出零售业态com1中客户细分的具体步骤。旅游业态com2中客户细分的步骤类似。
[0039]
可选地,作为本发明一个实施例,所述采用k-means聚类算法对融合会员分配价值等级,包括:步骤1、获取任意一个业态的数据集data1数据,利用归一化公式进行归一化处理,归一化公式为:;其中,x为data1中t个标签中的任一标签,n为数据集data1中样本数量,归一化处理后的样本为m1,m2,

,mn,其中mi=(m
i1
,m
i2
,...,m
it
);步骤2、获取预设的聚类类别个数k=5;步骤3、随机选定一个样本点作为第一个聚类中心c1,其值记作m1计算第一个聚类中心c1与其余n-1个样本点的欧氏距离:;
从这n-1个距离中选择最大距离所对应的样本点即所对应样本点作为第二个聚类中心c2,即,其值记作m2,计算c2与n-2个样本m3,

,mn的欧式距离d(c2,mi),i=3,4,...,n;分别比较m3,

,mn到c1和c2的距离,选m3,

,mn到c1和c2的最小距离的最大值所对应的样本点作为第三个聚类中心c3,,依次进行下去,直到选取出5个聚类中心{c1,c2,

,c5}为止,并将这5个聚类中心所对应的类记为{c1,c2,

,c5};步骤4、分别计算每个样本点与5个聚类中心的欧式距离d(ck,mi),将样本点归到最小距离所对应的类别中,即归到所对应的类别中,重新分配后的类别仍记为{c1,c2,

,c5},此时每个类别中样本的个数记为{n1,n2,

,nn};步骤5、计算每个类别中所有样本点的平均值,并将其作为新的聚类中心,仍记为{c1,c2,

,ck};步骤6、给定容忍阈值ε,计算代价函数值: ;其中m
i(k)
的上标(k)表示第k类,计算前后两次迭代的代价函数值的减少量,若减少量低于容忍阈值ε,则判断算法收敛,则该聚类算法结束;若不低于容忍阈值ε,则算法不收敛,转到步骤4进行循环迭代,直到聚类算法收敛,最终所得{c1,c2,

,c5}作为5个融合会员价值等级。
[0040]
最后,对聚类所得的类别可通过雷达图进行详细分析,为各类别添加价值标识,至此,完成零售业态com1的客户潜在价值的分类。
[0041]
可选地,作为本发明一个实施例,s3包括:以融合会员群体为训练集、测试集,以目标业态的会员标签为特征变量,以融合会员在目标业态的价值等级为响应变量,在训练集上基于stacking建立多分类预测模型,使用xgboost、lightgbm、gdbt算法,利用训练集进行建模、拟合、预测,完成第一层模型,再将第一层模型的预测结果作为输入特征变量,且将价值等级作为响应变量,以bayes分类器作为元分类器,bayes分类器经过训练之后,得到完整的多分类预测模型;在测试集上对所建预测模型进行验证,并将验证通过的预测模型运用到目标业态中的单一会员上,以单一会员在目标业态的价值等级为响应变量,以目标业态的会员标签为特征变量,预测目标业态中单一会员的价值等级;例如,以融合会员在零售业态的会员标签作为特征变量,以融合会员在酒店业态的会员标签作为响应变量,基于stacking建立多分类预测模型。在建模时对数据集进行训练集和测试集的划分,先在训练集上训练多分类预测模型,然后在测试集上进行验证。最后将所建得的多分类预测模型应用到仅是零售业态的会员但其不是酒店业态的会员的单一会员群体中,对单一会员在酒店业态的价值等级进行预测,识别出具有潜在价值的客户。
[0042]
可选地,作为本发明一个实施例,s4包括:建立推荐模型,根据目标业态中会员的价值等级确定推荐信息的发送渠道和发送周期,所述推荐模型为s=w*x e*y,其中,s为价值
等级,w为预设的发送渠道的权重值,e为发送周期的权重值;x为输出的发送渠道的预设值,y为输出的发送周期对应的预设值,x、y为正整数;得到至少一个组合解的x、y,在多个组合解中选择x、y差值最小的一组作为最终xy进行输出。在推荐信息时,针对不同的客户生成不同的推荐方案,例如价值等级高的客户,需要使用更为关键的发送渠道和更为频繁的发送周期,使得客户即使及时接收推荐信息,有利于客户关系的维系。通常推荐方案中包括发送渠道和发送周期,通过本实施例提供的推荐模型,可以直接根据价值等级自动分配发送推荐信息的渠道和周期;即使随着技术的革新或者公司的发展,引入新的发送渠道,也可以对新的发送渠道设置权重,无需对发送推荐信息的方案进行大范围调整。
[0043]
例如:发送渠道的预设值包括:x=1时,发送渠道为短信,x=2时,发送渠道为微信,x=3时,发送渠道为人工智能电话,x=4时,发送渠道为人工电话,x=5时,发送渠道为邮寄;发送周期对应的预设值包括y=1、2、3、4、5、6、7,且,y=1对应7天,y=2对应6天,...,y=7对应1天。假设价值等级s=5,w=0.4,e=0.6,0.4x 0.6y=5,令x=1,2,3,...,n,n为非零自然数,x<s/w, 或令y=1,2,3,..., n,n为非零自然数,x<s/w,输出不同组合的x、y值,包括:x=5,y=5;x=2,y=7;其中,x=5,y=5这一组差值最小,且并没有x=7对应的预设值,所以将x=5,y=5作为最终xy进行输出。
[0044]
可选地,作为本发明一个实施例,s5包括:对反馈内容设定至少一个反馈等级r,并设置反馈等级r的标记a,标记a为“ ”表示接受推荐,标记a为
“‑”
表示不接收推荐;定期接收用户在上一周期内针对该推荐信息的反馈内容和反馈次数f,根据反馈内容确定反馈等级r,输入反馈模型: t=[(a*r*f)/e],其中,[]表示取整函数,e为等级变化阈值,t为该周期用户在目标业态中价值等级的变化量。
[0045]
在本实施例中,反馈内容可以是表示接受和不接受信息,常见的例如短信信息,用户可以发送“退订”表示不接收,例如电话回访中,用户的按键反馈,例如公众号推文中设置的调查问卷,“喜欢”、“一般”和“不喜欢”三种选项,或者其他可以在不破坏用户隐私下获取的用户的反馈信息。至于反馈内容和反馈等级r的关系,需要提前设定,根据反馈内容确定反馈等级r的方式根据反馈内容的形式进行设定,例如“喜欢”、“一般”和“不喜欢”三种选项,且三种选项对应三种反馈等级。
[0046]
可选地,作为本发明一个实施例,s6包括:记录价值等级变化量,将变化量或变化次数超过预设范围的目标推荐信息进行分析。
[0047]
在本实施例中,对目标推荐信息进行进一步的分析,便于精准瞄准客户对于推荐信息的关注点,丰满客户的画像。对反馈内容表示接受的推荐信息,分析该客户喜好的推荐信息的共同内容,对反馈内容表示不接受的推荐信息,分析该客户不喜欢推荐信息的共同内容。例如,第一目标推荐信息:“本周日超市日用品区会员八折优惠,xx商品买一送一”, 第二目标推荐信息:“本周六食品区会员七折优惠,会员消费满一百元,即可抽奖一次”,该用户对这两篇推荐信息的反馈内容均为“接收”,该推荐信息的共同内容在于“折扣优惠”,所以该用户对“折扣优惠“感兴趣。
[0048]
在本实施例中,将推荐信息划分为标题和内容,一般标题更容易引起客户注意,所以标题和内容的重要度是不一样的,针对共同内容的提取采用相似度进行评价。所以相似度包括:针对推荐信息的标题基于n-gram语言模型和one-hot编码的相似度、针对推荐信息的内容基于lstm模型进行词性分析的相似度。
[0049]
一方面,目标推荐信息的标题相似度的计算方法包括:基于目标推荐信息的标题的短文本特性,通过n-gram语言模型对目标推荐信息的标题进行文本切割,基于one-hot编码语义词典得到稀疏的词语向量;通过计算词语向量之间余弦相似度,计算任意两篇目标推荐信息标题相似度。
[0050]
另一方面,目标推荐信息的内容相似度的计算方法包括:利用句法分析工具对目标推荐信息的内容中进行词项切分,得到切分后的词项及其句法位置,并基于one-hot编码语义词典将切分后的词项及其句法位置生成词项向量,将词项向量输入lstm模型,lstm模型输出该词项向量的词性判断结果;根据全文的词项向量及其词性判断结果,基于one-hot编码生成词义向量,通过计算词义向量之间余弦相似度,作为推荐信息内容相似度的结果。例如第一目标推荐信息:“本周日超市日用品区会员八折优惠,xx商品买一送一”,划分为“本周六/食品区/会员/七/折/优惠/,会员/消费/满/一百元,即可/抽奖/一次”,句法位置包括“主、谓、宾、定、状、补”,也是句法分析工具可以直接得出的,例如“本周六”为“定语”、“食品区”为主语、“七折优惠”为状语。词性分为“名词、动词、数词、量词”等常规词性,状语“七”“折”“优惠”的词项向量为a1、a2、a3,由lstm模型得到的词性为“a
1-数词”、“a
2-量词”、“a
3-名词”,进一步得到词义向量为a1、a2、a3,将所有目标推荐信息均在一个词向量空间进行转换,得到各自的词义向量。得到第一目标推荐信息的词义向量集合为a={...,a1,a2,a3,...,an},同理得到第二目标推荐信息的词义向量集合为b={b1,b2,b3,...,bn};根据词向量余弦的公式计算出两篇推荐信息的内容相似度,公式为:。
[0051]
可选地,作为本发明一个实施例,lstm模型训练过程如下:利用句法分析工具词性对历史推荐信息的内容中进行词项切分,将切分后的词项及其句法位置,基于one-hot编码语义词典生成词项向量,将词项向量输入lstm模型,lstm模型的响应向量为词性判断结果。
[0052]
确定任意两篇推荐内容的相似度后,将内容相似度高于预设相似度的目标推荐信息,反馈到企业,有利于工作人员对相似度高的内容进行人工分析,将人工分析的共同点转化为客户特征,标注于客户全方位画像上,例如,某一客户的a、b、c三篇目标推荐信息的相似度高于预设相似度,人工分析发现三者都包含“打折优惠”“新品上新”的信息,则该客户特征为“喜爱打折优惠”,“关注上新”,便于根据客户特征发送推荐信息。
[0053]
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内活任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献