一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

潜在用户挖掘的方法、装置、电子设备及存储介质与流程

2023-02-04 13:59:16 来源:中国专利 TAG:

技术特征:
1.一种潜在用户挖掘的方法,包括如下步骤:s1、配置和预设数据抽取、清洗、转换规则;s2、通话信令汇集,根据采集规则采集全国各省的电信用户通话信令,其中,所述采集规则包括:确定信令数据采集周期、信令数据,所述信令数据包括:话单处理时间、呼叫类型、imsi、主叫号码、被叫号码、通话开始时间、通话结束时间、通话时长;s3、通话信令清洗、转换、结构化,因各省电信信令的差异性,需要对非法信令进行数据清洗,根据s1步骤中配置的数据清洗规则对采集的通话信令进行清洗;根据s1步骤中配置的数据转换规则将清洗后的信令数据进行归一化处理,生成标准的结构化的信令数据,其中,信令归一化处理包括原数据与系统内标准信令数据形成对应关系;s4、采用小样本多次抽样法获取初始化质心,以提高算法精准度,由聚类所生成的一组样本形成簇,对同一簇内信令数据进行小样本多次抽样法评估输入的小样本的聚类质心,得到新的质心;s5、海量信令的k-means模型聚类,把结构化的信令数据作为k-means模型的输入,进行聚类分析,输出聚类结果;s6、可营销的目标号码,通过聚类结果挖掘出潜在用户号码作为可营销的目标号码。2.如权利要求1所述的方法,其中,s4步骤包括如下步骤:s41、先计算信令数据同一簇内全部的聚类质心两两之间的欧氏距离总和,然后将总和除以组合数作为淘汰奇异聚类质心的阈值;s42、选取此簇第一个全局最优聚类质心,其中,选取的标准是此聚类质心到此簇其余聚类质心距离小于阈值的概率不能小于0.4,接下来s43或s44方法弃除奇异质心;s43、继续按照步骤s42的方法选第二个聚类质心、第三个聚类质心和多个聚类质心,直到没有好的聚类质心可以加入,从而剩余的聚类质心判断为奇异聚类质心;s44、选取第一个全局聚类质心后,不再继续选取第二全局最优聚类质心,而把第一个当作参照聚类质心,接着算出此簇其余聚类质心到参考聚类质心的距离,如果此距离小于阈值,则可认为此聚类质心较好;否则,则视为次优质心。3.如权利要求2所述的方法,其中,s5步骤包括如下步骤:s51、经过步骤s4小样本多次抽样的方案得到聚类模型的初始化质心,设为k个样本作为初始聚类质心:a=a1,a2,

ak;所述质心包括遇忙、久呼不应、不可达、无条件呼的通信助理信令场景;s52、针对数据集中每个样本xi计算它到k个聚类质心的距离并将其分到距离最小的聚类质心所对应的类中;将数据集d={x1,x2,

,xm},通过k-means划分得到c={c1,c2,

,ck};其中,根据每通电话的信令数据计算到质心的欧式几何距离,完成每次循环的信令聚类;s53、针对每个类别aj,重新计算它的聚类质心,即属于该类的所有样本的质心:并完成通信助理包括遇忙、久呼不应、不可达、无条件呼的场景的质心更新;
s54、重复上面s52和s53两步操作,直到达到包括迭代次数、最小误差变化的中止条件产生;s54、不断训练模型,优化模型,筛选出符合通信助理触发场景的信令。4.如权利要求1所述的方法,其中,步骤s3中,所述数据清洗规则包括:无效数据的特征规则和特殊数据的特征规则;无效数据为不包括如下任意一种数据的通话记录:呼叫类型、主叫号码、被叫号码、imsi、通话开始时间、通话结束时间,所述无效数据的特征规则为对于无效数据在数据清洗时系统自动清理掉;所述特殊数据的特征规则为在数据清洗时忽略所有特殊号码的通话记录数据。5.如权利要求1所述的方法,还包括:s7、短信营销、电话营销,利用聚类的结果目标号码进行精准短信营销、电话营销,发展成为通信助理业务用户。6.如权利要求5所述的方法,还包括:s8、业务用户的客户关怀,利用聚类结果进行精确的客户关怀,从而维持好客户关系。7.一种潜在用户挖掘的装置,包括:规则预设模块,用于配置和预设数据抽取、清洗、转换规则;通话信令汇集模块,用于根据采集规则采集全国各省的电信用户通话信令,其中,所述采集规则包括:确定信令数据采集周期、信令数据,所述信令数据包括:话单处理时间、呼叫类型、imsi、主叫号码、被叫号码、通话开始时间、通话结束时间、通话时长;通话信令清洗、转换、结构化模块,因各省电信信令的差异性,需要对非法信令进行数据清洗,根据所述规则预设模块的数据清洗规则对采集的通话信令进行清洗;根据所述规则预设模块的数据转换规则将清洗后的信令数据进行归一化处理,生成标准的结构化的信令数据,其中,信令归一化处理包括原数据与系统内标准信令数据形成对应关系;质心获取模块,所述质心获取模块采用小样本多次抽样法获取初始化质心,以提高算法精准度,由聚类所生成的一组样本形成簇,对同一簇内信令数据进行小样本多次抽样法评估输入的小样本的聚类质心,得到新的质心;k-means聚类模块,用于将海量信令进行k-means模型聚类,把结构化的信令数据作为k-means模型的输入,进行聚类分析,输出聚类结果;目标号码输出模块,通过聚类结果挖掘出潜在用户号码作为可营销的目标号码,并输出。8.如权利要求7所述的装置,还包括:营销模块,通过短信营销、电话营销,利用聚类的结果目标号码进行精准短信营销、电话营销,发展成为通信助理业务用户;用户关系维持模块,用于进行对业务用户进行客户关怀,利用聚类结果进行精确的客户关怀,从而维持好客户关系。9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的潜在用户挖掘程序,所述潜在用户挖掘程序被所述处理器执行时实现如权利要求1至6中任一项所述的潜在用户挖掘方法的步骤。10.一种计算机存储介质,其中,所述计算机存储介质上存储有潜在用户挖掘程序,所述潜在用户挖掘程序被处理器执行时实现如权利要求1至6中任一项所述的潜在用户挖掘
方法的步骤。

技术总结
本发明涉及一种潜在用户挖掘的方法、装置、电子设备及存储介质。潜在用户挖掘的方法包括步骤:S1、配置和预设数据抽取、清洗、转换规则;S2、根据采集规则采集全国各省的电信用户通话信令;S3、通话信令清洗、转换、结构化;S4、采用小样本多次抽样法获取初始化质心,对同一簇内信令数据进行小样本多次抽样法评估输入的小样本的聚类质心,得到新的质心;S5、海量信令的K-means模型聚类,把结构化的信令数据作为K-means模型的输入,进行聚类分析,输出聚类结果;S6、可营销的目标号码,通过聚类结果挖掘出潜在用户号码作为可营销的目标号码。依据本发明的潜在用户挖掘的方法,可以提高信令聚类分析的精度、性能与稳定性,获取精准的目标数据。标数据。标数据。


技术研发人员:孙清源 朱江 曹思佳 刘艳华 潘琳 陈家俊 李井峰 李瑁 赵峻毅 段巍巍 张静 崔春红 于莎莎 卢丹 吴曾
受保护的技术使用者:号百信息服务有限公司
技术研发日:2022.10.26
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献