一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种对客户投诉进行预警的方法及装置与流程

2021-11-15 15:06:00 来源:中国专利 TAG:


1.本发明涉及数据处理领域,尤其涉及一种对客户投诉进行预警的方法及装置。


背景技术:

2.iptv是一种利用宽带网向家庭用户提供包括数字电视在内的多种交互服务的崭新技术,随着iptv的广泛应用,用户的数量也在快速增长,但是收到的客户投诉也越来越多。为了向用户提供优质的服务,运维管理人员需要及时的解决出现的各种投诉问题。
3.当前,运维人员都是在收到客户投诉后,再处理客户发起的投诉,但是无法做到对客户投诉进行预警,即无法对客户可能出现的投诉进行预判,更无法从根本上找到投诉的问题所在。在这种情况下,运维人员不能预先解决可能出现的问题,也就无法改善iptv的服务质量,很有可能导致客户的满意度下降。


技术实现要素:

4.有鉴于此,本发明实施例公开了一种对客户投诉进行预警的方法及装置,解决了现有技术中由于无法对客户投诉进行预警导致的客户满意度下降的问题。
5.本发明实施例公开了一种对客户投诉进行预警的方法,包括:
6.获取待处理的指标数据集;所述待处理的指标数据集中包括至少一个用户对应的指标数据;
7.基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;所述目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;所述第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;
8.对所述目标用户进行分析,确定所述目标用户的投诉原因。
9.可选的,所述待处理的指标数据是基于各个指标数据之间的相似程度和/或基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选后得到的。
10.可选的,所述基于各个指标数据之间的相似程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的过程,包括:
11.计算待处理的指标数据集中每个用户对应的各个指标数据之间的pearson相关系数;
12.针对每个用户,筛选出大于预设系数阈值的pearson相关系数,并将大于预设系数阈值的pearson相关系数表示为目标pearson相关系数;
13.从所述目标pearson相关系数对应的多个指标数据中筛选出一个指标数据。
14.可选的,所述基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的过程,包括:
15.针对待处理的指标数据集中的每个用户:
16.分别计算该用户中每个指标相对于该用户所有指标的信息增益;所述指标的信息增益表征指标的重要程度;
17.筛选出信息增益大于预设增益阈值的指标数据。
18.可选的,所述对所述目标用户进行分析,确定所述目标用户的投诉原因,包括:
19.获取预先训练的原因分类模型;所述原因分类模型是基于第二样本数据集对预设的第二机器学习模型进行训练后得到的;所述第二样本数据集包括:标记有投诉原因的投诉用户的指标数据;
20.基于所述原因分类模型和目标用户的指标数据,确定目标用户的投诉原因。
21.可选的,还包括:
22.获取目标用户的投诉原因与解决措施的映射关系;
23.基于目标用户的投诉原因与解决措施的映射关系,确定所述目标用户的投诉原因对应的解决措施。
24.可选的,还包括:
25.获取目标用户识别模型输出结果的第一反馈信息;所述结果为可能发生投诉的目标用户
26.基于第一反馈信息对目标用户进行标记,得到标记结果;所述标记结果包括:投诉用户或非投诉用户;
27.基于标记后的目标用户对应的指标数据对目标用户识别模型进行优化。
28.可选的,还包括:
29.获取投诉原因分类模型输出的原因分类的第二反馈信息;
30.基于所述第二反馈信息确定投诉原因是否需要更正;
31.在投诉原因需要更正的情况下,获取更正后的投诉原因;;
32.基于更正后的目标投诉原因对应的指标数据对投诉原因分类模型进行优化。
33.本发明实施例还公开了一种对客户投诉进行预警的装置,包括:
34.获取单元,用于获取待处理的指标数据集;所述待处理的指标数据集中包括至少一个用户对应的指标数据;
35.识别单元,用于基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;所述目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;所述第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;
36.投诉原因分析单元,用于对所述目标用户进行分析,确定所述目标用户的投诉原因。
37.基于上述装置,可选的,所述待处理的指标数据是基于各个指标数据之间的相似程度和/或基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选后得到的。
38.本发明实施例公开了一种预测客户投诉的方法及装置,该方法包括:获取待处理的指标数据集;该待处理的指标数据集包括至少一个用户对应的指标数据;基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;该目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;该第一
样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;对该目标用户进行分析,确定目标用户的投诉原因。由此可知,本技术不仅实现了对可能发生投诉的目标用户的预测,并且还实现了对目标用户可能的投诉原因的预测,这样,运维人员在知晓客户投诉原因的情况下,能够尽早的对可能出现的问题进行预警,从而达到改善iptv的服务质量的目的,由此也能够降低客户的投诉量,提升客户满意度。
附图说明
39.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
40.图1示出了本发明实施例提供的一种对客户投诉进行预警的方法的流程示意图;
41.图2示出了本发明实施例提供的基于各个指标数据之间的相似程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的流程示意图;
42.图3示出了本发明实施例提供的一种基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的流程示意图;
43.图4示出了本发明实施例提供的一种对客户投诉进行预警的方法的又一流程示意图;
44.图5示出了本发明实施例提供的一种对客户投诉进行预警的装置的结构示意图。
具体实施方式
45.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
46.参考图1,示出了本发明实施例提供的一种对客户投诉进行预警的方法的流程示意图,在本实施例中,该方法包括:
47.s101:获取待处理的指标数据集;所述待处理的指标数据集中包括至少一个用户对应的指标数据;
48.本实施例中,指标数据apk指标数据(例如包括:机顶盒型号、工作时长、cpu利用率、内存利用率、二层网络丢失帧等)、olt光衰指标数据(例如包括:ocl的发送光功率、oct的接收光功率、onu的发送光功率等)、接入网络流量指标数据(例如包括:流入速率、流出速率、端口带宽)等。
49.其中,指标数据可以从iptv的网络域获取。
50.s102:基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;所述目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;所述第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;
51.本实施例中,目标用户识别模型的训练方法包括:
52.构建第一机器学习模型;
53.其中该第一机器学习模型可以是任何一种分类模型或者神经网络模型,本实施例中,不进行限定,例如可以为oneclasssvm模型。
54.获取第一样本数据集;
55.其中,第一样本数据集中包括投诉用户的指标数据和非投诉用户的指标数据;
56.其中,为了提升训练的模型的适应性和扩展性,本实施例中,可以设置第一样本数据集中,投诉用户和非投诉用户的比例。
57.基于第一样本数据集对第一机器学习模型进行训练。
58.s103:对目标用户进行分析,确定所述目标用户的投诉原因。
59.本实施例中,s102得到的目标用户为可能发生投诉的用户,但是在只知道可能发生投诉的客户,不知道投诉原因的情况下,运维人员无法做出相应的解决措施,因此,为了进一步提升用户的满意度,降低投诉量,可以对目标用户进行分析,从而确定出目标用户的投诉原因,进而给运维人员提供解决依据。
60.本实施例中,可以通过多种方式对目标用户进行分析,本实施例中不进行限定。例如可以对目标用户的指标数据进行分析,确定指标数据的特征,并基于指标数据的特征确定投诉原因。
61.除此之外,优选的,本实施例中还可以采用预先训练的第二机器学习模型识别目标用户的原因,其中,具体的方法会在下文中进行详细的介绍,本实施例中不再赘述。
62.本实施例中,获取待处理的指标数据集;该待处理的指标数据集包括至少一个用户对应的指标数据;基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;该目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;该第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;对该目标用户进行分析,确定目标用户的投诉原因。由此可知,本技术不仅实现了对可能发生投诉的目标用户的预测,并且还实现了对目标用户可能的投诉原因的预测,这样,运维人员在知晓客户投诉原因的情况下,能够尽早的对可能出现的问题进行预警,从而达到改善iptv的服务质量的目的,由此也能够降低客户的投诉量,提升客户满意度。
63.进一步的,为了更快的解决用户可能出现的投诉问题,在确定出目标用户的投诉原因后,可以基于投诉原因确定解决措施,具体的,还包括:
64.获取目标用户的投诉原因与解决措施的映射关系;
65.基于目标用户的投诉原因与解决措施的映射关系,确定所述目标用户的投诉原因对应的解决措施。
66.本实施例中,指标数据集中包含的指标数据众多,指标数据中可能会存在一定的冗余信息,并且可能还会存在一些无效的指标数据,这样不仅降低了数据处理的效率,并且也会对数据处理的结果产生影响,由此为了提升数据处理的效率,提升数据处理的准确度,可以对指标数据进行预处理。
67.其中,预处理的过程可以包括如下的两种方式,具体的包括:
68.方式一、基于各个指标数据之间的相似程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选;
69.方式二、基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的
指标数据进行筛选的过程。
70.其中,预处理的过程可以报上述两种方式中的任意一种,或者同时采用上述的两种方式。
71.也就是说,待处理的指标数据可以是基于各个指标数据之间的相似程度和/或基于指标数据的重要程度对待处理的指标数据集中的每个用户对应的指标数据进行筛选后得到的。
72.基于上述的两种方式会在下文中进行详细的介绍:
73.其中,参考图2,基于各个指标数据之间的相似程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的流程示意图,包括:
74.s201:计算待处理的指标数据集中每个用户对应的各个指标数据之间的pearson相关系数;
75.s202:针对每个用户,筛选出大于预设系数阈值的pearson相关系数,并将大于预设系数阈值的pearson相关系数表示为目标pearson相关系数;
76.s203:从所述目标pearson相关系数对应的多个指标数据中筛选出一个指标数据。
77.举例说明:可以通过如下的公式1)计算各个指标数据之间的pearson相关系数:
[0078][0079]
其中,x
i
与y
i
分别表示指标x与y的第i条数据,n表示该指标的数据总数,
[0080]
i=1,2,

,n。
[0081]
其中,若计算两个指标数据之间的pearson相关系数,若这两个指标数据的pearson相关系数大于预设的阈值,则表示这两个指标数据的相关性较高,为了降低数据的冗余度,可以剔除这两个指标数据中的一个,并保留另外一个。
[0082]
由此,通过计算指标数据之间的相关性,可以剔除一些冗余的指标数据,降低指标数据集的维度。
[0083]
其中,参考图3,示出了本发明实施提供的一种基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选的流程示意图,在本实施例中,该方法包括:
[0084]
s301:针对待处理的指标数据集中的每个用户:
[0085]
s302:分别计算该用户中每个指标相对于该用户所有指标的信息增益;所述指标的信息增益表征指标的重要程度;
[0086]
s303:筛选出信息增益大于预设增益阈值的指标数据。
[0087]
本实施例中,指标数据的信息增益可以通过如下的公式2)计算:
[0088]
2)ig(t)=h(c)-h(c|t);
[0089]
其中,ig(t)表示指标数据的信息增益,h(c)表示整个数据集的信息熵,h(c|t)表示剔除指标t后的信息增益。
[0090]
其中,整个数据集的信息熵h(c)可以通过如下的公式3)计算:
[0091]
[0092]
其中,c表示数据的标签的取值类别(例如投诉/不投诉),p(c
i
)表示每一类别取到的概率)。
[0093]
剔除指标t后的信息增益h(c|t)可以通过如下的公式4)计算:
[0094]
4)h(c|t)=p(t)h(c|t) p(t`)h(c|t`)。
[0095]
本实施例中,通过计算表征指标信息重要程度的信息增益,从而从指标数据集中筛选出重要程度较高的指标数据,这样不仅降低了指标数据的维度,并且得到了更为有效的指标数据。
[0096]
其中,对指标数据进行预处理的过程,除了包括上述两个方面外,还可以对指标数据进行清洗,例如包括:对指标数据进行空值过滤、异常值过滤、特殊符号值处理、正则化等。
[0097]
参考图4,示出了本发明实施例提供的一种对客户投诉进行预警的方法的又一流程示意图,在本实施例中,该方法包括:
[0098]
s401:获取待处理的指标数据集;所述待处理的指标数据集中包括至少一个用户对应的指标数据;
[0099]
其中,s401与上述s101一致,本实施例中不再赘述。
[0100]
s402:基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;所述目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;所述第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;
[0101]
其中,s402与上述s102一致,本实施例中不再赘述。
[0102]
s403:获取预先训练的原因分类模型;所述原因分类模型是基于第二样本数据集对预设的第二机器学习模型进行训练后得到的;所述第二样本数据集包括:标记有投诉原因的投诉用户的指标数据;
[0103]
本实施例中,第二机器学习模型可以包括多种,本实施例中不进行限定,例如可以为随机森林。
[0104]
其中,以随机森林为例,对第二机器学习模型的训练过程进行介绍:
[0105]
1)从第二样本数据集中抽取m个样本点,得到一个训练集;其中第二数据集包括:标记有投诉原因的投诉用户的指标数据;
[0106]
2)基于训练集,训练一个cart决策树;
[0107]
在训练cart决策树训练的过程中,对每个节点的切分规则是:先从所有特征(输入字段)中随机的选择k个特征,然后在从这k个特征中选择最优的切分点再做左右子树的划分。
[0108]
3)构建多棵树,每棵树最大限度的生长,以此生成随机森林;
[0109]
这样,当将任何一个用户的指标数据输入到训练好的随机森林中后,每棵树可以输出一个类别,最终的输出结果为随机森林中投票最多的类别。其中,每个类别表示一种原因类型。
[0110]
s404:基于所述原因分类模型和目标用户的指标数据,确定目标用户的投诉原因。
[0111]
本实施例中,将目标用户的指标数据输入到训练好的原因分类模型后,原因分类模型的输出结果为目标用户的投诉原因。
[0112]
本实施例中,通过训练好的机器学习模型实现了对目标用户的投诉原因的分析,这样,运维人员在知晓客户投诉原因的情况下,能够尽早的对可能出现的问题进行预警,从而达到改善iptv的服务质量的目的,由此也能够降低客户的投诉量,提升客户满意度。并且,通过该方法对投诉原因进行分析,准确度高、数据处理的效率也高。
[0113]
通过上述的介绍可知,针对客户的投诉预警,本实施例通过预先训练的目标用户识别模型识别可能发生投诉的目标用户,通过预先训练的原因分类模型确定目标用户的投诉原因。其中,目标用户识别模型以及原因分类模型都是通过大量的训练样本进行训练后得到的。但是,随着时间的推移,用户需求以及训练样本数据可能都会发生变化,为了保障目标用户识别模型以及原因分类模型的准确性,需要不断的对模型进行优化
[0114]
其中,针对目标用户识别模型,优化方法包括:
[0115]
获取目标用户识别模型示输出结果的第一反馈信息;所述输出结果为可能发生投诉的目标用户;
[0116]
基于第一反馈信息对目标用户进行标记,得到标记结果;所述标记结果包括:投诉用户和非投诉用户;
[0117]
基于标记后的目标用户对应的指标数据对目标用户识别模型进行优化。
[0118]
本实施例中,第一反馈信息可以表示目标用户识别模型输出的结果是否正确,并基于正确与否的反馈信息,对输出的结果(目标用户)进行标记,若正确则表示该目标用户为可能投诉的用户,若不正确则表示该目标用户为正常用户,那么可以基于该标记的结果作为样本数据再次用于对目标用户识别模型进行训练。由此可知,通过反馈信息处理后的数据样本的准确度更高,那么通过这样的样本数据训练目标用户的识别模型,能够提升目标用户识别模型的数据处理精度。
[0119]
针对投诉原因分类模型,优化方法包括:
[0120]
获取投诉原因分类模型输出的原因分类的第二反馈信息;
[0121]
基于所述第二反馈信息确定投诉原因是否需要更正;
[0122]
在投诉原因需要更正的情况下,获取更正后的投诉原因;
[0123]
基于更正后的投诉原因对应的指标数据对投诉原因分类模型进行优化。
[0124]
本实施例中,第二反馈信息可以表示原因分类模型输出的结果(目标用户的投诉原因)是否正确,在不正确的情况下,在对目标用户的投诉原因进行修正,得到更正后的投诉原因,并将该修正了投诉原因的目标用户作为样本数据对原因分类模型进行训练,由此,由于修正后的样本的准确度更高,以此来训练原因分类模型,能够提升原因分类模型的数据处理精度。
[0125]
参考图5,示出了本发明实施例提供的一种对客户投诉进行预警的装置的结构示意图,在本实施例中,该装置包括:
[0126]
获取单元501,用于获取待处理的指标数据集;所述待处理的指标数据集中包括至少一个用户对应的指标数据;
[0127]
识别单元502,用于基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;所述目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;所述第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;
[0128]
投诉原因分析单元503,用于对所述目标用户进行分析,确定所述目标用户的投诉原因。
[0129]
可选的,所述待处理的指标数据是基于各个指标数据之间的相似程度和/或基于指标数据的重要程度对所述待处理的指标数据集中每个用户对应的指标数据进行筛选后得到的。
[0130]
可选的,还包括:
[0131]
第一预处理单元,用于:
[0132]
计算待处理的指标数据集中每个用户对应的各个指标数据之间的pearson相关系数;
[0133]
针对每个用户,筛选出大于预设系数阈值的pearson相关系数,并将大于预设系数阈值的pearson相关系数表示为目标pearson相关系数;
[0134]
从所述目标pearson相关系数对应的多个指标数据中筛选出一个指标数据。
[0135]
可选的,还包括:
[0136]
第二预处理单元,用于:
[0137]
针对待处理的指标数据集中的每个用户:
[0138]
分别计算该用户中每个指标相对于该用户所有指标的信息增益;所述指标的信息增益表征指标的重要程度;
[0139]
筛选出信息增益大于预设增益阈值的指标数据。
[0140]
可选的,所述投诉原因分析单元,包括:
[0141]
原因分类模型获取单元,用于获取预先训练的原因分类模型;所述原因分类模型是基于第二样本数据集对预设的第二机器学习模型进行训练后得到的;所述第二样本数据集包括:标记有投诉原因的投诉用户的指标数据;
[0142]
投诉原因确定单元,用于基于所述原因分类模型和目标用户的指标数据,确定目标用户的投诉原因。
[0143]
可选的,还包括:
[0144]
解决措施确定单元,用于
[0145]
获取目标用户的投诉原因与解决措施的映射关系;
[0146]
基于目标用户的投诉原因与解决措施的映射关系,确定所述目标用户的投诉原因对应的解决措施。
[0147]
可选的,还包括:
[0148]
目标用户识别模型优化单元,用于:
[0149]
获取目标用户识别模型输出结果的第一反馈信息;所述结果为可能发生投诉的目标用户
[0150]
基于第一反馈信息对目标用户进行标记,得到标记结果;所述标记结果包括:投诉用户或非投诉用户;
[0151]
基于标记后的目标用户对应的指标数据对目标用户识别模型进行优化。
[0152]
可选的,还包括:
[0153]
原因分类模型优化单元,用于
[0154]
获取投诉原因分类模型输出的原因分类的第二反馈信息;
[0155]
基于所述第二反馈信息确定投诉原因是否需要更正;
[0156]
在投诉原因需要更正的情况下,获取更正后的投诉原因;;
[0157]
基于更正后的目标投诉原因对应的指标数据对投诉原因分类模型进行优化。
[0158]
通过本实施例的装置,获取待处理的指标数据集;该待处理的指标数据集包括至少一个用户对应的指标数据;基于待处理的指标数据集和预先训练的目标用户的识别模型,预测可能发生投诉的目标用户;该目标用户识别模型是基于第一样本数据集对预设的第一机器学习模型进行训练后得到的;该第一样本数据集包括:投诉用户的指标数据和非投诉用户的指标数据;对该目标用户进行分析,确定目标用户的投诉原因。由此可知,本技术不仅实现了对可能发生投诉的目标用户的预测,并且还实现了对目标用户可能的投诉原因的预测,这样,运维人员在知晓客户投诉原因的情况下,能够尽早的对可能出现的问题进行预警,从而达到改善iptv的服务质量的目的,由此也能够降低客户的投诉量,提升客户满意度。
[0159]
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0160]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献