一种基于用户用电投诉行为的用户分层方法及预测方法与流程

2021-10-27 20:50:00 来源：中国专利 TAG：分层用户方法用电投诉

1.本发明涉及电力用户行为分层领域，具体涉及一种基于用户用电投诉行为的用户分层方法及预测方法。

背景技术：

2.在电力行业用电需求侧企业与客户的关系是“管理”与“被管理”，存在企业“被动响应”用户需求，员工欠缺服务意识，考核监管机构不完善等问题。不仅如此，在实际工作中，公司采用传统的数据处理方式，从客户服务数据中提取得到一些统计表格，例如人工服务率、满意率等指标，这样做难以发现隐藏于数据中的业务规律，更难抽象出描述业务特点的数学模型。

技术实现要素：

3.为解决上述问题，本发明提供一种基于用户用电投诉行为的用户分层方法及预测方法，实现用电用户的行为分层以及用户投诉内容的预测，实现客户诉求的主动响应，以进一步提升客户满意度，具有简单直观、实用性强的特点，应用成效显著。
4.本发明的技术方案是：一种基于用户用电投诉行为的用户分层方法，包括以下步骤：
5.s1，获取用户行为的数据集d，进行初次层次分层，并获得指标矩阵a；用户行为包括用电行为和投诉行为；
6.s2，用边约束构造并求解目标函数，通过目标函数对初次层次分层结果进行再次层次分层获得再次层次分层的结果p；
7.s3，对再次层次分层的结果p进行迭代优化产生新的局部最小解p
′
；
8.s4，判断新的局部最小解p
′
是否满足收敛条件，若满足则获得最终分层结果；否则进入下一步；
9.s5，调用集群扩展对再次层次分层的结果p和新的局部最小解p
′
进行扩展获得新的集群p
″
，并将并集p∪p
′
∪p
″
添加到指标矩阵a；
10.s6，继续基于新的集群p
″
重复步骤s2
‑
s5，直到最终分层结果满足收敛标准。
11.进一步地，步骤s1中进行初次层次分层，具体为：
12.s101，设置初始聚类数h，从数据集d中随机选择一个点作为第一中心点p1；
13.s102，对于每个点，从已经选择的中心点找到该点最近的邻居，并记录它们之间的距离，用t(x)表示；
14.s103，选择中心点p
i
，p
i
＝arg max
x∈d
t(x)；
15.s104，重复步骤s102和s103，直到中心数为所设置的初始聚类数h，获得中心点集合{p1,p2,...,p
h
}。
16.进一步地，指标矩阵a是值为0或1的指标矩阵，其列表示对应用户的数据子集，值为1表示该点属于相应类别，为0表示不属于。
17.进一步地，步骤s2中的目标函数为：
[0018][0019][0020]
其中，c([a]
i
)是矩阵a中第i列的成本，α是平衡两项影响的权重因子，l为一个利用初始聚类中心之间的相似性构造的拉普拉斯矩阵；e是1的n维向量，二进制集合x是解向量，m是最终分类的类别数，q＝2
n
‑
1表示除空集合之外的数据子集的数量，d
i
表示初始聚类结果中矩阵a的第i个类别与其他类别的最小距离，聚类结果ε是限制解中类别的最小距离之和的截止因子。
[0021]
进一步地，步骤s5所获得新的集群p
″
为：
[0022]
其中，包含p和p
′
中所有元素加上离对应类中心最近的第j个非成员邻居，包含分类中的所有数据，但不包括离类中心最远的第j个点。
[0023]
本发明的技术方案还包括一种基于用户用电投诉行为的预测方法，包括以下步骤：
[0024]
ss1，采用图卷积对用户投诉行为数据进行图结构化，以从权利要求1
‑
5任一项所获得的用户分层结果中提取到用户行为特征；
[0025]
ss2，采用时间轴上的整个卷积结构来捕捉用户在不同时间段的投诉行为以及投诉持续时间情形；
[0026]
ss3，构造联合卷积块处理结构时间序列获得联合图卷积网络，利用联合图卷积网络对用户投诉行为进行预测。
[0027]
进一步地，步骤ss1中采用图卷积对用户投诉行为数据进行图结构化，具体为：
[0028]
ss101，基于频谱图卷积的概念引入图卷积算子的概念，即信号与核θ的乘积，
[0029]
其中，图傅里叶基是规范化图拉普拉斯是规范化图拉普拉斯的特征向量矩阵；
[0030]
ss102，通过chebyshev多项式，将图卷积写成ss102，通过chebyshev多项式，将图卷积写成其中是在缩放的拉普拉斯时评估的i级chebyshev多项式；
[0031]
ss103，令α＝α0＝
‑
α1，将式子变为从而完成使用图卷积来图结构化用户投诉行为数据。
[0032]
进一步地，步骤ss2具体为将每个节点的时间卷积的输入看作是一个长度为m的序列，卷积核被用来将输入y映射到单个输出元素因此gated卷积可以被定义为gated卷积可以被定义为其中q是模型中gates的输入，
⊙
指的是元素的hadamard乘积。
[0033]
进一步地，步骤ss3中构造联合卷积块处理结构时间序列，具体为：输入则输出k
l 1
可以由来计算；
[0034]
其中c为信道，分别是块l内的上下时间核；θ
l
是图卷积的谱核；relu()表示线性修正单元激活函数。
[0035]
进一步地，步骤ss3中在堆叠了两个联合卷积块之后，增加一个额外的时间卷积层和一个完成连接的层作为最后的输出层，时间卷积层将最后一个联合卷积块的输出映射到单步预测，进而联合图卷积网络的最终输出为并通过在c信号上应用线性变换其中是权重向量，b是偏差；
[0036]
步骤ss3中利用联合图卷积网络对用户投诉行为进行预测的损失函数为其中w
α
都是联合图卷积网络中可训练的参数，k
j 1
是预测结果与实际真实结果的差异，则表示联合图卷积网络的预测。
[0037]
本发明提供的一种基于用户用电投诉行为的用户分层方法及预测方法，通过层次化标签生成方法对用电用户的各种行为进行提取和分类，完成用电用户投诉行为标签的划分，通过建立用户标签体系形成电力营销业务画像；并且基于用户的用电投诉行为还提出一个联合图卷积网络来完成对用户下一投诉内容的预测，实现对用户诉求的主动响应，从而提升客户满意度。本发明采用层次化标签生成方法，在对数据集进行初次划分的时候具有较低的时间成本；构造的目标函数中加入了区别性信息，不仅可以用来获取各种类别之间的信息，还可以保证我们划分的类别具有高的离散度，最终可以完成对用户各种行为的分类、获得更有鲁棒性的高质量的结果，实现用户画像的构建。另外，本发明依据用户分层画像进行未来投诉内容的预测，通过联合卷积块集成了时间卷积以及非时间卷积，不仅拥有更好的性能，还可以更快训练、更容易收敛，实现客户诉求的主动响应，提升客户满意度。
附图说明
[0038]
图1是本发明具体实施例一方法流程示意图；
[0039]
图2是本发明具体实施例一基于层次化标签生成的用户画像构建过程示意图；
[0040]
图3是本发明具体实施例二方法原理示意图。
[0041]
图4是本发明具体实施例二联合图卷积网络的体系结构示意图；
[0042]
图5是本发明具体实施例二基于联合图卷积网络的用户投诉内容预测流程示意图。
具体实施方式
[0043]
下面结合附图并通过具体实施例对本发明进行详细阐述，以下实施例是对本发明的解释，而本发明并不局限于以下实施方式。
[0044]
实施例一
[0045]
如图1所示，本实施例提供一种基于用户用电投诉行为的用户分层方法，包括以下步骤：
[0046]
s1，获取用户行为的数据集d，进行初次层次分层，并获得指标矩阵a；用户行为包
括用电行为和投诉行为；
[0047]
本实施例采用max
‑
min distance(最长最短距离)这种时间复杂度低的算法来生成用户的用电行为、投诉行为等各个分区，这样可以在生成初始标签结果时节省大量时间。
[0048]
进行初次层次分层，具体为：
[0049]
s101，设置初始聚类数h，从数据集d中随机选择一个点作为第一中心点p1；
[0050]
s102，对于每个点，从已经选择的中心点找到该点最近的邻居，并记录它们之间的距离，用t(x)表示；
[0051]
s103，选择中心点p
i
，p
i
＝arg max
x∈d
t(x)；
[0052]
s104，重复步骤s102和s103，直到中心数为所设置的初始聚类数h，获得中心点集合{p1,p2,...,p
h
}。
[0053]
例如设置初始类别数为2，从数据集d中随机选择一个点作为第一个中心点p1；对于每个点，从已经选择的中心找到该点最近的邻居，并记录它们之间的距离，用t(x)表示；接着选择中心p
i
＝arg max
x∈d
t(x)。重复上述步骤，直到中心数为2。具体实施时，初始的分层结果可以用户的用电行为、投诉行为为初始聚类的中心。
[0054]
本实施例的指标矩阵a是值为0或1的指标矩阵，其列表示对应用户的数据子集，值为1表示该点属于相应类别，为0表示不属于。该步骤的指标矩阵a包含通过初次层次分类获得的类别。
[0055]
s2，用边约束构造并求解目标函数，通过目标函数对初次层次分层结果进行再次层次分层获得再次层次分层的结果p；
[0056]
首先构造出目标函数：
[0057][0058][0059]
其中c([a]
i
)是矩阵a中第i列的成本，α是平衡两项影响的权重因子，l是一个利用初始聚类中心之间的相似性构造的拉普拉斯矩阵；e是1的n维向量；二进制集合x是解向量，如果在最佳聚类结果处选择了对应于指标矩阵a的第i列的子集，则x中的第i元素的值等于1，否则为0；q＝2
n
‑
1表示除空集合之外的数据子集的数量；d
i
表示初始聚类结果中矩阵a中第i个聚类与其他聚类的最小距离，ε是限制解中类别的最小距离之和的截止因子。
[0060]
目标函数的第二项是拉普拉斯正则项，其被设计用于捕获结构信息。该函数中第一个约束可能会导致最终结果出现重叠类别。为了处理这种情况，可以使用任何重叠消除技术来确保每个行为点只属于一个类别；第二个约束是指最终分类的类别数为m；在第三个约束中，保证最终各个类别的分散度不要太小。之后从中心点集合{p1,p2}(所设置初始类别数为2)对每个x∈d更新各个分类的中心，一个再次分层结果p＝{p1,p2}获得。
[0061]
s3，对再次层次分层的结果p进行迭代优化产生新的局部最小解p
′
；
[0062]
本实施例通过初始的分层结果，如用户的用电行为、投诉行为为初始聚类的中心，对所有的数据进行进一步分类，然后对产生的结果应用迭代优化方法，得到进一步的分层标签，也就是得到新的局部最小解p
′
。例如p
′
中包含的用户的投诉行为会分为投诉内容、投诉频率、投诉持续时间、投诉发生的时间段等。
[0063]
s4，判断新的局部最小解p
′
是否满足收敛条件，若满足则获得最终分层结果；否则进入下一步；
[0064]
s5，调用集群扩展对再次层次分层的结果p和新的局部最小解p
′
进行扩展获得新的集群p
″
，并将并集p∪p
′
∪p
″
添加到指标矩阵a；
[0065]
集群扩展是指对每个大的分类p
i
，通过添加一个不在这两个类中且距类中心的距离最小的点，并删除一个属于类中成员且距类中心的距离最大的点，对p
i
产生较小的干扰，然后创建一个新的集合p
″
包含数据的部分子集。
[0066]
为了提高分类性能，要对已经获得的两个解进行扩展，但同时还要避免对p
i
产生较大的干扰，因此本发明创建一个新的集合p
″
包含数据的部分子集：t的值设为10，其中包含p
i
中的所有元素加上离类中心最近的第j个非成员邻居，包含分类中的所有数据，但不包括离类中心最远的第j个点，从而完成对分类的详细划分。例如p
″
最终包含的是投诉具体内容、投诉频率正常或偏多或从未、投诉持续时间偏长或正常、投诉发生时间段为何时等等。
[0067]
s6，继续基于新的集群p
″
重复步骤s2
‑
s5，直到最终分层结果满足收敛标准。
[0068]
经过以上步骤的循环，最终可以获得详细的用户标签分类，也在保证鲁棒性、计算复杂度低的情况下完成给用户画像的构建。如图2所示为基于上述层次化标签生成的用户画像构建过程示意图。
[0069]
实施例二
[0070]
在实施例一基础上，本实施例提供一种基于用户用电投诉行为的预测方法。实施例一通过层次化标签生成方法对用电用户的各种行为进行提取和分类，完成用电用户投诉行为标签的划分，所建立用户标签体系可形成电力营销业务画像。如图3所示，本实施例原理是在实施例一用电用户分类，根据分类可构建用户画像基础上，基于用户的用电投诉行为提出一个联合图卷积网络来完成对用户下一投诉内容的预测，实现对用户诉求的主动响应，从而提升客户满意度。如图4所示为本实施例联合图卷积网络的体系结构示意图。
[0071]
具体地，如图5所示，本实施例基于联合图卷积网络的用户投诉内容预测流程包括以下步骤：
[0072]
ss1，采用图卷积对用户投诉行为数据进行图结构化，以从实施例一所获得的用户分层结果中提取到用户行为特征；
[0073]
本实施例通过引入谱框架、在谱域中应用卷积来完成图卷积来图结构化行为特征数据，使用图傅立叶基础进行乘法，其过程如下：
[0074]
a)基于频谱图卷积的概念引入了图卷积算子的概念，即信号与核θ的乘积：
[0075]
[0076]
这里图傅里叶基是normalized图拉普拉斯是normalized图拉普拉斯(i
n
是一个单位矩阵，是对角度矩阵且d
ii
＝∑
j
w
ij
)的特征向量矩阵；是l的特征值的对角矩阵，θ(λ)也是一个对角矩阵，根据该定义，图信号x被内核θ滤波，在θ和图傅立叶变换u
t
x之间相乘。
[0077]
b)由于使用步骤a)中的等式在图卷积中计算内核θ可能会代价较大，因此本发明首先采用chebyshev多项式逼近策略来克服此问题。由于内核θ限制λ的多项式为其中是多项式系数的向量，m是图卷积的内核大小，而缩放后因此通过chebyshev多项式，可以将图卷积写成：
[0078][0079]
这里的是在缩放的拉普拉斯时评估的i级chebyshev多项式。
[0080]
c)由于神经网络具有尺度化和归一化的特征，因此本发明进一步假设μ
max
≈2，这样图卷积的式子可以简化为：
[0081][0082]
接着为了稳定数值性能，让α＝α0＝
‑
α1，就可以将式子变为：
[0083][0084]
从而完成使用图卷积来图结构化用户投诉行为等数据。
[0085]
ss2，采用时间轴上的整个卷积结构来捕捉用户在不同时间段的投诉行为以及投诉持续时间情形；
[0086]
由于对用户画像图中的每个节点，时间卷积在没有填充的情况下探索输入元素的m
j
个邻居，这导致序列长度每次缩短m
j
‑
1，因此，本发明将每个节点的时间卷积的输入看作是一个长度为m的序列。卷积核被用来将输入y映射到单个输出元素这里的q、r被分为两半，信道大小相同，因此gated cnn可以被定义为其中q是模型中gates的输入，
⊙
指的是元素的hadamard乘积，σ(r)是sigmoid gate控制当前状态的输入q哪个会与时间序列的动态变化有关。
[0087]
ss3，构造联合卷积块处理结构时间序列获得联合图卷积网络，利用联合图卷积网络对用户投诉行为进行预测；
[0088]
为了融合非时间域和时间域的特征，构造联合卷积块来处理结构时间序列。块本身可以根据特定情况的规模和复杂性进行堆叠或扩展。首先输入其中c为信道，则输出k
l 1
可以由可以由来计算，其中分别是块l内的上下时间核；θ
l
是图卷积的谱核；relu()表示线性修正单元激活函数。在堆叠了两个
联合卷积块之后，本发明附加了一个额外的时间卷积层和一个完全连接的层作为最后的输出层。时间卷积层将最后一个联合卷积块的输出映射到单步预测。然后，可以从模型中获得最终输出并通过在c
‑
channel上应用线性变换其中是权重向量，b是偏差。最后我们把用于用电用户投诉内容预测的损失函数写成这里w
α
都是模型中可训练的参数，k
j 1
是ground truth(预测结果与实际真实结果的差异)，则表示模型的预测。
[0089]
以上公开的仅为本发明的优选实施方式，但本发明并非局限于此，任何本领域的技术人员能思之的没有创造性的变化，以及在不脱离本发明原理前提下所作的若干改进和润饰，都应落在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于评价用户录音行为的方法及系统、装置、服务器、存储介质与流程

一种基于用户用电投诉行为的用户分层方法及预测方法与流程

相关文献

最热文献