一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于聚类的采集终端网络信号综合评价方法与流程

2022-06-12 02:23:30 来源:中国专利 TAG:


1.本发明涉及电网运维领域,尤其涉及一种基于聚类的采集终端网络信号综合评价方法。


背景技术:

2.在智能电网中,用电信息采集系统可以进行远程采集以及实时监测,为工作人员掌握电力用户的用电信息提供方便。目前的用电信息采集系统由主站系统、通信信道、现场终端三部分组成。现场终端采集到数据后需要通过现场采集设备通过sim卡在移动公网环境下拨号连接公网,上传计量设备的用电数据。不少用电信息采集终端安装于地下室、配电房、山野郊区等运营商网络信号覆盖差的地方,不能支持稳定可靠的终端通信。采集终端所处网络环境的信号覆盖强弱将直接影响采集数据质量,因此了解全省所有采集终端所处环境的网络信号情况很有必要。这需要建立可靠的评价体系对用电信息采集终端网络信号质量进行评价。
3.目前对于用电信息采集终端的评价方法较少,有相关研究开发了终端信号现场检测仪,用于现场实地检测公网信号和sim卡,但该方法只能用于现场实地检测,无法同时大规模评价多个终端网络信号质量。另有一种采集终端检测装置,能够实时检测所在地的网络信号强度,但针对的数据仅有终端网络信号强度一项,没有综合终端的其他网络信号质量相关数据进行研究,不够全面。


技术实现要素:

4.本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于聚类的采集终端网络信号综合评价方法,以实现全面评价采集终端网络信号的目的。为此,本发明采取以下技术方案。
5.一种基于聚类的采集终端网络信号综合评价方法,其特征在于包括以下步骤:
6.1)对终端提取网络信号相关的可用指标项数据,确立指标项为采集终端的网络信号强度a、终端在线率b和终端采集成功率c;对数据进行筛选清洗处理后对指标项内部数据进行特征值提取;
7.2)对三项指标在各自的评价维度内进行kmeans 聚类;通过聚类得到各个指标的多个簇结果,借助专家经验对各个簇体现出的网络信号质量进行分析和排序;提取对应簇的聚类中心,对不同聚类中心给定得分并建立各指标的特征库qa,qb和qc,用于后续终端的特征匹配和评价;
8.3)当需要对采集终端网络信号进行评价时,获取采集终端对应数据信息,经过特征量提取后,将各终端对应指标特征量与特征库qa、qb和qc匹配,得到终端各个指标项评分;即得到各个终端三项指标的初步评价结果,根据结果建立评价矩阵x如式(1)所示:
means 聚类算法聚类,根据聚类结果建立完善终端在线率b特征库;终端在线率b特征库中包括特征b1、特征b2、特征b3、特征b4,特征b1对应的终端的在线率百分比数值具有高最大值,较高最小值,高平均值,低极值差;整体的在线率绝大部分都在100%,属于终端在线率最高批次,给定得分为4;特征b2对应的终端的在线率百分比数值具有高最大值,较低最小值,较高平均值,较大极值差;在线率有波动,波动幅度较大,不够稳定,但平均值依旧维持在较高水平,给定得分为3;特征b3对应的终端的在线率百分比数值具有高最大值,低最小值,较低平均值,较大极值差;该批终端的在线率波动较大,不够稳定,且平均值较低,给定得分为2;特征b4对应的终端的在线率基本都是0,判定该批终端向系统主站传输数据时出现了问题,给定得分为1。
23.作为优选技术手段:在步骤1)中,采集成功率对应特征量为:反映采集成功率分布范围的最大值、最小值和极值差,反映整体数值大小的平均值和众数,反映采集成功率波动情况的方差。
24.作为优选技术手段:根据多次测试结果,确定聚类的分类数,采集成功率使用k-means 聚类算法聚类,根据聚类结果建立完善采集成功率c特征库;采集成功率c特征库中包括特征c1、特征c2、特征c3、特征c4,特征c1对应的终端的采集成功率百分比数值具有高最大值,高最小值,高平均值,低极值差;整体的采集成功率都在100%,属于采集成功率整体最高批次,给定得分为4;特征c2对应的终端的采集成功率百分比数值具有高最大值,较高最小值,较高平均值,较低极值差;采集成功率有波动,但最低采集成功率也达到了75%,波动幅度不大,属于采集成功率整体次高批次,给定得分为3;特征c3对应的终端的采集成功率百分比数值具有高最大值,较低最小值,较高平均值,较大极值差;该批终端整体的采集成功率波动较大,不够稳定,但平均值依旧维持在较高水平,给定得分为2;特征c4对应的终端的采集成功率基本都是0,可以判定该批终端在接收下属电表数据时出现了问题,给定得分为1。
25.有益效果:本技术方案首先对终端指标项数据进行特征量选取,利用kmeans 聚类得到各指标的聚类中心,并借助专家经验对结果进行质量分析和排序。建立各指标的特征库后对不同特征曲线给定得分,用于后续终端的特征匹配和评价。然后通过熵权法计算各指标项权重,结合指标项特征匹配结果计算得到终端得分,实现了对用电信息采集终端的网络信号终端质量的量化评价。终端评价客观、全面、准确,为后续的进一步分析打好基础。
26.本技术方案具有以下意义:
27.(1)社会意义:电网公司可通过本发明对用电信息采集终端的网络信号质量进行评价,量化终端网络信号质量,从而为提高终端网络信号覆盖质量提供了基础,进而保障采集系统数据的全面和及时性,提高服务质量。
28.(2)技术意义:该发明可用于对终端的网络信号质量进行评价,归纳了终端网络信号相关数据的特征表现,减少排查不良信号用电终端的人力物力损耗。为协调运营商针对性优化网络覆盖质量提供参考。
附图说明
29.图1是本发明的流程图。
30.图2是本发明的终端网络信号特征库建立流程图。
31.图3是本发明的终端网络信号综合评价流程图。
32.图4是本发明的终端信号强度特征库qa图。
33.图5是本发明终端在线率特征库qb图。
34.图6是本发明终端采集成功率特征库qc图。
具体实施方式
35.以下结合说明书附图对本发明的技术方案做进一步的详细说明。
36.如图1所示,1)对终端提取网络信号相关的可用指标项数据,确立指标项为采集终端的网络信号强度a、终端在线率b和终端采集成功率c;对数据进行筛选清洗处理后对指标项内部数据进行特征值提取;
37.2)对三项指标在各自的评价维度内进行kmeans 聚类;通过聚类得到各个指标的多个簇结果,借助专家经验对各个簇体现出的网络信号质量进行分析和排序;提取对应簇的聚类中心,对不同聚类中心给定得分并建立各指标的特征库qa,qb和qc,用于后续终端的特征匹配和评价;
38.3)当需要对采集终端网络信号进行评价时,获取采集终端对应数据信息,经过特征量提取后,将各终端对应指标特征量与特征库qa、qb和qc匹配,得到终端各个指标项评分;即得到各个终端三项指标的初步评价结果,根据结果建立评价矩阵x如式(1)所示:
[0039][0040]
式中,a、b和c分别表示终端的网络信号强度a、终端在线率b和终端采集成功率c,n表示终端个数;
[0041]
使用熵权法计算得到三个指标项的权重w=[w1,w2,w3],结合特征匹配结果计算终端的评价得分并进行排序;计算公式如式(2)所示;
[0042]
s=x*w
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0043]
式中,s为终端网络信号质量的评价结果矩阵,x为评价矩阵,w为影响因子权重;
[0044]
4)基于计算终端的评价得分,量化终端网络信号质量,排查不良信号用电终端,为提高终端网络信号覆盖质量提供基础。
[0045]
其中,建立各指标特征库的流程,如图2所示,对终端提取指标项数据,进行筛选清洗处理后对指标项内部数据分布进行特征值提取。对三项指标在各自的评价维度内进行kmeans 聚类,提取聚类结果中各个簇的聚类中心,并借助专家经验对结果进行分析和排序。基于聚类中心建立各指标的特征库后对不同聚类中心给定得分,用于后续终端的特征匹配和评价。
[0046]
计算终端得分流程,如图3所示,对于终端数据,提取特征量数据后根据特征库进行匹配,对每个终端的各个指标进行初步评分。使用熵权法计算各指标权重,结合特征匹配结果计算终端最终的网络信号得分。
[0047]
以下就具体数据作进一步的说明:
[0048]
1.数据预处理
[0049]
本发明的的应用数据来源是用电信息采集系统中现有的终端网络信号强度a、终端在线率b和终端采集成功率c。对数据进行筛选清洗,剔除数据缺失过多的终端,同时对部分缺失数据进行补全。
[0050]
2.指标项特征库建立
[0051]
1)终端信号强度a
[0052]
终端信号强度值分为四个区间,参考终端生产厂家的定义,将-113~-94定为一区间,-95~-79为二区间,-80~-65为三区间,-64~-51为四区间。计算信号强度数据在每个区间的分布概率得到聚类特征值。
[0053]
使用k-means 聚类算法聚类,根据聚类结果建立完善特征库,如表1所示。
[0054]
表1终端信号强度特征库qa[0055]
特征类型区间1区间2区间3区间4a10.0005270.0040930.1157220.879658a20.0008010.0569090.9210340.021256a30.0114510.8874920.0990250.002032a40.6702930.2748460.0548610
[0056]
根据特征量表内容绘制如图4所示。
[0057]
特征a1对应的终端强度数值大部分分布于区间四,即终端信号强度大部分时间都处于-64~-51之间,信号强度较强,给定得分为4;同理可知特征a2对应的终端强度数值大部分分布于区间三,即终端信号强度大部分时间都处于-80~-65之间,给定得分为3;特征a3对应的终端强度数值大部分分布于区间二,即终端信号强度大部分时间都处于-95~-79之间,给定得分为2;同理可知特征a4对应的终端强度数值大部分分布于区间一,即终端信号强度大部分时间都处于-113~-94之间,给定得分为1。
[0058]
2)终端在线率b
[0059]
对于终端在线率进行特征值提取,对应特征值项为反映终端在线率分布范围的最大值,最小值和极值差,反映整体数值大小的平均值和众数,反映终端在线率波动情况的方差。使用kmeans 聚类算法对处理后的数据进行聚类。根据聚类结果建立特征库,如表2所示。
[0060]
表2终端在线率特征库qb[0061]
特征类型最大值最小值平均值极值差方差众数b110081.2442399.9067818.755771.217902100b21002.79151293.8909797.2084921.12055100b3100011.9249110030.355490b4000000
[0062]
根据特征量表2内容绘制如图5所示。由图5可见,特征b1对应的终端的在线率百分比数值具有高最大值,较高最小值,高平均值,低极值差。整体的在线率绝大部分都在100%,属于终端在线率最高批次,给定得分为4;特征b2对应的终端的在线率百分比数值具有高最大值,较低最小值,较高平均值,较大极值差。在线率有波动,波动幅度较大,不够稳定,但平均值依旧维持在较高水平,给定得分为3;特征b3对应的终端的在线率百分比数值
具有高最大值,低最小值,较低平均值,较大极值差。该批终端的在线率波动较大,不够稳定,且平均值较低,给定得分为2;特征b4对应的终端的在线率基本都是0,可以判定该批终端向系统主站传输数据时出现了问题,给定得分为1。
[0063]
3)终端采集成功率c
[0064]
对于采集成功率提取特征值,对应特征值项为反映采集成功率分布范围的最大值,最小值和极值差,反映整体数值大小的平均值和众数,反映采集成功率波动情况的方差。使用kmeans 聚类算法对处理后的数据进行聚类。根据聚类结果建立特征库,如表3所示。
[0065]
表3终端采集成功率特征库qc[0066]
特征类型最大值最小值平均值极值差方差众数c199.997799.9315999.988920.0661130.01995499.99503c210072.7065292.0446227.2934810.9244294.48739c310010.51291.0736389.48826.19628100c4000000
[0067]
根据特征量表3内容绘制如图5所示。由图5可见,特征c1对应的终端的采集成功率百分比数值具有高最大值,高最小值,高平均值,低极值差。整体的采集成功率都在100%,属于采集成功率整体最高批次,给定得分为4;特征c2对应的终端的采集成功率百分比数值具有高最大值,较高最小值,较高平均值,较低极值差。采集成功率有波动,但最低采集成功率也达到了75%,波动幅度不大,属于采集成功率整体次高批次,给定得分为3;特征c3对应的终端的采集成功率百分比数值具有高最大值,较低最小值,较高平均值,较大极值差。该批终端整体的采集成功率波动较大,不够稳定,但平均值依旧维持在较高水平,给定得分为2;特征c4对应的终端的采集成功率基本都是0,可以判定该批终端在接收下属电表数据时出现了问题,给定得分为1。
[0068]
经过以上处理,建立终端的三个指标项对应的特征库qa,qb和qc。
[0069]
3.特征匹配初步评分
[0070]
对新一批数据进行评价时,经过数据处理和特征量提取后,将各终端对应指标特征量与特征库匹配,得到终端指标项评分,建立评价矩阵x,形式如表4所示。
[0071]
表4评价矩阵x示例
[0072][0073]
4.熵权法评分
[0074]
熵是对指标不确定性的度量,指标项信息量越大,不确定性就越小,熵也就越小。根据熵的特性,可以通过计算熵值来判断某个指标的离散程度。指标的离散程度越大,该指标对综合评价的影响越大,所占的权重也就应该越大。使用熵权法计算三个指标的权重值得到w,进而结合评价矩阵x计算得到最终的终端网络信号质量评分矩阵s。
[0075]
以上图1-6所示的一种基于聚类的采集终端网络信号综合评价方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献