一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据检测方法、装置及存储介质与流程

2021-11-15 18:43:00 来源:中国专利 TAG:


1.本发明实施例涉及数据监控技术领域,尤其涉及一种数据检测方法、装置及存储介质。


背景技术:

2.持续运行的大型互联网业务系统中,存在大量的数值指标来表示业务系统的运行状态,比如请求数、错误数、延时等等,这些数值指标通常称为监控指标。
3.监控指标的异常检测,就是将监控指标的最新数值与之前的数值序列进行比较,检测最新值是否出现大幅度的异常变动,比如突然大幅度增加或大幅度减少。
4.目前监控指标的异常检测,主要有以下几种技术方法:
5.1、基于规则进行检测。该方法面对大量不同种类不同特性的监控指标,配置统一的检测规则,识别异常的效果会比较差,容易出现大量错误识别、漏识别。
6.2、基于统计算法进行检测。该方法基于统计算法的检测,适用的监控指标类型比较局限。如果监控指标经常波动,或者日间夜间高低起伏,则检测效果就比较差。
7.3、基于机器学习方法训练模型进行。该方法使用一套正负样本集,训练出一个机器学习模型,来应对不同种类指标的检测,识别监控指标异常的效果会比较差。


技术实现要素:

8.本发明实施例提供的一种数据检测方法、装置及存储介质,可以提高对监控数据的检测准确性。
9.本发明的技术方案是这样实现的:
10.本发明实施例提供了一种数据检测方法,包括:
11.获取当前数据集合;所述当前数据集合包括:同一业务的多个当前数据;
12.分别利用多个类别识别模型对所述多个当前数据进行检测,确定出所述多个当前数据的目标曲线类别;所述目标曲线类别对应与多个当前数据的数据特性相同的历史数据构建的曲线图谱的类别;
13.利用所述目标曲线类别对应的目标异常检测模型,对所述多个当前数据进行检测,确定出所述多个当前数据对应的当前数据集合的检测结果;其中,
14.所述多个类别识别模型和所述目标异常检测模型是基于从不同方向上提取出多个历史数据中的样本数据,并利用所述样本数据进行训练得到的。
15.上述方案中,所述分别利用多个类别识别模型对所述多个当前数据进行检测,确定出所述多个当前数据的目标曲线类别之前,所述方法还包括:
16.获取历史时间段内的历史数据集合;所述历史数据集合包括:不同业务的多个历史数据;
17.根据所述多个历史数据的数据特性,确定出所述多个历史数据中的多个曲线类别;
18.在所述每个曲线类别对应的多个同类历史数据中,从不同方向上提取出多个样本数据;
19.利用所述多个样本数据分别对初始类别识别模型和初始异常检测模型进行训练,直至得到所述每个曲线类别对应的类别识别模型和异常检测模型,进而得到所述多个曲线类别对应的多个类别识别模型和多个异常检测模型。
20.上述方案中,所述根据所述多个历史数据的数据特性,确定出所述多个历史数据中的多个曲线类别,包括:
21.根据所述多个历史数据的数据特性,构建出对应所述不同业务的多个曲线图谱;
22.基于所述多个曲线图谱分别对应的曲线特征,确定出所述多个曲线类别。
23.上述方案中,所述数据特性包括:对应历史数据的时间特性和数值特性;
24.所述根据所述多个历史数据的数据特性,构建出对应所述不同业务的多个曲线图谱,包括:
25.以时间轴为横轴,以数值轴为纵轴,构建出时间

数值图谱;
26.根据所述不同业务对应的历史数据的时间特性和数值特性,在所述时间

数值图谱中标记出所述不同业务对应的历史数据,进而得到所述不同业务对应的多个曲线图谱。
27.上述方案中,所述曲线特性包括:形态特性、量级特性和抖动特性;所述量级特性表征对应曲线图谱的历史数据的数值分布特性;
28.所述基于所述多个曲线图谱分别对应的曲线特征,确定出所述多个曲线类别,包括:
29.基于所述多个曲线图谱分别对应的所述形态特性、所述量级特性和所述抖动特性,确定出所述多个曲线类别。
30.上述方案中,所述基于所述多个曲线图谱分别对应的所述形态特性、所述量级特性和所述抖动特性,确定出所述多个曲线类别,包括:
31.将所述多个曲线图谱分别对应的所述形态特性相同的曲线图谱分别归类,得到n个曲线类别;
32.将所述多个曲线图谱分别对应的所述量级特性相同的曲线图谱分别归类,得到m个曲线类别;
33.将所述多个曲线图谱分别对应的所述抖动特性相同的曲线图谱分别归类,得到z个曲线类别;
34.将所述n个曲线类别、m个曲线类别和z个曲线类别组合,得到所述多个曲线类别。
35.上述方案中,所述在所述每个曲线类别对应的多个同类历史数据中,从不同方向上提取出多个样本数据,包括:
36.将所述每个曲线类别对应的曲线图谱与对应的往期同类曲线图谱进行比对,根据同时间坐标下多个基本历史数据与对应的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据;所述多个基本历史数据归属于所述每个曲线类别对应的曲线图谱;所述多个参考历史数据归属于所述往期同类曲线图谱。
37.上述方案中,所述多个样本数据包括:多个正样本数据和多个负样本数据;
38.所述将所述每个曲线类别对应的曲线图谱与对应的往期同类曲线图谱进行比对,根据同时间坐标下多个基本历史数据与对应的多个参考历史数据的偏离程度,从不同方向
上提取出多个样本数据,包括:
39.将同时间坐标下的所述多个基本历史数据,与对应的所述多个参考历史数据进行比对,确定出在所述多个参考历史数据的预设数值范围内的所述多个正样本数据,和预设数值范围外的所述多个负样本数据。
40.上述方案中,所述利用所述多个样本数据分别对初始类别识别模型和初始异常检测模型进行训练,直至得到所述每个曲线类别对应的类别识别模型和异常检测模型,进而得到所述多个曲线类别对应的多个类别识别模型和多个异常检测模型,包括:
41.利用所述多个正样本数据对初始类别识别模型进行训练,直至得到所述每个曲线类别对应的类别识别模型,进而得到所述多个曲线类别对应的所述多个类别识别模型;
42.利用所述多个正样本数据和所述多个负样本数据对初始异常检测模型进行训练,直至得到所述每个曲线类别对应的异常检测模型,进而得到所述多个曲线类别对应的多个异常检测模型。
43.本发明实施例还提供了一种数据检测装置,包括:
44.数据获取单元,用于获取当前数据集合;所述当前数据集合包括:同一业务的多个当前数据;
45.第一检测单元,用于分别利用多个类别识别模型对所述多个当前数据进行检测,确定出所述多个当前数据的目标曲线类别;所述目标曲线类别对应与多个当前数据的数据特性相同的历史数据构建的曲线图谱的类别;
46.第二检测单元,用于利用所述目标曲线类别对应的目标异常检测模型,对所述多个当前数据进行检测,确定出所述多个当前数据对应的当前数据集合的检测结果;其中,
47.所述多个类别识别模型和所述目标异常检测模型是基于从不同方向上提取出多个历史数据中的样本数据,并利用所述样本数据进行训练得到的。
48.还提供了一种数据检测装置,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的步骤。
49.还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
50.本发明实施例中,通过获取当前数据集合;当前数据集合包括:同一业务的多个当前数据;分别利用多个类别识别模型对多个当前数据进行检测,确定出多个当前数据的目标曲线类别;利用目标曲线类别对应的目标异常检测模型对多个当前数据进行检测,确定出多个当前数据对应的当前数据集合的检测结果;多个类别识别模型和目标异常检测模型是基于从不同维度上提取出多个历史数据中的样本数据,并利用样本数据进行训练得到的。由于样本数据是从不同方向上提取出来的,所以通过样本数据训练的类别识别模型和异常检测模型更加的贴合不同曲线类别的数据特性,而且通过多个类别识别模型和曲线类别对应的目标异常检测模型分别从两个维度检测多个当前数据,所以提高了对监控数据的检测准确性。
附图说明
51.图1为本发明实施例提供的数据检测方法的一个可选的流程示意图;
52.图2为本发明实施例提供的数据检测方法的一个可选的流程示意图;
53.图3为本发明实施例提供的数据检测方法的一个可选的流程示意图;
54.图4为本发明实施例提供的数据检测方法的一个可选的流程示意图;
55.图5为本发明实施例提供的数据检测方法的一个可选的流程示意图;
56.图6为本发明实施例提供的数据检测方法的一个可选的流程示意图;
57.图7为本发明实施例提供的数据检测方法的一个可选的流程示意图;
58.图8为本发明实施例提供的数据检测方法的一个可选的流程示意图;
59.图9为本发明实施例提供的数据检测方法的一个可选的流程示意图;
60.图10为本发明实施例提供的数据检测方法的一个可选的流程示意图;
61.图11为本发明实施例提供的数据检测方法的一个可选的流程示意图;
62.图12为本发明实施例提供的数据检测方法的一个可选的效果示意图;
63.图13为本发明实施例提供的数据检测装置的结构示意图;
64.图14为本发明实施例提供的数据检测装置的一种硬件实体示意图。
具体实施方式
65.为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和实施例对本发明的技术方案进一步详细阐述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
66.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
67.如果发明文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
68.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
69.图1为本发明实施例提供的数据检测方法的一个可选的流程示意图,将结合图1示出的步骤进行说明。
70.s101、获取当前数据集合。
71.本发明实施例中,服务器和其他服务器或者其他终端建立通信连接。服务器通过该通信连接获取服务器或者终端当前一段时间段内的多个当前数据。
72.其中,多个当前数据为同一业务的数据。多个当前数据可以为数值数据。同一业务可以为请求数业务、错误数业务和延时业务中的任意一个。
73.其中,当前一段时间内可以为当前1小时内或者1分钟内,在此不做限定。
74.本发明实施例中,服务器通过该通信连接获取服务器或者终端当前一段时间段内的多个业务分别对应的多个当前数据。服务器在多个业务中挑选出任意一个业务的多个当前数据。
75.s102、分别利用多个类别识别模型对多个当前数据进行检测,确定出多个当前数据的目标曲线类别。
76.本发明实施例中,服务器首先分别利用多个类别识别模型对多个当前数据进行检测,确定出多个当前数据的目标曲线类别。
77.本发明实施例中,多个类别识别模型包括基于卷积神经网络模型的类别识别模型。多个类别识别模型是服务器首先利用历史数据构建多个曲线图谱,然后确定出其中的多个曲线类别。服务器从多个曲线类别对应的历史数据中分别提取出多个正样本数据。服务器通过多个曲线类别分别对应的多个正样本数据进行训练,得到了多个曲线类别对应的多个类别识别模型。
78.s103、利用目标曲线类别对应的目标异常检测模型,对多个当前数据进行检测,确定出多个当前数据对应的当前数据集合的检测结果。
79.本发明实施例中,服务器利用目标曲线类别对应的目标异常检测模型对多个当前数据进行检测,确定出多个当前数据对应的当前数据集合的检测结果。
80.本发明实施例中,目标异常检测模型包括基于卷积神经网络模型的异常检测模型。服务器从多个曲线类别对应的历史数据中分别提取出多个正样本数据和多个负样本数据。服务器通过多个曲线类别分别对应的多个正样本数据和多个负样本数据进行训练,得到了多个曲线类别分别对应的多个异常检测模型。其中,目标异常检测模型是目标曲线类别对应的异常检测模型。
81.其中,多个类别识别模型和目标异常检测模型是基于从不同方向上提取出多个历史数据中的样本数据,并利用样本数据进行训练得到的。其中,样本数据包括:多个正样本数据和多个负样本数据。
82.本发明实施例中,通过获取当前数据集合;当前数据集合包括:同一业务的多个当前数据;分别利用多个类别识别模型对多个当前数据进行检测,确定出多个当前数据的目标曲线类别;利用目标曲线类别对应的目标异常检测模型对多个当前数据进行检测,确定出多个当前数据对应的当前数据集合的检测结果;多个类别识别模型和目标异常检测模型是基于从不同维度上提取出多个历史数据中的样本数据,并利用样本数据进行训练得到的。由于样本数据是从不同方向上提取出来的,所以通过样本数据训练的类别识别模型和异常检测模型更加的贴合不同曲线类别的数据特性,而且通过多个类别识别模型曲线类别对应的目标异常检测模型分别从两个维度检测多个当前数据,所以提高了对监控数据的检测准确性。
83.参见图2,图2为本发明实施例提供的数据检测方法的一个可选的流程示意图,将结合各步骤进行说明。
84.s201、获取一段时间内的监控指标。
85.本发明实施例中,服务器获取终端或者其他服务器当前一段时间内的监控指标。其中,监控指标都为数值指标。
86.s202、曲线种类识别模型”识别监控指标为“曲线种类n。
87.本发明实施例中,服务器通过曲线种类识别模型识别出监控指标为曲线种类n。
88.s203、使用“曲线异常识别模型n”检测监控指标。
89.本发明实施例中,服务器通过曲线种类n对应的曲线异常识别模型n检测监控指
标。
90.s204、是否出现异常。
91.s205、是否有监控指标待检测。
92.本发明实施例中,服务器检测得到当前一段时间段内的监控指标正常,则服务器检测是否还有其他监控指标待检测。如果还有其他监控指标待检测,则服务器通过曲线种类识别模型识别出待检测的监控指标的种类。
93.s206、发送告警。
94.在一些实施例中,参见图3,图3为本发明实施例提供的数据检测方法的一个可选的流程示意图,图1示出的s102之前可以包括s104至s107实现,将结合各步骤进行说明。
95.s104、获取历史时间段内的历史数据集合。
96.本发明实施例中,服务器通过与中终端或者其他服务器之间的通信线路,获取终端或者其他服务器历史时间段内的历史数据集合。
97.其中,历史数据集合包括:对应终端或者服务器内的不同业务的多个历史数据。每个业务可以对应多个历史数据。
98.其中,多个历史数据可以为数值数据。
99.s105、根据多个历史数据的数据特性,确定出多个历史数据中的多个曲线类别。
100.本发明实施例中,服务器根据多个历史数据的数据特性,确定出多个历史数据中的多个曲线类别。
101.本发明实施例中,服务器首先根据不同业务的分别对应的多个历史数据的数据特性,构建出不同业务对应的多个曲线图谱,其次,服务器再根据多个曲线图谱的曲线特性将多个曲线图谱分为多个类别,得到多个曲线类别。
102.其中,数据特性可以为对应历史数据的时间特性和数值特性。
103.本发明实施例中,服务器可以根据多个曲线图谱的形态特性将多个曲线图谱分为s型曲线和平滑上升曲线等曲线类别。在此不做限定。
104.本发明实施例中,服务器可以根据多个曲线图谱的量级特性将多个曲线图谱分为1

100量级和100

1000量级等曲线类别。
105.本发明实施例中,服务器可以根据多个曲线图谱的抖动特性将多个曲线图谱分为强抖动和微抖动等曲线类别。
106.s106、在每个曲线类别对应的多个同类历史数据中,从不同方向上提取出多个样本数据。
107.本发明实施例中,服务器在每个曲线类别对应的多个同类历史数据中,从不同方向上提取出多个样本数据。
108.本发明实施例中,每个曲线类别可以对应同类别的至少一个曲线图谱。服务器在至少一个曲线图谱中确定一个曲线图谱,并提取出该曲线图谱的多个同类历史数据。服务器可以将该曲线图谱与往期同类曲线图谱进行比对,并在多个同类历史数据中提取出同时间坐标下超出往期同类曲线中的多个参考历史数据的数值范围的多个负样本数据。服务器还可以在多个同类历史数据中提取出同时间坐标下未超出往期同类曲线图谱中的多个历史数据的数值范围的多个正样本数据,服务器将多个正样本数据和多个负样本数据结合得到多个样本数据。
109.其中,多个正样本数据用于训练形成每个曲线类别对应的类别识别模型。多个正样本数据和多个负样本数据用于训练形成每个曲线类别对应的异常检测模型。
110.s107、利用多个样本数据分别对初始类别识别模型和初始异常检测模型进行训练,直至得到每个曲线类别对应的类别识别模型和异常检测模型,进而得到多个曲线类别对应的多个类别识别模型和多个异常检测模型。
111.本发明实施例中,服务器利用多个样本数据分别对初始类别识别模型和初始异常检测模型进行训练,直至得到每个曲线类别对应的类别识别模型和异常检测模型,进而得到了多个曲线类别对应的多个类别识别模型和多个异常检测模型。
112.本发明实施例中,服务器利用多个正样本数据对初始类别识别模型进行训练,直至得到每个曲线类别分别对应的类别识别模型,进而得到了多个曲线类别对应的多个类别识别模型。服务器利用多个正样本数据和多个负样本数据对初始异常检测模型进行训练,直至得到每个曲线类别分别对应的异常检测模型,进而得到了多个曲线类别对应的多个异常检测模型。
113.在本发明实施例中,类别识别模型的一次训练可以用以下几个阶段表示:前向传播阶段、反向传播阶段和更新权值阶段。前向传播阶段是多个正样本数据从输入层输入向后一直传输到输出层。反向传播阶段是从输出层向前一直传输到输入层。本发明实施例中提出的数据检测方法,在前向传播阶段将多个正样本数据输入至待训练的初始类别识别模型的网络结构中。初始类别识别模型的网络结构基于多个正样本数据通过损失函数计算出多个正样本数据对应的损失。
114.在本发明实施例中,初始类别识别模型的网络结构基于损失函数计算得到对应多个正样本数据的损失。若该损失大于损失阈值,初始类别识别模型的网络结构将基于该损失通过输出层,向中间层、输入层逐层反传,按梯度下降的方式修正各层的权值。当初始类别识别模型的网络结构各层的权值修正之后,初始类别识别模型的网络结构会继续对新获取到样本数据进行训练。初始类别识别模型训练得到类别识别模型的过程一直进行到的初始类别识别模型计算的当前损失不大于损失阈值时为止,或者初始类别识别模型训练的次数达到预先设定的训练次数时为止,得到类别识别模型。异常检测模型的训练过程和类别识别模型的训练过程相似,在此不一一赘述。
115.参见图4,图4为本发明实施例提供的数据检测方法的一个可选的流程示意图,将结合各步骤进行说明。
116.s207、监控指标历史数据。
117.本发明实施例中,服务器获取终端或者其他服务器的不同业务的监控指标历史数据。
118.s208、数据采集分类。
119.本发明实施例中,服务器将监控指标按照对应的曲线图谱的类别进行分类。
120.s209、监控指标分类样本集。
121.本发明实施例中,服务器从分类得到的多个曲线类别对应的历史数据中采集各个曲线类别对应的分类样本集。
122.其中,每个曲线类别可以对应分类正样本集和分类负样本集。
123.s210、从两个维度分别训练机器学习模型。
124.本发明实施例中,服务器通过每个曲线类别的分类正样本集训练得到s211、类别识别模型、s212、异常检测模型。
125.s213、监控指标实时数据。
126.本发明实施例中,服务器获取对应终端或者其他服务器的监控指标的实时数据,也就是一段时间段内的监控指标数据。
127.s214、识别曲线种类。
128.本发明实施例中,服务器通过类别识别模型识别出监控指标实时数据的曲线种类。
129.s215、检测曲线异常。
130.本发明实施例中,服务器再通过该曲线种类对应的异常检测模型检测监控指标实时数据是否异常。
131.在一些实施例中,参见图5,图5为本发明实施例提供的数据检测方法的一个可选的流程示意图,图3示出的s105可以通过s108至s109实现,将结合各步骤进行说明。
132.s108、根据多个历史数据的数据特性,构建出对应不同业务的多个曲线图谱。
133.本发明实施例中,服务器根据多个历史数据的数据特性构建出对应不同业务的多个曲线图谱。
134.本发明实施例中,每个业务对应的多个历史数据,服务器根据每个业务对应的多个历史数据的数据特性,构建出每个业务的曲线图谱,进而得到了不同业务的多个曲线图谱。
135.本发明实施例中,多个历史数据中的每个历史数据包括:数值特性和时间特性。服务器根据多个历史数据的数值特性和时间特性构建出每个业务对应的曲线图谱。
136.s109、基于多个曲线图谱分别对应的曲线特征,确定出多个曲线类别。
137.本发明实施例中,服务器基于多个曲线图谱分别对应的曲线特征,确定出多个曲线类别。
138.本发明实施例中,每个曲线类别可以对应一个业务的曲线图谱的类别,也可以对应多个业务的曲线图谱的类别。曲线类别的数量小于等于多个曲线图谱的数量。
139.在一些实施例中,参见图6,图6为本发明实施例提供的数据检测方法的一个可选的流程示意图,图5示出的s108至s109可以通过s110至s112实现,将结合各步骤进行说明。
140.s110、以时间轴为横轴,以数值轴为纵轴,构建出时间

数值图谱。
141.本发明实施例中,服务器以时间轴为横轴,以数值轴为纵轴,构建出时间

数值图谱。
142.本发明实施例中,服务器以时间轴为横轴,以数值轴为纵轴,构建出多个曲线图谱对应的多个时间

数值图谱。
143.s111、根据不同业务对应的历史数据的时间特性和数值特性,在时间

数值图谱中标记出不同业务对应的历史数据,进而得到不同业务对应的多个曲线图谱。
144.本发明实施例中,服务器根据不同业务对应的历史数据的时间特性和数值特性,在时间

数值图谱中标记出不同业务对应的多个历史数据,进而得到了不同业务对应的多个曲线图谱。
145.本发明实施例中,服务器将每个业务对应的多个历史数据按照对应时间特性对应
时间轴上的时间坐标,数值特性对应数值轴上的数值坐标的方法,将多个历史数据标记在对应的时间

数值图谱中,得到了每个业务对应的曲线图谱,进而得到了多个业务对应的多个曲线图谱。
146.s112、基于多个曲线图谱分别对应的形态特性、量级特性和抖动特性,确定出多个曲线类别。
147.本发明实施例中,服务器基于多个曲线图谱分别对应的形态特性、量级特性和抖动特性,确定出多个曲线类别。
148.本发明实施例中,量级特性表征对应曲线图谱的历史数据的数值分布特性。
149.本发明实施例中,服务器将多个曲线图谱分别对应的形态特性相同的曲线图谱分别归类,得到n个曲线类别。服务器将多个曲线图谱分别对应的量级特性相同的曲线图谱分别归类,得到m个曲线类别。服务器将多个曲线图谱分别对应的抖动特性相同的曲线图谱分别归类,得到z个曲线类别。服务器将n个曲线类别、m个曲线类别和z个曲线类别组合,得到多个曲线类别。
150.在一些实施例中,参见图7,图7为本发明实施例提供的数据检测方法的一个可选的流程示意图,图6示出的s112可以通过s113至s116实现,将结合各步骤进行说明。
151.s113、将多个曲线图谱分别对应的形态特性相同的曲线图谱分别归类,得到n个曲线类别。
152.本发明实施例中,服务器将多个曲线图谱分别对应的形态特性相同的曲线图谱分别归类,得到n个曲线类别。n为大于等于1的正整数。
153.本发明实施例中,形态特性可以包括:n个子形态特性。服务器将曲线图谱中分别对应n个子形态特性的曲线图谱分别归类。得到了n个曲线类别。
154.本发明实施例中,形态特性可以包括:s型形态、一形态、l型形态和m型形态等形态。服务器在多个曲线图谱中将s型形态的曲线图谱归为一类,将一形态的曲线图谱归为一类,将l型形态的曲线图谱归为一类,将m型形态的曲线图谱归为一类,得到了四类曲线图谱。所以得到了四个曲线类别。
155.s114、将多个曲线图谱分别对应的量级特性相同的曲线图谱分别归类,得到m个曲线类别。
156.本发明实施例中,服务器将多个曲线图谱分别对应的量级特性相同的曲线图谱分别归类,得到了m个曲线类别。
157.本发明实施例中,量级特性可以包括:m个子量级特性。服务器将曲线图谱中分别对应m个子量级特性的曲线图谱分别归类。得到了m个曲线类别。
158.本发明实施例中,量级特性可以包括:1

100量级、100

1000量级和1000

10000量级。服务器在多个曲线图谱中将1

100量级的曲线图谱归为一类,将100

1000量级的曲线图谱归为一类,将1000

10000量级的曲线图谱归为一类。所以得到了三个曲线类别。
159.s115、将多个曲线图谱分别对应的抖动特性相同的曲线图谱分别归类,得到z个曲线类别。
160.本发明实施例中,服务器将多个曲线图谱分别对应的抖动特性相同的曲线图谱分别归类,得到z个曲线类别。
161.本发明实施例中,抖动特性可以包括:z个子抖动特性。服务器将曲线图谱中分别
对应z个子抖动特性的曲线图谱分别归类。得到了z个曲线类别。
162.本发明实施例中,量级特性可以包括:强抖动和微抖动。服务器在多个曲线图谱中将强抖动的曲线图谱归为一类,将微抖动的曲线图谱归为一类。所以得到了2个曲线类别。
163.其中,抖动特性表征曲线图谱中的历史数据偏离对应曲线图谱轴线的程度特性。
164.s116、将n个曲线类别、m个曲线类别和z个曲线类别组合,得到多个曲线类别。
165.本发明实施例中,服务器将n个曲线类别、m个曲线类别和z个曲线类别组合,得到多个曲线类别。
166.本发明实施例中,服务器将n个曲线类别、m个曲线类别和z个曲线类别相加,得到多个曲线类别。
167.在一些实施例中,参见图8,图8为本发明实施例提供的数据检测方法的一个可选的流程示意图,图3示出的s106可以通过s117实现,将结合各步骤进行说明。
168.s117、将每个曲线类别对应的曲线图谱与对应的往期同类曲线图谱进行比对,根据同时间坐标下多个基本历史数据与对应的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据。
169.本发明实施例中,服务器将每个曲线类别对应的曲线图谱与对应的往期同类曲线图谱进行比对,根据同时间坐标下多个基本历史数据与对应的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据。多个基本历史数据归属于每个曲线类别对应的曲线图谱;多个参考历史数据归属于往期同类曲线图谱。
170.本发明实施例中,服务器将每个曲线类别对应的任意一个曲线图谱与对应的往期同类曲线图谱进行比对。服务器根据同时间坐标下该曲线图谱中的多个基本历史数据与对应的往期同类曲线图谱中的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据。
171.本发明实施例中,服务器将每个曲线类别对应的曲线图谱依次与对应的往期同类曲线图谱进行比对。服务器根据同时间坐标下该曲线图谱中的多个基本历史数据与对应的往期同类曲线图谱中的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据。
172.本发明实施例中,从不同方向上提取出多个样本数据可以包括:服务器将偏离程度小的基本历史数据归为多个正样本数据中,服务器将偏离程度大的基本历史数据归为多个负样本历史数据中,进而得到了多个样本数据。
173.在一些实施例中,参见图9,图9为本发明实施例提供的数据检测方法的一个可选的流程示意图,图8示出的s117可以通过s118实现,将结合各步骤进行说明。
174.s118、将同时间坐标下的多个基本历史数据,与对应的多个参考历史数据进行比对,确定出在多个参考历史数据的预设数值范围内的多个正样本数据,和预设数值范围外的多个负样本数据。
175.本发明实施例中,服务器将同时间坐标下的多个基本历史数据,与对应的多个参考历史数据进行比对,确定出在多个参考历史数据的预设数值范围内的多个正样本数据,和预设数值范围外的多个负样本数据。
176.其中,预设数据范围可以为10、100等数值。
177.参见图10,图10为本发明实施例提供的数据检测方法的一个可选的流程示意图,
将结合各步骤进行说明。
178.s216、采集一段时间内的监控数据。
179.本发明实施例中,服务器采集一端时间内的监控数据。
180.s217、曲线样本。
181.s218、划分曲线种类。
182.本发明实施例中,服务器按照对应不同业务的历史数据构建出多个曲线图谱。服务器在多个曲线图谱中根据去曲线特性将曲线图谱进行分类。
183.示例性的,服务器将曲线图谱进行分类得到了曲线种类1、曲线种类2和曲线种类3。本发明实施例中,服务器可以在曲线种类1中提取出曲线种类1正样本和曲线种类1负样本。服务器可以在曲线种类2中提取出曲线种类2正样本和曲线种类2负样本。服务器可以在曲线种类3中提取出曲线种类3正样本和曲线种类3负样本。
184.在一些实施例中,参见图11,图11为本发明实施例提供的数据检测方法的一个可选的流程示意图,图8示出的s107可以通过s119至s120实现,将结合各步骤进行说明。
185.s119、利用多个正样本数据对初始类别识别模型进行训练,直至得到每个曲线类别对应的类别识别模型,进而得到多个曲线类别对应的多个类别识别模型。
186.本发明实施例中,服务器利用每个业务对应的多个正样本数据对对初始类别识别模型进行训练,直至得到每个曲线类别对应的类别识别模型,进而得到多个曲线类别对应的多个类别识别模型。
187.s120、利用多个正样本数据和多个负样本数据对初始异常检测模型进行训练,直至得到每个曲线类别对应的异常检测模型,进而得到多个曲线类别对应的多个异常检测模型。
188.本发明实施例中,服务器利用每个业务对应的多个正样本数据和多个负样本数据对初始异常检测模型进行训练,直至得到每个曲线类别对应的异常检测模型,进而得到多个曲线类别对应的多个异常检测模型。
189.示例性的,结合图12,服务器通过曲线种类1正样本、曲线种类2正样本和曲线种类3正样本分别进行模型训练,得到了曲线种类1、曲线种类2和曲线种类3分别对应的类别识别模型。服务器通过曲线种类1正样本和曲线种类1负样本进行模型训练,得到了曲线种类1对应的异常检测模型1。服务器通过曲线种类2正样本和曲线种类2负样本进行模型训练,得到了曲线种类2对应的异常检测模型2。服务器通过曲线种类3正样本和曲线种类3负样本进行模型训练,得到了曲线种类3对应的异常检测模型3。
190.参阅图13,为本发明实施例提供的数据检测装置的结构示意图。
191.本发明实施例还提供了一种数据检测装置800,包括:数据获取单元803、第一检测单元804和第二检测单元805。
192.数据获取单元803,用于获取当前数据集合;所述当前数据集合包括:同一业务的多个当前数据;
193.第一检测单元804,用于分别利用多个类别识别模型对所述多个当前数据进行检测,确定出所述多个当前数据的目标曲线类别;所述目标曲线类别对应与多个当前数据的数据特性相同的历史数据构建的曲线图谱的类别;
194.第二检测单元805,用于利用所述目标曲线类别对应的目标异常检测模型,对所述
多个当前数据进行检测,确定出所述多个当前数据对应的当前数据集合的检测结果;
195.所述多个类别识别模型和所述目标异常检测模型是基于从不同方向上提取出多个历史数据中的样本数据,并利用所述样本数据进行训练得到的。
196.本发明实施例中,数据检测装置800中的数据获取单元还用于获取历史时间段内的历史数据集合;所述历史数据集合包括:不同业务的多个历史数据。根据所述多个历史数据的数据特性,确定出所述多个历史数据中的多个曲线类别;在所述每个曲线类别对应的多个同类历史数据中,从不同方向上提取出多个样本数据;利用所述多个样本数据分别对初始类别识别模型和初始异常检测模型进行训练,直至得到所述每个曲线类别对应的类别识别模型和异常检测模型,进而得到所述多个曲线类别对应的多个类别识别模型和多个异常检测模型。
197.本发明实施例中,数据检测装置800还用于根据所述多个历史数据的数据特性,构建出对应所述不同业务的多个曲线图谱;基于所述多个曲线图谱分别对应的曲线特征,确定出所述多个曲线类别。
198.本发明实施例中,所述数据特性包括:对应历史数据的时间特性和数值特性;数据检测装置800还用于以时间轴为横轴,以数值轴为纵轴,构建出时间

数值图谱;根据所述不同业务对应的历史数据的时间特性和数值特性,在所述时间

数值图谱中标记出所述不同业务对应的历史数据,进而得到所述不同业务对应的多个曲线图谱。
199.本发明实施例中,所述曲线特性包括:形态特性、量级特性和抖动特性;所述量级特性表征对应曲线图谱的历史数据的数值分布特性;本发明实施例中,数据检测装置800还用于基于所述多个曲线图谱分别对应的所述形态特性、所述量级特性和所述抖动特性,确定出所述多个曲线类别。
200.本发明实施例中,数据检测装置800还用于将所述多个曲线图谱分别对应所述形态特性相同的曲线图谱分别归类,得到n个曲线类别;将所述多个曲线图谱分别对应所述量级特性相同的曲线图谱分别归类,得到m个曲线类别;将所述多个曲线图谱分别对应所述抖动特性相同的曲线图谱分别归类,得到z个曲线类别;将所述n个曲线类别、m个曲线类别和z个曲线类别组合,得到所述多个曲线类别。
201.本发明实施例中,数据检测装置800还用于将所述每个曲线类别对应的曲线图谱与对应的往期同类曲线图谱进行比对,根据同时间坐标下多个基本历史数据与对应的多个参考历史数据的偏离程度,从不同方向上提取出多个样本数据;所述多个基本历史数据归属于所述每个曲线类别对应的曲线图谱;所述多个参考历史数据归属于所述往期同类曲线图谱。
202.本发明实施例中,所述多个样本数据包括:多个正样本数据和多个负样本数据;数据检测装置800还用于将同时间坐标下的所述多个基本历史数据,与对应的所述多个参考历史数据进行比对,确定出在所述多个参考历史数据的预设数值范围内的所述多个正样本数据,和预设数值范围外的所述多个负样本数据。
203.本发明实施例中,数据检测装置800还用于利用所述多个正样本数据对初始类别识别模型进行训练,直至得到所述每个曲线类别对应的类别识别模型,进而得到所述多个曲线类别对应的所述多个类别识别模型;利用所述多个正样本数据和所述多个负样本数据对初始异常检测模型进行训练,直至得到所述每个曲线类别对应的异常检测模型,进而得
到所述多个曲线类别对应的多个异常检测模型。
204.本发明实施例中,通过数据获取单元803获取当前数据集合;当前数据集合包括:同一业务的多个当前数据;通过第一检测单元804分别利用多个类别识别模型对多个当前数据进行检测,确定出多个当前数据的目标曲线类别;通过第二检测单元805利用目标曲线类别对应的目标异常检测模型对多个当前数据进行检测,确定出多个当前数据对应的当前数据集合的检测结果;多个类别识别模型和目标异常检测模型是基于从不同维度上提取出多个历史数据中的样本数据,并利用样本数据进行训练得到的。由于样本数据是从不同方向上提取出来的,所以通过样本数据训练的类别识别模型和异常检测模型更加的贴合不同曲线类别的数据特性,而且通过多个类别识别模型曲线类别对应的目标异常检测模型分别从两个维度检测多个当前数据,所以提高了对监控数据的检测准确性。
205.需要说明的是,本发明实施例中,如果以软件功能模块的形式实现上述的集群构建及订阅信息处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台数据检测装置(可以是个人计算机等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
206.对应地,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
207.对应地,本发明实施例提供一种数据检测装置,包括存储器802和处理器801,所述存储器802存储有可在处理器801上运行的计算机程序,所述处理器801执行所述程序时实现上述方法中的步骤。
208.这里需要指出的是:以上存储介质和装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明存储介质和装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
209.需要说明的是,图14为本发明实施例提供的数据检测装置的一种硬件实体示意图,如图14所示,该数据检测装置800的硬件实体包括:处理器801和存储器802,其中;
210.处理器801通常控制数据检测装置800的总体操作。
211.存储器802配置为存储由处理器801可执行的指令和应用,还可以缓存待处理器801以及数据检测装置800中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(flash)或随机访问存储器(random access memory,ram)实现。
212.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例
序号仅仅为了描述,不代表实施例的优劣。
213.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
214.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
215.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
216.另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
217.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储装置、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。
218.或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机、服务器、或者网络装置等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储装置、rom、磁碟或者光盘等各种可以存储程序代码的介质。
219.以上所述,仅为本发明的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献