一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、数据处理装置、电子设备和存储介质与流程

2022-03-05 06:08:16 来源:中国专利 TAG:


1.本公开涉及数据处理技术领域和金融领域,更具体地,涉及一种数据处理方法、一种数据处理装置、一种电子设备、一种可读存储介质和一种计算机程序产品。


背景技术:

2.管理驾驶舱是一款为企业提供的指标分析型系统,致力于打破数据隔离,实现指标分析。管理驾驶舱通过详尽的指标体系使采集到的数据形象化、直观化、具体化,实时反映企业的运行状态。管理驾驶舱系统中的实时运营数据对业务的分析决策起着关键的作用。
3.在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:管理驾驶舱作为数据使用环节的最末端,如果中间的数据处理环节出现问题,会使驾驶舱的实时数据出现异常。


技术实现要素:

4.有鉴于此,本公开提供了一种数据处理方法、一种数据处理装置、一种电子设备、一种可读存储介质和一种计算机程序产品。
5.根据本公开的第一个方面,提供了一种数据处理方法,包括:
6.从管理驾驶舱的数据库中获取待处理数据表,其中,上述待处理数据表中包括多个第一业务数据,上述待处理数据表的每一列表征一个业务维度,上述待处理数据表的每一行表征一个业务数据组;
7.对于每个上述第一业务数据,将上述第一业务数据输入与上述第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果;
8.在上述检测结果表示上述第一业务数据为异常数据的情况下,将上述第一业务数据所属的目标业务数据组中的其他第一业务数据输入与上述目标业务数据组对应的预测模型中,输出得到第二业务数据;以及
9.使用上述第二业务数据对上述数据库中的第一业务数据进行替换。
10.根据本公开的实施例,还包括:
11.通过数据采集组件采集系统运行过程中产生的报文数据;
12.通过流计算引擎对上述报文数据进行组合,得到上述业务数据组;以及
13.将上述业务数据组通过通信链路传输并存储至位于上述数据库的上述待处理数据表中。
14.根据本公开的实施例,上述方法还包括:
15.从上述数据库中获取与上述目标业务维度相关联的历史业务数据集;以及
16.基于指数平滑方法,利用上述历史业务数据集构建得到与上述目标业务维度对应的异常检测模型,其中,上述异常检测模型基线检测模型、线性倾向检测模型和时间趋势检测模型。
17.根据本公开的实施例,其中,上述将上述第一业务数据数据输入与上述第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果,包括:
18.将上述第一业务数据输入上述异常检测模型中,输出预测得到的第三业务数据;
19.计算上述第一业务数据与上述第三业务数据的差值;
20.基于上述差值,确定上述第一业务数据的置信区间;以及
21.基于上述第一业务数据与上述置信区间的位置关系,得到上述检测结果。
22.根据本公开的实施例,其中,上述基于上述第一业务数据与上述置信区间的位置关系,得到上述检测结果,包括:
23.在上述第一业务数据位于上述置信区间外的情况下,得到表征上述第一业务数据为异常数据的上述检测结果;
24.在上述第一业务数据位于上述置信区间内的情况下,得到表征上述第一业务数据为正常数据的上述检测结果。
25.根据本公开的实施例,还包括:
26.从上述数据库中获取历史数据表;
27.基于多元线性回归方法,将上述历史数据表中与上述目标业务维度对应的业务数据作为因变量,将上述历史数据表中与其他业务维度对应的业务数据作为自变量,构建得到与上述目标业务数据组对应的预测模型。
28.根据本公开的实施例,还包括:
29.在构建得到上述预测模型之后,对上述预测模型进行模型检验,其中,上述模型检验至少包括回归方程的拟合优度检验、回归方程的整体显著性检验和回归系数的显著性检验。
30.根据本公开的第二个方面,提供了一种数据处理装置,包括:
31.获取模块,用于从管理驾驶舱的数据库中获取待处理数据表,其中,上述待处理数据表中包括多个第一业务数据,上述待处理数据表的每一列表征一个业务维度,上述待处理数据表的每一行表征一个业务数据组;
32.第一输出模块,用于对于每个上述第一业务数据,将上述第一业务数据数据输入与上述第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果;
33.第二输出模块,用于在上述检测结果表示上述第一业务数据为异常数据的情况下,将上述第一业务数据所属的目标业务数据组中的其他第一业务数据输入与上述目标业务数据组对应的预测模型中,输出得到第二业务数据;以及
34.替换模块,用于使用上述第二业务数据对上述数据库中的第一业务数据进行替换。
35.根据本公开的第三个方面,提供了一种电子设备,包括:
36.一个或多个处理器;
37.存储器,用于存储一个或多个指令,
38.其中,当上述一个或多个指令被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
39.根据本公开的第四个方面,提供了一种计算机可读存储介质,其上存储有可执行指令,上述可执行指令被处理器执行时使处理器实现如上所述的方法。
40.根据本公开的第五个方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机可执行指令,上述计算机可执行指令在被执行时用于实现如上所述的方法。
41.根据本公开的实施例,对于管理驾驶舱中数据库的业务数据,可以通过异常检测模型对业务数据进行检测,在检测结果表示该业务数据为异常值时,可以通过预测模型确定与该异常值对应的预测值,并使用该预测值对该异常值进行替换的技术手段。因为采用了在数据传输的末端管理驾驶舱中进行实时的数据处理的技术手段,所以至少部分地克服了相关技术中因中间数据处理环节出现问题而导致的驾驶舱实时数据异常的技术问题,从而有效保障了管理驾驶舱实时数据的高可用性,提升了管理驾驶舱的数据运营支持能力。
附图说明
42.通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
43.图1示意性示出了根据本公开实施例的可以应用数据处理方法的示例性系统架构图;
44.图2示意性示出了根据本公开实施例的数据处理方法的流程图;
45.图3示意性示出了根据本公开实施例的生成业务数据组方法的流程图;
46.图4示意性示出了根据本公开实施例的构建异常检测模型方法的流程图;
47.图5示意性示出了根据本公开实施例的通过异常检测模型得到检测结果方法的流程图;
48.图6示意性示出了根据本公开实施例的构建预测模型方法的流程图;
49.图7示意性示出了根据本公开的实施例的数据处理装置700的框图;以及
50.图8示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的框图。
具体实施方式
51.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
52.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
53.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
54.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或
具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
55.在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
56.在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
57.在管理驾驶舱中,实时掌握企业的实时运营数据对各个层级的管理人员是非常重要的,对他们的分析决策起着关键的作用。在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:管理驾驶舱作为数据使用环节的最末端,任意一个中间的数据处理环节出现问题,都会使驾驶舱的实时数据就无法正常显示。
58.在相关技术中,一般可以在数据采集时候对实时数据进行异常处理,但没有考虑实时数据在传输过程中出现问题对最末端数据的影响,且在异常处理的期间内,管理驾驶舱的数据不能正常展示,导致在管理驾驶舱进行实时数据展示的数据未进行数据的异常检测和异常处理,造成数据展示与实际数据之间有很大的误差。
59.为了至少部分地解决相关技术中存在的技术问题,本公开提供了一种数据处理方法,包括:从管理驾驶舱的数据库中获取待处理数据表,其中,待处理数据表中包括多个第一业务数据,待处理数据表的每一列表征一个业务维度,待处理数据表的每一行表征一个业务数据组;对于每个第一业务数据,将第一业务数据输入与第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果;在检测结果表示第一业务数据为异常数据的情况下,将第一业务数据所属的目标业务数据组中的其他第一业务数据输入与目标业务数据组对应的预测模型中,输出得到第二业务数据;以及使用第二业务数据对数据库中的第一业务数据进行替换。本公开还提供了一种数据处理装置、电子设备、计算机存储介质和计算机程序产品。
60.需要说明的是,本公开实施例确定的数据处理方法和装置可用于数据处理技术领域和金融领域,也可用于除数据处理技术领域和金融领域之外的任意领域。本公开实施例确定的数据处理方法和装置的应用领域不做限定。
61.图1示意性示出了根据本公开实施例的可以应用数据处理方法的示例性系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
62.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
63.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
64.终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手
机、平板电脑、膝上型便携计算机和台式计算机等等。
65.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的显示内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的数据等)反馈给终端设备。
66.需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者,本公开实施例所提供的数据处理方法也可以由终端设备101、102、或103执行,或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地,本公开实施例所提供的数据处理装置也可以设置于终端设备101、102、或103中,或设置于不同于终端设备101、102、或103的其他终端设备中。
67.例如,待处理数据表可以原本存储在终端设备101、102、或103中的任意一个(例如,终端设备101,但不限于此)之中,或者存储在外部存储设备上并可以导入到终端设备101中。然后,终端设备101可以在本地执行本公开实施例所提供的数据处理方法,或者将待处理数据表发送到其他终端设备、服务器、或服务器集群,并由接收该待处理数据表的其他终端设备、服务器、或服务器集群来执行本公开实施例所提供的数据处理方法。
68.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
69.图2示意性示出了根据本公开实施例的数据处理方法的流程图。
70.如图2所示,该方法包括操作s201~s204。
71.在操作s201,从管理驾驶舱的数据库中获取待处理数据表,其中,待处理数据表中包括多个第一业务数据,待处理数据表的每一列表征一个业务维度,待处理数据表的每一行表征一个业务数据组。
72.根据本公开的实施例,管理驾驶舱是一组动态的kpi指标,包含“平衡计分卡”模型中的各项指标,这些指标通常直接指向企业的目标和阶段性问题。管理驾驶舱以图表的方式直观的显示各项指标,并支持“钻取式查询”,实现对指标的逐层细化、深化分析。
73.根据本公开的实施例,待处理数据表可以如表1所示,其中,该待处理数据表的每一列可以表征一个业务维度,例如x1、x2、x3、x4等业务维度;该待处理数据表的每一行可以表征一个业务数据组,例如,x11、x12、x13和x14等业务数据构成一个业务数据组。
74.根据本公开的实施例,待处理数据表中包括多个第一业务数据,第一业务数据可以为待处理数据表中任意位置的原始数据,例如可以为x1、x2、x3、、x4、x11、x12、x13、x14等。
75.表1
76.x1x2x3x4
……
x11x12x13x14
……
x21x22x23x24
……
…………………………
77.在操作s202,对于每个第一业务数据,将第一业务数据输入与第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果。
78.根据本公开的实施例,异常检测模型可以是任意种类的数学模型,包括但不限于基于有标签数据的有监督模型、基于距离或基于线性模型的半监督学习模型以及基于密度或基于树的无监督学习模型等。
79.根据本公开的实施例,检测结果可以表征为第一业务数据是异常数据或者第一业务数据是正常数据。
80.在操作s203,在检测结果表示第一业务数据为异常数据的情况下,将第一业务数据所属的目标业务数据组中的其他第一业务数据输入与目标业务数据组对应的预测模型中,输出得到第二业务数据。
81.根据本公开的实施例,预测模型可以是任意种类的数学模型,包括但不限于使用趋势外推预测方法、回归预测方法等方法构建的数学模型,以及卡尔曼滤波预测模型、组合预测模型以及bp神经网络预测模型等已有的数学模型。
82.根据本公开的实施例,第二业务数据可以为在检测结果表征第一业务数据是异常数据的情况下,通过利用预测模型对目标业务数据组中的其他第一业务数据进行处理后得到的预测值,其中,该目标业务数据组是第一业务数据所属的数据组。
83.在操作s204,使用第二业务数据对数据库中的第一业务数据进行替换。
84.根据本公开的实施例,对于管理驾驶舱中数据库的业务数据,可以通过异常检测模型对业务数据进行检测,在检测结果表示该业务为异常值时,可以通过预测模型确定与该异常值对应的预测值,并使用该预测值对该异常值进行替换的技术手段。因为采用了在数据传输的末端进行实时的数据处理的技术手段,所以至少部分地克服了相关技术中因中间数据处理环节出现问题而导致的驾驶舱实时数据异常的技术问题,从而有效保障了管理驾驶舱实时数据的高可用性,提升了管理驾驶舱的数据运营支持能力。
85.下面参考图3~图6,结合具体实施例对图2所示的方法做进一步说明。
86.图3示意性示出了根据本公开实施例的得到业务数据组方法的流程图。
87.如图3所示,该方法包括操作s301~s303。
88.在操作s301,通过数据采集组件采集系统运行过程中产生的报文数据。
89.根据本公开的实施例,可以利用实时数据采集组件kafaka采集报文数据。
90.在操作s302,通过流计算引擎对报文数据进行组合,得到业务数据组。
91.根据本公开的实施例,可以利用流计算引擎spark对采集的报文数据进行归类汇总,将采集到的实时数据根据指标加工规则,加工成业务需要的业务数据组。
92.在操作s303,将业务数据组通过通信链路传输并存储至位于数据库的待处理数据表中。
93.根据本公开的实施例,可以配置定时作业,待大数据云平台的离线作业处理完实时数据后,将加工好的业务数据组传输到联机交易的数据库中,例如gp、oracle等。
94.根据本公开的实施例,通过利用流计算引擎spark加工由实时数据采集组件kafaka采集的报文数据生成业务需要的业务数据组,并将业务数据组传输并存储至待处理数据表中,可以实现对业务数据的实时处理。
95.图4示意性示出了根据本公开实施例的构建异常检测模型方法的流程图。
96.如图4所示,该方法包括操作s401~s402。
97.在操作s401,从数据库中获取与目标业务维度相关联的历史业务数据集。
98.在操作s402,基于指数平滑方法,利用历史业务数据集构建得到与目标业务维度对应的异常检测模型,其中,异常检测模型包括基线检测模型、线性倾向检测模型和时间趋势检测模型。
99.根据本公开的实施例,基于指数平滑技术的检测方法是一种利用指数平滑技术检测时间序列中异常行为的方法。指数平滑是基于时间序列的一个简单统计模型,只需要对自身的序列信息进行预测,不需要其他额外的信息,是根据自身预测自身的一种方法。
100.根据本公开的实施例,异常检测模型包括基线检测模型、线性倾向检测模型和时间趋势检测模型,异常检测模型表示为:
101.y

t 1
=a
t
b
t
c
t 1-m
ꢀꢀꢀꢀ
(1)
102.其中,y

t 1
表示根据异常检测模型得到的t时刻的预测值;a
t
表示基线检测模型;b
t
表示线性倾向检测模型;c
t 1-m
表示时间趋势检测模型。
103.根据本公开的实施例,基线检测模型a
t
为:
104.a
t
=α(y
t-c
t-m
) (1-α)
×
(a
t-1
b
t-1
)
ꢀꢀꢀꢀ
(2)
105.根据本公开的实施例,线性倾向检测模型b
t
为:
106.b
t
=β(a
t-a
t-1
) (1-β)
×bt-1
ꢀꢀꢀꢀ
(3)
107.根据本公开的实施例,时间趋势检测模型c
t 1-m
为:
108.c
t
=γ(y
t-a
t
) (1-γ)
×ct-m
ꢀꢀꢀꢀ
(4)
109.其中,α=1-exp{log(1-权重)/时间节点数};例如,可以设定一个小时内的观测值占据75%的权重,观测值的时间间隔为5分钟,则一个小时共有12个时间节点数,可以得到α=1-exp(log(1-75%)/12)=0.1。β表示一个季节性周期更长时间的线性趋势,用α的估值计算;例如,可以设定观测值的周期为5分钟,则一天共有288个时间节点数,可以得到当最后一天的观测值占用的权重为50%时,β=0.0024。γ表示季节性变化系数。α,β,γ的值位于0到1之间。
110.图5示意性示出了根据本公开实施例的通过异常检测模型得到检测结果方法的流程图。
111.如图5所示,该方法包括操作s501~s504。
112.在操作s501,将第一业务数据输入异常检测模型中,输出预测得到的第三业务数据。
113.在操作s502,计算第一业务数据与第三业务数据的差值。
114.根据本公开的实施例,第三业务数据和第一业务数据之间的差值为:
115.d
t
=γ|y
t-y

t
| (1-γ)d
t-m
ꢀꢀꢀꢀ
(5)
116.其中,y
t
表示t时刻的实际值;y

t
表示t时刻的预测值;d
t
表示t时刻的预测偏差。
117.在操作s503,基于差值,确定第一业务数据的置信区间。
118.根据本公开的实施例,设定置信区间参数δ-和δ

是影响置信区间宽度的因素,参数δ通常取[2,3]中的数,选择2时更加严格的异常判定机制。根据式(1)可以算出t时刻的预测值,根据式(5)可以算出t时刻的差值,然后判断差值是不是在设
定的置信区间内。
[0119]
在操作s504,基于第一业务数据与置信区间的位置关系,得到检测结果。
[0120]
根据本公开的实施例,在第一业务数据位于置信区间外的情况下,得到表征第一业务数据为异常数据的检测结果。
[0121]
根据本公开的实施例,当检测到数据异常时,利用异常处理后的第三业务数据进行展示。
[0122]
根据本公开的实施例,在第一业务数据位于置信区间内的情况下,得到表征第一业务数据为正常数据的检测结果。
[0123]
根据本公开的实施例,若检测到是实时数据没有异常,直接利用第一业务数据进行展示。
[0124]
根据本公开的实施例,通过在实时数据的末端基于指数平滑方法利用历史业务数据集构建的异常检测模型,实时对业务数据进行检测,若检测为异常数据,则利用异常处理后的数据进行展示,解决了因实时数据异常对管理驾驶舱数据展示产生的影响,保证了数据的高用性。
[0125]
图6示意性示出了根据本公开实施例的构建预测模型方法的流程图。
[0126]
如图6所示,该方法包括操作s601~s602。
[0127]
在操作s601,从数据库中获取历史数据表。
[0128]
在操作s602,基于多元线性回归方法,将历史数据表中与目标业务维度对应的业务数据作为因变量,将历史数据表中与其他业务维度对应的业务数据作为自变量,构建得到与目标业务数据组对应的预测模型。
[0129]
根据本公开的实施例,基于多元线性回归根据n组历史数据构建得到与目标业务数据组对应的预测模型为:
[0130]
y=b0 b1x1 b2x2

b
n 1
x
n 1
ꢀꢀ
(6)
[0131]
其中,y表示历史数据表中与目标业务维度对应的业务数据;xi表示历史数据表中与其他业务维度对应的业务数据;b0表示常数项,bj(j=1,2,..,p)表示y对xj的回归系数估计值。
[0132]
根据本公开的实施例,若某一机构相关类型的经营指标数据为x1,x2,x3,...,x
n 1
,某时刻检测出xj指标出现异常,以xj作为因变量,其他指标维度作为自变量进行建模。选取近一个月多组实时指标数据作为样本数据,将各组数据带入模型计算出线性回归方程参数。例如,y表示交易金额,x1表示用户数量,x2表示卡数量,x3表示交易量。
[0133]
根据本公开的实施例,在构建得到预测模型之后,对预测模型进行模型检验,其中,模型检验至少包括回归方程的拟合优度检验、回归方程的整体显著性检验和回归系数的显著性检验。
[0134]
根据本公开的实施例,拟合优度检验一般用于检验样本回归直线对观测值得拟合度,通常用判定系数r2衡量估计方程对样本对观测值的拟合程度。
[0135]
根据本公开的实施例,判定系数r2指因变量y的总变差中能由自由变量所解释的那部分变差的比重,即数学模型为:
[0136]
[0137]
其中,sst=ssr sse;表示总离差平方和;表示回归平方和,它是反映回归效果的参数;表示残差平方和;yi表示第i个样本点(x1、x2......x
p
)上的回归值;表示y的样本平均值。r2的值越接近于1,表明回归方程对实际观测值的拟合度效果越好,相反r2越接近0,拟合效果越差。
[0138]
根据本公开的实施例,回归方程的整体显著性检验是说明对自变量x整体的线性回归效果显著的,但不等于y对于每一个自变量x的效果都显著。
[0139]
根据本公开的实施例,回归系数的显著性检验需要对每个回归系数分别进行,假设h0:检验统计量t为:
[0140][0141][0142]
其中,在回归效果差的情况下,根据tj大小采用后退法依次剔除tj对应的不显著自变量,用剩余的显著因素进行最后一次回归。
[0143]
根据本公开的实施例,对传输数据进行监控,在实时数据传输的末端利用回归方程计算出预测数据,将预测的结果存储在数据库中,与实际数据进行比较,设定误差阈值,不断调整线性回归算法的参数,使得尽可能多的预测数据在误差允许的范围内,若检测到数据传输出现异常,例如数据传输中断等情况时,用预测的结果数据进行展示。
[0144]
根据本公开的实施例,通过在检测结果表示该业务数据为异常值时,直接在实时数据传输的最末端利用线性回归算法构建的预测模型确定出与该异常值对应的预测值,并使用该预测值对该异常值进行替换的技术手段,减少了因数据加工传输的各个环节造成的数据异常导致的显示不正常,解决了因实时数据采集和传输过程中的异常对管理驾驶舱实时数据展示产生的影响。
[0145]
需要说明的是,本公开实施例中的流程图所示的操作除非明确说明不同操作之间存在执行的先后顺序,或者不同操作在技术实现上存在执行的先后顺序,否则,多个操作之间的执行顺序可以不分先后,多个操作也可以同时执行。
[0146]
图7示意性示出了根据本公开的实施例的数据处理装置的框图。
[0147]
如图7所示,数据处理装置700包括第一获取模块710、第一输出模块720、第二输出模块730和替换模块740。
[0148]
第一获取模块710,用于从管理驾驶舱的数据库中获取待处理数据表,其中,待处理数据表中包括多个第一业务数据,待处理数据表的每一列表征一个业务维度,待处理数据表的每一行表征一个业务数据组。
[0149]
第一输出模块720,用于对于每个第一业务数据,将第一业务数据数据输入与第一业务数据所属的目标业务维度对应的异常检测模型中,输出得到检测结果。
[0150]
第二输出模块730,用于在检测结果表示第一业务数据为异常数据的情况下,将第一业务数据所属的目标业务数据组中的其他第一业务数据输入与目标业务数据组对应的预测模型中,输出得到第二业务数据。
[0151]
替换模块740,用于使用第二业务数据对数据库中的第二业务数据进行替换。
[0152]
根据本公开的实施例,数据处理装置还包括采集模块、组合模块和存储模块。
[0153]
采集模块,用于通过数据采集组件采集系统运行过程中产生的报文数据。
[0154]
组合模块,用于通过流计算引擎对所述报文数据进行组合,得到所述业务数据组。
[0155]
存储模块,用于将所述业务数据组通过通信链路传输并存储至位于所述数据库的所述待处理数据表中。
[0156]
根据本公开的实施例,数据处理装置还包括第二获取模块和第一构建模块。
[0157]
第二获取模块,用于从所述数据库中获取与所述目标业务维度相关联的历史业务数据集。
[0158]
第一构建模块,用于基于指数平滑方法,利用所述历史业务数据集构建得到与所述目标业务维度对应的异常检测模型,其中,所述异常检测模型包括基线检测模型、线性倾向检测模型和时间趋势检测模型。
[0159]
根据本公开的实施例,第一输出模块720包括预测单元、计算单元、确定单元和输出单元。
[0160]
预测单元,用于将所述第一业务数据输入所述异常检测模型中,输出预测得到的第三业务数据。
[0161]
计算单元,用于计算所述第一业务数据与所述第三业务数据的差值。
[0162]
确定单元,用于基于所述差值,确定所述第一业务数据的置信区间。
[0163]
输出单元,用于基于所述第一业务数据与所述置信区间的位置关系,得到所述检测结果。
[0164]
根据本公开的实施例,输出单元包括第一表征子单元和第二表征子单元。
[0165]
第一表征子单元,用于在所述第一业务数据位于所述置信区间外的情况下,得到表征所述第一业务数据为异常数据的所述检测结果。
[0166]
第二表征子单元,用于在所述第一业务数据位于所述置信区间内的情况下,得到表征所述第一业务数据为正常数据的所述检测结果。
[0167]
根据本公开的实施例,数据处理装置还包括第三获取模块和第二构建模块。
[0168]
第三获取模块,用于从所述数据库中获取历史数据表。
[0169]
第二构建模块,用于基于多元线性回归方法,将所述历史数据表中与所述目标业务维度对应的业务数据作为因变量,将所述历史数据表中与其他业务维度对应的业务数据作为自变量,构建得到与所述目标业务数据组对应的预测模型。
[0170]
根据本公开的实施例,第二构建模块还包括检验单元。
[0171]
检验单元,用于在构建得到所述预测模型之后,对所述预测模型进行模型检验,其中,所述模型检验至少包括回归方程的拟合优度检验、回归方程的整体显著性检验和回归系数的显著性检验。
[0172]
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单
元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0173]
例如,获取模块710、第一输出模块720、第二输出模块730和替换模块740中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块710、第一输出模块720、第二输出模块730和替换模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块710、第一输出模块720、第二输出模块730和替换模块740中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0174]
需要说明的是,本公开的实施例中数据处理装置部分与本公开的实施例中数据处理方法部分是相对应的,数据处理装置部分的描述具体参考数据处理方法部分,在此不再赘述。
[0175]
图8示意性示出了根据本公开实施例的适于实现数据处理方法的电子设备的框图。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0176]
如图8所示,根据本公开实施例的计算机电子设备800包括处理器801,其可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0177]
在ram 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、rom 802以及ram 803通过总线804彼此相连。处理器801通过执行rom 802和/或ram 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 802和ram 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0178]
根据本公开的实施例,电子设备800还可以包括输入/输出(i/o)接口805,输入/输出(i/o)接口805也连接至总线804。电子设备800还可以包括连接至i/o接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶显示
器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分808。通信部分808经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
[0179]
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0180]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0181]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0182]
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 802和/或ram 803和/或rom 802和ram 803以外的一个或多个存储器。
[0183]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的数据处理方法。
[0184]
在该计算机程序被处理器801执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0185]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0186]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c ,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备
上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0187]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0188]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献