一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

流式数据采样与模型更新方法、装置、系统与存储介质与流程

2021-10-29 23:14:00 来源:中国专利 TAG:采样 装置 流式 可读 模型

1.本发明涉及机器学习技术领域,尤其涉及流式数据采样与模型更新方法、装置、系统与计算机可读存储介质。


背景技术:

2.目前的phm(prognostic and health management,故障诊断与健康管理)模型多以离线训练与部署为主,因此无法从在线的流式数据中捕捉高价值的数据样本,不具备高效的在线更新的能力,难以做到在线的模型自适应更新,这会导致模型能够维持高性能表现的时间大为缩短,很快就无法发挥实时设备状态检测的作用;因此,如何延长模型维持高性能表现的时间,是急需解决的问题。


技术实现要素:

3.本发明的主要目的在于提出一种流式数据采样与模型更新方法、装置、系统与计算机可读存储介质,旨在解决如何延长初始模型维持高性能表现的时间的问题。
4.为实现上述目的,本发明提供一种流式数据采样与模型更新方法,所述流式数据采样与模型更新方法包括如下步骤:在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新。
5.优选地,根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果的步骤包括:根据所述初始模型中的所述训练样本集合对所述流式数据进行第一重要度测试,得到第一测试结果;根据所述初始模型中的所述训练样本集合对所述流式数据进行第二重要度测试,得到第二测试结果;根据所述第一测试结果和所述第二测试结果,得到重要度测试结果。
6.优选地,根据所述初始模型中的所述训练样本集合对所述流式数据进行第一重要度测试,得到第一测试结果的步骤包括:构建所述训练样本集合对应的非相似度集合,并计算所述非相似度集合的第一均值和第一方差;计算所述流式数据与所述训练样本集合的最小非相似度,并根据所述最小非相似度、所述第一均值和所述第一方差,得到第一测试结果。
7.优选地,根据所述初始模型中的所述训练样本集合对所述流式数据进行第二重要
度测试,得到第二测试结果的步骤包括:计算出所述初始模型对训练样本集合的初始模型预测误差集合,并计算所述初始模型预测误差集合的第二均值和第二方差;将所述流式数据输入所述初始模型,以计算出所述初始模型对所述流式数据的误差值,并根据所述误差值、所述第二均值和所述第二方差,得到第二测试结果。
8.优选地,若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新的步骤之前,所述流式数据采样与模型更新方法还包括:根据所述训练样本集合,确定所述初始模型对应的前验概率分布和似然函数,并根据所述前验概率分布和所述似然函数,得到所述初始模型对应的后验分布。
9.优选地,若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新的步骤包括:若所述重要度测试结果符合预设条件,则将经过所述重要度测试的流式数据代入所述后验分布;对代入流式数据的后验分布进行递归操作,以对所述初始模型进行更新。
10.优选地,若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新的步骤之后,所述流式数据采样与模型更新方法还包括:将所述初始模型替换为更新后的模型,并使得所述更新后的模型在线运行。
11.此外,为实现上述目的,本发明还提供一种流式数据采样与模型更新装置,所述流式数据采样与模型更新装置包括:获取模块,用于在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;测试模块,用于将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;更新模块,用于若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新。
12.进一步地,所述测试模块还用于:根据所述初始模型中的所述训练样本集合对所述流式数据进行第一重要度测试,得到第一测试结果;根据所述初始模型中的所述训练样本集合对所述流式数据进行第二重要度测试,得到第二测试结果;根据所述第一测试结果和所述第二测试结果,得到重要度测试结果。
13.进一步地,所述测试模块还用于:构建所述训练样本集合对应的非相似度集合,并计算所述非相似度集合的第一均值和第一方差;计算所述流式数据与所述训练样本集合的最小非相似度,并根据所述最小非相似度、所述第一均值和所述第一方差,得到第一测试结果。
14.进一步地,所述测试模块还用于:计算出所述初始模型对训练样本集合的初始模型预测误差集合,并计算所述初始模型预测误差集合的第二均值和第二方差;
将所述流式数据输入所述初始模型,以计算出所述初始模型对所述流式数据的误差值,并根据所述误差值、所述第二均值和所述第二方差,得到第二测试结果。
15.进一步地,所述更新模块还用于:根据所述训练样本集合,确定所述初始模型对应的前验概率分布和似然函数,并根据所述前验概率分布和所述似然函数,得到所述初始模型对应的后验分布。
16.进一步地,所述更新模块还用于:若所述重要度测试结果符合预设条件,则将经过所述重要度测试的流式数据代入所述后验分布;对代入流式数据的后验分布进行递归操作,以对所述初始模型进行更新。
17.进一步地,所述更新模块还用于:将所述初始模型替换为更新后的模型,并使得所述更新后的模型在线运行。
18.此外,为实现上述目的,本发明还提供一种流式数据采样与模型更新系统,所述流式数据采样与模型更新系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的流式数据采样与模型更新程序,所述流式数据采样与模型更新程序被所述处理器执行时实现如上所述的流式数据采样与模型更新方法的步骤。
19.此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有流式数据采样与模型更新程序,所述流式数据采样与模型更新程序被处理器执行时实现如上所述的流式数据采样与模型更新方法的步骤。
20.本发明提出的流式数据高效采样与模型在线更新,在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;若所述重要度测试结果符合预设条件,则根据所述流式数据,对初始模型进行更新。本发明根据训练样本集合对流式数据进行重要度测试,若重要性测试结果符合预设条件,则根据流式数据对初始模型进行更新,使得模型能够自适应更新,以延长模型维持高性能表现的时间。
附图说明
21.图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;图2为本发明流式数据采样与模型更新方法第一实施例的流程示意图。
22.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
23.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
24.如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
25.本发明实施例设备可以是pc机或服务器设备。
26.如图1所示,该设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接
口、无线接口(如wi

fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
27.本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
28.如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及流式数据采样与模型更新程序。
29.其中,操作系统是管理和控制流式数据高效采样、模型在线更新与软件资源的程序,支持网络通信模块、用户接口模块、流式数据采样与模型更新程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
30.在图1所示的智能制造设备中,所述智能制造设备通过处理器1001调用存储器1005中存储的流式数据采样与模型更新程序,并执行下述流式数据采样与模型更新方法各个实施例中的操作。
31.基于上述硬件结构,提出本发明流式数据采样与模型更新方法实施例。
32.参照图2,图2为本发明流式数据采样与模型更新方法第一实施例的流程示意图,所述方法包括:步骤s10,在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;步骤s20,将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;步骤s30,若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新。
33.本实施例流式数据采样与模型更新方法包括对流式数据进行重要度测试和模型更新,该数据处理方法运用智能制造设备的故障诊断与预测性维护(phm)系统中,该智能制造设备可以是终端、pc设备或生产制造设备,phm系统全生命周期包含了phm目标定义、离线初始模型训练、初始模型部署运维、与在线推理与模型更新4个主要模块;为描述方便,以生产制造设备为例进行描述;生产制造设备中的phm目标定义已完成,根据目标需求收集训练样本集合并进行了数据驱动的初始模型训练,得到初始模型,初始模型评估达到要求,经过初始模型部署运维阶段,该初始模型得以部署并实现在线运行,并且生产制造设备处于动态生产制造的过程中,在此基础上,在初始模型在线运行时,流式数据采样与模型更新系统从生产制造设备及环境中获取流式数据,该初始模型是基于训练样本集合训练得到的,将流式数据输入所述初始模型,并根据初始模型中的训练样本集合对流式数据进行重要度测试,重要度测试包括第一重要度测试和第二重要度测试,通过对流式数据进行第一重要度测试得到第一测试结果,通过对流式数据进行第二重要度测试得到第二测试结果,并根据第一测试结果和第二测试结果得到重要度测试结果;若判断得到重要度测试结果符合预设条件,则根据通过重要度测试的流式数据,对初始模型进行更新。需要说明的是,流式数据采样与模型更新系统从生产制造设备及环境获取的流式数据可以是单个数据,也可以是流式数据集合,流式数据是生产制造设备在生产制造过程中被采集到的数据;训练样本集合
是初始模型训练阶段的数据集合;预设条件是由相关研发人员在流式数据采样与模型更新系统装置中提前设定的,只有在重要度测试结果符合预设条件时,才对初始模型进行更新;初始模型可为数据驱动模型。
34.本实施例的流式数据采样与模型更新方法,在初始模型在线运行时,获取流式数据,初始模型是基于训练样本集合训练得到的;将流式数据输入初始模型,并根据初始模型中的训练样本集合对流式数据进行重要度测试,得到重要度测试结果;若重要度测试结果符合预设条件,则根据流式数据,对初始模型进行更新。本发明根据训练样本集合对流式数据进行重要度测试,若重要性测试结果符合预设条件,则根据流式数据对初始模型进行更新,使得模型能够自适应更新,以延长模型维持高性能表现的时间。
35.以下将对各个步骤进行详细说明:步骤s10,在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;在本实施例中,流式数据采样与模型更新系统根据目标需求收集训练样本集合,并进行了数据驱动的初始模型训练,得到初始模型,并且初始模型评估达到要求,初始模型经过初始模型部署运维阶段,并实现在线运行,流式数据采样与模型更新系统在初始模型在线运行时,实时获取生产制造设备以及环境中的流式数据。
36.步骤s20,将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;在本实施例中,流式数据采样与模型更新系统获取流式数据后,将流式数据输入初始模型,并根据初始模型中的训练样本集合分别对流式数据进行第一重要度测试和第二重要度测试,以完成对流式数据的重要度测试,并根据第一重要度测试得到的第一测试结果和第二重要度测试得到的第二测试结果,确定重要度测试结果。
37.具体地,步骤s20还包括:步骤a,根据所述初始模型中的所述训练样本集合对所述流式数据进行第一重要度测试,得到第一测试结果;在该步骤中,流式数据采样与模型更新系统获取到流式数据后,根据初始模型中的训练样本集合构建出训练样本集合对应的非相似度集合,并根据非相似度集合对流式数据进行第一重要度测试,得到第一测试结果,在一实施例中,流式数据采样与模型更新系统获取的流式数据为单个数据时,先构建出训练样本集合对应的非相似度集合,再计算出非相似度集合对应的第一均值和第一方差,计算出流式数据与训练原本集合的非相似度,根据流式数据与训练样本集合的非相似度以及非相似度集合对应的第一均值和第一方差得到第一测试结果;在另一实施例中,流式数据采样与模型更新系统获取的流式数据为多个数据,即流式数据集合时,在计算出流式数据与训练原本集合的非相似度时,需要计算流式数据集合中每个数据与训练样本集合的非相似度,并分别根据每个非相似度与非相似度集合对应的第一均值和第一方差得到第一测试结果集合。需要说明的是,第一重要度测试为数据重建重要度测试,通过分析流式数据对于训练样本集合的非相似度,以判断是否将流式数据用于初始模型的更新。
38.进一步地,步骤a包括:构建所述训练样本集合对应的非相似度集合,并计算所述非相似度集合的第一均
值和第一方差;在该步骤中,流式数据采样与模型更新系统随机根据训练样本集合中的训练样本数据,计算出每个训练样本数据与其它训练样本数据的非相似度,以构建训练样本集合对应的非相似度集合,并计算出非相似度集合对应的第一均值和第一方差;如:对于训练样本集合内的任意样本x
i
,x
j
(i≠j),定义非相似度为:其中,d
i,j
指任意样本x
i
,x
j
(i≠j)的非相似度,p为正整数,典型的,p取1或者2,计算出训练样本集合中每个训练样本数据与其它训练样本数据的非相似度后,构建非相似度集合d={d
i,j
,1≤i<j},再计算出非相似度集合对应的第一均值mean(d)和第一方差var(d)。
39.计算所述流式数据与所述训练样本集合的最小非相似度,并根据所述最小非相似度、所述第一均值和所述第一方差,得到第一测试结果。
40.在该步骤中,流式数据采样与模型更新系统计算流式数据与训练样本集合中的每个训练样本数据的非相似度,并确定的最小非相似度,并根据最小非相似度、第一均值和第一方差,得到第一测试结果;在一实施例中,流式数据采样与模型更新系统获取的流式数据为单个数据x
t
时,计算流式数据x
t
与训练样本集合中每个训练样本数据的非相似度:其中,d
t,i
指x
t
与训练样本集合中任意样本x
i
的非相似度,p为正整数,典型的,p取1或者2,流式数据采样与模型更新系统计算出流式数据与训练样本集合中每个训练样本数据的非相似度后,确定其中的最小非相似度min(d
t,i
),并结合第一均值mean(d)和第一方差var(d),得到第一测试结果:其中,当最小非相似度min(d
t,i
)大于或等于第一均值mean(d)与三倍第一方差3var(d)的和时,第一测试结果为1,其他情况下第一测试结果为0。
41.在另一实施例中,流式数据采样与模型更新系统获取的流式数据为多个数据,即流式数据集合时,在计算出流式数据与训练原本集合的非相似度时,需要计算流式数据集合中每个流式数据与训练样本集合的非相似度,并分别根据每个流式数据对应的最小非相似度与非相似度集合对应的第一均值和三倍第一方差得到第一测试结果集合。
42.步骤b,根据所述初始模型中的所述训练样本集合对所述流式数据进行第二重要度测试,得到第二测试结果;在该步骤中,流式数据采样与模型更新系统根据初始模型对训练样本集合的预测值以及贝叶斯概率模型对训练样本集合的测量值,确定初始模型对训练样本集合的预测误差集合,计算出初始模型预测误差集合对应的第二均值和第二方差;流式数据采样与模型更新系统根据初始模型对流式数据的预测值以及贝叶斯概率模型对流式数据的测量值,确定初始模型对流式数据的误差值,并根据第二均值、第二方差和初始模型对流式数据的误
差值进行第二重要度测试,得到第二测试结果;在一实施例中,流式数据采样与模型更新系统获取的流式数据为单个数据时,先根据初始模型对训练样本集合的预测值以及贝叶斯概率模型对训练样本集合的测量值,确定初始模型预测误差集合,再计算出初始模型预测误差集合对应的第二均值和第二方差,根据初始模型对流式数据的预测值以及贝叶斯概率模型对流式数据测量值,确定初始模型对流式数据的误差值,根据初始模型对流式数据的误差值以及预测误差集合对应的第二均值和第二方差得到第二测试结果;在另一实施例中,流式数据采样与模型更新系统获取的流式数据为多个数据,即流式数据集合时,在计算出初始模型对流式数据的误差值时,需要计算初始模型对流式数据集合中每个数据的误差值,并分别根据初始模型对流式数据集合中每个数据的误差值与预测误差集合对应的第二均值和第二方差得到第二测试结果集合。需要说明的是,第二重要度测试为初始模型重建重要度测试,通过分析初始模型对流式数据的误差值,以判断是否将流式数据用于初始模型的更新。
43.进一步地,步骤b包括:计算出所述初始模型对训练样本集合的初始模型预测误差集合,并计算所述初始模型预测误差集合的第二均值和第二方差;在该步骤中,流式数据采样与模型更新系统计算出初始模型对训练样本集合的初始模型预测误差集合,并计算初始模型预测误差集合的第二均值和第二方差;在一实施例中,流式数据采样与模型更新系统将训练样本集合内的任意样本x
i
输入初始模型,都能计算出初始模型对任意样本x
i
的预测值,流式数据采样与模型更新系统通过贝叶斯概率模型对训练样本集合内的任意样本x
i
进行测量,都能得到测量值y
i
,因此,初始模型对训练样本集合内的任意样本x
i
都有预测误差为,将初始模型对训练样本集合中的每个样本数据的预测误差都计算完毕后,构建初始模型预测误差集合,再计算出初始模型预测误差集合e对应的第二均值和第二方差。
44.将所述流式数据输入所述初始模型,以计算出所述初始模型对所述流式数据的误差值,并根据所述误差值、所述第二均值和所述第二方差,得到第二测试结果。
45.在该步骤中,流式数据采样与模型更新系统将流式数据输入初始模型,计算出初始模型对流式数据的预测值,流式数据采样与模型更新系统通过贝叶斯概率模型对流式数据测量,得到测量值,并根据预测值和测量值计算出初始模型对流式数据的误差值,再根据初始模型对流式数据的误差值、初始模型预测误差集合的第二均值和第二方差,得到第二测试结果;在一实施例中,流式数据采样与模型更新系统获取的流式数据为单个数据时,对于当前时刻t的流式数据x
t
,流式数据采样与模型更新系统将流式数据x
t
输入初始模型,得到预测值,并通过贝叶斯概率模型对流式数据x
t
进行测量,得到测量值y
t
初始模型对流式数据x
t
误差值为,流式数据采样与模型更新系统根据初始模型对流式数据x
t
误差值、第二均值mean(e)和三倍第二方差3var(e),得到第二测试结果:其中,当误差值大于或等于第二均值mean(e)和三倍第二方差3var(e),第二测试结果为1,其他情况下第二测试结果为0。
46.在另一实施例中,流式数据采样与模型更新系统获取的流式数据为多个数据,即流式数据集合时,在计算出初始模型对流式数据的误差值时,需要计算初始模型对流式数据集合中每个数据的误差值,并分别根据初始模型对流式数据集合中每个数据的误差值与预测误差集合对应的第二均值和三倍第二方差得到第二测试结果集合。
47.步骤c,根据所述第一测试结果和所述第二测试结果,得到重要度测试结果。
48.在该步骤中,流式数据采样与模型更新系统根据第一测试结果和第二测试结果,得到重要度测试结果;在一实施例中,流式数据采样与模型更新系统获取的流式数据为单个数据,并得到第一测试结果为,得到第二测试结果为,对于重要度测试结果有如下规则:其中,当流式数据采样与模型更新系统得到第一测试结果为1和第二测试结果为1,以及第一测试结果为1或第二测试结果为1的情况下,则重要度测试结果为1,此时流式数据采样与模型更新系统获取的流式数据通过重要度测试,可用于后续更新初始模型的步骤,当流式数据采样与模型更新系统得到第一测试结果和第二测试结果为其他情况,则重要度测试结果为0,此时流式数据采样与模型更新系统获取的流式数据不通过重要度测试,不可用于后续更新初始模型的步骤。
49.步骤s30,若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新。
50.在本实施例中,流式数据采样与模型更新系统得到重要度测试结果,并将重要度结果与预设条件进行对比,若重要度测试结果不符合预设条件,则对应的流式数据不通过重要度测试,初始模型不需要进行更新,若重要度测试结果符合预设条件,则根据流式数据对初始模型进行更新;如:当流式数据采样与模型更新系统得到第一测试结果为1和第二测试结果为1,以及第一测试结果为1或第二测试结果为1的情况下,则重要度测试结果为1,符合预设条件,此时流式数据采样与模型更新系统获取的流式数据通过重要度测试,根据流式数据对初始模型进行更新,当流式数据采样与模型更新系统得到第一测试结果为0和第二测试结果为0,则重要度测试结果为0,不符合预设条件,此时流式数据采样与模型更新系统获取的流式数据不通过重要度测试,初始模型不需要进行更新。
51.具体地,在步骤s30之前包括:步骤d,根据所述训练样本集合,确定所述初始模型对应的前验概率分布和似然函数,并根据所述前验概率分布和所述似然函数,得到所述初始模型对应的后验分布。
52.在该步骤中,流式数据采样与模型更新系统根据训练样本集合,确定初始模型对应的前验概率分布和似然函数,并根据前验概率分布和似然函数,得到初始模型对应的后验分布,在一实施例中,流式数据采样与模型更新系统根据训练样本集合,确定初始模型初始模型有贝叶斯回归形式:,其中,y
t
为训练样本集合中的每个样本数据通过贝叶斯概率模型后得出的值,为初始模型对应的计算函数,其中θ为初始
模型中的计算参数,x
t
为训练样本集合中的任意一个样本数据,为期望为0,方差为的正态分布,基于训练样本集合以及初始模型对应的贝叶斯回归形式,确定为参数前验概率分布,为似然函数,因此初始模型的后验分布可分解为:其中,为参数前验概率分布,为似然函数,θ为初始模型中的计算参数,为正态分布的标准差,x
i
为训练样本集合中的任意一个样本数据,y
i
为训练样本集合中的每个样本数据x
i
通过贝叶斯概率模型后得出的值。
53.具体地,在步骤s30包括:步骤e,若所述重要度测试结果符合预设条件,则将经过所述重要度测试的流式数据代入所述后验分布;在该步骤中,流式数据采样与模型更新系统得到重要度测试结果,并将重要度结果与预设条件进行对比,若重要度测试结果符合预设条件,则将经过重要度测试的流式数据代入后验分布中。
54.步骤f,对代入流式数据的后验分布进行递归操作,以对所述初始模型进行更新。
55.在该步骤中,流式数据采样与模型更新系统对代入经过重要度测试的流式数据的后验分布进行递归操作,以对初始模型进行更新,在一实施例中,通过重要度测试的流式数据为单个数据x
t
,流式数据采样与模型更新系统将流式数据x
t
代入后验分布后,对后验分布进行递归操作:其中,,通过对比,经过递归操作后的后验分布可分解出流式数据x
t
对应的概率分布为,该概率分布与后验分布未代入流式数据x
t
时的分布具有关联性,因此通过将流式数据x
t
代入后验分布,可对初始模型进行更新,得到更新后的模型,使得初始模型能够自适应更新,以延长初始模型维持高性能表现的时间。
56.本实施例的流式数据采样与模型更新系统在初始模型在线运行时,获取流式数据,该初始模型是基于训练样本集合训练得到的,将流式数据输入所述初始模型,并根据初始模型中的训练样本集合对流式数据进行重要度测试,重要度测试包括第一重要度测试和第二重要度测试,通过对流式数据进行第一重要度测试得到第一测试结果,通过对流式数据进行第二重要度测试得到第二测试结果,并根据第一测试结果和第二测试结果得到重要度测试结果;流式数据采样与模型更新系统若判断得到重要度测试结果符合预设条件,则根据通过重要度测试的流式数据,对初始模型进行更新,使得模型能够自适应更新,以延长模型维持高性能表现的时间。
57.进一步地,基于本发明流式数据采样与模型更新方法第一实施例,提出本发明流式数据采样与模型更新方法第二实施例。
58.流式数据采样与模型更新方法的第二实施例与流式数据采样与模型更新方法的第一实施例的区别在于,在步骤s20之后,流式数据采样与模型更新方法还包括:步骤g,将所述初始模型替换为更新后的模型,并使得所述更新后的模型在线运行。
59.在本实施例中,流式数据采样与模型更新系统在对初始模型完成更新后,将更新前的初始模型替换为更新后的模型,并利用更新后的模型进行对智能制造设备的故障诊断与预测性维护,同时使得更新后的模型在线运行,获取流式数据,并将通过重要度测试结果符合预设条件的流式数据继续对模型进行更新,以达到延长模型维持高性能表现的时间的目的。
60.本发明还提供一种流式数据采样与模型更新装置。本发明流式数据采样与模型更新装置包括:获取模块,用于在初始模型在线运行时,获取流式数据,所述初始模型是基于训练样本集合训练得到的;测试模块,用于将所述流式数据输入所述初始模型,并根据所述初始模型中的所述训练样本集合对所述流式数据进行重要度测试,得到重要度测试结果;更新模块,用于若所述重要度测试结果符合预设条件,则根据所述流式数据,对所述初始模型进行更新。
61.进一步地,所述测试模块还用于:根据所述初始模型中的所述训练样本集合对所述流式数据进行第一重要度测试,得到第一测试结果;根据所述初始模型中的所述训练样本集合对所述流式数据进行第二重要度测试,得到第二测试结果;根据所述第一测试结果和所述第二测试结果,得到重要度测试结果。
62.进一步地,所述测试模块还用于:构建所述训练样本集合对应的非相似度集合,并计算所述非相似度集合的第一均值和第一方差;计算所述流式数据与所述训练样本集合的最小非相似度,并根据所述最小非相似度、所述第一均值和所述第一方差,得到第一测试结果。
63.进一步地,所述测试模块还用于:计算出所述初始模型对训练样本集合的初始模型预测误差集合,并计算所述初始模型预测误差集合的第二均值和第二方差;将所述流式数据输入所述初始模型,以计算出所述初始模型对所述流式数据的误差值,并根据所述误差值、所述第二均值和所述第二方差,得到第二测试结果。
64.进一步地,所述更新模块还用于:根据所述训练样本集合,确定所述初始模型对应的前验概率分布和似然函数,并根据所述前验概率分布和所述似然函数,得到所述初始模型对应的后验分布。
65.进一步地,所述更新模块还用于:
若所述重要度测试结果符合预设条件,则将经过所述重要度测试的流式数据代入所述后验分布;对代入流式数据的后验分布进行递归操作,以对所述初始模型进行更新。
66.进一步地,所述更新模块还用于:将所述初始模型替换为更新后的模型,并使得所述更新后的模型在线运行。
67.本发明还提供一种流式数据采样与模型更新系统。
68.流式数据采样与模型更新系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的流式数据采样与模型更新程序,所述流式数据采样与模型更新程序被所述处理器执行时实现如上所述的数据流式数据高效采样与模型在线更新的步骤。
69.其中,在所述处理器上运行的流式数据采样与模型更新程序被执行时所实现的方法可参照本发明数据流式数据采样与模型更新方法各个实施例,此处不再赘述。
70.本发明还提供一种计算机可读存储介质。
71.计算机可读存储介质上存储有流式数据采样与模型更新程序,所述流式数据采样与模型更新程序被处理器执行时实现如上所述的流式数据高效采样与模型在线更新的步骤。
72.其中,在所述处理器上运行的流式数据采样与模型更新程序被执行时所实现的方法可参照本发明流式数据采样与模型更新方法各个实施例,此处不再赘述。
73.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本技术不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
74.应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在
……
时"或"当
……
时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本技术使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的,或意味着任一个或任何组合。例如,“包括以下至少一个:a、b、c”意味着“以下任一个:a;b;c;a和b;a和c;b和c;a和b和c”,再如,“a、b或c”或者“a、b和/或c”意味着“以下任一个:a;b;c;a和b;a和c;b和c;a和b和c”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
75.应该理解的是,虽然本技术实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部
分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
76.取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
77.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
78.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
79.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
80.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜