一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于模型训练的数据预测方法及装置与流程

2022-02-20 12:55:18 来源:中国专利 TAG:


1.本发明涉及数据分析技术领域,尤其涉及一种基于模型训练的数据预测方法及装置。


背景技术:

2.随着大数据时代的快速发展,大数据分析在企业发展中起到重要作用,通过高效的大数据分析进行数据预测,企业不仅能够进一步了解用户的个性化需求,为用户提供个性化信息推送,从而实现产品的优化发展,还能够在风险来临之前作出相应的应对策略,从而提升整个企业的安全生产。
3.当前,传统的数据分析一般只能针对线性相关或者函数相关的数据进行准确预测分析,方法单一且具有局限性。在面对企业发展中处于动态变化的海量数据中,传统的数据分析往往不能满足其动态的分析需求,从而造成在对用户未来需求进行预测时准确率下降,使得企业损失利益。可见,在大数据分析中,如何实现高准确率的数据预测尤为重要。


技术实现要素:

4.本发明所要解决的技术问题在于,提供一种基于模型训练的数据预测的方法及装置,能够跨系统地通过模型训练对大量的静态模式以及动态模式的数据进行数据预测,并将数据预测结果进行可视化的展示,可以更加直观地评估数据预测结果,有利于提高预测数据时的准确率。
5.为了解决上述技术问题,本发明第一方面公开了一种基于模型训练的数据预测方法,所述方法包括:
6.所述数据分析系统接收与所述数据分析系统建立通讯连接的数据端发送的第一数据集的信息;所述第一数据集的信息是由所述数据端对基础数据进行第一数据筛选操作后发送的,所述第一数据集包括预设数量的数据,所述第一数据集的信息包括所有所述第一数据的信息,所述第一数据集的信息的模式是静态的模式和/或动态的模式;
7.所述数据分析系统对所述第一数据集进行第一数据预处理操作,得到所述第一数据集的预处理结果;
8.所述数据分析系统根据所述第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据所述算法配置对所述训练模型执行训练操作,得到数据预测模型。
9.作为一种可选的实施方式,在本发明第一方面中,所述第一数据集的信息包括所有所述第一数据的来源信息、所有所述第一数据的编程语言类型、所有所述第一数据的名称信息以及所有所述第一数据的数据类型中的至少一种,每个所述第一数据的名称信息包括中文名称和/或英文名称。
10.作为一种可选的实施方式,在本发明第一方面中,在所述数据分析系统根据所述第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据所述算法配置对所述训练模型执行训练操作,得到数据预测模型之后,所述方法还包括:
11.所述数据分析系统检测是否接收到所述数据端发送的预测数据指令;所述预测数据指令用于请求所述数据分析系统对第二数据集进行预测,所述第二数据集是由所述数据端对基础数据进行第二数据筛选操作后发送的;
12.当检测出接收到预测数据指令时,所述数据分析系统对所述第二数据集进行第二数据预处理操作,并得到所述第二数据集的预处理结果;
13.所述数据分析系统将所述第二数据集的预处理结果输入到所述数据预测模型,并对所述第二数据集的预处理结果执行数据反写操作,得到所述数据预测模型的预测结果作为所述第二数据集的预测结果;
14.以及,所述方法还包括:
15.所述数据分析系统对所述数据预测模型执行评估操作,得到所述数据预测模型的评估信息。
16.作为一种可选的实施方式,在本发明第一方面中,在所述数据分析系统对所述数据预测模型执行评估操作,得到所述数据预测模型的评估信息之后,所述方法还包括:
17.所述数据分析系统检测是否接收到所述数据端发送的针对所述评估信息的查看指令;
18.当检测出接收到针对所述评估信息的查看指令时,所述数据分析系统发送所述评估信息至所述数据端。
19.作为一种可选的实施方式,在本发明第一方面中,所述评估信息包括所述数据预测模型的准确率、所述数据预测模型的召回率、所述数据预测模型的相关性系数、所述数据预测模型的显著性检验值、所述数据预测模型的方差比率检验值中的至少一种。
20.作为一种可选的实施方式,在本发明第一方面中,在所述数据分析系统将所述第二数据集的预处理结果输入到所述数据预测模型执行预测操作,得到所述数据预测模型的预测结果作为所述第二数据集的预测结果之后,所述方法还包括:
21.所述数据分析系统将所述预测结果发送至所述数据端,以触发所述数据端执行相匹配的操作。
22.作为一种可选的实施方式,在本发明第一方面中,所述数据分析系统将所述预测结果发送到所述数据端,以触发所述数据端执行相匹配的操作,包括:
23.由所述数据端将所述预测结果存储至相匹配的存储位置;所述相匹配的存储位置包括内存、文件以及数据库中的至少一种;
24.和/或,
25.由所述数据端根据所述预测结果,对所述预测结果进行设计器的配置,得到所述预测结果的展示图表;所述预测结果的展示图表为静态的结果展示图表和/或动态的结果展示图表。
26.本发明第二方面公开了一种基于模型训练的数据预测装置,所述装置包括:
27.数据接收模块,用于接收与所述数据分析系统建立通讯连接的数据端发送的第一数据集的信息;所述第一数据集的信息是由所述数据端对基础数据进行第一数据筛选操作后发送的,所述第一数据集包括预设数量的数据,所述第一数据集的信息包括所有所述第一数据的信息,所述第一数据集的信息的模式是静态的模式和/或动态的模式;
28.数据预处理模块,用于对所述第一数据集进行第一数据预处理操作,得到所述第
一数据集的预处理结果;
29.模型训练模块,用于根据所述第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据所述算法配置对所述训练模型执行训练操作,得到数据预测模型。
30.作为一种可选的实施方式,在本发明第二方面中,所述第一数据集的信息包括所有所述第一数据的来源信息、所有所述第一数据的编程语言类型、所有所述第一数据的名称信息以及所有所述第一数据的数据类型中的至少一种,每个所述第一数据的名称信息包括中文名称和/或英文名称。
31.作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
32.第一检测模块,用于在所述模型训练模块根据所述第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据所述算法配置对所述训练模型执行训练操作,得到数据预测模型之后,检测是否接收到所述数据端发送的预测数据指令;所述预测数据指令用于请求所述数据分析系统对第二数据集进行预测,所述第二数据集是由所述数据端对基础数据进行第二数据筛选操作后发送的;
33.所述数据预处理模块,还用于当所述第一检测模块检测出接收到预测数据指令时,对所述第二数据集进行第二数据预处理操作,并得到所述第二数据集的预处理结果;
34.数据预测模块,用于将所述第二数据集的预处理结果输入到所述数据预测模型,并对所述第二数据集的预处理结果执行数据反写操作,得到所述数据预测模型的预测结果作为所述第二数据集的预测结果;
35.以及,所述装置还包括:
36.模型评估模块,用于对所述数据预测模型执行评估操作,得到所述数据预测模型的评估信息。
37.作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
38.第二检测模块,用于在所述模型评估模块对所述数据预测模型执行评估操作,得到所述数据预测模型的评估信息之后,检测是否接收到所述数据端发送的针对所述评估信息的查看指令;
39.评估信息发送模块,用于当所述第二检测模块检测出接收到针对所述评估信息的查看指令时,发送所述评估信息至所述数据端。
40.作为一种可选的实施方式,在本发明第二方面中,所述评估信息包括所述数据预测模型的准确率、所述数据预测模型的召回率、所述数据预测模型的相关性系数、所述数据预测模型的显著性检验值、所述数据预测模型的方差比率检验值中的至少一种。
41.作为一种可选的实施方式,在本发明第二方面中,所述装置还包括:
42.预测结果发送装置,用于在所述数据预测模块将所述第二数据集的预处理结果输入到所述数据预测模型执行预测操作,得到所述数据预测模型的预测结果作为所述第二数据集的预测结果之后,将所述预测结果发送至所述数据端,以触发所述数据端执行相匹配的操作。
43.作为一种可选的实施方式,在本发明第二方面中,所述预测结果发送模块将所述预测结果发送到所述数据端,以触发所述数据端执行相匹配的操作的方式具体为:
44.由所述数据端将所述预测结果存储至相匹配的存储位置;所述相匹配的存储位置包括内存、文件以及数据库中的至少一种;
45.和/或,
46.由所述数据端根据所述预测结果,对所述预测结果进行设计器的配置,得到所述预测结果的展示图表;所述预测结果的展示图表为静态的结果展示图表和/或动态的结果展示图表。
47.本发明第三方面公开了另一种基于模型训练的数据预测装置,所述装置包括:
48.存储有可执行程序代码的存储器;
49.与所述存储器耦合的处理器;
50.所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于模型训练的数据预测方法。
51.本发明第四方面公开了一种计算机可存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于模型训练的数据预测方法。
52.与现有技术相比,本发明实施例具有以下有益效果:
53.本发明实施例中,跨系统地通过模型训练对大量的静态模式以及动态模式的数据进行数据预测,并将数据预测结果进行可视化的展示。这样,在面对企业发展中处于动态变化的海量数据时,也能满足企业数据的动态分析需求,从而准确地推测出用户的未来需求变化。可见,实施本发明能够对动态数据作出准确的数据预测分析,且能够直观地对数据预测结果进行评估,有利于提升数据预测分析的可靠性。
附图说明
54.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
55.图1是本发明实施例公开的一种基于模型训练的数据预测方法的流程示意图;
56.图2是本发明实施例公开的另一种基于模型训练的数据预测方法的流程示意图;
57.图3是本发明实施例公开的一种基于模型训练的数据预测装置的结构示意图;
58.图4是本发明实施例公开的另一种基于模型训练的数据预测装置的结构示意图;
59.图5是本发明实施例公开的又一种基于模型训练的数据预测装置的结构示意图。
具体实施方式
60.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
61.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括
对于这些过程、方法、产品或端固有的其他步骤或单元。
62.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
63.本发明公开了一种基于模型训练的数据预测方法及装置,能够跨系统地通过模型训练对大量的静态模式以及动态模式的数据进行数据预测,并将数据预测结果进行可视化的展示,可以更加直观地评估数据预测结果,有利于提高数据预测的准确率。以下分别进行详细说明。
64.实施例一
65.请参阅图1,图1是本发明实施例公开的一种基于模型训练的数据预测方法的流程示意图。其中,图1所描述的基于模型训练的数据预测方法可以应用于企业中不同的业务领域,可以是互联网、电子商务、金融保险、生物医疗、生产制造、餐饮外卖、体育娱乐、交通物流等中的至少一种。具体的,可以应用于企业的战略规划部门中的战略规划,也可以应用在企业的市场营销部门调研用户对企业产品的积极性。(如:采集客户信息和相应的购买商品信息,分析当前客户针对待预估商品的偏好值)。可选的,该数据分析可以是企业运营管理流程数据分析、任务管理及计划管理数据分析、组织效率数据分析、流程优化及价值产出数据分析、行业研究数据分析、产品测试数据分析、渠道数据分析、价格与销售量预测数据分析、项目管理数据分析、工程管理数据分析、建立整个组织运营指标系统、营销费用控制数据分析、广告效果评价数据分析、口碑与舆情监测数据分析以及媒体费用优化分析中的至少一种,本发明例不做限定。具体的,该方法可以由数据分析装置实现,进一步可选的,该数据分析装置可以集成在数据分析设备,也可以是用于对数据分析流程进行管理的本地服务器或云端服务器等,本发明例不做限定。如图1所示,该基于模型训练的数据预测方法可以包括以下操作:
66.101、数据分析系统接收与数据分析系统建立通讯连接的数据端发送的第一数据集的信息。
67.本发明实施例中,数据分析系统与数据端建立通讯连接,再接收数据端中数据库采集的数据集的信息,即数据分析系统可以对数据端进行配置以及数据端管理,从而从数据端的数据库中接收数据集的信息。可选的,数据分析系统可以直接存储数据端发送的数据库中的数据集的信息,以便后续分析操作时数据的调用。进一步可选的,数据端中的数据库可以是使用传统的关系型数据库,即采用已经对字段定义好的表格方式进行存储,其中的数据则以行和列的方式再存储到表格中,其中的数据模式是静态的;数据端中的数据库也可以是非关系型数据库,即是所存储的数据结构是不规则、不完整或没有预定义的,如存储文档、各类报表、图像信息等,其中的数据模式是动态的,且会对数据集的信息进行实时更新。这样,该数据分析系统在数据采集时,即可以导入大量静态模式的数据,也可以抓取大量动态的数据,以供后续步骤中的数据挖掘与各种数据分析进行加工处理。基于以上的数据端中数据库数据的存储模式,数据分析系统可以接收到静态模式的数据集的信息,也可以接收到动态模式的数据集的信息。
68.进一步的,第一数据集的信息是由数据端对基础数据进行第一数据筛选操作后发
送的。可选的,第一数据集的信息可以包括数据的来源信息、数据的编程语言类型、数据的名称信息以及数据的数据类型中的至少一种。具体的,数据的来源信息可以是数据端中各个数据库的连接信息,数据名称信息可以是中文名称,也可以英文名称,数据的编程语言类型可以是数据的结构化查询语言信息以及数据的非结构化查询语言信息,其中,数据的结构化查询语言信息可以是数据更新、数据插入、数据删除以及数据选择中的至少一种,数据的非结构化查询语言信息也可以是数据更新、数据插入、数据删除以及数据选择中的至少一种,而数据的数据类型可以是整数型、浮点型、字符型以及布尔型中的至少一种。这样,针对企业中结构化以及非结构化的数据集的信息,可以按业务分类构建企业数据集以及建立各业务数据集,统一主数据标准,为数据集的信息的应用统一数据源及数据标准。
69.又进一步的,第一数据筛选操作可以是通过数据抽取实现,也可以通过数据清理实现。具体的,数据抽取即可以把不同数据源中的数据按照数据库的数据格式转入到数据库中,或者先将数据库中的数据文件转化为指定格式的文本文件,再将转化好的数据库文件导入到指定数据库中,抽取出需要的数据,而数据清理可以处理缺失数据、重复数据以及异常数据,清除冗余数据以及区别性大的数据,最后将数据加载到数据库中。需要说明的是,将数据加载到数据库中可以是根据数据量、系统资源以及数据的实时性要求,选择增量加载,即目标表仅更新源表变化的数据,也可以根据简单需求选择全量加载,即全表删除后再进行数据加载。这样,筛选出来的数据可以提高数据库收集存储历史数据的可用性,有利于提高后期数据进行预测分析时的准确性。
70.又进一步的,基础数据包括但不限于企业的财务数据、资产数据、销售数据、企业自身数据、企业作为市场主体所处的市场信息数据、公共政策信息数据、行业准则数据、专家经验数据、在线操作日志数据、内部控制流程数据以及仓储数据等。进一步可选的,基础数据的数据形式可以是表格形式、键值对形式、文档形式、图片形式、音频形式以及视频形式中的至少一种,本发明实施例不做限定。这样,该基于模型训练的数据预测方法可以渗透到各个企业以及各个流程,可以适应实际企业生产服务过程中需求的变化,从而准确地预测出用户未来需求。
71.102、数据分析系统对第一数据集进行第一数据预处理操作,得到第一数据集的预处理结果。
72.本发明实施例中,在第一数据集的信息经过数据端的数据筛选操作后,发送到数据分析系统,该数据分析系统可以对第一数据集的信息进行第一数据集的预处理操作,直接得到第一数据集的信息的预处理结果,以便数据集的信息的预处理结果在计算机里顺利运行。可选的,该第一数据预处理操作可以是但不限于数据清理、数据集成、数据变换以及数据规约。具体的,数据清理可以通过填写数据缺失的值、光滑噪声数据、识别或删除离群点清理数据,将数据格式标准化以及清除异常和重复数据来实现;数据集成可以将数据源的数据结合起来并统一储存;数据变换可以通过平滑聚集、概化、规范化等方式转换数据形式;数据规约则可以通过数据筛选和数据降维实现。需要说明的是,第一数据集的信息经过预处理后,数据分析系统所得到的预处理结果可以与处理前的第一数据集的信息保持准确性、完整性、一致性以及时效性。这样,第一数据集的信息经过预处理后,数据分析系统可以得到标准的、连续的预处理结果,提高后续数据预测结果的准确性以及缩短计算过程。
73.103、数据分析系统根据第一数据集的预处理结果,对预先确定出的训练模型进行
算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型。
74.本发明实施例中,数据分析系统根据第一数据集的预处理结果以及确定出的用于训练模型训练的算法配置,对训练模型执行训练操作,可直接得到数据预测模型。可选的,该训练模型的训练操作可以是对无监督学习模型进行训练,也可以是对半监督学习模型进行训练,还可以是对监督学习模型进行训练。进一步的,用于训练模型训练操作的算法配置可以是算法类型,也可以是算法中的参数,还可以是用于算法运算时的因变量以及自变量。又进一步的,算法类型可以是kmeans聚类算法、决策树算法、逻辑回归算法、线性回归算法、可用于基于用户推荐的算法、可用于知识图谱的算法中的至少一种。具体的,kmeans聚类算法通常应用在从随机分布的事物集合中将相同事物进行分组;线性回归算法则通常应用在根据已知的变量(自变量)来预测某个连续的数值变量(因变量)。举例来说,当企业需要改善客户群信息,根据客户的购买历史、兴趣或活动监控来对客户类别做进一步细分时,可以采用kmeans聚类算法实现,有助于公司针对特定客户群制定特定的广告;当餐饮企业需要根据每天的营业数据(包括菜谱价格、就餐人数、预定人数、特价菜折扣等)预测就餐规模或营业额,可以采用线性回归算法实现;当企业在多个方案中需要选择最佳决策方案时,可以依据每个方案中对应的市场状态以及各状态下的概率和损益值,采用决策树算法实现。
75.进一步可选的,该训练模型可以是由数据端发送至数据分析系统中,也可以是数据分析系统预先存储在文件、内存以及数据库中(如:云端数据库、本地数据库)。
76.可见,实施本发明实施例能够使企业在做数据预测分析时根据不同的需求选择算法配置对不同的训练模型进行训练操作,且可以根据数据预测分析需求对算法配置进行修改,从而提高所得的数据预测模型的可靠性。
77.在一个可选的实施例中,在上述步骤103中的数据分析系统根据第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型之后,该方法还可以包括:
78.数据分析系统发送该数据预测模型至数据端,以触发数据端对该数据预测模型执行存储操作。
79.在该可选的实施例中,数据分析系统在得到数据预测模型后,可以将该数据预测模型发送至数据端,并由数据端对该数据预测模型进行存储。可选的,可以由数据端将该数据预测模型存储至文件、内存以及数据库中的至少一种相匹配的存储位置。
80.可见,该可选实施例为数据预测模型提供了多种不同的存储方式,以便企业在有需要时对该数据预测模型进行调取使用,加快数据预测分析进程。
81.实施例二
82.请参阅图2,图2是本发明实施例公开的一种基于模型训练的数据预测方法的流程示意图。其中,图2所描述的基于模型训练的数据预测方法可以应用于企业中不同的业务领域,可以是互联网、电子商务、金融保险、生物医疗、生产制造、餐饮外卖、体育娱乐、交通物流等中的至少一种。具体的,可以应用于企业的战略规划部门中的战略规划,也可以应用在企业的市场营销部门调研用户对企业产品的积极性。可选的,该数据分析可以是企业运营管理流程数据分析、任务管理及计划管理数据分析、组织效率数据分析、流程优化及价值产出数据分析、行业研究数据分析、产品测试数据分析、渠道数据分析、价格与销售量预测数据分析、项目管理数据分析、工程管理数据分析、建立整个组织运营指标系统、营销费用控
制数据分析、广告效果评价数据分析、口碑与舆情监测数据分析以及媒体费用优化分析中的至少一种,本发明例不做限定。具体的,该方法可以由数据分析装置实现,进一步可选的,该数据分析装置可以集成在数据分析设备,也可以是用于对数据分析流程进行管理的本地服务器或云端服务器等,本发明例不做限定。如图2所示,该基于模型训练的数据预测方法可以包括以下操作:
83.201、数据分析系统接收与数据分析系统建立通讯连接的数据端发送的第一数据集的信息。
84.202、数据分析系统对第一数据集进行第一数据预处理操作,得到第一数据集的预处理结果。
85.203、数据分析系统根据第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型。
86.本发明实施例中,针对步骤201-步骤203的其它描述,请参照实施例一中针对步骤101-步骤103的详细描述,本发明实施例不再赘述。
87.204、数据分析系统检测是否接收到数据端发送的预测数据指令。
88.本发明实施实施例中,预测数据指令由数据端发送至数据分析系统,即该预测数据指令可以在企业有需求时通过数据端发出,这样可以有针对性地对数据进行预测分析,从而不影响数据预测结果的时效性。
89.205、当检测出接收到预测数据指令时,数据分析系统对第二数据集进行第二数据预处理操作,并得到第二数据集的预处理结果。
90.本发明实施例中,第二数据集的信息经过数据分析系统的预处理操作后,数据分析系统所得到的预处理结果同样可以与处理前的第二数据集的信息保持准确性、完整性、一致性以及时效性。
91.206、数据分析系统将第二数据集的预处理结果输入到数据预测模型,并对第二数据集的预处理结果执行数据反写操作,得到数据预测模型的预测结果作为第二数据集的预测结果。
92.本发明实施例中,在第二数据集的信息经过数据分析系统的预处理后,数据分析系统可以直接将第二数据集的信息的预处理结果输入到数据预测模型中执行数据反写操作,得到数据预测模型的预测结果作为第二数据集的预测结果。这样,数据分析系统可以高效且有针对性地根据预处理结果继续进行数据预测分析工作,从而节省不必要的步骤。
93.进一步的,该数据预测模型的预测结果可以直接被视为第二数据集的预测结果,该数据预测模型的预测结果的形式可以通过计算机图形学,也可以通过图像处理技术,还可以通过其他办公软件(如excel)转换成表格、文件、图形以及图像等形式中的至少一种,本发明实施例不做限定。具体的,该数据预测模型以及该数据预测模型的预测结果可以直接存储在数据分析系统中,还可以由数据分析系统发送至数据端。这样,两个系统可以做到信息交互,在需要调用该数据预测模型或者该数据预测模型的预测结果时可以节省获取信息时间。
94.可见,本发明实施例能够跨系统地接收大量静态以及动态模式的数据集的信息,且可以对接收到的数据集的信息灵活地进行预处理操作,提高数据集的信息的处理能力,从而提高后续对于数据集的信息进行预测时的准确性以及预测分析速度。
95.在一个可选的实施例中,该方法还可以包括以下操作:
96.207、数据分析系统对数据预测模型执行评估操作,得到数据预测模型的评估信息。
97.在该可选的实施例中,数据分析系统可以通过对数据预测模型的评估操作全方位地验证数据预测模型的实用性。可选的,数据分析系统可以对无监督学习模型类型进行评估操作,也可以对半监督学习模型类型进行评估操作,还可以对监督学习模型类型进行评估操作,并有针对性地得到数据预测模型的评估信息。进一步的,数据预测模型的评估信息可以是数据预测模型的准确率、数据预测模型的召回率、数据预测模型的方差比率检验值、数据预测模型的显著性检验值、数据预测模型的相关性系数中的至少一种。举例来说,当企业需要对给定的测试数据集进行数据预测模型中的正确分类的样本数以及总样本数之间的比例计算时,可以采用数据预测模型的准确率来进行评估;当企业根据数据预测结果需求,需要一个指标来综合地考虑精确率以及召回率时,可以根据数据预测模型的方差比率检验值进行评估,计算出两者的权重。
98.可见,该可选的实施例可以根据企业不同需求,灵活地采用不同的数据预测模型的评估信息去针对数据预测模型的实用性给定不同方位的评价指标,从而满足企业中不同业务的数据预测分析需求。
99.在又一个可选的实施例中,在上述步骤207中的数据分析系统对数据预测模型执行评估操作,得到数据预测模型的评估信息之后,该方法还包括:
100.数据分析系统检测是否接收到数据端发送的针对评估信息的查看指令;
101.当检测出接收到针对评估信息的查看指令时,数据分析系统发送评估信息至数据端。
102.在该可选实施例中,在数据分析系统得到该数据预测模型的评估信息之后,可选的,数据分析系统可以直接将该评估信息存储至文件、内存以及数据库中,也可以是数据分析系统先发送至数据端,再由数据端存储至文件、内存以及数据库中。进一步可选的,当数据分析系统检测出接收到数据端发送的针对评估信息的查看指令时,数据分析系统可以发送评估信息中所包含的数据预测模型的准确率、数据预测模型的召回率、数据预测模型的方差比率检验值、数据预测模型的显著性检验值、数据预测模型的相关性系数中的至少一种信息至数据端。
103.可见,该可选的实施例能够提供跨系统的数据预测模型的评估信息的交互方法,不仅有利于企业在对数据预测模型进行评估时灵活地调取评估信息,还有利于企业有针对性地对数据预测模型及其涉及的算法作出后续的改进,从而提高预测结果的准确性。
104.在又一个可选的实施例中,在上述步骤206中的数据分析系统将第二数据集的预处理结果输入到数据预测模型,并对第二数据集的预处理结果执行数据反写操作,得到数据预测模型的预测结果作为第二数据集的预测结果之后,该方法还包括:
105.数据分析系统将预测结果发送至数据端,以触发数据端执行相匹配的操作。
106.在该可选的实施例中,在数据分析系统将预测结果发送到数据端之后,由数据端对数据预测结果执行相匹配的操作。可选的,可以由数据端对该预测结果进行存储操作,还可以由数据端对该预测结果进行结果展示操作。进一步的,该预测结果可以是表格、文件、图形以及图像等形式中的至少一种。又进一步的,数据分析系统也可以直接存储该预测结
果至相匹配的存储位置。具体的,数据分析系统可以将该预测结果存储在文件、内存以及数据库(如:云端数据库、本地数据库)中至少一种相匹配的存储位置。
107.可见,该可选的实施例不仅能够得到准确的数据预测结果,还能够提高不同类型的预测结果的存储能力,从而在有需要时可以灵活地从数据分析系统或者数据端中调用不同类型的预测结果。
108.在又一个可选的实施例中,上述步骤中的数据分析系统将预测结果发送至数据端,以触发数据端执行相匹配的操作,可以包括:
109.由数据端将预测结果存储至相匹配的存储位置。
110.在该可选的实施例中,数据分析系统得到的预测结果可以发送至数据端,由数据端将接收到的预测结果进行其他相匹配的操作。可选的,可以由数据端对预测结果进行存储操作,存储至内存、文件以及数据库的至少一种相匹配的存储位置。进一步的,预测结果可以通过移动终端,也可以通过本地服务器,还可以通过云端服务器来进行存储操作。再进一步的,该预测结果的数据存储类型可以是整数型、浮点型、字符型以及布尔型中的至少一种。
111.可见,该可选的实施例体现了数据预测结果储存方式的多样化,可以灵活地甚至不限场合地对各种类型的数据预测结果进行存储,有利于在企业有需要时加快获取数据预测结果的速度,从而加快企业的工作效率。
112.在又一个可选的实施例中,上述步骤中的数据分析系统将预测结果发送至数据端,以触发数据端执行相匹配的操作,可以包括:
113.由数据端根据预测结果,对预测结果进行设计器的配置,得到预测结果的展示图表。
114.在该可选实施例中,数据分析系统得到的预测结果可以发送至数据端,由数据端将接收到的预测结果进行其他相匹配的操作。可选的,可以由数据端对预测结果进行设计器的配置,并进行结果展示操作。具体的,可以由数据端通过excel、bi工具以及python等对预测结果进行设计器的配置,在进行设计器的配置时,可以根据数据集的编程语言类型或者根据不同的可视化搭配组件有选择性地对预测结果进行结果展示。进一步的,由数据端进行结果展示操作时,该预测结果的展示图表类型可以是静态的展示图表类型,也可以是动态的展示图表类型,还可以是静态以及动态结合的展示图表类型。静态的展示图表类型可以是折线图、柱状图、面积图、散点图、雷达图、双轴图等图表中的至少一种,动态的展示图表类型可以是热点链接、图表联动、在线的分析报告编辑、系列拖拽、视频动画等中的至少一种。这样,可以提供多种可视化数据预测结果的展示方法,实现数据的创建、分析以及展示应用的系统集成,能够支持数据分析系统与应用平台的无缝衔接以及交互。
115.可见,该可选的实施例可以根据企业的数据分析需求,结合不同的可视化组件,有选择性地展示需要展示的预测结果,不仅有利于企业更加直观地看出预测结果的可靠性,还有利于企业对预测结果作出针对性的评判。
116.实施例三
117.请参阅图3,图3是本发明实施例公开的一种基于模型训练的数据预测装置的结构示意图。其中,图3所描述的装置用于实现对企业中不同业务流程的数据分析需求,可选的,该基于模型训练的数据预测装置可以集成在数据分析设备,也可以是用于对数据分析流程
进行管理的本地服务器或云端服务器等,本发明例不做限定。如图3所示,该基于模型训练的数据预测装置可以包括:
118.数据接收模块301,用于接收与数据分析系统建立通讯连接的数据端发送的第一数据集的信息;第一数据集的信息是由数据端对基础数据进行第一数据筛选操作后发送的,第一数据集包括预设数量的数据,第一数据集的信息包括所有第一数据的信息,第一数据集的信息的模式是静态的模式和/或动态的模式;
119.数据预处理模块302,用于对第一数据集进行第一数据预处理操作,得到第一数据集的预处理结果;
120.模型训练模块303,用于根据第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型。
121.可选的,第一数据集的信息包括所有第一数据的来源信息、所有第一数据的编程语言类型、所有第一数据的名称信息以及所有第一数据的数据类型中的至少一种,每个第一数据的名称信息包括中文名称和/或英文名称。
122.可见,实施图3所描述的基于模型训练的数据预测装置能够使企业在做数据预测分析时根据不同的需求选择算法配置对不同的训练模型进行训练操作,且可以根据数据预测分析需求对算法配置进行修改,从而提高所得的数据预测模型的可靠性。
123.在一个可选的实施例中,该基于模型训练的数据预测装置还可以包括:
124.第一检测模块304,用于在上述模型训练模块303执行上述根据第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型之后,检测是否接收到数据端发送的预测数据指令;预测数据指令用于请求数据分析系统对第二数据集进行预测,第二数据集是由数据端对基础数据进行第二数据筛选操作后发送的;
125.数据预处理模块302,还用于当第一检测模块304检测出接收到预测数据指令时,对第二数据集进行第二数据预处理操作,并得到第二数据集的预处理结果;
126.数据预测模块305,用于将第二数据集的预处理结果输入到数据预测模型,并对第二数据集的预处理结果执行数据反写操作,得到数据预测模型的预测结果作为第二数据集的预测结果。
127.可见,实施图4所描述的基于模型训练的数据预测装置能够接收大量静态以及动态模式的数据集的信息,且可以对接收到的数据集的信息灵活地进行预处理操作,提高数据集的信息的处理能力,从而提高后续对于数据集的信息进行预测时的准确性以及预测分析速度。
128.在又一个可选的实施例中,该基于模型训练的数据预测装置还可以包括:
129.模型评估模块306,用于在上述模型训练模块303执行上述根据第一数据集的预处理结果,对预先确定出的训练模型进行算法配置,并根据算法配置对训练模型执行训练操作,得到数据预测模型之后,对数据预测模型执行评估操作,得到数据预测模型的评估信息。
130.可见,实施图4所描述的基于模型训练的数据预测装置可以根据企业不同需求,灵活地采用不同的数据预测模型的评估信息去针对数据预测模型的实用性给定不同方位的评价指标,从而满足企业中不同业务的数据预测分析需求。
131.在又一个可选的实施例中,该基于模型训练的数据预测装置还可以包括:
132.第二检测模块307,用于在上述模型评估模块306执行上述对数据预测模型执行评估操作,得到数据预测模型的评估信息之后,检测是否接收到数据端发送的针对评估信息的查看指令;
133.评估信息发送模块308,用于当第二检测模块307检测出接收到针对评估信息的查看指令时,发送评估信息至数据端。
134.可选的,评估信息包括数据预测模型的准确率、数据预测模型的召回率、数据预测模型的相关性系数、数据预测模型的显著性检验值、数据预测模型的方差比率检验值中的至少一种。
135.可见,实施图4所描述的基于模型训练的数据预测装置可以根据企业不同需求,灵活地采用不同的数据预测模型的评估信息去针对数据预测模型的实用性给定不同方位的评价指标,从而满足企业中不同业务的数据预测分析需求。
136.在又一个可选的实施例中,该基于模型训练的数据预测装置还可以包括:
137.预测结果发送模块309,用于在上述数据预测模块305执行上述将第二数据集的预处理结果输入到数据预测模型执行预测操作,得到数据预测模型的预测结果作为第二数据集的预测结果之后,将预测结果发送至数据端,以触发数据端执行相匹配的操作。
138.可见,实施图4所描述的基于模型训练的数据预测装置不仅能够得到准确的数据预测结果,还能够提高不同类型的预测结果的存储能力,从而在有需要时可以灵活地从数据分析系统或者数据端中调用不同类型的预测结果。
139.在又一个可选的实施例中,该基于模型训练的数据预测装置中预测结果发送模块309将预测结果发送到数据端,以触发数据端执行相匹配的操作的方式具体为:
140.由数据端将预测结果存储至相匹配的存储位置;相匹配的存储位置包括内存、文件以及数据库中的至少一种。
141.可见,实施图4所描述的基于模型训练的数据预测装置体现了数据预测结果储存方式的多样化,可以灵活地甚至不限场合地对各种类型的数据预测结果进行存储,有利于在企业有需要时加快获取数据预测结果的速度,从而加快企业的工作效率。
142.在又一个可选的实施例中,该基于模型训练的数据预测装置中预测结果发送模块309将预测结果发送到数据端,以触发数据端执行相匹配的操作的具体方式为:
143.由数据端根据预测结果,对预测结果进行设计器的配置,得到预测结果的展示图表;预测结果的展示图表为静态的结果展示图表和/或动态的结果展示图表。
144.可见,实施图4所描述的基于模型训练的数据预测装置可以根据企业的数据分析需求,结合不同的可视化组件,有选择性地展示需要展示的预测结果,不仅有利于企业更加直观地看出预测结果的可靠性,还有利于企业对预测结果作出针对性的评判。
145.实施例四
146.请参阅图5,图5是本发明实施例公开的又一种基于模型训练的数据预测的装置的结构示意图。如图5所示,该基于模型训练的数据预测装置可以包括:
147.存储有可执行程序代码的存储器401;
148.与存储器401耦合的处理器402;
149.处理器402调用存储器401中存储的可执行程序代码,执行本发明实施例一或本发
明实施例二所描述的基于模型训练的数据预测方法中的步骤。
150.实施例五
151.本发明实施例公开了一种计算机可存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一或本发明实施例二所描述的基于模型训练的数据预测方法中的步骤。
152.实施例六
153.本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一或实施例二中所描述的基于模型训练的数据预测方法中的步骤。
154.以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
155.通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(read-only memory,rom)、随机存储器(random access memory,ram)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子抹除式可复写只读存储器(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
156.最后应说明的是:本发明实施例公开的一种基于模型训练的数据预测方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献