一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种可视化的数据处理系统及处理方法与流程

2021-10-19 23:25:00 来源:中国专利 TAG:数据处理 系统 方法 可视化 综合性

技术特征:
1.一种可视化的数据处理系统,用于实现对大数据的处理,其特征在于,包括:前台可视化操作部分,用于定义任务执行单元,依据具体的任务需求定义所述任务执行单元的执行顺序,形成任务执行规则并发送;后台数据处理部分,与所述前台可视化操作部分信号连接,用于接收所述任务执行规则,依据所述任务执行规则调用所述任务执行单元,得到任务执行结果并保存;所述前台可视化操作部分具体包括,多个清洗任务执行单元,用于定义具体的数据清洗任务操作,以模块化的形式对操作进行保存;多个建模任务执行单元,用于定义具体的数据清洗任务操作,以模块化的形式对操作进行保存,多个所述建模任务执行单元间相互独立;任务输入单元,用于依据具体的任务需求,对所述清洗任务执行单元及所述建模任务执行单元的执行顺序进行定义,形成所述任务执行规则并发送;所述后台数据处理部分具体包括,任务接收单元,与所述任务输入单元信号连接,用于接收所述任务执行规则;任务解析和判断单元,与所述任务接收单元信号连接,用于对所述任务执行规则进行解析,判断所述任务执行规则是否有效、根据判断结果执行后续操作;任务链形成和执行单元,与所述任务解析和判断单元信号连接、还分别与多个所述清洗任务执行单元及多个所述建模任务执行单元信号连接,当所述任务解析和判断单元的判断所述任务执行规则有效时,依据所述任务执行规则按序对所述清洗任务执行单元及所述建模任务执行单元进行调用,得到所述任务执行结果并发送;任务结果保存单元,与所述任务链形成和执行单元信号连接,用于对所述任务执行规则及所述任务执行结果进行保存记录。2.根据权利要求1所述的一种可视化的数据处理系统,其特征在于:多个所述清洗任务执行单元间相互独立;每个所述清洗任务执行单元均包括,清洗对象输入模块,用于定义需要进行数据清洗的数据集对象;清洗过程定义模块,与所述清洗对象输入模块信号连接,用于定义具体的数据清洗过程;清洗结果导出模块,与所述清洗过程定义模块信号连接,用于依据所述数据清洗过程对所述数据集对象进行数据清洗,得到数据清洗结果并输出。3.根据权利要求1所述的一种可视化的数据处理系统,其特征在于:多个所述建模任务执行单元间相互独立,每个所述建模任务执行单元均包括一个模型训练子单元和一个模型应用子单元;所述模型训练子单元包括,训练集选择模块,用于对训练数据集进行选择;训练集预处理模块,与所述训练集选择模块信号连接,用于对所述训练数据集进行数据预处理操作;训练模型构建模块,与所述训练集预处理模块信号连接,用于依据预处理后的所述训练数据集,结合算法、参数,形成数据处理模型;
所述模型应用子单元包括,数据集选择模块,用于对任务训练集进行选择;数据集预处理模块,与所述数据集选择模块信号连接,用于对所述任务训练集进行数据预处理操作;建模结果导出单元,与所述数据集预处理模块信号连接,用于依据预处理后的所述任务训练集,结合所述数据处理模型,得到数据建模处理结果并输出。4.一种可视化的数据处理方法,基于如权利要求1~3任一所述的一种可视化的数据处理系统,其特征在于,包括如下步骤:s1、定义任务执行单元,依据具体的任务需求定义具体的任务执行单元的执行顺序,形成任务执行规则;s2、依据所述任务执行规则调用相对应的所述任务执行单元,得到任务执行结果并保存;s1具体包括如下步骤,s11、定义具体的数据清洗任务操作,以模块化的形式将操作保存至清洗任务执行单元中,并保证多个所述清洗任务执行单元间相互独立;s12、定义具体的数据建模任务操作,以模块化的形式将操作保存至建模任务执行单元中,并保证多个所述建模任务执行单元间相互独立;s13、依据具体的任务需求,对所述清洗任务执行单元及所述建模任务执行单元的执行顺序进行定义,形成所述任务执行规则并发送;s2具体包括如下步骤,s21、接收所述任务执行规则;s22、对所述任务执行规则进行解析,判断所述任务执行规则是否有效,若判断结果为所述任务执行规则有效则按需执行s23,若判断结果为所述任务执行规则无效则报错结束后续流程;s23、依据所述任务执行规则按序对所述清洗任务执行单元及所述建模任务执行单元进行调用,按序执行完操作流程后,得到所述任务执行结果并发送;s24、对所述任务执行规则及所述任务执行结果进行保存记录,若任务执行过程中涉及数据处理模型则将所述数据处理模型一并保存。5.根据权利要求4所述的一种可视化的数据处理方法,其特征在于,s11具体包括如下步骤:s111、定义需要进行数据清洗的数据集对象,所述数据集对象的来源可为文件类型数据库或关系型数据库或消息队列;s112、定义具体的数据清洗过程,所述清洗过程包括去重、均值填充、空值填充以及删除数据;s113、所述数据清洗过程对所述数据集对象进行数据清洗,可选择性地对清洗后的结果进行聚合或时空碰撞,得到数据清洗结果并输出。6.根据权利要求4所述的一种可视化的数据处理方法,其特征在于,s12包括按序进行的模型训练子步骤和模型应用子步骤;所述模型训练子步骤具体包括,
s121、对训练数据集进行选择,所述训练数据集可为文件或数据库表,所述训练数据集内必须包含训练需要的特征列;s122、对所述训练数据集进行数据预处理操作;s123、依据预处理后的所述训练数据集,选择算法、设定参数,形成数据处理模型并保存,所述参数包括训练和测试数据集比例、迭代次数、树的深度、分类数量以及正则化参数;所述模型应用子步骤具体包括,s124、对任务训练集进行选择;s125、对所述任务训练集进行数据预处理操作;s126、依据预处理后的所述任务训练集,结合所述数据处理模型,得到数据建模处理结果并输出。

技术总结
本发明揭示了一种可视化的数据处理系统及处理方法,其中,系统由前台可视化操作部分以及后台数据处理部分组成,方法则包括如下步骤:S1、定义任务执行单元,依据具体的任务需求定义具体的任务执行单元的执行顺序,形成任务执行规则;S2、依据任务执行规则调用相对应的任务执行单元,得到任务执行结果并保存。本发明以一种可视化、自定义的方式,实现了对数据处理流程的有效控制,整个操作过程简单直观,极大地缩短了开发周期、节约了企业内宝贵的技术人员资源、提升了企业的生产效率和实际产出。出。出。


技术研发人员:马学中 胡德斌
受保护的技术使用者:苏州维众数据技术有限公司
技术研发日:2021.05.24
技术公布日:2021/10/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜