一种基于深度学习的人工智能模型开发平台的制作方法

2021-12-08 00:01:00 来源：中国专利 TAG：

1.本发明属于人工智能技术领域，尤其涉及一种基于深度学习的人工智能模型开发平台。

背景技术：

2.现在企业人工智能ai模型在训练阶每个项目的数据来源一般都各不相同，需要研发人员每次都要根据项目情况人工去申请、获取、清洗、预处理数据。ai模型在开发过程中，需要一系列的运算、存储等资源。在大多数企业实体中，很多项目都是项目组自己提供运算资源训练模型，上线时再申请生产资源对环境进行配置、对项目进行部署。这种各自为政的资源管理模式不可避免地会造成资源使用的不协调与浪费。模型交付难，缺少统一的模型运行、监控平台，服务管理接口、及更新维护机制。并且每个模型上线后各个项目独自使用，遇到其他业务场景需要重新从数据获取、清洗、标注、训练等流程重新开始，烟筒式的开发，在企业内部就会形成一系列的数据孤岛。
3.现有技术中，烟筒式的开发模式会造成一系列数据孤岛，模型的隔离部署管理和可复用程度低，模型交付难，缺少统一的模型运行、监控、管理、更新维护平台。

技术实现要素：

4.本发明的主要目的在于克服现有技术的缺点与不足，提供一种基于深度学习的人工智能模型开发平台，在人工智能模型开发平台中提供数据管理、算法开发、模型训练、模型管理、模型部署、模型炼知、权限管理等功能，对数据、算法、模型进行标准化统一管理，算法和模型可复用程度高，避免重复开发，提高了开发效率；不同项目可并行调用，避免了数据孤岛的存在，同时支持服务自主对接，降低了对接难度。
5.根据本发明的一个方面，本发明提供了一种基于深度学习的人工智能模型开发平台，所述平台包括：
6.数据管理单元，用于对各类数据进行数据筛选、数据分析、数据标注，所述数据标注的方式包括机器自动标注和人工手动标注；
7.算法开发单元，用于创建新的算法，或根据应用需求对平台中预置的算法进行操作，所述操作包括在线编辑、上传、下载、删除；
8.模型训练单元，用于为每个训练任务分配独立的虚拟容器，采用预置算法或用户自定义算法进行云端训练；
9.模型管理单元，用于对所述模型进行创建、查询、下载、编辑、删除操作，并保存操作后的模型；
10.模型部署单元，用于对模型管理单元中的模型利用云端服务功能进行部署，所述模型部署的方式包括在线部署和批量部署。
11.优选地，所述数据标注的类型包括：图像分类、目标检测、目标跟踪和文本分类；所述数据标注的过程包括：
12.采集业务数据，所述业务数据包括文本、图像、音频和视频；
13.对所述业务数据创建标签组，形成数据集；
14.对所述数据集中的数据进行标注，将标注后的数据集进行发布。
15.优选地，所述根据应用需求对平台中预置的算法进行操作，包括：
16.创建交互式编程环境，在所述交互式编程环境中编辑算法；
17.对编辑后的算法进行调试，并保存调试后的算法。
18.优选地，对模型进行训练，包括：
19.创建训练任务，所述训练任务支持多种深度学习算法；
20.训练过程中动态调制算法参数，完成模型训练。
21.优选地，所述模型管理单元包括模型优化模块，用于对模型管理单元中存储的模型进行优化处理。
22.优选地，模型部署单元中的云端服务功能支持多种深度学习算法训练、灰度发布、图片预处理、自定义推理脚本。
23.优选地，所述人工智能模型开发平台还包括模型炼知单元，所述模型炼知单元通过重用已知的预训练模型为用户定制新的模型，为用户提供一键创建任务的功能，并提供菜单选择功能来控制模型间知识的迁移。
24.优选地，所述模型炼知单元包括炼知引擎；所述炼知引擎用于多任务迁移学习、图像分类、语义分割、深度估计、知识重组、模型可迁移性分析和模型压缩。
25.优选地，所述人工智能模型开发平台还包括权限管理单元，用于对所述人工智能模型开发平台进行角色、权限的统一管理，所述管理包括菜单管理、账号管理和角色管理。
26.优选地，所述菜单管理包括：对菜单进行权限控制，若有权限，则显示菜单名允许访问相应的模块，若无权限，则隐藏菜单名；
27.所述角色管理包括：根据业务对应的角色进行管理，或根据访问权限的等级进行管理。
28.本发明能达到的有益效果如下：
29.1.多层次可复用：对于算法、模型的标准化管理，以及可复用服务封装能力，使得算法和模型可复用程度高，避免重复开发，提高了开发效率。
30.2.服务统一化：统一的服务接口规范，可支持服务自主对接，降低了对接难度。
31.3.流程角色优化：研发流程拆分优化，清晰的研发角色定义，支持任务并行与角色协作，ai产品研发流水线化，能提高开发人员的开发效率。
32.4.数据统一管理：数据管理模块对数据统一管理，并实现了版本管理，不同项目可并行调用，避免了数据孤岛的存在。
33.5.支持一键部署：针对模型部署难的问题，可实现在线部署调参，一键部署上线，加快了应用上线周期。
34.6.资源管控：统一资源管理，包括计算资源、存储资源等，支持资源弹性调度。降低了企业的开发成本。
35.通过参照以下附图及对本发明的具体实施方式的详细描述，本发明的特征及优点将会变得清楚。
附图说明
36.图1是人工智能模型开发平台结构示意图；
37.图2是对数据进行标注的流程示意图；
38.图3是对算法进行编辑操作的流程示意图；
39.图4是人工智能模型开发平台的总体框架示意图。
具体实施方式
40.下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
41.实施例1
42.图1是人工智能模型开发平台结构示意图。如图1所示，本发明提供了一种基于深度学习的人工智能模型开发平台，所述平台包括：
43.数据管理单元，用于对各类数据进行数据筛选、数据分析、数据标注，所述数据标注的方式包括机器自动标注和人工手动标注；
44.算法开发单元，用于创建新的算法，或根据应用需求对平台中预置的算法进行操作，所述操作包括在线编辑、上传、下载、删除；
45.模型训练单元，用于为每个训练任务分配独立的虚拟容器，采用预置算法或用户自定义算法进行云端训练；
46.模型管理单元，用于对模型进行创建、查询、下载、编辑、删除操作，并保存操作后的模型；
47.模型部署单元，用于对模型管理单元中的模型利用云端服务功能进行部署，所述模型部署的方式包括在线部署和批量部署。
48.需要说明的是，本实施例中的数据管理单元、算法开发单元、模型训练单元、模型管理单元、模型部署单元可以由图4中具有相应功能的模块构成，即本实施例中的功能单元可以包括图4中示出的一个或多个模块。
49.优选地，所述数据标注的类型包括：图像分类、目标检测、目标跟踪和文本分类；所述数据标注的过程包括：
50.采集业务数据，所述业务数据包括文本、图像、音频和视频；
51.对所述业务数据创建标签组，形成数据集；
52.对所述数据集中的数据进行标注，将标注后的数据集进行发布。
53.具体地，ai开发过程中经常需要处理海量数据，数据准备与标注往往耗费整体开发一半以上时间。通常情况下，合适的训练数据集对于文件的质量和规格有着很高的要求。数据的质量一定程度决定了模型的好坏。该平台数据管理提供了一套高效便捷的管理和标注数据框架。不仅支持图片、文本、语音、视频等多种数据类型，涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景，可适用于各种ai项目，如计算机视觉、自然语言处理、音视频分析等；同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能，拥有高质量的数据标注处理算法，输出高品质的数据，支持下游ai数据训练获得更优
的训练效果。ai开发者可基于该框架实现数据标注全流程处理。
54.其中，数据标注的流程参见图2，数据标注的类型如下表所示。
55.表：数据标注支持类型
[0056][0057]
数据集状态说明如下：
[0058]
1.未标注：数据集所有文件均未标注；
[0059]
2.导入中：将本地待标注文件或者已标注数据集导入平台中；
[0060]
3.标注中：数据集中部分文件处在未完成的状态，且当前未在执行自动标注任务；
[0061]
4.自动标注中：当前数据集正在执行自动标注任务；
[0062]
5.自动标注完成：数据集已完成自动标注任务；
[0063]
6.标注完成：当前数据集所有文件都已通过人工确认环节；
[0064]
7.未采样：目标跟踪场景下视频数据集创建完毕的初始状态；
[0065]
8.采样中：目标跟踪场景下视频开始逐帧采样；
[0066]
9.采样失败：视频采样失败；
[0067]
10.目标跟踪中：对视频采样后生成的图片完成标注任务后，进行目标跟踪，生成目标id、目标位置；
[0068]
11.目标跟踪失败：文件缺失或其他原因导致失败；
[0069]
12.数据增强中：针对图片数据集进行文件扩充，基于原始图片转换生成新图片。
[0070]
优选地，所述根据应用需求对平台中预置的算法进行操作，包括：
[0071]
创建交互式编程环境，在所述交互式编程环境中编辑算法；
[0072]
对编辑后的算法进行调试，并保存调试后的算法。
[0073]
具体地，参见图3，算法开发模块是基于机器学习的一站式ai模型开发平台提供给用户开发算法的模块，包含notebook和算法管理两部分。notebook是一种交互式编程环境，ai开发者可以在云端进行机器学习的开发。notebook中完成数据准备、数据预处理、算法调试与模型训练，无需多平台切换。每个notebook都是一个独立的编程环境，用户可以对notebook实现创建、打开、停止、启动、删除等操作，算法开发完成之后，还可以将其保存到算法管理单元中，从而可以进行后续的训练工作。
[0074]
算法管理用于保存一些平台预置的算法以及用户自己开发的算法。对于已经保存的算法，用户可以进行在线编辑、创建训练任务、下载、fork、删除等操作。
[0075]
算法管理模块与数据管理、训练管理、模型管理等其他模块相互耦合，可提供更好
的ai一站式开发体验。算法管理列表是用户创建的算法列表，可进行上传算法、在线编辑、创建训练任务、下载、fork、删除等操作。
[0076]
优选地，对模型进行训练，包括：
[0077]
创建训练任务，所述训练任务支持多种深度学习算法；
[0078]
训练过程中动态调制算法参数，完成模型训练。
[0079]
具体地，一站式ai模型开发平台为每一个人工智能的训练任务都单独分配了一个虚拟容器去进行训练，各个训练任务之间相互隔离，互不干扰，可提高训练任务的可靠性。训练任务支持tensorflow、oneflow、pytorch等多种深度学习框架，使用预置算法或用户自定义算法进行云端训练。支持训练任务的多版本控制，用户可基于现有版本进行修改，动态调整算法超参数，简化模型开发和全流程训练管理。从而得到一个满意的模型。
[0080]
训练管理主要包含以下两块功能：
[0081]
镜像管理：用户可以自行上传镜像
[0082]
训练任务：用户可以通过创建的算法对已发布的数据集进行训练。
[0083]
任务模板的主要功能为保存训练运行时所需要的参数，方便用户快速使用。保存任务模板可以方便用户后续的参数修改扩展。
[0084]
优选地，所述模型管理单元包括模型优化模块，用于对模型管理单元中存储的模型进行优化处理。
[0085]
具体地，模型管理可以导入训练生成的模型，并对模型的版本迭代进行统一管理。用户可以从本地上传模型文件，也可以从训练管理页面中导入。用户可在此进行模型的管理，支持的操作包括创建模型、查询模型、历史版本、下载、编辑、删除等。还可将模型保存到模型仓库进行多版本的管理。同时，还支持将模型导出，应用到用户的其他系统。
[0086]
一站式ai模型开发平台还具有模型优化模块，研发了用于计算机视觉应用领域和自然语言处理应用领域的模型优化技术。
[0087]
优选地，模型部署单元中的云端服务功能支持多种深度学习算法训练、灰度发布、图片预处理、自定义推理脚本。
[0088]
具体地，完成模型训练后，对于模型管理中保存的模型，云端服务功能可以具体实现为云端serving模块，用户可在云端serving模块对模型进行部署。云端serving模块特点如下：
[0089]
支持对oneflow，tensorflow，pytorch，keras四种深度学习框架训练；
[0090]
支持http、grpc两种通信方式；
[0091]
支持多节点部署；
[0092]
支持灰度发布；
[0093]
支持基本的图片预处理；
[0094]
支持自定义推理脚本；
[0095]
支持使用自制镜像。
[0096]
模型部署分为两种方式：
[0097]
在线部署：对某个模型进行部署，点击在线服务记录可查看具体的在线服务信息和调用指南、预测、监控信息、日志、部署记录板块。
[0098]
批量部署：可对多个模型进行部署，点击列表中任意一条批量服务，进入部署详情
列表页可查看具体的批量服务信息和日志等板块。
[0099]
优选地，所述人工智能模型开发平台还包括模型炼知单元，所述模型炼知单元通过重用已知的预训练模型为用户定制新的模型，为用户提供一键创建任务的功能，并提供菜单选择功能来控制模型间知识的迁移。
[0100]
具体地，模型炼知是一种基于知识重组、知识蒸馏、神经网络剪枝等技术的模型定制化方式。在传统的模型训练流程中，针对每一个待解决的任务，需要完成数据收集、标注、预处理、模型训练等一系列步骤，并由此得到对应的单任务模型。在互联网上，存在大量的公开可获得预训练模型，炼知技术通过重用预训练模型来为用户定制新模型。
[0101]
优选地，所述模型炼知单元包括炼知引擎，所述炼知引擎面向多任务迁移学习，支持的任务包括图像分类、语义分割、深度估计；所述炼知引擎具有知识重组、模型可迁移性分析、模型压缩功能。
[0102]
具体地，模型炼知主要由两部分构成：
[0103]
炼知引擎：知识重组算法包，支持重组、蒸馏、剪枝、模型可迁移性度量等功能
[0104]
在线模型炼知平台：一键式炼知平台，包含模型图谱可视化、训练管理、模型分享等功能
[0105]
炼知引擎是一个面向多任务迁移学习设计的轻量级算法包，支持图像分类、语义分割、深度估计等多种任务。引擎主要包括三类功能：
[0106]
知识重组：通过利用无标注数据，整合不同来自不同任务的模型表征，构建新的多任务模型。
[0107]
可迁移性：利用无标注数据，分析中间表征来估计模型间的可迁移性，为重组算法提供模型选取的参考依据。
[0108]
压缩算法：蒸馏、剪枝等基础的模型压缩算法。
[0109]
炼知平台是通过重用预训练模型的知识来构建新模型的平台，平台提供了简单易用的模型炼知功能，覆盖知识重组、知识蒸馏、神经网络剪枝等算法。炼知平台的主要面向非专业用户，在平台上用户可以一键创建任务，并通过简单的菜单选择来控制模型间知识的迁移，而无需进行繁琐的编码。
[0110]
优选地，所述人工智能模型开发平台还包括权限管理单元，用于对所述人工智能模型开发平台进行角色、权限的统一管理，所述管理包括菜单管理、账号管理和角色管理。
[0111]
优选地，所述菜单管理包括：对菜单进行权限控制，若有权限，则显示菜单名允许访问相应的模块，若无权限，则隐藏菜单名；
[0112]
所述角色管理包括：根据业务对应的角色进行管理，或根据访问权限的等级进行管理。
[0113]
具体地，为了便于对一站式ai模型开发平台进行角色、权限统一控制和资源管控，设置了开发平台权限管理单元。管理单元共分为两个三个部分：
[0114]
菜单管理：类型分为3种：目录、菜单、按钮。在目录、菜单上加权限控制，有权限的就可以访问对应模块，没有的连菜单名都看不到。在业务模块的功能按钮上加权限控制，最小粒度的控制用户行为。
[0115]
账号管理：在创建用户时，需输入用户的基本信息，并直接为用户绑定角色。
[0116]
角色管理：角色有两个维度确认：业务维度和等级维度，业务维度是指不同的角色
负责不同的功能，例如：标注员，算法工程师。等级维度，即超级管理员、普通管理员。
[0117]
本实施例中，工智能模型开发平台对算法、模型进行标准化管理，使得算法和模型可复用程度高，避免重复开发，提高了开发效率。平台提供统一的服务接口规范，支持服务自主对接，降低了对接难度。平台提供数据统一管理，并实现了版本管理，不同项目可并行调用，避免了数据孤岛的存在。同时，平台支持一键部署，可实现在线部署调参，一键部署上线，加快了应用上线周期。另外，平台进行统一资源管理，包括计算资源、存储资源等，支持资源弹性调度，降低了企业的开发成本。
[0118]
关于上述实施例中的平台，其中各个单元执行操作的具体步骤已经在有关该方法的实施例中进行了详细描述，此处不再详细阐述说明。上述平台中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个单元对应的操作。应该理解的是，虽然本发明各实施例的流程图中的各个单元按照连接线的指示依次连接，但是这些单元并不是必然按照连接线指示的顺序依次执行。除非本文中有明确的说明，这些单元的执行并没有严格的顺序限制，这些单元可以以其它的顺序执行。
[0119]
以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：广告投放的效果预测方法、装置、计算机设备和存储介质与流程

一种基于深度学习的人工智能模型开发平台的制作方法

相关文献

最热文献