一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种模型管理方法、装置以及存储介质与流程

2021-11-15 16:53:00 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种模型管理方法、装置以及存储介质。


背景技术:

2.标准模型依赖服务,即依赖于模型提供不同能力。典型的例子是人工智能(artificial intelligence,ai)微服务,根据加载的模型不同,提供的能力也不一样。针对于同一类问题的细分,比如识别不同品牌的商品,需要针对这种品牌商品特定训练的模型,提供商品识别能力的服务设备往往需要与不同品牌的识别模型关联,形成专属识别服务,或者将多个模型放在同一个服务设备中提供不同的接口以识别不同品牌的商品。针对同一类问题的细分,针对同一能力的服务有不同的版本,会降低迭代速度,而且将多个模型打包到一个服务设备中,会使得服务本身变得臃肿。
3.目前,虽然允许对服务设备的模型配置进行修改,但由于需要手动登录每台服务设备并修改配置,操作繁琐,特别是面对大量的服务设备以及频繁需要更改模型配置时,运维工作量极大,管理效率低。


技术实现要素:

4.本发明实施例提供了一种模型管理方法、装置以及存储介质,可以将服务与模型解耦,实现对模型以及服务设备的模型配置的高效管理,有效降低运维的复杂度。
5.第一方面,本发明实施公开了一种模型管理方法,包括:
6.接收模型更新请求,所述模型更新请求包括服务设备的标识信息和第一模型文件的描述信息;
7.根据所述服务设备的标识信息确定出目标服务设备;
8.向所述目标服务设备发送模型更新指令,所述模型更新指令包括所述第一模型文件的描述信息,所述模型更新指令用于指示所述目标服务设备根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对收到的服务请求进行处理。
9.第二方面,本发明实施公开了一种模型管理方法,包括:
10.接收模型更新指令,所述模型更新指令包括第一模型文件的描述信息;
11.根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对提供服务的模型文件进行更新;
12.当接收到服务请求时,通过加载所述第一模型文件处理所述服务请求。
13.第三方面,本发明实施例提供了一种模型管理装置,包括:
14.接收模块,用于接收模型更新请求,所述模型更新请求包括服务设备的标识信息和第一模型文件的描述信息;
15.确定模块,用于根据所述服务设备的标识信息确定目标服务设备;
16.发送模块,用于向所述目标服务设备发送模型更新指令,所述模型更新指令包括
所述第一模型文件的描述信息,所述模型更新指令用于指示所述目标服务设备根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对收到的服务请求进行处理。
17.第四方面,本发明实施例提供了一种模型管理装置,包括:
18.接收模块,用于接收模型更新指令,所述模型更新指令包括第一模型文件的描述信息;
19.获取模块,用于根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件;
20.处理模块,用于利用所述第一模型文件对提供服务的模型文件进行更新;
21.所述处理模块,还用于当接收到服务请求时,通过加载所述第一模型文件处理所述服务请求。
22.第五方面,本发明实施例提供了一种模型管理设备,所述模型管理设备包括:处理器、通信接口和存储器,所述处理器、通信接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面所述的方法。
23.第六方面,本发明实施例提供了一种服务设备,所述服务设备包括:处理器、通信接口和存储器,所述处理器、通信接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第二方面所述的方法。
24.第七方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面以及第二方面所述的模型管理方法。
25.本发明实施例中,模型管理设备接收包括服务设备的标识信息和第一模型文件的描述信息的模型更新请求,再根据服务设备的标识信息确定出目标服务设备,并向确定出的目标服务设备发送包括第一模型文件的描述信息模型更新指令,该模型更新指令用于指示目标服务设备根据第一模型文件的描述信息从模型仓库中获取第一模型文件,并利用该第一模型文件对收到的服务请求进行处理,通过上述实施例,可以将服务与模型解耦,实现对模型以及服务设备的模型配置的高效管理,有效降低运维的复杂度。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.图1是本发明实施例公开的一种模型管理系统的架构示意图;
28.图2是本发明实施提供的一种模型管理方法的流程示意图;
29.图3是本发明实施提供的另一种模型管理方法的流程示意图;
30.图4是本发明实施例公开的又一种模型管理系统的架构示意图
31.图5是本发明实施例提供的一种模型文件更新管理的流程示意图;
32.图6是本发明实施例提供的一种模型文件入库管理的流程示意图;
33.图7是本发明实施例提供的一种模型文件部署管理的流程示意图;
34.图8是本发明实施例提供的一种模型管理装置的结构示意图;
35.图9是本发明实施例提供的另一种模型管理装置的结构示意图;
36.图10是本发明实施例提供的一种模型管理设备的结构示意图;
37.图11是本发明实施例提供的一种服务设备的结构示意图。
具体实施方式
38.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.云技术(cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管托技术。
40.云技术(cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
41.数据库(database),简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
42.数据库管理系统(database management system,dbms)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、xml(extensible markup language,可扩展标记语言);或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如sql(结构化查询语言(structured query language)、xquery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些dbms能够跨类别,例如,同时支持多种查询语言。
43.请参见图1,图1为本发明实施例的一种模型管理系统的架构示意图,如图1所示,该模型管理系统包括客户端101、模型管理设备102以及多个服务设备103。
44.其中,客户端101用于向模型管理设备102上传模型文件以及该模型文件的描述信息,更新各个服务设备103上的模型部署,向用户提供查询模型部署情况的可视化操作界面等,描述信息包括功能描述信息和版本描述信息。
45.模型管理设备102用于对模型仓库中的模型文件进行管理,维护各个服务设备103上的模型部署情况,以及模型仓库中每个模型文件的部署情况,提供搭建自动化分发链路向各个服务设备103分发模型更新指令。其中,模型仓库是一个数据库,用来存储模型文件,
模型管理设备102上可以运行有数据管理系统,通过数据管理系统对模型仓库进行管理。
46.服务设备103用于根据当前部署的模型文件对外提供相应的服务能力,根据模型更新指令调整本机上的模型部署,通过运行的模型管理系统的代理进程将本机上部署的模型信息同步给模型管理设备102。
47.其中,模型管理设备102具体可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。
48.客户端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
49.服务设备103可以是对外提供一定服务能力的分布式设备,例如提供商品识别服务。客户端101、模型管理设备102之间、模型管理设备102和服务设备103之间可以通过有线或无线通信方式进行直接或间接地连接,本技术在此不做限制。
50.在一种可能的实现方式中,用户可以通过客户端101向模型管理设备102发送模型更新请求,该模型更新请求包括服务设备的标识信息和模型文件的描述信息。该模型文件的描述信息可以包括功能描述信息和版本描述信息。模型管理设备102根据服务设备的标识信息从多个服务设备103中确定出目标服务设备,同时,模型管理设备还要检验目标服务设备上的模型文件的描述信息与接收的模型文件的描述信息是否一致。若是不一致,模型管理设备102向确定的目标服务设备103发送模型更新指令,目标服务设备103根据模型更新指令中携带的模型文件的描述信息从模型仓库中确定出所需要的模型文件,将待更新的模型文件的部署情况发送给模型管理设备102请求验证。模型管理设备102验证通过向客户端101模型更新确认请求,客户端101在收到模型更新确认请求,检验待更新的模型文件的描述信息与发送的模型更新请求中的模型文件的是否一致,若不一致,则发送延迟模型更新确认指令或者模型不更新指令,若一致,则发送模型更新确认指令。在客户端101发送模型更新确认指令后,目标服务设备103利用从模型仓库中获取的模型文件对收到的服务请求进行处理。其中,服务设备103会将更新后的模型文件的描述信息发送给模型管理设备102,从而达到将服务与模型解耦,实现对模型以及服务设备的模型配置的高效管理,有效降低运维的复杂度。
51.请参见图2,图2是本发明实施提供的一种模型管理方法的流程示意图,该方法主要是从模型管理系统的模型管理设备的角度进行的阐述,其中,模型管理系统还包括服务设备以及客户端,该流程图的步骤,主要包括:
52.s201、模型管理设备接收模型更新请求,该模型更新请求包括服务设备的标识信息和第一模型文件的描述信息。
53.模型管理设备接收客户端发送过来的模型更新请求,该模型更新请求可以包括服务设备的标识信息和第一模型文件的描述信息。其主要功能是通过服务设备的标识信息确定出客户端想更新的服务设备,以及根据模型文件的描述信息进行服务设备上的模型文件的相对应的更新。示例性的,为了区分模型文件的描述信息的不同,这里用第一模型文件的描述信息来表示模型更新请求中的模型文件的描述信息。
54.进一步地,第一模型文件的描述信息包括功能描述信息以及版本描述信息。功能
描述信息主要是用于描述需要更新的服务设备对应的模型文件的功能,如识别商品品牌的功能、识别商品形状的功能以及识别商品颜色的功能等等,这里不对功能的描述做具体的限定。举个简单的例子,如果是针对商品品牌的识别,若是a品牌模型,对应的版本描述信息可以有a品牌模型v0.1.1以及a品牌模型v0.1.2;若是b品牌模型,对应的版本描述信息可以有b品牌模型v0.1.1以及b品牌模型v0.1.2等。
55.更进一步地,模型文件的描述信息中除了功能描述信息以及版本描述信息外,还可以包括场景描述信息。场景描述信息就是结合功能和版本信息进一步细化识别服务。如商品品牌的识别服务中,加入场景描述后,就可以细化到在某个具体场景下的商品识别。典型的具体场景可以包括冷柜、普通柜台、货架、仓库等等。
56.s202、模型管理设备根据服务设备的标识信息确定出目标服务设备。
57.由于模型管理设备具有一个管理的功能,该模型管理设备不仅记录了模型文件的描述信息还记录了服务设备的标识信息。因此,在模型管理设备接收到模型更新请求中携带的服务设备的标识信息后,就能从不断更新的记录的服务设备的标识信息中找出与接收到的服务设备的标识信息相对应的目标服务设备。其中,模型更新请求携带的服务标识信息不仅限于一个,相对应的,确定出来的目标服务设备也不仅限于一个。一般情况下,模型管理设备的存储采用的是远程字典服务(remote dictionary server,redis)存储,这种存储方式能在一定程度去除单点跌宕机带来的信息丢失问题。因此,在模型管理设备中的服务设备的信息是完整的记录信息。
58.s203、模型管理设备向目标服务设备发送模型更新指令,该模型更新指令包括第一模型文件的描述信息,该模型更新指令用于指示目标服务设备根据第一模型文件的描述信息从模型仓库中获取第一模型文件,并利用第一模型文件对收到的服务请求进行处理。
59.在一种可能的实现方式中,模型管理设备在确定出目标服务设备后,就直接向目标服务设备发送模型更新指令,该模型更新指令包括了上述的第一模型文件的描述信息。目标处理设备主要是根据该第一模型文件的描述信息从模型仓库中获取第一模型文件的,目标处理设备也是根据该第一模型文件的描述信息来确定第一模型文件的功能以及模型文件的版本信息的。在目标服务设备确定了第一模型文件后,便可以利用该第一模型文件对收到的服务请求进行处理。其中,模型更新指令中支持“多节点单版本”和“指定节点多版本”,其节点就是本发明中的服务设备。“多节点单版本”,指在模型更新指令中,携带的是对多个服务设备的相同的模型文件的描述信息的更新;“指定节点多版本”,指在模型更新指令中,携带的是对指定服务设备的多个版本的模型文件的描述信息的更新。
60.在一种可能的实现方式中,模型管理设备向目标服务设备发送模型更新指令之后,还会接收目标服务设备发送的模型更新验证消息,模型管理设备根据模型仓库的模型文件对其进行验证,其验证的是找到的服务设备是否是需要更新的节点设备,当模型更新验证消息验证通过就向客户端发送模型更新确认请求,确认待更新的模型文件的描述信息与发送的模型更新请求中的模型文件的是否一致,若一致,客户端才向模型管理设备发送模型更新确认指令。模型管理设备接收客户端返回的模型更新确认指令,再将该模型更新确认指令发送给目标服务设备。该模型更新确认指令用于指示目标服务设备可以进行模型更新。
61.在一种可能的实现方式中,模型管理设备向目标服务设备发送模型更新指令之
前,模型管理设备需要检测在模型仓库中存储的目标服务设备的模型文件的描述信息与第一模型文件的描述信息是否一致,其中,模型仓库中存储的服务设备的模型文件的描述信息是以模型部署情况表的形式记录的。若不一致,模型管理设备则向目标服务设备发送模型更新指令,若是一致,则表明目标服务设备不需要对模型文件的描述信息进行更新,这样可以在一定程度上减少处理设备做无效操作。
62.在一种可能的实现方式中,每个服务设备上运行有模型管理系统的代理进程。模型部署情况表生成的过程:模型管理设备接收每个服务设备发送的模型部署信息,该部署信息包括每个服务设备上部署的模型文件的描述信息和摘要信息,该部署信息是由上述的代理进程采集得到的。其中,摘要信息是代理进程根据每个服务设备上的模型文件计算的得到的,一般是采用md5信息摘要算法(md5 message-digest algorithm)。模型管理设备接收到模型部署信息后,根据模型部署信息生成模型部署情况表,模型部署情况表中具体可以包括每一个服务设备上部署的模型文件的描述信息以及模型仓库中每个模型文件部署的服务设备的标识信息,模型文件的描述信息可以包括每个模型文件的功能描述信息以及模型文件的版本描述信息。模型管理设备还可以将模型部署情况表发送给客户端,在客户端收到用户对模型文件的部署情况进行查询时,客户端就通过查询模型部署情况表获取模型文件的部署情况。
63.在一种可能的实现方式中,当目标服务设备将原模型文件以及原模型文件的描述信息更新为第一模型文件以及第一模型文件的描述信息后。一般情况下,会将原模型文件删掉,但是本发明侧重于将原模型文件进行暂存,即不删除,也不使用,等到后续还想处理原模型文件所对应的服务请求时,便可以直接回滚,无需再一次进行模型更新以及更新确认等操作,直接调用原模型文件处理相应的服务。
64.在一种可能的实现方式中,模型管理设备除了对服务设备发送模型更新指令以及根据服务设备上的模型部署信息生成模型部署情况表外,还包括对新模型文件入库操作。新模型文件的入库操作包括:模型管理设备接收客户端发送的第二模型文件以及第二模型文件的描述信息,该第二模型文件的描述信息同样包括了上述的功能描述信息和版本描述信息。而后模型管理设备获取第二模型文件对应的摘要信息。针对获取到的摘要信息与模型仓库中的模型文件的摘要信息进行对比,若是摘要信息不一致,则将摘要信息不一致对应的第二模型文件存储到模型仓库中,并更新模型仓库对应的模型文件列表,即将没有的第二模型文件加入进去并更新成新的模型文件列表。
65.在一种可能的实现方式中,当模型管理设备检测到第二模型文件的摘要信息与模型仓库中的模型文件的摘要信息相同时,那么就有相同摘要信息对应的第二模型文件发送给客户端,客户端知晓后就不会再发送相同的第二模型文件。同时,模型管理设备会将更新的模型文件列表发送给客户端,以便让客户端在需要时可以针对性通过模型文件列表查询模型文件。一般情况下,返回给客户端的模型文件列表是通过可视化的界面显示的。
66.本发明实施例中,模型管理设备接收包括服务设备的标识信息和第一模型文件的描述信息的模型更新请求,再根据服务设备的标识信息确定出目标服务设备,并向确定出的目标服务设备发送包括第一模型文件的描述信息模型更新指令,该模型更新指令用于指示目标服务设备根据第一模型文件的描述信息从模型仓库中获取第一模型文件,并利用该第一模型文件对收到的服务请求进行处理,通过上述实施例,可以将服务与模型解耦,实现
对模型以及服务设备的模型配置的高效管理,有效降低运维的复杂度。
67.图3是本发明实施提供的另一种模型管理方法的流程示意图,该方法主要是从模型管理系统的多个服务设备中的目标服务设备的角度进行的阐述,其中,模型管理系统还包括模型管理设备以及客户端,该流程图的步骤,主要包括:
68.s301、目标服务设备接收模型更新指令,该模型更新指令包括第一模型文件的描述信息。
69.其中,目标服务设备可以包括该多个服务设备中的一个或者多个。目标服务设备接收到的模型更新指令是由模型管理设备接收到客户端发送的模型更新请求之后,再向目标服务设备发送的,该模型更新请求中包括服务设备的标识信息和第一模型文件的描述信息。该模型更新指令是在模型管理设备在确定出目标服务设备后发送的,其中,第一模型文件的描述信息是用于指示目标服务设备在更新时需要的模型文件的具体内容,包括需要更新的模型文件,模型文件的功能以及模型文件的版本等。
70.s302、目标服务设备根据第一模型文件的描述信息从模型仓库中获取第一模型文件,并利用该第一模型文件对提供服务的模型文件进行更新。
71.在一种可能的实现方式中,当目标服务设备收到模型更新指令后,便根据模型更新指令中的第一模型文件的描述信息从模型仓库中获取对应的第一模型文件。对应的第一模型文件的模型仓库可能是模型管理设备、云存储设备以及数据存储设备中任一设备中。其中,数据存储设备是与模型管理设备有通信连接的设备,如存储硬盘等。目标服务设备在获取第一模型文件后,目标服务设备利用该第一模型文件对提供服务的模型文件进行更新,包括将原模型文件更新为第一模型文件,更新为第一模型文件的描述信息。其中,这里的更新并不是移出原有的模型文件,只是当前提供服务的模型文件是第一模型文件。
72.在一种可能的实现方式中,目标服务设备接收到的模型更新指令中携带有第一模型文件的描述信息对应的第一模型文件,在这种情况下,目标服务设备便不需要再从其他存储设备中去获取第一模型文件,只需要直接接收第一模型文件,同时,目标服务设备也是直接利用接收到的第一模型文件对提供服务的模型文件进行更新。这种情况是因为第一模型文件就存储在模型管理设备对应的模型仓库中,当模型管理设备解析第一模型文件的描述信息时就能直接从模型仓库中获得第一模型文件。
73.在一种可能的实现方式中,在目标服务设备根据第一模型文件的描述信息从模型仓库中获取到第一模型文件,并利用该第一模型文件对提供服务的模型文件进行更新之前,需要向模型管理设备发送一个模型更新验证信息,该模型更新验证信息是让模型管理设备目标服务设备是正确。在模型管理设备在对该目标服务设备发送的模型更新验证信息校验通过的情况下,向客户端发送模型更新确认请求,模型更新确认请求是为了确认待更新的模型文件的描述信息与发送的模型更新请求中的模型文件的是否一致,若一致,客户端才向模型管理设备发送模型更新确认指令。模型管理设备接收客户端根据模型更新确认请求发送的模型更新确认指令,并将该模型更新确认指令发送给目标服务设备后,目标服务设备再利用第一模型文件对提供服务的模型文件进行更新。这样一个模型更新确认的步骤,是为了确定目标服务设备在进行模型文件更时,该服务设备没有在执行其他的服务,若是不进行确认,可能导致服务设备正在进行的服务被中断。这样能保证模型管理系统在对模型管理的同时,也能保证对用户提供的服务。
74.s303、当接收到服务请求时,目标服务设备通过加载第一模型文件处理服务请求。
75.其中,目标服务设备获取到第一模型文件并利用获取到的第一模型文件对提供服务的模型文件进行更新后,当接收到服务请求时,目标服务设备再通过加载第一模型文件来提供服务,具体的服务是由客户通过服务设备发起的,更具体的,如拍照后,将该照片上传到服务设备以触发服务。
76.在一种可能的实现方式中,多个服务设备中的每个服务设备上运行有模型管理系统的代理进程,目标服务设备通过代理进程采集各个服务设备上的模型部署信息,该模型部署信息包括每个服务设备上部署的模型文件的描述信息和摘要信息,摘要信息是代理进程利用md5信息摘要算法,根据每个服务设备上的模型文件。摘要信息主要是用来标记模型文件,以快速的确定出模型文件是哪一个。服务设备获取模型部署信息后,将其发送给模型管理设备,以使得模型管理设备根据模型部署信息中的模型文件的描述信息以及摘要信息生成模型部署情况表。其中,模型部署情况表表中包括了各个服务设备的标识信息、模型文件的摘要信息、模型文件的功能描述信息以及模型文件的版本描述信息等。值得注意的是,各个服务设备是周期性的采集服务设备的模型文件的描述信息以及计算出摘要信息,并且也是周期性的上报给模型管理设备,以便模型管理设备更好的对服务设备的模型部署信息进行管理。同时,该模型部署情况表还会被模型管理设备发送个客户端,在客户端收到用户对模型文件的部署情况进行查询时,客户端就通过查询模型部署情况表获取模型文件的部署情况。
77.本发明实施例,目标服务设备接收包括第一模型文件的描述信息的模型更新指令,其中,模型更新指令是由模型管理设备在接收到客户端发送的模型更新请求之后向目标服务设备发送的,进而目标服务设备根据第一模型文件的描述信息从模型仓库中获取到第一模型文件,并利用第一模型文件对提供服务的模型文件进行更新,当接收到服务请求时,目标服务设备再通过加载第一模型文件处理服务请求。通过实施该方法,可以实现对模型文件快速更新,也能实现对模型文件的批量管理,从而提高了模型管理系统对模型的管理效率,有效降低运维的复杂度。
78.请参见图4,图4是本发明实施例提供的又一种模型管理系统的架构示意图,如图4所示,该模型管理系统(vesta)由模型管理系统的客户端(vesta client)、模型管理系统的代理进程(vesta agent)以及模型管理平台(vesta)构成,其中:
79.client:向vesta发送模型部署信息、模型上传信息、模型加载信息;也接收vesta发送的模型列表,具体包括模型文件列表和模型部署情况表。client可以根据模型列表维护模型版本以及每个版本的模型部署情况。用户可以通过client指定服务加载更新后的模型。
80.agent:部署于服务所在的节点,会将本机上的模型信息与vesta同步,即图4中向vesta发送的模型部署,agent还接收vesta发送的模型以及模型更新指令,并控制服务对模型文件的加载。
81.vesta:vesta接收client发送的模型部署信息,主要为模型更新请求;vesta接收client发送到的模型上传信息,主要是通过模型文件的摘要信息对模型文件进行管理;vesta接收client发送的模型加载,该模型加载信息主要是用于指示vesta agent提供服务时加载模型。vesta通过与agent同步获得各个节点上的模型信息,生成模型部署情况表;
vesta还分发模型更新指令给agent。
82.其中,client、vesta以及agent具体实现的方法步骤在上述实施例中已经具体说明了,这里就不再一一赘述。
83.请参见图5,图5是本发明实施例提供的一种模型文件更新管理的流程示意图,该流程图是从模型管理系统中模型管理设备、客户端与服务设备交互的角度进行阐述的,该流程图主要阐述的是对目标服务设备的模型文件更新管理,具体的交互流程:
84.s501、客户端向模型管理设备发送模型更新请求,该模型更新请求包括服务设备的标识信息和第一模型文件的描述信息。
85.s502、模型管理设备根据服务设备的标识信息确定出目标服务设备。
86.其中,模型管理设备根据服务设备的标识信息从多个服务设备中确定出目标服务设备,模型更新请求携带的服务标识信息不仅限于一个,相对应的,确定出来的目标服务设备也不仅限于一个。
87.s503、模型管理设备向服务设备中的目标服务设备发送模型更新指令,该模型更新指令中包括第一模型文件的描述信息。
88.针对步骤s503,可选地,在模型管理设备向服务设备中的目标服务设备发送模型更新指令之前,模型管理设备需要检测在模型管理设备中存储的目标服务设备的模型文件的描述信息与第一模型文件的描述信息是否一致,其中,模型管理设备中存储的服务设备的模型文件的描述信息是以模型部署情况表的形式记录的。若不一致,模型管理设备则向目标服务设备发送模型更新指令,这样可以在一定程度上减少处理设备做无效操作,若是一致,则表明目标服务设备不需要对模型文件的描述信息进行更新。
89.s504、目标服务设备根据第一模型文件的描述信息从模型仓库中获取第一模型文件。
90.其中,模型仓库可能是模型管理设备、云存储设备以及数据存储设备中任一设备中。
91.s505、目标服务设备向模型管理设备发送模型更新验证消息。
92.s506、模型管理设备对模型更新验证消息进行校验。
93.s507、模型管理设备向客户端发送模型更新确认请求。
94.s508、客户端向模型管理设备发送模型更新确认指令,模型管理设备再向目标服务设备转发模型更新确认指令。
95.s509、目标服务设备利用第一模型文件对提供服务的模型文件进行更新,并在接收到服务请求时,通过加载第一模型文件处理服务请求。
96.本发明实施例,客户端向模型管理设备发送包括服务设备的标识信息和模型文件的描述信息的模型更新请求;模型管理设备根据服务设备的标识信息从多个服务设备中确定出目标服务设备,同时,模型管理设备还要检验目标服务设备上的模型文件的描述信息与接收的模型文件的描述信息是否一致。若是不一致,模型管理设备向确定的目标服务设备发送模型更新指令,目标服务设备根据模型更新指令中携带的第一模型文件的描述信息从模型仓库中确定出所需要的第一模型文件,将待更新的模型文件的部署情况发送给模型管理设备请求验证。模型管理设备验证通过则向客户端请求确认,在客户端发送模型更新确认指令后,目标服务设备利用从模型仓库中获取的第一模型文件对收到的服务请求进行
处理。上述通过模型管理系统中的设备的交互,能高效的对需要更改的模型文件进行更改。
97.请参见图6,图6是本发明实施例提供的一种模型文件入库管理的流程示意图,该流程图是从模型管理系统中模型管理设备与客户端交互的角度进行阐述的,该流程图主要阐述的是对客户端发送的模型文件进行入库的管理,该流程图主要包括以下步骤:
98.s601、客户端向模型管理设备发送第二模型文件以及第二模型文件的描述信息。
99.s602、模型管理设备获取所述第二模型文件的摘要信息。
100.s603、模型管理设备检测模型仓库中是否存在模型文件的摘要信息与所述第二模型文件的摘要信息相一致的情况,若不存在,则将第二模型文件存储到模型仓库,并更新模型仓库对应的模型文件列表。
101.s604、模型管理设备向客户端发送摘要信息相一致的第二模型文件以及更新的模型仓库对应的模型文件列表。
102.s605、客户端通过模糊匹配查询模型文件列表中的模型文件的描述信息。
103.本发明实施例,客户端将第二模型文件以及模型文件的描述信息发送给模型管理设备,模型管理设接收到模型文件以及模型文件的描述信息后,获取第二模型文件的摘要信息,将该摘要信息与模型仓库中的模型文件的摘要信息进行比对,若是检测到所获取的模型文件的摘要信息与模型管理设对应的模型仓库中的模型文件信息的摘要信息向一致,则将摘要信息一致的第二模型文件返回给客户端,同时,将摘要信息不一致的第二模型文件进行入库,并更新模型仓库对应的模型文件列表,并将模型文件列表返回给客户端,通过上述实施例,可以实现对信模型文件的入库管理,同时方便用户通过客户端的可视化界面查询目前模型文件的相关信息。
104.请参见图7,图7是本发明实施例提供的一种模型文件部署管理的流程示意图,该流程图是从模型管理系统中模型管理设备、客户端与服务设备交互的角度进行阐述的,该流程图主要阐述是对服务设备发送的模型文件的部署信息的管理,具体步骤:
105.s701、目标服务设备通过代理进程采集模型部署信息,模型部署信息包括每个服务设备上部署的模型文件的描述信息和摘要信息。
106.s702、目标服务设备向模型管理设备发送模型部署信息。
107.其中,目标服务设备是周期性的向模型管理设备发送模型部署信息的。
108.s703、模型管理设备根据模型部署信息生成模型部署情况表。
109.s704、模型管理设备向客户端发送模型部署情况表。
110.其中,该模型部署情况表包括每个服务设备上部署的模型文件的描述信息,以及模型仓库中每个模型文件部署的服务设备的标识信息。
111.s705、客户端利用模糊匹配查询模型部署情况表中的服务设备的模型部署信息。
112.本发明实施例中,目标服务设备根据运行在服务设备上的模型管理系统的代理进程采集模型部署信息,模型部署信息包括了目标服务设备上部署的模型文件的描述信息和摘要信息。目标服务设备将模型部署信息发送给模型管理设备,模型管理系统在收到模型部署信息后,根据每个服务设备发送的模型部署信息生成模型部署情况表,模型管理设备将模型部署情况表发送给客户端,通过上述实施例,能实现对服务设备上的模型部署信息进行高效的管理,同时,也能便与客户端查询服务设备的模型部署信息。
113.请参见图8,图8是本发明实施例提供的一种模型管理装置的示意图,该装置80包
括:接收模块801、确定模块802、发送模块803,获取模块804、检测模块805,处理模块806,其中:
114.接收模块801,用于接收模型更新请求,所述模型更新请求包括服务设备的标识信息和第一模型文件的描述信息。
115.确定模块802,用于根据所述服务设备的标识信息确定出目标服务设备。
116.发送模块803,用于向所述目标服务设备发送模型更新指令,所述模型更新指令包括所述第一模型文件的描述信息,所述模型更新指令用于指示所述目标服务设备根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对收到的服务请求进行处理。
117.在一种可能的实现方式中,所述描述信息包括功能描述信息和版本描述信息。
118.在一种可能的实现方式中,接收模块801,还用于接收第二模型文件和所述第二模型文件的描述信息。
119.获取模块804,用于获取所述第二模型文件的摘要信息。
120.检测模块805,用于检测所述模型仓库中是否存在模型文件的摘要信息与所述第二模型文件的摘要信息相一致的情况。
121.处理模块806,还用于若不存在,则将所述第二模型文件存储到所述模型仓库中,并更新所述模型仓库对应的模型文件列表。
122.在一种可能的实现方式中,接收模块801,用于接收模型部署信息,所述模型部署信息包括每个服务设备上部署的模型文件的描述信息和摘要信息,所述模型部署信息是由代理进程采集得到的。
123.处理模块806,用于根据所述模型部署信息生成模型部署情况表,所述模型部署情况表包括所述每个服务设备上部署的模型文件的描述信息和所述模型仓库中每个模型文件部署的服务设备的标识信息。
124.在一种可能的实现方式中,确定模块802,用于根据所述模型部署情况表确定所述目标服务设备上部署的模型文件的描述信息。
125.检测模块805,用于检测所述第一模型文件的描述信息与所述目标服务设备上部署的模型文件的描述信息是否一致。
126.发送模块803,用于若不一致,则执行所述向所述目标服务设备发送模型更新指令的步骤。
127.请参见图9,图9是本发明实施例提供的另一种模型管理装置,该装置90包括:接收模块901、获取模块902、处理模块903、发送模块904。其中:
128.接收模块901,用于接收模型更新指令,所述模型更新指令包括第一模型文件的描述信息。
129.获取模块902,用于根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件。
130.处理模块903,用于利用所述第一模型文件对提供服务的模型文件进行更新。
131.所述处理模块903,还用于当接收到服务请求时,通过加载所述第一模型文件处理所述服务请求。
132.在一种可能的实现方式中,处理模块903,用于通过代理进程采集模型部署信息,
所述模型部署信息包括目标服务设备上部署的模型文件的描述信息和摘要信息。
133.发送模块904,用于向模型管理设备发送所述模型部署信息,以使得所述模型管理设备根据所述每个服务设备发送的模型部署信息生成模型部署情况表,所述模型部署情况表包括所述每个服务设备上部署的模型文件的描述信息和所述模型仓库中每个模型文件部署的服务设备的标识信息。
134.请参见图10,为本发明实施例提供了一种模型管理设备的结构示意图。该模型管理设备可包括处理器1001、存储器1002和通信接口1003,所述处理器1001、存储装置1002和通信接口1003之间可以交互数据。
135.所述存储装置1002可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储装置1002也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,ssd)等;所述存储装置1002还可以包括上述种类的存储器的组合。所述通信接口1003用于收发数据。
136.所述存储器1002用于存储计算机程序,所述计算机程序包括程序指令,所述处理器1001被配置用于调用所述程序指令,执行:
137.通过所述通信接口1003接收模型更新请求,所述模型更新请求包括服务设备的标识信息和第一模型文件的描述信息。
138.根据所述服务设备的标识信息确定出目标服务设备。
139.通过所述通信接口1003向所述目标服务设备发送模型更新指令,所述模型更新指令包括所述第一模型文件的描述信息,所述模型更新指令用于指示所述目标服务设备根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对收到的服务请求进行处理。
140.在一种可能的实现方式中,所述描述信息包括功能描述信息和版本描述信息。
141.在一种可能的实现方式中,处理器1001,还用于:
142.接收第二模型文件和所述第二模型文件的描述信息。
143.获取所述第二模型文件的摘要信息。
144.检测所述模型仓库中是否存在模型文件的摘要信息与所述第二模型文件的摘要信息相一致的情况。
145.若不存在,则将所述第二模型文件存储到所述模型仓库中,并更新所述模型仓库对应的模型文件列表。
146.在一种可能的实现方式中,处理器1001,还用于:
147.接收模型部署信息,所述模型部署信息包括每个服务设备上部署的模型文件的描述信息和摘要信息,所述模型部署信息是由代理进程采集得到的。
148.根据所述模型部署信息生成模型部署情况表,所述模型部署情况表包括所述每个服务设备上部署的模型文件的描述信息和所述模型仓库中每个模型文件部署的服务设备的标识信息。
149.在一种可能的实现方式中,处理器1001,还用于:
150.根据所述模型部署情况表确定所述目标服务设备上部署的模型文件的描述信息。
151.检测所述第一模型文件的描述信息与所述目标服务设备上部署的模型文件的描
述信息是否一致。
152.若不一致,则执行所述向所述目标服务设备发送模型更新指令的步骤。
153.请参见图11,为本发明实施例提供了一种服务设备的结构示意图。如图11所示,该服务设备可包括处理器1101、存储器1102和通信接口1103,所述处理器1101、存储装置1102和通信接口1103之间可以交互数据。
154.所述存储装置1102可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储装置1102也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,ssd)等;所述存储装置1102还可以包括上述种类的存储器的组合。所述通信接口1103用于收发数据。
155.所述存储器1102用于存储计算机程序,所述计算机程序包括程序指令,所述处理器1101被配置用于调用所述程序指令,执行:
156.通过所述通信接口1103接收模型更新指令,所述模型更新指令包括第一模型文件的描述信息;
157.根据所述第一模型文件的描述信息从模型仓库中获取所述第一模型文件,并利用所述第一模型文件对提供服务的模型文件进行更新;
158.当接收到服务请求时,通过加载所述第一模型文件处理所述服务请求。
159.在一种可能的实现方式中,所述处理器1101,还用于:
160.通过代理进程采集模型部署信息,所述模型部署信息包括目标服务设备上部署的模型文件的描述信息和摘要信息。
161.向模型管理设备发送所述模型部署信息,以使得所述模型管理设备根据所述每个服务设备发送的模型部署信息生成模型部署情况表,所述模型部署情况表包括所述每个服务设备上部署的模型文件的描述信息和所述模型仓库中每个模型文件部署的服务设备的标识信息。
162.本发明实施例还提供了一种计算机存储介质,该计算机存储介质中存储有程序指令,该程序指令被执行时,用于实现上述实施例中描述的相应方法。
163.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的
164.在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
165.上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个
网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
166.另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
167.上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:u盘、移动硬盘、磁碟、光盘、只读存储器(英文:read-only memory,缩写:rom)或者随机存取存储器(英文:random access memory,缩写:ram)等各种可以存储程序代码的介质。
168.以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献