一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多级标签K近邻的完整性模型资源匹配方法与流程

2022-02-20 00:35:53 来源:中国专利 TAG:

基于多级标签k近邻的完整性模型资源匹配方法
技术领域
1.本发明涉及一种信息数据管理技术,特别涉及一种基于多级标签k近邻的完整性模型资源匹配方法。


背景技术:

2.随着经济的发展,现代企业之间的数据共享越来越重要,设计/制造/服务之间的数据共享需求更加迫切,数据共享的前提是资源可以相互匹配,这样才能实现数据共享。但是不同企业间的数据源、结构、形式各不相同,从而阻碍了数据共享。
3.在现有技术中,对资源匹配的研究大部分集中在云服务和云制造领域,资源匹配技术单一,大部分是采用基于单一的语义相似度的方法,匹配效率不高,阻碍数据共享。


技术实现要素:

4.针对数据匹配共享问题,提出了一种基于多级标签k近邻的完整性模型资源匹配方法,支持产品全生命周期各阶段之间的资源统一管理、资源匹配、资源共享。
5.本发明的技术方案为:一种基于多级标签k近邻的完整性模型资源匹配方法,具体包括如下步骤:
6.1)将任务分解为粒度合适的多个子任务,且每个子任务可被单资源执行;
7.2)对分解后的每个子任务对应建立其描述模型,然后进行完整性封装,建立起完整性封装模型;
8.3)将步骤2)建立的每个子任务描述模型与资源库中的资源进行多级标签匹配,若匹配成功,进行下一步匹配;
9.4)对每个子任务描述模型与步骤3)匹配的对应资源再进行k近邻法匹配,若匹配成功,进行后续工作,反之则失败,淘汰该子任务描述模型的资源样本数据。
10.进一步,所述步骤3)中每个子任务描述模型和资源库中的资源均为树形结构描述模型,当子任务描述模型和资源库中某一资源描述模型中所有标签的语义相似度均超过阈值,则认为此子任务描述模型和资源匹配成功,实现快速匹配。
11.进一步,所述标签包括功能范围标签、约束语境标签、参数标签和功能要求标签。
12.进一步,所述步骤4)中k近邻法匹配为:使用步骤3)中子任务描述模型匹配成功的对应资源作为资源训练集,利用k近邻法对子任务子任务描述模型进行分类判别,分类判别结果与设定的控制限比较后,获得匹配结果。
13.进一步,所述k近邻法匹配,在资源训练集中寻找某一个样本xi的前k个近邻样本,记其中表示样本xi的第j个近邻样本;接着计算样本xi与其k个近邻样本的欧式距离平方和作为统计值,即然后确定一个控制限在资源训练集中寻找待测样本x的前k个近邻,计算x与其k个近邻样本的欧式距
离平方和比较与大小,若则淘汰这个样本资源,其中k值选择采用交叉验证来选取,控制限取p
±
3s,p为平均值,s为标准偏差。
14.本发明的有益效果在于:本发明基于多级标签k近邻的完整性模型资源匹配方法,在任务分解、建立子任务描述模型、建立完整性封装模型后提出了两轮资源匹配方法。第一轮:采用多级标签匹配进行第一轮资源匹配,第一轮匹配上的,再进行第二轮的细化匹配。第二轮:采用近邻法获取k个近邻,淘汰大于控制限的近邻,从而获得属于一个类别的资源,达到能高效地进行资源匹配的效果。这样能取到更加吻合模型的数据,为后续分析数据等一系列工作奠定了基础,有利于数据的共享,为各个领域提供数据参考。
附图说明
15.图1为本发明基于多级标签k近邻的完整性模型资源匹配方法流程图;
16.图2为本发明方法中多级标签匹配流程图;
17.图3为本发明方法中k近邻匹配流程图。
具体实施方式
18.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
19.本发明提出一种基于多级标签k近邻的完整性模型资源匹配方法,可以达到快速有效的资源匹配效果。如图1所示流程图,方法具体包括如下步骤:
20.步骤1:将任务分解为粒度合适的多个子任务,且保证每个子任务是可以被资源库中的某个单独资源独立完成;
21.步骤2:对分解后的每个子任务对应建立其描述模型,然后进行完整性封装,建立起完整性封装模型;
22.步骤3:将步骤2建立的每个子任务描述模型与资源库中的资源进行多级标签匹配,若匹配成功,进行下一步匹配;
23.步骤4:对每个子任务描述模型与步骤3)匹配的对应资源再进行k近邻法匹配,进一步提高资源匹配的吻合度。若匹配成功,进行后续工作,反之则失败,淘汰该子任务描述模型的资源样本数据;
24.在步骤1中,首先根据任务的功能、零部件等特点进行任务分解,将一个任务分解为多个子任务,分解后的每个子任务要保证作为单资源可执行。分解时,保障单独资源独立完成的前提下,同时将任务分解为粒度更大的子任务,这样可以节约成本和损耗。
25.在步骤2中,根据子任务的功能类型、本体属性、评价指标等内容构建子任务统一化描述模型,统一化这是为了每个描述模块连接起来,并进行完整性封装,建立完整性封装子任务描述模型;
26.在步骤3中,将子任务描述模型与资源库中的各种资源进行多级标签匹配;为了提高资源的匹配吻合度,提出了一种基于多级标签的资源匹配方法,对资源进行快速匹配。子任务和资源的描述模型都是一种基于集合,有多级标签组成的树形结构描述模型。在资源匹配时可利用此特点,对各级元素分别计算语义相似度,当子任务和资源所有对应元素的
语义相似度均超过阈值,此时可认为子任务和资源匹配成功。在此实例中分为四个标签,分别为:功能范围标签、约束语境标签、参数标签和功能要求标签。流程如图2所示,将子任务描述模型依次与多个标签依次匹配。某一子任务描述模型与资源库中资源匹配的具体流程:

做好资源与模型匹配的准备工作,初始化参数i=1。

计算子任务与资源在第i级标签上的语义相似度。

若相似度大于设定的阈值则进行下一级的匹配,反之,则匹配失败,淘汰该资源。

依次进行第三步,直到四次标签都匹配成功,进行下一步工作。
27.在步骤4中,因为多级标签匹配可能存在误差,对子任务与子任务模型对应的资源进行又一轮的匹配。而k近邻算法可以在样本(样本指的是资源,即步骤3中某一子任务对应的资源)中找出大多数属于一个类别的资源,基于此优势所以在步骤3的基础上再进行k近邻法匹配:首先在子任务的资源训练集中(子任务的资源训练集指的是用步骤3匹配的结果,即某一子任务对应的资源,作为步骤四的数据集),寻找某一个样本xi的前k个近邻样本,记其中表示样本xi的第j个近邻样本。接着计算样本xi与其k个近邻样本的欧式距离平方和作为统计值,即然后确定一个控制限在资源训练集中寻找待测样本x的前k个近邻,计算x与其k个近邻样本的欧式距离平方和比较与大小,若则淘汰这个资源(指的是某一子任务描述模型对应的资源)。其中k值和控制限的确定尤为重要,k值的选择采用交叉验证来选取,控制限取p
±
3s(p为平均值,s为标准偏差)。流程如图3所示,子任务描述模型对应的资源具体匹配流程如下:

在多级标签匹配结束后,在训练集中寻找每个样本的前k个近邻样本。

计算每个样本与其k个近邻样本的欧氏距离平方和。

设置一个训练模型的控制限。

若欧氏距离平方和大于等于控制限则匹配失败,则淘汰该资源。反之,则匹配成功。这样依次完成所有子任务的匹配,为后续资源调度提供服务。
28.这样经过上述四个步骤,就能取到更加吻合模型的数据,从而可以达到高效快速地资源匹配的效果,为后续分析数据等一系列工作奠定了基础。
29.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献