一种模糊规则库增量更新方法与流程

2023-02-14 16:30:26 来源：中国专利 TAG：

1.本发明属人工智能技术领域，尤其涉及一种模糊规则库增量更新方法。

背景技术：

2.通常，在人工智能领域，模式识别和机器学习的工具能在降低数据库的维数的同时，建立一个强大的分类器。近年来，为了解决数据的动态增长问题，如果采取重新扫描更新后的数据集进行重新计算的方式会导致时间和空间的浪费，甚至在一些大规模数据上，这些方法将不再适用。
3.目前，基于粗糙集的增量学习方法分为三种：知识表示的更新，规则约简的更新和特征选择的更新。首先，知识表示的更新方法是指在动态数据集中，基于不同粗糙集扩展模型的更新上下近似的方法，如紧邻粗糙集,优势关系粗糙集，贝叶斯粗糙集等，这些更新方法针对数据示例的逐个更新,数据示例的批量更新、特征的增减更新等不同的情况分别讨论，分析了粗糙近似知识表示的相应的增量学习机制。其次，一些学者在规则约简更新中提出了增量的更新方法，这些方法多数考虑了在逐个添加示例的情况下规则的更新方法，近年来也有分组添加示例的规则学习的更新方法。最后一种关于特征选择的动态更新的相关研究较少，且集中于离散值数据集的动态变化问题，即便是针对连续值数据集，也是面向属性集更新，无法解决连续性动态数据上的增量特征提取问题。

技术实现要素：

4.为解决上述技术问题，本发明提出了一种模糊规则库增量更新方法，为了解决连续性动态数据上的规则库增量更新问题。
5.本发明采用以下技术方案：
6.一种模糊规则库增量更新方法，包括以下步骤：
7.首先根据模糊粗糙集理论生成原始规则库，基于静态规则库属性约简算法，对于模糊规则前件进行属性约简；
8.加入新的规则后再根据一致度变化更新所述原始规则库，基于模糊规则库的增量更新算法生成新规则库；
9.所述模糊规则库的增量更新算法包括：
10.计算原始样本在包含新增样本的属性全集和原有属性值约简上的一致度；
11.动态数据集上计算一致度的方法：
[0012][0013]
判断新增样本的属性约简一致度和原有属性值约简上的一致度两者是否相等，若相等，则其属性值约简保持不变，规则库中对应的规则也保持不变；如果两者不相等，则更新该属性值约简，更新原始规则库。
[0014]
所述基于静态规则库属性约简算法包括以下步骤：
[0015]
1)首先，计算数据集中每个样本的一致度；给定一个模糊决策表dt＝《u，r，d》，u为整个论域，r表示规则前件，d表示规则后件，如果一些新示例δu＝{x
n 1
，x
n 2
，...，x
n s
}加入进来，生成动态模糊决策表dt＝《u∪δu，r，d》，，计算度量样本信息含量的关键值即一致度；
[0016]
2)然后，创建约简属性集合和候选属性集合，约简属性集合开始为空，候选属性集合里包含所有条件属性，针对每个样本，依次从候选属性中选取条件属性，并计算每次增加属性后的样本一致度，当加入某属性后一致度增加时则该属性为约简属性，若加入某属性后一致度不变则该属性仍留在候选属性，直到样本一致度与全属性计算时一致，则一致度满足条件，停止计算。
[0017]
3)最后删除候选属性中的冗余属性，最终得到约简样本，所有样本的属性值约简组成新的规则库。
[0018]
所述一致度的计算公式为：
[0019][0020]
这里rc(x，y)表示x,y之间的相似度，rd(x，y)＝0表示x,y为异类点，一致度的物理意义为距离x最近的异类点的距离，α表示一个阈值。
[0021]
加入新的规则时，采用基于一致度的属性值约简算法计算新数据的属性值约简，将新数据对应的规则加入已有规则库。
[0022]
加入新示例后每条规则计算一致度存在一种情况，第一种情况为新示例可以与原有规则匹配，加入新样例后指模糊边界一致度变小，一致度更新为变小后的新一致度。
[0023]
加入新示例后每条规则计算一致度存在另一种情况，新示例与原有规则匹配，但加入新示例后指模糊边界一致度不变或变大，一致度取最小值，这种情况下一致度保持不变。
[0024]
加入新示例后每条规则计算一致度存在另一种情况，样本为新示例无法与原有规则匹配，则出现一条新的规则，按照已有算法计算其一致度。
[0025]
通过动态数据集上的一致度计算方法得出，在给定模糊决策表dt＝《u∪δu，r，d》中，p为更新后的规则，存在δs为变
动规则集，即包含上述的规则集；如果那么这时达到最大，只考虑x∈δs如何选择属性。
[0026]
本发明实施例提供的模糊规则库增量更新方法中，、加入新示例计算一致度时，重点在于变动规则集，即仅考虑新示例可以与原有规则匹配，加入新样例后指模糊边界(一致度)变小的情况，与新示例无法与原有规则匹配，出现一条新的规则的情况下，如何选择属性，进行属性约简，在变动规则集上对规则库增量更新可以大大缩短时间，从而实现高效处理大规模数据。该算法在对原始规则库的模糊规则动态更新时，相比于重新扫描更新后的数据集进行重新计算的方式，利用已有的约简结果可以有效地提高规则库更新的效率。本发明提出一系列的增量属性值约简、规则生成、规则库增量更新算法，实现动态更新规则库。相比于重新扫描更新后的数据集进行重新计算的方式，利用已有的约简结果可以有效地提高规则库更新的效率。通过在新示例改变的变动规则集上对规则库增量更新进一步缩短约简时间。处理动态更新数据时，增量属性值约简算法可以提到处理效率。
附图说明
[0027]
图1为本发明实施例提供的一种模糊粗糙集增量约简流程示意图；
[0028]
图2为本发明实施例提供的一种增量规则提取与非增量规则提取时间比较示意图。
具体实施方式
[0029]
本发明实施例提供了一种模糊规则库增量更新方法，将粗糙集属性值约简和增量学习理论结合，建立一套完整、严谨的基于模糊粗糙集的模糊规则库的增量更新方法，来解决动态连续值数据集上的属规则库更新问题。
[0030]
模糊规则库增量更新包含两步：首先基于领域知识和模糊粗糙集理论生成原始规则库，基于静态规则库属性约简算法对于模糊规则前件进行属性约简；加入新的规则后再根据一致度变化更新规则库，基于模糊规则库的增量更新算法生成新规则库。
[0031]
具体实施方案如下：
[0032]
1、基于一致度的属性值约简算法，流程如下：
[0033]
1)首先，计算数据集中每个样本的一致度；给定一个模糊决策表dt＝《u，r，d》，u为整个论域，r表示规则前件，d表示规则后件，如果一些新示例δu＝{x
n 1
，x
n 2
，...，x
n s
}加入进来，生成动态模糊决策表dt＝《u∪δu，r，d》。计算度量样本信息含量的关键值——一致度。
[0034]
2)然后，创建约简属性集合和候选属性集合，约简属性集合开始为空，候选属性集合里包含所有条件属性，针对每个样本，依次从候选属性中选取条件属性，并计算每次增加属性后的样本一致度，当加入某属性后一致度增加时则该属性为约简属性，若加入某属性后一致度不变则该属性仍留在候选属性，直到样本一致度与全属性计算时一致，则一致度满足条件，停止计算。
[0035]
一致度的计算公式：
[0036]
[0037]
这里rc(x，y)表示x,y之间的相似度，rd(x，y)＝0表示x,y为异类点，一致度的物理意义为距离x最近的异类点的距离，α表示一个阈值，避免同类点被错误分类。
[0038]
3)最后删除候选属性中的冗余属性，最终得到约简样本。所有样本的属性值约简组成了规则库。
[0039]
2、模糊规则库增量更新算法，这里是本发明创新点所在，更新规则库流程如下，参见图1：
[0040]
1)计算原始样本在包含新增样本的属性全集和原有属性值约简上的一致度；
[0041]
动态数据集上计算一致度的方法：
[0042][0043]
参数在前文已说明。
[0044]
2)判断新增样本的属性约简一致度和原有属性值约简上的一致度两者是否相等，若相等，则其属性值约简保持不变，规则库中对应的规则也保持不变。如果两者不相等，则需要更新该属性值约简，从而更新原始规则库。加入新的规则时，依然采用基于一致度的属性值约简算法计算新数据的属性值约简，从而将新数据对应的规则加入已有规则库。
[0045]
形象来说，加入新示例后每条规则计算一致度可能存在三种情况，第一种情况为新示例可以与原有规则匹配，加入新样例后指模糊边界(一致度)变小，因此一致度更新为变小后的新一致度；第二种情况为新示例可以与原有规则匹配，但加入新示例后指模糊边界(一致度)不变或变大，由于一致度取最小值，因此这种情况下一致度保持不变；第三种情况为样本为新示例无法与原有规则匹配，则出现一条新的规则，按照已有算法计算其一致度。
[0046]
参见图2，通过上述动态数据集上的一致度计算方法可以得出，在给定模糊决策表dt＝《u∪δu，r，d》中，p为更新后的规则，存在δs为变动规则集，即包含上述第一种情况和第三种情况下的规则集。如果即上述第二种情况，那么这时已经达到最大。只需要考虑x∈δs如何选择属性，从而缩短约简时间。
[0047]
其原理为：
[0048]
基于静态规则库构建的知识，如果重新计算一致度既费时又存在重复计算。本专利提出在动态数据集上更新一致度，实现高效增量属性值约简。
[0049]
通过分析添加示例前后一致度的变化，提出了一致度计算的增量属性值约简算法。基于这个增量属性值约简算法请清晰、详细地列出来该算法的步骤，逻辑正确。可以通过避免在动态数据集上的冗余计算显著地减少计算时间。然后，基于严格的理论推导发现
了已有约简的辨识能力改变的关键数据。关键数据即为加入新示例后变动规则集，这个发现使得在有限的数据上快速更新已有约简变得可行。最后，基于增量属性值约简算法进行规则生成，从而实现规则库增量更新。相关实验表明了该增量算法是有效且高效的，特别是在高维数据集上效果更加突出。
[0050]
通过上述动态数据集上的一致度计算方法可以得出，在给定模糊决策表dt＝＜u∪δu，r，d＞中，p为更新后的规则，存在δs为变动规则集，即包含上述第一种情况和第三种情况下的规则集。如果即上述第二种情况，那么这时已经达到最大。只需要考虑x∈δs如何选择属性，从而缩短约简时间。
[0051]
本发明欲保护的创新点
[0052]
1、加入新示例计算一致度时，重点在于变动规则集，即仅考虑新示例可以与原有规则匹配，加入新样例后指模糊边界(一致度)变小的情况，与新示例无法与原有规则匹配，出现一条新的规则的情况下，如何选择属性，进行属性约简，在变动规则集上对规则库增量更新可以大大缩短时间，从而实现高效处理大规模数据。
[0053]
2、该算法在对原始规则库的模糊规则动态更新时，相比于重新扫描更新后的数据集进行重新计算的方式，利用已有的约简结果可以有效地提高规则库更新的效率。
[0054]
本发明提出一系列的增量属性值约简、规则生成、规则库增量更新算法，实现动态更新规则库。相比于重新扫描更新后的数据集进行重新计算的方式，利用已有的约简结果可以有效地提高规则库更新的效率。通过在新示例改变的变动规则集上对规则库增量更新进一步缩短约简时间。处理动态更新数据时，增量属性值约简算法可以提到处理效率。
[0055]
具体实施例举例：
[0056]
步骤1：将原始数据集划分成两个数据集，取第一个数据子集，数据集可以描述成一个决策表，表示成一个三元组dt＝《u,r,d》，u是一个非空示例集{x1,x2,
…
,xn}，每个示例由一组条件属性r＝{a1,a2,
…
,am}以及一组决策属性d来构成。
[0057]
通过非增量规则库算法进行规则库构建，首先，计算数据集中每个样本的一致度；然后，创建约简属性集合和候选属性集合，约简属性集合开始为空，候选属性集合里包含所有条件属性，针对每个样本，依次从候选属性中选取条件属性，并计算每次增加属性后的样本一致度，当加入某属性后一致度增加时则该属性为约简属性，若加入某属性后一致度不变则该属性仍留在候选属性，直到样本一致度与全属性计算时一致，则一致度满足条件，停止计算；最后删除候选属性中的冗余属性，最终得到约简样本。所有样本的属性值约简组成了规则库，将初始规则库进行保存。
[0058]
一致度的计算公式：
[0059][0060]
这里rc(x，y)表示x,y之间的相似度，rd(x，y)＝0表示x,y为异类点，一致度的物理意义为距离x最近的异类点的距离。
[0061]
步骤2：读取第一个数据集合构建的初始规则库，取第二个数据子集作为新增的数据，每加入一条新示例，都按照上述方法重新计算每条规则的一致度，可能存在三种情况，
第一种情况为新示例可以与原有规则匹配，加入新样例后指模糊边界(一致度)变小，因此一致度更新为变小后的新一致度；第二种情况为新示例可以与原有规则匹配，但加入新示例后指模糊边界(一致度)不变或变大，由于一致度取最小值，因此这种情况下一致度保持不变；第三种情况为样本为新示例无法与原有规则匹配，则出现一条新的规则，按照已有算法计算其一致度，通过增量规则算法进行规则库更新，并保存规则库。
[0062]
对于本领域技术人员而言，显然本发明实施例不限于上述示范性实施例的细节，而且在不背离本发明实施例的精神或基本特征的情况下，能够以其他的具体形式实现本发明实施例。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明实施例的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统、装置或终端权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。
[0063]
最后应说明的是，以上实施方式仅用以说明本发明实施例的技术方案而非限制，尽管参照以上较佳实施方式对本发明实施例进行了详细说明，本领域的普通技术人员应当理解，可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于小波注意力和重塑融合的舌头体质识别方法

一种模糊规则库增量更新方法与流程

相关文献

最热文献