基于神经网络技术解决数据泛化不均衡问题的方法与流程

2022-03-23 04:30:12 来源：中国专利 TAG：

1.本发明涉及数据分类的技术领域，具体涉及基于神经网络技术解决数据泛化不均衡问题的方法。

背景技术：

2.数据泛化在分类研究中占有重要地位，它是分类规则挖掘算法的基础。分类任务的一个重要特征就是数据量庞大，且数据中含有一定量的异常信息，这样的数据是不适合直接分类的。通过数据泛化，可以将数据整理、清洁，为分类提供较好的数据环境。另外数据泛化采用了概念层次技术，可以发现高层的分类规则，从而使分类结果更易理解。
3.数据泛化是一个从相对低层概念到更高层概念且对数据库中与任务相关的大量数据进行抽象概述的一个分析过程。
4.分类的数据环境应具备以下几个特点：(1)数据应包含丰富的属性信息，应具备可靠性和稳定性；(2)数据的属性应具有对于分类任务的相关性。大多数的分类任务只与数据库中部分属性有关，多余的、无关的属性介入分类，常会减慢甚至错误引导分类过程，应此必须去掉无关属性。(3)数据应具有高层数据信息，以发现清晰的、高层的、具有统计意义的分类规则。
5.但是，针对部分属性无关，多余的、无关的属性的数据在某些特定类型的分类中反而具有区分两种类型的关键因素，因此，现有技术中数据泛化存在不均衡的问题。亟需一种技术可以解决上述技术问题。

技术实现要素：

6.本发明提供基于神经网络技术解决数据泛化不均衡问题的方法，现有技术中数据泛化存在不均衡的问题。
7.本发明提供基于神经网络技术解决数据泛化不均衡问题的方法，包括：
8.确定待分类的第一数据集和第二数据集，所述第一数据集与所述第二数据集具有微小差别；
9.分别提取所述第一数据集和第二数据集的孤立点，所述孤立点在所述第一数据集和第二数据集中是少量的，是引起第一数据集与第二数据集具有变化的离异点；
10.将所述第一数据集的孤立点与所述第二数据集的孤立点进行特征普遍化，分别形成第一数据集的第一特征点和第二数据集的第二特征点；
11.采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类。
12.可选的，在所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，之前包括：
13.将所述第一数据集的若干个第一特征点构成第一特征点集，将所述第二数据集的若干个第二特征点构成第二特征点集；
14.相应的，所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，包括：
15.采用神经网络技术对所述第一特征点集和所述第二特征点集进行分类；
16.将分类结果应用于所述第一数据集和第二数据集的分类。
17.可选的，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
18.步骤a1，将所述第一数据集采用聚类算法划分为若干个不相交的数据集；
19.步骤a2，确定每个数据集中的数据的数量，根据数量多少对所述数据集进行降序排序，排序后的所述数据集按照排序位置具有相应的序号；
20.步骤a3，确定处于中间位置的数据集及该数据集包含的数据的数量；
21.步骤a4，根据下述公式确定数据集的临界位置的数据集的序号t：
[0022][0023][0024]
其中，t为临界位置的数据集的序号；c为中间位置的数据集的序号；nc为处于中间位置的数据集中数据的数量，n
t
为临界位置的数据集中数据的数量，n
t-1
为临界位置前一位置的数据集中数据的数量，p是中间位置的数据集排序的序号；c≤t≤n，n为划分的数据集的总数量；
[0025]
步骤a5，将序号为t，t 1，...n的数据集中包含的数据设定为孤立点。
[0026]
可选的，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
[0027]
步骤b1，将所述第一数据集采用聚类算法划分为若干个不相交的数据集；
[0028]
步骤b2，确定每个数据集中的数据的数量，根据数量多少对所述数据集进行升序排序，排序后的所述数据集按照排序位置具有相应的序号；
[0029]
步骤b3，确定处于中间位置的数据集及该数据集包含的数据的数量；
[0030]
步骤b4，根据下述公式确定数据集的临界位置的数据集的序号t：
[0031][0032][0033]
其中，t为临界位置的数据集的序号；c为中间位置的数据集的序号；nc为处于中间位置的数据集中数据的数量，n
t
为临界位置的数据集中数据的数量，n
t-1
为临界位置前一位置的数据集中数据的数量，p是中间位置的数据集排序的序号；1≤t≤c；
[0034]
步骤b5，将序号为t-1，t-2，...1的数据集中包含的数据设定为孤立点。
[0035]
可选的，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
[0036]
步骤c1，将所述第一数据集按照维度划分为若干个单元集合；
[0037]
步骤c2，确定每个单元集合的密度，将所有非零密度的单元集合设定为目标单元集合；
[0038]
步骤c3，从所述目标单元集合中任一单元集合采用相异函数查询其与相邻单元集合的关系，当所述单元集合与相邻所有单元集合的相异函数值小于阈值时，确定所述单元集合内的数据为孤立点；
[0039]
步骤c4，重复步骤c3，遍历所述目标单元集合中所有的单元集合，确定出所述第一数据集中的所有孤立点。
[0040]
可选的，所述采用神经网络技术对所述第一特征点集和所述第二特征点集进行分类中，所述神经网络算法如下：
[0041]
步骤d1，所述输入层为所述第一特征点集和所述第二特征点集包含的特征点数据；所述卷积层将所述输入层数据与滤波器进行卷积运算，运算公式如下：
[0042][0043]
其中，为第l层的第j个数据，aj为第一特征点集中的输入数据，bj为第二特征点集中的输入数据；为第l层的第一特征点集中第j个数据，为第l-1层的第一特征点集中第i个数据；为第l层的第二特征点集中第j个数据；为第l-1层的第二特征点集中第i个数据；为第l层的第j个数据和第l-1层的第i个数据连接的滤波器；为偏置；s(
·
)为激活函数；
[0044]
步骤d2，对所述卷积层输出的数据进行子采样，通过激活函数及子采样公式获得所述子采样层的数据：
[0045][0046][0047]
其中，为子采样公式；为偏置；为第l层的第一特征点集中第j个数据，为第l-1层的第一特征点集中第j个数据；为第l层的第二特征点集中第j个数据，为第l-1层的第二特征点集中第j个数据；
[0048]
步骤d3，采样步骤d2方式依次获得经过2次卷积层和采样层的数据；
[0049]
步骤d4，在连接层，将步骤d3获得的数据采用下述改进后的激活函数进行数据输出：
[0050][0051]
步骤d5，根据所述连接层的数据输出确定所述第一数据集和第二数据集的分类。
[0052]
可选的，采用所述神经网络算法构建分类模型；
[0053]
将确定的所述第一数据集和第二数据集输入至所述分类模型；
[0054]
根据所述分类模型对所述第一数据集和第二数据集进行分类。
[0055]
可选的，所述根据所述连接层的数据输出确定所述第一数据集和第二数据集的分类，之后还包括：
[0056]
根据下述公式确定输出概率：
[0057][0058]
其中，si为第i个输出数据的概率，ei为第i个输出数据以e为底求指数幂，∑
jej
为所有输出数据以e为底指数幂的和；
[0059]
根据下述公式确定交叉熵损失：
[0060]
δ＝-logsi
[0061]
根据所述交叉熵损失确定输出结果的准确性。
[0062]
可选的，所述分别提取所述第一数据集和第二数据集的孤立点，之前还包括：
[0063]
对所述第一数据集和第二数据集进行数据预处理，将所述第一数据集和第二数据集中重要部分的数据进行清洗删除。
[0064]
可选的，所述分别提取所述第一数据集和第二数据集的孤立点，之前还包括：
[0065]
提取所述第一数据集和第二数据集中的重要部分的数据作为特定特征点；
[0066]
相应的，所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，包括：
[0067]
采用神经网络算法根据第一特征点与第二特征点以及特定特征点对所述第一数据集和第二数据集进行分类。
[0068]
本技术提供基于神经网络技术解决数据泛化不均衡问题的方法，采用该方法在一定程度上解决了数据泛化不均衡的问题，该方法中对数据集的分类采用的方式是通过提取数据集中的孤立点，并将所述孤立点进行特征化形成特征点，通过神经网络依据特征点对所述数据集进行分类。因此，通过采用了数据集中不被重视的，甚至被称为噪声点的孤立点作为特征点，将数据集中的这些孤立点利用起来进行分类计算，可以解决数据泛化不均衡的问题。
[0069]
本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0070]
下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
附图说明
[0071]
附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：
[0072]
图1为本发明实施例中基于神经网络技术解决数据泛化不均衡问题的方法的流程图；
[0073]
图2为本发明实施例中孤立点的提取方法的流程图；
[0074]
图3为本发明实施例中孤立点的提取的另一种方法的流程图；
[0075]
图4为本发明实施例中孤立点的提取的另一种方法的流程图。
具体实施方式
[0076]
以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。
[0077]
实施例1：
[0078]
本发明实施例提供了基于神经网络技术解决数据泛化不均衡问题的方法，图1为本发明实施例中基于神经网络技术解决数据泛化不均衡问题的方法的流程图，请参照图1，该方法包括：
[0079]
s101，确定待分类的第一数据集和第二数据集，所述第一数据集与所述第二数据集具有微小差别；
[0080]
s102，分别提取所述第一数据集和第二数据集的孤立点，所述孤立点在所述第一数据集和第二数据集中是少量的，是引起第一数据集与第二数据集具有变化的离异点；
[0081]
s103，将所述第一数据集的孤立点与所述第二数据集的孤立点进行特征普遍化，分别形成第一数据集的第一特征点和第二数据集的第二特征点；
[0082]
s104，采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类。
[0083]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是针对具有微小差距或变化的两种类的分类方法，该情况虽然有特殊性，但是在大数据领域也越来越多的出现上述情况，因此，本实施例提供的方案在很大程度上解决了针对微小差距的分类。举例说明：若a类和b类相比变化较小，通过基本的二分法是没有办法将两者进行分类的，因为若a类和b类相差较小，则说明两类大部分特征是相同或相似的，将这些重要部分的特征作为提取的特征点是无法对两者进行区分的，这也就提到关于数据泛化不均衡的问题，一般情况下分类时，需要提取重要部分的特征进行比对，会删除或忽略不重要的、不起作用的一些特征，但是，在本实施例中，正是应用了那些不重要的不起作用的特征作为主要特征进行比对，因为，针对相差微小的两类，这些不重要的不起作用的特征反而记载着两者的差别，通过对这些被忽略的特征进行计算，实现对数据的分类。
[0084]
具体的，首先确定待分类的第一数据集和第二数据集，所述第一数据集与所述第二数据集具有微小差别。这就是本实施例的方案的前提条件，是对两个差别较小数据集的分类。
[0085]
其次，分别提取所述第一数据集和第二数据集的孤立点，所述孤立点在所述第一数据集和第二数据集中是少量的，是引起第一数据集与第二数据集具有变化的离异点。
[0086]
在该步骤中，是对第一数据集和第二数据集中孤立点的提取，所述孤立点是指不符合数据的一般模型的数据，在挖掘正常类知识时，通常总是把它们作为噪声来处理。也可称作离异点。
[0087]
通过各种方式和方法提取数据集中的孤立点，将所述孤立点作为后续步骤中比对计算的依据。
[0088]
再次，将所述第一数据集的孤立点与所述第二数据集的孤立点进行特征普遍化，分别形成第一数据集的第一特征点和第二数据集的第二特征点。
[0089]
由于所述第一数据集和第二数据集中的孤立点是独立的，是与其他数据不产生联系的点，所以在该步骤中，对所述孤立点进行特征普遍化，也就是定义所述孤立点为数据集中的特征点。该特征点与普遍意义中具有重要意义的特征点不同，该特征点是将在普遍意义中不被认定为特征点的孤立点设定为特征点，该设置与普遍意义上的特征点的设置的思维方式是相反的。
[0090]
最后，采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类。
[0091]
在该步骤中，采用根神经网络算法对所述第一特征点和第二特征点进行分类，由于所述第一特征点和第二特征点分别代表了所述第一数据集和第二数据集的区别特征，所以，通过对所述第一特征点和第二特征点进行分类可以实现对所述第一数据集和第二数据集的分类。
[0092]
综上，采用本实施例提供的方法在一定程度上解决了数据泛化不均衡的问题，本实施例对数据集的分类采用的方式是通过提取数据集中的孤立点，并将所述孤立点进行特征化形成特征点，通过神经网络依据特征点对所述数据集进行分类。因此，本实施例采用了数据集中不被重视的，甚至被称为噪声点的孤立点作为特征点，将数据集中的这些孤立点利用起来进行分类计算，可以解决数据泛化不均衡的问题。
[0093]
实施例2：
[0094]
在实施例1的基础上，在所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，之前包括：
[0095]
将所述第一数据集的若干个第一特征点构成第一特征点集，将所述第二数据集的若干个第二特征点构成第二特征点集；
[0096]
相应的，所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，包括：
[0097]
采用神经网络技术对所述第一特征点集和所述第二特征点集进行分类；
[0098]
将分类结果应用于所述第一数据集和第二数据集的分类。
[0099]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是根据神经网络算法进行分类之前，将将所述第一数据集的若干个第一特征点构成第一特征点集，将所述第二数据集的若干个第二特征点构成第二特征点集。不管是第一数据集还是第二数据集其包含的第一特征点即孤立点不可能是一个，所述第一特征点(孤立点)可以有多个，而数据集中所有孤立点整合为一个集合，形成第一特征点集和第二特征点集。
[0100]
相应的，对所述第一特征点和第二特征点的分类即对所述第一特征点集和第二特
征点集的分类，也就实现了对第一数据集和第二数据集的分类。
[0101]
本实施例是对实施例1的优化，也适合现实中常见的数据分类情况，同时，也可以解决数据泛化不均衡的问题。
[0102]
实施例3：
[0103]
图2为本发明实施例中孤立点的提取方法的流程图，请参照图2，在实施例1的基础上，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
[0104]
步骤a1，将所述第一数据集采用聚类算法划分为若干个不相交的数据集；
[0105]
步骤a2，确定每个数据集中的数据的数量，根据数量多少对所述数据集进行降序排序，排序后的所述数据集按照排序位置具有相应的序号；
[0106]
步骤a3，确定处于中间位置的数据集及该数据集包含的数据的数量；
[0107]
步骤a4，根据下述公式确定数据集的临界位置的数据集的序号t：
[0108][0109][0110]
其中，t为临界位置的数据集的序号；c为中间位置的数据集的序号；nc为处于中间位置的数据集中数据的数量，n
t
为临界位置的数据集中数据的数量，n
t-1
为临界位置前一位置的数据集中数据的数量，p是中间位置的数据集排序的序号；c≤t≤n，n为划分的数据集的总数量；
[0111]
步骤a5，将序号为t，t 1，...n的数据集中包含的数据设定为孤立点。
[0112]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是提取孤立点的方法，该方法的核心思想是对数据集中数据进行分类，计算每个类中数据的数量，并依据数量的多少对类进行排序，找出中间位置的类中的数据数量以及位置，然后根据公式确定临界位置的数据集的序号，查找出孤立点对应的类，并将该类中的所有数据设定为孤立点的集合。
[0113]
需要说明的是，计算每个类中数据的数量，并依据数量的多少对类进行排序中，是对序列进行降序排列。通过降序排列，孤立点出现在按序排列的类中的后几个类中。
[0114]
因此，采用本实施例提供的提取孤立点的方法可以保证提取孤立点的稳定性，相比于基于距离提取孤立点的方法更准确。
[0115]
实施例4：
[0116]
图3为本发明实施例中孤立点的提取的另一种方法的流程图，请参照图3。
[0117]
在实施例1的基础上，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
[0118]
步骤b1，将所述第一数据集采用聚类算法划分为若干个不相交的数据集；
[0119]
步骤b2，确定每个数据集中的数据的数量，根据数量多少对所述数据集进行升序排序，排序后的所述数据集按照排序位置具有相应的序号；
[0120]
步骤b3，确定处于中间位置的数据集及该数据集包含的数据的数量；
[0121]
步骤b4，根据下述公式确定数据集的临界位置的数据集的序号t：
[0122][0123][0124]
其中，t为临界位置的数据集的序号；c为中间位置的数据集的序号；nc为处于中间位置的数据集中数据的数量，n
t
为临界位置的数据集中数据的数量，n
t-1
为临界位置前一位置的数据集中数据的数量，p是中间位置的数据集排序的序号；1≤t≤c；
[0125]
步骤b5，将序号为t-1，t-2，...1的数据集中包含的数据设定为孤立点。
[0126]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是提取孤立点的方法，该方法的核心思想是对数据集中数据进行分类，计算每个类中数据的数量，并依据数量的多少对类进行排序，找出中间位置的类中的数据数量以及位置，然后根据公式确定临界位置的数据集的序号，查找出孤立点对应的类，并将该类中的所有数据设定为孤立点的集合。
[0127]
需要说明的是，计算每个类中数据的数量，并依据数量的多少对类进行排序中，是对序列进行升序排列。通过升序排列，孤立点出现在按序排列的类中的前几个类中。这是与实施例3具有区别的特征，不管是升序还是降序，后续参数及公式做相应调整即可。可满足不同类型的数据集的分类。
[0128]
因此，采用本实施例提供的提取孤立点的方法可以保证提取孤立点的稳定性，相比于基于距离提取孤立点的方法更准确。
[0129]
实施例5：
[0130]
图4为本发明实施例中孤立点的提取的另一种方法的流程图，请参照图4。
[0131]
在实施例1的基础上，所述提取所述第一数据集的孤立点中，所述孤立点的提取方式如下：
[0132]
步骤c1，将所述第一数据集按照维度划分为若干个单元集合；
[0133]
步骤c2，确定每个单元集合的密度，将所有非零密度的单元集合设定为目标单元集合；
[0134]
步骤c3，从所述目标单元集合中任一单元集合采用相异函数查询其与相邻单元集合的关系，当所述单元集合与相邻所有单元集合的相异函数值小于阈值时，确定所述单元集合内的数据为孤立点；
[0135]
步骤c4，重复步骤c3，遍历所述目标单元集合中所有的单元集合，确定出所述第一数据集中的所有孤立点。
[0136]
上述技术方案的工作原理及有益效果为：本实施例提供的方案依然是提取孤立点的方法，该方法的核心思想是按照密度划分若干个单元集合，并通过每个单元集合与相邻单元结合的相异函数计算的方式检测提取所述孤立点的。
[0137]
采用本实施例提供的孤立点的提取方法，不受孤立点分布位置的限制，针对大数据多维度的数据都可采用本实施例提供的方法。
[0138]
实施例6：
[0139]
在实施例2的基础上，所述采用神经网络技术对所述第一特征点集和所述第二特
征点集进行分类中，所述神经网络算法如下：
[0140]
步骤d1，所述输入层为所述第一特征点集和所述第二特征点集包含的特征点数据；所述卷积层将所述输入层数据与滤波器进行卷积运算，运算公式如下：
[0141][0142]
其中，为第l层的第j个数据，aj为第一特征点集中的输入数据，bj为第二特征点集中的输入数据；为第l层的第一特征点集中第j个数据，为第l-1层的第一特征点集中第i个数据；为第l层的第二特征点集中第j个数据；为第l-1层的第二特征点集中第i个数据；为第l层的第j个数据和第l-1层的第i个数据连接的滤波器；为偏置；s(
·
)为激活函数；
[0143]
步骤d2，对所述卷积层输出的数据进行子采样，通过激活函数及子采样公式获得所述子采样层的数据：
[0144][0145][0146]
其中，为子采样公式；为偏置；为第l层的第一特征点集中第j个数据，为第l-1层的第一特征点集中第j个数据；为第l层的第二特征点集中第j个数据，为第l-1层的第二特征点集中第j个数据；
[0147]
步骤d3，采样步骤d2方式依次获得经过2次卷积层和采样层的数据；
[0148]
步骤d4，在连接层，将步骤d3获得的数据采用下述改进后的激活函数进行数据输出：
[0149][0150]
步骤d5，根据所述连接层的数据输出确定所述第一数据集和第二数据集的分类。
[0151]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是通过卷积神经网络算法对所述第一数据集和所述第二数据集进行分类。在该实施例中，在连接层，将步骤d3获得的数据采用改进后的激活函数进行数据输出，该改进后的激活函数解决了收敛速度慢
的问题，改进后的激活函数具备稀疏性和光滑特性。
[0152]
实施例7：
[0153]
在实施例6的基础上，采用所述神经网络算法构建分类模型；
[0154]
将确定的所述第一数据集和第二数据集输入至所述分类模型；
[0155]
根据所述分类模型对所述第一数据集和第二数据集进行分类。
[0156]
上述技术方案的工作原理及有益效果为：通过所述卷积神经网络算法可以构建分类模型，而该分类模型是针对数据集变化微小的数据的分类，通过构建模型，简化该分类方法。
[0157]
实施例8：
[0158]
在实施例6的基础上，所述根据所述连接层的数据输出确定所述第一数据集和第二数据集的分类，之后还包括：
[0159]
根据下述公式确定输出概率：
[0160][0161]
其中，si为第i个输出数据的概率，ei为第i个输出数据以e为底求指数幂，∑
jej
为所有输出数据以e为底指数幂的和；
[0162]
根据下述公式确定交叉熵损失：
[0163]
δ＝-logsi[0164]
根据所述交叉熵损失确定输出结果的准确性。
[0165]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是对输出结果准确性的判断，具体是通过计算输出数据的分类概率，以及根据该概率计算交叉熵损失，当交叉熵损失越接近0，说明结果越准确，因此，在卷积神经网络算法中，尽可能减小交叉熵损失，保证输出结果的准确性。
[0166]
实施例9：
[0167]
在实施例1的基础上，所述分别提取所述第一数据集和第二数据集的孤立点，之前还包括：
[0168]
对所述第一数据集和第二数据集进行数据预处理，将所述第一数据集和第二数据集中重要部分的数据进行清洗删除。
[0169]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是对所述第一数据集和第二数据集中重要部分的数据进行清洗删除，通过对重要部分的数据进行删除，保证提取的孤立点更准确，且不受数据集中重要部分的数据的影响。
[0170]
实施例10：
[0171]
在实施例1的基础上，所述分别提取所述第一数据集和第二数据集的孤立点，之前还包括：
[0172]
提取所述第一数据集和第二数据集中的重要部分的数据作为特定特征点；
[0173]
相应的，所述采用神经网络算法根据所述第一数据集的第一特征点与所述第二数据集对应的第二特征点对所述第一数据集和第二数据集进行分类，包括：
[0174]
采用神经网络算法根据第一特征点与第二特征点以及特定特征点对所述第一数
据集和第二数据集进行分类。
[0175]
上述技术方案的工作原理及有益效果为：本实施例提供的方案是提取所述第一数据集和第二数据集中的重要部分的数据作为特定特征点，并将该特征点与所述第一特征点集和第二特征点集共同作为神经网络算法的输入。该方案的核心思想是采用孤立点和普遍意义上的特征点进行混合形成分类基础，该方法适合特定的数据集，该数据集中标识与其他数据集不同的部分可能既包括孤立点也包括重要数据，因此，将两者结合共同对数据集进行分类，满足特定条件下的数据的分类。
[0176]
显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于过完备深度低秩子空间聚类的高光谱图像波段选择方法与流程

基于神经网络技术解决数据泛化不均衡问题的方法与流程

相关文献

最热文献