一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于机器学习的低维特征小样本多分类方法和装置与流程

2021-11-24 21:10:00 来源:中国专利 TAG:


1.本技术涉及机器学习技术领域,尤其涉及一种基于机器学习的低维特征小样本多分类方法和装置。


背景技术:

2.随着深度学习的发展,各学科领域开始使用神经网络等深度学习技术解决领域问题并取得了一系列突破性进展。但是,深度神经网络训练需要大量数据,在数据获取难度大、成本高或根本不存在大量数据的问题上,神经网络很难发挥作用。


技术实现要素:

3.本技术旨在至少在一定程度上解决相关技术中的技术问题之一。
4.为此,本技术的第一个目的在于提出一种基于机器学习的低维特征小样本多分类方法,解决了类间特征重叠度高、存在噪声特征的小样本低维特征多分类问题,提出的使用机器学习技术进行多维特征筛选融合的分类方法,可以分析处理有噪特征,对有噪数据鲁棒性较好,同时在小样本数据上有较好的泛化能力,适用于类间特征重叠度高、存在噪声特征、训练数据量少的高难度多分类问题。
5.本技术的第二个目的在于提出一种基于机器学习的低维特征小样本多分类装置。
6.本技术的第三个目的在于提出一种非临时性计算机可读存储介质。
7.为达上述目的,本技术第一方面实施例提出了一种基于机器学习的低维特征小样本多分类方法,包括:使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;对划分后的样本进行特征选择,得到特征选择结果;对特征选择结果进行特征变换,得到变换后的特征;对变换后的特征进行处理,得到最终的分类结果。
8.可选地,在本技术的一个实施例中,特征选择,具体过程为:
9.使用递归特征排除法,每次随机筛除一个特征,选择分类结果最佳的特征筛除方法,然后递归进行下一次特征筛除,直到剩下最后一个特征,统计所有筛除过程中分类结果最佳的筛除方法,作为特征选择结果。
10.可选地,在本技术的一个实施例中,采用大间隔最近距离lmnn方法进行特征变换,具体包括以下步骤:
11.使用主成分分析pca法初始化特征变换矩阵;
12.使用大间隔最近距离方法lmnn优化特征变换矩阵;
13.使用特征变换矩阵对特征选择结果进行线性变换,得到变换后的特征。
14.可选地,在本技术的一个实施例中,使用线性核支持向量机和高斯核支持向量机分别对变换后的特征进行分类训练,得到分类概率,将分类概率相乘并归一化,生成最终的分类结果。
15.为达上述目的,本技术第二方面实施例提出了一种基于机器学习的低维特征小样本多分类装置,包括划分模块、特征选择模块、特征变换模块、分类器模块,其中,
16.划分模块,用于使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;
17.特征选择模块,用于对划分后的样本进行特征选择,得到特征选择结果;
18.特征变换模块,用于对特征选择结果进行特征变换,得到变换后的特征;
19.分类器模块,用于对变换后的特征进行处理,得到最终的分类结果。
20.可选地,在本技术的一个实施例中,特征选择模块,具体用于:
21.使用递归特征排除法,每次随机筛除一个特征,选择分类结果最佳的特征筛除方法,然后递归进行下一次特征筛除,直到剩下最后一个特征,统计所有筛除过程中分类结果最佳的筛除方法,作为特征选择结果。
22.可选地,在本技术的一个实施例中,特征变换模块,采用大间隔最近距离lmnn方法进行特征变换,具体包括以下步骤:
23.使用主成分分析pca法初始化特征变换矩阵;
24.使用大间隔最近距离方法lmnn优化特征变换矩阵;
25.使用特征变换矩阵对特征选择结果进行线性变换,得到变换后的特征。
26.可选地,在本技术的一个实施例中,分类器模块,具体用于:
27.使用线性核支持向量机和高斯核支持向量机分别对变换后的特征进行分类训练,得到分类概率,将分类概率相乘并归一化,生成最终的分类结果。
28.为了实现上述目的,本技术第三方面实施例提出了一种非临时性计算机可读存储介质,当存储介质中的指令由处理器被执行时,能够执行一种基于机器学习的低维特征小样本多分类方法和装置。
29.本技术实施例的基于机器学习的低维特征小样本多分类方法、基于机器学习的低维特征小样本多分类装置和非临时性计算机可读存储介质,解决了类间特征重叠度高、存在噪声特征的小样本低维特征多分类问题,提出的使用机器学习技术进行多维特征筛选融合的分类方法,可以分析处理有噪特征,对有噪数据鲁棒性较好,同时在小样本数据上有较好的泛化能力,适用于类间特征重叠度高、存在噪声特征、训练数据量少的高难度多分类问题。
30.本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
31.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
32.图1为本技术实施例一所提供的一种基于机器学习的低维特征小样本多分类方法的流程图;
33.图2为本技术实施例的基于机器学习的低维特征小样本多分类方法的使用tsne可视化的原始特征分布图;
34.图3为本技术实施例的基于机器学习的低维特征小样本多分类方法的使用tsne可视化的特征选择和特征变换后的特征分布图;
35.图4为本技术实施例二所提供的一种基于机器学习的低维特征小样本多分类装置
的结构示意图。
具体实施方式
36.下面详细描述本技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
37.下面参考附图描述本技术实施例的基于机器学习的低维特征小样本多分类方法和装置。
38.图1为本技术实施例一所提供的一种基于机器学习的低维特征小样本多分类方法的流程图。
39.如图1所示,该基于机器学习的低维特征小样本多分类方法包括以下步骤:
40.步骤101,使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;
41.步骤102,对划分后的样本进行特征选择,得到特征选择结果;
42.步骤103,对特征选择结果进行特征变换,得到变换后的特征;
43.步骤104,对变换后的特征进行处理,得到最终的分类结果。
44.本技术实施例的基于机器学习的低维特征小样本多分类方法,通过使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;对划分后的样本进行特征选择,得到特征选择结果;对特征选择结果进行特征变换,得到变换后的特征;对变换后的特征进行处理,得到最终的分类结果。由此,能够解决类间特征重叠度高、存在噪声特征的小样本低维特征多分类问题,提出的使用机器学习技术进行多维特征筛选融合的分类方法,可以分析处理有噪特征,对有噪数据鲁棒性较好,同时在小样本数据上有较好的泛化能力,适用于类间特征重叠度高、存在噪声特征、训练数据量少的高难度多分类问题。
45.进一步地,在本技术实施例中,特征选择,具体过程为:
46.使用递归特征排除法,每次随机筛除一个特征,选择分类结果最佳的特征筛除方法,然后递归进行下一次特征筛除,直到剩下最后一个特征,统计所有筛除过程中分类结果最佳的筛除方法,作为特征选择结果。
47.使用递归特征排除法,对输入低维特征进行筛选,得到对分类结果相关性大的特征集合。使用的低维输入特征一般在10维左右,不是所有特征都对分类结果有区分度,要对输入特征进行分析和筛选,选择对分类问题重要的部分特征,防止无关特征造成干扰。
48.进一步地,在本技术实施例中,采用大间隔最近距离lmnn方法进行特征变换,具体包括以下步骤:
49.使用主成分分析pca法初始化特征变换矩阵;
50.使用大间隔最近距离方法lmnn优化特征变换矩阵;
51.使用特征变换矩阵对特征选择结果进行线性变换,得到变换后的特征。
52.使用一种传统的度量学习(metric learning)方法大间隔最近距离(lmnn),对特征选择后的特征进行变换处理。通过度量学习学到一个变换矩阵,使得相同分类样本在高维特征空间中距离尽量接近,不同分类样本尽量远离,优化特征的分布,使原始特征空间中不可分的样本在变换后的特征空间中尽量可分。
53.进一步地,在本技术实施例中,使用线性核支持向量机和高斯核支持向量机分别
对变换后的特征进行分类训练,得到分类概率,将分类概率相乘并归一化,生成最终的分类结果。
54.线性核支持向量机(svm)和高斯核支持向量机,两者作加权投票,对变换后的特征进行多分类。
55.图2为本技术实施例的基于机器学习的低维特征小样本多分类方法的使用tsne可视化的原始特征分布图。
56.图3为本技术实施例的基于机器学习的低维特征小样本多分类方法的使用tsne可视化的特征选择和特征变换后的特征分布图。
57.如图2和图3所示,使用基于机器学习的低维特征小样本多分类方法对原始特征进行特征选择和特征变换后,特征的可分性大大增强了。
58.图4为本技术实施例二所提供的一种基于机器学习的低维特征小样本多分类装置的结构示意图。
59.如图4所示,该基于机器学习的低维特征小样本多分类装置,包括划分模块、特征选择模块、特征变换模块、分类器模块,其中,
60.划分模块10,用于使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;
61.特征选择模块20,用于对划分后的样本进行特征选择,得到特征选择结果;
62.特征变换模块30,用于对特征选择结果进行特征变换,得到变换后的特征;
63.分类器模块40,用于对变换后的特征进行处理,得到最终的分类结果。
64.进一步地,在本技术实施例中,特征选择模块,具体用于:
65.使用递归特征排除法,每次随机筛除一个特征,选择分类结果最佳的特征筛除方法,然后递归进行下一次特征筛除,直到剩下最后一个特征,统计所有筛除过程中分类结果最佳的筛除方法,作为特征选择结果。
66.进一步地,在本技术实施例中,特征变换模块,采用大间隔最近距离lmnn方法进行特征变换,具体包括以下步骤:
67.使用主成分分析pca法初始化特征变换矩阵;
68.使用大间隔最近距离方法lmnn优化特征变换矩阵;
69.使用特征变换矩阵对特征选择结果进行线性变换,得到变换后的特征。
70.进一步地,在本技术实施例中,分类器模块,具体用于:
71.使用线性核支持向量机和高斯核支持向量机分别对变换后的特征进行分类训练,得到分类概率,将分类概率相乘并归一化,生成最终的分类结果。
72.使用端到端的方式训练,不同模块的超参数使用网格搜索(grid search)方法进行最佳参数选择。特征变换后的标志物表达量特征已经具有一定的可分性,此时通过多个分类器融合的方式进行分类,可以综合多个分类器的分析,增强分类结果的准确性。
73.本技术实施例的基于机器学习的低维特征小样本多分类装置,包括划分模块、特征选择模块、特征变换模块、分类器模块,其中,划分模块,用于使用三折分类交叉验证方法对样本进行多次划分,得到划分后的样本;特征选择模块,用于对划分后的样本进行特征选择,得到特征选择结果;特征变换模块,用于对特征选择结果进行特征变换,得到变换后的特征;分类器模块,用于对变换后的特征进行处理,得到最终的分类结果。由此,能够解决类
间特征重叠度高、存在噪声特征的小样本低维特征多分类问题,提出的使用机器学习技术进行多维特征筛选融合的分类方法,可以分析处理有噪特征,对有噪数据鲁棒性较好,同时在小样本数据上有较好的泛化能力,适用于类间特征重叠度高、存在噪声特征、训练数据量少的高难度多分类问题。
74.为了实现上述实施例,本技术还提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例的基于机器学习的低维特征小样本多分类方法和装置。
75.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
76.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
77.流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
78.在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
79.应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离
散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
80.本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
81.此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
82.上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献