一种基于主成分分析的光谱分类方法与系统

2022-12-31 15:11:31 来源：中国专利 TAG：

1.本发明涉及高光谱分类技术领域，特别是一种基于主成分分析的光谱分类方法与系统。

背景技术：

2.物质的红外光谱包含了成分的分子转动、振动信息，是用于物质成分分类和定量分析的可靠依据。传统的高光谱分类方法包括基于光谱特征的分类方法和基于统计特征的分类方法，光谱匹配分类是根据光谱曲线之间的差别对光谱进行分类，常用的光谱相似性测度包括欧式距离、光谱角余弦、光谱相关系数等。光谱相似性测度只考虑了光谱曲线某一方面的特征，不能完整地描述光谱曲线形态，在特征相似度高情况下不能很好地区分类别，分类效果较差。基于统计特征分类方法需要大量数据进行训练，对于少量样本情况下分类适用性差。如何在少量样本、光谱相似度高的情况下，实现对样本的准确分类，是光谱分类的一个难点。

技术实现要素：

3.鉴于以上所述现有技术的缺点，本发明的目的在于提供一种基于主成分分析的光谱分类方法与系统，以解决上述技术问题。
4.为实现上述目的及其他相关目的，本发明提供一种基于主成分分析的光谱分类方法，包括：
5.获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，其中，每个类别至少包括一种具体成分；
6.分别对不同的类别集合进行主成分分析，得到各类别的主成分特征向量矩阵；
7.按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集；
8.对所述矩阵集重新进行主成分分析，得到总特征主成分向量矩阵；
9.获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重；
10.选择权重大于设定阈值的类别作为所述待分类物质的类别；
11.根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分。
12.在本发明的一可选实施例中，获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，具体包括：
13.获取已知物质的光谱，并按照类别分成m种类物质，每种类别有ni个具体成分；
14.将第k类别集合光谱构成光谱矩阵s
(k)
：
15.s
(k)
＝[s1，s2，
…
sn]
(k)
[0016]
其中，si表示第k类别集合中的第i个成分光谱。
[0017]
在本发明的一可选实施例中，分别对不同类别的集合进行主成分分析，得到各类
别的主成分特征向量矩阵，具体包括：
[0018]
分别对各类别的光谱矩阵s
(k)
归一化，得到归一化后的光谱矩阵
[0019]
对归一化后的光谱矩阵进行主成分分析，得到各类别的主成分向量矩阵和主成分矩阵；
[0020]
对得到的各类别的主成分向量矩阵进行归一化，得到各类别的归一化主成分特征向量矩阵
[0021]
在本发明的一可选实施例中，分别对各类别的光谱矩阵s
(k)
归一化，得到归一化后的光谱矩阵具体包括：
[0022]
每个类别已知物质的光谱减去自身均值，得到中间值
[0023][0024]
其中，是各类物质中的第i个成分光谱的均值；
[0025]
每个已知样本光谱除以自身的模：
[0026][0027][0028]
其中，是的模。
[0029]
在本发明的一可选实施例中，对归一化后的光谱矩阵进行主成分分析，得到各类别的主成分向量矩阵和主成分矩阵，通过下式实现：
[0030][0031]
其中，u
(k)
是p
×
n的主成分向量矩阵，表示n个特征轴向量；v
(k)
是n
×
n的主成分矩阵，表示n个样本在n个特征轴上的分量。
[0032]
在本发明的一可选实施例中，对得到的各类别的主成分向量矩阵进行归一化，得到各类别的归一化主成分特征向量矩阵通过下式实现：
[0033][0034]
其中，u
(k)
是p
×
n的主成分向量矩阵，表示n个特征轴向量，是u
(k)
的转置矩阵。
[0035]
在本发明的一可选实施例中，按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集，通过下式实现：
[0036][0037]
其中，y是矩阵集，是各类别主成分特征向量矩阵。
[0038]
在本发明的一可选实施例中，获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重，具体包括：
[0039]
计算待分类物质的光谱x的主成分系数c
all
：
[0040][0041]
其中，是总特征主成分向量矩阵；
[0042]
计算每个类别主成分特征向量矩阵系数的权重：
[0043]r(k)
＝||c
(k)
||/||c
all
||
[0044]
其中，c
(k)
是每个类别主成分特征向量矩阵系数，||c
(k)
||是c
(k)
的模，||c
all
||是c
all
的模。
[0045]
在本发明的一可选实施例中，根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分，具体包括：
[0046]
计算待分类物质和已知物质在特征轴矩阵上的分量；
[0047]
根据待分类物质和已知物质在特征轴矩阵上的分量计算得到相关系数；
[0048]
根据相关系数，判断待分类物质是否与已知物质匹配，输出分类结果。
[0049]
为实现上述目的本发明还提供一种基于主成分分析的光谱分类系统，所述系统包括：
[0050]
第一分类模块：获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，其中，每个类别至少包括一种具体成分；
[0051]
第一计算模块：分别对不同类别的集合进行主成分分析，得到各类别的主成分特征向量矩阵；
[0052]
排列模块：按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集；
[0053]
第二计算模块：对所述矩阵集重新进行主成分分析，得到总特征主成分向量矩阵；
[0054]
第三计算模块：获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重；
[0055]
第二分类模块：选择权重大于设定阈值的类别作为所述待分类物质的类别；
[0056]
第三分类模块：根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分。
[0057]
本发明的技术效果在于本发明提出的一种基于主成分分析的光谱分类方法，通过获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，其中，每个类别至少包括一种具体成分；分别对不同的类别集合进行主成分分析，得到各类别的主成分特征向量矩阵；按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集；对所述矩阵集重新进行主成分分析，得到总特征主成分向量矩阵；获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重；选择权重大于设定阈值的类别作为所述待分类物质的类别；根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分。从而可以对于少量样本、光谱相似度高的样本实现准确分类。本方法具有所需样本少、分类精度高的优点，是一种光谱分类的新方法，可拓展于其它波段的光谱分类或数据分类应用。
[0058]
应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。
附图说明
[0059]
此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理。显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术者来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：
[0060]
图1是本技术的一示例性实施例示出的基于主成分分析的光谱分类方法的流程图；
[0061]
图2是本技术的一示例性实施例示出的6种物质的红外吸光度光谱图；
[0062]
图3是图2示出的6种物质的红外吸光度光谱归一化前后对比图；
[0063]
图4是本技术的一示例性实施例示出的汽油类的主成分特征向量矩阵图；
[0064]
图5是本技术的一示例性实施例示出的柴油类的主成分特征向量矩阵图；
[0065]
图6是本技术的一示例性实施例示出的总特征主成分向量矩阵图；
[0066]
图7是本技术的一示例性实施例示出的一种待分类物质的红外吸光度光谱图；
[0067]
图8是本技术的一示例性实施例示出的待分类物质的光谱在总特征主成分向量矩阵上的系数图；
[0068]
图9是本技术的一示例性实施例示出的92#、95#汽油的系数分布和待分类物质的系数分布图；
[0069]
图10是本技术的一示例性实施例示出的基于主成分分析的光谱分类系统的框图。
具体实施方式
[0070]
以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。
[0071]
需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。
[0072]
首先需要说明的是，主成分分析(principal components analysis，pca)是一种降维算法，它能将多个指标转换为少数几个主成分，这些主成分是原始变量的线性组合，且彼此之间互不相关，其能反映出原始数据的大部分信息。一般来说，当研究的问题涉及到多变量且变量之间存在很强的相关性时，我们可考虑使用主成分分析的方法来对数据进行简化。通过基于主成分分析的光谱分类方法，对于少量样本和特征区分度小的情况也可以很好区分特征类别。
[0073]
物质的红外光谱包含了成分的分子转动、振动信息，是用于物质成分分类和定量分析的可靠依据。传统的高光谱分类方法包括基于光谱特征的分类方法和基于统计特征的分类方法，光谱匹配分类是根据光谱曲线之间的差别对光谱进行分类，常用的光谱相似性测度包括欧式距离、光谱角余弦、光谱相关系数等。光谱相似性测度只考虑了光谱曲线某一
方面的特征，不能完整地描述光谱曲线形态，在特征相似度高情况下不能很好地区分类别，分类效果较差。基于统计特征分类方法需要大量数据进行训练，对于少量样本情况下分类适用性差。如何在少量样本、光谱相似度高的情况下，实现对样本的准确分类，是光谱分类的一个难点。
[0074]
为解决这些问题，本技术的实施例提出一种基于主成分分析的光谱分类方法。图1是本技术的一示例性实施例示出的基于主成分分析的光谱分类方法的流程图。
[0075]
如图1所示，在一示例性的实施例中，基于主成分分析的光谱分类方法至少包括步骤s110至步骤s170，详细介绍如下：
[0076]
s110，获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，其中，每个类别至少包括一种具体成分。
[0077]
在本发明的一可选实施例中，获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，具体包括：
[0078]
获取已知物质的光谱，并按照类别分成m种类物质，每种类别有ni个具体成分；
[0079]
将第k类别集合光谱构成光谱矩阵s
(k)
：
[0080]s(k)
＝[s1，s2，
…
sn]
(k)
[0081]
其中，si表示第k类别集合中的第i个成分光谱，维度为p的一个矢量，与光谱波段相对应；对于高光谱数据，光谱维度远大于成分个数，即p＞＞n，i是每个类别中具体成分的个数。
[0082]
如图2所示，已知物质的光谱可以是95#汽油、92#汽油、柴油、航空煤油、乙醇和乙酸乙酯的红外吸光度光谱，按照类别分成汽油类(95#汽油、92#汽油)、柴油类(柴油、航空煤油)、乙醇及乙酸乙酯(乙醇和乙酸乙酯只有一个光谱，不进行类别分析)4类物质，每种类别至少有1个具体成分，对于第1(汽油)类物质，将类中所有成分光谱构成矩阵s
(1)
，s
(1)
＝[s1，s2]
(1)
，其中，s1是95#汽油光谱，s2是92#汽油光谱；同理对柴油类、乙醇及乙酸乙酯进行相同操作，得到s
(2)
，s
(3)
，s
(4)
。
[0083]
s120，分别对不同的类别集合进行主成分分析，得到各类别的主成分特征向量矩阵。
[0084]
在本发明的一可选实施例中，分别对不同类别的集合进行主成分分析，得到各类别的主成分特征向量矩阵，具体包括：
[0085]
分别对各类别的光谱矩阵s
(k)
归一化，得到归一化后的光谱矩阵
[0086]
每个类别已知物质的光谱减去自身均值，得到中间值
[0087][0088]
其中，是各类物质中的第i个样本光谱的均值；
[0089]
每个已知样本光谱除以自身的模，得到归一化的
[0090][0091]
[0092]
其中，是归一化后的光谱矩阵，是的模。
[0093]
如图3所示，按照上述步骤对6种物质的红外吸光度光谱进行处理后得到图3，图3是图2示出的6种物质的红外吸光度光谱归一化前后对比图。可以看到通过将光谱进行归一化处理，不仅提升收敛速度，还一定程度提高了模型精度；为后续的主成分分析提供基础。
[0094]
对归一化后的光谱矩阵进行主成分分析，得到各类别的主成分向量矩阵和主成分矩阵；
[0095][0096]
其中，u
(k)
是p
×
n的主成分向量矩阵，表示n个特征轴向量；v
(k)
是n
×
n的主成分矩阵，表示n个样本在n个特征轴上的分量，即v
(k)
的第一列表示样本s1在n个特征轴向量上的分量，第二列表示样本s2在n个特征轴向量上的分量，依次类推。
[0097]
对得到的各类别的主成分向量矩阵进行归一化，得到各类别的归一化主成分特征向量矩阵
[0098][0099]
其中，u
(k)
是p
×
n的主成分向量矩阵，表示n个特征轴向量，是u
(k)
的转置矩阵。
[0100]
如图4和图5所示，对每一类别进行主成分分析，分别得到汽油类的主成分特征向量矩阵图和柴油类的主成分特征向量矩阵图。
[0101]
s130，按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集。
[0102]
在本发明的一可选实施例中，按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集，通过下式实现：
[0103][0104]
其中，y是矩阵集，是各类别主成分特征向量矩阵。
[0105]
s140，对所述矩阵集重新进行主成分分析，得到总特征主成分向量矩阵。
[0106]
按照步骤s120对步骤s130得到的矩阵集y重新进行主成分分析，得到总特征主成分向量矩阵如果需要扩展新类别物质识别，先将新类别物质光谱主成分分析，得到新类别的主成分特征向量矩阵，然后将其加入原来的总特征主成分向量矩阵进行主成分分析，得到新的总特征主成分向量矩阵。
[0107]
s150，获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重。
[0108]
在本发明的一可选实施例中，获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重，具体包括：
[0109]
计算待分类物质的光谱x的主成分系数c
all
：
[0110][0111]
其中，是总特征主成分向量矩阵；
[0112]
计算每个类别主成分特征向量矩阵系数的权重：
[0113]r(k)
＝||c
(k)
||/||c
all
||
[0114]
其中，c
(k)
是每个类别主成分特征向量矩阵系数，||c
(k)
||是c
(k)
的模，||c
all
||是c
all
的模。
[0115]
s160，选择权重大于设定阈值的类别作为所述待分类物质的类别。
[0116]
如图8待分类物质的光谱在主成分向量矩阵上的系数所示，其中轴序号(1，2)是汽油，序号(3，4)是柴油，5是乙醇，6是乙酸乙酯；设定分类阈值是0.8，根据权重计算公式得到光谱在汽油类上的权重是0.998，大于阈值0.8，判定为汽油类别。
[0117]
s170，根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分。
[0118]
在本发明的一可选实施例中，根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分，具体包括：
[0119]
计算待分类物质和已知物质在特征轴矩阵上的分量；
[0120]
根据待分类物质和已知物质在特征轴矩阵上的分量计算得到相关系数；
[0121]
根据相关系数，判断待分类物质是否与已知物质匹配，输出分类结果。
[0122]
其中，已知物质的系数分量是矢量x，待分类物质的系数分量是矢量y，根据x和y计算得到相关系数，相关系数r的计算公式为：
[0123][0124]
式中xi为目标特征(i＝1
…
n)；为目标特征的平均值；yi为标准谱；为标准谱的平均值。
[0125]
相关系数表明了两个量的线性相关程度，并且|r|≤1。当r＝1时，则x与y成正线性关系；r＝-1时，则x与y成负线性关系。根据r值与1或-1接近程度来判别x和y的相关程度。
[0126]
如图9所示，待分类物质的系数分布与92#汽油相似度高，判定待分类光谱为92#汽油。
[0127]
图10是本技术的一示例性实施例示出的基于主成分分析的光谱分类系统的框图，如图10所示，所述系统包括：
[0128]
第一分类模块1010：获取已知物质的光谱，并按照类别对所述已知物质的光谱进行分类，以获取不同的类别集合，其中，每个类别至少包括一种具体成分；
[0129]
第一计算模块1020：分别对不同类别的集合进行主成分分析，得到各类别的主成分特征向量矩阵；
[0130]
排列模块1030：按照指定顺序对各类别的所述主成分特征向量矩阵进行排列，以得到矩阵集；
[0131]
第二计算模块1040：对所述矩阵集重新进行主成分分析，得到总特征主成分向量
矩阵；
[0132]
第三计算模块1050：获取待分类物质的光谱，并根据所述总特征主成分向量矩阵计算所述待分类物质的光谱属于每个类别系数的权重；
[0133]
第二分类模块1060：选择权重大于设定阈值的类别作为所述待分类物质的类别；
[0134]
第三分类模块1070：根据所述待分类物质的类别的主成分特征向量矩阵及待分类物质的光谱来获取所述待分类物质的具体成分。
[0135]
需要说明的是，上述实施例所提供的基于主成分分析的光谱分类系统与上述实施例所提供的基于主成分分析的光谱分类方法属于同一构思，其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述，此处不再赘述。上述实施例所提供的基于主成分分析的光谱分类系统在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能，本处也不对此进行限制。
[0136]
上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。
[0137]
在本文的描述中，提供了许多特定细节，诸如部件和/或方法的实例，以提供对本发明实施例的完全理解。然而，本领域技术人员将认识到可以在没有一项或多项具体细节的情况下或通过其他设备、系统、组件、方法、部件、材料、零件等等来实践本发明的实施例。在其他情况下，未具体示出或详细描述公知的结构、材料或操作，以避免使本发明实施例的方面变模糊。
[0138]
在整篇说明书中提到“一个实施例”、“实施例”或“具体实施例”意指与结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中，并且不一定在所有实施例中。因而，在整篇说明书中不同地方的短语“在一个实施例中”、“在实施例中”或“在具体实施例中”的各个表象不一定是指相同的实施例。此外，本发明的任何具体实施例的特定特征、结构或特性可以按任何合适的方式与一个或多个其他实施例结合。应当理解本文所述和所示的发明实施例的其他变型和修改可能是根据本文教导的，并将被视作本发明精神和范围的一部分。
[0139]
还应当理解还可以以更分离或更整合的方式实施附图所示元件中的一个或多个，或者甚至因为在某些情况下不能操作而被移除或因为可以根据特定应用是有用的而被提供。
[0140]
另外，除非另外明确指明，附图中的任何标志箭头应当仅被视为示例性的，而并非限制。此外，除非另外指明，本文所用的术语“或”一般意在表示“和/或”。在术语因提供分离或组合能力是不清楚的而被预见的情况下，部件或步骤的组合也将视为已被指明。
[0141]
如在本文的描述和在下面整篇权利要求书中所用，除非另外指明，“一个”、和“该”包括复数参考物。同样，如在本文的描述和在下面整篇权利要求书中所用，除非另外指明，“在
…
中”的意思包括“在
…
中”和“在
…
上”。
[0142]
本发明所示实施例的上述描述(包括在说明书摘要中所述的内容)并非意在详尽列举或将本发明限制到本文所公开的精确形式。尽管在本文仅为说明的目的而描述了本发
明的具体实施例和本发明的实例，但是正如本领域技术人员将认识和理解的，各种等效修改是可以在本发明的精神和范围内的。如所指出的，可以按照本发明所述实施例的上述描述来对本发明进行这些修改，并且这些修改将在本发明的精神和范围内。
[0143]
本文已经在总体上将系统和方法描述为有助于理解本发明的细节。此外，已经给出了各种具体细节以提供本发明实施例的总体理解。然而，相关领域的技术人员将会认识到，本发明的实施例可以在没有一个或多个具体细节的情况下进行实践，或者利用其它装置、系统、配件、方法、组件、材料、部分等进行实践。在其它情况下，并未特别示出或详细描述公知结构、材料和/或操作以避免对本发明实施例的各方面造成混淆。
[0144]
因而，尽管本发明在本文已参照其具体实施例进行描述，但是修改自由、各种改变和替换亦在上述公开内，并且应当理解，在某些情况下，在未背离所提出发明的范围和精神的前提下，在没有对应使用其他特征的情况下将采用本发明的一些特征。因此，可以进行许多修改，以使特定环境或材料适应本发明的实质范围和精神。本发明并非意在限制到在下面权利要求书中使用的特定术语和/或作为设想用以执行本发明的最佳方式公开的具体实施例，但是本发明将包括落入所附权利要求书范围内的任何和所有实施例及等同物。因而，本发明的范围将只由所附的权利要求书进行确定。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

一种基于主成分分析的光谱分类方法与系统

相关文献

最热文献