一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于相似度的自适应窗口化拉曼光谱识别方法与流程

2022-04-14 00:03:49 来源:中国专利 TAG:


1.本发明涉及光谱识别技术领域,尤其涉及一种基于相似度的自适应窗口化拉曼光谱识别方法。


背景技术:

2.拉曼检测,具有速度快、灵敏度高、指纹无损伤等特点,在现场检测方面具有独特优势,且在农业、医药、食品、石化等领域也得到了广泛的应用。由于测试对象的拉曼光谱信号可以通过纳米增强基底放大百万倍以上,甚至可以实现单分子水平的检测,因此可以使用拉曼光谱特征峰值信息来识别被测试的物体。拉曼光谱分析包括光谱的预处理、特征提取和特征分类等步骤,其中特征提取是拉曼光谱分析的核心环节。由于每种物质都有相应的拉曼光谱特征峰分布,所以拉曼光谱特征峰的位置和大小直接反映了该物质的结构和含量信息,能否很好地识别拉曼光谱特征峰将直接影响样品特征分类的准确性。
3.在拉曼光谱识别算法中一般使用特征峰或相似度的匹配方法。基于拉曼特征峰的光谱自动识别方法。该方法是一种反向匹配识别的方法,以光谱特征峰峰位与峰强作为索引反向进行检索。具体流程如下所示。
4.(1)载入待识别物质的光谱数据并进行前处理并使用小波变换提取其特征峰峰位与峰强信息;(2)将拉曼数据库里所有物质的特征峰与待识别物质特征峰进行比对,若一个特征峰峰位偏差在5个波束以内,则数据库中该物质此位置峰强则在s中累加;(3)根据第二步的峰位信息寻找待测物质特征峰所对应的峰强,对应的峰强全部在a中累加,计算相似度公式如下:
[0005][0006]
(4)若相似度p的值超过于0.85,则可以认为待识别物质中含有该物质,循环上述步骤,直到比对完拉曼数据库内所有物质。
[0007]
基于相似度的光谱自动识别方法。该方法是一种正向检索的方法,以光谱相似度作为物质分类评判标准。待识别物质光谱与数据库光谱的差异大小由命中质量系数(hqi)进行评判,hqi的计算公式如下:
[0008][0009]
上式中,a表示待识别物质拉曼光谱,l表示拉曼光谱库的标准光谱,p为光谱长度。hqi值越大则待识别物质拉曼光谱与标准光谱越接近。此时,可用hqi作为匹配系数,遍历光谱库中标准光谱后,匹配系数最大且高于85%的标准谱为最终结果。
[0010]
但是在低浓度拉曼光谱识别分类时,由于其光谱有效信息较少,采用全光谱进行相似度匹配时容易导致其出现误配错配的情况。于是需要进一步改进其全光谱计算相似度的方法,针对有效信息较多的地方对其进行光谱相似度匹配,以减少无用片段对其产生的不利影响。


技术实现要素:

[0011]
为解决背景技术中存在的技术问题,本发明提出一种基于相似度的自适应窗口化拉曼光谱识别方法,克服了现有拉曼光谱相似度匹配算法对于低浓度物质光谱的匹配能力不足,实现拉曼光谱识别的自动化。
[0012]
本发明提出一种基于相似度的自适应窗口化拉曼光谱识别方法,包括:
[0013]
s1:获取待识别物质的拉曼光谱,对待识别物质的拉曼光谱进行预处理;
[0014]
s2:获取预处理后待识别物质的拉曼光谱的所有波峰,并根据所述波峰的峰位与峰高确定待识别物质的拉曼特征峰;
[0015]
s3:获取包含待识别物质的标准品拉曼光谱数据的数据库;
[0016]
s4:遍历数据库中标准品的拉曼特征峰,与待识别物质的拉曼特征峰对比确定满足匹配条件的目标标准品;
[0017]
s5:根据目标标准品的拉曼特征峰的峰位和峰宽建立自适应窗口,计算自适应窗口内待识别物质与目标标准品的拉曼特征峰的相似度;
[0018]
s6:基于上述待识别物质与目标标准品的拉曼特征峰的相似度,计算目标标准品拉曼光谱的匹配系数;
[0019]
s7:基于所述匹配系数确定待识别物质中是否含有该目标标准品物质。
[0020]
优选地,所述步骤s1中对待识别物质的拉曼光谱进行预处理具体包括:对待识别物质的拉曼光谱进行去荧光背景干扰。
[0021]
优选地,所述步骤s2具体包括:
[0022]
s201:对预处理后待识别物质的拉曼光谱数据进行窗函数平滑后再进行二阶求导,获得所有波峰;
[0023]
s202:提取所述波峰的峰位和峰高,计算每个波峰的峰高和半峰宽之比vr,所述其中h为峰高,w为峰宽。
[0024]
s203:当所述波峰的vr满足特征峰信噪比要求则确定其为拉曼特征峰。
[0025]
优选地,所述步骤s4中所述匹配条件具体包括:所述标准品的拉曼特征峰与待识别物质的拉曼特征峰的峰位偏差小于第一匹配阈值且峰高差距不超过第二匹配阈值。
[0026]
优选地,所述步骤s5所述计算自适应窗口内待识别物质与目标标准品的拉曼特征峰的相似度具体公式为:
[0027][0028]
其中,hqi表示相似度,a和b分别为两个大小相同的待检测物质的拉曼数据矩阵和目标标准品的拉曼数据矩阵,与是矩阵a与b的均值,m与n分别为矩阵的行数与列数。
[0029]
优选地,所述步骤s6所述计算目标标准品拉曼光谱的匹配系数具体公式为:
[0030]
其中
[0031]
其中,n为进行自适应窗口化相似度匹配拉曼特征峰的个数。
[0032]
优选地,所述步骤s7所述基于所述匹配系数确定待识别物质中是否含有该目标标
准品物质具体包括:若匹配系数小于第一相似阈值,则判定待检测物质中不含有目标标准品物质;若匹配系数大于第一相似阈值小于第二相似阈值,则判定待检测物质中可能含有目标标准品物质;若匹配系数大于第二相似阈值,则判定待检测物质中含有目标标准品物质。
[0033]
本发明公开了一种基于相似度的自适应窗口化拉曼光谱识别方法,通过获取待识别物质的拉曼光谱,进行预处理;获取预处理后待识别物质的拉曼光谱的所有波峰,确定待识别物质的拉曼特征峰;遍历数据库中标准品的拉曼特征峰,与待识别物质的拉曼特征峰对比确定满足匹配条件的目标标准品;建立自适应窗口,计算自适应窗口内待识别物质与目标标准品的拉曼特征峰的相似度;计算目标标准品拉曼光谱的匹配系数从而确定待识别物质中是否含有该目标标准品物质;通过自适应窗口相似度比对,无需人为设置任何参数,实现了拉曼光谱识别的自动化。
[0034]
本发明中,引入根据拉曼光谱特征对进行去荧光背景预处理,有效减少了无效信息对匹配的干扰。
[0035]
本发明中,引入峰高与半峰宽之比vr作为假峰的判别机制,确定拉曼特征峰,相比传统波峰检测方法中的幅度法、斜率法和面积法,结合了拉曼特征峰的特点,提高了低浓度拉曼光谱识别速度和准确性。
[0036]
本发明中,在光谱识别过程中,引入自适应窗口化相似度计算,不仅能进一步提高了有效信息的权重,而且减少了无效信息的干扰。
附图说明
[0037]
图1为本发明提出的一种基于相似度的自适应窗口化拉曼光谱识别方法的流程图;
[0038]
图2为本发明第一实施例中真阳性冰毒毛发样本的拉曼光谱图;
[0039]
图3为本发明第二实施例中假阳性冰毒毛发样本的拉曼光谱图;
[0040]
图4为本发明第三实施例中真阳性冰毒尿液样本的拉曼光谱图。
具体实施方式
[0041]
如图1所示,图1为本发明实施例提出一种基于相似度的自适应窗口化拉曼光谱识别方法的流程图。
[0042]
参照图1,本发明第一实施例提出的一种基于相似度的自适应窗口化拉曼光谱识别方法,应用于待识别物质为真阳性冰毒毛发样本,具体方法包括:
[0043]
s1:获取待识别物质的拉曼光谱,对待识别物质的拉曼光谱进行预处理;
[0044]
如图2所示,图2为真阳性冰毒毛发样本的拉曼光谱进行预处理后光谱图,需要说明的是,预处理仅对待识别光谱进行去荧光背景即去基线干扰,并不进行平滑处理防止峰形的有效信息丢失。
[0045]
s2:获取预处理后待识别物质的拉曼光谱的所有波峰,并根据所述波峰的峰位与峰高确定待识别物质的拉曼特征峰;
[0046]
具体的,步骤s2具体包括:
[0047]
s201:对预处理后待识别物质的拉曼光谱数据进行窗函数平滑后再进行二阶求
导,获得所有波峰;
[0048]
s202:提取所述波峰的峰位和峰高,计算每个波峰的峰高和半峰宽之比vr,所述其中h为峰高,w为峰宽。
[0049]
s203:当所述波峰的vr满足特征峰信噪比要求则确定其为拉曼特征峰。
[0050]
需要说明的是,是否满足特征峰信噪比要求ε可基于待检测物质的属性特征进行调整,在本实施例中,真阳性冰毒毛发样本ε为50,vr》50才计为拉曼特征峰。
[0051]
本实施例中,对图2所示的光谱进行峰位提取,获得54个波峰,提取54个波峰的峰位和峰高,计算每个波峰的峰高和半峰宽之比vr,vr》50才计为拉曼特征峰,予以保留,否则删去;计算结果如下表所示:
[0052]
[0053]
[0054]
[0055][0056]
s3:获取包含待识别物质的标准品拉曼光谱数据的数据库;
[0057]
s4:遍历数据库中标准品的拉曼特征峰,与待识别物质的拉曼特征峰对比确定满足匹配条件的目标标准品;
[0058]
具体的,匹配条件为所述标准品的拉曼特征峰与待识别物质的拉曼特征峰的峰位偏差小于第一匹配阈值δ且峰高差距不超过第二匹配阈值δ。需要说明的是,匹配条件δ与δ可依据检测仪器的分辨率进行调节,在本实施例中,此时δ=5,δ=10。
[0059]
s5:根据目标标准品的拉曼特征峰的峰位和峰宽建立自适应窗口,计算自适应窗口内待识别物质与目标标准品的拉曼特征峰的相似度;
[0060]
具体的,相似度公式为:
[0061][0062]
其中,hqi表示相似度,a和b分别为两个大小相同的待检测物质的拉曼数据矩阵和目标标准品的拉曼数据矩阵,与是矩阵a与b的均值,m与n分别为矩阵的行数与列数。
[0063]
需要说明的是,在本实施例中,所述拉曼数据矩阵包含两行数据,其中第一行数据是拉曼位移,第二行数据是拉曼相对强度。
[0064]
本实施例中,对满足匹配条件的峰进行相似度匹配,其自适应窗口化主要在于相似度计算时窗口长度自动根据特征峰峰宽长度而进行改变,待识别光谱数据范围与数据库中特征峰起始位置一致。
[0065]
s6:基于上述待识别物质与目标标准品的拉曼特征峰的相似度,计算目标标准品拉曼光谱的匹配系数;
[0066]
具体的,计算目标标准品拉曼光谱的匹配系数具体公式为:
[0067]
其中
[0068]
其中,n为进行自适应窗口化相似度匹配拉曼特征峰的个数。
[0069]
s7:基于所述匹配系数确定待识别物质中是否含有该目标标准品物质。
[0070]
具体的:若匹配系数小于第一相似阈值,则判定待检测物质中不含有目标标准品物质;若匹配系数大于第一相似阈值小于第二相似阈值,则判定待检测物质中可能含有目标标准品物质;若匹配系数大于第二相似阈值,则判定待检测物质中含有目标标准品物质。
[0071]
本实施例中,第一相似阈值为0.6;第二相似阈值为0.9,即据p值的大小返回最终
结果。若p值均小于p1=60%,则结果为未检出目标标准品物质,若p值大于p1=60%且不大于p2=90%,则结果为可能含有目标标准品物质,若p值超过p2=90%,则结果为含有目标标准品物质。
[0072]
如图3所示,图3为本发明第二实施例提出的一种基于相似度的自适应窗口化拉曼光谱识别方法,应用于待识别物质为假阳性冰毒阳性毛发样本的拉曼光谱进行预处理后光谱图;
[0073]
与第一实施例的区别在于,本实施例中,峰高与半峰宽之比vr需大于100,匹配系数的第一相似阈值p1=75%,第二相似阈值p2=95%。
[0074]
如图4所示,图4为本发明第三实施例提出的一种基于相似度的自适应窗口化拉曼光谱识别方法,应用于待识别物质为真阳性冰毒尿液样本的拉曼光谱进行预处理后光谱图;
[0075]
与第一实施例不同之处在于,峰高与半峰宽之比vr需大于150,匹配系数的第一相似阈值p1=85%,第二相似阈值p2=99%。
[0076]
本发明公开了一种基于相似度的自适应窗口化拉曼光谱识别方法,通过获取待识别物质的拉曼光谱,进行预处理;获取预处理后待识别物质的拉曼光谱的所有波峰,确定待识别物质的拉曼特征峰;遍历数据库中标准品的拉曼特征峰,与待识别物质的拉曼特征峰对比确定满足匹配条件的目标标准品;建立自适应窗口,计算自适应窗口内待识别物质与目标标准品的拉曼特征峰的相似度;计算目标标准品拉曼光谱的匹配系数从而确定待识别物质中是否含有该目标标准品物质;通过自适应窗口相似度比对,无需人为设置任何参数,实现了拉曼光谱识别的自动化。
[0077]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献