一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于负反馈数据库的SERS光谱特征峰识别方法与流程

2022-04-16 13:26:35 来源:中国专利 TAG:

一种基于负反馈数据库的sers光谱特征峰识别方法
技术领域
1.本发明涉及光谱分析的技术领域,尤其涉及一种基于负反馈数据库的sers光谱特征峰识别方法。


背景技术:

2.拉曼检测以速度快、灵敏度高、指纹无损伤等特点在现场检测方面具有独特优势,且在农业、医药、食品、石化等领域也得到了广泛的应用。由于测试对象的sers光谱信号可以通过纳米增强基底放大百万倍以上,甚至可以实现单分子水平的检测,因此可以使用sers光谱特征峰值信息来识别被测试的物体。一般sers光谱分析包括光谱预处理、特征峰提取和特征峰分类等步骤,这其中特征峰提取是sers光谱分析的核心环节。由于每种物质都有相应的sers光谱特征峰分布,因此sers光谱特征峰的位置和大小直接反映了该物质的结构和含量信息,也就是说能否很好地识别sers光谱中的特征峰将直接决定被测试物特征分类的准确性。
3.以往常用的的谱峰识别方法有以下几种方法:幅值法通过设置一个阈值,将大于阈值的第一个点视为光谱峰的起点,将随后的最大点视为谱峰的高点,然后将接下来小于阈值的第一个点视为光谱峰的最终点。该方法的原理较为简单,计算速度较快,但容易受到基线漂移的影响,并且比较阈值的选择对光谱峰检测的准确性有很大的影响。连续小波变换法通过一系列小波函数的叠加对信号进行分解,将寻峰从时域寻找极值转变为小波系数矩阵的脊线寻峰。虽然这种方法寻峰准确率较高,对于噪声和背景也具有较强的抑制能力,但计算量较大,实在不适合实时运算。同时由于脊线长度与小波尺度的选择密切相关,还需要确定脊线长度阈值及脊线信噪比阈值,所以脊线信噪比的意义也不是非常明确。因此连续小波变换法不够稳健,不易使用在信噪比比较大的sers光谱特征峰识别中。导数法是通过把谱线看成是一条连续的曲线这一基本想法,对谱线上每个点求导数,需要根据导数的性质确定谱峰的位置。该方法对于光滑曲线具有较高的搜索准确性,且计算速度基本可以满足实时的要求,但对于噪声较大的复杂谱线易产生虚假峰,需要设置阈值参数过滤掉虚假峰,因此阀值的选取对分析结果影响较大。依据局部信噪比的定义,谱峰处的局部信噪比下限应为6倍的噪声标准差。然而实际的光谱数据除了包含特征峰、基线噪声外,还存在基线漂移,如何从中估计出噪声标准差是一个值得研究的问题。
4.目前,主要是通过手动或半手动的传统方法来进行噪声估计,估计噪声标准偏差首先需要从光谱中找出一段没有包含特征峰、离群值和明显基线倾斜的数据。如果不同场景下采集的光谱数据都用这种方式处理,因为人为主观因素的影响,容易导致估计结果不可靠,这极不利于手持式拉曼光谱仪的自动化操作。并且由于该sers光谱比传统sers光谱的干扰峰更多,所以只进行单纯的谱峰识别是很难将正确的sers光谱特征峰与干扰峰区分开的,干扰峰一般包括噪声干扰峰、基底干扰峰与非物质特征峰等。因此sers光谱特征峰不仅需要进行传统谱峰识别,更需要在传统谱峰识别的基础上再进行特征峰筛选。


技术实现要素:

5.基于背景技术存在的技术问题,本发明提出了一种基于负反馈数据库的sers光谱特征峰识别方法,该识别方法无需人为设置任何参数就可以自动实现特征峰识别,并且还能够识别出弱小的特征峰,滤除虚假峰。
6.本发明提出的一种基于负反馈数据库的sers光谱特征峰识别方法,包括:
7.对sers光谱中的准波峰进行峰形筛选,保留与高斯分布偏差小的准波峰;
8.将所述sers光谱与数据库中标准sers光谱进行匹配选择,选出匹配程度大的标准sers光谱;基于该匹配程度大的标准sers光谱对所述sers光谱中与高斯分布偏差小的准波峰进行负反馈,即得到所述sers光谱中的特征峰。
9.本发明中,先对微弱拉曼信号的准波峰进行峰形筛选,利用准波峰与高斯分布的偏差程度,找出满足高斯分布的所有具有微弱拉曼信号的准波峰,之后再对这些准波峰进行峰位筛选,利用数据库负反馈进行特征峰选择,找出了微弱拉曼信号中的特征峰。
10.优选地,所述sers光谱是将原始sers光谱进行基于卷积神经网络的预处理后获得。
11.本发明中,引入根据拉曼光谱特征训练好的卷积神经网络来消除基线漂移与普通噪声的影响,相比中值滤波、高通滤波和小波变换的传统预处理方法,卷积神经网络具有速度快、实时性好且放大信号的特点,提高拉曼光谱的识别率。
12.优选地,所述“基于卷积神经网络的预处理”具体包括:对于卷积核和输出层的权重选择“glorot”初始化,在训练阶段使用随机网格搜索交叉验证框架来选择精度最高的配置。
13.本发明中,对于卷积核和输出层的权重初始化,之所以选择“glorot”初始化,是因为可以通过跟踪用于随机化的种子来复制初始化。
14.优选地,所述准波峰是利用超对称特征峰提取法对sers光谱进行提取后获得。
15.所述“超对称特征峰提取法”具体包括:将超对称函数作为变换函数与所述sers光谱的数据进行褶积变换,提取出所述sers光谱中的准波峰,并包括获取所述准波峰的峰位、峰高与半峰宽;
16.优选地,所述超对称函数为对称变换函数,其公式如下所示:
[0017][0018]
其中,a和b为常数,x表示变量。
[0019]
本发明中,引入超对称特征峰提取法进行波峰检测和提取,相比传统波峰检测方法中的幅度法、斜率法和面积法,超对称特征峰提取法结合了对类峰形函数进行的特殊设计,与选择匹配滤波器法相结合,提高了检测速度和准确性。
[0020]
优选地,所述“峰形筛选”具体包括:计算所述sers光谱中的准波峰与高斯分布的偏差值α、β,若偏差值α、β不在设定阀值范围内,则滤除该准波峰,若偏差值α、β在所述设定阀值范围内,则保留该准波峰,实现保留与高斯分布偏差小的准波峰。
[0021]
优选地,所述偏差值α为偏度α,其公式如下所示:
[0022][0023][0024][0025]
其中,d表示方差,n表示整个波峰纵坐标个数,表示光谱纵坐标平均值,yi为第i个光谱纵坐标值;
[0026]
所述偏差值β为峰度β,其公式如下所示:
[0027]
μ=ey
[0028]
σ2=exy
2-μ2[0029][0030]
μ表示中心矩,e表示期望算子,y表示光谱纵坐标组成的数组,x表示数据库中光谱横坐标组成的数组,σ表示标准差。
[0031]
本发明中,α、β的设定阀值范围是需要根据大量真实案例数据统计,再结合拉曼特征峰满足高斯分布的这一特点所得出。
[0032]
优选地,所述“匹配选择“具体包括:计算所述sers光谱与数据库中标准sers光谱的匹配系数γ,若匹配系数γ大于设定阀值,则保留该标准sers光谱,实现选出匹配程度大的标准sers光谱。
[0033]
优选地,所述匹配系数γ的公式如下所示:
[0034][0035]
其中,a为所述经峰形筛选后的sers光谱横、纵坐标组成的矩阵,b为数据库中标准sers光谱横、纵坐标数据组成的矩阵,与是a与b的均值,m为横坐标,n为纵坐标。
[0036]
本发明中,匹配系数γ的设定阀值范围是需要根据大量真实案例数据统计,再结合拉曼特征峰满足高斯分布的这一特点所得出。
[0037]
优选地,所述“负反馈”具体包括:计算所述sers光谱中准波峰的峰位与所述标准sers光谱中每个波峰的峰位之差值θ,若差值θ在设定阀值范围内,则将该准波峰作为特征峰,得到所述sers光谱中的特征峰。
[0038]
本发明中,在波峰检测过程中引入基于易制毒化学品数据库负反馈的特征峰筛选步骤,不仅能进一步提高检测速度和准确性,而且还增强了检测弱小峰的准确性与能力。
[0039]
与现有技术相比,本发明具有如下优点:
[0040]
本发明提出的一种基于负反馈数据库的sers光谱特征峰识别方法,能够在不需要预先对sers光谱设置一系列阈值的情况下,获得微弱信号特征峰位置及强度,避免了现有技术对微弱拉曼光谱数据预处理产生的畸变,提高了微弱拉曼光谱信号分析的精度。
附图说明
[0041]
图1为实施例所述识别方法的步骤流程图;
[0042]
图2为实施例所述识别方法的主程序流程图;
[0043]
图3为实施例所述识别方法中第一次峰形筛选的流程图;
[0044]
图4为实施例所述识别方法中第二次峰位筛选的流程图;
[0045]
图5为实施例所述待识别sers光谱预处理前后的示意图;
[0046]
图6为实施例从所述预处理sers光谱中提取出的准波峰的示意图;
[0047]
图7为实施例经第一次峰形筛选出的准波峰示意图;
[0048]
图8为实施例根据cv 10-7
光谱进行第二次峰位筛选出的特征峰示意图;
[0049]
图9为实施例根据cv 10-8
光谱进行第二次峰位筛选出的特征峰示意图。
具体实施方式
[0050]
实施例
[0051]
参照图1-4,本发明提出一种基于负反馈数据库的sers光谱特征峰识别方法,包括如下步骤:
[0052]
s1、将采集到的结晶紫(cv)sers光谱作为待识别的sers光谱,对所述待识别的sers光谱进行基于卷积神经网络的光谱预处理,对于卷积核和输出层的权重选择“glorot”初始化,在训练阶段使用随机网格搜索交叉验证框架来选择精度最高的配置,得到预处理sers光谱;
[0053]
其中,卷积神经网络模型的参数以及取值范围如下所示:
[0054]
卷积层的卷积核个数:#kernels∈1,4,6;
[0055]
卷积核的大小:n∈[2,50];
[0056]
卷积步长:s∈[1,50];
[0057]
正则项中的参数:λ1,λ2=10n,其中n∈[-1,1];
[0058]
sgd更新规则中momentum:momentum∈0.1*[3,12];
[0059]
学习率:lr=10n,其中n∈[0,4];
[0060]
上述待识别的sers光谱在经过卷积神经网络的光谱预处理前后的光谱图像可参照图5所示,图5为所述待识别sers光谱预处理前后的示意图。由图1可知,对待识别sers光谱进行基于卷积神经网络的光谱预处理后,减少了基线背景与普通噪声的干扰,为后续准波峰的提取提供了稳定的条件;
[0061]
s2、利用超对称特征峰提取法对步骤s1中所述预处理sers光谱中的准波峰进行提取,通过选择超对称函数作为变换函数与所述预处理sers光谱的数据进行褶积变换,提取出预处理sers光谱中的准波峰,并获取了准波峰的峰位、峰高、半峰宽以及起始位置等光谱数据;
[0062]
所述超对称函数为对称变换函数,其公式为:
[0063][0064]
其中,a和b为常数,x表示变量;
[0065]
上述利用超对称特征峰提取法从所述预处理sers光谱中提取出的准波峰可参照
图6所示,图6为从所述预处理sers光谱中提取出的准波峰的示意图;
[0066]
从预处理sers光谱中提取出的准波峰的峰位、峰高、半峰宽以及起始位置的详细数据可参照下表1所示:
[0067]
表1预处理sers光谱中的准波峰的光谱数据列表
[0068]
序号峰位峰高半峰宽开始位置结束位置15222991.0820.144885562542886.481.6453954535552020.6710.40537573
………………
541803821.625.58179418125519501037.2913.5419271973
[0069]
s3、计算步骤s2所提取出的准波峰与高斯分布的偏差值,包括偏度α、峰度β,筛选出偏度α、峰度β在设定阀值范围内的准波峰:若偏度α、峰度β不在所述设定阀值的范围内则直接滤除该准波峰,直接不计为sers光谱特征峰,若偏度α、峰度β在所述设定阀值的范围内,则保留该准波峰,由此筛选出所有满足高斯分布的准波峰,得到经第一次峰形筛选后的准波峰;
[0070]
上述偏度α、峰度β的计算公式为:
[0071][0072][0073][0074]
其中,d表示方差,n表示整个波峰纵坐标个数,表示光谱纵坐标平均值,yi为第i个光谱纵坐标值;
[0075]
μ=ey
[0076]
σ2=exy
2-μ2[0077][0078]
其中,μ表示中心矩,e表示期望算子,y表示光谱纵坐标组成的数组,x表示光谱横坐标组成的数组,σ表示标准差;
[0079]
根据上述公式计算出的准波峰的偏度α、峰度β如下表2所示:
[0080]
表2准波峰的偏度α、峰度β的计算结果列表
[0081]
序号峰位峰高半峰宽偏度α峰度β15222991.0820.141.521.572542886.481.646.426.48
35552020.6710.40-0.32.77
………………
541803821.625.582.764.815519501037.2913.54-1.32-2.9
[0082]
上述经第一次峰形筛选出的准波峰可参照图7所示,图7为经第一次峰形筛选出的准波峰示意图;
[0083]
本实施例中,将偏度α的设定阀值定义为-1至3之间,将峰度β的设定阀值范围定义为-3至3之间,筛选出偏度α、峰度β分别满足α∈[-1,3],β∈[-3,3]的准波峰,具体的筛选结果如下表3所示:
[0084]
表3第一次峰形筛选出的准波峰的光谱数据列表
[0085]
序号峰位峰高半峰宽偏度α峰度β15222991.0820.141.521.5725552020.6710.40-0.32.773603603.218.78-0.550.75
………………
2115841430.1311.71-0.962.732216165121.6712.690.931.33
[0086]
s4、计算步骤s1中所述预处理sers光谱与特殊建立的数据库中标准sers光谱的匹配系数γ,筛选出匹配系数γ大于设定阀值的标准sers光谱:若匹配系数γ小于所述设定阀值,则不将该标准sers光谱的峰位与所述经第一次峰形筛选后的准波峰进行负反馈,若匹配系数γ大于所述设定阀值,则将该标准sers光谱的峰位与所述经第一次峰形筛选后的准波峰进行负反馈;
[0087]
上述匹配系数γ的计算公式为:
[0088][0089]
其中,a为所述经峰形筛选后的sers光谱横、纵坐标组成的矩阵,b为数据库中标准sers光谱横、纵坐标数据组成的矩阵,与是a与b的均值,m为横坐标,n为纵坐标;
[0090]
根据上述公式计算出的匹配系数γ如下表4所示:
[0091]
表4匹配系数γ的计算结果列表
[0092][0093]
本实施例中,将匹配系数γ设定阀值的范围定义为90-100%,即当匹配系数γ≥90%时,将数据库中该标准sers光谱的峰位与经第一次峰形筛选后的准波峰进行负反馈;根据上表可知需要进行峰位负反馈的光谱有cv 10-7
与cv 10-8
,即需要进行两次峰位负反馈;
[0094]
根据上表可知,需要进行峰位负反馈的光谱有cv 10-7
,将该cv 10-7
光谱与经第一次峰形筛选后的准波峰进行比对,计算cv 10-7
光谱中每个峰位与所述准波峰的峰位之间的差值θ,若满足θ∈[-5,5],则将该准波峰计为特征峰,若不满足θ∈[-5,5],则滤除,由此完成第二次峰位筛选,得到经第二次峰位筛选后的特征峰,具体筛选结果可参照图8所示,图8为根据cv 10-7
光谱进行第二次峰位筛选出的特征峰示意图;
[0095]
上述根据cv 10-7
光谱进行第二次峰位筛选出的特征峰的光谱数据如下表5所示:
[0096]
表5第二次峰位筛选出的特征峰的光谱数据列表
[0097]
序号峰位峰高半峰宽15222991.0820.1425552020.6710.4037237499.898.66475710695.6625.0759142313.4611.7969392836.1440.7779612671.849.56810401559.6323.62910621037.296.631011371055.5714.371111704283.6228.181212961558.6915.781313671721.703.041413902529.1641.331514455702.7223.161615381210.7115.90
1715841430.1311.711816165121.6712.69
[0098]
根据上表可知,需要进行峰位负反馈的光谱还有cv 10-8
,将该cv 10-8
光谱与所述经第二次峰位筛选后的特征峰进行比对,计算cv 10-8
光谱中每个峰位与所述特征峰的峰位之间的差值θ,若满足θ∈[-5,5],则将该特征峰计为最终的特征峰,若不满足θ∈[-5,5],则滤除,得出sers光谱中的特征峰,具体筛选结果可参照图9所示,图9为根据cv 10-8
光谱进行第二次峰位筛选出的特征峰示意图;
[0099]
上述根据cv 10-8
光谱进行第二次峰位筛选出的特征峰的光谱数据如下表6所示:
[0100]
表6第二次峰位筛选出的特征峰的光谱数据列表
[0101]
序号峰位峰高半峰宽17237499.898.66275710695.6625.0739142313.4611.7949392836.1440.77511704283.6228.18614455702.7223.16715841430.1311.71816165121.6712.69
[0102]
将sers光谱中最终识别的特征峰与实际的特征峰进行对比,其结果如下表7所示:
[0103]
表7 sers光谱中最终识别的特征峰与实际特征峰的对比结果列表
[0104][0105][0106]
由上可知,经过本实施的识别方法最终可以得出一个完整的sers光谱特征峰,且峰位偏移都在正常范围内。
[0107]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明的技术范围内,根据本发明的技术方案及其发明加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献