一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

拉曼光谱预处理模型生成方法、系统、终端及存储介质

2022-11-12 20:08:00 来源:中国专利 TAG:


1.本发明涉及拉曼光谱预处理技术领域,更具体地说,涉及一种拉曼光谱预处理模型生成方法、系统、终端及存储介质。


背景技术:

2.拉曼光谱是一种基于光与物质相互作用后产生拉曼散射的光谱技术,拉曼散射是由于散射光与入射光的频差与散射介质分子的振动或纯转动能级间隔对应所产生的;作为一种分子振动谱,拉曼光谱的无标记性被广泛应用于化学,生物等检测;然而,由于仪器本身的噪声、样品荧光效应和环境噪声,定量精度和定性准确度受到干扰,特别是对于生物样品的检测,这种干扰会更加明显,使特征峰无法被有效识别;虽然通过仪器的升级改进、检测环境的优化、样品的预处理可以减弱噪声的影响,但会受到时间成本和经济成本的限制,并且目前的技术水平无法从硬件上完全消除这些噪声的影响。
3.拉曼光谱预处理是对采集到的光谱去除基线背景信号和噪声信号,现有技术中,拉曼光谱预处理方法分为数学分析方法和机器学习方法:基于数学分析方法光谱预处理的原理是使用光谱物理数学方程进行解析,由于实际采样的拉曼光谱不完全满足数学方程,并且背景和噪声信号多样化,导致数学分析方法需要针对不同光谱人工调参数,不能实现全自动化,而且难以处理低信噪比或复杂背景信号的拉曼光谱;使用机器学习方法,可以处理复杂背景信号拉曼光谱,并且对低信噪比光谱有更好的处理效果,现阶段基于机器学习方法的拉曼光谱预处理模型多数使用全监督机器学习,但是由于拉曼光谱无法通过真实光谱采集得到无噪声及基线背景信号的标准光谱作为标签,一般是采用模拟的高斯峰或洛伦兹峰生成仿真光谱作为全监督机器学习标签,噪声采用随机高斯噪声,基线使用随机荧光信号,这种处理方法虽然在一定程度上可以拟合出模拟拉曼光谱数据集,但是在使用过程中极易出现噪声峰形过拟合,导致预处理后的光谱信号失真,仍然有一定局限性。
4.现有方法示例:1.基于多项式或最小二乘法拟合去除背景信号的方法:需要根据不同信号和不同信噪比的拉曼光谱进行相应参数的人工设计,导致该方法有一定主观性,并且几乎无法处理低信噪比光谱。
5.2.基于小波变换的去除基线背景信号和噪声的方法:小波变换是根据光谱时域上的分布特征进行拟合,通过设计自动化的迭代可以在一定程度上实现自动化,但是需要根据不同信噪比的拉曼光谱选择不同算法,此外,该方法对低信噪比拉曼光谱处理的噪声抑制、基线背景去除和信号保真效果依然不理想。
6.3.基于深度学习的全监督去除噪声和基线背景信号的方法:利用深度学习可以实现自动化无人为干扰的光谱预处理,并且噪声和基线背景去除效果较好,但是对于低信噪比拉曼光谱,全监督算法会过拟合高斯峰和洛伦兹峰,得到的拉曼光谱会产生一定的变形,导致处理后的光谱失真。
7.需要一种更加低成本、更加高效自动化、高保真的方式方法解决上述问题。


技术实现要素:

8.本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种拉曼光谱预处理模型生成方法,还提供了一种拉曼光谱预处理模型生成系统、一种拉曼光谱预处理终端及一种计算机可读存储介质。
9.本发明解决其技术问题所采用的技术方案是:构造一种拉曼光谱预处理模型生成方法,其中,包括以下步骤:第一步:将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库:第二步:将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化。
10.本发明所述的拉曼光谱预处理模型生成方法,其中,所述将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库包括方法:准备训练数据集,生成理想光谱库和参考光谱库;训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库。
11.本发明所述的拉曼光谱预处理模型生成方法,其中,所述准备训练数据集,生成理想光谱库和参考光谱库包括方法:收集真实的拉曼光谱/表面增强拉曼光谱数据;提取拉曼光谱/表面增强拉曼光谱数据中拉曼光谱的噪声信息、基线背景信号和拉曼特征峰,并分别生成噪声信息库、基线背景信号库和拉曼峰库;将拉曼峰库中的特征峰随机组合生成不带噪声和基线背景信号的理想光谱,并建库;在理想光谱数据上叠加提取的噪声和基线背景信号生成参考光谱,并建库。
12.本发明所述的拉曼光谱预处理模型生成方法,其中,所述训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库包括方法:拉曼光谱生成对抗网络包含生成器和鉴别器,其中生成器:以理想光谱库和随机高斯噪声为输入,生成仿真拉曼光谱;鉴别器:以仿真拉曼光谱库和参考光谱库为输入,将仿真拉曼光谱判别为假或真,并将参考光谱判别为真或假;在训练生成器时,生成器损失函数以鉴别器将仿真光谱判别为真或假的误差最小化为目标;在训练鉴别器时,鉴别器损失函数以鉴别器分类准确率最大化为目标;交替训练生成器与鉴别器,生成器最终生成接近参考光谱的高仿真拉曼光谱库。
13.本发明所述的拉曼光谱预处理模型生成方法,其中,所述生成高仿真拉曼光谱采用公式:;其中表示生成器(g)利用输入的随机高斯噪声(z)和理想光谱()生成
的仿真拉曼光谱;和分别表示鉴别器(d)将输入光谱判断为仿真拉曼光谱为假或真和参考光谱为真或假的概率;该公式包括和两个过程:表示训练鉴别器时,仿真拉曼光谱被判断为假,参考光谱被判断为真,使的值接近于0,进而接近于0,实现了鉴别器准确率最大化;表示在训练生成器时,仿真拉曼光谱被判断为真,使的值接近于1,进而接近于1;通过以上两个过程交替,生成器实现高仿真光谱的生成。
14.本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,同时采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
15.本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方法:使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;采用拉曼光谱背景信号评估模块,初步拟合所需去除的噪声和基线背景信号;理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
16.本发明所述的拉曼光谱预处理模型生成方法,其中,所述将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化采用方
法:使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码;采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并通过损失函数计算损失值;将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新。
17.本发明所述的拉曼光谱预处理模型生成方法,其中,所述拉曼光谱位置编码器模块采用方法为滑动窗口法、正/余弦编码法或类批次编码法;采用滑动窗口法,对拉曼光谱的不同拉曼位移依次进行分割后得到多通道数据;采用正/余弦编码法,对光谱强度相对位置进行编码,具有周期性特征;采用类批次编码法,对多条光谱进行相关性分析,利用相关系数对光谱进行编码。
18.本发明所述的拉曼光谱预处理模型生成方法,其中,所述损失函数采用公式:;;其中用于训练背景信号评估模块,用于训练整个预处理模型;,分别指的是理想参考光谱和预处理之后的光谱;和对应于背景信号评估模块和预处理模型输出;包括训练背景信号评估模块和拉曼光谱预处理模型两个过程:第一步,使用对背景信号评估模块进行训练;第二步,使用对拉曼光谱预处理模型进行训练;计算可选均方根误差、或平均绝对误差方法进行计算,同时在第二步中加入权重系数对二者反馈进行平衡;所述均方根误差rmse采用公式:;所述平均绝对误差mae采用公式:。
19.一种拉曼光谱预处理模型,其中,所述拉曼光谱预处理模型由如上述拉曼光谱预处理模型生成方法生成。
20.一种拉曼光谱预处理模型应用方法,应用如上述的拉曼光谱预处理模型,其实现方法如下:将待处理的原始拉曼/表面增强拉曼光谱输入所述拉曼光谱预处理模型进行处理,输出去除了噪声和基线背景信号的处理后拉曼/表面增强拉曼光谱。
21.一种拉曼光谱预处理模型生成系统,其中,应用于如上述的拉曼光谱预处理模型生成方法,包括:执行所述第一步的参数设置训练集单元和执行所述第二步的模型训练单元。
22.一种拉曼光谱预处理设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上述方法的步骤。
23.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述方法的步骤。
24.本发明的有益效果在于:本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单、快速,并且得到的结果在有效去除噪声和背景基线信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
附图说明
25.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图:图1是本发明实施例一的拉曼光谱预处理模型生成方法流程图;图2是本发明实施例一的拉曼光谱预处理模型生成方法噪声信息、基线背景信号以及拉曼峰提取示意图;图3是本发明实施例一的拉曼光谱预处理模型生成方法高仿真拉曼光谱库和理想光谱库生成流程图;图4是本发明实施例一的拉曼光谱预处理模型生成方法拉曼光谱位置编码模块(滑动窗口法)示意图;图5是本发明实施例一的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;图6是本发明实施例一的拉曼光谱预处理模型生成方法验证1的光谱处理结果比对图;图7是本发明实施例一的拉曼光谱预处理模型生成方法验证2的不同预处理算法对基于血清表面增强拉曼光谱的癌症诊断准确率的影响示意图;图8是本发明实施例一的拉曼光谱预处理模型生成方法验证3的预处理算法对拉曼高光谱细胞成像质量的提升效果比对示意图;图9是本发明实施例二的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;图10是本发明实施例三的拉曼光谱预处理模型生成方法拉曼光谱预处理算法训练流程图;图11是本发明实施例五的拉曼光谱预处理模型应用方法原理框图;
图12是本发明实施例六的拉曼光谱预处理模型生成系统原理框图。
具体实施方式
26.为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
27.实施例一一种拉曼光谱预处理模型生成方法,如图1所示,同时参阅图2-8,其包括以下步骤:s01:将真实拉曼/表面增强拉曼光谱库经由拉曼光谱生成对抗网络处理,生成理想光谱库和高仿真拉曼光谱库:准备训练数据集,生成理想光谱库和参考光谱库;训练拉曼光谱生成对抗网络,并最终生成高仿真拉曼光谱库;如图3所示,包括步骤如下:a1.收集真实的拉曼光谱/表面增强拉曼光谱数据;a2.提取拉曼光谱/表面增强拉曼光谱数据中拉曼光谱的噪声信息、基线背景信号和拉曼特征峰,并分别生成噪声信息库、基线背景信号库和拉曼峰库;a3.将拉曼峰库中的特征峰随机组合生成不带噪声和基线背景信号的理想光谱,并建库;a4.在理想光谱数据上叠加提取的噪声和基线背景信号生成参考光谱,并建库;a5.生成器以理想光谱库和随机高斯噪声为输入,其功能是生成仿真拉曼光谱;a6.鉴别器以仿真拉曼光谱库和参考光谱库为输入,其功能是将仿真拉曼光谱判别为假(或真),并将参考光谱判别为真(或假);a7.在训练生成器时,生成器损失函数以鉴别器将仿真光谱判别为真(或假)的误差最小化为目标,在训练鉴别器时,鉴别器损失函数以鉴别器分类准确率最大化为目标,该过程将导致生成器损失函数值增加,而训练生成器时会对抗该过程,通过交替训练生成器与鉴别器,生成器将生成更加接近参考光谱的高仿真拉曼光谱库;a8.训练生成器和鉴别器过程中,采用损失函数:其中表示生成器(g)利用输入的随机高斯噪声(z)和理想光谱()生成的仿真拉曼光谱;和分别表示鉴别器(d)将输入光谱判断为仿真拉曼光谱为假或真和参考光谱为真或假的概率;该公式包括和两个过程:表示训练鉴别器时,仿真拉曼光谱被判断为假,参考光谱
被判断为真,使的值接近于0,进而接近于0,实现了鉴别器准确率最大化同理,表示在训练生成器时,仿真拉曼光谱被判断为真,使的值接近于1,进而接近于1。通过以上步骤交替,生成器实现了生成高仿真光谱的功能。
28.s02:将高仿真拉曼光谱库输入拉曼光谱预处理模型进行训练;理想光谱库作为拉曼光谱预处理模型的标签,对预处理后的拉曼光谱进行损失值计算并反馈至拉曼光谱预处理模型,进行参数自动优化;基线背景信号:拉曼光谱基线背景信号是指在光谱采集过程中不可避免引入一个缓慢变化的信号,通常来源于荧光信号。在激光照射过程中,光与物质相互作用除了发生拉曼光子跃迁之外,还有很大部分同频荧光发生跃迁,产生缓慢变化的信号,当该信号半高宽大于拉曼峰,有效拉曼谱峰与荧光背景信号叠加在一起会难以被识别,这种现象被称为基线漂移,即产生基线背景信号;生成器主要由神经网络构成,生成器以理想光谱库和随机高斯噪声为输入,其功能是生成仿真拉曼光谱。随机高斯噪声作为一个随机变量,为理想参考光谱提供不同的背景信号。主要可选用卷积神经网络、注意力神经网络、图神网络、或感知机神经网络等;鉴别器主要由神经网络构成,以仿真拉曼光谱库和参考光谱库为输入,其功能是将仿真拉曼光谱判别为假(或真),并将参考光谱判别为真(或假)。主要可选用卷积神经网络、注意力神经网络、图神网络、或感知机神经网络等;具体的,第二步采用方法:b1.使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;同时采用拉曼光谱背景信号评估模块,初步拟合所需去除的信号;b2.采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;主要利用神经网络对光谱进行分类训练,在分类训练过程中,模型会学习得到光谱中的关键的特征(拉曼峰)。编码器采用的方法包括卷积神经网络、注意力网络、或感知机网络等;b3.采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;将来自编码器的高度压缩的特征还原成去除基线和噪声的光谱,使用神经网络自动学习模型训练过程的解码器能力。解码器采用的方法包括卷积神经网络、注意力网络、或感知机网络等;b4.理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失函数:;;其中用于训练背景信号评估模块,用于训练整个预处理模型。
,分别指的是理想参考光谱和预处理之后的光谱。和对应于背景信号评估模块和预处理模型输出。整个训练过程第一步使用只对背景信号评估进行训练。第二步,对整个预处理模型进行训练。计算可选均方根误差、或平均绝对误差方法进行计算。同时在第二步中加入权重系数对二者反馈进行平衡。
29.所述均方根误差rmse采用公式:所述均方平均绝对误差mae采用公式:b5.将损失值反馈回拉曼光谱预处理模型,通过导数链式法则进行模型参数的更新;具体的,第一步中:提取噪声信号可使用小波变换方法、傅里叶变换方法或者窗口滑动方法等实现;说明如下:小波变换是一种时频局部化的信号处理方法,适合于在低频变化缓慢和在高频变化较快的信号,它非常适合于局部瞬时事件。对于拉曼光谱而言,噪声等价于高频信号,基线和拉曼峰等价于较低频的信号,因此使用小波变换可以有效提取拉曼光谱中的噪声信号。具体来说,对光谱信号进行小波变换系数分解,保留主要由噪声信号控制的小波系数,利用保留的小波系数重构可以得到其中的噪声信号;傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号。利用傅里叶变换同样也可以认为噪声是高频信号。具体来说,对光谱进行离散傅里叶变化,根据傅里叶域提取高频分量,最终可以获得其中的噪声信号;滑动窗口算法是在给定窗口大小的数组上执行要求的操作。去噪就是用窗口内数据的统计值(如均值、中值等)来代替当前值,获取噪声的时候就是利用原始光谱减去滑动后的光谱即可获得噪声;提取拉曼光谱拉曼特征峰使用梯度下降法或微分寻峰拟合方法等实现;说明如下:梯度下降是一种常用的求解无约束最优化问题的方法。简单来说就是利用求导的矢量方向和大小求解函数的极值,对于拉曼特征峰提取,利用极值(一个拉曼峰,两个峰边沿)即可分离出拉曼峰;微分法对光谱进行局域微分求解。对于光谱而言,在变化速率小的区域微分值小,拉曼峰附近微分值大。因此根据微分值大小对峰进行分离,可以得到一个个分离得到的拉曼峰;提取基线背景信号使用小波变换方法、傅里叶变换方法或者最小二乘法等实现;说明如下:小波变换是一种时频局部化的信号处理方法,适合于在低频变化缓慢和在高频变
化较快的信号,它非常适合于局部瞬时事件。对于拉曼光谱而言,噪声等价于高频信号,基线等价于低频信号,拉曼峰等价于中频的信号,因此使用小波变换可以去有效提取其中的基线信号。具体来说,对光谱信号进行小波变换系数分解,保留主要由基线信号控制的小波系数,利用保留的小波系数重构可以得到其中的基线背景信号;最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差(真实目标对象与拟合目标对象的差)的平方和寻找数据的最佳函数匹配。对于拉曼光谱而言,总体趋势线属于基线信号,因此利用最小二乘法拟合光谱趋势可获得基线背景信号;傅里叶变换的目的是可将时域(即时间域)上的信号转变为频域(即频率域)上的信号。利用傅里叶变换同样也可以认为基线是中频信号。具体来说,对光谱进行离散傅里叶变换,根据傅里叶域提取中频分量,最终可以获得其中的基线背景信号;第二步中:拉曼光谱位置编码器模块对光谱峰分割采用方法为滑动窗口法、正/余弦编码法或类批次编码法等方法;具体的,“拉曼光谱位置编码器模块”对拉曼位移进行编码可以采用不同的具体方法,包括但不限于滑动窗口法、正/余弦编码法、或类批次编码法等,不同的编码侧重性有所不同。
[0030]“滑动窗口法”将光谱进行多通道分段,分段后每部分光谱分属不同的特征提取,在共同计算中可以保持权重。“滑动窗口法”编码器侧重于对光谱不同拉曼位移段弱特征峰的信号保留。
[0031]
可选方案采用的“正/余弦编码法”,正/余弦编码法对光谱的拉曼位移进行编码,对每个拉曼位移给出一个编码值,可以获得位移和强度的强对应关系,该方法侧重于光谱的周期性特征。
[0032]
可选方案采用的“类批次编码法”使用分析批次间的关系给出编码关系式,例如对同一个拉曼位移的所有光谱强度给出一个固定的编码值,这种编码方法反应了同一个拉曼位移间的强对应关系,侧重分析光谱间的差异。这些编码器的作用都是在模型输入时可以更容易自动匹配每一个强度所对应的拉曼位移,加强模型的拟合和泛化能力;本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单,快速,并且得到的结果在有效去除噪声和基线背景信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
[0033]
图2是拉曼光谱生成对抗网络算法中噪声信息库、基线背景信号库和拉曼峰库提取示意图;具体实施:辅助任务拉曼光谱生成对抗网络算法部分对输入的(a)真实拉曼光谱库进行特征峰寻峰和窗口分割,对相应特征进行提取。特征提取方法包括但不限于最小二乘法,小波变换,维纳变换等。进而建立(b)噪声信息库、(c)基线背景信号库和(d)拉曼峰库;图4是拉曼光谱预处理模型rsbpdl算法中拉曼光谱位置编码模块(滑动窗口)示意图;具体实施:使用滑动窗口策略将光谱分成多个区域送入拉曼光谱预处理模型
rsbpdl模型进行处理。该滑动窗口策略的关键参数是步长(stride)和大小(size)两个参数,这两个参数在模型训练中会根据输出反馈自动选择最合适的数值。该模块的主要作用是对光谱进行切分,从而在光谱预处理过程中实现不同波数段的光谱特征峰提取;在预处理后,可以更好的还原微弱信号的拉曼峰;以下是本发明在对光谱预处理的效果技术参数与现有方法的比较:表1各种预处理算法处理后的光谱与理想光谱的均方根误差(rmse)值比较 表2各种预处理算法处理后的光谱与理想光谱的无穷范数(infinitenorm,)值比较表1和表2分别展示了本发明与现有方法相比,对不同信噪比的原始拉曼光谱的噪声去除和背景抑制能力(表1rmse),以及信号保真程度(表2无穷范数)。其中均方根误差(rmse)用于计算图中两条光谱的差异,该值越小说明噪声去除和背景抑制能力越强,,其中表示光谱总点数,为光谱第个点,理想参考光
谱,预处理之后的光谱。无穷范数()于计算光谱中峰的最大差异,该数值越小,说明光谱的保真度越高,,其中表示光谱总点数,为光谱第个点,表示理想参考光谱,表示预处理之后的光谱。从结果看,本发明rsbpdl处理后的光谱对比原始光谱的均方根误差(rmse)和无穷范数()相比其他现有方法小,说明本发明对拉曼光谱预处理效果优于现有方法;图6是不同算法预处理后的单光谱与理想光谱重合度比较示意图(表1和表2中的光谱4);(a)展示了由拉曼光谱生成对抗网络算法生成的光谱数据,其中原始光谱是含噪声和基线的处理前原始光谱,理想光谱是对应的去除噪声和基线背景信号后的理想光谱。(b-f)展示了五种不同的预处理算法(polynomialfitting,wavelettransform,residualcnn,unet-1d和rsbpdl)对原始光谱进行处理后的光谱与理想光谱的比较。其中rsbpdl为本发明模型。预处理后的光谱与理想光谱越相似,说明该算法对光谱的噪声去除和背景抑制能力更高,对光谱的保真程度更高。从结果看,rsbpdl处理后的光谱与理想光谱重合度最高,并且均方根误差(rmse)和无穷范数()值最小,说明本发明对拉曼光谱预处理效果优于现有方法;图7是本发明预处理拉曼光谱对疾病诊断准确率有提升作用;诊断试验纳入28例癌症患者和27例正常人,数据集划分为训练集各22/21例,验证集各6例,交叉验证100次。诊断模型采用残差神经网络诊断,使用的数据为受试者血清采集表面增强拉曼光谱。为了提高诊断准确率,需要对采集到的拉曼光谱进行去除噪声和基线背景信号的预处理。
[0034]
分别利用本发明的拉曼光谱预处理模型(rsbpdl)以及现有的四种预处理算法(polynomialfitting,wavelettransform,residualcnn,和unet-1d)对采集到的拉曼光谱进行预处理后,再将得到光谱输入疾病诊断模型中训练,并通过验证集评估的诊断准确率。其中受试者工作特征曲线(roc)是临床诊断用于综合评价诊断方法的特异性和灵敏度的工具。auc是roc曲线下的面积,auc数值越高说明诊断准确率越高。由左图可见,经过本发明rsbpdl预处理拉曼光谱的诊断准确率相关roc曲线位于最上方,代表roc曲线下面积最大;右图为误差棒图,其中上下横线表示误差的上下限,棱形表示误差均值。每条线表示一种预处理方法;右图显示,在所有预处理算法中,本发明拉曼光谱预处理算法rsbpdl预处理后进行分类诊断的auc值最大,对诊断准确率的提升效果最佳,本发明拉曼光谱预处理算法rsbpdl通过对噪声和基线背景信号的有效去除,可以明显提高光谱应用于疾病诊断的准确率。
[0035]
图8是本发明对拉曼光谱细胞成像的分辨率提升效果展示;左图是通过拉曼共聚焦显微镜直接采集的原始拉曼光谱图,选择像素点拉曼光谱中2930cm-1
的拉曼峰进行成像,可以看到图像信噪比和分辨率较低。右图对采集到的拉曼光谱使用本发明rsbpdl算法进行预处理后再成图像。
[0036]
通过比较可以看到成像后的图像质量得到较大提升,并且图像中可以看到细胞更多细节,具有更高的信噪比和分辨率。
[0037]
图像质量评价可以通过计算两个图像的熵值实现,熵值越大表明图像所包含信息越多。
[0038]
熵值(entropy)计算公式:,其中pi代表为每个像素点的值。左图熵值为2.43,右图熵值为3.09,结果表明经过rsbpdl预处理光谱后的拉曼图像包含更多的细节信息。因此rsbpdl预处理后可以有效提升拉曼图像质量;实施例二本实施例与实施例一基本相同,相同之处不再赘述,不同之处在于,如图9所示:第二步采用方法:使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;采用拉曼光谱背景信号评估模块,初步拟合所需去除的信号,降低后续拟合难度;理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失值;将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新;如图9所示,与实施例一的方案的区别在于:在第二步中将“拉曼光谱背景信号评估模块”后移,同样可以实现光谱的预处理,只是后置容易降低“拉曼光谱背景信号评估模块”输出结果的作用,效果会有所下降,原因是:当“拉曼光谱背景信号评估模块”被后置后,其特征不能被编码器所提取,只能依靠解码器对背景评估模型输出进行处理。因此,在“拉曼光谱背景信号评估模块”被后置后其可训练性被降低,相比于实施例一中的效果,其预处理后噪声会偏大。
[0039]
实施例三本实施例与实施例一基本相同,相同之处不再赘述,不同之处在于,如图10所示:第二步采用方法:使用拉曼光谱位置编码器模块,对光谱的强度和拉曼位移进行编码,使模型训练时更容易自动关联每一个强度对应的拉曼位移,加强模型的拟合和泛化能力;采用拉曼光谱编码器模块对光谱进行特征提取,提取其中属于拉曼峰的特征;采用拉曼光谱解码器模块将高度压缩的拉曼峰特征还原成拉曼光谱;理想光谱库作为模型训练的标签,与还原后的拉曼光谱集进行比较并计算损失函数;将损失值反馈回拉曼光谱预处理模型,通过链式法则进行模型参数的更新;如图10所示,与实施例一的方案的区别在于:在第二步中仅利用“编码器模块”和“解码器模块”对光谱特征进行提取,并去除基线和噪声。由于移除了“光谱的背景信号评估模块”,虽然同样可以实现光谱预处理,但是效果会有所下降。
[0040]
实施例四一种拉曼光谱预处理模型,其中,所述拉曼光谱预处理模型由如上述拉曼光谱预处理模型生成方法生成。
[0041]
实施例五一种拉曼光谱预处理模型应用方法,如图11所示,应用如上述的拉曼光谱预处理模型,其实现方法如下:将待处理的原始拉曼/表面增强拉曼光谱输入所述拉曼光谱预处理模型进行处理,输出去除了噪声信号和基线背景信号的处理后拉曼/表面增强拉曼光谱;本方法可以直接用于任意待处理拉曼光谱的噪声、基线背景信号去除。输出的处理后光谱,可以直接用于下游应用,并提升该应用的性能。应用包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像分辨率提升等图像领域的应用。
[0042]
实施例六一种拉曼光谱预处理模型生成系统,如图12所示,用于实施如上述的拉曼光谱预处理模型生成方法,包括执行第一步以生成高仿真拉曼光谱库和理想光谱库的参数设置训练集单元1和执行第二步以训练生成参数优化后的自监督拉曼光谱预处理模型的模型训练单元2;本发明是首次将自监督算法用于拉曼光谱的预处理,解决了拉曼光谱没有标签数据用于训练的问题;这种方法的优点是训练完成后模型使用简单,快速,并且得到的结果在有效去除噪声和基线背景信号的同时,具有更高的保真度;此方法可用于实时光谱分析,提高应用的准确率。应用范围包括但不限于物质鉴定、疾病诊断等分类应用,物质浓度/含量检测等定量应用,以及光谱成像信噪比和分辨率提升等图像领域的应用。
[0043]
实施例七一种拉曼光谱预处理设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如上述方法的步骤。
[0044]
实施例八一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,计算机程序被处理器执行时实现如上述方法的步骤。
[0045]
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,rom/ram、磁盘、光盘、闪存等存储器。
[0046]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献