一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于非侵入性测量体内分析物的系统和方法与流程

2022-03-01 08:04:19 来源:中国专利 TAG:
用于非侵入性测量体内分析物的系统和方法与流程

本发明要求2020年7月13日提交的具有相同标题的美国非临时专利申请序列号16/927,804的优先权,该美国非临时专利申请要求2019年7月24日提交的具有相同标题的美国临时专利申请序列号62/878,074的优先权,该美国临时专利申请全文以引用方式并入本文。

技术领域

本公开涉及化学计量学、分析物浓度的确定,并且更具体地涉及用于非侵入性测量体内分析物的系统和方法。

背景技术

许多常用的医疗诊断装置(诸如血糖仪)是侵入性的,因为它们需要从患者抽取血液或其他组织以用于分析目的和/或诊断目的。该过程可能是痛苦的,并且对患者有潜在风险。此外,仅有少数医疗诊断装置可应用于一系列目标分析物,并且一般来讲,需要将样品送到实验室来确定多种分析物的浓度。

已经推行了非侵入性化学计量装置,但这些装置的适用性通常有限,也就是说,它们仅可用于确定特定的分析物或分析物类别的浓度,否则它们的信噪比(S/N)会很差,相对于测试标准,准确度达不到90%。作为前述情况的一个示例,Bergeson等人的文章“Resonance Raman Measurements of Carotenoids using Light Emitting Diodes”报告了一种商业装置,其专注于在共振条件下检测类胡萝卜素的拉曼谱线(Raman line)。由于Bergeson等人公开的这种技术采用特定的共振条件,所以不能推广到大范围的分析物。包括近红外光谱在内的其他非侵入性技术已经用于特定分析物(例如,“Pulse Ox”),但此类方法对于许多其他所关注分析物(例如,葡萄糖)还不够准确,或者在检查多于一个测试对象时准确度不足。

因此,需要一种用于测量体内分析物的非侵入性方法,该方法适用于范围广泛的分析物并且还可以提供准确的浓度测量结果,而无需针对个体测试对象进行校准。



技术实现要素:

本文公开了一种用于非侵入性地探测体内样品以测量分析物的探针。该探针包括:激光发生器,其用于输出具有指定的波长、功率和光束直径的激光辐射;耦合到驱动器的旋转镜,该旋转镜被适配成将激光辐射偏转到样品上,使得激光辐射在样品表面上的焦点随时间推移而移动,从而减小样品之上或之中的任何单个点处的平均辐射强度;以及集光光学器件,其被定位成经由扫描镜接收由激光辐射冲击在样品上的焦斑处所引起的并且从所述样品发出的拉曼信号。被引导到样品上的激光辐射适于从样品引出拉曼信号,用于测量样品中的分析物。

在某些实施方案中,机械驱动器被实施为马达,该马达耦合到旋转镜并且被适配成旋转该旋转镜,使得从该旋转镜偏转的激光辐射在样品表面上描绘图案。在其他实施方案中,机械驱动器可以被实施为压电元件,该压电元件耦合到旋转镜并且被适配成枢转或振动该旋转镜,以便以类似方式使辐射偏转,从而在样品表面上描绘图案。可以使用其他类型的镜驱动器。此外,通过移动样品而不是追踪激光辐射和集光光学器件的焦点,可以产生类似的扫描效果。在一些实施方式中,激光辐射的扫描将冲击在样品的任何单个位置处的平均辐射强度降低到小于.1W/cm2

在某些实施方式中,该探针还包括在其中心具有小镜的窗口,该窗口定位在激光发生器与扫描装置之间。该小镜将从激光发生器传输的激光辐射沿着一条路径重定向至扫描装置,同时拉曼信号和瑞利(Rayleigh)散射激光辐射沿着第二路径行进,穿过未被该小镜遮挡的窗口区域,并且朝向被设计成阻挡激光辐射的波长处的大部分(99.999%)瑞利散射辐射的长通滤光器,并且还允许拉曼信号沿着第二路径通过。来自样品的拉曼信号随后被聚光透镜聚焦并且被引导到光纤中,该光纤将拉曼信号和减弱的激光辐射传输到检测装置,在一种实施方式中,该检测装置包括具有TEC冷却的CCD成像阵列的光谱仪。

本文还公开了一种用于非侵入性地探测体内样品以测量分析物的方法。该方法包括:产生具有波长、功率和直径的激光辐射;将激光辐射偏转到样品上,使得激光辐射在样品表面上的焦点随时间推移而移动,从而使样品表面上的任何单个点处的平均辐射强度下降;以及收集由激光辐射冲击在样品上的该焦点处所引起的并且从所述样品发出的拉曼信号。收集的拉曼信号用于测量样品中的分析物。

在某些实施方案中,激光辐射被旋转镜偏转,该旋转镜被适配成将辐射偏转到样品上,使得偏转的辐射在样品表面之上或之下描绘图案,诸如圆形、椭圆形、光栅扫描。冲击在样品的任何单个位置处的平均辐射强度可以小于.1W/cm2

在某些实施方案中,该方法还包括沿着被引导朝向样品的第一路径重定向激光辐射,辐射沿着该第一路径被扫描部件偏转。散射辐射(瑞利和拉曼两者)沿着第二路径行进,该第二路径也被扫描部件偏转朝向滤光器,以沿着朝向检测装置的该第二路径除去激光波长处的大部分辐射。来自样品的拉曼信号因此沿着第二路径被引导朝向检测装置,使得减小的激光信号(瑞利散射主要被滤光器阻挡)和拉曼信号(未被滤光器阻挡)都被引导到光纤中,光纤将这些信号传输到检测装置。

此外,本公开提供了一种用于非侵入性地探测体内样品以测量分析物的系统。该系统包括:耦合到体内样品的脉搏传感器,其被适配成检测样品中的血液脉搏波并且产生相应的脉搏信号;激光发生器,其用于产生具有波长、功率和初始直径的激光辐射,该激光辐射被引导朝向样品以从样品引出拉曼信号;激光控制器,其被适配成开启或关闭激光发生器;光谱仪,其被定位成接收拉曼信号并且产生光谱数据,由该光谱数据可以计算分析物浓度;以及耦合到脉搏传感器、激光控制器和光谱仪的计算装置,该计算装置被适配成基于从激光控制器接收的定时数据将光谱数据与从脉搏传感器接收的脉搏信号相关联,以便将来自样品的血液内的分析物的光谱分量与来自由样品的非血液成分产生的分析物的光谱分量分离。

在一些实施方案中,该计算装置被配置成计算脉搏信号的指数移动平均值,并且在从脉搏传感器获得的脉搏信号降至低于或升至高于脉搏信号的指数移动平均值时将信号发送至激光控制器以激活激光发生器,使得光谱仪在血液脉搏的谷值或峰值期间接收拉曼信号。

在某些实施方案中,该系统还包括扫描装置,该扫描装置被适配成将激光辐射偏转到样品上,使得激光辐射在样品上冲击的表面区域大于初始光束直径,并且在样品表面之中或之上的任何位置处的平均辐射强度相应下降。由激光发生器产生的激光辐射的波长可以被选择为引起包含在样品内的一种或多种所关注分析物的共振增强。

还公开了一种用于非侵入性地探测体内样品以测量分析物的方法。该方法包括:检测体内样品的血液脉搏信号;在可控时间产生具有波长、功率和初始直径的激光辐射(即,控制体内样品暴露于激光辐射的频率和持续时间),该激光辐射被引导朝向样品以从样品引出拉曼信号;由拉曼信号产生分析物光谱数据;以及将光谱数据与脉搏信号和激光产生的定时相关联,以便将来自样品的血液内的分析物的光谱分量与由样品的非血液成分内的分析物产生的光谱分量分离。

在某些实施方案中,该方法还包括:计算脉搏信号的指数移动平均值;当脉搏信号降至低于或升至高于脉搏信号的指数移动平均值时控制激光发生器开启,其中光谱数据在血液脉搏的谷值或峰值期间产生。

在一些实施方案中,该方法还包括将激光辐射偏转到样品上,使得激光辐射在样品上冲击的表面积大于初始直径,并且在样品之中或之上的任何位置处的平均辐射强度相应下降。可以选择激光辐射的波长,以引起包含在样品内的至少一种所关注分析物的共振增强。

本公开还提供了一种由包含实验拉曼信号数据的光谱数据确定分析物浓度的方法。该方法包括:收集一组实验光谱数据;通过将变化添加到所接收的实验光谱数据来产生附加的半合成光谱数据;以及训练机器学习算法(或者其他模型或模型组合),以从用作训练数据集的光谱数据破译相关拉曼信号,其中该光谱数据既包括所接收的实验光谱数据,又包括附加的半合成光谱数据。

从本发明的某些实施方案的以下描述以及附图和权利要求书中可以了解这些和其他方面、特征和优点。

附图说明

图1是根据本公开的用于非侵入性测量体内分析物的系统的主要部件的示意性框图。

图2是在根据本公开的用于基于拉曼光谱非侵入性测量体内分析物的系统中使用的拉曼探针的一个实施方案的示意图。

图3是可以在根据本公开的用于非侵入性测量体内分析物的系统中使用的示例性光谱仪的主要部件的框图。

图4是显示脉搏波、示例性激光激活和脉搏波指数移动平均值随时间推移的变化的曲线图,展示了根据本公开的一个实施方案的从包含血液的体内样品捕获拉曼光谱数据的方法。

图5是钨灯的示例性观察光谱和根据普朗克方程的理论光谱。

图6A示出了使用本文所公开的拉曼系统的一个实施方案在没有进行平场校正的情况下获得的葡萄糖和胭脂树红类胡萝卜素的暗校正光谱。

图6B示出了在使用钨灯和普朗克方程进行平场校正校准后的图6A的光谱。

图7A示出了使用本文所公开的拉曼系统的一个实施方案获得的氖灯的原始暗校正光谱。

图7B示出了图7A的氖灯的校正了光学像差的光谱。

图7C示出了从光谱仪的CCD检测器的不同切片(行或列)获得的图7A和图7B的氖光谱的基础数据。

图7D示出了通过对图7C中的切片求和并且校准波长而获得的经校准的氖发射光谱。

图8示出了通常存在于体内样品中的某些分析物(包括血红蛋白、胶原蛋白、脂肪和胆固醇)的拉曼光谱。

具体实施方式

概述

用于非侵入性测量体内分析物的系统的简化示意性概览图示于图1中。系统100的部件包括拉曼探针105、脉搏传感器110、激光控制单元115、具有TEC冷却的CCD(热电冷却的电荷耦合器件)阵列125的光谱仪120,以及主计算机130。主计算机130被配置成按已知方式使用计算机可执行指令,以将命令发送到激光控制单元115并且处理由光谱仪120和TEC冷却的CCD阵列125获取的测量数据。第一专用直流电源132可以用于向TEC冷却的CCD阵列125供电,而第二专用直流电源134可以用于向激光控制单元115供电。拉曼探针105被配置成产生激光辐射,该激光辐射被引导朝向体内生物样品135(例如,人类患者的一部分,诸如手指),以用于“探测”包含所关注分析物的样品的目的。样品135可以包含范围广泛的用于医学目的或其他目的的所关注分析物,包括葡萄糖、A1C、胆固醇、脂肪酸、AGE、类胡萝卜素和胆红素等。

从拉曼探针发射的辐射从这样的意义上“探测”样品135:即,被引导到样品上的辐射与样品内的化学元素相互作用,使得样品产生响应信号(通过荧光、瑞利散射和非弹性“拉曼”散射),该响应信号可以由测量仪器(诸如,具有TEC冷却的CCD阵列125的光谱仪120)检测。拉曼探针105可以以多种方式体现,包括例如,使用具有不同波长的激光以便引起特定分析物的共振增强,以及使用各种机构以使高功率激光能够用于捕获大量光子的目的,而不会超过安全W/cm2限值(例如,扫描元件或旋转镜)。在拉曼探针中,所捕获的拉曼信号往往是微弱的。虽然某些分析物由于共振现象而对特定波长具有强烈反应性并且产生相对强的信号,而且在宽带荧光背景上易于检测,但是并非所有的所关注分析物都能够轻易地通过这种现象检测,并且不需要的背景荧光可能淹没由来自所关注分析物的非共振拉曼散射产生的微弱信号。

在以下讨论的实施方案之一中,拉曼探针105被设计成探测样品以便通过拉曼散射产生分子响应信号。拉曼信号具有的优点是它们对于分析物具有特异性,因此具有“签名”特性;然而,拉曼信号也具有显著的缺点,即它们往往相当微弱,并且通常比背景荧光弱几个数量级。此外,光谱仪120的传感器(如上所述可以体现为TEC冷却的CCD阵列125)由于像素增益可变性、跨像素的热电流或“暗”电流变化(诸如“燥点”,这是这种变化的极端情况)、随机散粒噪声(由光子到达传感器的随机性产生,因此是随机的)和其他因素,而可能引入额外的噪声源。即使在没有此类额外的噪声源的情况下,由于来自样品中存在的即便没有数千种也有数百种的不同分析物的信号重叠,光谱仪的直接输出可能无法明显地揭示所关注分析物的浓度。在大多数情况下,由主计算机130执行的数据处理阶段被证明是至关重要的。发明人已经发现,常规数据处理技术(诸如偏最小二乘回归(PLS)和主成分分析(PCA))无法可靠或有效地分拣或检测目标分析物的微弱信号。作为替代,需要特定的数据处理算法(包括但不限于机器学习算法和非负矩阵分解,由已知的物理关系和从各单独分析物取得的光谱获知)来从光谱数据适当地破译分析物信号。

因此,系统100的所有部件(从拉曼探针105到光谱仪120和TEC冷却的CCD阵列125到主计算机130)需要一起配置以实现相对于不需要的强信号(包括噪声和宽带荧光)背景检测所关注的微弱信号的任务,从而非侵入性地确定样品中存在的特定分析物的浓度。因此,以下公开内容包括探针、光谱仪和数据处理设计中的改进,这些改进提高了实现具有临床上可接受的准确度的非侵入性测量的分析物水平测定准确度。

图2是可以在根据本公开的用于基于拉曼光谱非侵入性测量体内分析物的系统中使用的拉曼探针105的一个实施方案的框图。在拉曼光谱中,入射辐射被分子非弹性散射,这意味着以这种方式散射的光子的能量略小于(通常)或略大于传入光子的能量。在光谱上,散射辐射包括与传入光子频率相同的强谱线(来自规则的弹性“瑞利”散射),以及位于该强谱线两侧的较弱谱线(“边带”,来自非弹性“拉曼”散射),称为斯托克斯谱线和反斯托克斯谱线。斯托克斯谱线和反斯托克斯谱线的强度和频率范围可以用于分子鉴定。值得注意的是,图2所示探针的实施方案仅仅是与系统一起使用的探针的一种实施方式;本领域技术人员将会知道,可以根据需要对部件及其规格进行多种修改,以靶向某些分析物、提高信噪比(S/N)、减小荧光、减小某些类型的噪声、提高模块性(例如,使用光纤耦合激光组件),等等。

再次参见图2,探针105包括从激光发生器组件205(“激光组件”)开始的多个部件。由激光组件205发射的激光辐射的具体波长可以基于所关注的具体分析物来选择,该具体分析物可以在某些波长下被激发以发生共振。由于共振极大地提高了信噪比,因此可以选择激光的波长来引发此类共振。通常在分析物吸收光谱的峰值附近观察到共振增强。例如,已知葡萄糖在近红外(NIR)范围内具有吸收峰,并且该范围内的激光波长可能能够引发葡萄糖和在该范围内具有吸收峰的相关分析物的共振增强。当未预先确定所关注的具体分析物或者所关注分析物的共振未知时,激光波长可以基于其他光学考虑,例如,已知波长较长的激光以较弱的信号为代价产生较小的荧光。由于荧光抑制是区分弱拉曼光谱线的考虑因素,所以在由于高水平的背景荧光而导致S/N比低的一些情况下,提示使用较长的波长。在一些实施方式中,可以采用移位激发拉曼技术以允许除去或“取消”荧光基线。该技术的一个实施方案采用像LED一样的宽带光源来激发荧光以建立基线,该基线可以从用窄带光源(激光)获得的光谱中减去。另一个实施方案涉及使用两种或更多种波长略有不同的激光;拉曼信号连同激光一起发生频移,但荧光趋于保持不变,从而允许对其进行估计和去除。

探针的激光组件205(图2)由激光控制单元115(图1所示)控制,该激光控制单元可以被配置成控制激光脉冲的定时和长度(时间长度),或者更一般地控制开启或关闭激光发生器的定时。由激光组件205发射的激光辐射被传输通过谱线(带通)滤光器或短通滤光器210,该滤光器使激光波长通过并且除去来自激光发生器的偏离中央激光波长的任何光谱输出。光束从谱线滤光器210传输到镜215。激光束从镜215行进到第二镜220,该第二镜嵌入在窗口225中,将激光束反射到镜232。

镜232耦合到机械驱动器235,该机械驱动器被适配成响应于电激活信号而旋转、枢转和/或振动该镜。代替镜232,扫描装置可以包括成角度的滤光器。此外,机械驱动器235能够以替代性方式实现。例如,机械驱动器可以是具有耦合到镜232的轴的马达,或者它可以包括被配置成使该镜移动或振动的压电元件。机械驱动器的目的是以下述方式改变激光从镜的反射:该方式使得激光束的焦点以及集光光学器件的焦点在样品135上的多个点上锁步扫描,优选地以规定的图案。以这种方式,聚焦在样品上的光束的直径保持小而密集,但是对于给定功率的激光束,样品在任何单个位置处所暴露于的辐射的平均强度(以W/cm2为单位)相对于固定光束减小。值得注意的是,在一些实施方式中,样品135可以被移动或移位以实现类似的目的,尽管这在处理体内样品时通常是不太方便的技术。这类似于将蜡烛火焰移过人的手:没有烧伤;然而,如果将蜡烛(和手)留在固定位置,则会导致严重的烧伤。机械驱动器235和激光组件205都可以由驱动器单元207激活。

为了完成这项工作,当激光束的焦点经由镜232扫描时,集光光学器件的焦点必须追踪扫描激光的焦点,以便激发激光的焦点和集光光学器件的焦点始终精确重合。在任何单个时间点,激光束都在样品之上(或之中)照射一个小光斑,散射光可以从该小光斑有效地收集并且沿相当小的光纤向下发送。这种双重扫描(在当前实施方案中由旋转镜实现)允许采用比其他情况下功率更高的激光,而不会烧伤或损伤样品。如果激光连续聚焦在样品上的单个小光斑上,则只能使用低功率,因为高功率激光会因过度加热而损伤样品。因此,为了降低入射在样品上的任一个位置处的平均功率,并且避免这种损伤,对焦点进行扫描。由于样品具有热质量,所以足够快的扫描可以导致能够使得样品上的每个点处的平均功率远低于瞬时峰值功率。这意味着可以使用较高功率的激光来引发拉曼效应,从而产生较强的信号,并且因此获得更好的信噪比。另外,还实现了更具代表性的样品采样。

因此,这种方法使对光学扩展量的需求保持可管理,甚至很低,同时允许使用较高的激光功率,并且有效地收集来自样品的散射光。使用密集聚焦的激光束扫描样品并且通过追踪共焦集光光学器件接收拉曼信号是实现拉曼散射光子的有效捕获,并且因此围绕光学扩展量定律(不违背该定律)进行“最终运行”的一种方式。样品上的焦斑始终保持小到足以使返回的拉曼信号聚焦到小光纤中而不会造成显著损失,而高功率激光能够以高光学扩展量系统的方式使用,诸如在激光上有光束扩散器或漫射器(以防止样品烧伤)的系统,以及具有大光纤束和大型低F/#光学器件(以从所得的大照明区域收集信号)的集光系统。再次强调,要使这种方法起作用,照明光学器件和集光光学器件需要在所有时间点共聚焦(聚焦在同一光斑上)。在该所描绘的实施方案中,旋转镜或振动镜232被放置在物镜附近,处于准直激光束和从样品返回的准直信号两者的路径中。镜232的这种放置确保激光光学器件和集光光学器件两者的焦点彼此紧密追踪。

从镜232反射的扫描辐射被引导到聚焦透镜(也称为物镜)240上,然后被引导到样品135上。样品可以被放置在小瓶中或玻璃窗口242上,以在所需深度处提供一致的聚焦。在一个示例中,马达组件235对镜232的旋转导致样品(可以是放置在载玻片上的手指)内部的焦点以下述模式扫描:该模式确保样品之中或之上的任一个位置处的平均辐射足够低,以便不引起损伤或干扰准确测量。在一些实施方式中,例如在其中样品是患者手指的那些测试中,脉搏传感器110定位在第二附近手指上以获取患者的脉搏,原因将在下文进一步解释。

在样品处,传入的激光辐射与成分分析物相互作用并且引起拉曼散射。散射的拉曼辐射(“拉曼信号”)通过使该拉曼信号准直的透镜240传回,然后传输到扫描装置镜232,在那里拉曼信号被反射回具有嵌入的镜220的窗口225。拉曼信号经过窗口225的未被遮挡区域到达长通滤光器245。长通滤光器245被设计成阻挡大部分激光波长辐射(其强度会产生压倒性的干扰,甚至可能损坏CCD阵列),同时让微弱的拉曼信号通过。应当理解,所得的拉曼信号包括不需要的宽带荧光、一定量的噪声,以及极小部分(10-6左右)的激光波长处的辐射。传输通过长通滤光器245的拉曼信号然后经过聚光透镜250,其将准直的拉曼光聚焦到光纤的末端中。虽然图2中未示出,但是如果需要,可以将小型漫射器/匀化器放置在光纤束的正前方,以便匀化传入的拉曼信号,以减小光纤顶端(光纤束中的不同光纤获得不同水平的照明)处的空间变化噪声。拉曼信号最终进入位于探针输出端口262处的光纤或光纤束260中。

在某些实施方式中,光纤束可以由7股线束组成,该7股线束在探针端处具有光纤的圆形排列并且在光谱仪端处具有光纤的线形排列,后一种排列方式被设计成优化与光谱仪的输入狭缝的耦合。在这种情况下,使用SMA905连接器264将光纤束260固定到探针。在其他情况下,光纤束可以是大直径的“导光管”,诸如用于显微镜照明的“导光管”;“导光管”以非常大的光纤束的形式出现,也以大直径液体光波导的形式出现。由于导光管的直径较大,因此使用导光管需要在探针和光谱仪中都使用不同的连接器。

以下描述的当前实施方式中使用的光谱仪具有大型F/1.4光学器件和大型CCD传感器,并且可以操纵长10mm的狭缝,因此可以充分利用“导光管”,或者优选地充分利用大的圆形至线形的光纤束,以便每秒从样品之上或之中的大直径目标区域捕获大量光子。换句话说,这是高光学扩展量系统。光纤束或导光管将来自拉曼探针105的拉曼信号传输到光谱仪120,该光谱仪分离传入的拉曼信号的波长并且产生这些分离波长的低噪声高分辨率图像,即光谱。值得注意的是,在采用大的光纤或光纤束的实施方式中,可以取消光束扫描;可以将光束扩展器直接放置在激光之后以扩散光束,因为可以有效地捕获来自样品上所得的较大直径光斑的光子并且将其传输到足够大的光纤(即,直径与聚焦在样品上的被照射光斑的直径大致相等的光纤)中。在使用小直径光纤(诸如必须与许多商用光谱仪一起使用的光纤)的情况下,必须使用小光束直径才能有效地收集光子,因此采用光束扫描将光束能量分布在样品的较大区域上。然而,即便使用高光学扩展量光谱仪,扫描仍然能够实现较高的激光功率和更具代表性的样品采样,从而使分析仪器更加灵敏。

光谱仪

图3是可以在本发明所公开的系统和方法的环境中使用的光谱仪的示意性框图。图2所示的光纤束或导光管260将光从拉曼探针105传送到光谱仪125的输入端,该输入端包括终止于狭缝310的光纤连接器305。该狭缝的大小可以根据光谱仪的配置进行调整,如下所述。准直透镜315被定位成使通过狭缝310的拉曼信号辐射准直并且将准直的辐射引导朝向第一镜320,该第一镜继而将传入的辐射重定向至第二镜325。辐射从第二镜325反射到交叉色散棱镜330。该棱镜分离拉曼信号辐射的传入波长,并且根据波长水平地偏转这些传入波长。该棱镜执行使用中阶梯光栅设计所需的阶次分离。辐射然后行进到衍射光栅335,该衍射光栅再次根据波长重定向辐射,这次是垂直重定向朝向聚焦透镜340。聚焦透镜340将由光栅335衍射的辐射聚焦到TEC冷却的CCD检测器125上。光谱仪被构造成使得其可以轻易地被重新配置为单阶(非中阶梯光栅)光谱仪,从而允许以牺牲总光谱覆盖率为代价来采用长得多的狭缝。

TEC冷却的CCD成像装置125包括像素阵列,其中每个像素均产生与它们在经受下文讨论的各种噪声源时累积的辐射量(光子数)成比例的电荷。然后可以读出电荷以产生摄谱图像,其指示进入光谱仪的光(在这种情况下是拉曼信号辐射)中存在的波长及其强度。可以根据需要替换光栅335。在一个具体实施方案中,光栅335可以使用1800ln/mm的全息光栅(非中阶梯光栅配置)来实现。在一些实施方式中,光栅可以被替换为中阶梯光栅。在某些实施方式中,光谱仪120可以被配置为具有体积相位全息光栅、大光纤束和极长的狭缝(例如,10mm狭缝与圆形至线形光纤束),以便以牺牲光谱覆盖率为代价获得出色的聚光能力(然而光谱覆盖率对于本公开仍然绰绰有余,如下所述)。在其他实施方案中,光谱仪可以配备中阶梯光栅,以最大化光谱覆盖率。为了适应中阶梯光栅,光谱仪仅限于使用较小直径的光纤(例如,600μm光纤和匹配的狭缝)。在该实施方案中,在不使用任何移动部件的情况下,光谱范围在单个帧中从近紫外充分地延伸到近红外中(350nm至1100nm)。可以设计软件可配置的光谱仪以选择性地实施上述两个实施方案。例如,多个光栅(包括全息光栅和中阶梯光栅两者)可以布置在由步进马达或类似装置驱动的旋转元件上,使得光栅可以被换入或换出光谱仪的光学路径。附加地或替代性地,安装在该光学路径中的多个光栅中的任一个光栅可以由另一个马达可调节地旋转以改变光栅相对于该光学路径的角度,从而修改光谱覆盖率。

以本文所设想的这种非侵入性化学计量学实现高性能的主要挑战之一在于获得必要的仪器配置特征。更具体地讲,探针和光谱仪的特征显著影响获得稳定和准确的结果的可能性。实验表明,为了检测和准确地测量分析物浓度,特别是对于为弱拉曼散射体的分析物以及在存在高水平样品荧光的情况下,必须使用具有高分辨率、合理的光谱范围、高光学扩展量(例如,使用大直径光纤束以便每秒捕获更多光子的能力)和高动态范围的光谱仪。

光谱仪的分辨率决定了该光谱仪能够分辨的光谱峰的最大数目。光谱可以被分为多个“区间”,因此高分辨率光谱仪可以被表征为具有窄区间。具有窄区间的结果之一是每个区间的噪声(包括随机散粒噪声和不需要的宽带荧光)较小,而不会衰减任何适配在区间内的有效窄带拉曼信号。在具有同等强度信号的情况下噪声较小,意味着S/N比较高。测试证明,对于532nm激光,在约0.05nm至0.2nm范围内的分辨率表现良好。对于波长较长的激光,例如980nm,测试表明介于.2nm至.8nm之间的分辨率是可接受的,因为在较长的波长下,相同的拉曼频移转化为较大的波长变化。在高水平宽带荧光的环境中,高分辨率在窄信号(在拉曼散射中很常见)的情况下尤其有益。另一个好处是,由于来自由其他分析物产生的附近峰值的干扰减小,可以更容易地识别具体分析物。值得注意的是,使用诸如平滑化、解卷积、毛毛雨(drizzling)、堆叠或增加曝光时长等程序来补偿分辨率不足很困难,甚至不可能。

光谱范围宽得合理(由诸如本文所述的光谱仪实现,即使在非中阶梯光栅配置下)也是有益的,因为它允许检测更多信号。一般来讲,需要约200cm-1至约3600cm-1的光谱范围。例如,葡萄糖具有多个拉曼信号,范围从远低于500cm-1至超过3000cm-1;光谱范围足够宽以覆盖可用拉曼信号的范围是有益的。与分辨率一样,补偿光谱覆盖率不足很困难。然而,值得注意的是,如果特定波长范围针对特定分析物(例如,葡萄糖),则可以通过仅对目标范围的几个相关子集进行采样来简化硬件要求。在许多情况下,在测试之前将不会知道窄带子集的最佳集合;因此,为了初步确定给定分析物的最佳波长和滤光器要求,足以涵盖所有相关光谱信息的光谱覆盖率是必要的。一旦获得了一种或多种分析物的这种初始数据,就可以设计和采用算法来确定用于利用小型化装置测量分析物的有限集合的最佳滤光器组。

其他光谱仪特征也能够显著地影响性能。许多高性能光谱仪使用将光子转变为电荷的电荷耦合器件(CCD)来检测辐射。CCD由于电子的热力学运动而倾向于产生与其所保持的温度成比例的噪声。这被称为“暗电流”。为实现低噪声,将用于光谱仪中的CCD用热电冷却器冷却至-20℃或更低的温度范围是有用的。另一个重要的考虑因素是光学扩展量或聚光能力。高光学扩展量意味着每秒可以从更大的区域捕获更多的光子,这对于给定的积分周期转化为较好的S/N。在上述的该探针实施方案中,还可以使用将照明散布在样品的更大区域上的扫描装置来增加(或进一步增加)有效的光学扩展量。通过使用较大的光纤直径可以增加实际的光学扩展量;较大的光纤直径使包含更多光子的较宽光束能够到达光谱仪(假设光谱仪可以处理该光束)。一般来讲,采用技术来确保系统的光子通量或灵敏度足以获得足够强的拉曼信号用于分析。

光谱仪的动态范围是可以在提高整体S/N中发挥作用的另一个因素,尤其是当存在较大的荧光背景时,对于生物材料并且尤其是对于非侵入性体内测量通常就是这种情况。具有高动态范围的CCD能够进行更长时间的积分,而不会导致像素变得饱和(例如,由于强宽带荧光),从而能够以较小的读出噪声捕获更多光子。大动态范围允许每单位时间的CCD读出更少,因此对于给定的总光子计数可以减小总读出噪声,从而提高整体S/N。在该当前实施方式中,高动态范围是通过使用以下光谱仪设计来实现的:该设计将每个波长的狭缝图像(信号)散布在众多像素上,从而产生高“有效井深”,其大致等于像素数目乘以单个像素井深。

除了在设定光谱仪的特征(例如,分辨率、光谱范围)和某些操作条件(例如,动态范围)方面的考虑之外,校准光谱仪的波长以及波长间或像素间的灵敏度变化也是实现良好性能所必需的。校准灵敏度在拉曼光谱法的环境中特别重要,尤其是在平滑背景荧光的水平较高时。高水平的背景荧光与像素间(波长间)灵敏度的变化相互作用,可能产生类似于真正的拉曼信号的高水平尖峰噪声。荧光是宽带并且是平滑的,而不是尖峰,因此如果精确地校准波长间的灵敏度,则背景荧光在光谱图中出现时将是平滑的,因此可以更容易地从拉曼信号中分离。所谓“平场校正”,即校正图像帧或光谱上的灵敏度变化,在《天文学世界》(The world of Astronomy)以外的大多数出版物中常常被忽略。除了波长间的灵敏度之外,还有许多其他的光谱仪操作固有的噪声源或干扰源。存在随温度变化的偏差或偏移,以及随温度和像素间的变化而变化的暗电流,其中一些像素(“燥点”)受温度影响的程度比其他像素大。像素灵敏度也存在变化,诸如上文提到的,这对于给定的CCD往往是稳定的。这些“噪声”源通常可以通过校准过程和涉及暗帧、平场和校准灯帧的相关联数学运算来去除,这些数学运算可以用于确定像素的增益、偏移和暗电流。虽然这些现象在这里被称为“噪声”,但许多在本质上不是随机的,而是具有一致性和可重复性,因此可以被“校准掉”(因此噪声用引号标示)。一旦校准完成,图像就可以根据CCD像素集合的已知增益和暗电流进行校正,因为它们具有一致性和可重复性。随机噪声在本质上是不可预测的,并且无法校准除去;这是真正的噪声(不加引号)。随机噪声的一个示例是所谓的“散粒噪声”或“泊松噪声”,其源自光子随机撞击检测器的影响,类似于盖革计数器的随机咔哒声。

光谱仪的设计以引入或不校正某些像差为代价,以便:1)消除尽可能多的光学元件以减少损耗和杂散光;2)最大限度地提高灵活性、分辨率和光学扩展量;以及3)简化机械构造,只要引入的或未校正的像差可以在数学上逆转。更具体地讲,在一些实施方式中,采用或允许仅导致很少信息损失或完全不导致信息损失并且可以在数学上逆转而不引入显著伪影的光学像差。此类像差的一个示例是狭缝图像中的曲率(参见图7A)。已经发现,在狭缝图像中引入倾斜(非直线性),然后一旦图像被数字化就以数学方式补偿像差,实际上产生了增强的光谱仪性能。分析证明,这种增强也可以在具有直线性狭缝图像的光谱仪设计中仅仅通过旋转相机(CCD图像)以使得狭缝图像在图像平面上看起来以最佳角度倾斜而获得。允许此类像差侵入可以实现更简单的光学器件、更好的分辨率、更少的杂散光和更大的通量,以及其他潜在的优点。相反,分辨率差、杂散光多和通量低导致信息的不可逆损失,这种损失在数学上无法撤消。目的是通过在可能的情况下引入前一种类型的在数学上可逆转的像差(其不会导致信息的实际损失),来积极地最小化后一种类型的光学像差。

倾斜的狭缝图像还使得能够实现更细粒度采样(即所谓的“超分辨率”),以及使用解卷积(如有必要),此时由于较高频空间分量混叠到所关注的主波段中而导致的伪影少得多。这类似于时间序列采样、音频信号处理,以及天文图像处理中的“毛毛雨”过程。特别地,“毛毛雨”是一种数字图像处理方法,其用于抖动图像的线性重建,以补偿大视场的欠采样问题。抖动图像是由于在两次曝光之间望远镜在随机方向上轻微移动几个像素而产生的。抖动图像使用通过每个像素的统计显著性对图像进行加权的算法来组合。毛毛雨算法能够去除几何失真、旋转和平移的影响,同时保持光度测定的有效性。能够以不同方式实现的倾斜狭缝(诸如通过轻微旋转相机)提供类似的效果,因为像素的中央波长以比实际水平像素间距所覆盖的间隔更小的间隔出现(具有小得多的长狭缝)。这是因为图像的每一行中的像素相对于其他行,中央波长略有移位。这种移位可能远小于任何单行中的连续像素之间的中心到中心波长差。当像素重新排列,然后“下毛毛雨”到精细得多的网格上时,获得远远更高的有效采样率。结果是采样更佳、更平滑、噪声更低的光谱。

在狭缝图像中引入倾斜(非直线性),然后一旦图像被数字化就以数学方式处理这种像差,产生了与对像差进行光学校正时所实现的性能相比显著提高的光谱仪性能。分析证明,这种增强也可以在具有直线性狭缝图像的光谱仪设计中通过旋转相机(CCD图像)以使得狭缝图像在图像平面上看起来以最佳角度倾斜而获得。从倾斜的狭缝图像得到两个主要的好处。一个好处是在波长域中实现更细粒度采样,如上文所提及的:波长域中的有效采样间隔随着狭缝长度增加而减小。粗光纤束和极长的狭缝在CCD上提供高光学扩展量和长狭缝图像。长狭缝图像可以产生极细粒度的光谱采样。由于分辨率(基于像素大小)保持不变,所以更细粒度采样相当于过采样,且过采样的程度与狭缝图像的长度(以像素为单位测量)成比例(给定最佳的狭缝角度)。这种过采样使得通过适当的解卷积算法在最终光谱中实现子像素分辨率(所谓的超分辨率)成为可能,而不会引入显著的伪影(诸如吉卜斯现象或“振铃”)。倾斜的狭缝图像连同其在数字化图像中的数学逆转带来的第二个好处是,在面对列缺陷、“爆裂”像素以及常常出现在CCD成像装置中的其他缺陷时具有远远更大的鲁棒性。在使用低成本的大幅面CCD芯片工作时尤其如此。同样,宇宙射线撞击更容易去除,并且对从图像提取的最终光谱只有较小的影响。由于许多像素对最终观察到的光谱中的每个波长区间有贡献,所以像素增益或灵敏度变化也往往被平均掉。

另外,通过倾斜的狭缝图像将特定波长分布在多列CCD元件上避免或显著减小了列变化或缺陷的影响。对于长狭缝尤其如此,其中狭缝图像覆盖数百个或数千个像素,如诸如本文所述的高光学扩展量系统中可能遇到的那样。这可以作为如上文所讨论的光学器件中的像差的结果来实现。通过简单地略微旋转CCD成像器并且调整光谱提取软件以匹配,也可以实现特定波长在多列CCD元件上的分布。

对于其中所关注的分析物只有少数几种的应用,光谱仪的所需光谱范围可以显著变窄。这允许将光谱仪设计为小型化的形式。例如,对于窄光谱范围应用,可以使用光谱仪的部件(诸如滤光轮和定制芯片)来代替较大的部件(诸如光栅和大型CCD阵列)。

预扫描校准

鉴于上文讨论的问题,有必要在从样品获取光谱之前对光谱仪执行预扫描校准程序,以尽可能多地去除非随机性的“噪声”。预扫描校准过程的第一部分是暗电流校正。暗电流校正是在所有光源关闭和快门闭合的情况下进行的。这样做是为了确定CCD阵列的像素是否即使在没有光源刺激的情况下也表现出电流变化(所有CCD都在一定程度上这样做,尽管充分冷却可以将暗电流减小到可忽略的水平)。暗校正以下述方式进行:首先用CCD阵列捕获一组“暗帧”,然后通过减去在暗帧中发现的暗电流变化来补偿数据阵列中的像素之间的暗电流变化。暗校正也可以通过其他方式进行。例如,暗帧可以穿插来自实际拉曼光谱或其他来源的数据帧。同样,在去除宇宙射线伪影后,通过减去暗帧来对光谱图像进行暗校正。

在第二步中,系统噪声(由于例如波长间的灵敏度变化而引起)被去除。这可以通过使用钨灯的所谓平场校正来完成,尽管可以替代性地或附加地使用其他程序。钨灯具有众所周知的光谱,该光谱与普朗克方程针对黑体辐射预测的光谱匹配良好。图5A示出了来自钨灯的示例性观察光谱,以及根据普朗克方程计算的在2600°K处的预期黑体光谱。值得注意的是,这些曲线彼此不同:这是因为光学器件和CCD两者在一系列波长上的光谱响应率导致系统灵敏度发生变化。校准过程针对具有未校准光谱光子计数S(i)的所有光谱区间(i)找到校准权重函数W(i),使得W(i)*S(i)与P(i)匹配,其中P(i)是在对应于光谱区间(i)的波长处以及钨灯丝的温度(T)下的预期黑体辐射。

在平场校正程序中,来自钨灯的辐射由光谱仪检测,并且为钨灯辐射生成两条或更多条光谱数据曲线。从这些光谱S(i)中,确定每个区间的权重校准函数W(i)。权重校准函数W(i)一经生成,即可以用于后续程序,以校正光学器件和TEC冷却的CCD阵列中的波长灵敏度变化,并且将这种变化从光谱仪数据中去除。因此,在对样品运行扫描之前,该上述校准过程对光谱仪(甚至探针)的系统“噪声”(包括暗电流、波长间的灵敏度变化,以及偏差)进行校正。

图6A和图6B展示了校准对光谱数据的影响。图6A示出了仅针对暗电流进行校正并且未使用平场校正进行校准的两种分析物的原始光谱。上方的轨线是葡萄糖的光谱,下方的轨线是胭脂树红类胡萝卜素的光谱。图6B示出了在暗校正和平场校准两者之后基于相同的底层图像数据的光谱。对图6A和图6B的比较表明,经平场校正的数据中的噪声水平(尤其是葡萄糖的)大大降低。另外,斜率和峰值振幅也发生了变化:例如,可以在2100倒数厘米附近看到葡萄糖峰值,这在平场校准之前的数据中并不明显。相对峰值强度的准确性是对分析物建模的一个重要因素,因为在极端情况下,不同波长处的相对峰值强度的失真可能使某些分析物无法区分。平场校准有助于确保相对峰值强度在物理上是正确的。

需要使用氖-氩灯和其他发射光谱源对波长执行额外的校准程序。图7A示出了从氖-氩校准灯获取的原始(仅暗校正)光谱图像。光谱图像包含与氖发射谱线相关联的清晰狭缝图像(呈现为负像图像,其中较暗的区域等同于更多的光子)。该图像还描绘了一条适当拟合的“阶次描迹曲线”,它是通过狭缝图像绘制的平滑曲线。该阶次描迹曲线可以在初始校准程序期间获得,然后用于提取光谱,只要光谱仪配置尚未变化。该阶次追踪曲线仅在很少的情况下需要因为漂移而重新计算。在拍摄该图像时,冷却被关闭,像素合并(binning)被设置为4×4(低分辨率,低动态范围模式),并且只显示整个CCD图像的一个小子集。

图7B示出了在对由于光谱仪的光学配置引起的像差进行校正之后氖-氩灯的光谱图像。仅示出了重新映射的像素的子集。一般来讲,许多像素对每个波长或每条光谱线都有贡献,并且可以通过使用更长的狭缝和更大的光纤束来增加像素贡献的数量。这有效地允许多个独立的通道或观察结果有助于每个波长处的强度测量结果,从而有助于减小噪声和增大有效动态范围。

图7C示出了与图7B所示相同的数据,其呈现为来自CCD检测器像素的不同“切片”(行或列)的一组光谱图线。图7C中仅示出了切片的一个小子集。由于所采用的光纤束(Thor Labs圆形至线形的7芯光纤束)中的光纤之间存在空间,以及在探针端进入光纤束中的各个光纤的照明存在变化,这些切片表现出一些强度变化。可以使用光纤末端的漫射器或匀化器来校正这些变化。纤芯照明的变化随光源定位而变化,这改变灵敏度模式,进而可能干扰稳定的平场校正。图7C还示出一些像素出现饱和(在它们的最大值处)。由于许多像素对每个波长处的强度测量结果都有贡献,所以在图7D所示的氖校准灯的最终光谱图线中,该效果不是很明显。该图线是通过将图7C中所示的切片相加来计算的。校准波长是通过拟合多项式以将像素索引映射到以纳米为单位的波长来完成的。图7D的图线示出了氖和氩发射谱线上的NIST数据与观察到的峰值之间的极佳拟合(尽管像素饱和,但标准误差小于5皮米)。该图中的X轴以纳米为单位。值得注意的是,拉曼分析中所用的倒数厘米是激光与信号(边带)之间频率差的量度;其被计算为:倒数厘米=10000000/激光的nm数-10000000/拉曼信号的nm数。如果需要,可以将X轴配置成显示倒数厘米而不是纳米。

数据处理

如图1所指示,光谱仪120经由直接通信信道或无线通信信道耦合到主计算机130。经由该连接,光谱仪120将从样品获得的拉曼光谱法光谱数据传输到被配置成处理该光谱数据的主计算机130。主计算机130还耦合到激光控制单元,主计算机可以向该激光控制单元发送命令信号并且还从其接收关于激光脉冲的定时以及血液脉搏波信号的信息。计算装置可以被配置为具有各种软件工具来实施算法和执行数学运算,诸如确定有关从光谱仪(光谱仪,图1)接收的光谱数据的差分。

在许多应用中,所关注的体内分析物存在于血液中,并且由周围的软组织、间质液和骨骼产生的信号是干扰源。在脉搏血氧测定领域,该问题是通过使用脉搏波振幅而不是总测量信号来解决的。基于血液信号在脉搏期间由于动脉/血管容积的变化而振荡的事实,由血液产生的信号与由其他来源产生的信号区分开。因此,测量光谱的变化仅表征动脉/血管血液。通过仅分析测量光谱的振荡分量,并且丢弃随时间推移保持恒定的分量,可以计算血液中存在的分析物。由于使用为检测弱拉曼信号所需的以分钟为单位测量的长曝光设计的CCD阵列,难以测量周期小于1秒的脉搏波,因此迄今为止还没有实现将该技术应用于拉曼光谱法。在使用光子计数CCD装置的拉曼环境中,更短的曝光是不可行的,因为所得的读出噪声会将相对弱的拉曼信号淹没。此外,在低噪声成像装置中,读出大型CCD阵列的过程本身可能是相当缓慢的过程。

本公开提供了一种使得能够使用普通的CCD成像装置在拉曼光谱法环境中测量脉搏波振幅的方法。该方法通过图4中的脉搏信号的曲线图来展示。脉搏信号405是从脉搏传感器110(图1所示)获得的。图4还示出了激光激活信号410。激光控制单元115按照主计算机130的指示,控制激光与脉搏信号同步地开启和关闭。激光激活信号410被示为具有开启周期和关闭周期的方波信号。在所描绘的这种情况下,当脉搏信号高于其指数移动平均值时,即当血容量高时,激光开启。激光开启/关闭周期开始的确切定时是结合从耦合到激光控制单元的脉搏传感器读取的读数来设置的。在第一次曝光(CCD积分)中,激光被触发以在脉搏信号405升至高于测量脉搏信号405的指数移动平均值(ema)415的点处开启,并且在脉搏信号降至低于ema时关闭。在下一次曝光期间,激光以相反的方式被触发,以在脉搏信号405降至低于ema信号415时开启,并且在该脉搏信号升至高于ema时关闭。换句话讲,在第一次曝光(其范围可以是从10秒到100秒或更长时间的任何值)中,激光仅在脉搏波的峰值附近开启,并且在第二次曝光(具有与第一次曝光相同的积分周期)中,激光在脉搏信号的谷值附近开启。因此,来自样品的拉曼信号仅在血液脉搏的峰值(第一次曝光)或谷值(第二次曝光)期间由激光诱导,并且这些信号不会在整个脉搏振荡中被CCD检测器平均掉。然后通过将从第二次曝光(谷值附近的激光)获得的光谱从第一次曝光(峰值附近的激光)中减去,可以检测从血液分析物得到的有意义的拉曼信号,并且将来自软组织、骨骼等的拉曼信号“抵消掉”。在实际进行实际测量时,上述曝光序列被重复多次,以便提高信噪比。

本公开所提供的用于使用CCD阵列在拉曼光谱法环境中测量脉搏波振幅的一种替代性技术采用不同波长的激光辐射,使得能够在单次曝光内获得“脉搏高”和“脉搏低”数据,从而显著地减小漂移的影响。使用两个不同的激光源,其具有彼此接近的波长,例如相隔1nm,但仍然可测量地不同。激光源可以是被制造成以不同波长为中心的不同激光源,或者它们可以是在略微不同的温度下运行的相同激光源。已知激光波长随着激光源的温度而变化,并且可以用简单的TEC冷却元件来轻易地调节激光源的温度,以提供具有略微不同波长的两种激光。本文为方便起见称为“激光A”和“激光B”的这两种激光具有少量移位的波长,它们诱导也移位相同量的拉曼信号(斯托克斯谱线和反斯托克斯谱线),从而允许将由激光A和激光B产生的拉曼光谱区分开。相比之下,在由激光A和激光B产生的拉曼光谱中出现的背景荧光是平滑的,在移位的光谱之间保持几乎相同;荧光没有移位。

在该方法中,激光A和激光B交替接通和断开,例如,激光A接通/激光B断开,接着激光A断开/激光B接通,如此循环往复。在一种实施方式中,控制激光A在脉搏信号的峰值处接通(此时激光B断开),并且控制激光B在脉搏信号的谷值处接通(此时激光A断开)。然而,来自激光A和激光B两者的拉曼光谱是在同一个CCD曝光时间窗口中获得的。与之前描述的单波长方法相比,这导致2倍的“复用优势”。使用激光A和激光B获得的拉曼光谱彼此相减,这消除了光谱在它们之间共用的背景荧光辐射,从而留下拉曼信号。使用两种激光时来自皮肤的拉曼信号和荧光尽管发生移位,却是相同的,因此可以在数学上被抵消掉。由于激光被相对快速地切换,所以在一秒或更短时间的量级上,几乎没有时间供样品特征漂移(由于平均血流、手指温度、移动等的缓慢变化而引起)。低漂移进而使得能够基本上完全消除荧光(因为出现在相应光谱中的荧光辐射的水平几乎没有时间改变),以及消除源自皮肤和固定组织中的拉曼信号。采用适当的数学处理,可以将源自血液中的拉曼信号从复用数据分离。这种切换激光布置类似于移位激发拉曼,其有时用于处理高水平的荧光,但是也被适配成允许血液信号从源自皮肤、骨骼或其他固定组织中的信号分离。

与基于脉搏波振幅的测量结果一样,在考虑到皮肤色素沉着、软组织和其他因素中的差异的情况下,为了获得跨个体的稳定校准,当使用拉曼数据时,有必要利用分析物的差分或相对测量结果。在一种技术中,以稳定方式产生强信号的一组血液分析物被用作参考或基线。在血液中,血红蛋白通常用作一种良好的参考分析物。在这种情况下,然后相对于血红蛋白对血液中的其他分析物进行测量。该技术避开了由于血容量、组织透明度以及具有个体和时间可变性的其他因素中的差异而引起的问题。在该文献中,由于不能获得用于从一个个体推广到另一个个体,或者甚至从一个个体内的一个时间段推广到另一个时间段的技术,所以在非侵入性NIR以及基于拉曼的分析物测量方面的许多尝试都失败了。

使用半合成数据扩充数据集

即使光谱仪在分辨率、聚光能力和动态范围方面被最佳地设计,并且在所有相关的噪声降低程序、校准程序和脉搏波锁定程序已经被执行之后,由于拉曼信号的相对微弱、来自存在的许多分析物的众多信号、压倒性的荧光背景和各种形式的剩余噪声,即使在已经采取前面提到的措施之后,破译从光谱仪输出的数据中的拉曼峰值可能仍是具有挑战性的任务。

为了解决这个问题,在相关技术中已经采用了包括多元回归、偏最小二乘法(PLS)和主成分分析(PCA)在内的常规数学程序,以便在光谱仪数据内挑选出与一种或多种分析物的定量测量结果相关的拉曼信号。一般来讲,这些程序还不能够胜任以足够大的可靠性或准确性测定分析物浓度。这主要是由于以下事实:即,此类技术通常试图通过选择数据的高度冗余特征作为占主导地位的重要因素来降低过度共线数据集的维数。然而,因为拉曼光谱包含数量庞大的高度不同的特征,其中任何数量的特征在检测特定分析物的存在方面都可能是重要的,所以基于总的方差或相关性来降低维数在拉曼分析中并不是有效的方法。

本公开采用一种或多种数据处理技术,其可以包括如本领域中已知的机器学习算法,这些机器学习算法通过细化应用于输入数据的权重来“学习”,以迭代地接近已知输出值。这些算法采用通过分析扩充数据集所获得的权重。扩充的数据集包括:i)从取自多个对象的血液样品获得的光谱;ii)从纯的或混合的已知分析物获得的光谱;以及iii)由i)和ii)的加权总和或通过其他手段产生的半合成数据。通常难以获得大量的血液样品和纯分析物样品以构建足够大的数据集来训练用于检测特定分析物的算法。通过用半合成数据扩充样品数据,可以获得比其他方式可能获得的数据集大得多的数据集。能够实现这种扩充的理论基础是以下事实:即,在分析物之间不存在化学相互作用的情况下,拉曼光谱是加性的。也就是说,如果特定的样品光谱A在频率X处显示振幅Y1的拉曼峰值,并且样品光谱B在相同的频率X处显示振幅Y2的拉曼峰值,则从50%来自A并且50%来自B的样品获得的组合样品光谱C将具有对应于这两个振幅的线性组合(即,(Y1 Y2)/2)的峰值。该特征允许产生底层数据的任何数量的半合成线性组合,并且将其当作原始样品(例如,数千个或数万个半合成光谱)。

血液样品光谱和纯分析物光谱可以怎样组合以产生半合成光谱的一个示例参考下表1进行说明。

表1

根据表1,已经从10个人类对象(人类对象1、人类对象2等)采集样品。还从4种已知分析物(分析物1、分析物2等)中取样,因此总共有14种样品。人类对象和分析物样品的确切数量仅仅是示例性的,并且可以使用每种类别的不同数量。对于这些样品中的每一者(人类对象1-10、分析物样品1-4),使用上述的系统和方法获得拉曼光谱S1、S2...S14。替代性地,当可获得时,可以对一个或多个已知分析物样品使用标准光谱。表1的最后一列中出现了几个示例性光谱(即,S1、S11和S12);这些光谱仅出于说明性的目的而示出,而不应当被认为是代表准确的拉曼光谱。

图8示出了通常存在于体内样品中的某些分析物(包括血红蛋白、胶原蛋白、脂肪和胆固醇)的光谱。血红蛋白的光谱包括1228、1562、1580和1621cm-1处的峰。据发现,1562、1580和1621处的峰值增大,而1228处的峰值随着长期暴露于葡萄糖的增加而减小。这表明A1C和糖化对血红蛋白的其他作用可以使用拉曼光谱来测量。血红蛋白也充当在微分测量方法中使用的参考分析物。这四种分析物的光谱显示出彼此重叠或靠近的峰值。例如,胶原蛋白、脂肪和胆固醇在大约1440-1450cm-1处示出峰值。在重叠的情况下,此类峰值处的振幅的比率提供有用的信息。给定波长处的峰值反映特定的化学键,例如C=C或C=O。例如,具有C=C键与C=O键的不同比率的分子的光谱将显示具有与在该波长处产生信号的键的数目大致成比例的振幅的峰值。

由于对截然不同的波长处的信号进行振幅比率比较是有用的,因此重要的是适当地平场校准该系统,使得跨波长的灵敏度恒定并且被校准。

表的第二列包括一组权重W1、W2...W14。权重是总和为一(1)的随机值。半合成样品光谱(样品号15)作为14个来源样品的光谱的加权总和产生。换句话讲,样品15(S15)的光谱等于W1*S1 W2*S2 W3*S3...W13*S13 W14*S14。另外的样品S16...Sn可以使用不同的随机权重W1...W14以相同的方式生成。以这种方式,如上所述的由半合成数据扩充的放大数据集可以用于训练神经网络、非负矩阵模型和/或其他程序,以提高从拉曼光谱检测分析物的准确度。

化学计量学

用于在拉曼光谱和化学计量学中测定分析物浓度的常规方法通常是应用一些形式的预测模型,例如多元线性回归、主成分回归(PCA)或“偏最小二乘法”回归(PLS),以试图最佳地“预测”样品中所关注的分析物的已知浓度。这些技术试图从由样品获得的观察到的光谱曲线实现最高平方多重相关或最低平方和误差。在该语境中,光谱曲线中的各个区间被认为是“自变量”,并且这些方法所需的样品中的已知分析物浓度是“因变量”。因此,通常的方法是“盲”程序,其中只有很少的知识或完全没有知识被结合到关于成分分析物的光谱特征或者由这些分析物产生的信号如何组合以产生观察到的光谱曲线的模型中。

本公开中采用的主要模型可以使用主计算机或者访问拉曼信号数据的不同计算装置来执行,该主要模型与上述方法的极大不同之处在于,其充分地结合了关于以下各项的领域知识:(1)从测量结果、文献或QM分子建模中的任一者获得的潜在分析物的光谱特征;(2)来自这些潜在分析物或成分分析物的信号组合以产生从样品获得的观察到的光谱曲线的方式;以及(3)光谱特征跨分析物和样品两者彼此相关的方式。此外,当拟合该模型时,不使用样品的已知分析物浓度(在前一段中提到的“因变量”)。结合领域知识产生了灵敏得多且稳定得多的模型,以及更加不容易受到不期望的曲线拟合的影响的模型。

描述该模型的基本方程是:

Sji=∑kWjkAki Eji (1)

其中Sji是针对第j种样品在第i个光谱区间中观察到的信号强度,Wjk是第j种样品中的第k种成分分析物的浓度,Aki是第k种成分分析物在第i个光谱区间中的信号强度,并且Eji是第j种样品和第i个光谱区间的误差或残差。

方程(1)能够以矩阵形式表示为:

S=WA E(2) (2)

为了拟合该模型,处理器被配置成求解矩阵W和A,使得Frobenius范数(C)(该模型拟合数据的程度的量度)因为受到W和A上的许多约束而最小化。

C=∥S-WA∥2 (3)

换句话讲,执行该模型通过纯分析物或“成分”分析物的光谱曲线的浓度加权总和来最优地再现从样品获取的观察到的光谱曲线。

可以看出,该模型涉及一种类型的矩阵因子分解,并且可能涉及维数降低,这与从奇异值分解获得的结果并无区别。与在维数降低方案(诸如主成分方案)中通常采用的矩阵因子分解相比,所公开的因子分解消除了对正交性的要求,其中正交性被许多其他约束所替代。这些约束将关于光谱特征以及现象的物理特性的领域知识结合到该模型中。

更具体地讲,这些约束可以包括以下各项中的一者或多者:A)由于在任何光谱区间中接收的光子的数目必须等于或大于零并且任何样品中的任何分析物的浓度也必须等于或大于零的事实,矩阵S、A和W为非负性;B)基于领域知识,A中的成分分析物曲线的子集的先验规范。这些预设曲线可以基于多种分析物(诸如葡萄糖、胆红素、胆固醇和血红蛋白,以及它们的变化)的已知光谱曲线(例如,基于测量结果、文献或QM分子建模的曲线)来固定,以说明光谱峰值中的背景依赖性移位。局部规范和“偏差”也可以被指定用于A的一些行。这允许通过使用“更柔和”或“更模糊”的约束将不太精确或完整的知识引入该模型中。

此类局部规范可以基于的因素包括基于对来自先前拟合的模型的残差的检查的估计、某些光谱信号如何与某些分子键相关联的知识,等等。A的一些行可以大部分不受约束,除了非负性,以及可能的稀疏性之外;C)此外,可以将一些“偏差”应用于W的某些列,以将该模型在其与因变量的相关性方面加以改进。这些偏差可以保持很小,以避免不期望的曲线拟合的可能性。然而,应当指出的是,此类偏差对A的包含完全指定的成分分析物曲线的那些行将没有影响,而对包含部分指定的曲线或特征的那些行将只有很小的影响;对A的几乎完全不受约束的行的影响最大;以及D)对任何所涉及的矩阵都没有正交性约束,因为没有理由期望各种分析物的光谱曲线是正交的。事实上,众所周知,不同的分析物能够具有并且时常确实具有一些重叠的光谱峰,这意味着非正交性。同样,样品中分析物的浓度通常可以被假定为非正交的(除了小瓶中的纯分析物(每种分析物一个小瓶)之外)。类似地,从样品获得的光谱曲线很少是正交的。对于使用正交约束模型的常规维数降低技术,为了准确地表示基础化学特性,任何正交解都将需要“旋转”到某一更有意义的倾斜解。在本文所公开的模型中,没有必要进行这种旋转。就命名法而言,所公开的模型可以被称为“直接非负倾斜Procrustean因子模型”。

在训练或模型建立过程中,将包括矩阵W和S的输入的训练数据用于通过求解方程(3)来确定分析物矩阵A。训练数据可以包括上述的半合成数据。一旦确定了矩阵A,主计算机就可以执行该模型以确定新的体内样品中的分析物浓度。这通过求解给定S的浓度矩阵W(其包含样品的观察到的光谱曲线)和在训练/模型建立过程期间获得的分析物矩阵A来完成。在给定A的情况下,用于确定W的算法可以包括任何良好的非负线性最小二乘方程求解器,尽管也可以使用允许添加附加约束的其他算法。

该模型的质量可以通过针对训练数据中的每种分析物将W中发现的浓度与同一个样品集合的测量浓度或已知浓度相关联(例如,通过将W中发现的葡萄糖浓度与使用标准血糖仪获得的葡萄糖浓度进行比较)来评估。可以实现上述模型的变型形式。然而,值得注意的是,为了从拉曼信号获得准确的分析物浓度测量结果,关键因素是将大量的领域知识和基于知识的偏差明确地结合到该模型中。包含未知数量(并且通常是大量)分析物的样品的拉曼光谱呈现极大的自变量集合,其不能在没有严格曲线拟合与信息损失的情况下通过盲多变量预测或基于相关性的模型(包括简单的前馈神经网络)预先减小。因此,在本公开的上下文中不采用此类盲多变量预测或基于相关性的模型。然而,在诸如本文所述的模型的环境中,神经网络和其他机器学习方法也可以用于检测和校正异常值,以及提高测量结果的整体准确度。

应当理解,本文所公开的任何结构和功能上的细节均不应被解释为限制所述系统和方法,而是被提供为用于向本领域的技术人员教导实施所述方法的一种或多种方式的代表性的实施方案和/或布置。

应当进一步理解,在若干附图中各处,图中的相同数字表示相同的元件,并且不是所有的实施方案或布置都需要参考附图描述和展示的所有部件和/或步骤。

本文所用的术语仅出于描述具体实施方案的目的,而并不旨在限制本发明。如本文所用,单数形式“一个”、“一种”和“该”旨在还包括复数形式,除非上下文另外明确指示。将进一步理解,术语“包括”和/或“包含”在用于本说明书中时,指示存在所陈述的特征、整体、步骤、操作、元件和/或部件,但并不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、部件和/或它们的组。

本文使用的取向术语仅出于约定和参考的目的,而不应被理解为限制性的。然而,应当认识到,这些术语可以参照观看者来使用。因此,没有暗示或推断任何限制。

另外,本文所用的措词和术语是出于描述的目的,并且不应被视为限制性的。本文中使用“包含”、“包括”或者“具有”、“含有”、“涉及”以及它们的变型形式意在涵盖其后列出的项目及其等效物,以及附加项目。

虽然已经参考示例性实施方案描述了本发明,但是本领域的技术人员应当理解,在不脱离本发明的范围的情况下,可以作出各种改变并且可以用等效物来替代本发明的要素。此外,在不脱离本发明的基本范围的情况下,本领域的技术人员将会知道许多修改来使特定的仪器、情形或材料适于本发明的教导内容。因此,本发明并不旨在局限于作为实施本发明设想的最佳模式公开的特定实施方案,而是本发明将包括落入本领域普通技术人员所理解的本公开范围内的所有实施方案。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献