一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

识别微生物的方法与流程

2022-02-22 17:36:37 来源:中国专利 TAG:


1.本发明涉及一种识别微生物的方法,适用于医学、临床、兽医、农业和食品以及环境领域,该方法使用统计技术,例如用于光谱分布的多变量分析的方法,或者神经网络,以与传统方法相比,在极短的时间内识别和获得与微生物生长有关的迹象。
2.特别地,本发明提供了一种分析仪器,通过分析未知样品的振动光谱的光谱分布图,以及将所述光谱分布图与先前收集并存储在数据库中的样品光谱进行比较来识别微生物。


背景技术:

3.使用振动光谱技术来识别微生物是已知的。
4.例如,傅里叶变换红外光谱(ftir)是一种非破坏性分析技术,可以获取分析样品的化学组分信息。自1990年代初,该技术已用于分析生物样品(diem m.等人,the analyst[27aug 2004,129(10):880-885])。
[0005]
同时,ftir技术对未知微生物的识别和分类能力也得到了展示(helm d.等人,journal of general microbiology(1991,137,69-79)和marley l.等人,vibrational spectroscopy 26,2,2001,151-159)。
[0006]
众所周知,微生物的不同物种、亚种或亚分类的特征在于精确的生化成分,如蛋白质、脂质、核酸和多糖,这反映在特征的振动谱中(ed.griffiths和chalmers,2001年振动光谱手册,john wiley&sons,纽约,第5卷)。
[0007]
ftir技术在微生物学中建议的一些潜在应用包括:
[0008]
(i)鉴定人类或兽医领域的病原体,例如在临床实验室;
[0009]
(ii)流行病学调查、研究主题、病原体筛查、卫生检查、感染链的阐明、控制疗法和复发感染的检测;
[0010]
(iii)环境微生物的表征和筛选;
[0011]
(iv)监测生物技术过程;
[0012]
(v)食品或制药行业的微生物质量控制;
[0013]
(vi)保存收获的菌株。
[0014]
识别已知的微生物的方法是基于未知样品的光谱与存储在数据库中的已知微生物物种的光谱之间的比较分析技术。
[0015]
这种类型的已知识别方法的例子在文件中报道:us5660998a、cn103217398a、us6379920b1、wo2006002537a1、us9551654b2、us20170167973a1、wo2017/210783a1、sousa等人,european journal of clinical microbiology&infectious diseases(2014)33:1345-1353、whittaker等人,journal of microbiological methods 55(2003)709-716、wang等人,international journal of food microbiology 167(2013)293-302。
[0016]
在申请人提交的专利申请pct/it2019/050025中描述了另一种方法。
[0017]
然而,在上述许多已知方法中,以透射、反射或成像模式进行光谱采集。
[0018]
例如,在us5660998和us6379920中报道了透射或反射采集模式,而在wo2006002537a1、us9551654b2、us20170167973a1中采用了成像模式。
[0019]
这些方法的缺点在于获得的信号直接取决于样品的厚度和形态,样品可能太厚而产生饱和,或者不均一并由于散射而产生失真。
[0020]
众所周知,与单点检测器相比,由于每个像素可获得的信噪比较低,因此基于成像方法(例如多像素)的方法可能会限制单个光谱的分辨率。
[0021]
现有技术的另一个缺点是,光谱通常会由于水或其他污染物的存在呈现信号,这些信号覆盖了微生物的特殊信号。
[0022]
在某些情况下,例如cn103217398a,采用干燥程序,但是,如wo2017/210783a1中所报道,这些程序会对微生物产生破坏性和不可逆的影响,也会改变它们的光谱。
[0023]
在某些情况下,例如wo2017/210783a1,可以通过多次采集来去除光谱中存在的水成分。然而,该解决方案具有更长的分析时间和用于比较光谱的分析程序的更大复杂性相关的缺点。
[0024]
现有技术的另一个缺点是参考数据库通常包括有限数量的微生物物种,因此没有涵盖广泛的可能物种。
[0025]
例如,cn103217398a报道的数据库和相关鉴定方法涉及13种细菌。
[0026]
此外,随着参考数据库规模的增加,产生涉及到微生物种类的培养和生长程序、光谱获取程序和比较分析程序等一系列问题。
[0027]
例如,随着数据库规模的增加,未知样品的分析时间也会增加,因为未知样品的光谱必须与数据库中包含的大量光谱进行比较。
[0028]
此外,同种微生物的光谱特征可能存在很大差异,因此很难将它们与数据库中包含的光谱进行比较。
[0029]
这种可变性可能是由于每个物种存在不同的菌株,或者由于培养基化学成分和/或生长条件的可能变化而导致的同一物种的不同培养物之间的差异。
[0030]
因此,需要开发新的方法来识别微生物,以适用于大量微生物分类(例如分类类别或表型组或基因型组),并且使用的参考数据库具有很大的可变性。
[0031]
因此,本发明的一个目的是提出一种能够确定未知微生物样品是否属于一个或多个类别和/或组的识别方法。
[0032]
本发明的另一个目的是提出一种识别微生物的方法,该方法可以区分微生物的相同物种、亚种或子类的不同菌株,这些菌株可能在不同培养基上的不同培养物中生长,或在存在或不存在生物体液和/或复杂的基质的不同环境条件下生长。
[0033]
本发明的另一个目的是提供一种识别微生物的方法,该方法准确、要求每次单独分析都需要快速时间并且不需要高计算能力,即使在大型数据库的情况下也是如此。
[0034]
本发明的另一个目的是提供一种装置,该装置能够以简单的方式实施所述识别微生物的方法,集成所有不同的分析步骤和仪器部件。
[0035]
本发明的另一个目的是提供一种不需要连续或部分互联网连接来进行远程数据处理和后续结果获取的装置和方法。
[0036]
申请人已经设计、测试和实施本发明以克服现有技术的缺点并获得这些和其他目的和优点。


技术实现要素:

[0037]
本发明在独立权利要求中阐述和示出技术特征。从属权利要求描述了本发明的其他特征或主要发明思想的变体。
[0038]
本发明涉及一种识别微生物的方法,特别是一种允许识别未知样品中存在的微生物的方法,将所述未知样品的振动光谱与根据已知样品的参考振动光谱创建的预先计算的模型进行比较,这些模型之前已经存档在数据库中。
[0039]
本发明的识别微生物方法包括:
[0040]
准备已知微生物样品的参考光谱数据库的步骤;
[0041]-创建多个预先计算的模型的一个或多个步骤,与分层组织的微生物的类别和/或分类组相关联,从更广泛的类别和/或分类组到较小的类别和/或分类组,每个预先计算的模型包括与微生物类别和/或分类群相关的识别光谱特征;
[0042]-对未知样本进行采样的一个步骤;
[0043]-获取未知样品光谱的一个或多个步骤;
[0044]-处理未知样品的光谱的一个或多个步骤;
[0045]-一个或多个分析步骤,每个分析步骤连续执行多个子步骤,将未知样品的光谱与所述预先计算的模型进行比较,每个子步骤用多变量分析方法将未知样品的光谱与具有逐渐变小的类别和/或分类组的预先计算的模型比较,以至少提供显示所述未知样品属于微生物的类别和/或分类组的分数。
[0046]-一个或多个控制步骤,其中如果可靠性参数低于预定的可接受值,则要求对未知样品的光谱进行新的采集步骤,或者提供该方法的最终结果,该结果可能包括失败识别,或者成功识别。
[0047]
在一些实施例中,准备与已知微生物样品相关的参考光谱数据库的步骤为,对每个已知样品提供:
[0048]-对已知样品进行取样的步骤,可能从在存在或不存在生物流体和/或复杂基质的情况下在固体或液体培养基上生长获得;
[0049]-获取已知样品光谱的一个或多个步骤;
[0050]-处理已知样品的光谱的一个或多个步骤。
[0051]
在该方法的第一实施例中,未知样品和/或已知样品可以从生长中获得,该生长使用任何合适的培养基,例如固体或液体,可能在存在或不存在生物流体和/或复杂基质的情况下进行。
[0052]
在另一个实施例中,未知样品和/或已知样品可以直接从天然样品中获得而无需经历生长阶段。
[0053]
在一些实施例中,准备数据库的步骤可以仅执行一次以创建数据库,然后可以将其用于未知样品的每个后续分析。
[0054]
在一些实施例中,准备数据库的步骤也可以指数据库更新,在需要包括新的微生物类别和/或分类组时进行,从而扩展该方法的适用范围。
[0055]
类似地,预先计算的模型一旦创建,就可以用于未知样品的每次后续分析,或者也可以在每次需要添加新的微生物类别和/或分类组时进行更新。
[0056]
根据本发明,通过能够以直接或间接方式检测红外辐射吸收的装置,例如振动光
谱仪,来获取光谱。
[0057]
在一些实施例中,本发明可以在不存在和存在样本的情况下使用连续信号采集模式,连续模式分别辅助仪器的清洁操作和为光谱采集做准备的光谱参数(例如信号强度、信噪比、光谱形状、最佳干燥水平)的客观评估。
[0058]
有利地,根据本发明,提供了对上述光谱参数的监测,这允许标准化所获得的光谱的质量,使得该过程独立于操作者的主观评价。
[0059]
因此,使用此模式获取的光谱指的是强度和干燥程度基本相同的样品,因此彼此之间更具可比性。
[0060]
在一些实施例中,本发明使用自动识别分类组的最重要的识别光谱特征的算法。
[0061]
此特性允许显著减少分析步骤所需的时间,从而加快时间并提高识别的准确性。
[0062]
有利地,相对于现有技术的方法,与分层组织的微生物的分类组相关联的多个预先计算的模型的顺序使用允许降低识别未知样品所需的计算能力,因此不需要使用互联网连接,而如果使用分布式(distributed)或远程计算系统进行数据处理,则互联网连接是必需的。
[0063]
这些特征允许增加数据库的大小,允许识别不同微生物或者同一物种、亚种或亚科的不同菌株的物种、亚种、分类或亚分类,它们也可能在不同培养基上的不同培养物中生长,或在不同的环境条件下,可能存在生物流体和/或复杂基质。
[0064]
本发明还涉及一种执行所述识别微生物的方法的设备,包括检测振动分布的装置,其包括辐射源、检测器、待分析的样品放置其上的限定的采集区,以及与检测装置耦合的固定或便携式类型的电子装置,其中安装有处理系统和数据显示系统。
[0065]
在一些实施例中,预先计算的模型存储在所述电子装置中,其与从更广泛的分类组到更小的分类组的分层组织的微生物的分类组相关联,每个预先计算的模型包括与微生物的类别和/或分类组相关联的识别光谱特征。
附图说明
[0066]
参考以下描述、附图和所附权利要求将理解本公开的这些和其他方面、特征和优点。附图是说明书的组成部分,示出了本发明的一些实施例,并且与说明书一起描述本公开的原理。
[0067]
借助以下附图更好地描述和展示本发明,其中:
[0068]-图1是根据本发明方法的可能设备的示意图;
[0069]-图2以示例的方式示出了本发明方法的一个实施例的步骤的框图;
[0070]-图3a和3b显示了使用ftir-atr技术收集的实验数据,其中图3a显示了收集的原始数据,其中每个物种由不同的颜色表示;图3b显示了转换后的数据;
[0071]-图4a和4b分别示出了用步骤e获得的未知样本分类的子步骤的图形表示,以及用于分配步骤f生成的用于识别可靠性的分数的对应表。
[0072]-图5是通过根据此处描述的实施例的方法与数据库的光谱的交叉验证进行验证获得的混淆矩阵,用于根据“属”(genus)类别评估微生物的分类。
[0073]
为了便于理解,在可能的情况下使用了相同的附图标记来标识图中相同的共同元件。应当理解,一个实施例的元件和特征可以方便地结合到其他实施例中而无需进一步说
明。
具体实施方式
[0074]
我们现在将详细参考本发明的各种实施例,其中一个或多个示例在附图中示出。每个实施例都是通过说明本发明的方式提供的,不应理解为对本发明的限制。例如,作为一个实施例的一部分而示出或描述的特征可以在其他实施例上采用或与其他实施例相关联以产生另一实施例。应当理解,本发明应包括所有此类修改和变体。
[0075]
在描述这些实施例之前,还必须阐明,本说明书的应用不限于如以下说明书中使用附图所描述的部件构造与布置的细节。本描述可以提供其他实施例并且可以以各种其他方式获得或执行。还必须澄清,这里使用的措辞和术语仅用于描述目的,不能被视为限制性的。
[0076]
除非另有定义,本文和下文中使用的所有技术和科学术语具有本发明所属领域的普通经验人员通常理解的相同含义。
[0077]
尽管可以在实践中或在测试中使用与这里描述的那些相似或等效的方法和材料来验证本公开,但是下面通过示例的方式描述了这些方法和材料。在发生冲突时,以包含这些定义的本技术为准。材料、方法和示例仅是说明性的,不能以限制性的方式理解。
[0078]
在此和下文中,样品是指任何含有微生物有机体(例如微生物)的任何物质的最小量,但不仅限于用于分析目的。
[0079]
有时,如果需要,在微生物组成未知或已知的情况下,将指定未知样品或已知样品。
[0080]
在一些实施方案中,微生物可以具有医学、临床、兽医、农业和食品、环境方面的意义。
[0081]
图1示意性地示出了根据本发明的用于识别微生物的设备10。
[0082]
在一些实施例中,为了直接或间接地检测红外辐射的吸收,该设备使用装置,例如:
[0083]-红外ir分光光度计,可能在傅立叶变换红外中运行
[0084]-拉曼光谱仪,
[0085]-光热光谱仪
[0086]-光声光谱仪
[0087]-将上面列出的其中一种仪器与谐振技术耦合而非为了信号提升,例如谐振拉曼、表面增强、表面增强拉曼光谱(sers)、表面增强红外吸收(seira)、谐振表面增强红外吸收(谐振seira)、针尖增强拉曼光谱(ters)。
[0088]
本发明的适用性实际上不受用于获取未知样本的振动分布的技术类型的限制,并且这里描述的方法和设备可以与任何类型的振动光谱相关联地使用。
[0089]
举例来说,该设备包括用于ftir型振动光谱的分光光度计,其可以使用样品振动光谱的任何采集模式,例如atr(衰减全反射),因此是ftir-atr分光光度计(图1)。
[0090]
分光光度计可以与处理系统和数据显示系统耦合。
[0091]
处理系统和显示系统可以例如集成到单个处理和显示系统中和/或可以包括在电子装置15中,例如配备有屏幕的个人计算机或便携式装置,例如手机或平板电脑。
[0092]
在一些实施例中,处理系统包括计算机程序,该计算机程序可以存储在电子装置15可读的介质中并且包含可以在每种情况下由设备10执行的指令。
[0093]
在下文中,为了说明的简单,将参考电子装置15来说明能够管理设备10以及处理和显示数据的一套软件和硬件系统。
[0094]
分光光度计的主要部件本身是已知的,它至少包括辐射17的源13和检测器14。
[0095]
为简单起见,分光光度计的其他组件,例如单色器、斩波器、干涉仪,未在图1中显示。
[0096]
源13可以发射适合激发样品中存在的分子的任何类型的辐射17,例如,在ir、ftir或ftir-atr分光光度计的情况下,它可以是红外辐射17的源。
[0097]
在一些实施例中,源13可以是globar类型的黑体辐射源,或量子级联激光器(qcl)或在红外区域发射的通用激光器。
[0098]
在一些实施例中,例如,如果分光光度计基于拉曼技术,则源13可以是单色光的激光源13,基于所采用的拉曼技术的特定类型,其频率可能与红外区域相关联或甚至更高。
[0099]
在一些实施例中,由源13发射的辐射17,即入射辐射17a,可以被引导,可能通过反射元件16,导向位于采集区18中的样本。
[0100]
在使用atr模式的实施例中,入射辐射17a可由反射元件16引导以影响内部反射元件。
[0101]
在一些实施例中,内部反射元件可以是例如晶体12。
[0102]
在一些实施例中,晶体12可以是具有高折射率的晶体12。
[0103]
在一些实施例中,晶体12可以是金刚石、znse、硅或锗的晶体12。
[0104]
有利地,如果晶体12是金刚石晶体12,则其用于比较测量比znse、硅或锗更耐用、并且具有更大的透明度范围的优点。
[0105]
晶体12内部的辐射17的反射在晶体12的表面上产生渐逝场,在该表面上可以定义采集区18。
[0106]
这种渐逝场可以穿透一定范围的深度,视情况而定,可以达到样品内部的几微米。
[0107]
特别地,该深度范围是入射辐射17a的入射角和波长以及用于晶体12的材料的折射率的函数,因此可以认为对于所有样品分析是恒定的。
[0108]
出于这个原因,atr模式有利地允许无需通过穿过样品的辐射光路获得光谱,因此独立于样品的厚度,与使用透射或反射的方法相比,保证了更高的再现性。
[0109]
此外,该模式允许限制或防止可能对光谱质量产生负面影响的散射和/或信号饱和现象。
[0110]
因此,该模式保证了更高的测量重复性和更简单的样品制备。
[0111]
出口处的辐射17,在与样品相互作用之后,即出射辐射17b,然后被反射元件16导向检测器14。
[0112]
在一些实施例中,检测器14可以是dlatgs检测器(氘化l-丙氨酸掺杂的三甘氨酸硫酸盐)。
[0113]
在替代实施例中,检测器14可以是dtgs检测器。在替代实施例中,检测器14可以是mct(碲镉汞)检测器,单个或布置在阵列中。
[0114]
在替代实施例中,检测器14可以是ccd检测器。
[0115]
在替代实施例中,检测器可以是辐射热测量计或微辐射热测量计,单个或布置在阵列中。
[0116]
举例来说,检测器14将包含在出射辐射17b中的光学信息转换成电信号,该电信号被发送到电子装置15。
[0117]
在一些实施例中,该装置被设置为采集nir(近ir)和/或mir(中ir)和/或fir(远ir)区域中的光谱。
[0118]
在一些实施例中,设备10可以在连续采集模式下操作,即在电子装置15的屏幕上实时显示采集区18中每次采集到的内容。
[0119]
本发明还涉及一种通过评估振动分布图来识别样品中微生物的方法,如图2所示,包括:
[0120]-准备已知微生物的已知样品的参考光谱数据库的步骤a,包括:
[0121]-对已知样本进行采样的一个或多个步骤a1;
[0122]-一个或多个获取已知样品光谱的步骤a2;
[0123]-一个或多个步骤a3,可能是自动化的,处理已知样本的光谱以至少识别光谱区域,其中评估每个类别和/或分类组的识别光谱特征的存在。
[0124]-创建多个预先计算的模型的一个或多个步骤a4,与分层组织的微生物的类别和/或分类组相关联,从更广泛的类别和/或分类组到更小的类别和/或分类组,每个预先计算模型包括与微生物类别和/或分类群相关的识别光谱特征;
[0125]-对未知样本进行采样的步骤b;
[0126]-一个或多个获取未知样品光谱的步骤c;
[0127]-在步骤a3中定义的基础上处理未知样品的光谱的一个或多个步骤d;
[0128]-一个或多个分析步骤e,每个分析步骤e提供连续执行将未知样品的光谱与所述预先计算的模型进行比较的多个子步骤,每个子步骤用多变量分析方法将未知样品的光谱与具有逐渐变小的类别和/或分类组的预先计算的模型比较,以至少提供显示所述未知样品属于微生物的类别和/或分类组的分数;
[0129]-一个或多个控制步骤f,其中如果所述可靠性参数低于预定的可接受值,则请求未知样本的光谱c的新采集步骤,或者提供该方法的最终结果,其可以包括失败识别j,或成功识别g、h、i。
[0130]
在一些实施例中,只要需要在数据库中插入新的已知样本,就可以重复所述步骤a1、a2、a3。
[0131]
在一些实施例中,在取样步骤b、a1中,样品可以进行初步程序,其为微生物提供营养物质的添加。
[0132]
在一些实施例中,样品可以在固体培养基上生长。
[0133]
在一些实施例中,样品可以在培养皿上生长。
[0134]
在一些实施方案中,样品可以在液体培养基上生长,然后离心,获得浓缩的沉淀。
[0135]
在一些实施例中,样品可以在液体培养基或液体生长肉汤上生长,然后过滤。
[0136]
在一些实施方案中,样品可以在液体培养基或液体生长肉汤上生长,或者可以对其进行浓缩或富集程序以增加存在的微生物的浓度。
[0137]
在其他实施例中,被分析的样品可以直接从天然样品获得,而无需经历生长期。
[0138]
在一些实施例中,样品可能包含人类、动物、环境、农业和食物来源的生物流体和/或复杂基质。在一些实施例中,光谱采集步骤c、a2可以提供清洁与样品接触的装置表面的预备步骤,例如图1所示的采集区18的表面。
[0139]
在一些实施例中,例如通过连续采集模式可以获得背景光谱以验证这种清洁的有效性,例如通过观察与沉积在采集区18上的杂质相关的吸收带的消失。
[0140]
在一些实施例中,光谱采集步骤c、a2还提供了对沉积在采集区18上的样品进行的检测,采集区18可能位于分光光度计的晶体12上。
[0141]
在一些实施例中,检测物以固体形式沉积在采集区18上,例如通过用一次性棒(disposable rod)移除和沉积它。
[0142]
在一些实施例中,可以将检测物压在采集区18上,例如通过测力压机(dynamometric press)。
[0143]
在一些实施例中,光谱监测样品的干燥水平和为光谱的采集做准备的光谱参数(例如信号强度、信噪比、光谱形状)。
[0144]
在一些实施例中,可以在连续采集模式下评估离开设备的水含量,并监测与相应波数范围内的水的光谱特性相关的吸收带的减少直至可能完全消失。
[0145]
根据本发明,当达到预定的标准干燥水平和光谱参数时获取样品的光谱。
[0146]
有利地,该特征允许克服或至少限制现有技术的问题,即光谱可能由于水的存在而具有覆盖或干扰微生物特有信号的信号。
[0147]
光谱获取步骤c、a2还规定记录从样品中获取的检测的光谱。
[0148]
在一些实施例中,光谱记录提供了获取预定数量的系列光谱,然后对其进行平均以提高信噪比。
[0149]
在一些实施例中,对于每个检测,可以获取和平均包括在从8到512个范围内的多个光谱,优选每个检测在32和256个之间,甚至更优选每个检测在64和128个之间。
[0150]
处理光谱的步骤d、a3,或光谱的平均值,可以提供:
[0151]-识别(可能是自动化的)光谱区域,以评估识别每个类别和/或分类组的光谱特征的存在;
[0152]-使用光谱分布的线性和/或非线性插值和/或拟合算法;
[0153]-计算光谱分布的一阶和/或二阶导数;
[0154]-在整个光谱范围内使用矢量归一化算法对导数进行归一化。举例来说,图3a显示了可以为不同样品收集的光谱,图3b显示了处理后的光谱。
[0155]
通过对几个已知样品重复步骤a1、a2、a3,可以准备已知微生物的参考光谱数据库。
[0156]
然而,在本方法的一些实施例中,还提供了数据库可以包括使用其他方法获得的已知微生物的光谱。
[0157]
在一些实施例中,数据库包括与属于已知微生物的不同分类组的单一微生物培养物相关的光谱。
[0158]
在一些实施例中,数据库包括与每个类别和/或分类组的已知微生物的不同菌株有关的光谱。
[0159]
在一些实施例中,数据库包括与在培养基上生长的样品相关的光谱,例如但不仅
限于琼脂、cna琼脂、cled琼脂、血琼脂、显色琼脂、沙氏琼脂。
[0160]
在一些实施例中,数据库包括与在液相生长肉汤中生长的样品相关的光谱,然后将其离心、或过滤或富集以获得沉淀或浓缩样品。
[0161]
在一些实施例中,数据库包括与在没有生长期的情况下获得的样品相关的光谱,即,从天然样品获得,直接从任何物质或材料获得。
[0162]
有利地,从液体肉汤中的生长和随后的沉淀或过滤或富集获得的光谱的测量允许在生物流体例如体液和/或复杂基质存在的情况下直接识别光谱。
[0163]
数据库中包含的光谱的这种异质性和可变性允许进行一般分析,从而可以识别微生物,还包括来自不同培养基上生长的影响。
[0164]
在使用每个光谱的多次采集的实施例中,可以在数据库中插入单独的重复光谱和/或根据重复计算的平均光谱。
[0165]
步骤a4从包含在数据库中的光谱开始创建预先计算的模型,即包含与分层组织的微生物的分类组相关联的识别光谱特征的参考库。
[0166]
在一些实施例中,预先计算的模型可以存储在设备10的电子装置15中。
[0167]
在一些实施例中,识别光谱特征可以例如包括峰的形状、大小、强度和面积、强度之间或不同峰的面积之间的相关性和比率、峰的最大值的频率。
[0168]
在一些实施例中,识别光谱特征可以包括在950和1280cm-1
之间(与核酸、碳水化合物和多糖相关)、1280和1480cm-1
之间(与淀粉相关,例如蛋白质,甲基和亚甲基,例如脂质),在1700和1800cm-1
之间(与羰基相关,例如脂质),在2800和3000cm-1
之间(与脂肪链相关,例如脂质),3a和3b以图例的方式显示。
[0169]
在一些实施例中,分类组可以包括分类学类别,例如域、界、门、纲、目、科、群、属、种、亚种。
[0170]
在一些实施例中,分类组可以是例如原核生物、真核生物、古细菌、革兰氏阳性菌、革兰氏阴性菌、酵母菌、丝状真菌。
[0171]
在进一步的实施例中,分类组可以例如是分类学类别和/或表型组和/或基因型组。
[0172]
在一些实施例中,分类组可以从更广泛的分类组到更小的分类组分层组织,使得更广泛的分类组包括一组更小的分类组,例如微生物的一个属可以包括不同的物种,微生物的一个物种可以包括几个亚种。
[0173]
在一些实施例中,预先计算的模型可以包括与每个类别和/或分类组相关的识别光谱特征的列表。
[0174]
在步骤a4中,然后比较数据库中包含的光谱以识别微生物分类组共有的识别光谱特征。
[0175]
在一些实施例中,可以提供自动识别系统来识别与分类组相关联的识别光谱特征。
[0176]
在一些实施例中,可以通过下面提到的统计分析技术和/或基于神经网络和/或人工学习(artificial learning)的方法来识别与分类组相关联的识别光谱特征。
[0177]
在一些实施例中,因此可以基于分类组创建任意数量的预先计算的模型。
[0178]
这样,每次在分析步骤e中,未知样本的光谱与模型进行比较时,这种比较只能在
光谱区间和/或与最感兴趣的光谱特征相关,而不是在整个光谱范围和/或所有光谱特性上。
[0179]
例如,如果想要在整个光谱范围内比较以1cm-1
分辨率采集的未知样品的光谱,与包含例如以相同分辨率采集的18000个参考光谱的数据库,这种比较,使用最先进的方法,需要6500万个点(points)的评估。
[0180]
申请人已经发现,通过使用根据本发明的预先计算的模型,该比较可能需要比现有技术的方法低20到80倍之间的数量的点的评估。
[0181]
因此,预先计算模型的使用允许以相关方式减少必要的计算能力,因此排除远程数据分析和/或分布式计算的需要,即使存在大型数据库也是如此。
[0182]
因此,该特征允许显著增加数据库的大小以包括大量分类组,从而改进和扩展本发明方法的预测和识别能力。
[0183]
这一特性还允许在高分辨率下处理光谱,提高方法的准确度和精密度。
[0184]
此外,例如,所述列表的存在可以使得在所有光谱的整个波数范围上使用最小二乘法和/或可能的平均均方抛弃量(average square discards)计算变得多余。
[0185]
在一些实施例中,分析步骤e连续提供多个比较子步骤,其中将未知样品的光谱与预先计算的模型进行比较。
[0186]
特别地,每个子步骤将未知样品的光谱与逐渐变小的分类组的预先计算的模型进行比较,并提供至少一些显示未知样品属于微生物的微生物分类组的分数。
[0187]
在本发明的一些实施例中,多变量分析的统计和/或化学计量方法可用于比较,例如主成分分析(pca)或线性判别分析(lda),以及线性判别偏最小二乘法(ldpls)、二次判别分析(qd)、分层聚类分析(hca)、随机森林算法,或这些和未明确提及的其他技术的任何组合。
[0188]
在一些实施例中,执行基于神经网络的方法的方法、技术或算法可用于所述比较。
[0189]
在一些实施例中,执行基于人工学习(机器学习)的方法的方法、技术或算法可用于所述比较。
[0190]
在本发明的一些实施例中,所述比较还可用于比较光谱和模型的一阶和/或二阶导数。
[0191]
在一些实施例中,可以统计权重以不同的方式对光谱的不同区域进行加权。
[0192]
在本发明的一些实施例中,光谱与模型之间的比较可以通过光谱与模型之间距离的定义来进行,例如使用基于最小二乘法的方法。
[0193]
在一些实施例中,该距离可以用作执行统计和/或化学计量分析的度量。
[0194]
在一些实施例中,光谱之间的差异可用于pca和/或lda分析。
[0195]
在一些实施例中,可以使用组合统计方法,其执行pca,随后通过lda分析主要成分的线性判别式。
[0196]
在这些实施例中,当pca的结果经受随后的lda分析时,通过pca获得的簇的分离被加强,从而还允许识别彼此具有非常相似的光谱特征的物种。
[0197]
在一些实施例中,比较子步骤可以首先将未知光谱与更广泛分类组的预先计算的模型进行比较,以识别未知样本所属的更广泛类别和/或分类组;随后,将未知光谱与预先计算好的渐小分类组的模型进行比较,以识别未知样本所属的渐小分类组。
[0198]
有利地,相对于其他已知方法,该特性允许在光谱类型之间执行较少数量的比较。
[0199]
例如,如果数据库包含与45类不同物种相关的45种光谱,则现有技术的已知方法将尝试通过将未知样品与存在的所有45类的物种进行比较来识别未知样品。
[0200]
另一方面,在本发明的方法的实施例中,可以根据具有相似特征的更广泛的分类宏组(例如4个)对45个物种进行分类。
[0201]
例如,每个宏组包含3个较小的分类组,每个分类组又包含2个更小的分类子组,后者例如与不同的物种或亚种相关联。
[0202]
在这种情况下,可以提供3个子步骤,其中在第一个子步骤中将第一分类宏组分配给未知样本,在第二个子步骤中分配第二分类组,在第三个子步骤中步骤分配第三分类组。
[0203]
有利地,该特性允许将光谱划分为相似的宏组,简化数据矩阵并允许在第一步之后处理不太复杂的数据矩阵,在该数据矩阵中更容易识别划分例如特别是相似的物种或亚种的特性。
[0204]
此外,该特性因此允许获得更快和更有效的方法,无论是在时间方面还是在计算资源的消耗方面都相对于已知方法而言。
[0205]
在一些实施例中,在每个比较子步骤中,多变量分析技术显示未知光谱归属于与其比较的每个分类组的分数。
[0206]
归属分数可以从上述多变量分析技术以已知方式获得,并且可以归一化并表示为百分比。
[0207]
例如,在一些实施例中,归属分数可以与主要成分之间的线性判别式相关联。
[0208]
在一些实施例中,控制步骤f提供验证在分析步骤e中执行的识别的可靠性。
[0209]
该控制可以例如通过验证在每个子步骤中已经识别出未知样本所属的至少一个分类组来执行,该分类组具有高于预定接受值,例如高于70%的归属分数。
[0210]
在这种情况下(图2中的框g),未知样本被识别为较小的分类组。
[0211]
如果在一个或多个比较子步骤中,归属分数之一低于预定接受值,则该方法提供第二采集步骤c、第二处理步骤d和第二分析步骤e以对未知样本进行第二检测。
[0212]
如果两个分析步骤e将未知样本分配到相同的分类组(图2中的框h),则未知样本将被两个分析步骤e分配的最小分类组识别。
[0213]
否则,规定进行第三次检测,并且执行第三采集步骤c、第三处理步骤d和第三分析步骤e。
[0214]
如果第三分析步骤e将未知样本分配给至少一个先前分析步骤e的相同分类组(图2中的框i),则未知样本被识别为由所述两个匹配的分析步骤e分配的最小分类组。
[0215]
否则,提供未识别信息(图2中的框j)。
[0216]
一个实施例提供了一种用于收集数据并针对数据库对其进行分析的计算机程序或软件,该程序或软件可以存储在计算机可读介质中并且包含指令,该指令一旦由用于微生物分类和识别的分析设备执行,就确定执行根据本说明书的方法。。
[0217]
实施例1
[0218]
图4a示意性地示出了根据本发明通过应用多个预测模型(步骤e)在未知光谱上执行以随后确定各种感兴趣类别的过程流程。在已知光谱的数据库上将未知光谱与在步骤a1、a2、a3、a4中开发的多个预测模型进行比较。例如,每个模型都基于pca-lda分析,该分析
用于将可能类型中的某个特定类型归属于被确定的分类。特别是,对于图4a中的每个面板,每个点对应于由pca-lda计算分配给已知样本数据库中存在的光谱的坐标(步骤a4);一个集合a、b、c中的每个点都反映了它属于的用于确定类别的特定类型。在模型1中,确定属于为类别1提供的各种类型,已知样本的所有光谱被分组在相应归属集合a、b、c中(图4a的第一面板)。对于模型1,三种不同的类型因此是可能的,每种类型都与模型定义的空间的特定部分相关联。
[0219]
对于每个未知光谱,在步骤e中,它在模型定义的空间中占据的空间坐标被预测,并通过评估其在同一空间中的方位,确定其与所讨论的类别相关的类型。举例来说,在图4a的第一面板中可以看出,对于模型1,它的坐标与属于类型a的模型的光谱的坐标类似,因此它被指定为相同的类型。
[0220]
模型从最广泛到最小的层次细分允许通过提供多个模型应用的子步骤,获得关于所讨论的微生物类型越来越多的具体信息(图4a第二和第三的面板)。
[0221]
应该注意的是,属于为类别1提供的特定类型决定了哪个后续模型将应用于未知样本。
[0222]
因此,将未知光谱与逐渐变小的分类组的预先计算的模型进行比较,以便逐渐识别出与未知样本相关联的更详细的所属类别(图4a)。
[0223]
对于在未知样本的分析步骤e中应用的每个模型,还计算显示属于相关类型的分数,可能以百分比的形式。该值反映了为未知光谱计算的坐标与模型中为相同类别的光谱定义的坐标(图4b中的表格)的相似程度。
[0224]
随后,在步骤f中,在图4b中示意性地示出,评估与在过程的各个子步骤期间确定的每种类型相关联的归属分数,以评估结果的可靠性。对于每个模型,已经定义了可接受值,高于该值可以认为结果是可靠的。如果从上面的比较中发现所有归属分数的值都高于为每个模型预先建立的值,则提供结果(步骤g),否则请求新的分析步骤。
[0225]
实施例2
[0226]
在该方法的一个实施例中,它可用于鉴定上述任何一种可能的分类特征,例如微生物属。参见图5,其显示了根据本发明的数据库的光谱验证该方法得到的混淆矩阵,其中可以观察到实际结果和预测结果之间从97.5%到100%的对应关系。
[0227]
显然,在不脱离本发明的领域和范围的情况下,可以对如前所述的方法和/或设备进行部件或步骤的修改和/或添加。还清楚的是,虽然已经参照一些具体例子描述了本发明,但是本领域技术人员当然能够实现具有所述特征的许多其他等效形式的方法和/或装置。在权利要求中,因此都属于由此定义的保护领域。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献