一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于确定MS扫描数据中的干扰、过滤离子并对样品进行质谱分析的方法和装置与流程

2021-12-03 23:38:00 来源:中国专利 TAG:

用于确定ms扫描数据中的干扰、过滤离子并对样品进行质谱分析的方法和装置
技术领域
1.本公开涉及质谱分析领域。更确切地说,本公开涉及用于确定前体离子分析期间的同位素簇的干扰水平的方法和系统。


背景技术:

2.可通过制备样品并且通过其质量峰观察质谱(ms)中的样品分子(前体)来鉴别样品的分子。每个前体分子物质可能会在质谱中产生多个峰,因为所述分子有同位素存在于样品。所有与相同前体分子有关的峰的簇可称为同位素簇或同位素分布。为了鉴别前体,可将在同位素簇的质量峰周围的质量窗口w中的离子分离、碎片化,并且然后可基于碎片频谱分析碎片的质谱(ms2)以鉴别分子。
3.在目标前体分子的离子的同位素簇周围的质量窗口中,也可观察到属于不同前体分子的同位素簇的质量峰。不同分子的同位素簇的此干扰影响使通过在ms2质谱中观察到的分子碎片来鉴别分子复杂化。
4.鉴于以上问题,优选的是分析具有不受来自另一同位素簇的干扰影响或基本上不受来自另一同位素簇的干扰影响的同位素簇的前体分子。描述干扰影响的另一术语是质谱质量范围的“纯度”或也称为“非干扰分数”。
5.us 9583323提出采用不同质量窗口大小w的ms2质谱,并且当针对不同质量窗口观察到相同峰时,将质量扫描鉴别为无干扰。
6.关于us 9583323中所建议的方法,使用在不同提取离子色谱图(xic)宽度处使用的各种隔离窗口的比较。在各种实施例中,串联质谱仪在质量范围的多个质量选择窗口宽度上进行单个前体扫描和多个碎片扫描,这允许在串联质谱仪单次运行之后进行采集后处理。串联质谱仪使用一个或多个前体离子的单次质谱扫描,以及使用整个质量范围内的两个或更多个隔离窗口宽度的产物离子的两次或更多次质谱扫描来分析第一样品。两个或更多个隔离窗口宽度可以是均一的或可变的。在另一步骤中,如果一个或多个峰参数的第一集合与一个或多个峰参数的第二集合基本上相同,那么将产物离子鉴别为不包括干扰。
7.us 8455818提出鉴别由所研究的前体峰的强度比和干扰峰的强度界定的干扰的量。当干扰量的值较小或前体纯度高于前体离子的阈值时,将检测前体离子的ms2质谱。否则,将会对前体离子进行纯化过程。
8.us 8455818描述了其中评估来自非相关峰的干扰的预定义窗口。这一文件还描述了一种使用质谱分析来分析被分析物的方法,所述方法包含:提供被分析物;从被分析物产生前体离子的分布;分析至少一部分前体离子分布的质荷比,从而生成与前体离子分布相对应的前体离子质谱分析数据;在前体离子质谱分析数据中鉴别对应于前体离子的前体峰;确定在前体峰附近的m/z单位的预选范围内的干扰量,其中所述预选范围在前体峰的0.01到10m/z单位内;并且当干扰量小于选定值时,打碎对应于前体峰附近的m/z单位的预选范围的离子,从而生成碎片离子;并且当干扰量大于或等于选定值时,不打碎对应于前体
峰附近的m/z单位的预选范围的离子。
9.另一方法描述于wo 2016198984中。这一文件鉴别在ms全谱扫描步骤中产生的前体离子频谱中的前体离子峰,确定前体离子频谱中的前体离子峰是否包括卷积特征,且如果前体离子峰包括卷积特征,那么指示质谱仪防止前体离子峰在多个循环中的一个或多个后续循环的过滤步骤中被排除。
10.在文件gb 2471155中检查预定义窗口处的纯度,其中论述分析来自质谱仪的数据的方法以用于数据相关的采集。所述方法包含:获得样品的质谱,其中所述质谱包括所关注的同位素簇;对于每个所关注的同位素簇,使用沿着质谱的m/z轴的预定义宽度的隔离窗口,并使用配置成用于数据相关采集的计算机来分离质谱的一部分;对于每个所关注的同位素簇,使用配置成用于数据相关采集的计算机来计算位于隔离窗口内的所关注的相应同位素簇的纯度值;分别基于每个所述纯度值计算每个所关注的同位素簇的选择分数;并且选择具有最高选择分数的所关注的同位素簇中的一个或多个以进行进一步分析。
11.在此背景下,本发明旨在提供用于确定每个同位素簇的纯度水平和/或所述簇中的单个峰的纯度水平的改进的方法。本发明还提供基于每个同位素簇的纯度水平和/或所述簇中的单个峰的纯度水平来改善从质谱分析导出的信息质量的方法。


技术实现要素:

12.提供一种确定对应于ms扫描数据中的前体分子的同位素分布的特定峰的一个或多个干扰参数的方法。ms扫描数据包含多个峰,每个峰具有质荷比和相对丰度。同位素分布包含多个峰的子集。一个或多个干扰参数包含特定峰的峰纯度p
i

13.所述方法可包含从ms扫描数据中鉴别不属于同位素分布的峰子集的一个或多个干扰峰,并且基于特定峰的相对丰度i
i
和一个或多个干扰峰的相对丰度来确定特定峰的峰纯度p
i

14.或者,所述方法可包含确定不存在与同位素分布有关的干扰峰。在此情况下,特定峰的峰纯度可以是最大纯度值(例如峰纯度可以是1,其中可能的纯度值范围在0与1之间)。
15.有利的是,所述方法为同位素分布中的每个单个峰提供峰纯度。峰纯度可用于作出与多步光谱法过程中的后续步骤有关的决策。例如,峰纯度可用于滤出具有低纯度分数的峰。
16.如上文所论述,ms扫描数据包含多个“峰”。在本技术案中,工作“峰”是指高于背景噪声水平的离子检测的统计上显著的读数。换句话说,在对应于峰的m/z值下的离子检测器读数的信噪比(snr)高于检测阈值。例如,snr阈值可以是10:1、5:1或1:1(或10db、7db或0db)。
17.同位素分布可以是多个同位素分布之一。ms扫描数据可包含将多个峰的子集分配给同位素分布的数据。可将每个峰分配给具有置信度值(例如,0与1之间的概率)的同位素分布。
18.特定峰的峰纯度可与来自不属于同位素分布的相邻峰的干扰有关(并且提供其量度)。
19.基于一个或多个干扰峰的相对丰度来确定特定峰的峰纯度p
i
,可包含选择一个或多个干扰峰的第一干扰峰并且基于第一干扰峰的相对丰度i
interf
来确定特定峰的峰纯度
p
i

20.在一些情况下p
i
=i
i
/(i
i
i
interf
)
21.干扰峰可以是具有高于干扰阈值的相对丰度的最接近的干扰峰,使得第一干扰峰的质荷比比不属于同位素分布中的峰的子集并且具有高于干扰阈值的相对丰度的ms扫描数据中的任何其它峰更接近同位素分布的特定峰的质荷比。
22.如果超过一个干扰峰与特定峰的距离相同(即,两个干扰峰具有高于干扰阈值的相对丰度,且两者具有其质荷比与同位素分布的特定峰的质荷比之间的相同绝对差),那么然后可将具有最高相对丰度的这些干扰峰选择为最接近的干扰峰。
23.一个或多个干扰参数还可包含特定峰的干扰距离,d
interf
,其中干扰距离d
interf
基于特定峰的质荷比m
i
与第一干扰峰的质荷比m
interf
之间的差。
24.在一些情况下,d
interf
=|m
interf

m
i
|。
25.干扰距离可能与最接近的干扰峰的m/z“距离”有关,其中“距离”是沿m/z轴的距离(特定峰的质荷比m
i
与第一干扰峰的质荷比m
interf
之间的差)。在本技术案中,其它m/z差可同样被称为“距离”。
26.一个或多个干扰参数还可包含同位素分布的同位素m/z窗口w
isd
。同位素m/z窗口可界定包括具有高于包括阈值的相对丰度的同位素分布的每个峰的质荷比的范围。
27.同位素m/z窗口w
isd
可以是m/z值的范围,并且因此可由两个单独参数界定:同位素m/z窗口的开始点w
isdstart
,及同位素m/z窗口的结束点w
isdend

28.包括阈值可设置为同位素分布中的最丰富的峰的比例或ms数据中的最丰富的峰的比例。例如,所述比例可以是1%、5%、10%或20%。所述比例可以是0%,这将指示同位素分布中的所有峰应包括于同位素m/z窗口中。
[0029]“最丰富”的峰是具有最高相对丰度的峰。
[0030]
同位素m/z窗口可以同位素分布中最丰富的峰的质荷比m0为中心,所述峰具有同位素分布中的峰的最高相对丰度i0。同位素m/z窗口的半宽度w
isd/2
可界定为同位素分布的最丰富的峰的质荷比与同位素分布的最远显著峰的质荷比之间的绝对差。最远显著峰可界定为具有以下各者的同位素分布中的峰:
[0031]
a)高于包括阈值的相对丰度;和
[0032]
b)离同位素分布中最丰富的峰最远的质荷比,使得最远显著的峰和最丰富的峰的质荷比之间的绝对差大于最丰富的峰与在同位素分布中具有高于包括阈值的相对丰度的任何其它峰的质荷比之间的绝对差。
[0033]
同位素m/z窗口的下边界和上边界可分别由具有高于包括阈值的相对丰度的同位素分布的峰的另外的子集的最低和最高质荷比界定。在此情况下,同位素m/z窗口可不以最丰富的峰为中心。
[0034]
如果高于包括阈值的同位素分布中超过一个峰具有与最丰富的峰相同的绝对m/z差,那么然后可随机选择一个峰(并且所得同位素m/z窗口将包括两个峰)。
[0035]
确定不存在与同位素分布有关的干扰峰可包含确定由同位素m/z窗口界定的质荷比的范围不含有不属于同位素分布的峰的子集并且具有高于干扰阈值的相对丰度的任何峰。
[0036]
鉴别来自ms扫描数据的一个或多个干扰峰可包含鉴别具有同位素m/z窗口内(即,
由同位素m/z窗口界定的m/z值的范围内)且具有高于干扰阈值的相对丰度的质荷比的峰。
[0037]
可将干扰阈值设置为以下各者中的任一者的比例:特定峰、同位素分布中的最丰富的峰或ms数据中的最丰富的峰。例如,所述比例可以是1%、5%、10%或20%。所述比例可以是0%,这将指示无论它们可能有多小,都应考虑所有干扰峰。
[0038]
一个或多个干扰参数还可包含同位素分布的同位素纯度p
isd
。所述方法还可包含确定属于同位素分布的峰的子集的总相对丰度s
iso
和不属于同位素分布的峰的子集的总相对丰度s
interf
。所述方法还可包含确定ms扫描中具有处于由同位素m/z窗口界定的范围内的质荷比的所有峰的总相对丰度。所述方法还可包含使用峰的子集的总相对丰度s
iso
和同位素m/z窗口中的所有峰的总相对丰度来确定同位素纯度p
isd

[0039]
在一些情况下p
isd
,=s
iso
/(s
iso
s
interf
)
[0040]
同位素纯度可与来自不属于同位素分布的峰的整个同位素分布的干扰水平有关(且可以是其量度)。
[0041]
确定属于同位素分布的峰的子集的总相对丰度s
iso
可能涉及对同位素分布中的所有峰的相对丰度求和。或者,此可能涉及仅对具有高于包括阈值的相对丰度的同位素分布中的所有峰的相对丰度求和。或者,此可能涉及仅对具有处于由同位素m/z窗口界定的范围内的质荷比的同位素分布中的所有峰的相对丰度进行求和。或者,此可能涉及仅对具有高于包括阈值的相对丰度和具有处于由同位素m/z窗口界定的范围内的质荷比的同位素分布中的所有峰的相对丰度进行求和。
[0042]
确定具有处于由同位素m/z窗口界定的范围内的质荷比的ms扫描中所有峰的总相对丰度可能涉及对具有处于由同位素m/z窗口界定的范围内的质荷比的所有峰的相对丰度进行求和。或者,此可能涉及对具有处于由同位素m/z窗口界定的范围内的质荷比和具有高于干扰阈值的相对丰度的所有峰的相对丰度进行求和。
[0043]
提供一种在对应于ms扫描数据中的前体分子的同位素分布周围选择隔离窗口的方法。ms扫描数据包含多个峰,每个峰具有质荷比和相对丰度。同位素分布包含多个峰的子集。所述方法包含通过如上文所描述的方法确定第一同位素分布的每个峰的峰纯度p
i
。所述方法还包含基于峰纯度确定第一同位素分布的每个峰的纯度分数s
i
。所述方法还包含界定隔离窗口的下边界w
start
和上边界w
end
,使得仅具有高于预定阈值t的纯度分数的同位素分布的峰包括于隔离窗口中。
[0044]
换句话说,可界定隔离窗口以使得仅足够纯的峰具有在上边界与下边界之间的质荷比。设置边界以使得从隔离窗口排除具有低于阈值的纯度值的峰。
[0045]
预定阈值t可设置在纯度分数的最高与最低可能值之间的任何地方。例如,纯度分数可在0到1范围内。在此情况下,预定阈值(纯度阈值)可以是(例如)0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。纯度阈值可以是1,其将指示在隔离窗口中只应包括不受任何干扰影响的峰。纯度阈值可以是0.01或0.001,其将指示应从隔离窗口(经过滤)排除具有极高干扰水平的峰。
[0046]
每种同位素分布可包含多个峰的子集。可将每个峰分配给具有限定概率的特定同位素分布。可将一些峰分配给超过一种的同位素分布,每种同位素分布具有对应的概率。一些峰可能未分配给同位素分布。
[0047]
纯度分数s
i
还可基于以下各者中的一者或多者:同位素分布的同位素m/z窗口
w
isd
;特定峰的第一同位素分布的同位素纯度p
isd
;和/或干扰距离d
interf

[0048]
在一些情况下s
i
=min(p
isd
,p
i
)
1/k
[0049]
k=2
n
如果0.7n≤d<0.7(n 1),n=0、1、2、

[0050]
d=min(d
interf
,w
isd/2
)
[0051]
或k=2
n
其中n=floor(d/0.7)
[0052]“floor(d/0.7)”意指d的整数部分除以0.7(舍弃任何余数),并且例如,也可写为int(d/0.7)或向下舍入(d/0.7)。
[0053]
隔离窗口可以具有最高相对丰度的多个峰的对应子集的峰为中心。设置隔离窗口的下边界和隔离窗口的上边界可包含界定隔离窗口的宽度,使得仅具有小于预定阈值t的纯度分数的同位素分布的峰包括于隔离窗口中。
[0054]
或者,隔离窗口的下边界和上边界可通过相对于最接近高于和低于最丰富的峰并且具有低于包括阈值的纯度分数的同位素分布的峰的质荷比来界定,从而将这些上下最接近的峰从隔离窗口中排除,但是这些峰之间的所有峰被包括在隔离窗口中。
[0055]
提供一种确定对应于ms扫描中的前体分子的同位素分布的一个或多个干扰参数的方法。ms扫描包含多个峰,每个峰具有质荷比和相对丰度。同位素分布可包含多个峰的子集。一个或多个干扰参数包含同位素m/z窗口和同位素纯度。所述方法包含确定同位素分布的同位素m/z窗口w
isd
,其中同位素分布的同位素m/z窗口界定包括具有高于包括阈值的相对丰度的同位素分布的每个峰的质荷比的范围。同位素m/z窗口以同位素分布中最丰富的峰的质荷比m0为中心,所述峰具有同位素分布中的峰的最高相对丰度i0。同位素m/z窗口的半宽度w
isd/2
定义为同位素分布的最丰富的峰的质荷比与同位素分布的最远显著的峰的质荷比之间的绝对差。最远显著的峰具有:
[0056]
a)高于包括阈值的相对丰度;和
[0057]
b)离同位素分布中最丰富的峰最远的质荷比,使得最远显著的峰和最丰富的峰的质荷比之间的绝对差大于最丰富的峰与在同位素分布中具有高于包括阈值的相对丰度的任何其它峰的质荷比之间的绝对差。所述方法还包含确定属于同位素分布的峰的子集的总相对丰度s
iso
。所述方法还包含确定ms扫描中具有处于由同位素m/z窗口界定的范围内的质荷比的所有峰的总相对丰度。所述方法还包含使用峰的子集的总相对丰度s
iso
,和同位素m/z窗口中的所有峰的总相对丰度来确定与同位素分布的同位素m/z窗口内的干扰水平有关的同位素纯度p
isd

[0058]
有利的是,所述方法提供用于ms扫描数据中的每种同位素分布的同位素纯度。同位素纯度可用于作出与多步光谱法过程中的后续步骤有关的决策。例如,同位素纯度可用于决定使同位素分布经受进一步分析的顺序或提供同位素分布的选择标准。
[0059]
可基于同位素分布的一个或多个干扰参数来计算同位素分布纯度分数(或“簇重叠分数”)。
[0060]
确定ms扫描中具有处于由同位素m/z窗口界定的范围内的质荷比的所有峰的总相对丰度可包含:
[0061]
确定ms扫描中具有处于由不属于同位素分布中峰的子集的同位素m/z窗口界定的范围内的质荷比并且具有高于干扰阈值的相对丰度的所有峰的总相对丰度s
interf
;和
[0062]
计算ms扫描中具有处于由同位素m/z窗口界定的范围内的质荷比的所有峰的总相
对丰度为以下各者的总和:
[0063]
ms扫描中具有处于由不属于同位素分布中峰的子集的同位素m/z窗口界定的范围内的质荷比并且具有高于干扰阈值的相对丰度的所有峰的总相对丰度s
interf
;和
[0064]
属于同位素分布的峰的子集的总相对丰度s
iso

[0065]
还提供选择用于进一步分析ms扫描数据中的一种或多种同位素分布的方法。每种同位素分布对应于相应的前体分子。ms扫描数据包含多个峰,每个峰具有质荷比和相对丰度。每种同位素分布包含多个峰的子集。所述方法包含,对于ms扫描中的一种或多种同位素分布中的每一种,使用上文所描述的方法确定与同位素分布的同位素m/z窗口w
isd
内的干扰水平有关的同位素纯度p
isd
,并且基于同位素m/z窗口w
isd
和/或同位素纯度p
isd
确定同位素分布纯度分数,和
[0066]
选择具有高于预定阈值的相应同位素分布纯度分数的一种或多种同位素分布用于进一步分析。
[0067]
预定阈值可设置在同位素分布纯度分数的最高与最低可能值之间的任何地方。例如,同位素分布纯度分数可在0到1范围内。在此情况下,预定阈值(或“同位素分布纯度阈值”)可以是(例如)0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。预定阈值可以是1,其将指示仅应选择不受任何干扰的同位素分布以用于进一步分析。预定阈值可以是0.01或0.001,其将指示具有极高干扰水平的同位素分布应从进一步的分析中排除(经过滤)。
[0068]
同位素分布纯度分数可基于同位素分布的一或多个干扰参数。同位素分布分数可与同位素纯度相同。
[0069]
还提供界定应分析ms扫描数据中的一种或多种同位素分布的顺序的方法。ms扫描数据中的每种同位素分布对应于相应前体分子。ms扫描数据包含多个峰,每个峰具有质荷比和相对丰度。每种同位素分布包含多个峰的子集。所述方法包含,对于ms扫描中的一种或多种同位素分布中的每一种,使用根据权利要求10或权利要求11所述的方法确定与同位素分布的同位素m/z窗口w
isd
内的干扰水平有关的同位素纯度p
isd
,并且基于同位素m/z窗口w
isd
和/或同位素纯度p
isd
确定同位素分布纯度分数。所述方法还包含基于同位素分布纯度分数对一种或多种同位素分布进行分级,使得其中应分析ms扫描数据中的一种或多种同位素分布的顺序由分级界定。
[0070]
还提供一种对样品进行质谱分析的方法。所述方法包含对样品进行ms扫描并获得ms扫描数据,其中所述ms扫描数据包含多个峰,每个峰具有质荷比和相对丰度。所述方法还包含鉴别ms扫描数据中的一种或多种同位素分布,每种同位素分布对应于样品内含有的前体分子,每种同位素分布包含多个峰的子集。所述方法还包含:从在ms扫描数据中鉴别的一种或多种同位素分布中选择一种或多种同位素分布用于进一步分析;和/或对来自在ms扫描数据中鉴别的一种或多种同位素分布中的一种或多种同位素分布进行分级以用于以根据分级的顺序进行进一步分析。所述方法还包含确定所选择的一种或多种同位素分布的第一同位素分布周围的隔离窗口,其中所述隔离窗口界定质荷比的范围。所述方法还包含收集具有由隔离窗口界定的范围内的质荷比的离子。所述方法还包含对所收集的离子进行ms2扫描并且获得ms2扫描数据。
[0071]
可使用如上文所描述的方法从在ms扫描数据中鉴别的一种或多种同位素分布中选择一种或多种同位素分布用于进一步分析。
[0072]
可使用如上文所描述的方法对来自在ms扫描数据中鉴别的一种或多种同位素分布中的一种或多种同位素分布进行分级以用于以根据分级的顺序进行进一步分析。
[0073]
可使用如上文所描述的方法来确定所选择的一种或多种同位素分布的第一同位素分布周围的隔离窗口,其中所述隔离窗口界定质荷比的范围。
[0074]
所述方法还可包含基于ms2扫描数据鉴别对应于第一同位素分布的前体分子。
[0075]
所述方法还可包含确定所选择的一种或多种同位素分布的一种或多种其它同位素分布周围的隔离窗口。所述方法还可包含:对于其它同位素分布中的每一者,收集具有在由隔离窗口界定的范围内的质荷比的离子,并且对所收集的离子样品中的每一者进行ms2扫描,并且获得ms2扫描数据(连同按由一种或多种所选择的同位素分布的分级界定的顺序的第一同位素分布)。所述方法还可包含基于ms2扫描数据鉴别对应于其它同位素分布中的每一者的前体分子。
[0076]
从在ms扫描中鉴别的一种或多种同位素分布中选择一种或多种同位素分布用于进一步分析可包含:对于在ms扫描中鉴别的一种或多种同位素分布中的每一者,确定与同位素分布的同位素m/z窗口w
isd
内的干扰水平有关的同位素纯度p
isd
,并且基于同位素m/z窗口w
isd
和/或同位素纯度p
isd
确定同位素分布纯度分数;以及选择具有高于预定阈值的同位素分布纯度分数的同位素分布。
[0077]
所述方法还可包含基于同位素分布纯度分数对选择用于进一步分析的一种或多种同位素分布进行分级。所述方法还可包含对所收集的离子进行ms2扫描,并且以由分级界定的顺序获得ms2扫描数据。
[0078]
方法可以多种方式组合。例如,可从ms扫描数据中选择同位素分布用于进一步分析和/或基于同位素分布的纯度进行分级,并且可选择用于使用ms2分析那些同位素分布中的每一者的隔离窗口。可使用如上文所描述计算的干扰参数(p
i
、d
interf
、p
isd
和w
isd
)来实现这些过滤和分级操作。
[0079]
还提供一种经配置以进行上文所描述的方法中的任一种的装置。
[0080]
还提供一种包含指令的计算机程序,所述指令当在质谱分析系统的处理器上执行时,使质谱分析系统执行上文所描述的方法中的任一种。
附图说明
[0081]
从下面仅以举例方式并且参照未按比例绘制的附图所给出的说明中,本发明的以上指出的和各种其它方面将变得更清楚,在附图中:
[0082]
图1显示其中已鉴别两个同位素簇的质谱的简化实例。
[0083]
图2a和2b说明可如何界定同位素m/z窗口。
[0084]
图3说明确定同位素分布的特定峰的候选纯度。
[0085]
图4a和4b说明电荷值z=2和z=3的离子的相邻峰之间的距离(其质量相差大约1amu)。
具体实施方式
[0086]
呈现以下描述以使所属领域的技术人员能够制作并使用本发明,并且在特定应用和其要求的情况下提供以下描述。因此,所公开的材料、方法和实例仅是说明性的且并不意
欲是限制性的。对所描述的实施例的各种修改对于所属领域技术人员而言将是显而易见的,并且本文的一般原理可应用于其它实施例。因此,本发明不意欲限于所示出的实施例和实例,而应符合根据所示出和描述的特征和原理的最广的可能范围。参照图式结合以下描述,本发明的具体特征和优点将变得更加清楚。
[0087]
除非另外定义,否则本文所使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的含义。在有矛盾的情况下,将以本说明书(包括定义)为准。
[0088]
在本文中,术语“前体离子”、“前体离子物质”、“第一代离子”和“第一代离子物质”是指在碎片单元中不存在任何受控碎片的情况下由质量分析仪从电离源接收的离子。当术语“扫描”用作名词时,应在一般意义上理解为意指“质谱”,而与产生扫描的装置实际上是否是扫描仪无关。类似地,当术语“扫描”用作动词时,应在一般意义上理解为指代获取质谱数据的动作或过程。
[0089]
如本文所使用,“一个/种(a或an)”还可指代“至少一个/种”或“一个/种或多个/种”。并且,“或”的使用是包括性的,使得当“a”为真、“b”为真或“a”和“b”两者都为真时,短语“a或b”为真。此外,除非以其它方式隐含或明确地理解或陈述,否则以单数形式出现的单词涵盖其复数形式,而以复数形式出现的单词涵盖其单数形式。此外,应理解,除非另外隐含地或明确地理解或陈述,否则对于本文中描述的任何给定组分或实施例,针对所述组分列出的任何可能的候选或替代方案通常可单独地使用或彼此结合使用。此外,应了解,如本文所示的图式未必按比例绘制,其中可能仅为本公开的清楚起见而绘制一些元件。此外,附图标记可在各图中重复以示出相对应的或相似的元件。另外,将理解,除非另外隐含地或明确地理解或陈述,否则此类候选或替代方案的任何列表仅是说明性的,而不是限制性的。此外,“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”和“包括(include/includes/including)”的使用并不意欲是限制性的。
[0090]
此外,除非另外指明,否则本说明书和权利要求书中所使用的表示成分、组分、反应条件等的数量应理解为由术语“约”修饰,使得略微和非实质偏差在本教示内容的范围内。因此,除非相反地指示,否则本说明书和随附权利要求书中所阐述的数值参数是可取决于试图通过本文提出的标的物获得的所需特性而变化的近似值。最低限度地,并且不试图限制等效物原则应用于权利要求书的范围,至少应根据所报告的有效数字的数目并且通过应用一般四舍五入技术来解释每个数值参数。尽管阐述本文呈现的主题的广泛范围的数值范围和参数是近似值,但尽可能精确地报告特定示例中阐述的数值。然而,任何数值固有地含有某些由其对应的测试测量值中所发现的标准差必然造成的误差。
[0091]
提供一种通过其质量峰鉴别质谱(ms)中所观察到的样品(前体)的分子的新方法。对质量峰周围的质量窗口中的离子进行分离、碎片化,并且然后检测碎片的质谱(ms2)以基于碎片频谱鉴别分子。此可在一些实例中通过比较碎片频谱与库中的标准频谱来实现。
[0092]
可从色谱柱洗脱样品,并且因此可能必须在某些时间间隔内从洗脱的样品检测质谱。因此,检测所观察的分子的碎片的质谱(ms2)的时间可能受到限制。结果,界定合理顺序的分级可能是有益的,其中通过ms2质谱鉴别所观察到的前体。
[0093]
样品的每个分子具有同位素分布(也称为“同位素分布(isotope distribution)”)。同位素分布由具有不同m/z值的分子的同位素体产生。每个同位素体在质谱中产生峰。可通过收集包括同位素分布的同位素体的质量窗中的离子来分析对应于分
子的同位素体的离子。经收集用于进一步分析的离子的质量窗口称为“隔离窗口”。隔离窗口可独立于同位素分布的宽度。或者,可基于同位素分布(例如,与同位素分布具有相同的宽度)选择隔离窗口。在一些实例中,隔离窗口的宽度可由用户指定(例如,在用于ms2扫描的用户界面中)。
[0094]
当样品经历ms光谱法时,样品中存在的每个前体分子产生同位素分布。为了鉴别相应的前体分子,可以分析扫描中的同位素分布。然而,一个问题是在分子的离子的同位素分布的质量范围中,还可观察到另一分子的同位素分布的质量峰。不同分子的同位素分布的此干扰影响基本上使通过在ms2质谱中观察到的其分子碎片的鉴别复杂化。因此,优选分析不受干扰影响或基本上不受干扰影响的质量峰。描述干扰影响的另一术语是质谱的质量范围的“纯度”。因此,所检测到的ms2质谱的顺序应与所分析的质量范围的纯度或所分析的质量峰的环境有关。为此,已提出一种纯度过滤器,其提供纯度或者也称为非干扰分数。本技术案中所论述的实例方法提供改进的纯度过滤器。
[0095]
这些技术还可以在分析ms2扫描数据时使用。例如,每个碎片可具有同位素分布并且这些可重叠。如果需要进一步碎片化(例如,在ms
n
光谱法中),那么所描述的技术可用于基于碎片的同位素分布的纯度来鉴别应进一步分析哪些碎片和以何种顺序进行所述分析。碎片周围的隔离窗口也可基于碎片的同位素分布中的峰的纯度来确定。
[0096]
实施纯度过滤器的改进方法的一个实例针对一种或多种同位素分布鉴别表征所述同位素分布与另一种同位素分布的干扰的一个或多个(优选两个)参数,并且针对所述同位素分布中的每个同位素峰,鉴别表征来自最接近的干扰峰的干扰的一个或多个(优选两个)参数。
[0097]
可通过界定算法或高级峰检测算法的同位素和电荷状态从质谱中鉴别同位素分布(也称为同位素簇)。此过程在欧洲专利申请第17174330.5号(ep3293755b1)中更详细地描述,其以引用的方式并入本文中。用于鉴别来自ms数据的同位素分布的其它方法是可能的。
[0098]
图1显示其中已鉴别两个同位素簇的质谱的简化实例。可以看出,两个簇的m/z比范围重叠。
[0099]
经确定以界定干扰水平的参数可用于过滤和排序。例如,同位素分布的纯度作为整体可用于确定其中应分析同位素分布的顺序。此外,同位素分布中的单个同位素峰的纯度(每一者鉴别来自同位素峰附近的一个或多个干扰峰的干扰水平)可用于在ms2分析之前滤出同位素分布的某些峰(例如,通过调整隔离窗口以排除具有较差干扰分数的峰)。可将界定干扰的一个或多个参数组合成每个同位素峰和/或每个同位素分布的单一分数。
[0100]
在已经从样品的质谱提取同位素分布之后,可确定每个同位素分布的m/z窗口w
isd
和纯度值p
isd
。对于同位素分布的每个同位素峰,可鉴别最接近的干扰峰。最接近的干扰峰可以是不属于同位素分布的最接近的峰(例如,属于不同同位素分布的峰)。确切地说,此最接近的干扰峰的m/z距离d
interf
被确定为表征每个同位素峰的干扰的一个参数。表征每个同位素峰的干扰的另一参数可以是同位素峰纯度p
i
。与干扰峰的相对丰度相比,同位素峰纯度可与同位素峰的相对丰度有关。
[0101]
根据所确定的纯度参数中的一个或多个,可计算每个同位素峰和/或每个同位素分布的纯度分数(或干扰分数)。干扰分数可以用作分类标准以界定其中通过ms2质谱鉴别
所观察到的前体的顺序,或用作选择标准,应通过ms2质谱研究哪些前体。然后,分数是界定哪些前体可以被鉴别的纯度过滤器的选择标准。
[0102]
不同的所确定的参数的加权可组合在单一分数中。进行此操作的一种方式是将每个参数乘以加权因子并且将参数相加。
[0103]
典型的10汤姆逊(thomson)(10u)的最大值可假定为同位素分布的m/z宽度。1汤姆逊可定义为1u/e,其中u是统一原子质量单位并且e是元电荷。
[0104]
下文描述为用于质谱仪而开发的基于apd的纯度过滤器的具体实施方案。此方法可在计算机系统上实施并且指令可储存于计算机软件中。
[0105]
一般来说,纯度过滤器提供基于前体附近的干扰量选择和优先化前体的手段。在此背景下,“干扰”是指质谱中不属于与所关注的前体相同的同位素分布(并且因此不属于化学物质)的任何信号。
[0106]
在本发明中,为了避免使用预定义的m/z窗口,发现通过电荷状态检测算法(如ep3293755b1的高级峰测定(apd)算法)单独计算每个同位素分布和其相关峰的纯度值。此外,纯度值可用作分类标准以按纯度顺序处理候选峰列表。例如,以“最纯的”候选物开始并以纯度递减的顺序继续可能是有益的。当ms
n
频谱的量必须在给定时间量内最大化时而不损害所提供的信息时,这是特别重要的。可从色谱柱洗脱用于分析的样品。可以以固定的样品时间间隔从柱收集样品。样品分析的时间因此可限于样品之间的时间(在下一个样品洗脱之前)。在样品之间的固定时间间隔期间,对样品进行的分析水平受到限制。因此,可以使用纯度值来指导分析,从而可在固定间隔期间获得更有用的信息。
[0107]
此外,洗脱样品中的前体分子的丰度将随时间变化。因此,当分析第一洗脱样品时,前体可能经受来自干扰分子的显著水平的干扰。然而,当在时间间隔之后分析第二洗脱样品时,可观察到较高丰度的前体分子并且可观察到较低丰度的干扰分子(或可能已通过所述时间间隔完全洗脱),导致前体分子的纯度分数提高。因此,当前体具有较高的纯度分数时,可在第二时间段鉴别前体,而不是在第一时间段鉴别前体。
[0108]
纯度值的计算
[0109]
针对由电荷状态检测算法发现的每种同位素分布可进行以下步骤。apd算法尤其适合于此方法,因为其能够从给定质谱提取同位素分布列表。
[0110]
整个同位素分布的纯度
[0111]
同位素分布的同位素包络被定义为开始于具有最低m/z值的同位素分布中的峰并且结束于具有最高m/z值(包括端点)的同位素分布中的峰的m/z值的范围。因此,考虑可能来源于相同化学物质的所有峰,同位素包络的宽度由isd的最低m/z和最高m/z同位素峰之间的m/z距离给出。同位素包络包括同位素分布的所有峰。
[0112]
使用基于同位素包络的单个m/z窗口计算同位素分布(isd)的纯度。此窗口在本技术案中称为同位素分布的“m/z窗口”、“质量/电荷(m/z)窗口”或“同位素m/z窗口”,并且由w
isd
表示。m/z窗口w
isd
可通过将窗口居中在isd的最丰富的峰上并且调整窗口的宽度直到属于isd的所有峰包括于窗口中(使得窗口在isd的最丰富的峰周围保持对称)来获得。这在图2a中示出。更确切地说,首先计算半宽度w
isd/2

[0113]
w
isd
/2=max(m0–
m
low
,m
high

m0),
[0114]
其中m
x
是同位素峰的m/z值(m0:isd的最丰富的峰,m
low
:最低m/z峰,m
high
:最高m/z
峰)。然后通过以下公式给出窗口边界w
isdstart
、w
isdend

[0115]
w
isdstart
=m0–
w
isd/2

[0116]
w
isdend
=m0 w
isd/2

[0117]
使得w
isdend

w
isdstart
=2w
isd/2
=w
isd
。以此方式,窗口恰好足够大以满足两个条件(居中在isd中最丰富的峰并且包括isd中的所有峰)并且不再更宽。
[0118]
在上文所描述的方法中,m/z窗口w
isd
以最强峰为中心。因此,其至少与同位素包络一样宽。此方法是有利的,因为isd的最强峰优先针对ms2触发。然而,可以以其它方式界定m/z窗口w
isd
。例如,m/z窗口w
isd
可以以isd的平均m/z值为中心。或者,m/z窗口w
isd
可与同位素包络相同,即,由isd的最低m/z和最高m/z峰界定。
[0119]
术语“w
isd”可指由m/z窗口的起点和终点(w
isdend
和w
isdstart
)界定的窗口。w
isd
还可用于指开始与结束点之间的m/z距离(即,w
isd
=w
isdend

w
isdstart
)。
[0120]
确定m/z窗口w
isd
的方法假定ms数据中的每个峰与对应isd之间的关系是定义明确的。实际上,一些峰可仅以特定确定性分配给特定isd。在一些实施例中,当确定单个m/z窗口w
isd
时,可忽略分配给具有低于特定阈值的确定性的特定isd的峰。
[0121]
以类似方式,当确定单个m/z窗口w
isd
时,可忽略具有低于某一阈值的强度(相对丰度)的峰。这在图2b中示出。
[0122]
在m/z范围w
isdstart
≤m/z≤w
isdend
中检测到的所有峰根据它们与所关注的isd的关联进行检查。如果确定一个峰很可能属于同一isd,那么将其强度i添加到同位素强度累加器s
iso
中。否则,将其强度添加到干扰强度累加器s
interf
。如果峰属于多个isd,包括所关注的isd,那么其强度可以与累加器成比例分布。这些比例可以例如基于相关联的isd的强度比来计算。一种替代的更简单的方法由以下组成:如果峰与多个isd相关联,那么将50%的固定比例添加到任一累加器中。
[0123]
在处理整个m/z窗口之后,将纯度值p
isd
计算为
[0124]
p
isd
=s
iso
/(s
iso
s
interf
),
[0125]
其中0<p
isd
≤1。
[0126]
同位素峰的纯度
[0127]
在计算整个isd的纯度值之后,将具有m/z值m
i
和强度i
i
的isd的每个同位素峰相对于在isd的m/z窗口内的最接近的干扰峰单独分析:
[0128]
1.储存i
i
中的同位素峰的强度(相对丰度)。
[0129]
2.找到isd的m/z窗口w
isd
内的最接近的干扰峰(m/z值m
interf
),并且将其强度储存在i
interf
中,并且将其m/z距离储存在d
interf
=|m
interf

m
i
|中。
[0130]
3.将同位素峰纯度计算为p
i
=i
i
/(i
i
i
interf
)。
[0131]
应注意,如果p
isd
是1(即,窗口内不存在干扰峰),所有同位素峰的p
i
必须也是1。在此情况下,可以将d
interf
设置为同位素峰与窗口的最接近的边界之间的m/z距离(w
isdstart
或w
isdend
)。
[0132]
如果p
isd
==1:d
interf
=min(m
i

w
isdstart
,w
isdend

m
i
)
[0133]
否则:d
interf
=|m
interf

m
i
|
[0134]
出于性能原因,如果isd的纯度是100%(无干扰),那么跳过计算单个纯度的步骤可能是有益的。如果isd的纯度高于指定阈值,那么跳过计算单个纯度的步骤,并且然后将
isd的纯度分配给各个峰,这也可在不过度影响结果的情况下改进性能。
[0135]
每个同位素峰在软件中用值对(p
i
,d
interf
)和(p
isd
,w
isd
)在内部注释,其由纯度过滤器使用以相对于纯度窗口(其可以是用户定义的)评估纯度。并且,值对可被组合以获得单个数字作为分数,其然后可以被用作数据相关实验中的前体候选者列表的分类标准。
[0136]
例如,为了将一对纯度值和m/z宽度或距离(p,m)转换为单个32位整数/分数,p首先乘以106,四舍五入到最接近的整数,并且再次乘以1000,使得1000≤p≤109,m乘以100并四舍五入到最接近的整数,使得0≤m≤999。然后将两个转换值相加以获得整数分数。当用作分类标准时,此数字格式比m/z宽度或距离更注重纯度。然而,取决于用户的优先级和记分机制的目标应用,可能有益的是互换值,使得m/z值被置于高阶数字处并且纯度值被置于低阶数字处。
[0137]
基于纯度的过滤峰(第一种方法)
[0138]
提供两种基于纯度分数进行过滤的不同方法。第一实施例假定经界定的质量窗口宽度w。
[0139]
纯度过滤器取决于两个参数:以m/z为单位的纯度窗口(w)和在0

1(或0

100%)范围内的纯度阈值(t)。过滤器旨在过滤(不包括)具有低于阈值t的纯度值的候选峰,即,仅具有等于或高于t的纯度值的峰可通过过滤器。纯度窗口界定纯度测定的边界并且在候选峰周围对称,因此产生边界。
[0140]
w
start
=m
c

w/2,
[0141]
w
end
=m
c
w/2,
[0142]
其中m
c
是候选者的m/z值。
[0143]
可预定义候选峰中的每一者的纯度窗口w的宽度。此参数可由用户在用户界面中定义。纯度窗口的宽度可以是纯度过滤器的特性中的一个。纯度窗口的宽度在一些情况下可设置成等于隔离窗口的宽度。
[0144]
候选纯度p
c
可从由p
isd
和d
interf
给出的isd的纯度参数进行内插。用于计算候选纯度的窗口通常以候选峰为中心(尽管通过指定m/z偏移可以引入不对称,类似于隔离偏移)。
[0145]
此方法定义了具有m/z值m
c
的候选峰的纯度值p
c
。如果已经用如上文所描述的纯度值对预先注释了候选峰,那么可以如下做出是否过滤(排除)还是通过(包括)峰的决定:
[0146]
1.如果整个同位素分布p
isd
的纯度是1,或如果纯度窗口w不包括与候选峰最接近的干扰峰(即,w/2<d
interf
),那么设置候选纯度p
c
=1。换句话说,如果在宽度w的预期质量窗口中没有观察到干扰峰,那么纯度值p
c
具有其最大值1。
[0147]
2.否则,如果纯度窗口w等于或大于m/z窗口w
isd
的宽度(即,w≥w
isd
),那么设置p
c
=p
isd
。即,如果候选者的同位素分布的整个m/z窗口w
isd
在宽度w的纯度窗口内,那么同位素分布p
isd
的纯度值是最相关的。同样地,同样,当下一干扰峰d
interf
的距离与w
isd/2
的值相同时,设置p
c
=p
isd

[0148]
3.如果纯度窗口w小于全部同位素分布{2}(即,w<w
isd
)的质量/电荷窗口w
isd
,并且下一干扰峰在纯度窗口(即,d
interf
<w/2)内,那么候选峰的单个同位素峰纯度p
i
具有更大相关性并且被考虑在内。用于计算候选者的纯度值p
c
的公式考虑了所有四个确定的参数。候选纯度p
c
可经由线性插值计算:
[0149]
a.计算斜率a=(p
isd

p
i
)/(w
isd/2

d
interf
)并且偏移量b=p
i

a
·
d
interf

[0150]
应注意,如果w
isd/2
=d
interf
,那么斜率未定义。此情况在步骤2中发现。
[0151]
b.通过计算p
c
=a
·
w/2 b来插值p
c

[0152]
c.如果p
c
<t,那么排除(过滤器)峰;另外包括。
[0153]
如果没有用纯度值(其对于具有低信噪比的峰是最期望的)来注释峰,那么应当默认地将其滤出。
[0154]
以上第三情况的说明:
[0155]
p
c
=a
·
w/2 b

b=p
i

a
·
d
interf
[0156]
p
c
=a(w/2

d
inter
f) p
i

a=(p
isd

p
i
)/(w
isd/2

d
interf
)
[0157]
p
c
=(p
isd

p
i
)
×
(w/2

d
inter
f)/(w
isd/2

d
inter
f) p
i
[0158]
条件:
[0159]
w<w
isd
[0160]
d
inter
f<w/2
[0161]
图3图示了此计算。内插中的(w/2

d
interf
)和(w
isd/2

d
interf
)的值在图中示出。还可以看到这些值与质量窗口和到最接近的干扰峰的距离之间的关系。
[0162]
在第一实施例中,使用预定义纯度窗口(即,用户定义的纯度窗口)来过滤峰。过滤基于通过或失败测试。换句话说,如果候选峰的纯度值高于用户定义的阈值并且另外排除,那么包括候选峰。这可以帮助避免在所得到的ms2频谱中产生过强的干扰。此纯度过滤器可以是由用于各种峰特征(如强度、m/z、电荷状态等)的多个过滤器组成的全面过滤器库的一部分。所有这些过滤器可进行通过或失败(包括/排除)测试以根据用户的需求选择用于ms2的候选者(例如,仅具有电荷状态>1、强度>1e4和/或纯度>0.8的候选者可包括在ms2分析中)。在许多情况下,用户可将纯度窗口设置为等于ms2实验的隔离窗口。然而,这并非必选的。
[0163]
在没有事先知悉隔离/纯度窗口的情况下基于纯度过滤峰(第二种方法)
[0164]
下文提供了确定这些干扰参数(分数)的第二种方法,其不需要事先知悉隔离窗口w。换句话说,用户不需要设置预定义纯度窗口。从此第二种方法导出的信息可以有利地用于选择用于碎片的隔离窗口。
[0165]
以与上文所描述的第一种方法类似的方式计算整个同位素分布p
isd
和各个同位素峰p
i
的纯度值。
[0166]
在第二实施例中,提供了一种独立于特定质量窗口宽度w的方法,针对所述特定质量窗口宽度w检测ms2质谱(隔离窗口)。此方法基于以下事实:在1.4m/z单位(汤姆逊)的质量窗口中,对于z=2的电荷状态,可以观察到具有增加的质量的同位素分布的一个相邻峰,并且可以观察到具有减少的质量的同位素分布的一个相邻峰。这在图4a中示出。此外,对于z=3的电荷状态,可以观察到质量增加的同位素分布的两个相邻峰和质量减少的同位素分布的两个相邻峰。这在图4b中示出(未按比例)。
[0167]
应当注意,在蛋白质组学领域中,通常对z=1的前体的兴趣较低(因为它们通常起源于非分析物背景离子),并且因此可通过电荷状态过滤器过滤。对于其中z=1的前体更令人感兴趣的其它应用(如小分子),可以调节1.4

m/z窗口以还包括相邻的同位素峰。本技术案中所描述的基于纯度的前体选择技术可能对蛋白质组学应用(发现实验)特别有益,因为样品复杂性更高并且样品中的肽大部分未知(此与非蛋白质组学应用相反,非蛋白质组学
应用通常具有更低的样品复杂性和面向目标的工作流程)。
[0168]
其中图4a和图4b是指“(m
c
1)/2”、“(m
c
2)/3”、“(m
c

1)”、“(m
c

2)”等的m/z值,“ 1”或
“‑
1”是指质量差大约为1个原子质量单位(amu)。“/2”或“/3”是指2e或3e的离子电荷,其中e是元电荷。这是简化的图示。技术人员将理解,质谱的峰之间的精确间隔在同位素体物质之间可能不相同。
[0169]
此外,技术人员还将了解,不同同位素体可产生具有几乎相同的m/z值但不完全相同的峰。例如,m/z值比最丰富的物质(在电荷值z=1的“m0 1”位置中)高1m/z单位的峰可具有稍微不同的m/z值。如果m
c
峰与
12
ch
3
离子有关,那么在“m
c
1”中可能有两个峰,第一个属于
13
ch
3
并且第二个属于
12
ch2d

。这些在低分辨率下的峰似乎在m/z值上具有相同的m/z值差异,可在高分辨率下观察到。
[0170]
因此,如果下一个干扰峰的距离d
interf
高于0.7m/z单位,那么候选峰比干扰峰更靠近isd的相邻峰。因此,这些干扰峰的影响可以被认为较小,并且纯度值接近整个isd的纯度分数。因此,此方法与特定质量窗口宽度w无关。
[0171]
应认识到,在没有事先知悉用于碎片的隔离窗口的情况下,对簇的每个同位素峰赋予不同的干扰分数是有益的。所导出的信息可以用于选择用于碎片的隔离窗口。此方法可通过以下步骤实现:
[0172]
a)在ms1处使用定义算法的同位素和电荷状态(例如,apd)定义同位素簇。
[0173]
b)检查每个峰并且将其归于同位素簇。当同位素簇重叠时,定义“簇重叠分数”(或同位素纯度p
isd
),这对于属于同位素簇(也称为“同位素体”)的所有峰都是相同的。在一个实施方案中,簇重叠分数由归一化为同位素簇m/z范围内的同位素和干扰峰的总强度的同位素峰的总强度给出,其在最丰富的同位素峰周围对称并且包括簇的最低m/z和最高m/z同位素峰。其它方法也可以用于“簇重叠分数”的分配。
[0174]
c)检查同位素簇的每个峰,并且使用离最接近的干扰的m/z距离值以及干扰峰的归一化强度,以便重新标记每个同位素峰。如果在同位素簇m/z范围内存在超过一个干扰峰,那么选择高于强度/显著性阈值的最接近的干扰峰。
[0175]
d)使用母离子的列表,质谱仪移动通过具有最佳非干扰分数的最强峰至具有最差干扰分数的较不强峰。
[0176]
强度/干扰分数的决策矩阵也可以用于不同类型的实验,以便最大化利用此信息。
[0177]
e)当基于给定隔离窗口内的干扰量过滤前体时,小于或等于前体的同位素簇宽度的隔离窗口内的前体的干扰量可以通过利用干扰分数(仅考虑最接近的显著干扰)和簇重叠分数(考虑整个同位素簇)两者来估测。
[0178]
有利的是,此方法可以在没有事先知悉隔离窗口的情况下进行。此外,用于碎片化的隔离窗口可以根据所关注的每个峰的“干扰分数”自动调整,从而保持对具有良好干扰分数的低强度峰的灵敏度(例如,使用较宽的窗口)。
[0179]
纯度值的应用
[0180]
可以组合值对(p
i
,d
interf
)和(p
isd
,w
isd
)以获得单个数字作为同位素峰的分数。此分数(a)可用作数据相关实验中的前体候选者的列表的分类标准,或(b)其可充当纯度过滤器的选择标准。
[0181]
实例:纯度分数作为分类标准
[0182]
为了将一对纯度值和m/z宽度或距离(p,m)转换为单个32位整数/分数,p首先乘以106,四舍五入到最接近的整数,并且再次乘以1000,使得1000≤p≤109,m乘以100并四舍五入到最接近的整数,使得0≤m≤999。然后将两个转换值相加以获得整数分数。当用作分类标准时,此数字格式比m/z宽度或距离更注重纯度。然而,取决于用户的优先级和记分机制的目标应用,可能有益的是互换值,使得m/z值被置于高阶数字处并且纯度值被置于低阶数字处。
[0183]
对候选峰进行排序可以为峰过滤机制的工作流程提供优点,其可以对频谱峰而不是同位素分布进行操作。并且,对每个峰进行过滤允许选择isd中离isd内的干扰最远的那些峰。例如,如果干扰接近isd的最强峰(=小距离),那么可优先针对ms2选择具有较高距离且因此具有较高整数分数的同位素峰。
[0184]
实例:纯度分数作为选择标准(纯度过滤器)
[0185]
纯度过滤器过滤(不包括)候选峰,所述候选峰具有低于用户定义的阈值t(0≤t≤1)的纯度值,即,仅具有等于或大于t的纯度值的峰可通过过滤器且然后充当数据相关ms/ms实验的潜在候选者。
[0186]
为了与此过滤器相容,必须将纯度值对转化为单一同位素纯度分数s
i
(0<s
i
≤1)。在没有事先知悉用户定义的纯度窗口的情况下,可以通过与最接近的干扰的同位素特异性m/z距离d
interf
来加权纯度值,使得分数随着距离的增加而增加(即,改进)。此可以例如通过取纯度值的第k个根来实现,其中k随距离而变:
[0187]
s
i
=min(p
isd
,p
i
)
1/k
其中k=1、2、4、8、

(2的幂)
[0188]
使用整个同位素分布的纯度的最小值p
isd
和同位素峰的纯度p
i
,强调同位素峰的个别环境。通常,共同电荷状态z为2或3的肽的隔离窗口具有~1.4m/z单位的宽度,以便包括第二同位素峰(z=2)和另外的第三同位素峰(z=3)。如果窗口在前体峰周围对称,那么此窗口尺寸对应于~0.7的半宽度(大多数情况下)。基于这些假设,根据m/z距离d以0.7m/z单位的离散步长来选择k:
[0189]
k=2
n
如果0.7n≤d<0.7(n 1),n=0、1、2、

[0190]
即:
[0191]
k=1如果d<0.7
[0192]
k=2如果0.7≤d<1.4
[0193]

[0194]
可以将d设置成等于d
interf
。或者,d可设定为d
interf
的最小值和同位素分布的质量/电荷窗口的半宽度w
isd/2
(d=min(d
interf
,w
isd/2
))。此可避免在质量/电荷窗口w
isd
的边缘处的峰的人为高纯度分数。
[0195]
例如,d=2、p
isd
=0.5、p
i
=0.8的同位素峰的分数是s
i
=0.5
1/4
=0.84。
[0196]
选择用于较大隔离窗口的较高阈值可能是有利的。这至少是因为分数随着与最接近的干扰峰的距离增加而增加。
[0197]
虽然以上描述提供了其中同位素分布的质量/电荷窗口w
isd
和隔离窗口都以最丰富的峰为中心的技术,但并非必须是这种情况。可允许用户指定针对这些参数中的每一者的偏移(类似于在ms2扫描的特性中可用的隔离偏移)以在纯度计算中引入某一种不对称性。
[0198]
原则上,对于计算isd的纯度的m/z窗口存在多个选项:
[0199]
·
以最强峰为中心的窗口,包括isd的所有峰(如上文所表明)。
[0200]
·
以isd的平均m/z值为中心的窗口。
[0201]
·
由isd的最低m/z和最高m/z峰定义的窗口。
[0202]
实际上,数据相关实验的通用工作流程通常以强度递减的顺序触发(经过滤)峰。结果,本公开提供以最强峰为中心的窗口,包括isd的所有峰(高于阈值)。此可提供某些实际优点。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献