一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

检测血清中的代谢物水平的产品在制备诊断各类型SLE患者制剂中的应用及制剂

2022-08-13 13:31:17 来源:中国专利 TAG:

检测血清中的代谢物水平的产品在制备诊断各类型sle患者制剂中的应用及制剂
技术领域
1.本发明属于医药分子生物学检测技术领域,具体涉及检测sle,sle不同疾病活动度及不同器官受累sle的诊断标志物水平的产品在制备诊断各类型sle 患者试剂中的应用及其制剂。


背景技术:

2.系统性红斑狼疮(systemic lupus erythematosus,sle)是一种自身免疫性疾病,好发于育龄期女性。其特征在于机体存在大量针对多种自身抗原的抗体,这些自身抗体和一些自身反应性t细胞直接导致sle的病理变化。sle的严重程度取决于主要器官受累的程度,包括最常见的皮肤、肾脏、血液系统、关节、中枢神经系统等。常见的皮肤表现包括面部盘状红斑,颊部蝶形红斑,光敏性,脱发等。30~60%的sle患者会进展为狼疮肾炎,是造成sle死亡的最重要原因之一,早期有肾小球和肾病综合征的表现,如血尿、蛋白尿、管型尿等,肾活检是目前诊断的金标准。多达90%的sle患者会有对称性关节痛。此外,sle患者还会有血液系统的累积,表现为白细胞减少、红细胞减少、血小板减少或三者均减少等。虽然一般认为遗传、激素、环境和免疫学因素与sle患者的多种临床表现相关。但sle的确切发病机制仍不清楚,目前sle的诊断主要基于典型的临床表现,包括来自多个器官系统的体征和症状,以及自身抗体的存在。由于 sle广泛多变和异质性的临床症状,使得自身抗体的诊断具有低敏感性或低特异性,迄今仍没有一种早期、准确的用于系统性红斑狼疮的确诊及分型的临床标记物。
3.代谢物作为生物体表型的直接体现者,是一种天然的表型指标。因此,代谢物分析已经成为一种广泛应用于临床诊断的有效方法。近年来,高通量方法的快速发展使人们能够更好地去识别和表征包括sle在内的复杂疾病的生物标志物。通过结合lc-ms/ms代谢组学和脂质组学方法增加了血清中代谢物的覆盖率。鉴于sle不同疾病活动度及不同器官受累表型sle之间的病理差异,代谢组学和脂质组学的结合可能成为发现sle不同临床表型生物标志物的重要平台。
4.sle的严重程度与受累器官的类型息息有关。因此,寻找不同器官受累sle 的可靠生物标志物将显著有利于sle患者的最佳治疗。


技术实现要素:

5.本发明发现了用于sle,不同疾病活动度sle及不同器官受累sle早期诊断的生物标记物。通过检测不同代谢物的水平,进一步联合logistic二元回归和 roc曲线分析,可以辅助早期诊断sle,不同疾病活动度sle,同时还能区分不同器官受累sle包括仅肾脏受累sle(ki)、仅皮肤受累sle(si)、仅血液系统受累sle(bi)、多系统受累sle(mi)。
6.本发明的首要目的在于检测多个代谢物水平的产品在制备辅助诊断sle、不同疾病活动度sle及不同器官受累sle制剂中的应用。
7.检测血清中的代谢物水平的产品在制备诊断各类型sle患者制剂中的应用,包括诊断sle,不同疾病活动度sle及不同器官受累sle(ki、si、bi、mi) 中的至少一种;所述的用于诊断sle患者的4个生物标志物为:硫酸脱氢表雄酮、2-甲基丁酰甘氨酸、苯甲酸、脂肪酸(fatty acid,fa)(20:1);用于诊断不同疾病活动度sle的3个生物标志物为:溶血磷脂酰胆碱(lysophosphatidylcholine, lpc)(18:0)、磷脂酰胆碱(phosphatidylcholine,pc)(18:3/18:3)、磷脂酰乙醇胺(phosphatidylethanolamine,pe)(16:0/22:4);所述的不同器官受累sle患者包括: ki、si、bi、mi;所述的用于诊断ki患者的4个生物标志物为:2-羟基乙烷磺酸盐、5,8,11-二十碳三烯酸、吡嗪、pe(18:1e/21:2);用于诊断si患者的2个生物标志物为:l-异亮氨酸、甘油三酯(triacylglycerol,tag)(12:3/21:3/21:3);所述的用于诊断bi患者的5个生物标志物为:顺式-5-十四烯酰肉碱、 lpc(22:6(4z,7z,10z,13z,16z,19z))、pc(14:0/18:2)、pc(16:1e/18:2)、pe(10:0/26:4);用于诊断mi患者的6个生物标志物为:l-α-天冬氨酸-l-羟基脯氨酸、 pe(16:0/18:2)、pc(15:0/18:2(9z,12z))、pc(16:0/p-16:0)、 pc(22:5(4z,7z,10z,13z,16z)/14:0)、pc(5:0/26:1)。
8.所述的应用,sle患者诊断时,利用4个生物标志物中至少一种,sle患者硫酸脱氢表雄酮水平与hc相比降低,fa(20:1)、2-甲基丁酰甘氨酸、苯甲酸水平与hc相比升高。
9.所述的应用,不同疾病活动度sle患者诊断时,利用3个生物标志物中的至少一种,使用sledai评估疾病活动性。活动性sle的pe(16:0/22:4)水平与非活动性sle患者相比升高,lpc(18:0)、pc(18:3/18:3)水平与非活动性sle患者相比降低。
10.所述的应用,ki患者诊断时,利用4个生物标志物中至少一种,ki患者的 2-羟基乙烷磺酸盐、5,8,11-二十碳三烯酸、吡嗪、pe(18:1e/21:2)水平与hc相比升高;进一步地,2-羟基乙烷磺酸盐、5,8,11-二十碳三烯酸、吡嗪、pe(18:1e/21:2) 水平分别在si、bi、mi患者与hc的两两比较中均没有显著差异。
11.所述的应用,si患者诊断时,利用2个生物标志物中至少一种,si患者的 l-异亮氨酸、tag(12:3/21:3/21:3)水平与hc相比降低;进一步地,l-异亮氨酸、 tag(12:3/21:3/21:3)水平分别在ki、bi、mi患者与hc的两两比较中均没有显著差异。
12.所述的应用,bi患者诊断时,利用5个生物标志物中至少一种,bi患者的 pc(14:0/18:2)、pc(16:1e/18:2)、pe(10:0/26:4)水平与hc相比降低,顺式-5-十四烯酰肉碱、lpc(22:6(4z,7z,10z,13z,16z,19z))水平与hc相比升高;进一步地,顺式-5-十四烯酰肉碱、lpc(22:6(4z,7z,10z,13z,16z,19z))、pc(14:0/18:2)、 pc(16:1e/18:2)、pe(10:0/26:4)水平分别在ki、si、mi患者与hc的两两比较中均没有显著差异。
13.所述的应用,mi患者诊断时,利用6个生物标志物中至少一种,mi患者的 pc(16:0/p-16:0)、pc(22:5(4z,7z,10z,13z,16z)/14:0)水平与hc相比降低,l-α
‑ꢀ
天冬氨酸-l-羟基脯氨酸、pe(16:0/18:2)、pc(15:0/18:2(9z,12z))、pc(5:0/26:1)水平与hc相比升高;进一步地,l-α-天冬氨酸-l-羟基脯氨酸、pe(16:0/18:2)、 pc(15:0/18:2(9z,12z))、pc(16:0/p-16:0)、pc(5:0/26:1)、 pc(22:5(4z,7z,10z,13z,16z)/14:0)水平分别在ki、si、bi患者与hc的两两对比中均没有显著差异。
14.所述的应用,所述的产品通过分析多个样本检测结果,获得代谢物水平,通过单变量统计分析包括学生t检验和多元变量分析opls-da筛选组间的差异代谢物与脂质,采用二元logistic回归和roc分析建立诊断模型,得出公式,用于待测样本的诊断。
15.所述的应用,sle患者和hc相比,
16.联合4个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log (p/(1-p))=-0.794 34223.471a 178897.26b

2009.888c 116698.988d,预测p的分界值为0.81,当p≥0.81时被归类为sle,当p《0.81时被归类为hc;其中a表示2-甲基丁酰甘氨酸在血清中的含量;b表示苯甲酸在血清中的含量; c表示硫酸脱氢表雄酮在血清中的含量;d表示脂肪酸(20:1)在血清中的含量。
17.所述的应用,活动性sle患者和非活动性患者相比,联合3个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log(p/(1-p))=2.379
‑ꢀ
28127.018e-37622.689f 4938.163g,预测p的分界值为0.5,当p≥0.5时被归类为活动性sle,当p《0.5时被归类为非活动性sle;其中e表示溶血磷脂酰胆碱(18:0)在血清中的含量;f表示磷脂酰胆碱(18:3/18:3)在血清中的含量、g表示磷脂酰乙醇胺(16:0/22:4)在血清中的含量。
18.所述的应用,ki与非ki患者,即与si、bi、mi、hc相比,联合4个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log(p/(1-p))=-3.908 3239.837h 10262.915i 46092.934j 8684.127k,预测p的分界值为0.2,当 p≥0.2时被归类为ki患者,当p《0.2时被归类为非ki患者;其中h表示2
‑ꢀ
羟基乙烷磺酸盐在血清中的含量;i表示5,8,11-二十碳三烯酸在血清中的含量; j表示吡嗪在血清中的含量;k表示磷脂酰乙醇胺(18:1e/21:2)在血清中的含量。
19.所述的应用,si与非si患者,即与ki、bi、mi、hc相比,联合4个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log(p/(1-p))=1.028
ꢀ–
115813.522l

32060.855m,预测p的分界值为0.21,当p≥0.21时被归类为 si患者,当p《0.21时被归类为非si患者;其中l表示甘油三酯(12:3/21:3/21:3) 在血清中的含量;m表示l-异亮氨酸在血清中的含量。
20.所述的应用,bi与非bi患者,即与ki、si、mi、hc相比,联合5个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log(p/(1-p))=-0.623 19557.858n 20475.52o-89054.642q-71464.11r-28455.578s,预测p的分界值为0.05,当p≥0.05时,被归类为bi患者,当p《0.05时,被归类非bi患者;其中n表示顺式-5-十四烯酰肉碱在血清中的含量,o表示溶血磷脂酰胆碱(22:6(4z,7z,10z,13z,16z,19z))在血清中的含量;q表示磷脂酰胆碱(14:0/18:2)在血清中的的含量;r表示磷脂酰乙醇胺(10:0/26:4)在血清中的含量;s表示磷脂酰胆碱(16:1e/18:2)在血清中的含量。
21.所述的应用,mi患者与非mi患者,即ki、si、bi、hc相比,联合6个代谢物水平进行二元logistic回归分析,得到公式logit(p)=log(p/(1-p))=2.162
ꢀ–
21062.085t

51754.546u 15220.774v

60136.617w 580055.017x
–ꢀ
4990.361y,预测p的分界值为0.14;当p≥0.14时,被归类为mi患者,当p< 0.14时,被归类为非mi患者,其中t表示l-α-天冬氨酸-l-羟基脯氨酸在血清中的含量;u表示磷脂酰乙醇胺(16:0/18:2)在血清中的含量,v表示磷脂酰胆碱 (15:0/18:2(9z,12z))在血清中的含量;w表示磷脂酰胆碱(16:0/p-16:0)在血清中的含量;x表示磷脂酰胆碱(5:0/26:1)在血清中的含量;y表示磷脂酰胆碱 (22:5(4z,7z,10z,13z,16z)/14:0)在血清中的含量。
22.本发明还提供了一种诊断不同器官受累表型sle患者的制剂,包括上述的应用方法配套的检测血液中代谢物水平的产品。
23.本发明获得sle、不同疾病活动度sle、不同器官受累sle的血清诊断标志物的具体实现步骤如下:
24.1、sle患者和hc血清样本收集与信息获取分析
25.(1)采集sle患者和hc血液样本,建立和整理血样标准库;
26.(2)收集和整理sle患者和hc的临床信息与临床数据确认入组受试者。
27.2、受试者生物样本的处理与检测
28.(1)参与者的血液样本被收集在真空采血管中,在室温下凝固,并在4℃下以 3000rpm的速度离心10分钟,将上清移入两个1.5ml ep管中,在液氮速冻下存储于-80℃直至用于代谢组学和脂质组学检测;
29.(2)代谢物提取,lc-ms/ms代谢组学检测;
30.(3)脂质提取,lc-ms/ms脂质组学检测;
31.3、数据处理与整合
32.(1)原始数据经proteowizard软件转成mzxml格式后,使用r程序包(内核为 xcms)进行峰识别,峰提取,峰对齐和积分等处理;
33.(2)面积归一化过程用于获得组合的正负离子数据,得到的各样本的不同代谢物的含量用于后续分析。
34.4、生物标志物的筛选
35.(1)预处理和整合后的数据,运用单变量统计分析包括学生t检验及正交偏最小二乘法判别分析(orthogonal projections to latent structures-discriminant analysis,opls-da)等多元统计方法对数据进行分析;
36.(2)通过opls-da模型的第一主成分的变量投影重要度(variable importance inthe projection,vip)》1,结合t检验的显著性参数p值《0.05,及倍数变化(foldchange,fc)的相关阈值来寻找两组之间的差异代谢物和脂质。
37.5、生物标志物组合的筛选
38.(1)结合单元变量和多元变量统计分析结果,使用t检验来比较组间的统计差异, opls-da的监督分析最大化了组间的全局代谢变化,使用筛选出差异代谢物和脂质,建立二元logistic回归模型,设计最佳代谢物组合,使用auc和截断值确定灵敏性和特异性来评估每个生物标志物模型的整体性能。
39.本发明的有益效果;
40.本发明首次利用筛选的代谢物或脂质作为生物标志物对sle、不同疾病活动度sle、ki、si、bi、mi患者进行筛查,我们的研究成功地确定了sle患者及 sle不同临床表型相关的生物标志物,这有助于更精确地诊断和评估sle的疾病进展。
41.本发明缩写及相关代谢物中英文对照
42.系统性红斑狼疮:systemic lupus erythematosus(sle)
43.健康对照:healthycontrol(hc)
44.仅肾脏受累的系统性红斑狼疮:systemic lupus erythematosus patients with only kidney involvement(ki)
45.仅皮肤受累的系统性红斑狼疮:systemic lupus erythematosus patients with only skin involvement(si)
46.仅血液系统受累的系统性红斑狼疮:systemic lupus erythematosus patients with only blood system involvement(bi)
47.多系统受累的系统性红斑狼疮:systemic lupus erythematosus patients with multisystem involvement(mi)
48.正交偏最小二乘法判别分析:orthogonal projections to latent structures-discriminant analysis(opls-da)
49.opls-da模型的第一主成分的变量投影重要度:variable importance in the projection(vip)
50.组间差异倍数:fold change(fc)
51.液相色谱串联质谱:liquid chromatography-tandem mass spectrometry(lc-ms/ms)
52.脂肪酸:fatty acid(fa)
53.溶血磷脂酰胆碱:lysophosphatidylcholine(lpc)
54.磷脂酰胆碱:phosphatidylcholine(pc)
55.磷脂酰乙醇胺:phosphatidylethanolamine(pe)
56.甘油三酯:triacylglycerol(tag)
附图说明
57.图1:代谢组学和脂质组学分析sle组和hc组的opls-da模型得分散点图和模型置换检验结果图;
58.图2:脂质组学分析活动性sle和非活动性sle的opls-da模型得分散点图和置换检验结果图;
59.图3:代谢组学和脂质组学分析ki患者对hc组opls-da模型得分散点图和模型置换检验结果图;
60.图4:代谢组学和脂质组学分析si患者对hc组opls-da模型得分散点图和模型置换检验结果图;
61.图5:代谢组学和脂质组学分析bi患者对hc组opls-da模型得分散点图和模型置换检验结果图;
62.图6:代谢组学和脂质组学分析mi患者对hc组opls-da模型得分散点图和模型置换检验结果图;
63.图7:四组不同器官受累sle(ki、si、bi、mi)和hc组的差异代谢物和脂质韦恩图;
64.图8:散点图显示sle和hc之间的脱氢表雄酮硫酸盐、2-甲基丁酰甘氨酸、苯甲酸、fa(20:1)水平。
65.图9:散点图显示活动sle和非活动sle之间的lpc(18:0)、pc(18:3/18:3)、 pe(16:0/22:4)水平。
66.图10:散点图显示ki患者和hc之间的2-羟基乙磺酸盐、5,8,11-二十碳三烯酸、吡嗪、pe(18:1e/21:2)水平。
67.图11:散点图显示si患者和hc之间的l-异亮氨酸、tag(12:3/21:3/21:3) 水平。
68.图12:散点图显示bi患者和hc之间顺式-5-十四烯酰肉碱、pc(14:0/18:2)、 pc
(16:1e/18:2)、pe(10:0/26:4)、lpc(22:6(4z,7z,10z,13z,16z,19z))水平。
69.图13:散点图显示mi患者和hc之间l-α-天冬氨酸-l-羟基脯氨酸、 pe(16:0/18:2)、pc(15:0/18:2(9z,12z))、pc(16:0/p-16:0)、pc(5:0/26:1)、 pc(22:5(4z,7z,10z,13z,16z)/14:0)水平。
70.图14:为各组比较诊断的roc曲线图(a:sle vs.hc;b:非活动性sle vs. 活动性sle;c:ki vs.si/bi/mi/hc;d:si vs.ki/bi/mi/hc;e:bi vs.ki/si/mi/hc; f:mi vs.ki/si/bi/hc)。
71.图15:sle及不同疾病活动度sle的生物标志物在某一血清样本的tic图的保留时间标示。
72.图16:不同器官受累sle的生物标志物在某一血清样本的tic图的保留时间标示。
73.总离子流色谱图(total ion chromatography,tic)。
具体实施方式
74.为了进一步理解本发明,下面将结合本发明实施例,对本发明中的技术方案进行清楚、完整地描述,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下本发明实施例的描述不应理解为对本发明的任何限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,均属于本发明保护的内容。除非另有说明,本文使用的所有技术术语和科技术语具有本发明所属技术领域普通技术人员通常知晓的意思。
75.本发明纳入的sle病例均为皮肤科或风湿科医师临床确诊为sle的患者,所有患者至少满足美国风湿病学会(acr)分类标准中的4项分类标准,并且没有其它自身免疫性疾病的病史。使用sledai评估疾病活动性。非活动性sle 定义为sledai评分从0-4分,活动性sle为sledai评分高于4分。ki患者的纳入标准基于肾活检或存在一下一项或者多项:(a)蛋白尿》0.5g/24h,(b)血尿(红细胞》5/hp,不包括感染和其他原因),(c)脓尿(白细胞》5/hp,不包括感染和其他原因),(d)尿管型(血红蛋白、颗粒管型或红细胞管型);si患者的纳入标准表现为面部盘状红斑、脸颊蝴蝶状红斑、皮疹、脱发中任一项或多项;bi患者存在以下一项或多项标准:(a)白细胞《3
×
109/l,(b)血小板《100
×
109/l; mi患者被定义为前述的两个或多个系统受累。
76.健康对照(hc):身体健康,未患有sle,并且没有其它自身免疫性疾病的病史。
77.实施例:sle、不同疾病活动度sle及不同器官受累患者(ki、si、bi、mi) 潜在血清生物标志物的筛选。
78.一、sle患者和hc血清样本的获取
79.该研究获得医院伦理委员会批准,并经签署知情同意书。收集133例sle患者和30例hc的血清样本,置于-80℃直至用于代谢组学和脂质组学检测。133例 sle根据sledai评分分为70例活动性sle和63例非活动性sle;133例sle 根据不同器官受累表型筛选出以下四组:30例仅肾脏系统受累sle(ki)、29 例仅皮肤系统受累sle(si)、14例仅血液系统受累sle(bi)、30例多系统受累sle(mi)。
80.二、163名受试者血清样本的处理与检测
81.采用lc-ms/ms技术对每个分析样本进行代谢组学和脂质组学分析,得到各血清样
本的原始代谢指纹图谱。
82.1.代谢物提取及lc-ms/ms代谢组学分析
83.(1)代谢物的提取
84.移取100ul血清样品至ep管中,加入400ul提取液(甲醇:乙腈=1:1(v/v),含同位素标记内标混合物),涡旋混匀30s;超声10min(冰水浴);-40℃静置 1h;将样品4℃,12000rpm(离心力13800(x g),半径8.6cm)离心15min;取上清于进样瓶中上机检测;所有样品另取等量上清混合成qc样品上机检测。
85.(2)lc-ms/ms代谢组学分析
86.本项目使用vanquish(thermofisherscientifiic)超高效液相色谱仪,通过 waters acquity uplc beh amide(2.1mm
×
100mm,1.7μm)液相色谱柱对目标化合物进行色谱分离。液相色谱a相为水相,含25mmol/l乙酸铵和25mmol/l 氨水,b相为乙腈。样品盘温度:4℃,进样体积:2μl。orbitrap exporis120质谱仪能够在控制软件(xcalibur,版本:4.0.27,thermo)控制下进行一级、二级质谱数据采集。详细参数如下:sheath gas flow rate:50arb,aux gas flow rate:15 arb,capillary temerature:320℃,full ms resolution:60000,ms/ms resolution: 15000,collision energy:10/30/60in ece mode,spray voltage:3.8kv(positive) 或-3.4kv(negative)。
87.2.脂质提取及lc-ms/ms脂质组学分析
88.(1)脂质的提取
89.移取血清100μl样品,加入480μl的提取液(mtbe:meoh=5:1,含is);涡旋混匀30s,冰水浴超声10min后;将样品在-40℃条件下静置1h。将样品 4℃,3000rpm(离心力900(
×
g),半径8.6cm)离心15min,取上清液300μ l,真空干燥;加入100μl的溶液(dcm:meoh=1:1)进行复溶,涡旋30s,冰水浴超声10min;将样品4℃,13000rpm(离心力16200(
×
g),半径8.6cm) 离心15min;取75μl上清液于进样瓶中上机检测;所有样品另取20μl上清混合成qc样品上机检测。
90.(2)lc-ms/ms脂质组学分析
91.本项目使用agilent 1290(agilent technologies)超高效液相色谱仪,通过 phenomenkinetex c18(2.1*100mm,1.7μm)液相色谱柱对目标化合物进行色谱分离。液相色谱a相为40%水和60%乙腈溶液,其中含10mmol/l甲酸铵; b相为10%乙腈,90%异丙醇溶液,每1000ml中加入了50ml的10mmol/l甲酸铵水溶液。采用梯度洗脱:0~1.0min,40%b;1.0~12.0min,40%~100%b; 12.0~13.5min,100%b;13.5~13.7min,100%~40%b;13.7~18.0min,40%b。流动相流速:0.3ml/min,柱温55℃,样品盘温度:4℃,进样体积:正离子 2μl;负离子2μl。thermo q exactive orbitrap质谱仪能够在控制软件 (xcalibur,版本:4.0.27,thermo)控制下进行一级、二级质谱数据采集。详细参数如下:sheath gas flow rate:30arb,aux gas flow rate:10arb,capillary temperature:320℃(positive)或300℃(negative),full ms resolution:70000, ms/ms resolution:17500,collision energy:15/30/45in nce mode,spray voltage:5 kv(positive)或-4.5kv(negative)。
92.3.数据处理与整合
93.原始数据经proteowizard软件转成mzxml格式后,使用r程序包(内核为 xcms)进行峰识别,峰提取,峰对齐和积分等处理。原始数据的处理主要包括三个方面:偏差值和缺
失值的过滤、缺失值的填充和数据标准化。首先对检出率小于 50%或相对标准偏差大于30%的物质进行过滤。其次,对部分组内因样品物质含量极低而未检出的物质进行补缺,采用数值模拟的方法补上最小值的一半。最后采用内标法对数据进行标准化,得到数据标准化后的正负离子模式数据。然后与二级质谱数据库匹配进行物质注释。面积归一化过程用于获得合并的正负离子数据,得到各样本的不同代谢物的含量用于后续分析。
94.4.生物标志物组合的筛选
95.(1)差异代谢物与脂质的筛选
96.使用simca对数据进行对数(log)转换加uv格式化处理,首先对第一主成分进行opls-da进行建模分析。opls-da是一种有监督的模式识别方法,通过设置分组信息,我们可以过滤掉代谢物中与分类变量不相关的正交变量,并对正交变量和非正交变量分别分析,从而获得更加可靠的代谢物的组间差异。为了验证模型的质量,用7折交叉验证(7-fold cross validation)进行检验;然后用交叉验证后得到的r2y(模型对分类变量y的可解释性)和q2(模型的可预测性)对模型有效性进行评判;最后通过置换检验(permutation test),随机多次改变分类变量 y的排列顺序得到不同的随机q2值,对模型有效性做进一步的检验。置换检验随机模型的q2值均小于原模型的q2值;q2的回归线与纵轴的截距小于零,同时随着置换保留度逐渐降低,置换的y变量比例增大,随机模型的q2逐渐下降。说明原模型具有良好的稳健性,不存在过拟合现象。
97.(2)生物标志物的筛选
98.通过opls-da模型的vip》1,结合t检验的显著性参数p值《0.05,及倍数变化(fold change,fc)的相关阈值来寻找两组之间的差异代谢物和脂质。整合差异的代谢物和脂质,采用二元logistics回归和roc分析建立诊断模型,得到对应诊断组的auc、敏感性和特异性等数值。
99.三、结果
100.1.正交偏最小二乘法判别分析(opls-da)
101.血清样本的代谢物和脂质谱揭示了sle与hc的区别。sle和hc血清样本代谢组学opls-da模型和脂质组学的opls-da模型具有良好的稳健性,不存在过拟合(图1)。活动性sle和非活动性sle血清样本的代谢组学opls-da 模型存在过拟合,活动性sle和非活动性sle脂质组学的opls-da模型具有良好的稳健性(图2)。仅肾脏受累sle(ki)、仅皮肤受累sle(si)、仅血液系统受累sle(bi)、多系统受累sle(mi)分别与hc的代谢组学和脂质组学的opls-da模型皆具有良好的稳健性(图3-图6)
102.2.差异代谢物筛选
103.(1)本发明以opls-da中的vip》1,t检验的p《0.05,fc》1.5或《0.667为筛选条件,筛选sle和hc之间的差异代谢物和脂质。采用二元logistics回归和 roc分析建立组合模型,结果显示由四种代谢物:硫酸脱氢表雄酮、2-甲基丁酰甘氨酸、苯甲酸、fa(20:1)组成的诊断模型显示出最佳预测效率。其auc为 0.998,敏感性为0.987,特异性为1.00。(表1)
104.(2)本发明以opls-da中的vip》1,t检验的p《0.05,fc》1.2或《0.833为筛选条件,筛选活动性sle和非活动性sle之间的差异脂质。采用二元logistics 回归和roc分析建立组合模型。结果显示由3个脂质:lpc(18:0),pc(18:3/18:3), pe(16:0/22:4)组成的诊断模型可用于区分活动性sle和非活动性sle。其auc 为0.767,敏感性为0.691,特异性为0.687(表
2)。
105.(3)本发明以opls-da中的vip》1,t检验的p《0.05,fc》1.5或《0.667为筛选条件,首先分别筛选出ki、si、bi、mi与hc的显著差异代谢物和脂质,然后用韦恩图分别筛选ki、si、bi、mi组特有的代谢物和脂质(图7),然后采用logistics回归和roc分析建立组合模型,用于ki患者与非ki患者、si患者与非si患者、bi患者与非bi患者、mi患者与非mi患者的区分。用于诊断ki 患者的4个生物标志物是:2-羟甲乙烷磺酸盐、5,8,11-二十碳三烯酸、吡嗪、 pe(18:1e/21:2);用于诊断si患者的2个代谢物是:l-异亮氨酸、 tag(12:3/21:3/21:3);用于诊断bi患者的5个代谢物是:顺式-5-十四烯酰肉碱、pc(14:0/18:2)、pc(16:1e/18:2)、pe(10:0/26:4)、lpc(22:6(4z,7z,10z,13z,16z,19z));用于诊断mi患者的6个生物标志物是:l-α-天冬氨酸-l羟基脯氨酸、 pe(16:0/18:2)、pc(15:0/18:2(9z,12z))、pc(16:0/p-16:0)、pc(5:0/26:1)、 pc(22:5(4z,7z,10z,13z,16z)/14:0)(表4)
106.roc曲线下面积(auc)实际的取值范围为0.5~1,而一般认为:对于一个诊断试验,roc曲线下面积在0.5~0.7之间时诊断价值较低,在0.7~0.9之间时诊断价值中等,在0.9以上时诊断价值较高。
107.sle患者和hc相比,
108.联合4个代谢物水平进行二元logistic回归分析,得到公式logit(p)=-0.794 34223.471a 178897.26b

2009.888c 116698.988d,预测p的分界值为 0.81,当p≥0.81时被归类为sle,当p《0.81时被诊断为hc;其中a表示2-甲基丁酰甘氨酸在血清中的含量;b表示苯甲酸在血清中的含量;c表示硫酸脱氢表雄酮在血清中的含量;d表示fa(20:1)在血清中的含量。
109.活动性sle患者和非活动性患者相比,
110.联合3个代谢物水平进行二元logistic回归分析,得到公式logit(p)=2.379
ꢀ‑
28127.018e-37622.689f 4938.163g,预测p的分界值为0.5,当p≥0.5时被归类为活动性sle,当p《0.5时被归类为非活动性sle;其中e表示lpc(18:0) 在血清中的含量;f表示pc(18:3/18:3)在血清中的含量、g表示pe(16:0/22:4) 在血清中的含量。
111.ki患者和非ki患者(si、bi、mi、hc)相比联合4个代谢物水平进行二元logistic 回归分析,得到公式logit(p)=-3.908 3239.837h 10262.915i 46092.934j 8684.127k预测p的分界值为0.2,当p≥0.2时被归类为ki患者,当p《0.2 时被归类为非ki患者;其中h表示2-羟基乙烷磺酸盐在血清中的含量;i表示 5,8,11-二十碳三烯酸在血清中的含量;j表示吡嗪在血清中的含量;k表示 pe(18:1e/21:2)在血清中的含量。
112.si患者和非si患者(ki、bi、mi、hc)相比联合4个代谢物水平进行二元logistic 回归分析,得到公式logit(p)=1.028

115813.522l

32060.855m,预测p 的分界值为0.21,当p≥0.21时被归类为si患者,当p《0.21时被归类为非 si患者;其中l表示tag(12:3/21:3/21:3)在血清中的含量;m表示l-异亮氨酸在血清中的含量。
113.bi患者和非bi患者(ki、si、mi、hc)相比联合5个代谢物水平进行二元logistic 回归分析,得到公式logit(p)=-0.623 19557.858n 20475.52o-89054.642q
‑ꢀ
71464.11r-28455.578s,预测p的分界值为0.05,当p≥0.05时,被归类为 bi患者,当p《0.05时,被归类为非bi患者;其中n表示顺式-5-十四烯酰肉碱在血清中的含量,o表示lpc(22:6(4z,7z,10z,13z,16z,19z))在血清中的含量;q表示pc(14:0/18:2)在血清中的含量;r表示pe(10:
0/26:4)在血清中的含量;s表示pc(16:1e/18:2)在血清中的含量。
114.mi患者和非mi患者(ki、si、bi、hc)相比联合6个代谢物水平进行二元logistic 回归分析,得到公式logit(p)=2.162

21062.085t

51754.546u 15220.774v

60136.617w 580055.017x

4990.361y,预测p的分界值为 0.14;当p≥0.14时,被归类为mi患者,当p<0.14时,被归类为mi患者,其中t表示l-α-天冬氨酸-l-羟基脯氨酸在血清中的含量;u表示pe(16:0/18:2) 在血清中的含量,v表示pc(15:0/18:2(9z,12z))在血清中的含量;w表示 pc(16:0/p-16:0)在血清中的含量;x表示pc(5:0/26:1)在血清中的含量;y表示pc(22:5(4z,7z,10z,13z,16z)/14:0)在血清中的含量。
115.表1. 4个血清标志物构建的sle诊断模型的分类性能
116.表2. 3个血清标志物构建的活动性sle诊断模型的分类性能
117.表3.不同器官受累sle组(ki、si、bi、mi)特有的生物标志物
118.表4.血清标志物构建的不同器官受累sle诊断模型的分类性能
119.表1. 4个血清标志物构建的sle诊断模型的分类性能
[0120][0121]
表2. 3个血清标志物构建的活动性sle诊断模型的分类性能
[0122][0123]
表3.不同器官受累sle组(ki、si、bi、mi)特有的生物标志物(na:表示不满足组间显著差异代谢物或脂质的筛选条件即:vip》1&p《0.05&fc》1.50or fc《0.667。)
[0124]
[0125][0126]
表4.血清标志物构建的不同器官受累sle诊断模型的分类性能
[0127]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献