一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种视网膜母细胞瘤分期模型构建方法及标志物与流程

2022-03-05 08:06:22 来源:中国专利 TAG:


1.本发明涉及代谢组学分析技术领域,尤其涉及一种基于代谢组学和机器学习技术的视网膜母细胞瘤分期模型构建和标志物鉴定。


背景技术:

2.视网膜母细胞瘤(retinoblastoma,rb)是最常见的儿童眼内恶性肿瘤,约占儿童恶性肿瘤的10%,如果不及时进行治疗,rb可能导致儿童完全失明甚至死亡,及时准确地对rb进行诊断和分期是其管理的关键。
3.在发达国家,rb的有效监测可使其5年生存率达到95%,同时显著降低患者的医疗成本,提高视力质量。然而,传统的rb检测方法需要结合眼底检查、影像学检查以及肿瘤组织病理检查,操作复杂,费用高,并且需要有经验的操作人员。此外,由于rb具有松散性质,在眼摘前对其肿瘤组织进行活检可能会导致其眼外扩散。
4.在资源有限的地区,rb监测仍然不足,其死亡率甚至可能达到70%以上。因此,亟需发展新的rb监测工具,特别是对资源有限的地区。
5.生物体液中的生物标记物检测正在取代传统的活检和成像技术,从细胞到分子水平对癌症进行动态监测。在细胞水平,分析血液中循环肿瘤细胞等特定细胞,可以动态监测癌症进展。然而,这通常需要复杂的预分离过程。同时,在分子水平上,对生物体液中特定分子的直接检测更加,易于大规模临床应用。特别地,与蛋白质和基因生物标志物相比,代谢生物标志物作为通路的最终产物,能够更加直接地反映人体的生理病理过程。值得注意的是,相对于单一的生物标志物分析,构建多个标志物构成的生物标志物组合至关重要,以表征复杂的生物系统。在这种情景下,机器学习是非常重要的,可以在复杂的数据集中执行特征选择和表型识别等任务。
6.质谱(ms)已成为检测生物标志物的主要工具。与传统的酶学和光谱测定方法(如核磁共振、拉曼光谱)相比,质谱以高灵敏度/分辨率测量代谢物的质荷比(m/z),因此能够以无标记的方式进行分子鉴定。ms在复杂生物体液的代谢分析中依赖于繁琐的样品处理,如液相/气相色谱(lc/gc),用于代谢产物的富集和样品的纯化。值得注意的是,传统的代谢分析需要严格的预处理过程(约3-5小时)以及较大的样本量(约100μl),以克服生物体液中样品的复杂性和较低的代谢产物丰度,一次性可收集的房水样本量极小(约10μl/样本),故传统分析技术难以对房水进行代谢分析。
7.最近,纳米颗粒增强激光解吸/电离(ldi)质谱芯片的发展在代谢指纹图谱方面展现出强大的潜力,由于其特定的纳米结构可以有效捕获和识别代谢物。到目前为止,ldi-ms芯片的代谢指纹已经覆盖了血液、尿液和脑脊液等几种生物液体,用于疾病的诊断和预后。目前,还没有报道将ldi-ms芯片用于房水代谢指纹谱图成像。


技术实现要素:

8.有鉴于现有技术的上述缺陷,本发明提供了一种视网膜母细胞瘤分期模型构建方
法及应用。
9.本发明采用以下技术方案:
10.第一方面,本发明提供了一种视网膜母细胞瘤分期模型构建方法,主要步骤包括:
11.步骤1、使用ldi-ms,进行rb病人房水样品代谢指纹谱图成像;
12.步骤2、对rb病人房水代谢指纹谱图进行机器学习,实现对rb分期的准确预测;
13.步骤3、进行房水中生物标志物鉴定,通过生物标志物组合实现对rb分期的准确预测。
14.进一步地,步骤1具体包括:
15.步骤1.1、采集rb早期患者和晚期患者房水样本,作为分析样本,并准备去离子水、纳米颗粒基质、激光解吸电离飞行时间质谱(ldi-tof-ms);
16.步骤1.2、稀释采集的房水样本:用去离子水稀释5倍;
17.步骤1.3、配置纳米颗粒基质溶液;
18.步骤1.4、样品制备:取步骤1.2稀释后的房水样本1μl点样在ldi-ms质谱靶板上,室温下干燥;
19.步骤1.5、纳米颗粒基质制备:取步骤1.3纳米颗粒基质溶液1μl点样在ldi-ms质谱靶板上,室温下干燥;
20.步骤1.6、指纹谱图成像:在ldi-tof-ms中进行房水样本代谢指纹谱图成像;
21.优选地,步骤1.3中纳米颗粒基质溶液终浓度是采用去离子水配成1mg/ml。
22.进一步地,所述步骤2使用python 3.8进行数据分析,具体步骤包括:
23.步骤2.1、对步骤1.6获得的指纹谱图进行预处理,包括数据重采样、谱线平滑、基线校正、谱峰联配以及缺失值填充,得到m/z信号;
24.步骤2.2、使用弹性网络算法对m/z信号进行特征选择(c=1,l1_ratio=0.65),并设置弹性网络算法中系数的阈值,得到m/z特征;
25.步骤2.3、将采集的患者样本数据划分成训练集和测试集;
26.步骤2.4、使用20次重复的5折交叉验证对岭回归在训练集上进行l2参数优化以及模型训练,得到岭回归在训练集上的性能;
27.步骤2.5、对步骤2.4中训练好的模型在测试集进行预测,得到岭回归在测试集上的性能。
28.优选地,步骤2.2中所述阈值设置为0.18。
29.优选地,所述患者样本66个。
30.进一步地,所述步骤3具体步骤包括:
31.步骤3.1、采集rb早期患者和晚期患者房水样本,作为分析样本,并准备去离子水、纳米颗粒基质、ldi-tof-ms和激光解吸电离离子回旋共振质谱(ldi-fticr-ms);
32.步骤3.2、稀释采集的房水样本:用去离子水稀释5倍;
33.步骤3.3、配置纳米颗粒基质溶液;
34.步骤3.4、样品制备:取步骤3.2稀释后的房水样本1μl点样在ldi-ms质谱靶板上,室温下干燥;
35.步骤3.5、纳米颗粒基质制备:取步骤3.3纳米颗粒基质溶液1μl点样在ldi-ms质谱靶板上,室温下干燥;
36.步骤3.6、获取分子量:在ldi-fticr-ms中得到生物标志物的精准分子量;
37.步骤3.7、获取二级质谱谱图:在ldi-tof-ms中得到生物标志物的二级质谱谱图;
38.优选地,步骤3.3中纳米颗粒基质溶液终浓度是采用去离子水配成1mg/ml。
39.第二方面,本发明提供了一种利用视网膜母细胞瘤分期模型构建方法的分期标志物,该标志物包括以下房水代谢物中的任意一种或多种:乳酸lac、乙酰乙酸ace、乙酰丙酸lev、1-吡咯啉-5-羧酸prc、缬氨酸val、去甲肾上腺素nor、天冬氨酸asp。
40.第三方面,本发明提供了一种视网膜母细胞瘤诊断试剂盒,其特征在于:包括所述的乳酸lac、乙酰乙酸ace、乙酰丙酸lev、1-吡咯啉-5-羧酸prc、缬氨酸val、去甲肾上腺素nor、天冬氨酸asp中的一种或多种。
41.本发明的优点在于:本发明采用ldi-ms,仅仅使用200nl房水/样本,无需任何复杂预处理过程(只需要用去离子水稀释5倍),实现了房水代谢指纹谱图高通量(384样本/芯片),高灵敏度(低至0.3pmol),高信号数量(228个m/z信号)以及高可重复性(cv《10%)检测,有效解决了传统技术样本量较大以及预处理复杂等缺陷。
42.除此之外,本发明通过对rb病人房水代谢指纹谱图进行机器学习,构建了准确预测rb分期(早期,晚期)的模型,并鉴定了7个代谢生物标志物组合,有望应用于临床中rb分期的检测。解决了传统rb检测技术存在的通量低,操作复杂,费用高,分析速度慢等问题。
附图说明
43.图1是本发明实施例中rb患者房水样本代表性代谢指纹谱图;
44.图2是本发明实施例中66个rb病人房水代谢指纹谱图预处理后228个m/z信号对应热图;
45.图3是本发明实施例中机器学习中训练集,测试集划分方法及其训练和评估过程示意图;
46.图4是本发明实施例中生物标志物组合预测rb疾病分期的性能图。
具体实施方式
47.以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
48.实施例1、使用纳米颗粒增强激光解吸电离飞行时间质谱技术,进行房水代谢指纹谱图成像
49.步骤1:仪器与试剂的准备:纳米颗粒基质辅助激光解吸电离飞行时间质谱,房水样本,去离子水,纳米颗粒基质(无机纳米颗粒);
50.步骤2:将房水样本用去离子水稀释5倍。
51.步骤3:将无机纳米颗粒用去离子水配成1mg/ml的纳米颗粒基质溶液。
52.步骤4:在质谱靶板上进行样品制备,每个稀释后的房水样本点样1μl,室温下干燥;
53.步骤5:在质谱靶板上进行纳米颗粒基质制备,每个纳米颗粒基质溶液点样1μl,室温下干燥;
54.步骤6:在纳米颗粒基质辅助激光解吸电离傅里叶变换离子回旋共振质谱仪中进行房水代谢指纹谱图成像ldi-fticr-ms;
55.步骤7:得到房水代谢指纹谱图,用于后续分析。
56.实施例2、对rb病人房水代谢指纹谱图进行机器学习,实现对rb分期的准确预测:
57.步骤1:仪器与试剂的准备:python 3.8;
58.步骤2:通过步骤一,对66个rb病人房水进行代谢指纹谱图成像(图1);
59.步骤3:在python 3.8上对66个房水代谢指纹谱图进行预处理,包括数据重采样,谱线平滑,基线校正,谱峰联配以及缺失值填充,得到228个m/z信号(图2);
60.步骤4:在python 3.8上使用弹性网络算法对228个m/z信号进行特征选择(c=1,l1_ratio=0.65),并设置弹性网络算法中系数的阈值为0.18,得到16个m/z特征(图3);
61.步骤5:将66个病人划分成训练集(44个病人)和测试集(22个病人)(图3);
62.步骤6:在python 3.8上使用20次重复的5折交叉验证对岭回归在训练集(44个病人)上进行l2参数优化以及模型训练(图4),得到岭回归在训练集上的性能(表1);
63.步骤7:在python 3.8上对步骤6中训练好的模型在测试集(22个病人)进行预测(图4),得到岭回归在测试集上的性能(表1)。
64.表1. 16个m/z特征训练得到的岭回归在训练集和测试集中的性能
[0065][0066]
实施例3、进行房水中生物标志物鉴定,通过生物标志物组合实现对rb分期的准确预测:
[0067]
步骤1:仪器与试剂的准备:纳米颗粒基质辅助激光解吸电离飞行时间质谱,纳米颗粒基质辅助激光解吸电离傅里叶变换离子回旋共振质谱,房水样本,去离子水,纳米颗粒基质(无机纳米颗粒);
[0068]
步骤2:将房水样本用去离子水稀释5倍;
[0069]
步骤3:将无机纳米颗粒用去离子水配成1mg/ml的纳米颗粒基质溶液;
[0070]
步骤4:在质谱靶板上进行样品制备,每个稀释后的房水样本点样1μl,室温下干燥;
[0071]
步骤5:在质谱靶板上进行纳米颗粒基质制备,每个纳米颗粒基质溶液点样1μl,室温下干燥;
[0072]
步骤6:在纳米颗粒基质辅助激光解吸电离傅里叶变换离子回旋共振质谱仪(ldi-fticr-ms)中得到生物标志物的精准分子量(《5ppm);
[0073]
步骤7:在纳米颗粒基质辅助激光解吸电离飞行时间质谱(ldi-tof-ms)中得到生物标志物的二级质谱谱图;
[0074]
步骤8:对质谱检测结果进行分析,鉴定出7个代谢生物标志物(表2);
[0075]
表2. 7个代谢生物标志物相关信息
[0076][0077][0078]
步骤9:相比于单个标志物,7个标志物组合在预测rb病人分期时表现出最好的性能(图4)。
[0079]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献