一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

与非结核性肺炎有关的血浆miRNA标志物及其应用

2022-04-24 23:33:13 来源:中国专利 TAG:

与非结核性肺炎有关的血浆mirna标志物及其应用
技术领域
1.本技术属于生物医学技术领域,尤其涉及一种与非结核性肺炎有关的血浆mirna标志物及其应用。


背景技术:

2.一般来说,肺炎是指肺泡、远端气道和肺间质的感染性验证,可由细菌、病毒和其他病原体等因素感染引起的,其中,以细菌性肺炎和病毒性肺炎最为常见;其中,常见细菌有肺炎链球菌、葡萄球菌、嗜血流感杆菌等,病毒性肺炎,常见病毒如呼吸道合胞病毒、流感病毒、副流感病毒、腺病毒等。其中,活动性肺结核,是比较常见的传染性的疾病,主要是感染了结核分枝杆菌所造成的慢性感染性的疾病,抗结核用药与治疗周期与非结核性肺炎大不相同;非结核性肺炎主要是指由非结核分枝杆菌或病毒感染引起的肺部疾病。而由于引起肺炎的原因不同,进行治疗的时候需要准确区别才能对症下药,而缺乏早期、快速的肺炎诊断技术是导致肺炎抗炎药物误用、滥用、细菌包括结核分枝杆菌耐药率高的原因之一。
3.因此,发展新的检测方法,提高非结核性肺炎与活动性肺结核的检出率仍然是当前的重要任务。


技术实现要素:

4.本技术的目的在于提供一种与非结核性肺炎有关的血浆mirna标志物及其应用,旨在解决现有技术中没有相关的血浆mirna标志物能够对非结核性肺炎患病风险进行准确、快速进行预测的问题。
5.为实现上述申请目的,本技术采用的技术方案如下:
6.第一方面,本技术提供一种与非结核性肺炎有关的血浆mirna标志物,血浆mirna标志物包括mir-223-3p、mir-1246、mir-185-5p、mir-23b-3p、mir-4532、mir-370-3p、mir-378c、let-7c-5p、mir-15b-3p、mir-665、mir-143-3p、mir-132-3p、mir-10a-5p、mir-335-5p中的一个或多个。
7.第二方面,本技术提供一种与非结核性肺炎有关的血浆mirna标志物在制备非结核性肺炎预测的产品中的应用,血浆mirna标志物为与非结核性肺炎有关的血浆mirna标志物。
8.第三方面,本技术提供一种用于预测非结核性肺炎患病风险的试剂盒,试剂盒包括血浆mirna标志物设计的引物。
9.第四方面,本技术提供一种用于预测非结核性肺炎患病风险的系统,系统包括:
10.数据获取单元:用于将样本进行基于direct s-poly(t)plus的实时荧光定量反应,获取样本中血浆mirna标志物进行实时荧光定量反应得到的ct值;
11.数据分析单元:用于将ct值与外参相减并进行标准化处理,得到δct值,利用随机森林模型处理δct值,分析样本的风险概率值;
12.数据预测单元:用于将风险概率值与阈值进行比较,以预测非结核性肺炎患病风
险。
13.本技术第一方面提供的11种新的与非结核性肺炎有关的血浆mirna标志物,由于血浆mirna早于细胞内蛋白质类标志物释放进入血液中,检测血浆水平可作为早期辅助分析非结核性肺炎的标志物;在检测分析过程中,不需要再进一步提取外泌体且不需要筛选和制备特异性抗体,可直接进行pcr检测,在检测过程中,检测可同时对多个mirna标志物进行同步分析,检测速率高、检测简单快,不会造成假阳性;同时可有利于较好区分非结核性肺炎与活动性肺结核的样本,更有利于全面、准确用于预测非结核性肺炎的患病风险。
14.本技术第二方面提供的与非结核性肺炎有关的血浆mirna标志物在制备非结核性肺炎早期诊断的产品中的应用,由于提供的11种血浆mirna标志物在预测非结核性肺炎中的相对表达量具有统计学差异,采用其制备得到的非结核性肺炎早期诊断的产品在使用过程中准确性和敏感性较高,可很好的区分非结核性肺炎与活动性肺结核,更有利于全面、准确用于预测非结核性肺炎的患病风险。
15.本技术第三方面提供的用于预测非结核性肺炎患病风险的试剂盒,试剂盒包括血浆mirna标志物设计的引物,根据提供的引物可快速从样本中检测得到相应的mirna标志物,无需提取核酸,简单快速、减少污染、避免丢失、成本降低、技术门槛低;并且血浆相对于其他组织/体液样本较易获得,极大地方便了临床应用。
16.本技术第四方面提供的用于预测非结核性肺炎患病风险的系统,提供的系统包括数据获取单元、数据分析单元、数据预测单元;该系统将基于direct s-poly(t)plus的实时荧光定量反应分析得到的样本的mirna标志物的ct值先进行标准化处理,确保误差范围更小,结果更可靠;再利用随机森林模型分析样本的风险概率值并与阈值比对,将实时荧光定量反应结合ai诊断模型,可较好区分非结核性肺炎与活动性肺结核,预测结果准确度较高,可信度较高,可广泛应用。
附图说明
17.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1是本技术实施例提供的非结核性肺炎与活动性肺结核病人差异mirna热图。
19.图2是本技术实施例提供的非结核性肺炎与活动性肺结核病人特征选择mirna组合图
20.图3是本技术实施例提供的11个mirna分别区分非结核性肺炎和活动性肺结核病人的roc曲线图。
21.图4是本技术实施例提供的rf模型测试数据的roc曲线图。
具体实施方式
22.为了使本技术要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
23.本技术中,术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况。其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
24.本技术中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,“a,b,或c中的至少一项(个)”,或,“a,b,和c中的至少一项(个)”,均可以表示:a,b,c,a-b(即a和b),a-c,b-c,或a-b-c,其中a,b,c分别可以是单个,也可以是多个。
25.应理解,在本技术的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,部分或全部步骤可以并行执行或先后执行,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
26.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。在本技术实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
27.本技术实施例说明书中所提到的相关成分的重量不仅仅可以指代各组分的具体含量,也可以表示各组分间重量的比例关系,因此,只要是按照本技术实施例说明书相关组分的含量按比例放大或缩小均在本技术实施例说明书公开的范围之内。具体地,本技术实施例说明书中的质量可以是μg、mg、g、kg等化工领域公知的质量单位。
28.术语“第一“、“第二”仅用于描述目的,用来将目的如物质彼此区分开,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。例如,在不脱离本技术实施例范围的情况下,第一xx也可以被称为第二xx,类似地,第二xx也可以被称为第一xx。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
29.本技术实施例中所用术语“预测值”、“阈值”指的是经rf算法中计算得出的数学分数;“预测值”为将受试者样本mirna数据输入rf模型后计算出的数学分数,范围0~1;“阈值”指的是评价模型分类能力的计算方法,本发明使用约登指数(youden index)计算阈值,当样本“预测值”大于“阈值”,模型判断为非结核性肺炎患病风险高;当样本“预测值”小于“阈值”,模型判断为非结核性肺炎患病风险低。
30.本技术所用的术语“差异表达”是指特定mirna在靶样本中的表达水平与在对照样本中相比是改变的,具有统计学意义;对照样本是活动性肺结核的样本,其可以是上调(即在靶样本中mirna ct值降低)或下调(即在靶样本中mirna ct值升高)。换句话说,mirna在靶样本中被激活至比在对照样本中跟高或更低的水平。
31.本技术的ct值反映特定的mirna序列从其基因组基因座被转录的程度。
32.本技术实施例第一方面提供一种与非结核性肺炎有关的血浆mirna标志物,血浆mirna标志物包括mir-223-3p、mir-23b-3p、mir-4532、mir-378c、let-7c-5p、mir-15b-3p、mir-665、mir-143-3p、mir-132-3p、mir-10a-5p、mir-335-5p中的一个或多个。
33.本技术实施例第一方面提供的11种新的与非结核性肺炎有关的血浆mirna标志物,由于非结核性肺炎样本中的血浆mirna早于细胞内蛋白质类标志物释放进入血液中,检测血浆水平可作为早期辅助分析非结核性肺炎的标志物;在检测分析过程中,不需要再进一步提取外泌体且不需要筛选和制备特异性抗体,可直接进行pcr检测,在检测过程中,检测可同时对多个mirna标志物进行同步分析,检测速率高、检测简单快,不会造成假阳性;同
时可有利于较好区分非结核性肺炎与活动性肺结核的样本,更有利于全面、准确用于预测非结核性肺炎的患病风险。
34.在一些实施例中,提供的11种mirna标志物中,每个标志物的登记号、标志符号和序列如下所示:
35.mir-223-3p的登记号为mi0000300,标志符号为mir223,序列如seq id no.1所示,为ugucaguuugucaaauacccca;
36.mir-4532的登记号为mi0016899,标志符号为mir4532,序列如seq id no.2所示,为ccccggggagcccggcg;
37.mir-378c的登记号为mi0015825,标志符号为mir378c,序列如seq id no.3所示,为acuggacuuggagucagaagagugg;
38.mir-15b-3p的登记号为mi0000438,标志符号为mir15b,序列如seq id no.4所示,为cgaaucauuauuugcugcucua;
39.mir-143-3p的登记号为mi0000459,标志符号为mir143,序列如seq id no.5所示,为ugagaugaagcacuguagcuc;
40.mir-335-5p的登记号为mi0000816,标志符号为mir335,序列如seq id no.6所示,为ucaagagcaauaacgaaaaaugu;
41.mir-23b-3p的登记号为mi0000439,标志符号为mir23b,序列如seq id no.7所示,为aucacauugccagggauuaccac;
42.let-7c-5p的登记号为mi0000064,标志符号为mirlet7c,序列如seq id no.8所示,为ugagguaguagguuguaugguu;
43.mir-665的登记号为mi0005563,标志符号为mir665序列如seq id no.9所示,为accaggaggcugaggccccu;
44.mir-132-3p的登记号为mi0000449,标志符号为mir132,序列如seq id no.10所示,为uaacagucuacagccauggucg;
45.mir-10a-5p的登记号为mi0000266,标志符号为mir10a,序列如seq id no.11所示,为uacccuguagauccgaauuugug。
46.本技术实施例第二方面提供一种与非结核性肺炎有关的血浆mirna标志物在制备非结核性肺炎预测的产品中的应用,血浆mirna标志物为与非结核性肺炎有关的血浆mirna标志物。
47.本技术实施例第二方面提供的与非结核性肺炎有关的血浆mirna标志物在制备非结核性肺炎早期诊断的产品中的应用,由于提供的11种血浆mirna标志物在预测非结核性肺炎中的相对表达量具有统计学差异,采用其制备得到的非结核性肺炎早期诊断的产品在使用过程中准确性和敏感性较高,可很好的区分非结核性肺炎与活动性肺结核,更有利于全面、准确用于预测非结核性肺炎的患病风险。
48.在一些实施例中,产品包括试剂盒、芯片、系统中的至少一种。由于提供的mirna标志物检测方面,特异性较强,灵敏度较高,应用于试剂盒、芯片或系统的制备,可提高非结核性肺炎患病风险的预测准确度及可信度,并且有效区分非结核性肺炎与活动性肺结核。
49.本技术实施例第三方面提供一种用于预测非结核性肺炎患病风险的试剂盒,试剂盒包括根据的血浆mirna标志物设计的引物。
50.本技术实施例第三方面提供的用于预测非结核性肺炎患病风险的试剂盒,试剂盒包括血浆mirna标志物设计的引物,根据提供的引物可快速从样本中检测得到相应的mirna标志物,无需提取核酸,简单快速、减少污染、避免丢失、成本降低、技术门槛低;并且血浆相对于其他组织/体液样本较易获得,极大地方便了临床应用。
51.在一些实施例中,引物包括根据每个血浆mirna标志物设计的通用逆转录引物、荧光定量反应的特异上游引物以及特异性下游引物。
52.在一些实施例中,通用逆转录引物如seq.id no.12所示,为cagtgcagggtccgaggt。
53.在一些实施例中,mir-223-3p的荧光定量反应的特异上游引物如seq.id no.13所示,为ctgggugucaguuugucaaau;荧光定量反应的特异下游引物如seq.id no.24所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttttggggt;
54.mir-23b-3p的荧光定量反应的特异上游引物如seq.id no.14所示,为ctgggaucacauugccaggga;荧光定量反应的特异下游引物如seq.id no.25所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttgtggtaa;
55.mir-4532的荧光定量反应的特异上游引物如seq.id no.15所示,为ctgggccccggggagc;荧光定量反应的特异下游引物如seq.id no.26所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttcgccgg;
56.mir-378c的荧光定量反应的特异上游引物如seq.id no.16所示,为ctgggacuggacuuggaguca;荧光定量反应的特异下游引物如seq.id no.27所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttccactcttc;
57.let-7c-5p的荧光定量反应的特异上游引物如seq.id no.17所示,为ctgggugagguaguagguugu;荧光定量反应的特异下游引物如seq.id no.28所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttaaccat;
58.mir-15b-3p的荧光定量反应的特异上游引物如seq.id no.18所示,为ctgggcgaaucauuauuugcu;荧光定量反应的特异下游引物如seq.id no.29所示,为gtgcagggtccgaggtcagagccacctgggcaattttttttttttagagc;
59.mir-665的荧光定量反应的特异上游引物如seq.id no.19所示,为ctgggaccaggaggcugag;荧光定量反应的特异下游引物如seq.id no.30所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttaggggc;
60.mir-143-3p的荧光定量反应的特异上游引物如seq.id no.20所示,为ctgggugagaugaagcacug;荧光定量反应的特异下游引物如seq.id no.31所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttgagcta;
61.mir-132-3p的荧光定量反应的特异上游引物如seq.id no.21所示,为ctggguaacagucuacagcca;荧光定量反应的特异下游引物如seq.id no.32所示。为gtgcagggtccgaggtcagagccacctgggcaatttttttttttcgacca;
62.mir-10a-5p的荧光定量反应的特异上游引物如seq.id no.22所示,为ctggguacccuguagauccga;荧光定量反应的特异下游引物如seq.id no.33所示,为gtgcagggtccgaggtcagagccacctgggcaatttttttttttcacaaat;
63.mir-335-5p的荧光定量反应的特异上游引物如seq.id no.23所示,为ctgggucaagagcaauaacga;荧光定量反应的特异下游引物如seq.id no.34所示,为gtgcagg
gtccgaggtcagagccacctgggcaatttttttttttacatttt。
64.在一些实施例中,试剂盒还包括探针,其中,探针的序列如seq.id no.35所示,为cagagccacctgggcaattt。
65.在一些实施例中,试剂盒还包括基于direct s-poly(t)plus的实时荧光定量反应使用的试剂。试剂包括针对每个mirna标志物的引物以及反应过程中需要使用的酶、缓冲液。基于direct s-poly(t)plus的实时荧光定量rt-qpcr,是一种不需提取核酸,直接以经简单处理的血清或血浆(s/p)为模板检测循环microrna(mirna)的实时荧光定量pcr。
66.通过基于direct s-poly(t)plus的实时荧光定量rt-qpcr技术直接对受试者的血浆mirna进行检测,其检测效率比传统方法显著提高、定量更加准确、经济方便。
67.在一些实施例中,用于预测非结核性肺炎患病风险的试剂盒,还包括用于预测非结核性肺炎患病风险的随机森林模型,随机森林模型(rf模型)是一种常规的算法,本技术实施例提供的rf模型型是采用常规的算法,输入11种mirna数据本和样本值参数构建一个适用于该样本的模型,用于对样本得到的ct值进行分析。
68.本技术实施例第四方面提供一种用于预测非结核性肺炎患病风险的系统,系统包括:
69.数据获取单元:用于将样本进行基于direct s-poly(t)plus的实时荧光定量反应,获取样本中血浆mirna标志物进行实时荧光定量反应得到的ct值;
70.数据分析单元:用于将ct值与外参相减并进行标准化处理,得到δct值,利用随机森林模型处理δct值,分析样本的风险概率值;
71.数据预测单元:用于将风险概率值与阈值进行比较,以预测非结核性肺炎患病风险。
72.本技术实施例第四方面提供的用于预测非结核性肺炎患病风险的系统,提供的系统包括数据获取单元、数据分析单元、数据预测单元;该系统将基于direct s-poly(t)plus的实时荧光定量反应分析得到的样本的mirna标志物的ct值先进行标准化处理,确保误差范围更小,结果更可靠;再利用随机森林模型分析样本的风险概率值并与阈值比对,将实时荧光定量反应结合ai诊断模型,准确快速预测非结核性肺炎患病风险,并且可较好区分非结核性肺炎与活动性肺结核,预测结果准确度较高,可信度较高,可广泛应用。
73.具体的,用于预测非结核性肺炎患病风险的系统包括数据获取单元,数据获取单元主要用于将样本进行基于direct s-poly(t)plus的实时荧光定量反应,获取样本中mirna标志物进行实时荧光定量反应得到的ct值。
74.在一些实施例中,获取样本中mirna标志物进行实时荧光定量反应得到的ct值的步骤中,包括:
75.s01.采集样本,将样本进行预处理得到上清液粗制rna;
76.s02.将上清液粗制rna进行逆转录反应得到cdna;
77.s03.将cdna进行荧光定量pcr检测,获取样本中每个mirna标志物进行实时荧光定量反应得到的ct值。
78.步骤s01中,采集样本,将样本进行预处理得到上清液粗制rna。
79.在一些实施例中,将样本和裂解液按照体积比1:1混合后,于50~54℃条件下孵育15~16分钟、95~96℃变性5~6分钟、13000g离心力条件下4℃离心5~6分钟,得到上清液
粗制rna。
80.步骤s02中,将上清液粗制rna进行逆转录反应得到cdna。
81.在一些实施例中,逆转录反应的反应体系如下:4~5μl上清液粗制rna、1~1.5μl 0.05μm s-poly(t)plus引物、1u多聚腺苷酸聚合酶、100u鼠白血病逆转录酶、1.5~2μl反应缓冲液、无rna酶水补足至10μl。
82.在一些实施例中,反应缓冲液包含以下终浓度的组分:200mm tris-hcl、600mm nacl、40mm mgcl2、4mm atp、2mm dntp、ph 8.0。
83.在一些实施例中,逆转录反应的反应条件如下:37~37.5℃保温15~16分钟,42~42.5℃保温15~16分钟,75~75.5℃加热5~6分钟以灭活酶,然后迅速置于冰上,静置2分钟以终止灭活,得到cdna。
84.步骤s03中,将cdna进行荧光定量pcr检测,获取样本中每个mirna标志物进行实时荧光定量反应得到的ct值。
85.在一些实施例中,荧光定量pcr的反应体系如下:0.5~0.6μl cdna稀释一倍,2~2.5μl 10
×
taq酶反应缓冲液,0.5~0.6μl 2.5mm脱氧核苷酸混合液,4~4.5μl 1μm特异上游引物,4~4.5μl 1μm特异上游引物,5~5.5μl 1μm taqman荧光探针引物,0.5~0.6μl taq dna聚合酶,0.2~0.3μl 100
×
荧光参比试剂,无核酸酶水补足至20μl;其中,taq酶反应缓冲液包含以下终浓度的组分:20mm tris-hcl、50mm kcl、2mm mgcl2、5%glycerol、ph 8.5。
86.在一些实施例中,荧光定量pcr检测采用探针法,pcr运行仪器为abi 7500,每20μl rt-qpcr检测体系加入0.5μl稀释一倍的cdna;检测条件为:预变性95℃5分钟、变性95℃10秒、退火60℃40秒,用时50分钟。
87.具体的,用于预测非结核性肺炎患病风险的系统,系统包括:数据分析单元:用于将ct值与外参相减并进行标准化处理,得到δct值,利用随机森林模型处理δct值,分析样本的风险概率值。
88.在一些实施例中,将数据输入单元输入的ct值与外参cel-mir-54相减并进行scale归一标准化处理得到δct值,数据归一化简单:误差范围更小,结果更可靠。
89.在一些实施例中,利用rf模型处理δct值,分析样本的风险概率值。rf模型的建立基于python scikit-learn模块,自动参数调优方法选取gridsearchcv,并设定7倍交叉验证,以拟合出模型对该数据的最佳性能,根据gridsearchcv选出的最优参数进行最终建模。然后根据训练数据和测试数据的预测值,利用约登指数计算模型最佳阈值。
90.具体的,用于预测非结核性肺炎患病风险的系统,系统包括:数据预测单元:用于将风险概率值与阈值进行比较,以预测非结核性肺炎患病风险。
91.在一些实施例中,数据预测单元还包括非结核性肺炎患病风险的阈值,当风险概率值高于阈值时,判断患非结核性肺炎患病风险的风险高;当风险概率值低于阈值时,判断非结核性肺炎患病风险的风险低。
92.下面结合具体实施例进行说明。
93.实施例1
94.一种与非结核性肺炎有关的mirna标志物在制备非结核性肺炎早期诊断的产品中的应用,其中,产品选自用于预测非结核性肺炎患病风险的系统,系统包括:
95.(1)数据获取单元:用于将样本进行基于direct s-poly(t)plus的实时荧光定量反应,获取样本中血浆mirna标志物进行实时荧光定量反应得到的ct值。
96.具体步骤如下:包括:
97.①
受试者血浆样本的收集与处理
98.本实施例共纳入活动性肺结核患者146例、非结核性肺炎病人139例。其中第一批样本用于mirna标志物筛选,包括79例活动性肺结核患者及60例非结核性肺炎病人;第二批样本包括67例活动性肺结核患者及49例非结核性肺炎病人,用于rf模型的构建及测试。受试者年龄范围均为20-60岁,非结核性肺炎病人为临床排除结核病诊断,mtb痰涂片三次、培养或pcr检查均阴性,细菌学检测证实有结核分枝杆菌之外细菌或真菌,结合临床症状、影像学及治疗性诊断等不支持结核病的诊断,包括临床诊断明确的肺炎、支气管炎、尘肺等。活动性肺结核患者为病原学(痰涂片、痰培养或分子诊断)阳性、初治、且治疗时间不超过30天。所有受试者样本检测mirna初始数量均为264个。
99.受试者血浆样本的收集与处理:采集受试者空腹静脉血,所用采血管为edta抗凝管;4℃下1600g离心10分钟,分离上层血浆,重复一次,分装于2ml ep管,-80℃冰箱保存。
100.②
粗制rna:20μl血浆和20μl裂解液在50℃条件下孵育15分钟、95℃变性5分钟、13000g离心力条件下4℃离心5分钟,得到35μl粗提rna。
101.③
cdna合成:取4μl粗提rna、1μl 0.05μm s-poly(t)plus引物、1u多聚腺苷酸聚合酶、100u鼠白血病逆转录酶、1.5μl反应缓冲液、无rna酶水补足至10μl;37℃保温15分钟,42℃保温15分钟,75℃加热5分钟以灭活酶,然后迅速置于冰上,静置2分钟以终止灭活;其中,反应缓冲液包含以下终浓度的组分:200mm tris-hcl、600mm nacl、40mm mgcl2、4mm atp、2mm dntp、ph 8.0。得到10μl cdna。
102.④
rt-qpcr反应:取0.5μl cdna稀释一倍,2μl 10
×
taq酶反应缓冲液,0.5μl 2.5mm脱氧核苷酸混合液,4μl 1μm特异性上游引物,4μl 1μm rt引物,5μl 1μm taqman荧光探针引物,0.5μl taq dna聚合酶,0.2μl 100
×
荧光参比试剂,无核酸酶水补足至20μl;其中,taq酶反应缓冲液包含以下终浓度的组分:20mm tris-hcl、50mm kcl、2mm mgcl2、5%glycerol、ph 8.5。
103.④
rt-qpcr检测采用探针法,pcr运行仪器为abi 7500,每20μl rt-qpcr检测体系加入0.5μl稀释一倍的cdna;检测条件为:预变性95℃5分钟、变性95℃10秒、退火60℃40秒,用时50分钟。
104.(2)数据分析单元:用于将ct值与外参相减并进行标准化处理,得到δct值,利用随机森林模型处理δct值,分析样本的风险概率值。
105.①
实时荧光定量rt-qpcr下机数据预处理:ct值超出40的数据(“undetermined”)采用knn最近邻算法进行填补(k=20)。填补后数据每个mirna分别减去外参cel-mir-54,再进行scale归一化处理,得到δct数据。
106.②
建立rf模型:将得到的得到δct数据进行模型计算。
107.(3)数据预测单元:用于将风险概率值与阈值进行比较,以预测非结核性肺炎患病风险。
108.rf模型的建立基于python scikit-learn模块。自动参数调优方法选取gridsearchcv,并设定7倍交叉验证,以拟合出模型对该数据的最佳性能,根据
gridsearchcv选出的最优参数进行最终建模。利用约登指数计算模型最佳阈值。
109.预测非结核性肺炎患病风险:将得到的曲线下面积(auc)进行描绘,得到的最佳临界点为确定阈值;当风险概率值高于阈值时,患非结核性肺炎的风险高;当风险概率值低于阈值时,患非结核性肺炎的风险低。
110.结果分析
111.(一)非结核性肺炎特异性相关mirna筛选
112.第一批样本中对非结核性肺炎病人与活动性肺结核患者的mirna表达进行差异分析,检验方法为wilcoxon检验,以p《0.05为阈值,从264个mirna中筛选出112个差异表达mirna。基于差异mirna表达水平的无监督层次聚类分析见图1。
113.进一步,通过多重共线性分析:去除相关性大于0.7的mirna,共77个,余下35个。从35个mirna中求出对区分非结核性肺炎识别最有效的特征mirna,实现特征空间维数的压缩:通过递归特征消除算法(rfe)筛选最优mirna组合,如图2所示,22个mirna集合的准确率最高。
114.如表1所示,分别在非结核性肺炎病人与活动性肺结核患者的比较中,对提供的mirna进行递归特征选择,表2所示分别为特征选择计算的22个mirna在3个比较组中的重要性指数。根据表1~2结果显示,当按mirna重要性指数向后递增组合时,区分非结核性肺炎病人与活动性肺结核患者的最佳mirna组合数如表1所示,此时模型准确率和一致性较高。
115.表1
[0116][0117]
表2
[0118]
id重要性指数mir-223-3p4.90mir-378c4.29mir-15b-3p4.20mir-45324.00
mir-132-3p3.77mir-143-3p3.49mir-10a-5p3.05mir-23b-3p2.95let-7c-5p2.59mir-335-5p2.56mir-6652.15
[0119]
进一步,对22个mirna原始ct值进行筛查,去除11个mirna平均ct值大于35的mirna,最终得到11个非结核性肺炎特异性相关mirna标志物。11个mirna区分活动性肺结核与非结核性肺炎受试者工作特征曲线(roc)如图3所示,其曲线下面积(auc)范围为0.6~0.71。
[0120]
(二)rf模型的建立和测试
[0121]
基于rf模型的roc曲线见图4。曲线下面积(auc)为0.99,最佳临界点(“阈值”)为0.7,此时模型对数据的敏感性是0.98(95%ci:0.89,1.0)、特异性是0.95(95%ci:0.87,0.99、准确率为0.96(95%ci:0.91,0.99)、召回率f1为0.96,阳性预测值和阴性预测值分别为0.94(95%ci:0.84,0.99)和0.98(95%ci:0.92,1.0)(表3)。
[0122]
表3
[0123][0124]
综上,本技术提供的11种新的与非结核性肺炎有关的血浆mirna标志物,由于血浆mirna早于细胞内蛋白质类标志物释放进入血液中,检测血浆水平可作为早期辅助分析非结核性肺炎的标志物;在检测分析过程中,不需要再进一步提取外泌体且不需要筛选和制备特异性抗体,可直接进行pcr检测,在检测过程中,检测可同时对多个mirna标志物进行同步分析,检测速率高、检测简单快,不会造成假阳性;同时可有利于较好区分活动性肺结核与非结核性肺炎的样本,更有利于全面、准确用于预测非结核性肺炎的患病风险。
[0125]
以上所述仅为本技术的较佳实施例而已,并不用以限制本技术,凡在本技术的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献