一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于诊断特发性肺纤维化病的生物标志物及其应用

2023-03-28 23:02:21 来源:中国专利 TAG:


1.本发明属于分子生物学技术领域,涉及一种用于诊断特发性肺纤维化病的生物标志物及其应用。


背景技术:

2.特发性肺纤维化(ipf)是一种预后不良的,以进行性肺纤维化为特征的肺部疾病,吸烟或吸烟史与ipf发病率之间存在较强的相关性,主要症状包括进行性劳力性呼吸困难和干咳。ipf发病机制亦未完全阐明,但有足够证据表明与免疫炎症及肺泡损伤有关。不同标本所显示的免疫炎症反应特征不尽一致,周围血所反映出的是免疫异常比较突出,而支气管肺泡灌洗液显示炎症反应为主,而肺局部组织的异常又有所不同。开发有效的与特发性肺纤维化病的标志物,对于特发性肺纤维化病的诊断和治疗具有重要意义。
3.cn112143720a公开了一种特发性肺纤维化疾病血液诊断标志物cbr1及其在制备诊断或预后工具中的应用,该工具是通过检测血液中的cbr1基因及其表达产物来实现检测特发性肺纤维化疾病的目的,通过蛋白组学筛选在特发性肺纤维化患者和正常人中存在差异表达的蛋白,后经qpcr和elisa验证证明cbr1在mrna和蛋白两个水平上均为特发性肺纤维化患者血液的含量比正常人的低。
4.同工型是由相同基因表达的mrna或蛋白质变体。同工型mrna可能在转录蛋白质的蛋白质编码能力、结构和功能方面有所不同,从而导致独特的生物学功能。同工型mrna是在转录过程中通过选择性剪接(as)产生,此过程在大约95%的人类基因中发生。
5.综合上述,开发新型的特发性肺纤维化疾病标志物,扩充特发性肺纤维化疾病诊断标准,对于特发性肺纤维化病诊断领域具有重要意义。


技术实现要素:

6.针对现有技术的不足和实际需求,本发明提供一种用于诊断特发性肺纤维化病的生物标志物及其应用,本发明对特发性肺纤维化(ifp)肺组织进行第三代rna单分子实时测序和第二代rna测序,并通过fmlrc-hisat2-idp策略,高精度地识别了基因转录过程中的选择性剪接事件。结合肺组织转录组和蛋白质组的差异分析,发现转录本enst00000341846和蛋白ensp00000343129的表达水平在ifp肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化,因此,可作为有效的生物标志物,应用于检测特发性肺纤维化。
7.为达上述目的,本发明采用以下技术方案:
8.第一方面,本发明提供一种用于诊断特发性肺纤维化病的生物标志物,所述生物标志物包括转录本enst00000341846和/或蛋白ensp00000343129,所述蛋白ensp00000343129由转录本enst00000341846翻译。
9.本发明使用fmlrc-hisat2-idp策略检测as事件和同工型,使用smrt-seq的单分子测序获得高精度的rna序列,其精度通过第二代rna测序获得的数据进一步校正。结合肺组
织转录组和蛋白质组的差异分析,将trim29作为新的具有影响ipf潜力的候选基因。进一步研究发现trim29的转录本enst00000341846和蛋白ensp00000343129的表达水平在ifp肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化。
10.第二方面,本发明提供第一方面所述的用于诊断特发性肺纤维化病的生物标志物在制备检测特发性肺纤维化病产品中应用。
11.第三方面,本发明提供一种检测特发性肺纤维化病的试剂盒,所述试剂盒包括检测第一方面所述的用于诊断特发性肺纤维化病的生物标志物的表达水平的试剂。
12.优选地,所述试剂包括rna转录组检测试剂和/或蛋白组检测试剂。
13.第四方面,本发明提供第一方面所述的用于诊断特发性肺纤维化病的生物标志物在以非疾病诊断目的的检测特发性肺纤维化中应用。
14.第五方面,本发明提供一种以非疾病诊断为目的的检测特发性肺纤维化的方法,所述方法包括:
15.对待测样本中转录本enst00000341846和/或蛋白ensp00000343129进行检测,计算转录本enst00000341846和/或蛋白ensp00000343129的表达水平,与正常样本中转录本enst00000341846和/或蛋白ensp00000343129的表达水平比较,进行判断是否是特发性肺纤维化阳性。
16.本发明中,以非疾病诊断为目的的检测特发性肺纤维化的方法可应用于肺部特发性肺纤维化相关行为的基础研究中。
17.优选地,特发性肺纤维化阳性的判断标准为:待测样本中转录本enst00000341846表达水平与正常样本中转录本enst00000341846表达水平的比值》5。
18.优选地,特发性肺纤维化阳性的判断标准为:待测样本中蛋白ensp00000343129的表达水平与正常样本中蛋白ensp00000343129的表达水平的比值》5。
19.优选地,所述待测样本包括肺组织样本、血液样本等。
20.优选地,所述以非疾病诊断为目的的检测特发性肺纤维化的方法包括以下步骤:
21.(1)提取待测样本中rna和/或蛋白质;
22.(2)检测待测样本中转录本enst00000341846和/或蛋白ensp00000343129,计算转录本enst00000341846和/或蛋白ensp00000343129的表达水平,与正常样本中转录本enst00000341846和/或蛋白ensp00000343129的表达水平比较,进行判断是否是特发性肺纤维化阳性。
23.第六方面,本发明提供一种检测特发性肺纤维化病的装置,所述装置包括检测单元和分析单元,所述检测单元用于执行包括:提取待测样本中rna和/或蛋白质,检测待测样本中转录本enst00000341846和/或蛋白ensp00000343129,计算转录本enst00000341846和/或蛋白ensp00000343129的表达水平;所述分析单元用于执行包括:与正常样本中转录本enst00000341846和/或蛋白ensp00000343129的表达水平比较,进行判断是否是特发性肺纤维化病阳性。
24.与现有技术相比,本发明具有以下有益效果:
25.本发明对特发性肺纤维化(ifp)肺组织进行单分子实时测序和第二代rna测序,首次发现转录本enst00000341846和蛋白ensp00000343129的表达水平在ifp肺组织和正常肺组织中的表达水平存在显著差异,可准确表征特发性肺纤维化,作为一类新的生物标志物,
应用于检测肺部的特发性肺纤维化。
附图说明
26.图1a为三代单分子rna测序技术检测到的基因和转录本的饼图;
27.图1b为三代单分子rna测序技术检测到的可变剪接事件和同工型的情况图;
28.图1c为三代单分子rna测序技术检测到的不同类型的可变剪接事件图;
29.图1d为三代单分子rna测序技术检测到的不同类型的可变剪接事件图;
30.图2a为基因水平表达量和可变剪接水平对应的ma图;
31.图2b为基因水平可变剪接水平和显著性水平对应火山图;
32.图2c为基因水平分析发现的重要转录本表达量热图;
33.图2d为转录本水平表达量和可变剪接水平对应的ma图;
34.图2e为转录本水平可变剪接水平和显著性水平对应火山图;
35.图2f为转录本水平分析发现的重要转录本表达量热图;
36.图3a为第三代单分子rna测序、二代rna测序和蛋白组各自到的基因数量韦恩氏图;
37.图3b为在二代rna测序和蛋白组检测中具有差异表达的可变剪接基因图;
38.图3c为在二代rna测序和蛋白组检测中具有差异表达的差异剪接基因图;
39.图4为转录本enst00000341846在健康人和ipf患者肺组织中表达水平结果图;
40.图5为蛋白ensp00000343129在健康人和ipf患者肺组织中表达水平结果图;
41.图6为免疫组织化学方法显示的蛋白ensp00000343129在正常和ipf肺组织中表达水平结果图。
具体实施方式
42.为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
43.实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
44.本发明实施例中,使用fmlrc-hisat2-idp策略检测as事件和亚型,使用smrt-seq单分子rna测序可以获得高精度的rna序列,其读数通过第二代rna测序的数据进一步校正。smrt测序是第三代测序(3gs)技术,通过在零模波导中直接检测cdna,它可以产生平均约15,000个碱基的rna长序列。此外,通过整合转录组和蛋白质组数据,鉴定新的ipf相关基因,并探讨了其在ipf发病机制中的作用。
45.本发明实施例中研究方法如下所示。
46.1.研究对象资料
47.本发明经广东省广州医科大学第一附属医院伦理委员会批准(伦理号:2018-92)。ipf肺组织采集自广州医科大学第一附属医院接受肺移植的5名终末期ipf患者和3例肺供体的健康肺组织。从每位患者获得签署的知情同意书。所有ipf患者均按照其官方ipf临床
实践指南建议的标准进行诊断:(1)排除其他已知的ild原因;(2)高分辨率计算机断层扫描(hrct)上存在uip模式;(3)对于接受外科肺活检的患者,诊断是通过组织病理学模式和hrct模式的存在来做出的。
48.2.样品采集与制备
49.收集参与者肺组织样品,液氮中保存备用。
50.3.smrt-seq文库构建和第三代rna测序
51.按照先前描述的方案(参见:zheng,p.,s.sun,j.wang,z.j.cheng,k.c.lei,m.xue,t.zhang,h.huang,x.d.zhang,and b.sun.2022.'integrative omics analysis identifies biomarkers of idiopathic pulmonary fibrosis',cell mol life sci,79:66.)进行rna提取和完整性检查。根据制造商的方案,使用smarter pcr cdna合成试剂盒(clontech)合成第一链cdna,并使用primestar gxl dna聚合酶(clontech)通过pcr将单链cdna扩增12~14个循环。使用smrtbell
tm
prep kit 1.0(pacific biosciences)构建了一个未选择大小的smrtbell文库。使用dna测序试剂盒(pacific biosciences)在系统上对模板文库进行测序。用smrt link分析工具检查了pacbio smrt-seq数据的质量。
52.4.rna-seq文库构建和第二代rna测序
53.按照先前描述的方案(参见:zheng,p.,s.sun,j.wang,z.j.cheng,k.c.lei,m.xue,t.zhang,h.huang,x.d.zhang,and b.sun.2022.'integrative omics analysis identifies biomarkers of idiopathic pulmonary fibrosis',cell mol life sci,79:66.)构建第二代rna-seq文库。使用illumina truseq rna样品制备试剂盒(illumina)制备cdna文库。根据ultra
tm
rna library prep kit for illumina(neb)的说明,对片段化的rna(平均长度约为200bp)进行第一链和第二链cdna合成,然后进行接头连接和低循环富集。使用agilent 2200 tapestation和2.0(life technologies,usa)评估纯化的文库产品。在广州瑞博生物有限公司(中国广州)使用illumina hiseq3000平台对文库进行配对末端测序(pe150,测序读数为150bp)。
54.5.检测可变剪接事件
55.为了获得更高的异构体检测灵敏度,我们采用fmlrc-hisat2-idp策略来获得高精度的单分子rna序列。首先,通过isoseq工具(pacific biosciences,第3版)对smrt长读数进行预处理,以获得循环共识序列(ccs)读数。然后对ccs读数进行细化和抛光以获得更高的序列准确性。使用fastqc软件来检查ccs读数的质量。其次,将相同样本的illumina短读数与人类参考基因组(hg19)对齐,然后使用hisat2(版本2.2.1)检测外显子连接。第三,ccs读数通过使用fmlrc(版本1.0.0)的高精度illumina短读数校正。然后通过gmap工具将校正的长读数与人类参考基因组hg38进行比对。最后,通过使用idp工具对纠错的长读取和从短读取检测到的外显子连接进行综合分析,生成转录注释文件。
56.6.差异剪接分析
57.用于差异剪接分析的统计数据是剪接百分比(psi),它用每个as事件的外显子包含转录本的比率来表示。psi的计算公式如下:
58.59.其中分子是包含外显子的转录物的总表达水平,分母是所有转录物的总表达水平,表达水平由tpm表示。
60.首先,使用“genepredtogtf”工具将“genepred”格式的转录注释文件转换为“gtf”格式。然后,从rna-seq转录组计算每个样本中转录本的丰度(以tpm为单位)。最后,使用suppa根据默认参数设置基于转录注释和转录丰度计算psi。suppa2计算的as事件类型包括:跳过外显子(se)、5’剪接位点变化(a5)、3’剪接位点变化(a3)、互斥外显子(mx)、内含子保留(ri)、可变第一外显子(af)和可变最后外显子(al)。
61.7.rna-seq数据处理
62.使用trimmomatic工具(版本0.36)修剪原始rna序列以去除接头和低质量序列(参数设置:trailing:20、minlen:235和crop:235),然后使用fastqc软件检查读取的数据质量。然后使用hisat2将配对末端读数与人类参考基因组hg18对齐,并使用htseq工具(版本0.6.0)计算映射到每个基因的读数计数。整个样本的表达水平表示为tpm(每百万映射读数的外显子模型每千碱基转录本)。使用r软件包degseq,筛选调整后的p值《0.05和|log2(倍数变化)|》1的基因作为显著差异表达的基因。
63.8.蛋白质组学数据采集与分析。
64.按照先前描述的方法(参见:zheng,p.,s.sun,j.wang,z.j.cheng,k.c.lei,m.xue,t.zhang,h.huang,x.d.zhang,and b.sun.2022.'integrative omics analysis identifies biomarkers of idiopathic pulmonary fibrosis',cell mol life sci,79:66.)获得和分析肺组织样品的蛋白质组学数据。为了生成数据相关采集(dda),将样品合并为混合物,并通过高ph值分离与八个部分进行分级。然后,通过数据独立采集(dia)单独处理样品以评估蛋白质组差异。将irt试剂盒(ki3002,biognosys ag,瑞士)添加到所有样品中,以校准提取肽峰的保留时间。使用spectronaut 13(biognosys ag,switzerland)对dia数据集进行统计分析,包括数据标准化和相对蛋白质定量。在经welch’s anova检验后,通过调整p值《0.05和倍数变化》1.5的阈值选择差异表达的蛋白质。
65.9.免疫组织化学
66.按照先前面描述的方案(参见:zheng,p.,s.sun,j.wang,z.j.cheng,k.c.lei,m.xue,t.zhang,h.huang,x.d.zhang,and b.sun.2022.'integrative omics analysis identifies biomarkers of idiopathic pulmonary fibrosis',cell mol life sci,79:66.)制备从ipf患者和健康供体收集的组织切片。切片加入一抗(兔抗人trim29,santa cruz biotechnology,inc.),4℃湿盒孵育过夜。洗涤和振摇后,将组织切片与二抗(抗兔,武汉服务生物科技有限公司)在室温下孵育50分钟。组织用3,3
’‑
二氨基联苯胺(dab)显色溶液染色,细胞核用苏木精染色溶液复染。染色的载玻片由e100观察,图像由nikonds-u3相机采集。
67.实施例1
68.本实施例检测异构体和可变剪接事件。
69.使用fmlrc-hisat2-idp策略,我们检测到来自9,009个基因的13,382个转录本,其中包括1,0475个蛋白质编码转录本和2,887个非编码转录本。其中,6069个(67.4%)基因只有一个转录本,2940个(32.6%)基因转录两个或多个转录本(图1a)。这些转录变体来自相同亚型的as或来自相同基因的不同亚型(图1b)。在检测到的基因和转录本中,在1,942个基
因中鉴定了2776个可变剪接事件,其中,1506个基因(77.5%)有1个as事件,241个基因(12.4%)有2个as事件,195个基因(10%)有2个以上的as事件(图1c)。在转录变体中检测到的2,776个as事件中,最常见的as类型是外显子跳跃(se)(40%),其次是可变第一外显子(af)和5’/3’剪接位点改变(a5,a3)(图1d)。这四种剪接方法占所有剪接事件的91.6%。
70.实施例2
71.本实施例进行差异剪接分析。
72.首先在基因水平上分析了两组之间的差异剪接(ds)。我们计算了每个样本的1,151个基因中检测到的1,427个可变剪接事件的psi值。30个as事件的psi值在ipf组和对照组之间存在显着差异(p《0.05)。ma图和火山图(图2a和图2b)显示psi差异、转录本丰度和p值的分布。与其他基因相比,显着的ds基因具有更高的psi差异和转录本丰度。所有样本中重要ds基因的psi聚类热图如图2c所示。
73.然后在亚型水平分析了两组之间的差异剪接。我们计算了来自每个样本的7,979个基因的9,903个同种型中as事件的psi值。来自226个基因的458种亚型的psi值在ipf组和对照组之间存在显着差异(p《0.05)。ma图和火山图(图2d和图2e)显示psi差异、转录本丰度和p值的分布。重要同工型psi的聚类热图显示ifp和对照样本中的不同模式(图2f)。
74.实施例3
75.本实施例寻找和ipf相关的特异性同工型。
76.本实施例联合分析了从相同样本中检测到的as事件、转录组和蛋白质组数据集,以确定与ipf发病机制相关的可能同种型。维恩图显示了在三个组学实验中检测到的基因(图3a)。smrt和二代测序均检测到8,586个基因的表达。在smrt测序和蛋白质组学中检测到2,882个基因,在所有三个组学中检测到2,859个基因。
77.然后我们鉴定了具有显着差异转录表达和蛋白质翻译的as基因(图3b)。包括trim29在内的12检测到as事件的基因在转录和翻译中具有显着的差异表达。trim29在ipf肺组织中具有显着不同的psi,同时其转录和蛋白质翻译也具有显着的差异(图3c)。
78.为了进一步验证这些候选基因的表达,我们用公共数据库的91个ipf转录组数据对这12个基因的表达差异进行验证。结果表明,12个基因中有11个在ipf肺组织具有显着的差异表达(调整后的p值《0.05)。
79.在研究了这些候选基因的已知生物学功能后,选择trim29作为候选ipf相关基因进行进一步验证和功能研究。trim29(tripartite motif containing 29)是一个蛋白质编译基因,它参与与核酸结合有关的同源或异源二聚体的形成。trim29通过ifnγ信号通路、造血干细胞分化和p53结合等途径调节与癌变和细胞分化相关的转录。虽然没有直接证据表明trim29与ipf相关,但它已经在与ipf具有相似特征的病理过程中显示出影响。trim29是各种癌症的独立预后指标,例如非小细胞肺癌,可促进癌症转移和上皮间质转化。
80.实施例4
81.本实施例分析trim29转录本enst00000341846的表达特征。
82.为了评估trim29转录本enst00000341846在ipf中的表达特征,本实施例分析了它的as事件、rna转录、蛋白质定量及其在肺细胞中的亚细胞表达。在转录阶段,ipf组enst00000341846的表达水平显著升高(图4)。在蛋白质组学实验中,由enst00000341846翻译的蛋白质ensp00000343129仅在ipf组织中检测到(图5)。对trim29的免疫组织化学(ihc)
染色(图6)显示ipf组织中的亚细胞表达,在健康组织中,没有观察到染色区域。在ipf组织的纤维化区,肺泡周围的细胞胞浆中可见表达区。
83.psi和丰度之间的相关性表明,对于enst00000341846,psi指数与转录本的tpm呈正相关。正常组织中的af剪接可能会减少enst00000341846的编码能力mrna的产生,并最终导致无法检测到的蛋白质翻译。而在ipf患者的肺组织中,选择性剪接更有利于产生大量具有编码能力的mrna。此后,高在ipf中高表达的ensp00000343129蛋白最终可能通过emt参与ipf的进程,加重患者的纤维化症状。
84.综上所述,本发明对特发性肺纤维化(ifp)肺组织进行第三代单分子实时rna测序和第二代rna测序,首次发现转录本enst00000341846和蛋白ensp00000343129的表达水平在ifp肺组织和正常肺组织中的表达水平存在显著差异,通过对血液等样本中的转录本enst00000341846和蛋白ensp00000343129的测定,可能准确有效的检测特发性肺纤维化,相比常规的高分辨ct和组织活检,本发明方法有着方便快捷,减少病人创伤,提高依从性等优点。
85.申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献