一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种mRNA5的制作方法

2022-03-14 04:32:46 来源:中国专利 TAG:

一种mrna 5
’3’
末端差异的快速检测方法
技术领域
1.本发明属于rna测序技术领域,涉及一种mrna5
’3’
末端差异的快速检测方法。


背景技术:

2.rna测序及转录组分析是对生命过程分子机理阐述的有力工具与方法,通过对表达调控网络的系统剖析,为下游医学、农业等生命科学产业提供了基础且丰富的研发数据。mrna是转录组研究的重要对象,其有无、多少直接反映了基因组活跃区域的表达情况,配合样本间的比较分析,可直观建立基因表达与生命体表型的对应关系,有助于从生命根本的核酸分子层面来研究生命的基础过程。
3.mrna测序工作主要集中在定量的差异分析,而在定量之前有两条路径获得用来定量的mrna片段(read或fragment)数,其一是通过已有的基因组注释文件,与已知序列进行比对而获得数据库已有的序列表达量来进行差异分析;其二是在已知mrna片段序列基础上,结合实际测序序列(read),做从头组装。组装结果不仅可以做表达量差异分析,而且可以找到对应实验中潜在的不同转录本(isoform),特异转录本是基因功能或生命过程的研究靶标。
4.针对mrna片段(read)组装,现有cufflinks与stringtie两款常用软件,后者是前者的更新版,在保留前者的基本属性外,stringtie提高了新转录本的检测敏感性,同时运行时间更短。然而敏感性的提高带来诸多不可信的假阳性组装结果,对客观单一阳性结果造成污染;同时当mrna片段(read)覆盖度不高时,该软件依旧认为可信且导出组装结果,以致后续实验组、对照组两两比较时,阳性组装片段被抹去,造成假阴性结果。


技术实现要素:

5.本发明针对现有软件在mrna片段(read)从头组装过程中引入的错误,提供一种简便、高效、高精度的mrna 5
’3’
末端差异的快速检测方法。
6.本发明的技术方案如下:
7.一种mrna 5
’3’
末端差异的快速检测方法,包括以下步骤:
8.步骤1,利用hisat2将对照组与实验组测得的mrna片段(read)比对到grch38参考序列上,通过序列注释信息,选取基因间区的片段进行后续分析;
9.步骤2,利用read间的重叠序列,将read逐一组装在一起,形成基因的5’或3’延长序列;
10.步骤3,根据基因的mrna5’或3’延长序列,形成同种型(isoform)转录本,比较实验组与对照组,如果满足实验组的长度长于对照组的长度200nt以上且fpkm
实验组
/fpkm
对照组
的比值大于等于2的条件,说明实验组与对照组末端差异显著,则提取实验组相对于对照组特有的转录本,作为下游分析数据;如果不满足实验组的长度长于对照组的长度200nt以上且fpkm
实验组
/fpkm
对照组
的比值大于等于2的条件,说明实验组与对照组末端差异不显著,则不进行后续分析。
11.在本发明具体实施方式中,为提高组装序列的可信性,设置fpkm
bin
与fpkm
ext
两个参数,fpkm
bin
代表每个bin单元(选取的序列窗口)read表达量,fpkm
ext
代表延伸总长的read表达量,一般情况下,两者均大于1,结果可信。同时窗口序列长度参数bin可以根据实际操作需要进行人为设定,数值越小,组装结果越精准,但更耗时。在本发明具体实施方式中,窗口序列长度参数bin设置为10nt。
12.与现有技术相比,本发明具有以下优点:
13.本发明有效解决了现有mrna片段组装的错误问题,提高了差异分析的可信性,实现了对实验组特定转录本的快速查找,使转录组数据进一步反应了研究对象的客观真实性。
附图说明
14.图1为本发明的mrna 5
’3’
末端差异的快速检测方法的流程示意图。
15.图2为实施例中生成的实验组与对照组的比较结果图。
具体实施方式
16.下面结合实施例和附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员亦可以认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。
17.实施例1
18.本发明的mrna 5
’3’
末端差异的快速检测方法的流程如图1所示,具体包括如下过程:
19.(1)收集比对到基因间区的单链rna片段(read)
20.下载grch38基因组序列fasta文件以及对应的gtf注释文件,利用hisat2软件,根据注释内容产生外显子与剪切位点文件,通过产生的两份文件建立索引,而后使用hisat2完成比对生成sam文件。比对过程-k参数设置为1,即只保留一个比对最好的位置的对应rna片段。
21.(2)片段(read)组装延长确定实际特有转录本
22.从比对结果中,提取基因间区的片段(read)。设置bin窗口长度为10nt,fpkm
bin
与fpkm
ext
均大于1,然后以片段之间的重叠序列进行逐步组装。组装后得到5’或3’延长序列。对实验组与对照组进行比较,实验组长于对照组的长度设定为200nt以上有效,同时fpkm
实验组
/fpkm
对照组
的比值大于等于2,最后提取实验组相对于对照组特有的转录本,生成结果文件如下及图2。
23.

技术特征:
1.一种mrna 5
’3’
末端差异的快速检测方法,其特征在于,包括以下步骤:步骤1,利用hisat2将对照组与实验组测得的read比对到grch38参考序列上,通过序列注释信息,选取基因间区的片段进行后续分析;步骤2,利用read间的重叠序列,将read逐一组装在一起,形成基因的5’或3’延长序列;步骤3,根据基因的mrna5’或3’延长序列,形成同种型转录本,比较实验组与对照组,如果满足实验组的长度长于对照组的长度200nt以上且fpkm
实验组
/fpkm
对照组
的比值大于等于2的条件,说明实验组与对照组末端差异显著,则提取实验组相对于对照组特有的转录本,作为下游分析数据;如果不满足实验组的长度长于对照组的长度200nt以上且fpkm
实验组
/fpkm
对照组
的比值大于等于2的条件,说明实验组与对照组末端差异不显著,则不进行后续分析。2.根据权利要求1所述的快速检测方法,其特征在于,步骤1中,设置fpkm
bin
与fpkm
ext
两个参数,fpkm
bin
代表每个bin单元read表达量,fpkm
ext
代表延伸总长的read表达量,fpkm
bin
与fpkm
ext
均大于1。3.根据权利要求1所述的快速检测方法,其特征在于,步骤1中,窗口序列长度参数bin设置为10nt。

技术总结
本发明公开了一种mRNA 5


技术研发人员:孙海汐 高峰 顾颖 沈玥
受保护的技术使用者:深圳华大生命科学研究院
技术研发日:2020.09.10
技术公布日:2022/3/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献