一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于高通量测序和探针富集的鉴定转基因事件的方法与流程

2022-02-21 04:33:55 来源:中国专利 TAG:

技术特征:
1.一种基于高通量测序和探针富集的鉴定转基因事件的方法,其特征在于,所述方法包括以下步骤:得到目标生物体的靶外源基因序列,得到对所述靶外源基因序列的捕获探针;得到所述目标生物体的若干待标识的dna片段和参考基因组序列;对待标识的所述dna片段连接接头序列,得到含接头的所述dna片段;用所述捕获探针对所述含接头的dna片段中的靶外源基因进行捕获与文库构建,得到富集文库;对所述富集文库进行高通量测序,得到高通量测序数据;用所述高通量测序数据中的dna序列分别与所述参考基因组序列和所述靶外源基因进行比对,确定所述靶外源基因插入所述目标生物体基因组上的位置,以鉴定转基因事件。2.根据权利要求1任意一项所述的方法,其特征在于,所述高通量测序包括单末端测序或双末端测序。3.根据权利要求2所述的方法,其特征在于,所述用所述高通量测序数据中的dna序列分别与所述参考基因组序列和所述靶外源基因进行比对,确定所述靶外源基因插入所述目标生物体基因组上的位置包括:若进行所述双末端测序,判定所述高通量测序数据中的双端读序是否包括重叠片段;若是,将含有重叠片段的所述高通量测序数据中的双端读序进行拼接,得到拼接序列;用所述拼接序列分别与所述参考基因组序列和所述靶外源基因序列进行至少一次比对,其中,进行第一比对时,若所述拼接序列的一端与所述靶外源基因序列至少有n1个碱基序列相匹配,得到初步匹配拼接序列;若所述初步匹配拼接序列与所述参考基因组序列至少有n1个碱基序列相匹配,得到第一有效序列;若否,将所述高通量测序数据中的双端读序分别与所述靶外源基因序列和所述参考基因组序列进行至少一次比对,若将所述高通量测序数据中的双端读序的一端与所述靶外源基因序列至少有n3个碱基序列相匹配,另一端与所述参考基因组序列至少有n3个碱基序列相匹配,得到第二有效序列;对所述第一有效序列和所述第二有效序列进行筛选,得到第一目标有效序列,判断所述第一目标有效序列是否具有与所述参考基因组序列匹配及不匹配的交界位点,若是,且若覆盖所述交界位点的序列数目≥n4,将所述交界位点沿上下游各延伸n5 bp,得到靶外源基因在参考基因组中的插入位置和插入方向,其中,n1、n3、n4和n5为正整数,且n1≥30,n3≥30,n4≥5,n5≥20。4.根据权利要求3所述的方法,其特征在于,所述用所述拼接序列分别与所述参考基因组序列和所述靶外源基因序列进行至少一次比对,还包括:进行第二比对时,将所述第一有效序列分别与所述靶外源基因序列和所述参考基因组序列进行比对,判断所述第一有效序列与所述靶外源基因序列有n2个碱基以上的序列相匹配,并与所述参考基因组序列有n2个碱基以上的序列相匹配,得到第三有效序列,其中,n2为正整数,且n2≥30。5.根据权利要求4所述的方法,其特征在于,所述对所述第一有效序列和所述第二有效
序列进行筛选,得到第一目标有效序列包括:对所述第一有效序列进行筛选,若所述第一有效序列与所述靶外源基因序列和所述参考基因组序列相匹配的碱基数目均大于n8bp,若所述第一有效序列与所述靶外源基因序列和所述参考基因组序列的错配的碱基数目均小于n9bp,若所述第一有效序列的测序读长为130-150bp时,所述第一目标有效序列分别与所述靶外源基因序列和所述参考基因组序列的相匹配的碱基数目之和大于80bp;若所述第一有效序列同时与所述靶外源基因序列和所述参考基因组序列相匹配的碱基数目小于10bp,若所述第一有效序列与所述靶外源基因序列和所述参考基因组序列均不相匹配的碱基数目小于n10bp,得到第一目标有效序列;对所述第二有效序列进行筛选,若所述第二有效序列与所述靶外源基因序列和所述参考基因组序列相匹配的碱基数目均大于n8bp,若所述第二有效序列与所述靶外源基因序列和所述参考基因组序列的错配的碱基数目均小于n9bp,若所述第二有效序列的测序读长为130-150bp时,所述第一有效序列与所述靶外源基因序列和所述参考基因组序列的相匹配的碱基数目之和大于80bp;若所述第二有效序列同时与所述靶外源基因序列和所述参考基因组序列相匹配的碱基数目小于10bp,若所述第二有效序列与所述靶外源基因序列和所述参考基因组序列均不相匹配的碱基数目小于n10bp,得到第一目标有效序列;其中,n8、n9和n10为正整数,且n8≥30,n9≤10,n10≤20。6.根据权利要求4所述的方法,其特征在于,所述用所述高通量测序数据中的dna序列分别与所述参考基因组序列和所述靶外源基因进行比对,确定所述靶外源基因插入所述目标生物体基因组上的位置还包括:若进行所述单末端测序,将所述高通量测序数据中的dna序列分别与所述靶外源基因序列和所述参考基因组序列进行第三比对;若所述dna序列一端与所述靶外源基因序列至少有n7个碱基序列相匹配,得到初步匹配读序序列;将所述初步匹配读序序列与所述参考基因组序列进行比对,若所述初步匹配读序序列与所述参考基因组序列至少有n6个碱基相匹配,得到第四有效序列;对所述第四有效序列进行筛选,得到第二目标有效序列;判断所述第二目标有效序列是否具有与所述参考基因组序列匹配及不匹配的交界位点,若是,且覆盖所述交界位点的序列数目≥n4,将所述交界位点沿上下游各延伸n5 bp,得到靶外源基因在参考基因组中的插入位置和插入方向,其中,n6和n7为正整数,且n6≥30,n7≥30。7.根据权利要求1所述的方法,其特征在于,用所述参考基因组序列和所述靶外源基因
序列对所述高通量测序数据进行比对之前,还包括:去除杂质序列。8.根据权利要求7所述的方法,其特征在于,所述去除杂质序列包括:去除所述高通量测序数据中的测序接头;去除不符合预设标准的序列;所述不符合预设标准的序列包括:单端序列3’端含有预设质量碱基数目超过自身序列1/3的序列,所述预设质量碱基为质量值≤20的碱基;去除序列长度小于80bp的序列。9.根据权利要求1所述的方法,其特征在于,所述捕获探针中的鸟嘌呤和胞嘧啶之和所占的摩尔比率为30%-80%;所述捕获探针与非靶标序列具有长度<40bp的相同序列段,且所述捕获探针与非靶标序列的序列同源性小于85%。10.一种基于高通量测序和探针富集的鉴定转基因事件的应用,其特征在于,将权利要求1-9中任意一项所述的方法用于转基因植物、转基因动物和转基因微生物的任意一种。

技术总结
本申请涉及生物信息学技术领域,尤其涉及一种基于高通量测序和探针富集的快速鉴定转基因事件的方法。所述方法包括以下步骤:得到目标生物体的靶外源基因序列、所述靶外源基因序列的捕获探针、若干待标识的DNA片段和参考基因组序列;得到含接头的所述DNA片段;使用所述捕获探针对所述含接头的DNA片段中的靶外源基因进行捕获与文库构建,得到富集文库;对所述富集文库进行高通量测序,得到高通量测序数据;用所述高通量测序数据中的DNA序列分别与所述参考基因组序列和所述靶外源基因进行比对,确定所述靶外源基因插入所述目标生物体基因组上的位置。本方法无需全基因组测序,大大节省了成本,而且可用于转入外源基因或者载体不清楚的转基因材料。不清楚的转基因材料。不清楚的转基因材料。


技术研发人员:陈利红 彭海 李甜甜 周俊飞 高利芬 李论 方治伟 肖华锋
受保护的技术使用者:江汉大学
技术研发日:2021.09.27
技术公布日:2022/1/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献