一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种毛竹变型SNP引物开发的方法与流程

2022-03-01 21:27:00 来源:中国专利 TAG:

一种毛竹变型snp引物开发的方法
技术领域
1.本发明属于分子生物学领域,具体涉及一种毛竹变型snp检测及其引物开发。


背景技术:

2.毛竹(phyllostachys edulis)是禾本科(gramminales)竹亚科(bambusoideae)刚竹属(phyllostachys) 散生竹种,是我国特有的、栽培面积最广、利用历史悠久的重要经济竹种。毛竹分布广泛,跨越北、中、 南三种亚热带气候,在长期适应不同的生长环境、栽培经营以及自身发生遗传漂移等过程中,发生了一系 列的形态变异,在天然毛竹林中已经发现20多个毛竹变型。为研究这些形态的差异,究竟是因为基因变 异而导致的可遗传变异还是由于生境不同而产生的表型可塑性,就非常有必要在基因水平上揭示毛竹的遗 传多样性和变异程度。因此,对毛竹变型开展鉴定研究,对于毛竹种质资源筛查和种质创新具有重要的现 实意义。
3.dna是生物体的主要遗传物质,携带有生物个体的完整的遗传信息和物种个体间的差异信息,且个 体间的dna差异可以稳定遗传,受外界条件的干扰较少。随着生物技术的发展,分子标记被开发出来用 于鉴定同种内不同个体间的差异。dna指纹图谱标记由少数具有较强代表性的标记构成,这些标记组合 可以对同种内的不同材料进行区分,结果稳定,鉴定方便,因此在植物物种质资源多样性研究、品种产权 确定和保护等方面广泛应用。dna分子标记主要包括限制性内切酶片段长度多态性(restriction fragmentlength polymorphism,rflp)、扩增片段多态性(amplifined fragment length polymorphism,aflp)、简单重复 序列(simple sequence repeat,ssr)和单核苷酸多态性(single nucleotide polymorphism,snp)等,这些分子标记 主要具有以下优点:不受环境季节影响,稳定性高;数量多、分布广;多态性高,自然材料存在丰富的变 异;多数标记表现为共显性,能够鉴定出纯合和杂合基因型,为育种材料的选择和鉴定提供了极大的便利。 snp是指一物种不同个体在基因组水平上由单个核苷酸变异引起的dna序列多态性,其数量多,分布广 泛,已发展成为第3代基因遗传标记。snp技术分析系统自动化程度高,通量大,速度快,易于建立标准 化操作,可用于分析亲缘关系较近的近缘种及不同基因型的品种,更适合于对复杂性状的遗传分析以及基 于群体的基因识别等方面的研究。基于上述特点,snp研究开始应用到林木等多年生木本植物,并在部分 树种中取得初步进展。竹类植物生活周期长、栽培程度低、基因杂合程度高,构建足够大的近等基因系来 高分辨率地检测qtl非常困难,而snp标记可检测基因内与目的性状关联的特定碱基,但用其它的标记 如aflp和ssr分子标记无法区分。因此,利用snp标记可以研究毛竹变型的遗传变异,而开发snp引 物是进行标记的重要前提。


技术实现要素:

4.为实现上述目的一种毛竹变型snp引物开发的方法本发明所要解决的第一个技术问题是提供了毛竹 变型snp筛选方法和条件,根据snp标记质量高、代表性强、标记的材料
区分度高、在基因组上的特异 性好等特点,对于检测出的snp,主要按照以下条件进行筛选:1.按照深度,保留大于等位5x的snp 位点;2.丢弃质量值(phred quality)小于30的snp位点;3.丢弃基因座上完整位点小于80%的snp; 4.丢弃第二等位基因比例(minor allele frequency,maf)小于20%的snp;5.保留二等位位点;6.保 留长度大于10kb的scaffold上的位点;7.针对有参项目,利用haploviewmega x进行tagsnp筛选。
5.本发明所要解决的第二个技术问题是提供snp引物开发的方法和条件,对于检测出的snp,主要按照 以下条件进行筛选:保留大于等位5x深度、二等位和长度大于10kb的scaffold上的位点,丢弃质量值小 于30、基因座上完整位点小于80%和第二等位基因比例小于20%的snp位点,利用haploviewmega x 软件进行tagsnp筛选。
6.本发明一种毛竹变型snp引物开发的方法,其特征在于,具体包含以下步骤:
7.a.dna提取与基因组测序
8.基因组dna采用改良ctab法提取,将检测合格的毛竹变型样品基因组dna,用超声波方法将dna 进行片段化,然后进行dna片段的纯化、末端修复、在3

端加a、连测序接头,进行琼脂糖凝胶电泳完 成片段大小选择,通过pcr扩增建成测序文库,进行文库的质检,合格文库采用illunima hiseq 2500平台 进行测序,得到原始测序序列(raw reads),对其进行数据过滤,去掉带接头的reads,过滤n含量高(超 过10%)和质量值低(低于10的碱基数超过50%)的reads,得到clean reads,用作后续的信息分析;
9.b.与参考基因组进行比对统计
10.将步骤a重测序得到的测序reads重新定位到毛竹参考基因组上,进行后续的变异分析;
11.运用bwa软件将测序获得的短序列与毛竹的参考基因组(版本:bamboo;下载网址: http://www.bamboogdb.org/page/download.jsp)进行比对,通过samtools flagstat命令对clean reads比对定 位到参考基因组上的位置,然后统计2个样品的测序深度和基因组覆盖度等方面的信息,进行序列变异的 检测;
12.c.snp检测
13.使用gatk软件工具包对样品的snp进行检测,根据参考基因组上clean reads的定位结果,使用 picard软件去重复、gatk软件进行局部重比对和碱基质量值的校正等预处理,然后进行snp和indel的 变异检测;对snp进行严格的过滤,包括:snp cluster过滤(5bp内若有2个snp过滤掉),indel附近5bp 内的s np过滤掉;
14.d.snp注释
15.通过snpeff软件进行snp、indel和sv的注释,根据检测获得的变异位点比对到参考基因组的位置 基因、cds位置等,获得变异位点在基因组的发生区域(基因区、基因间区或cds区等),以及产生的同 义非同义突变等。
16.e.snp筛选
17.根据snp标记质量高、代表性强、标记的材料区分度高、在基因组上的特异性好等特点,对于检测出 的snp,主要按照以下条件进行筛选:(1).按照深度,保留大于等位5x的snp位点;(2).丢弃质量值(phred quality)小于30的snp位点;(3).丢弃基因座上完整位点小于80%的snp;(4).丢弃第二等 位基因比例(minor allele frequency,maf)小于20%的snp;(5).保留二等位位点;(6).保留长度 大于10kb的scaffold上的位点;(7).针对有参项
目,利用haploviewmega x进行tagsnp筛选;
18.f.snp引物开发
19.对于检测出的snp,再主要按照以下条件进行筛选:保留大于等位5x深度、二等位和长度大于10kb的 scaffold上的位点,丢弃质量值小于30、基因座上完整位点小于80%和第二等位基因比例小于20%的snp位 点,利用haploviewmega x软件进行tagsnp筛选。并将参考基因组和样品在该位点的信息展示在序列相应 位置,然后根据序列设计引物。
20.本发明的优点:克服因毛竹生活周期长、栽培程度低以及基因杂合程度高等因素而导致的检测qtl非 常困难等缺点,易于建立标准化操作。开发毛竹snp引物,进而进行snp标记,可用于分析毛竹变型的亲缘 关系和遗传变异,更适合于对复杂性状的遗传分析以及基于群体的基因识别等方面的研究。
附图说明
21.图1中2个圣音竹样品的snp注释图。
具体实施方式
22.下面通过具体的实施例对本发明进一步说明,应当指出,对于本领域的普通技术人员来说,在不脱离 本发明原理的前提下,还可以做出若干变型和改进,这些也应视为属于本发明的保护范围。
23.实施例1
24.毛竹重要变型圣音竹(phyllostachys edulis f.tubaeformis)和返祖圣音竹snp引物开发。
25.实验材料为圣音竹和返祖圣音竹,编号分别为r01和r02,均采自湖南省益阳竹种园。选取刚长出且尚 未展开的嫩叶,液氮速冻后超低温保存。
26.1.圣音竹和返祖圣音竹dna提取与基因组测序
27.基因组dna采用改良ctab法提取。将检测合格的样品基因组dna,用超声波方法将dna进行片 段化,然后进行dna片段的纯化、末端修复、在3

端加a、连测序接头,进行琼脂糖凝胶电泳完成片段 大小选择,通过pcr扩增建成测序文库,进行文库的质检,合格文库采用illunima hiseq 2500平台进行测 序,得到原始测序序列(raw reads),对其进行数据过滤,去掉带接头的reads,过滤n含量高(超过10%) 和质量值低(低于10的碱基数超过50%)的reads,得到clean reads,用作后续的信息分析。
28.2.与毛竹参考基因组进行比对统计
29.将重测序得到的测序reads重新定位到毛竹参考基因组上,进行后续的变异分析。运用bwa软件将测 序获得的短序列与毛竹的参考基因组(版本:bamboo;下载网址: http://www.bamboogdb.org/page/download.jsp)进行比对,通过samtools flagstat命令对clean reads比对定 位到参考基因组上的位置,然后统计2个样品的测序深度和基因组覆盖度等方面的信息,进行序列变异的 检测。
30.3.snp检测
31.使用gatk软件工具包对样品的snp进行检测。根据参考基因组上clean reads的定位结果,使用 picard软件去重复、gatk软件进行局部重比对和碱基质量值的校正等预处
理,然后进行snp和indel的 变异检测。对snp进行严格的过滤,包括:snp cluster过滤(5bp内若有2个snp过滤掉),indel附近5bp 内的s np过滤掉。
32.4.snp注释
33.通过snpeff软件进行snp、indel和sv的注释。根据检测获得的变异位点比对到参考基因组的位置 基因、cds位置等,获得变异位点在基因组的发生区域(基因区、基因间区或cds区等),以及产生的同 义非同义突变等。
34.5.snp筛选
35.根据snp标记质量高、代表性强、标记的材料区分度高、在基因组上的特异性好等特点,对于检测出 的snp,主要按照以下条件进行筛选:1.按照深度,保留大于等位5x的snp位点;2.丢弃质量值(phredquality)小于30的snp位点;3.丢弃基因座上完整位点小于80%的snp;4.丢弃第二等位基因比例(minorallele frequency,maf)小于20%的snp;5.保留二等位位点;6.保留长度大于10kb的scaffold上的位 点;7.针对有参项目,利用haploviewmega x进行tagsnp筛选。
36.6.snp引物开发
37.对于检测出的snp,主要按照以下条件进行筛选:保留大于等位5x深度、二等位和长度大于10kb 的scaffold上的位点,丢弃质量值小于30、基因座上完整位点小于80%和第二等位基因比例小于20%的 snp位点,利用haploviewmega x软件进行tagsnp筛选。
38.分析如下:
39.(1)与参考基因组比对统计
40.圣音竹和返祖圣音竹两个样品通过高通量测序(illunima hiseq 2500等测序平台)得到原始图像数据 文件,经碱基识别分析转化为原始测序序列(raw reads),然后去除带接头的reads,过滤得到clean reads, 分别为83 065 300bp和8 1673 360bp,定位到毛竹参考基因组的占所有clean reads数的百分比分别为98.75% 和98.81%,双端均定位到毛竹参考基因组上并且距离符合测序片段的长度分布的占所有clean reads数的百 分比分别为87.26%和87.86%。样品平均覆盖深度分别为10
×
和9
×
,各深度对应的基因组覆盖比例如表1所 示。
41.表1 2种圣音竹的测序数据统计表
[0042][0043][0044]
(2)snp的检测与注释
[0045]
2.1 snp检测
[0046]
对两个圣音竹的基因组dna进行snp检测,获得snp位点集(表2)。圣音竹和返祖圣音竹获得snp数量 分别为1 591 930和1 553 861,其中转换类型(transition,ti)的snp数
量分别为1 196 090和1 174 884,颠换 类型(transversion,tv)的snp数量分别为395 840和378 977;杂合类型(heterozygosity,het)的snp数量 分别为1 443 633和1 386 016,纯合类型(homozygosity,homo)的snp数量分别为148 297和167 845。转换 /颠换的比值约为3。
[0047]
表2 2种圣音竹snp数据统计表
[0048][0049]
2.2 snp注释
[0050]
运用snpeff软件对两个圣音竹样品全基因组snp进行注释,得到其变异位点在基因组发生的区域或类型。 圣音竹发生在cds区域内的snp共计33 271个,其中,同义突变占比为47.36%,非同义突变占比为 51.44%。返祖圣音竹发生在cds区域内的snp共计32 165个,其中,同义突变占47.79%,非同义突变 占51.08%。
[0051]
(3)snp引物开发
[0052]
3.1将核心位点再次过滤,剩余1000位点左右,提供vcf和list文件,再加上数据库注释信息。
[0053]
将第一次过滤获得的31672个核心snp再次按照scaffold长度、maf(0.1)、完整度(0.8)、等位深度(8) 过滤,最终得到1245个核心snp,转换成list,并添加位点和基因注释。
[0054]
3.2基于过滤后的文件,设计r01和r02样品的snp引物。
[0055]
分别依据r01和r01的snp位点信息提取前后750bp的序列,并将参考基因组和样品在该位点的信息展示 在序列相应位置,格式如下:xxx[ref/样品]xxx,结果分别以.fa格式保存文件,然后根据序列设计引物, 以.xlsx格式保存文件。
[0056]
表3为2个圣音竹样品的部分参考引物r41和r42,如下:
[0057]
[0058]
[0059]
[0060]
[0061]
[0062]
[0063]
[0064]
[0065]
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072]
[0073]
[0074]
[0075]
[0076]
[0077]
[0078]
[0079]
[0080]
[0081]
[0082]
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献