一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种仿刺参抗高温育种低密度12KSNP芯片及应用的制作方法

2021-11-24 21:19:00 来源:中国专利 TAG:

600k snpgenotyping array for chicken[j].biomed central,2013,14(1).),但对仿刺参等养殖品种仍然缺乏成熟的商业化芯片(shikai liu,luyang sun,yunli,fanyue sun,yanliang jiang,yu zhang,jiaren zhang,jianbinfeng,ludmilla kaltenboeck,huseyin kucuktas,zhanjiang liu. development of the catfish 250k snp array for genome

wide associationstudies[j].biomed central,2014,7(1).),定制费用较为昂贵,且固相芯片难以满足位点灵活选择的应用需求。3,hd

marker技术是基于液相分子杂交的基因分型技术。该技术通过在单个pcr管内的高集成度探针杂交

延伸
‑ꢀ
连接反应,实现对多达上万个已知基因变异位点进行高通量筛查和分析相比固相芯片平台,由于hd

marker是基于引物池的方式进行芯片的合成,可根据实际研究需求增减位点,具有更高的使用灵活性。该技术将液相杂交反应的位点选择灵活性和高通量测序平台通量高、成本低的优势有效地结合,突破了目前固相定制芯片平台费用高昂、灵活性差、难于大规模应用等技术瓶颈,为非模式生物提供了一种兼容不同通量级别、不同标记类型的高效灵活的靶向基因分型技术。(lv j,jiao w,guo h,et al.hd

marker:a highlymultiplexed and flexible approach for targeted genotyping of more than10,000genes in a single

tube assay.genome research,2018,28(12): 1919

1930.zhu x,wang j,lv j,et al.sequencing

basedtranscriptome

wide targeted genotyping for evolutionary andecological studies.evolutionary bioinformatics,2019, 15(1176934319836074.)由于hd

marker在靶向精准性、灵活性、和成本等具有明显的优势,在仿刺参分子育种研究中是一种具有应用潜力的高通量标记检测技术。
[0004]
考虑到不同密度芯片的性价比,针对某个经济性状设计的低密度snp芯片是当今普遍选择的方法。这种策略是针对不同的snp芯片必须针对不同的性状进行设计,因为选定的snp会因不同的经济性状而异。这种方法的一个主要缺点是,由于使用有限的数据而导致预测精度的损失用于基因组预测的单核苷酸多态性数量可能相当大。事实上,针对性状不同低密度snp芯片的效率主要取决于连锁不平衡在估计效应较大的snp与影响个体性状的基因座之间的连锁不平衡大小。第二种策略是选择具有近似在基因组上等间距分布,且次等位基因频率(mafs)尽量是多态分布的snps,并把与多个经济性状显著关联的snp位点增加到snp芯片中;然后将低密度基因型填充到中等密度或高密度snp基因芯片,进行基因组预测分子育种。本专利采用的是第二种策略。
[0005]
仿刺参的生理活动随水温的变化而发生改变。仿刺参的适宜生长温度主要在10

20℃的范围内,其中最适生长温度为15

18℃。夏眠(aestivation) 是仿刺参的一个重要的生物学特征(廖玉麟.中国动物志:棘皮动物门.仿刺参纲[m].科学出版社,1997.),通常在水温较高,即当所处水体温度达到18℃时,仿刺参的摄食及运动会开始有所降低;当水温达到20℃以上时,仿刺参的生活会发生改变,它们会选择移动到水深较深处的礁石中间,摄食量和运动量会降低到很低的水平,甚至停止进食和运动,进入夏眠的状态(fli等,1996)。夏眠是仿刺参的一个标志性的生物学特性,是个体为适应高温环境而产生的一种维持基本生存的自我保护性应激活动(f li等,1996;yliu等,1996)。在夏眠过程中,仿刺参的摄食量减少、运动量锐减,由于夏眠期间的仿刺参几乎不进食,所以消化道会慢慢排空变透明并且消化道退化成细线状、体重呈零增长甚至负增长、代谢水平降低、个体组成也会发生变化、部分个体的消化道和生殖腺会退化甚至消失(k mitsukuri,1903;n sloan, 1985)。
2018年夏季,辽宁多地持续高温,局部地区最高气温甚至突破了40 摄氏度,使得仿刺参养殖产业遭遇了前所未有的打击。辽宁省海洋渔业厅透露,全省仿刺参养殖面积184.4万亩,其中池塘养殖面积98.5万亩。目前初步统计,仿刺参受灾损失面积95万亩,损失产量6.8万吨,直接经济损失68.7 亿元人民币。
[0006]
对于温度等环境变化的敏感,严重影响了仿刺参养殖业的发展,更带来了巨大的经济损失。针对这一问题,以改良种质资源为目的的分子生物学手段在棘皮动物中应用的需求显得尤为重要和急迫。找到仿刺参相关抗逆性状的基因,利用经济高效的基因芯片技术实现仿刺参种质改良,实现更高的经济效益,申请人设计了这款芯片。


技术实现要素:

[0007]
本发明的目的就在于snp芯片技术一直以来是经济养殖动物或农作物研究中靶位点分型便捷高效的工具,但是在仿刺参等非模式生物中尚未有可用的商业化snp芯片。为开展仿刺参抗逆性状选择等相关遗传育种工作提供可靠的技术平台,促进我国水产养殖业的发展,同时也为其他水产生物的芯片的设计和开发提供初步的理论参考和方法指导。本研究对仿刺参杂交家系子一代个体进行了高通量的snp标记的开发,进行了抗逆性状的精细定位。初步设计和开发了包含12k位点数目的基因芯片,以期为研究人员开展仿刺参的育种工作提供高效可靠的技术手段,方便便捷,快速,且经济的实现刺参抗高温性状的选育,减少养殖户的损失,带来更大的经济效益。
[0008]
本发明提供了一种仿刺参抗高温育种低密度12k snp芯片,所述的snp芯片包括用于仿刺参抗高温性状育种的snp标记组合以及用于仿刺参育种的液相育种芯片,所述用于仿刺参抗高温性状育种的snp标记组合,由11051个snp位点组成,snp所在核苷酸序列分别为seq id no.001

seq id no.11051 所示序列,长度为11bp,所述用于仿刺参育种的液相育种芯片,由11051对探针序列,每个snp位点对应两条探针序列,分别为forward探针和reverse 探针。
[0009]
本发明同时提供了一种仿刺参抗高温育种低密度12k snp芯片的制备方法以及该芯片相关的应用,具体包括一种仿刺参抗高温育种低密度12k snp 芯片在不同群体仿刺参的遗传背景分析中的应用,仿刺参抗高温性状相关基因组育种芯片snp位点填充准确率评价的应用,一种仿刺参抗高温育种低密度12k snp芯片在抗高温性状的全基因组选择育种值分析中的应用。
[0010]
一种仿刺参抗高温育种低密度12k snp芯片的制备方法,包括以下步骤:
[0011]
1、构建仿刺参抗高温群体
[0012]

2018年辽宁、山东多地持续高温,海水温度超过30度超过20多天,造成了仿刺参大量死亡,挑选存活率高的群体进行选育,组成抗高温群体。
[0013]

在普通仿刺参群体随机挑选100只为对照组,与抗高温群体随机挑选 100只为实验组,模拟高温天气,控制海水温度18度开始,每天增加1度,增加到32度保持,进行生存分析实验。利用生存分析cox回归模型,在考虑体重、年龄、盐度、ph、地域群体的综合因素下,对个体生存时间和温度回归分析,并估计个体生存概率做为抗高温表型。
[0014]

挑选抗高温群体与对照组部分个体,利用高通量转录组技术,筛选仿刺参抗高温相关关键基因与相关通路,并利用分子生物技术提取抗高温相关基因。
[0015]
2、全基因组范围的snp分型
[0016]
2.1dna提取
[0017]

在1.5ml的管中加入500ul ste裂解缓冲液(100mm nacl;10mm tris

cl, ph8.0;1mm edta,ph8.0),50ul 10%sds,3.5ul蛋白酶k(20mg/ml),16ulrnase a(100mg/ml),取扇贝闭壳肌约0.1克,加入,剪碎,研磨棒研磨,研磨至絮状,56℃处理约2h,期间每隔30mins颠倒混匀一次,最终裂解液澄清状态。
[0018]

加入500ul的tris饱和酚,100ul氯仿/异戊醇(24:1),轻轻晃动 20min,室温12000rpm离心10分钟。
[0019]

抽取上清液至新的1.5ml的ep管中,加入300ultris饱和酚,300ul 氯仿/异戊醇(24:1),轻轻晃动20mins,室温12000rpm离心10分钟。
[0020]

重复步骤(3)两至三遍,直至无蛋白层为止。
[0021]

抽取上清,加入等体积氯仿/异戊醇,约500ul,轻轻晃动20min,室温8000rpm,常温离心10分钟。
[0022]

取上清加入1ml的冰无水乙醇,50ul醋酸钠(3m),

20℃放置40min, 12000rpm离心10min,使核酸沉淀。
[0023]

弃上清,70%乙醇洗涤沉淀2次,每次8000rpm低温离心5min。
[0024]

干燥至乙醇全部挥发,加入30ul ddh2o溶解,再加0.75ul rnase于 37℃消化rna 1.5h。
[0025]

利用qubit试剂盒进行对dna进行定量,1%琼脂糖凝胶电泳检测dna 质量。提取的dna放置在

20℃保存备用。
[0026]
2.2建库及测序
[0027]
利用covaris破碎仪将提取的仿刺参基因组dna进行打断处理,打断范围设置在350bp左右,利用基因组dna建库试剂盒进行dna片段的末端修复加a,然后两端连接上接头后进行扩增,利用带有barcode的引物进行文库扩增,完成文库的构建。利用qubit 2.0进行文库定量。寄送至测序公司对文库的插入片段大小及文库的有效浓度进行定量,质检合格后在illumina hiseqx ten pe150平台进行测序。
[0028]
2.3重测序数据处理及比对分型
[0029]

参考基因组建立索引
[0030]
使用bwa软件的index命令、samtools的index命令、picard的 createsequencedictionary.jar构建参考序列的索引。
[0031]

序列比对
[0032]
利用bwa

mem命令将双末端测序reads进行比对,生成bam文件,利用 samtools的sort命令进行排序,生成排序的bam文件。
[0033]

去除pcr duplicate
[0034]
由于pcr过程中可能产生的偏好性,某些位置的片段会被过度扩增,从而使该位置上有大量冗余序列,造成分型的错误,因此要去除这些pcrduplicate,消除由于pcr实验过程中产生的假阳性序列。利用picardmarkduplicates.jar命令,通过设置参数remove_duplicates=true来丢弃 duplicated序列。
[0035]

建立bam文件的索引
[0036]
利用samtools index对每个个体生成的bam文件建立索引,为后续gatk 流程做好文件准备。
[0037]

gatk分型
[0038]
使用gatk软件中适用于群体变异检测的haplotypecaller模块对所有的样本进行变异检测,该方法首先使每样本生成一个gvcf文件,然后再进行群体的joint

genotype,依据群体的变异信息校正个体的变异和基因型数据。
[0039]
3、仿刺参12k snp标记筛选
[0040]
3.1snp标记初步过滤
[0041]
按照下述步骤对生成的原始变异位点依次进行过滤,生成高质量的snp 数据集。
[0042]

挑选出二态性snp位点
[0043]

过滤掉snp过于密集的区域,即10bp window内超过3的snp位点(bowen et al.,2011)
[0044]

根据官网推荐的hard filtering的过滤参数,过滤掉低质量snp位点,即qd<2.0,fs>20.0,mq<40.0,dp<6.0,dp>1000.0,mqranksum<

12.5, readposranksum<

8.0。
[0045]

过滤最小等位基因小于0.05的位点。
[0046]

最后得到高质量967万snp,进行下一步低密度snp选择。
[0047]
3.2snp标记优化选择
[0048]
估计动物个体分子育种可靠的遗传参数,需要进一步在初步过滤的snp 中筛选一组适用的snp。一般需要两个条件:第一,筛选的snp是该物种不同地理群体共有的snp;第二,挑选的snp具有较高的信息含量,可以对个体 snp基因效应及育种值进行准确评估。
[0049]

筛选出不同群体共有snp,然后在这些共有snp中减少或删除处于高连锁不平衡的snp,我们采用ld的r2>0.35作为删除snp尺度,结果表明在保持snp育种参数估计准确性的前提下,使用这个尺度来筛选snp,可以明显降低所需snp标记的数目。
[0050]

筛选高信息量的snp可以依据不同的统计指标,根据wright的fst、 snp基因频率的平均欧式距离、信息熵等综合指标,构建具有约束条件下snp 选择最优化模型,利用r软件优化求解包,获得snp基因频率含有高信息量 snp,且snp能较均匀分布基因组上。
[0051]

根据转录组筛选仿刺参抗高温相关关键基因与相关通路,挖掘有抗高温相关snp位点1015个,在基因组层面上,利用gwas关联分析,对抗高温组和对照组进行gwas分析,并p<0.05得到抗高温相关显著的snp位点967 个。
[0052]

使用snpeff软件对高质量的snp进行注释,确定snp所在的基因元件,及对氨基酸的变化影响等。
[0053]
最后,选择后snp总数控制到1.2万个标记左右。
[0054]
4、hd

marker高密度芯片的设计和开发探针设计
[0055]
4.1靶向性探针的设计和筛选
[0056]
根据hd

marker探针池的设计思路,选择snp位点上游22bp的碱基序列及下游22bp序列作为位点的特异探针。按照以下hd

marker探针设计原则进行侧翼探针的设计和评估:
[0057]
·
侧翼探针序列需要满足gc含量在40%

60%之间
[0058]
·
tm值在55~65℃之间,
[0059]
·
侧翼探针内不能有超过5个连续碱基的区域
[0060]
·
侧翼序列匹配度在80%以上的区域不能大于5处
[0061]
·
探针侧翼序列内的变异位点个数不超过3个。
[0062]
最终符合设计标准的位点数目为11051个,对通过设计标准的位点信息进行整合,形成了一个包含位点信息、探针序列以及注释信息的hd

marker 液相芯片池。芯片上来源于基因区上的位点4722个,覆盖的基因数目为5150 个,基因间区的位点为5571个。
[0063]
仿刺参液相芯片上的位点分布
[0064][0065]
4.2探针池的序列合成
[0066]
为使后续的pcr扩增中有引物结合的靶位点,将上游探针的5’端和下游探针的3’端都分别连接一段22bp的illumina平台测序通用的引物序列,形成forward探针和reverse探针。
[0067]
以illumina测序平台为例,侧翼杂交探针forward的结构为: cctacacgacgctcttccgatctxxxxxxxxxxxxxxxxxxxxxx,侧翼杂交探针reverse 的结构为:xxxxxxxxxxxxxxxxxxxxxxagatcggaagagcacacgtctga。其中x和y 代表位点两侧的特异性序列。
[0068]
将所有位点的f探针集合形成一个f探针池,所有位点的r探针集合形成一个r探针池,合成f探针池和r探针池获得12k位点的液相芯片池。
[0069]
4.3仿刺身芯片的检测
[0070]

、仿刺参dna提取:利用天根植物基因组提取试剂盒(rt405

12)提取肌肉组织的基因组dna,
[0071]

、dna样品质量检测:利用1%的琼脂糖凝胶电泳检测dna条带的完整性;用nanodrop微量核酸定量仪检测浓度,将dna浓度调整到100ng/ul.
[0072]

、hd

marker芯片检测:参照hd

marker标准实验流程,制备100个仿刺参dna样品的hd

marker文库。利用qubit4分光光度计检测文库的浓度,在8.9

10.6ng/ul之间,文库浓度均匀,质量符合测序要求。
[0073]

、芯片性能检测分析:
[0074]
液相芯片效能分析:芯片的效能从位点的靶向性、捕获率、准确率及均一性等几个指标进行评价。结果显示,在所有样品中位点的捕获效率均能达到97%以上,分型位点比例均在95%以上,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均能达到在0.96以上。与标准wgs文库数据相比,位点分型准确性也在90%

94%之间。结果表明仿刺参的12k液相芯片具有较好的分型效果。
[0075]
一种仿刺参抗高温育种低密度12k snp芯片的应用,包括下列步骤:
[0076]
1、不同地理群体遗传背景分析:筛选群体分型率大于90%,最小等位基因频率大
于0.05的位点,得到10081个高质量位点的基因型信息10081个,利用分型数据对仿刺参的个体聚类分析
[0077]
2、抗高温性状遗传力估计的应用:将12k芯片通过beagle填充至20k, 24k,针对仿刺参重要经济性状,使用gcta软件的greml法,分别计算12k, 20k,24k密度条件下的snp遗传力估计,进而证明低密度snp用于全基因组选择的可靠性。
[0078]
3、抗高温性状的全基因组选择育种值分析(gs):本研究使用bayes和gblup法分别进行全基因组的育种值估计,得出每个标记的标记效应及每个个体的估计育种值,并通过交叉验证法验证育种值估计的准确性。
[0079]
本发明的有益效果:
[0080]
(1)本发明的液相芯片靶向性好,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均能达到在0.96以上,位点分型准确性高,具有较好的分型效果。
[0081]
(2)本发明可通过筛选群体分型率大于90%,最小等位基因频率大于 0.05的位点,得到10081个高质量位点的基因型信息10081个,并利用分型数据对仿刺参的个体聚类分析,其结果清楚的显示了仿刺参芯片覆盖的snp 位点在仿刺参群体中具有较好的多态性,可以应用于仿刺参材料的遗传背景分析,是一种群体通用的snp芯片。
[0082]
(3)本发明在针对仿刺参重要经济性状使用gcta软件的greml法,分别计算12k,20k,24k密度条件下的snp遗传力估计,三种密度条件下snp 遗传力较高且保持稳定,证明了低密度snp用于全基因组选择的可靠性。
[0083]
(4)本发明使用bayes和gblup法分别进行全基因组的育种值估计,得出每个标记的标记效应及每个个体的估计育种值,并通过交叉验证法验证育种值估计的准确性,确保了12k低密度snp芯片在育种值估计中的良好表现。
[0084]
(5)本发明可为开展仿刺参抗高温性状选择等相关遗传育种工作提供可靠的技术平台,促进我国水产养殖业的发展,同时也为其他水产生物的芯片的设计和开发提供初步的理论参考和方法指导。
附图说明
[0085]
为了易于说明,本发明由下述的具体实施及附图作以详细描述。
[0086]
图1为本发明的仿刺参样本系统进化树;
[0087]
图2为本发明的不同密度snp标记在基因组的分布密度图(a)和次等位基因频率分布密度图(b);
[0088]
图3为本发明中不同snp密度条件下bayes和gblup估计育种值和位点效应的分布;
具体实施方式
[0089]
实施例1:仿刺参全基因组范围的12ksnp芯片的开发
[0090]
1、构建仿刺参抗高温群体
[0091]

2018年辽宁、山东多地持续高温,局部地区最高气温甚至突破了40摄氏度,造成了仿刺参大量死亡,挑选存活率高的群体进行选育,组成抗高温群体。
[0092]

在普通仿刺参群体随机挑选100只为对照组,与抗高温群体随机挑选 100只为实验组,控制海水温度28

30度的高温下,进行生存分析实验。利用生存分析cox回归模型,
在考虑体重、年龄、海水盐度、地域群体的综合因素下,对个体生存时间和温度回归分析,并估计每个个体生存概率。实验表明抗高温群体中的个体生存概率,明显高于普通群体个体。
[0093]

挑选抗高温群体与对照组部分个体,利用高通量转录组技术,筛选仿刺参抗高温相关关键基因与相关通路,并利用分子生物技术提取抗高温相关基因106个。
[0094]
2、全基因组范围的snp分型
[0095]
2.1dna提取
[0096]

在1.5ml的管中加入500ul ste裂解缓冲液(100mm nacl;10mm tris

cl, ph8.0;1mm edta,ph8.0),50ul 10%sds,3.5ul蛋白酶k(20mg/ml),16ulrnase a(100mg/ml),取扇贝闭壳肌约0.1克,加入,剪碎,研磨棒研磨,研磨至絮状,56℃处理约2h,期间每隔30mins颠倒混匀一次,最终裂解液澄清状态。
[0097]

加入500ul的tris饱和酚,100ul氯仿/异戊醇(24:1),轻轻晃动 20min,室温12000rpm离心10分钟。
[0098]

抽取上清液至新的1.5ml的ep管中,加入300ultris饱和酚,300ul 氯仿/异戊醇(24:1),轻轻晃动20mins,室温12000rpm离心10分钟。
[0099]

重复步骤(3)两至三遍,直至无蛋白层为止。
[0100]

抽取上清,加入等体积氯仿/异戊醇,约500ul,轻轻晃动20min,室温8000rpm,常温离心10分钟。
[0101]

取上清加入1ml的冰无水乙醇,50ul醋酸钠(3m),

20℃放置40min, 12000rpm离心10min,使核酸沉淀。
[0102]

弃上清,70%乙醇洗涤沉淀2次,每次8000rpm低温离心5min。
[0103]

干燥至乙醇全部挥发,加入30ul ddh2o溶解,再加0.75ul rnase于 37℃消化rna 1.5h。
[0104]

利用qubit试剂盒进行对dna进行定量,1%琼脂糖凝胶电泳检测dna 质量。提取的dna放置在

20℃保存备用。
[0105]
2.2建库及测序
[0106]
利用covaris破碎仪将提取的仿刺参基因组dna进行打断处理,打断范围设置在350bp左右,利用基因组dna建库试剂盒进行dna片段的末端修复加a,然后两端连接上接头后进行扩增,利用带有barcode的引物进行文库扩增,完成文库的构建。利用qubit 2.0进行文库定量。寄送至测序公司对文库的插入片段大小及文库的有效浓度进行定量,质检合格后在illumina hiseqx ten pe150平台进行测序。
[0107]
2.3重测序数据处理及比对分型
[0108]

参考基因组建立索引
[0109]
使用bwa软件的index命令、samtools的index命令、picard的 createsequencedictionary.jar构建参考序列的索引。
[0110]

序列比对
[0111]
利用bwa

mem命令将双末端测序reads进行比对,生成bam文件,利用 samtools的sort命令进行排序,生成排序的bam文件。
[0112]

去除pcr duplicate
[0113]
由于pcr过程中可能产生的偏好性,某些位置的片段会被过度扩增,从而使该位置
上有大量冗余序列,造成分型的错误,因此要去除这些pcrduplicate,消除由于pcr实验过程中产生的假阳性序列。利用picardmarkduplicates.jar命令,通过设置参数remove_duplicates=true来丢弃 duplicated序列。
[0114]

建立bam文件的索引
[0115]
利用samtools index对每个个体生成的bam文件建立索引,为后续gatk 流程做好文件准备。
[0116]

gatk分型
[0117]
使用gatk软件中适用于群体变异检测的haplotypecaller模块对所有的样本进行变异检测,该方法首先使每样本生成一个gvcf文件,然后再进行群体的joint

genotype,依据群体的变异信息校正个体的变异和基因型数据。
[0118]
3、仿刺参12k snp标记筛选
[0119]
3.1snp标记初步过滤
[0120]
按照下述步骤对生成的原始变异位点依次进行过滤,生成高质量的snp 数据集。
[0121]

挑选出二态性snp位点
[0122]

过滤掉snp过于密集的区域,即10bp window内超过3的snp位点(bowen et al.,2011)
[0123]

根据官网推荐的hard filtering的过滤参数,过滤掉低质量snp位点,即qd<2.0,fs>20.0,mq<40.0,dp<6.0,dp>1000.0,mqranksum<

12.5, readposranksum<

8.0。
[0124]

过滤最小等位基因小于0.05的位点。
[0125]

最后得到高质量967万snp,进行下一步低密度snp选择。
[0126]
3.2snp标记优化选择
[0127]
估计动物个体分子育种可靠的遗传参数,需要进一步在初步过滤的snp 中筛选一组适用的snp。一般需要两个条件:第一,筛选的snp是该物种不同地理群体共有的snp;第二,挑选的snp具有较高的信息含量,可以对个体 snp基因效应及育种值进行准确评估。
[0128]

筛选出不同群体共有snp,然后在这些共有snp中减少或删除处于高连锁不平衡的snp,我们采用ld的r2>0.35作为删除snp尺度,结果表明在保持snp育种参数估计准确性的前提下,使用这个尺度来筛选snp,可以明显降低所需snp标记的数目。
[0129]

筛选高信息量的snp可以依据不同的统计指标,根据wright的fst、 snp基因频率的平均欧式距离、信息熵等综合指标,构建具有约束条件下snp 选择最优化模型,利用r软件优化求解包,获得snp基因频率含有高信息量 snp,且snp能较均匀分布基因组上。
[0130]

根据转录组筛选仿刺参抗高温相关关键基因与相关通路,挖掘有抗高温相关snp位点1015个,在基因组层面上,利用gwas关联分析,对抗高温组和对照组进行gwas分析,并p<0.05得到抗高温相关显著的snp位点967 个。
[0131]

使用snpeff软件对高质量的snp进行注释,确定snp所在的基因元件,及对氨基酸的变化影响等。
[0132]
最后,选择后snp总数控制到1.2万个标记左右。
[0133]
4、hd

marker高密度芯片的设计和开发探针设计
[0134]
4.1靶向性探针的设计和筛选
[0135]
根据hd

marker探针池的设计思路,选择snp位点上游22bp的碱基序列及下游22bp
序列作为位点的特异探针。按照以下hd

marker探针设计原则进行侧翼探针的设计和评估:
[0136]
·
侧翼探针序列需要满足gc含量在40%

60%之间
[0137]
·
tm值在55~65℃之间,
[0138]
·
侧翼探针内不能有超过5个连续碱基的区域
[0139]
·
侧翼序列匹配度在80%以上的区域不能大于5处
[0140]
·
探针侧翼序列内的变异位点个数不超过3个。
[0141]
最终符合设计标准的位点数目为11051个,对通过设计标准的位点信息进行整合,形成了一个包含位点信息、探针序列以及注释信息的hd

marker 液相芯片池。芯片上来源于基因区上的位点4722个,覆盖的基因数目为5150 个,基因间区的位点为5571个。
[0142][0143][0144]
4.2探针池的序列合成
[0145]
为使后续的pcr扩增中有引物结合的靶位点,将上游探针的5’端和下游探针的3’端都分别连接一段22bp的illumina平台测序通用的引物序列,形成forward探针和reverse探针。
[0146]
以illumina测序平台为例,侧翼杂交探针forward的结构为: cctacacgacgctcttccgatctxxxxxxxxxxxxxxxxxxxxxx,侧翼杂交探针reverse 的结构为:xxxxxxxxxxxxxxxxxxxxxxagatcggaagagcacacgtctga。其中x和y 代表位点两侧的特异性序列。
[0147]
将所有位点的f探针集合形成一个f探针池,所有位点的r探针集合形成一个r探针池,合成f探针池和r探针池获得12k位点的液相芯片池。
[0148]
4.4仿刺身芯片的检测
[0149]

、仿刺参dna提取:利用天根植物基因组提取试剂盒(rt405

12)提取肌肉组织的基因组dna,
[0150]

、dna样品质量检测:利用1%的琼脂糖凝胶电泳检测dna条带的完整性;用nanodrop微量核酸定量仪检测浓度,将dna浓度调整到100ng/ul.
[0151]

、hd

marker芯片检测:参照hd

marker标准实验流程,制备100个仿刺参dna样品的hd

marker文库。利用qubit4分光光度计检测文库的浓度,在8.9

10.6ng/ul之间,文库浓度均匀,质量符合测序要求。
[0152]

、芯片性能检测分析:
[0153]
液相芯片效能分析:芯片的效能从位点的靶向性、捕获率、准确率及均一性等几个指标进行评价。结果显示,在所有样品中位点的捕获效率均能达到97%以上,分型位点比例均在95%以上,位点测序深度上具有较高的一致性,重复样品深度一致性的皮尔逊系数均
能达到在0.96以上。与标准wgs文库数据相比,位点分型准确性也在90%

94%之间。结果表明仿刺参的12k液相芯片具有较好的分型效果。
[0154]
实施例2:仿刺参12k snp芯片在分子育种中应用
[0155]
为了验证仿刺参芯片在仿刺参抗高温性状分子育种中应用效果,我们使用12k芯片对来自俄罗斯(30个)、大连(100个)、山东(100个)的样本进行检测,并进行分子育种中:
[0156]
(1)不同地理群体遗传背景分析;(2)抗高温性状遗传力估计的应用; (3)抗高温性状的全基因组选择育种值分析(gs)。
[0157]
1、仿刺参抗高温性状相关基因组育种芯片在不同群体仿刺参的遗传背景分析中的作用:
[0158]
筛选群体分型率大于90%,最小等位基因频率大于0.05的位点,得到 10081个高质量位点的基因型信息10081个,利用分型数据对仿刺参的个体聚类分析,如图1显示,样本主要分成俄罗斯、大连和山东三个群体,系统进化树上的位置清晰,分类明确。该结果显示,仿刺参芯片覆盖的snp位点在仿刺参群体中具有较好的多态性,可以应用于仿刺参材料的遗传背景分析,是一种群体通用的snp芯片。
[0159]
2、仿刺参抗高温性状相关基因组育种芯片snp位点填充准确率评价:
[0160]
将12k芯片通过beagle填充至20k,24k,填充准确性见表1,将12k芯片填充至20k的准确率为85.9%,12k芯片填充至24k的准确率为81.3%,如图2显示,12k,20k,24k snp位点在基因组上大致均匀分布。
[0161]
表1. 12k snp位点填充准确率
[0162]
snp数量20k24k填充准确率0.8590.813
[0163]
针对仿刺参重要经济性状,使用gcta软件的greml法,分别计算12k, 20k,24k密度条件下的snp遗传力估计。基于12k,20k,24k snp位点的snp 遗传力估计值如表2所示,三种密度条件下snp遗传力较高且保持稳定,证明了低密度snp用于全基因组选择的可靠性。
[0164]
表2.仿刺参snp遗传力
[0165]
snp数量12k20k24kh2
±
sd0.320
±
0.130.321
±
0.190.3315
±
0.18
[0166]
3、仿刺参抗高温性状相关基因组育种芯片在抗高温性状的全基因组选择育种值分析中的应用:
[0167]
本研究使用bayes和gblup法分别进行全基因组的育种值估计,得出每个标记的标记效应及每个个体的估计育种值,并通过交叉验证法验证育种值估计的准确性。
[0168]
根据计算得到的个体估计育种值结果(图3),发现不同密度的snp位点条件下,marker效应具有一定差异,但育种值的估计结果具有高度一致性,且两种方法对于估计育种值的求解结果具备较高的相关性(图3),通过交叉验证可见(表3),12k,20k,24k snp条件下,gblup和bayes估计育种值预测能力约在0.4

0.5,展示了12k低密度snp芯片在育种值估计中的良好表现。
[0169]
表3.不同snp密度条件下gblup和bayes估计育种值交叉验证结果
[0170] 12k20k24k
gblup0.498
±
0.0810.512
±
0.0240.52030.034bayes0.483
±
0.0530.510
±
0.0160.53420.030
[0171]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点,本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献