一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用分子条形码进行准确碱基判定的方法与流程

2022-06-05 21:56:03 来源:中国专利 TAG:

技术特征:
1.一种用于对多个核酸分子进行测序的方法,包括:(a)使用多个条形码分子对来自生物样品的多个核酸分子进行条形码化,以生成包含多个条形码序列的多个条形码化核酸分子;(b)对所述多个条形码化核酸分子进行测序以生成多个测序信号,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;(c)使用对应于所述多个条形码序列的所述信号将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号包括对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的条形码序列不同的条形码序列的信号;(d)处理所述给定组内的所述测序信号以生成一个或多个聚集信号集,其中所述一个或多个聚集信号集不是测序读取;以及(e)将所述一个或多个聚集信号集组合以生成共有序列。2.根据权利要求1所述的方法,其中在(e)中,所述组合包括执行碱基判定以鉴别单个碱基。3.根据权利要求2所述的方法,其中通过对所述一个或多个聚集信号集中的每一个内的聚集信号彼此进行处理以生成所述共有序列来执行所述碱基判定。4.根据权利要求3所述的方法,还包括将所述一个或多个聚集信号集中的每一个内的所述聚集信号彼此平均以生成所述共有序列。5.根据权利要求3所述的方法,还包括对照一参考来处理所述共有序列以鉴别一个或多个遗传变体。6.根据权利要求2所述的方法,其中通过对照一参考信号来对所述一个或多个聚集信号集中的每一个内的聚集信号进行处理以生成所述共有序列来执行所述碱基判定。7.根据权利要求1所述的方法,其中所述多个核酸分子从受试者的身体样品获得。8.根据权利要求1所述的方法,其中所述多个核酸分子包括脱氧核糖核酸(dna)分子。9.根据权利要求8所述的方法,其中所述dna分子包括甲基化dna分子。10.根据权利要求1所述的方法,其中所述多个核酸分子包括核糖核酸(rna)分子。11.根据权利要求1所述的方法,其中在(a)中,所述条形码化包括将所述条形码分子与所述多个核酸分子连接。12.根据权利要求1所述的方法,其中所述多个条形码化核酸分子被非独特地条形码化。13.根据权利要求1所述的方法,其中所述多个条形码分子包括至少约100,000个不同的条形码。14.根据权利要求1所述的方法,其中所述多个条形码分子包含至少2个核苷酸取代的汉明距离。15.根据权利要求1所述的方法,其中所述多个测序信号包括模拟信号。16.根据权利要求1所述的方法,还包括在(c)之前或之后预处理所述多个测序信号以去除系统误差。17.根据权利要求1所述的方法,还包括在(b)之前扩增所述多个条形码化核酸分子。18.根据权利要求17所述的方法,其中所述扩增包括聚合酶链反应(pcr)。19.根据权利要求17所述的方法,其中所述扩增包括重组酶聚合酶扩增(rpa)。
20.根据权利要求1所述的方法,其中通过大规模平行阵列测序生成所述多个测序信号。21.根据权利要求1所述的方法,其中通过流式测序生成所述多个测序信号。22.根据权利要求1所述的方法,其中(c)和(d)与(b)的所述测序实时或接近实时执行。23.根据权利要求22所述的方法,其中(e)与(b)的所述测序实时或接近实时执行。24.一种用于对多个核酸分子进行测序的系统,包括:存储多个测序信号的数据库,所述多个测序信号通过使用多个条形码分子对所述多个核酸分子进行条形码化并对所述多个条形码化核酸分子进行测序来生成,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;以及可操作地耦合到所述数据库的一个或多个计算机处理器,其中所述一个或多个计算机处理器被单独地或共同地编程用于:(a)使用对应于所述多个条形码序列的所述信号将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号包括对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的条形码序列不同的条形码序列的信号;(b)处理所述给定组内的所述测序信号以生成一个或多个聚集信号集,其中所述一个或多个聚集信号集不是测序读取;以及(c)将所述一个或多个聚集信号集组合以生成共有序列。25.一种用于对多个核酸分子进行测序的方法,包括:(a)使用多个条形码分子对来自生物样品的多个核酸分子进行条形码化,以生成包含多个条形码序列的多个条形码化核酸分子;(b)对所述多个条形码化核酸分子进行测序以生成多个测序信号,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;(c)处理对应于所述多个条形码序列的所述信号以鉴别所述多个测序信号中的每一个的所述条形码序列;(d)使用所述鉴别的条形码序列将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的鉴别的条形码序列不同的鉴别的条形码序列;(e)处理所述给定组内的所述测序信号以生成一个或多个聚集信号集,其中所述一个或多个聚集信号集不是测序读取;以及(f)将所述一个或多个聚集信号集组合以生成共有序列。26.根据权利要求25所述的方法,其中在(f)中,所述组合包括执行碱基判定以鉴别单个碱基。27.根据权利要求26所述的方法,其中通过对所述一个或多个聚集信号集中的每一个内的聚集信号彼此进行处理以生成所述共有序列来执行所述碱基判定。28.根据权利要求27所述的方法,其中所述处理包括将所述一个或多个聚集信号集中的每一个内的所述聚集信号彼此平均以生成所述共有序列。29.根据权利要求27所述的方法,还包括对照一参考来处理所述共有序列以鉴别一个或多个遗传变体。30.根据权利要求26所述的方法,其中通过对照一参考信号来对所述一个或多个聚集
信号集中的每一个内的聚集信号进行处理以生成所述共有序列来执行所述碱基判定。31.根据权利要求25所述的方法,其中所述多个核酸分子从受试者的身体样品获得。32.根据权利要求25所述的方法,其中所述多个核酸分子包括脱氧核糖核酸(dna)分子。33.根据权利要求32所述的方法,其中所述dna分子包括甲基化dna分子。34.根据权利要求25所述的方法,其中所述多个核酸分子包括核糖核酸(rna)分子。35.根据权利要求25所述的方法,其中在(a)中,所述条形码化包括将所述条形码分子与所述多个核酸分子连接。36.根据权利要求25所述的方法,其中所述多个条形码化核酸分子被非独特地条形码化。37.根据权利要求25所述的方法,其中所述多个条形码分子包括至少约10万个不同的条形码。38.根据权利要求25所述的方法,其中所述多个条形码分子包含至少2个核苷酸取代的汉明距离。39.根据权利要求25所述的方法,其中所述多个测序信号包括模拟信号。40.根据权利要求25所述的方法,还包括在(d)之前或之后预处理所述多个测序信号以去除系统误差。41.根据权利要求25所述的方法,还包括在(b)之前扩增所述多个条形码化核酸分子。42.根据权利要求41所述的方法,其中所述扩增包括聚合酶链反应(pcr)。43.根据权利要求41所述的方法,其中所述扩增包括重组酶聚合酶扩增(rpa)。44.根据权利要求25所述的方法,其中所述多个测序信号通过大规模平行阵列测序生成。45.根据权利要求25所述的方法,其中所述多个测序信号通过流式测序生成。46.根据权利要求25所述的方法,其中(d)和(e)与(b)的所述测序实时或接近实时执行。47.根据权利要求46所述的方法,其中(f)与(b)的所述测序实时或接近实时执行。48.一种用于对多个核酸分子进行测序的系统,包括:存储多个测序信号的数据库,所述多个测序信号通过使用多个条形码分子对所述多个核酸分子进行条形码化并对所述多个条形码化核酸分子进行测序来生成,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;以及可操作地耦合到所述数据库的一个或多个计算机处理器,其中所述一个或多个计算机处理器被单独地或共同地编程用于:(a)处理对应于所述多个条形码序列的所述信号以鉴别所述多个测序信号中的每一个的所述条形码序列;(b)使用所述鉴别的条形码序列将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的鉴别的条形码序列不同的鉴别的条形码序列;(c)处理所述给定组内的所述测序信号以生成一个或多个聚集信号集,其中所述一个或多个聚集信号集不是测序读取;以及
(d)将所述一个或多个聚集信号集组合以生成共有序列。49.一种用于对多个核酸分子进行测序的方法,包括:(a)使用多个条形码分子对来自生物样品的多个核酸分子进行条形码化,以生成包含多个条形码序列的多个条形码化核酸分子;(b)对所述多个条形码化核酸分子进行测序以生成多个测序信号,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;(c)使用对应于所述多个条形码序列的所述信号将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号包括对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的条形码序列不同的条形码序列的信号;(d)处理所述给定组内的所述测序信号以生成一个或多个估计序列,其中所述一个或多个估计序列中的每一个包含多个估计碱基判定;以及(e)将所述一个或多个估计序列组合以生成共有序列。50.根据权利要求49所述的方法,其中所述一个或多个估计序列包括多个估计序列,并且其中所述共有序列是基于所述多个估计序列中的多数投票而生成的。51.根据权利要求49所述的方法,还包括对照一参考来处理所述共有序列以鉴别一个或多个遗传变体。52.根据权利要求49所述的方法,其中所述多个核酸分子从受试者的身体样品获得。53.根据权利要求49所述的方法,其中所述多个核酸分子包括脱氧核糖核酸(dna)分子。54.根据权利要求53所述的方法,其中所述dna分子包括甲基化dna分子。55.根据权利要求49所述的方法,其中所述多个核酸分子包括核糖核酸(rna)分子。56.根据权利要求49所述的方法,其中在(a)中,所述条形码化包括将所述条形码分子与所述多个核酸分子连接。57.根据权利要求49所述的方法,其中所述多个条形码化核酸分子被非独特地条形码化。58.根据权利要求49所述的方法,其中所述多个条形码分子包括至少约10万个不同的条形码。59.根据权利要求49所述的方法,其中所述多个条形码分子包含至少2个核苷酸取代的汉明距离。60.根据权利要求49所述的方法,其中所述多个测序信号包括模拟信号。61.根据权利要求49所述的方法,还包括在(c)之前或之后预处理所述多个测序信号以去除系统误差。62.根据权利要求49所述的方法,还包括在(b)之前扩增所述多个条形码化核酸分子。63.根据权利要求62所述的方法,其中所述扩增包括聚合酶链反应(pcr)。64.根据权利要求62所述的方法,其中所述扩增包括重组酶聚合酶扩增(rpa)。65.根据权利要求49所述的方法,其中所述多个测序信号通过大规模平行阵列测序生成。66.根据权利要求49所述的方法,其中所述多个测序信号通过流式测序生成。67.根据权利要求49所述的方法,其中(c)和(d)与(b)的所述测序实时或接近实时执
行。68.根据权利要求67所述的方法,其中(e)与(b)的所述测序实时或接近实时执行。69.一种用于对多个核酸分子进行测序的系统,包括:存储多个测序信号的数据库,所述多个测序信号通过使用多个条形码分子对所述多个核酸分子进行条形码化并对所述多个条形码化核酸分子进行测序来生成,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;以及可操作地耦合到所述数据库的一个或多个计算机处理器,其中所述一个或多个计算机处理器被单独地或共同地编程用于:(a)使用对应于所述多个条形码序列的所述信号将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号包括对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的条形码序列不同的条形码序列的信号;(b)处理所述给定组内的所述测序信号以生成一个或多个估计序列,其中所述一个或多个估计序列中的每一个包含多个估计碱基判定;以及(c)将所述一个或多个估计序列组合以生成共有序列。70.一种用于对多个核酸分子进行测序的方法,包括:(a)使用多个条形码分子对来自生物样品的多个核酸分子进行条形码化,以生成包含多个条形码序列的多个条形码化核酸分子;(b)对所述多个条形码化核酸分子进行测序以生成多个测序信号,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;(c)处理对应于所述多个条形码序列的所述信号以鉴别所述多个测序信号中的每一个的所述条形码序列;(d)使用所述鉴别的条形码序列将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的条形码序列不同的鉴别的条形码序列;(e)处理所述给定组内的所述测序信号以生成一个或多个估计序列,其中所述一个或多个估计序列中的每一个包含多个估计碱基判定;以及(f)将所述一个或多个估计序列组合以生成共有序列。71.根据权利要求70所述的方法,其中所述一个或多个估计序列包括多个估计序列,并且其中所述共有序列是基于所述多个估计序列中的多数投票而生成的。72.根据权利要求70所述的方法,还包括对照一参考来处理所述共有序列以鉴别一个或多个遗传变体。73.根据权利要求70所述的方法,其中所述多个核酸分子从受试者的身体样品获得。74.根据权利要求70所述的方法,其中所述多个核酸分子包括脱氧核糖核酸(dna)分子。75.根据权利要求74所述的方法,其中所述dna分子包括甲基化dna分子。76.根据权利要求70所述的方法,其中所述多个核酸分子包括核糖核酸(rna)分子。77.根据权利要求70所述的方法,其中在(a)中,所述条形码化包括将所述条形码分子与所述多个核酸分子连接。78.根据权利要求70所述的方法,其中所述多个条形码化核酸分子被非独特地条形码
化。79.根据权利要求70所述的方法,其中所述多个条形码分子包括至少约10万个不同的条形码。80.根据权利要求70所述的方法,其中所述多个条形码分子包含至少2个核苷酸取代的汉明距离。81.根据权利要求70所述的方法,其中所述多个测序信号包括模拟信号。82.根据权利要求70所述的方法,还包括在(d)之前或之后预处理所述多个测序信号以去除系统误差。83.根据权利要求70所述的方法,还包括在(b)之前扩增所述多个条形码化核酸分子。84.根据权利要求83所述的方法,其中所述扩增包括聚合酶链反应(pcr)。85.根据权利要求83所述的方法,其中所述扩增包括重组酶聚合酶扩增(rpa)。86.根据权利要求70所述的方法,其中所述多个测序信号通过大规模平行阵列测序生成。87.根据权利要求70所述的方法,其中所述多个测序信号通过流式测序生成。88.根据权利要求70所述的方法,其中(d)和(e)与(b)的所述测序实时或接近实时执行。89.根据权利要求67所述的方法,其中(f)与(b)的所述测序实时或接近实时执行。90.一种用于对多个核酸分子进行测序的系统,包括:存储多个测序信号的数据库,所述多个测序信号通过使用多个条形码分子对所述多个核酸分子进行条形码化并对所述多个条形码化核酸分子进行测序来生成,所述多个测序信号包括对应于所述多个条形码序列的信号,其中所述多个测序信号不是测序读取;以及可操作地耦合到所述数据库的一个或多个计算机处理器,其中所述一个或多个计算机处理器被单独地或共同地编程用于:(a)处理对应于所述多个条形码序列的所述信号以鉴别所述多个测序信号中的每一个的所述条形码序列;(b)使用所述鉴别的条形码序列将所述多个测序信号分组成多个组,其中所述多个组中的给定组的测序信号对应于所述多个条形码序列中(i)对于所述给定组是相同的并且(ii)与所述多个组中的其他组的鉴别的条形码序列不同的鉴别的条形码序列;(c)处理所述给定组内的所述测序信号以生成一个或多个估计序列,其中所述一个或多个估计序列中的每一个包含多个估计碱基判定;以及(d)将所述一个或多个估计序列组合以生成共有序列。

技术总结
本公开内容提供了使用分子条形码对序列进行准确碱基判定的方法。用于对核酸分子进行测序的方法可以包括:(a)使用条形码分子对来自样品的核酸分子进行条形码化,以生成包含条形码序列的条形码化核酸分子;(b)对条形码化核酸分子进行测序以生成测序信号,该测序信号包括对应于条形码序列的信号,其中该测序信号不是测序读取;(c)使用对应于条形码序列的信号将测序信号分组成组,其中给定组的测序信号包括对应于(i)对于给定组是相同的并且(ii)与其他组的条形码序列不同的条形码序列的信号;(d)处理给定组内的测序信号以生成聚集信号集,该聚集信号集不是测序读取;以及(e)将该聚集信号集组合以生成共有序列。集信号集组合以生成共有序列。集信号集组合以生成共有序列。


技术研发人员:吉拉德
受保护的技术使用者:阿尔缇玛基因组学公司
技术研发日:2020.06.12
技术公布日:2022/6/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献