一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图的映射核酸片段的系统和方法与流程

2021-10-27 14:35:00 来源:中国专利 TAG:核酸 映射 片段 引用 组合

技术特征:
1.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:获得具有杂合基因组的物种的单个二倍体或多倍体生物的有向图,其中所述有向图代表所述杂合基因组的全部或部分并且包括一个或多个非线性拓扑组件,其中在所述一个或多个非线性拓扑组件中每个相应的非线性拓扑组件表示相对于一组目标序列的变异,在所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,其中所述对应的第一分支和对应的第二分支中的一个对应于所述目标序列,和通过重叠多个序列读段中的相应序列读段,使用来自单个生物的生物样品的所述多个序列读段形成所述有向图,这些序列读段相对于所述目标序列具有大于百分之十的随机误差,其中重叠的第一序列读段和第二序列之间的突出的量是不受限制的,前提是第一序列读段和第二序列读段之间存在最小的共有区;从电子格式的所述生物样品中获取查询序列,其中所述查询序列是(i)所述多个序列读段中的序列读段,或(ii)由所述多个序列读段形成的支架,其中所述查询序列至少包括所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;以及使用所述有向图形成所述查询序列到所述有向图的映射,并且其中所述查询序列的映射包括(i)第一比对成分到所述有向图的第一部分,(ii)第二比对成分到所述有向图的第二部分,以及(iii)描述所述有向图中所述有向图的第一部分和第二部分之间的关系的路径,其中第一部分和第二部分之一在第一非线性拓扑组件的第一或第二分支中,并且第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。2.根据权利要求1所述的核酸测序方法,其中所述一个或多个非线性拓扑组件中非线性拓扑组件的所述对应的第一分支和第二分支分别代表所述杂合基因组中变异的第一等位基因和第二等位基因。3.根据权利要求1或2所述的核酸测序方法,其中所述查询序列是所述多个序列读段中的序列读段。4.根据权利要求1

3中任一项所述的核酸测序方法,其中所述查询序列是由所述多个序列读段中的两个或更多个序列读段的共有物形成的支架。5.根据权利要求1

4中任一项所述的核酸测序方法,其中所述多个序列读段具有大于10,000个碱基对的平均序列长度。6.根据权利要求1

5中任一项所述的核酸测序方法,其中所述映射为所述查询序列提供在所述目标序列中的起始位置和结束位置,并且其中所述一个或多个程序单独地或共同地进一步包括用于使用序列比对算法以及所述起始位置和所述结束位置将所述查询序列与所述目标序列进行比对的指令。7.根据权利要求1

6中任一项所述的核酸测序方法,其中所述序列比对算法是动态编程全局比对算法、动态编程半全局比对算法或动态编程局部比对算法。8.根据权利要求1

7中任一项所述的核酸测序方法,其中所述有向图代表所述杂合基因组的至少百分之十,并且
所述有向图包括十个或更多个非线性拓扑组件。9.根据权利要求1

8中任一项所述的核酸测序方法,其中所述有向图代表所述杂合基因组的至少百分之五十,并且所述有向图包括二十五个或更多个非线性拓扑组件。10.根据权利要求1

9中任一项所述的核酸测序方法,其中所述有向图包括至少500,000个节点。11.根据权利要求1

10中任一项所述的核酸测序方法,其中所述有向图包括至少100,000个非线性拓扑组件。12.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:通过将从生物体的生物样品获得的多个序列读段映射到物种的目标序列上,为具有杂合基因组的所述物种的单个二倍体或多倍体生物体构建有向图,其中所述多个序列读段相对于所述目标序列共同具有大于百分之十的随机误差,所述有向图代表所述杂合基因组的全部或部分并且包括一个或多个非线性拓扑组件,其中在所述一个或多个非线性拓扑组件中每个相应的非线性拓扑组件表示相对于参考序列的变异,在所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,其中所述对应的第一分支和对应的第二分支中的一个对应于所述目标序列,并且所述对应的第一分支和对应的第二分支中的另一个对应于所述多个序列读段中的一个或多个序列读段中的通过所述映射识别的变异。13.根据权利要求12所述的核酸测序方法,其中所述多个序列读段具有大于10,000个碱基对的平均序列长度。14.根据权利要求12或13所述的核酸测序方法,其中所述映射为所述多个序列读段中的序列读段提供了在所述目标序列中的起始位置和结束位置,并且其中所述一个或多个程序单独地或共同地进一步包括用于使用序列比对算法以及所述序列读段的所述起始位置和所述结束位置将所述序列读段与所述目标序列比对的指令。15.根据权利要求12

14中任一项所述的核酸测序方法,其中所述序列比对算法是动态编程全局比对算法、动态编程半全局比对算法或动态编程局部比对算法。16.根据权利要求12

15中任一项所述的核酸测序方法,其中所述有向图代表所述物种的基因组的至少百分之十。17.根据权利要求12

16中任一项所述的核酸测序方法,其中所述有向图代表所述物种的基因组的至少百分之五十。18.根据权利要求12

17中任一项所述的核酸测序方法,其中所述有向图包括至少500,000个节点。19.根据权利要求12

18中任一项所述的核酸测序方法,其中所述有向图包括至少100,000个非线性拓扑组件。20.一种核酸测序方法,包括:
在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:为具有杂合基因组的物种的单个二倍体或多倍体生物构建单倍群组装图,其中所述单倍群组装图代表所述杂合基因组并包含一个或多个非线性拓扑组件,所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,和所述对应的第一分支和第二分支分别代表对应于所述杂合基因组中的第一同源染色体和第二同源染色体的第一定相单倍群和第二定相单倍群;从以电子格式从所述单个二倍体或多倍体生物获得的生物样品中获得衍生自多个序列读段的单倍群,其中所述单倍群至少包含所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;和使用所述单倍群组装图形成所述单倍群的映射,并且其中所述单倍群的映射包括(i)第一比对成分到所述单倍群组装图的第一部分,(ii)第二比对成分到所述单倍群组装图的第二部分,以及(iii)描述所述单倍群组装图中在所述单倍群组装图的第一部分和第二部分之间的关系的路径,和第一部分和第二部分中的一个在第一非线性拓扑组件的第一或第二分支中,而第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。21.根据权利要求20所述的核酸测序方法,其中所述多个序列读段具有大于10,000个碱基对的平均序列长度。22.根据权利要求20或21所述的核酸测序方法,其中所述映射为所述单倍群提供了在目标序列中的起始位置和结束位置,并且其中所述一个或多个程序单独地或共同地进一步包括用于使用序列比对算法以及所述起始位置和所述结束位置将所述单倍群与所述物种的目标序列比对的指令。23.根据权利要求22所述的核酸测序方法,其中所述序列比对算法是动态编程全局比对算法、动态编程半全局比对算法或动态编程局部比对算法。24.根据权利要求20

23中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之十,并且所述单倍群组装图包括十个或更多非线性拓扑组件。25.根据权利要求20

24中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之五十,并且所述单倍群组装图包括二十五个或更多非线性拓扑组件。26.根据权利要求20

25中任一项所述的核酸测序方法,其中通过重叠所述多个序列读段中的相应序列读段,使用所述多个序列读段形成所述单倍群组装图,其中重叠的第一序列读段和第二序列之间的突出的量是不受限制的,前提是第一和第二序列读段之间存在最小的共有区。27.根据权利要求20

26中任一项所述的核酸测序方法,其中所述单倍群组装图包括至少500,000个节点。28.根据权利要求20

27中任一项所述的核酸测序方法,其中所述单倍群组装图包括至
少100,000个非线性拓扑组件。29.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:为具有杂合基因组的物种的单个二倍体或多倍体生物构建单倍群组装图,其中所述单倍群组装图代表所述杂合基因组并包含一个或多个非线性拓扑组件,所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,和所述对应的第一分支和第二分支分别代表对应于所述杂合基因组中的第一同源染色体和第二同源染色体的第一定相单倍群和第二定相单倍群;从以电子格式从所述单个二倍体或多倍体生物获得的生物样品中获得多个序列读段,其中所述多个序列读段中的第一序列读段至少包含所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;和使用所述单倍群组装图形成所述多个序列读段中每个相应序列读段的映射,并且其中第一序列读段的所述映射被报告为分裂比对,其包括(i)第一比对成分到所述单倍群组装图的第一部分,(ii)第二比对成分到所述单倍群组装图的第二部分,以及(iii)描述所述单倍群组装图中所述单倍群组装图的第一部分和第二部分之间的关系的路径,其中第一部分和第二部分的一个在第一非线性拓扑组件的第一或第二分支中,并且第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。30.根据权利要求29所述的核酸测序方法,其中所述多个序列读段具有大于10,000个碱基对的平均序列长度。31.根据权利要求29或30所述的核酸测序方法,其中所述映射提供了目标序列中相应序列读段的起始位置和结束位置,并且其中所述一个或多个程序单独地或共同地进一步包括用于使用序列比对算法以及所述起始位置和所述结束位置将所述相应序列读段与所述目标序列进行比对的指令。32.根据权利要求31所述的核酸测序方法,其中所述序列比对算法是动态编程全局比对算法、动态编程半全局比对算法或动态编程局部比对算法。33.根据权利要求29

32中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之十,并且所述单倍群组装图包括十个或更多非线性拓扑组件。34.根据权利要求29

33中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之五十,并且所述单倍群组装图包括二十五个或更多非线性拓扑组件。35.根据权利要求29

34中任一项所述的核酸测序方法,其中通过重叠所述多个序列读段中的相应序列读段,使用所述多个序列读段形成所述单倍群组装图,其中重叠的第一序列读段和第二序列之间的突出的量是不受限制的,前提是第一和第二序列读段之间存在最小的共有区。36.根据权利要求29

35中任一项所述的核酸测序方法,其中所述单倍群组装图包括至
少500,000个节点。37.根据权利要求29

36中任一项所述的核酸测序方法,其中所述单倍群组装图包括至少100,000个非线性拓扑组件。38.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:为具有杂合基因组的单个二倍体或多倍体生物构建单倍群组装图,其中所述单倍群组装图代表所述杂合基因组并包含一个或多个非线性拓扑组件,所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,和所述对应的第一分支和第二分支分别代表对应于所述杂合基因组中的第一同源染色体和第二同源染色体的第一定相单倍群和第二定相单倍群;从以电子格式从所述单个二倍体或多倍体生物获得的生物样品中获得多个双端序列读段,其中所述多个双端序列读段中的第一组双端序列读段至少包含所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;和使用所述单倍群组装图形成所述多个双端序列读段中每个相应双端序列读段的映射,其中第一组双端序列读段的映射报告为分裂比对,其包括(i)第一比对成分到代表第一组双端序列读段中的第一序列读段的所述单倍群组装图的第一部分,(ii)第二比对成分到代表第一组双端序列读段中的第二序列读段的所述单倍群组装图的第二部分,以及(iii)描述所述单倍群组装图中所述单倍群组装图的第一部分和第二部分之间的关系的路径,其中第一部分和第二部分的一个在第一非线性拓扑组件的第一或第二分支中,并且第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。39.根据权利要求38所述的核酸测序方法,其中所述映射提供了目标序列中每个相应组的双端序列读段的起始位置和结束位置,并且其中所述一个或多个程序单独地或共同地进一步包括用于使用序列比对算法以及所述起始位置和所述结束位置将每个相应组的双端序列读段与所述目标序列进行比对的指令。40.根据权利要求39所述的核酸测序方法,其中所述序列比对算法是动态编程全局比对算法、动态编程半全局比对算法或动态编程局部比对算法。41.根据权利要求38

40中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之十,并且所述单倍群组装图包括十个或更多非线性拓扑组件。42.根据权利要求38

41中任一项所述的核酸测序方法,其中所述单倍群组装图代表所述杂合基因组的至少百分之五十,并且所述单倍群组装图包括二十五个或更多非线性拓扑组件。43.根据权利要求38

42中任一项所述的核酸测序方法,其中通过重叠所述多个双端序列读段中的相应双端序列读段组,使用所述多个双端序列读段形成所述单倍群组装图,其中重叠的第一组双端序列读段组和第二组双端序列读段组之间的突出的量不受限制,前提是第一组双端序列读段组和第二组双端序列读段组之间存在最小共有区。
44.根据权利要求29

35中任一项所述的核酸测序方法,其中所述单倍群组装图包括至少500,000个节点。45.根据权利要求29

36中任一项所述的核酸测序方法,其中所述单倍群组装图包括至少100,000个非线性拓扑组件。46.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:获得具有环状基因组的物种的图,其中所述图表示所述环状基因组并且包括:指定所述环状基因组是序列的片段线,其中所述序列的开头限定了所述片段线的开头,所述序列的结尾限定了所述片段线的结尾,和表示所述图中的环状边界的边线,所述边线指定所述片段线的结尾连接到所述片段线的开头;从以电子格式从所述物种的生物体获得的生物样品获得多个序列读段,其中所述多个测序读段中的第一序列读段跨越所述环状边界;和使用所述图形成所述多个测序读段中每个测序读段的映射,并且其中第一测序读段的映射被报告为分裂比对,其包括(i)第一比对成分到所述序列的末端部分,(ii)第二比对成分到所述序列的初始部分,和(iii)描述所述图中所述序列的末端部分和所述序列的初始部分之间的关系的路径。47.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:获得具有环状基因组的物种的图,其中所述图表示所述环状基因组并且包括:指定所述环状基因组是序列的片段线,其中所述序列的开头限定了所述片段线的开头,所述序列的结尾限定了所述片段线的结尾,和表示所述图中的环状边界的边线,所述边线指定所述片段线的结尾连接到所述片段线的开头;从以电子格式从所述物种的生物体获得的生物样品获得多个双端测序读段,其中所述多个双端测序读段中的第一组双端测序读段包含所述环状边界;和使用所述图形成所述多个双端序列读段中每个双端测序读段的映射,并且其中第一组双端序列读段的映射报告为分裂比对,其包括(i)第一组双端序列读段中的第一序列读段与所述序列的末端部分的比对,(ii)第一组双端序列读段中的第二序列读段与所述序列的初始部分的比对,和(iii)描述所述图中所述末端部分和所述初始部分之间关系的路径。48.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:获得以电子格式表示物种的生物体的基因组序列的一部分的查询序列,其中所述查询序列包括第一查询部分和第二查询部分;和将所述查询序列映射到所述物种的目标序列,其中所述映射包括将第一查询部分映射到所述目标序列的第一链的第一目标部分和将第二查询部分映射到所述目标序列的第二
链的第二目标部分,其中第一链是第二链的倒位互补,从而形成分裂比对,其包括(i)第一比对成分,其包括第一查询部分与第一链的第一目标部分的比对,(ii)第二比对成分,其包括第二查询部分与第二链的第二目标部分的比对,以及(iii)描述第一目标部分和第二目标部分之间关系的比对路径。49.根据权利要求48所述的核酸测序方法,其中所述查询序列包括第三查询部分,以及所述映射包括将第三查询部分映射到第一链的第三参考部分,并且所述分裂比对还包括第三比对成分,其包含第三查询部分与第一链的第三参考部分的比对,并且所述比对路径进一步描述第一参考部分和第二参考部分与第三参考部分的关系。50.根据权利要求48或49所述的核酸测序方法,其中所述查询序列是从所述生物体的生物样品获得的单一序列读段。51.根据权利要求48

50中任一项所述的核酸测序方法,其中所述查询序列是由从所述生物体的生物样品获得的多个序列读段形成的重叠群。52.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程序,所述一个或多个程序单独或共同包括用于以下的指令:获得环状图,其包括:指定了第一方向的插入序列的第一片段,指定了第一方向的衔接子序列的第二片段,指定了第二方向的插入序列的第三片段,指定了第二方向的衔接子序列的第四片段,将第一片段的末端连接到第二片段的开头的第一边,将第二片段的末端连接到第三片段的开头的第二边,将第三片段的末端连接到第四片段的开头的第三边,和将第四片段的末端连接到第一片段的开头的第四边,其中第二方向是第一方向的反补,以电子格式从生物样品中获得序列读段,其中所述序列读段跨越所述环状图表示的序列;和使用所述图形成所述序列读段的映射,其中所述序列读段的映射报告为所述序列读段中所述插入序列的每个实例的比对。53.根据权利要求52所述的核酸测序方法,其中所述映射还包括所述衔接子序列的每个实例的比对。54.根据权利要求52或53所述的核酸测序方法,其中所述序列读段跨越所述环状图多次。55.根据权利要求54所述的核酸测序方法,其中所述多次是三次或更多次。56.根据权利要求54所述的核酸测序方法,其中所述多次是五次或更多次。57.根据权利要求54所述的核酸测序方法,其中所述多次是二十次或更多次。58.一种核酸测序方法,包括:在包括一个或多个处理器和存储器的计算机系统中,所述存储器存储一个或多个程
序,所述一个或多个程序单独或共同包括用于以下的指令:获得转录组注释,所述注释限定物种的参考序列中多个外显子中每个相应外显子的映射:构建与所述转录组注释对应的图,其中所述图包括:所述物种的所述参考序列,第一片段,所述第一片段代表所述多个外显子中的第一外显子,并包括所述参考序列中第一外显子的5'端和3'端的相应坐标,第二片段,所述第二片段代表所述多个外显子中的第二外显子,并包括所述参考序列中第二外显子的5'端和3'端的相应坐标,和第一外显子的3'端和第二外显子的5'端之间的连接,以电子格式从所述物种的生物体的生物样品获得mrna的序列读段,其中所述序列读段包含第一外显子和第二外显子;和使用所述图形成所述序列读段到所述参考序列的映射。59.根据权利要求58所述的核酸测序方法,其中不在所述序列读段中的第三外显子介于所述参考序列中的第一外显子和第二外显子之间。60.根据权利要求58或59所述的核酸测序方法,其中所述查询序列是从环状rna分子(circrna)获得的,并且所述查询序列中外显子的顺序与其在所述参考序列中的相应顺序不是线性的。61.一种存储在包含用于核酸序列测序的程序指令的计算机可读介质上的可执行软件产品,所述程序指令在至少一个处理器上执行,包括:获得具有杂合基因组的物种的单个二倍体或多倍体生物的有向图,其中所述有向图代表所述杂合基因组的全部或部分并且包括一个或多个非线性拓扑组件,其中在所述一个或多个非线性拓扑组件中每个相应的非线性拓扑组件表示相对于一组目标序列的变异,在所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,其中所述对应的第一分支和对应的第二分支中的一个对应于所述目标序列,和通过重叠多个序列读段中的相应序列读段,使用来自单个生物的生物样品的所述多个序列读段形成所述有向图,这些序列读段相对于所述目标序列具有大于百分之十的随机误差,其中重叠的第一序列读段和第二序列之间的突出的量是不受限制的,前提是第一序列读段和第二序列读段之间存在最小的共有区;从电子格式的所述生物样品中获取查询序列,其中所述查询序列是(i)所述多个序列读段中的序列读段,或(ii)由所述多个序列读段形成的支架,其中所述查询序列至少包括所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;以及使用所述有向图形成所述查询序列到所述有向图的映射,并且其中所述查询序列的映射包括(i)第一比对成分到所述有向图的第一部分,(ii)第二比对成分到所述有向图的第二部分,以及(iii)描述所述有向图中所述有向图的第一部分和第二部分之间的关系的路径,其中第一部分和第二部分之一在第一非线性拓扑组件的第一或第二分支中,并且第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。
62.一种核酸测序系统,包括:存储器;以及耦合到所述存储器的处理器,其被配置为:获得具有杂合基因组的物种的单个二倍体或多倍体生物的有向图,其中所述有向图代表所述杂合基因组的全部或部分并且包括一个或多个非线性拓扑组件,其中在所述一个或多个非线性拓扑组件中每个相应的非线性拓扑组件表示相对于一组目标序列的变异,在所述一个或多个非线性拓扑组件中的每个相应的非线性拓扑组件具有对应的起始节点和对应的终止节点,所述起始节点和终止节点至少由对应的第一分支和对应的第二分支连接,其中所述对应的第一分支和对应的第二分支中的一个对应于所述目标序列,和通过重叠多个序列读段中的相应序列读段,使用来自单个生物的生物样品的所述多个序列读段形成所述有向图,这些序列读段相对于所述目标序列具有大于百分之十的随机误差,其中重叠的第一序列读段和第二序列之间的突出的量是不受限制的,前提是第一序列读段和第二序列读段之间存在最小的共有区;从电子格式的所述生物样品中获取查询序列,其中所述查询序列是(i)所述多个序列读段中的序列读段,或(ii)由所述多个序列读段形成的支架,其中所述查询序列至少包括所述一个或多个非线性拓扑组件中的第一非线性拓扑组件的所述对应的起始节点或所述对应的终止节点;以及使用所述有向图形成所述查询序列到所述有向图的映射,并且其中所述查询序列的映射包括(i)第一比对成分到所述有向图的第一部分,(ii)第二比对成分到所述有向图的第二部分,以及(iii)描述所述有向图中所述有向图的第一部分和第二部分之间的关系的路径,其中第一部分和第二部分之一在第一非线性拓扑组件的第一或第二分支中,并且第一部分和第二部分中的另一个不在第一非线性拓扑组件的分支中。

技术总结
提供了将长核酸序列读段映射到目标序列的技术方案。对于具有杂合基因组的生物体,获得表示全部或一些基因组并包含一个或多个非线性拓扑组件的有向图。每个非线性拓扑组件具有至少由第一分支和第二分支连接的起始节点和终止节点。这些分支之一对应于目标序列。有向图使用来自生物体的生物样品的多个序列读段。序列读段重叠一不受限制的突出量,前提是每两个序列读段之间存在最小的共有区。获得至少包含第一非线性拓扑组件的起始节点或终止节点的查询序列。有向图用于形成查询序列到有向图的映射。向图的映射。向图的映射。


技术研发人员:I
受保护的技术使用者:加利福尼亚太平洋生物科学股份有限公司
技术研发日:2020.01.24
技术公布日:2021/10/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜