一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

单碱基编辑的预测方法、预测装置、编辑方法及编辑装置

2023-02-19 08:24:29 来源:中国专利 TAG:


1.本发明涉及基因编辑结果的预测技术,尤其涉及一种单碱基编辑结果的预测方法、一种单碱基编辑结果的预测装置、一种单碱基编辑方法、一种单碱基编辑装置,以及两种对应的计算机可读存储介质。


背景技术:

2.人类大多数的遗传病都与单个碱基的突变有关,通过精确地对单碱基突变进行修复,能够为治疗遗传性疾病提供新的治疗策略和手段。crispr-cas基因组编辑系统改变了我们在不同物种活细胞中操纵、检测、成像和注释特定dna和rna序列的能力。然而,crispr/cas9系统大部分情况下是通过nhej修复,可能带来碱基的随机插入或缺失,往往不能实现碱基的精确替换。
3.为了在不产生dna双链断裂的情况下对突变的目的位点进行精确地修复,本领域提出了胞嘧啶碱基编辑器(cbes)、腺嘌呤碱基编辑器(abes)等多种单碱基编辑器,其中,cbes介导c/g碱基对转化成t/a碱基对,abes介导a/t转化为g/c。迄今为止,cbes和abes已开发多个变体版本,如:aid-be3、be4max和abe8e,能够进一步提高单碱基编辑器的效率、精度并扩大适用范围。
4.然而,由于现有的各版编辑器只能在有限的体内位点进行编辑效果的验证,而且对于大部分基因组区域的基因型矫正或产生特定疾病模型存在目的位点编辑效率低、在编辑窗口内出现非目的基因型的改变、脱靶效应等潜在的问题,而传统的人工实验的验证方法存在费时、费力且时效性差的缺陷,本领域亟需一种自动预测单碱基编辑结果的技术,用于提升单碱基编辑结果的验证效率,以高效地辅助并促进疾病模型的构建及临床上突变的矫正。


技术实现要素:

5.以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之前序。
6.为了克服现有技术存在的上述缺陷,本发明提供了一种单碱基编辑结果的预测方法、一种单碱基编辑结果的预测装置、一种单碱基编辑方法、一种单碱基编辑装置,以及两种对应的计算机可读存储介质,能够提升单碱基编辑结果的验证效率,从而高效地辅助并促进疾病模型的构建及临床上突变的矫正。
7.具体来说,本发明的第一方面提供的上述单碱基编辑结果的预测方法包括以下步骤:根据指导序列从待测序列中确定多个待测位点;根据预设窗口分别确定各所述待测位点的多个相邻位点;对各所述待测位点及其对应的多个相邻位点的碱基进行特征提取,以获取各所述待测位点的特征矩阵;利用预先训练的神经网络的学习参数,根据各所述待测
位点的特征矩阵确定各所述待测位点的碱基被编辑的编辑概率;根据各所述待测位点的编辑概率,从所述多个待测位点中确定至少一个可编辑位点;根据各所述可编辑位点的编辑概率,计算各所述可编辑位点之间的条件概率;以及根据各所述可编辑位点的编辑概率,以及各所述可编辑位点之间的条件概率,计算至少一种单碱基编辑结果的概率。通过执行这些步骤,该预测方法能够自动预测单碱基编辑结以提升单碱基编辑结果的验证效率,从而高效地辅助并促进疾病模型的构建及临床上突变的矫正。
8.进一步地,在本发明的一些实施例中,所述根据指导序列从待测序列中确定多个待测位点的步骤包括:根据多个指导碱基,从待编辑的核糖核酸序列中定位所述指导序列;在所述核糖核酸序列中向所述指导序列的两端分别延伸多个位点,以确定所述待测序列;以及在所述待测序列中根据所述多个指导碱基确定所述多个待测位点。
9.进一步地,在本发明的一些实施例中,所述根据各所述待测位点的特征矩阵确定各所述待测位点的碱基被编辑的编辑概率的步骤包括:将所述待测位点的特征矩阵及位点序号输入所述神经网络;以及利用预先训练的对应于所述位点序号的第一学习参数,在所述神经网络确定各所述待测位点的碱基的所述编辑概率。
10.进一步地,在本发明的一些实施例中,所述神经网络包括多个具有不同大小卷积核的基础单元网络,和/或多个具有相同大小卷积核的基础单元网络。所述根据各所述待测位点的特征矩阵确定各所述待测位点的碱基被编辑的编辑概率的步骤进一步包括:将所述待测位点的特征矩阵及位点序号分别输入各所述具有不同大小卷积核的基础单元网络,和/或各所述具有相同大小卷积核的基础单元网络;以及利用预先训练的对应于所述位点序号的第一学习参数,在各所述具有不同大小卷积核的基础单元网络,和/或各所述具有相同大小卷积核的基础单元网络,分别确定所述待测位点的碱基的所述编辑概率。
11.进一步地,在本发明的一些实施例中,各所述基础单元网络对应不同大小的窗口。所述根据预设窗口分别确定各所述待测位点的多个相邻位点的步骤包括:根据各所述基础单元网络分别确定对应窗口的大小,并根据各所述窗口的大小分别为所述待测位点确定对应数量的相邻位点。所述对各所述待测位点及其对应的多个相邻位点的碱基进行特征提取,以获取各所述待测位点的特征矩阵的步骤包括:对各所述待测位点及其对应数量的相邻位点的碱基进行特征提取,以分别获取各所述待测位点关于各所述基础单元网络的特征矩阵。
12.进一步地,在本发明的一些实施例中,所述利用预先训练的对应于所述位点序号的第一学习参数,在各所述具有不同大小卷积核的基础单元网络,和/或各所述具有相同大小卷积核的基础单元网络,分别确定所述待测位点的碱基的所述编辑概率的步骤包括:获取由各所述具有不同大小卷积核的基础单元网络,和/或各所述具有相同大小卷积核的基础单元网络输出的基础编辑概率;利用预先训练的第二学习参数对各所述基础编辑概率进行加权平均,以确定所述待测位点的碱基的所述编辑概率。
13.进一步地,在本发明的一些实施例中,所述基础单元网络由多层全连接层构成。所述第一学习参数包括多组预先训练的子参数。所述利用预先训练的对应于所述位点序号的第一学习参数,在所述神经网络确定各所述待测位点的碱基的所述编辑概率的步骤包括:向第一全连接层输入所述待测位点的所述特征矩阵,并利用第一子参数对所述特征矩阵进行映射,以生成并输出第一中间向量;以及由各所述全连接层依次利用对应的子参数,对前
一全连接层输出的中间向量进行降维映射,直到在最后一全连接层输出一维的所述编辑概率。
14.进一步地,在本发明的一些实施例中,所述神经网络还包括编码器单元。所述编码器单元中包括卷积层。所述预测方法还包括以下步骤:对所述待测序列中各位点的碱基进行特征提取,以获取所述待测序列的全局特征矩阵;利用预先训练的第三学习参数,在所述编码器单元从所述全局特征矩阵提取全局特征向量;以及将所述全局特征向量与所述第一中间向量一起输入所述基础单元网络的第二全连接层,由所述第二全连接层根据第二子参数生成并输出第二中间向量。
15.进一步地,在本发明的一些实施例中,所述根据各所述待测位点的编辑概率,从所述多个待测位点中确定至少一个可编辑位点的步骤包括:根据预设的概率阈值对各所述待测位点的编辑概率进行筛选,以确定其中编辑概率大于或等于所述概率阈值的至少一个待测位点为所述至少一个可编辑位点。
16.进一步地,在本发明的一些实施例中,所述根据各所述可编辑位点的编辑概率,计算各所述可编辑位点之间的条件概率的步骤包括:将所述至少一个可编辑位点按位点序号组合成可编辑位点序列;以及根据所述可编辑位点序列中各相邻可编辑位点的编辑概率,计算各相邻可编辑位点之间的条件概率。
17.进一步地,在本发明的一些实施例中,所述根据所述可编辑位点序列中各相邻可编辑位点的编辑概率,计算各相邻可编辑位点之间的条件概率的步骤包括:根据各所述相邻可编辑位点之间的条件概率,在贝叶斯网络进行各种所述单碱基编辑结果的联合分布表示,以确定需要计算的条件概率;根据所述可编辑位点序列中各相邻可编辑位点之间的条件概率,表示各所述相邻可编辑位点之间的相关性;以及利用预先训练的第四学习参数,在贝叶斯网络根据各所述相邻可编辑位点的编辑概率,以及各所述相邻可编辑位点之间的编辑相关性,计算各所述相邻可编辑位点之间的条件概率。
18.进一步地,在本发明的一些实施例中,所述根据各所述可编辑位点之间的条件概率,计算至少一种单碱基编辑结果的概率的步骤包括:根据各所述相邻可编辑位点之间的条件概率,计算各所述单碱基编辑结果的联合分布表示的值,以确定各所述单碱基编辑结果的概率。
19.进一步地,在本发明的一些实施例中,在执行所述利用预先训练的神经网络,根据各所述待测位点的特征矩阵确定各所述待测位点的碱基被编辑的编辑概率的步骤之前,所述预测方法还包括以下步骤:获取多组主动编辑位点及其对应的编辑结果的样本数据,其中,所述编辑结果指示一个或多个被动编辑位点;对各组所述样本数据的编辑结果进行统计,以确定各所述主动编辑位点对应的至少一种编辑结果的概率;对各所述主动编辑位点其对应的多个相邻位点,以及各所述被动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取各所述主动编辑位点及各所述被动编辑位点的特征矩阵样本;逐一将各组所述样本数据中所述主动编辑位点及各所述被动编辑位点的特征矩阵样本输入待训练的神经网络,再将所述神经网络针对每组所述样本数据输出的多个编辑概率输入待训练的贝叶斯网络;以及利用对应样本数据中各所述编辑结果的概率,训练所述神经网络及所述贝叶斯网络的多个学习参数。
20.进一步地,在本发明的一些实施例中,所述对各组所述样本数据的编辑结果进行
统计,以确定各所述主动编辑位点对应的至少一种编辑结果的概率的步骤包括:根据预设的数量阈值对各组所述样本数据进行筛选,以获取数据点数量大于或等于所述数量阈值的样本数据,并对筛选获得的样本数据中各种编辑结果的数量进行统计,以确定各所述主动编辑位点对应的至少一种编辑结果的概率;和/或根据数据点数量对涉及相同主动编辑位点的多组所述样本数据中各种编辑结果的概率进行加权平均统计,以确定各所述主动编辑位点对应的至少一种编辑结果的概率。
21.进一步地,在本发明的一些实施例中,所述对各所述主动编辑位点其对应的多个相邻位点,以及各所述被动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取各所述主动编辑位点及各所述被动编辑位点的特征矩阵样本的步骤包括:对各所述主动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取各所述主动编辑位点的原始特征矩阵样本;对各所述被动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取各所述被动编辑位点的原始特征矩阵样本;以及根据预设的丢弃比例对各所述原始特征矩阵样本中的数据进行随机丢弃,以获取各所述主动编辑位点及各所述被动编辑位点的特征矩阵样本。
22.进一步地,在本发明的一些实施例中,所述利用对应样本数据中各所述编辑结果的概率,训练所述神经网络及所述贝叶斯网络的多个学习参数的步骤包括:根据各所述主动编辑位点对应的所述至少一种编辑结果的概率,采用最小化预测值与实际值之间均方误差的方法,训练所述神经网络及所述贝叶斯网络的所述多个学习参数。
23.根据本发明的第二方面提供的上述单碱基编辑方法包括以下步骤:确定待测序列及指导序列;确定多种单碱基编辑器及其对应的学习参数;根据所述待测序列、所述指导序列以及各所述单碱基编辑器对应的学习参数,分别实施本发明的第一方面提供的上述单碱基编辑结果的预测方法,以确定各所述单碱基编辑器得到至少一种单碱基编辑结果的概率;以及根据各所述单碱基编辑器得到各所述单碱基编辑结果的概率,选择符合编辑需求的单碱基编辑器进行单碱基编辑。通过执行这些步骤,该编辑方法能够根据单碱基编辑结果的预测结果自动选择合适的单碱基编辑器来进行单碱基编辑,从而高效地辅助并促进临床上突变的矫正。
24.根据本发明的第三方面提供的上述单碱基编辑结果的预测装置包括存储器及处理器。所述处理器连接所述存储器,并被配置用于实施本发明的第一方面提供的上述单碱基编辑结果的预测方法。通过实施该预测方法,该预测装置能够自动预测单碱基编辑结以提升单碱基编辑结果的验证效率,从而高效地辅助并促进疾病模型的构建及临床上突变的矫正。
25.根据本发明的第四方面提供的上述单碱基编辑装置包括存储器及处理器。所述处理器连接所述存储器,并被配置用于实施本发明的第二方面提供的上述单碱基编辑方法。通过实施该编辑方法,该编辑装置能够根据单碱基编辑结果的预测结果自动选择合适的单碱基编辑器来进行单碱基编辑,从而高效地辅助并促进临床上突变的矫正。
26.根据本发明的第五方面提供的上述计算机可读存储介质,其上存储有计算机指令。所述计算机指令被处理器执行时,实施本发明的第一方面提供的上述单碱基编辑结果的预测方法。通过实施该预测方法,该计算机可读存储介质能够自动预测单碱基编辑结以提升单碱基编辑结果的验证效率,从而高效地辅助并促进疾病模型的构建及临床上突变的
矫正。
27.根据本发明的第六方面提供的上述计算机可读存储介质,其上存储有计算机指令。所述计算机指令被处理器执行时,实施本发明的第二方面提供的上述单碱基编辑方法。通过实施该编辑方法,该计算机可读存储介质能够根据单碱基编辑结果的预测结果自动选择合适的单碱基编辑器来进行单碱基编辑,从而高效地辅助并促进临床上突变的矫正。
附图说明
28.在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
29.图1示出了根据本发明的一些实施例提供的训练单碱基编辑结果预测模型的流程示意图。
30.图2示出了根据本发明的一些实施例提供的预测单碱基编辑结果的示意图。
31.图3示出了根据本发明的一些实施例提供的预测单碱基编辑结果的流程示意图。
32.图4示出了根据本发明的一些实施例提供的自动选择单碱基编辑器来进行单碱基编辑的流程示意图。
具体实施方式
33.以下由特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其他优点及功效。虽然本发明的描述将结合优选实施例一起介绍,但这并不代表此发明的特征仅限于该实施方式。恰恰相反,结合实施方式作发明介绍的目的是为了覆盖基于本发明的权利要求而有可能延伸出的其它选择或改造。为了提供对本发明的深度了解,以下描述中将包含许多具体的细节。本发明也可以不使用这些细节实施。此外,为了避免混乱或模糊本发明的重点,有些具体细节将在描述中被省略。
34.能理解的是,虽然在此可使用用语“第一”、“第二”、“第三”等来叙述各种组件、区域、层和/或部分,这些组件、区域、层和/或部分不应被这些用语限定,且这些用语仅是用来区别不同的组件、区域、层和/或部分。因此,以下讨论的第一组件、区域、层和/或部分可在不偏离本发明一些实施例的情况下被称为第二组件、区域、层和/或部分。
35.如上所述,由于现有的各版编辑器只能在有限的体内位点进行编辑效果的验证,而且对于大部分基因组区域的基因型矫正或产生特定疾病模型存在目的位点编辑效率低、在编辑窗口内出现非目的基因型的改变、脱靶效应等潜在的问题,而传统的人工实验的验证方法存在费时、费力且时效性差的缺陷,本领域亟需一种自动预测单碱基编辑结果的技术,用于提升单碱基编辑结果的验证效率,以高效地辅助并促进疾病模型的构建及临床上突变的矫正。
36.为了克服现有技术存在的上述缺陷,本发明提供了一种单碱基编辑结果的预测方法、一种单碱基编辑结果的预测装置、一种单碱基编辑方法、一种单碱基编辑装置,以及两种对应的计算机可读存储介质,能够提升单碱基编辑结果的验证效率,从而高效地辅助并促进疾病模型的构建及临床上突变的矫正。
37.在一些非限制性的实施例中,本发明的第一方面提供的上述单碱基编辑结果的预
测方法可以由本发明的第二方面提供的上述单碱基编辑结果的预测装置来实施。具体来说,该预测装置可以配置有第一存储器及第一处理器。该第一存储器包括但不限于本发明的第五方面提供的上述计算机可读存储介质,其上存储有第一计算机指令。该第一处理器连接该第一存储器,被配置用于执行该第一存储器上存储的第一计算机指令,以实施本发明的第一方面提供的上述单碱基编辑结果的预测方法。
38.在一些非限制性的实施例中,本发明的第三方面提供的上述单碱基编辑方法可以由本发明的第四方面提供的上述单碱基编辑装置来实施。具体来说,该编辑装置可以配置有第二存储器及第二处理器。该第二存储器包括但不限于本发明的第六方面提供的上述计算机可读存储介质,其上存储有第二计算机指令。该第二处理器连接该第二存储器,被配置用于执行该第二存储器上存储的第二计算机指令,以实施本发明的第二方面提供的上述单碱基编辑方法。
39.以下将首先结合一些单碱基编辑结果的预测方法来介绍上述预测装置的工作原理。本领域的技术人员可以理解,这些预测方法只是本发明提供的一些非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一些便于公众实施的具体方案,而非用于限制上述预测装置的全部工作方式或全部功能。同样地,该预测装置也只是本发明提供的一种非限制性的实施方式,不对这些预测方法中各步骤的执行主体构成限制。
40.在本发明的一些实施例中,单碱基编辑结果的预测方法可以分为训练阶段、验证阶段、测试阶段及使用阶段来实施。训练阶段根据训练集进行机器学习,以调节预测模型中的各学习参数来达到预测各种单碱基编辑结果的概率的功能。验证阶段根据验证集进行各种单碱基编辑结果的预测,并根据验证数据集中对应的实验结果判断是否达到训练目标。若未达到训练目标,则在验证阶段进行进一步的机器学习,以优化预测模型中的各学习参数。测试阶段根据测试集进行各种单碱基编辑结果的预测,并根据测试数据集中对应的实验结果计算预测功能的均方根误差(root mean squared error,rmse)和皮尔逊相关系数(pearson correlation coefficient),以作为表征预测模型性能的指标参数。使用阶段根据临床、研究等场景中涉及需要编辑的指导序列(guide rna)进行各种单碱基编辑结果的预测,并自动输出各种单碱基编辑结果发生的概率,以高效地辅助医疗及研究人员选择合适的单碱基编辑器来构建疾病模型,和/或矫正临床上遇到的单碱基突变。
41.请参考图1,图1示出了根据本发明的一些实施例提供的训练单碱基编辑结果预测模型的流程示意图。
42.在图1所示的实施例中,被编辑的核糖核酸(rna)序列是由多个a、c、n、g碱基按序组成,其中的a碱基及c碱基是能够被单碱基编辑器修改编辑的碱基。预测装置可以从被一种单碱基编辑器编辑的大量rna序列中分别截取主动编辑位点附近的多个位点(例如:40bp)以构成样本序列,并获取该样本序列中被单碱基编辑器实际修改编辑的一个或多个被动编辑位点的情况,以作为对应的编辑结果。之后,预测装置可以根据主动编辑位点、实验时间、时间地点等因素,将这些样本序列及其对应的编辑结果划分为多组样本数据。在一些实施例中,各组样本数据中的编辑结果可以由现有技术中人工实验的验证方法来确定。
43.在确定各组样本数据对应的编辑结果后,预测装置可以对各主动编辑位点对应的至少一种编辑结果进行数据统计,以确定各各主动编辑位点对应的至少一种编辑结果的概率。在一些优选的实施例中,预测装置可以首先根据预设的数量阈值(例如:100)对各组样
本数据进行筛选,以获取其中数据点达到100以上的样本数据,再对筛选获得的各组样本数据中各种编辑结果的数量进行统计,以确定各主动编辑位点对应的至少一种编辑结果的概率。通过过滤筛除数据点不足的实验结果,该方案能够降低误差对预测结果准确性的不利影响。
44.此外,预测装置还可以获取在不同时间或地点测得的相同主动编辑位点的多组样本数据,并根据数据点数量对各组数据样本中各种编辑结果的概率进行加权平均统计,以确定各主动编辑位点对应的至少一种编辑结果的概率。通过进行多组相同条件的重复实验,并取实验结果的加权平均值来作为各主动编辑位点对应的至少一种编辑结果的概率,该方案也能够降低误差对预测结果准确性的不利影响。
45.进一步地,在一些实施例中,预测装置可以优选地将各组样本数据按6:1:3比例分为训练集、验证集及测试集,以分别供训练阶段、验证阶段及测试阶段使用。通过为每个阶段分配不同的样本数据,本发明能够有效避免重复样本数据对验证阶段及测试阶段中确定的rmse和皮尔逊相关系数产生影响,从而确保预测模型各指标参数能够实际达到使用阶段的使用标准。
46.如图1所示,在获取训练集的多组样本数据之后,预测装置可以按组对各组样本数据中主动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取该主动编辑位点的特征矩阵样本,并对该组中各被动编辑位点其对应的多个相邻位点的碱基进行特征提取,以获取各被动编辑位点的特征矩阵样本。
47.在一些实施例中,预测装置可以首先为a、c、n、g每种碱基分别分配一个对应的16维向量以表征其碱基类型,再根据预设的窗口大小选择对应数量的相邻位点来组成各主动编辑位点及各被动编辑位点的特征矩阵样本。
48.例如,为a、c、n、g每种碱基分配的16维向量可以如下:
49.a(-6.5668e-03,3.8674e-01,2.0711e-31,7.1578e-02,4.3657e-01,-3.2518e-01,5.7683e-02,3.5906e-01,2.2344e 00,-7.7848e-01,-7.6448e-01,5.1070e-04,1.3986e-02,-9.7303e-01,-7.2894e-01,-2.4847e 00);
50.c(-3.9257e-01,-3.1645e-01,-1.0939e 00,5.3837e-01,9.3302e-01,-1.0064e 00,1.6198e-01,4.4028e-01,2.0875e-11,1.7894e-01,-4.9675e-02,-9.3526e-10,1.2919e-01,2.4055e 00,-2.5262e-01,4.5021e-02);
51.n(7.8809e-01,7.7653e-01,1.3239e 00,1.0788e-01,1.5112e-01,-1.5477e 00,2.3172e-01,-3.9756e-01,-1.8780e 00,-1.3681e 00,-1.3546e-01,-1.5244e-01,-5.9360e-01,-1.6361e-01,-1.3676e-01,6.7683e-02);
52.g(6.3140e-01,-1.3985e 00,4.9699e-01,7.0446e-01,-1.5601e-01,-1.3614e 00,-2.7935e-15,5.5599e-01,-8.4719e-03,3.0439e-02,6.4922e-01,-5.8593e-02,1.9590e 00,1.9792e-01,-1.5881e 00,-2.2154e-01)。
53.又例如,若预设窗口大小为10,则预测装置可以根据主动编辑位点及其前后共10个位点的碱基类型,构成16*10的矩阵以作为该主动编辑位点的特征矩阵样本。同样地,预测装置也可以根据各被动编辑位点及其前后共10个位点的碱基类型,分别构成16*10的矩阵以作为各被动编辑位点的特征矩阵样本。
54.进一步地,在一些实施例中,在提取各组样本数据中主动编辑位点及各被动编辑
位点的原始特征矩阵样本后,预测装置可以优选地根据预设的丢弃比例(例如:30%),对各原始特征矩阵样本中各维度的数据点进行随机丢弃(dropout),将这些数据点置零以获取各主动编辑位点及各被动编辑位点的特征矩阵样本。通过执行这些丢弃操作,该方案能够增强各组样本数据的随机性,以防止预测模型的过拟合。
55.进一步地,在另一些实施例中,预测模型由神经网络及贝叶斯网络两部分组成。该神经网络进一步包括多个基础单元网络,其中,每一基础单元网络对应一个不同大小的预设窗口。在该实施例中,预测装置将根据各基础单元网络对应的窗口大小,分别为各主动编辑位点及各被动编辑位点选择对应数量的相邻位点,以分别构成对应于各基础单元网络的特征矩阵样本。
56.如图1所示,在获取各组样本数据中主动编辑位点及各被动编辑位点的特征矩阵样本之后,预测装置可以逐一将各组样本数据中的主动编辑位点及各被动编辑位点的特征矩阵样本输入待训练的神经网络,从而在该神经网络根据当前的第一学习参数,确定该主动编辑位点的碱基被编辑的编辑概率,以及各被动编辑位点的碱基被编辑的编辑概率。之后,神经网络针对该组样本数据输出的多个编辑概率将被输入待训练的贝叶斯网络,从而在该贝叶斯网络根据当前的第二学习参数确定发生各编辑结果的概率。该概率可以由0~1的数值来表示。再之后,预测装置可以利用之前统计确定的该样本数据中各种编辑结果的实际概率,对该神经网络的第一学习参数及该贝叶斯网络的第二学习参数进行训练调整,以使该预测模型的神经网络及贝叶斯网络学习正确预测该种单碱基编辑器的各种编辑结果概率的功能。
57.在一些实施例中,上述机器学习的步骤可以基于最小化预测值与实际值之间的均方误差来进行。也就是说,预测装置可以根据各主动编辑位点对应的至少一种编辑结果的概率,采用最小化预测值与实际值之间均方误差的方法,训练该预测模型的神经网络及贝叶斯网络的多个学习参数,以达到正确预测各种编辑结果的概率的功能。
58.在本发明的一些实施例中,预测装置可以每重复预设次数(例如:10000次)的训练流程后,将上述验证集中的一组或多组样本数据依次输入预测模型,利用当前的各学习参数进行各种对应编辑结果的预测,并根据验证集中对应的实验结果,判断预测模型输出的预测结果的rmse及皮尔逊相关系数是否达到训练目标。若预测模型输出的预测结果未达到训练目标,则预测装置可以在验证阶段根据验证集中的该一组或多组样本数据,对该神经网络的第一学习参数及该贝叶斯网络的第二学习参数进行进一步的训练调整,以优化该预测模型中神经网络及贝叶斯网络的各学习参数。反之,若预测模型输出的预测结果已经达到训练目标,则预测装置可以判断预测模型已经能够满足使用阶段的使用标准,从而结束该预测模型的训练阶段。
59.之后,响应于训练阶段的完成,预测装置可以将上述测试集中的各组样本数据依次输入完成训练的预测模型,利用完成训练的各学习参数进行各种对应编辑结果的预测,并根据测试集中对应的实验结果计算预测模型输出的预测结果的rmse及皮尔逊相关系数,以作为表征该预测模型性能的指标参数。
60.通过使用不同的样本数据来分别执行上述训练阶段、验证阶段及测试阶段,该方案能够有效避免重复样本数据对验证阶段及测试阶段中确定的rmse和皮尔逊相关系数产生影响,从而确保预测模型各指标参数能够实际达到使用阶段的使用标准。此外,通过配置
验证集来执行上述验证阶段,该方案既能及时判断预测模型是否达到训练目标以及时完结训练流程,又能根据不同的样本数据来优化预测模型的学习参数,因此能够进一步提升预测模型的训练效率。
61.本领域的技术人员可以理解,上述由预测装置实施训练阶段、验证阶段及测试阶段的方案,只是本发明提供的一种非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一种便于公众实施的具体方案,而非用于限制本发明的保护范围。
62.可选地,在另一些实施例中,上述训练阶段、验证阶段及测试阶段中的各步骤也可以由配置有相关计算机指令的另一训练装置、另一验证装置和/或另一测试装置来实施,以达到相同的训练、验证机测试的效果。
63.可选地,在另一些实施例中,上述训练阶段、验证阶段及测试阶段中的统计编辑结果概率、判断预测结果是否达到训练目标、计算预测结果的rmse及皮尔逊相关系数等简单的步骤也可以由人工实现。
64.基于以上描述,本发明提供了针对一种单碱基编辑器来训练单碱基编辑结果预测方法的实施方式。该单碱基编辑器包括但不限于aid-be3、be4max和abe8e中的任意一种。基于相同原理,技术人员还可以根据本发明提供的上述构思,采用类似的方法分别训练多种其他单碱基编辑器的编辑结果预测方法,在此不再赘述。
65.单碱基编辑结果预测模型的使用流程,请结合参考图2及图3。图2示出了根据本发明的一些实施例提供的预测单碱基编辑结果的示意图。图3示出了根据本发明的一些实施例提供的预测单碱基编辑结果的流程示意图。
66.如图2及图3所示,在本发明的一些实施例中,对于需要编辑的核糖核酸(rna)序列,预测装置可以首先根据单碱基编辑器容易发生的非目的基因型改变,确定由多个指导碱基按序排列构成的指导序列(guide rna)。之后,预测装置可以在该待编辑序列中定位该多个按序排列的指导碱基,以确定该指导序列在该待编辑序列中的位置,并将该指导序列中的各位点分别定义为第1~20位点。再之后,预测装置可以在该待编辑序列中向该指导序列的两端分别延伸多个位点(例如:10个位点),以确定一条包含第-9~30位点的待测序列,并根据该多个按序排列的指导碱基将该指导序列的第1~20位点确定为预测模型的多个待测位点。
67.之后,预测装置可以将该包含第-9~30位点的待测序列输入预先训练的预测模型,由该预测模型根据预先训练的学习参数来确定该待测序列在对应单碱基编辑器中发生各种单碱基编辑结果的概率。
68.具体来说,预测模型可以首先根据预设窗口的大小分别确定各待测位点的多个相邻位点,并对各待测位点及其对应的多个相邻位点的碱基进行特征提取以获取各待测位点的特征矩阵。例如:对于该指导序列中第1位的待测位点,若预设窗口的大小为10,则预测模型可以将待测序列中第-4~0及第2~5位的9个位点确定为该第1位点的相邻位点。之后,预测模型可以对该第-4~5位的10个位点的碱基进行特征提取,以获取该第1位待测位点的10*16维的特征矩阵。
69.如图2所示,在一些实施例中,预测模型的神经网络包括卷积核大小为7、9、11的各三个基础单元网络,其中,各基础单元网络分别对应不同的窗口大小。例如:卷积核大小为7的第一、第二、第三基础单元网络分别对应大小为10、11、12的预设窗口,卷积核大小为8的
第四、第五、第六基础单元网络又分别对应大小为10、11、12的预设窗口,卷积核大小为9的第七、第八、第九基础单元网络又分别对应大小为10、11、12的预设窗口。如此,该神经网络包括多个具有不同大小卷积核的基础单元网络,以及多个具有相同大小卷积核的基础单元网络。通过配置多个具有不同大小卷积核的基础单元网络,该方案能够增加神经网络对各编辑概率的预测稳定性,并提升预测结果的准确率。通过配置多个具有相同大小卷积核的基础单元网络,该方案能够有效地避免随机误差对各编辑概率的干扰,从而提升神经网络对各编辑概率的预测准确率及稳定性。通过为各基础单元网络配置不同大小的预设窗口,该方案的神经网络能够获取更多样化的输入数据,从而更准确地预测各待测位点被单碱基编辑器编辑修改的编辑概率。
70.针对这些涉及不同窗口大小的基础单元网络,预测模型可以首先根据第一、第四及第七基础单元网络确定窗口大小为10,并根据该窗口大小将待测序列中第-4~0及第2~5位的9个位点确定为该第1位点的相邻位点,将待测序列中第-3~1及第3~6位的9个位点确定为该第2位点的相邻位点,并依次类推地确定其余待测位点的相邻位点。之后,预测模型可以对该第-4~5位的10个位点的碱基进行特征提取以获取该第1位待测位点的10*16维的特征矩阵,对该第-3~6位的10个位点的碱基进行特征提取以获取该第2位待测位点的10*16维的特征矩阵,并依次类推地获取其余待测位点的10*16维的特征矩阵。
71.类似地,预测模型还可以根据第二、第五及第八基础单元网络确定窗口大小为11,并根据该窗口大小将待测序列中第-4~0及第2~6位的10个位点确定为该第1位点的相邻位点,将待测序列中第-3~1及第3~7位的10个位点确定为该第2位点的相邻位点,并依次类推地确定其余待测位点的相邻位点。之后,预测模型还可以对该第-4~6位的11个位点的碱基进行特征提取以获取该第1位待测位点的11*16维的特征矩阵,对该第-3~7位的11个位点的碱基进行特征提取以获取该第2位待测位点的11*16维的特征矩阵,并依次类推地获取其余待测位点的11*16维的特征矩阵。
72.类似地,预测模型还可以根据第三、第六及第九基础单元网络确定窗口大小为12,并根据该窗口大小将待测序列中第-5~0及第2~6位的11个位点确定为该第1位点的相邻位点,将待测序列中第-4~1及第3~7位的11个位点确定为该第2位点的相邻位点,并依次类推地确定其余待测位点的相邻位点。之后,预测模型还可以对该第-5~6位的12个位点的碱基进行特征提取以获取该第1位待测位点的12*16维的特征矩阵,对该第-3~7位的12个位点的碱基进行特征提取以获取该第2位待测位点的12*16维的特征矩阵,并依次类推地获取其余待测位点的12*16维的特征矩阵。
73.再之后,预测模型可以先将第1位待测位点的各特征矩阵分别输入该第一至第九基础单元网络,利用预先训练的学习参数在各具有不同大小卷积核的基础单元网络,和/或各具有相同大小卷积核的基础单元网络,分别确定该第1位待测位点的碱基的被单碱基编辑器编辑修改的多个基础编辑概率。
74.具体来说,在一些实施例中,基础单元网络可以由三层输出维度分别是256、128、1的全连接层构成。该学习参数可以包括三组预先训练的子参数,其中,每层全连接层对应一组子参数。预测模型可以先将该第1位待测位点的特征矩阵输入第一层全连接层,采用relu激活函数并利用对应的第一子参数对输入的特征矩阵进行映射,以生成并输出256维的第一中间向量。之后,预测模型可以将该256维的第一中间向量输入第二层全连接层,采用
relu激活函数并利用对应的第二子参数对输入的第一中间向量进行降维映射,以生成并输出128维的第二中间向量。再之后,预测模型可以将该128维的第二中间向量输入第三层全连接层,采用sigmoid激活函数并利用对应的第三子参数对输入的第二中间向量进行降维映射,以生成并输出一维的基础编辑概率。该基础编辑概率可以由0~1的数值来表示。
75.进一步地,在一些优选的实施例中,该神经网络中还配置有基于卷积神经网络的编码器单元。该编码器单元由一层卷积层和两层全连接层构成,能够从上述包含40位碱基的待测序列提取16维的全局特征向量,以供神经网络更准确地预测各待测位点的碱基的被单碱基编辑器编辑修改的编辑概率。具体来说,预测模型可以首先对待测序列的第-9~30位的各位点的碱基进行特征提取,以获取该待测序列的40*16维的全局特征矩阵。之后,预测模型可以利用训练阶段预先训练的第三学习参数,经由编码器单元的一层卷积层和两层全连接层,从该40*16维的全局特征矩阵提取16维的全局特征向量。再之后,预测模型可以将该16维的全局特征向量与上述256维的第一中间向量一起输入基础单元网络的第二全连接层,由该第二全连接层根据第二子参数生成并输出128维的第二中间向量,再由第三全连接层根据第三子参数及该128维的第二中间向量生成并输出一维的基础编辑概率。通过该基于卷积神经网络的编码器单元,该方案能够进一步引入该包含40位碱基的待测序列的全局信息,能够进一步提升神经网络预测各待测位点的编辑概率的准确性。
76.进一步地,在另一些优选的实施例中,该神经网络中还配置有加权平均模块。该加权平均模块涉及加权平均功能的第二学习参数。本领域的技术人员可以理解,该第二学习参数的训练流程可以在上述训练阶段中,根据训练集的样本数据一并完成,在此不再展开介绍。响应于各基础单元网络输出的基础编辑概率,该加权平均模块可以利用预先训练的第二学习参数对各基础编辑概率进行加权平均,以确定该第1待测位点的碱基被单碱基编辑器编辑修改的编辑概率。通过训练第二学习参数对各基础单元网络输出的基础编辑概率进行加权平均,该方案能够进一步结合训练集中各窗口大小和/或各卷积核大小的基础单元网络对该第1待测位点的编辑概率的实际贡献,更准确地确定该第1待测位点的编辑概率。
77.依此类推,预测模型可以逐一将各待测位点的各特征矩阵输入该第一至第九基础单元网络,利用预先训练的学习参数在各具有不同大小卷积核的基础单元网络,和/或各具有相同大小卷积核的基础单元网络,分别确定各待测位点的碱基的被单碱基编辑器编辑修改的编辑概率,在此不再赘述。
78.更进一步地,在一些更优的实施例中,神经网络中涉及的各学习参数可以根据各待测位点的序号来单独训练。也就是说,神经网络可以涉及多组不同的第一学习参数,其中,每组第一学习参数对应一个待测位点。预测模型可以逐一将各待测位点的特征矩阵及其对应的位点序号输入神经网络,从而在神经网络的各基础单元网络利用对应于该位点序号的第一学习参数,分别确定各待测位点的碱基被单碱基编辑器编辑修改的编辑概率。通过为每个待测位点单独训练对应的第一学习参数,对应方案能够利用对应的第一学习参数,更准确地预测指导序列中各待测位点被单碱基编辑器编辑修改的编辑概率。
79.本领域的技术人员可以理解,上述为每个待测位点单独训练对应的第一学习参数、利用多个具有不同大小卷积核和/或相同大小卷积核的基础单元网络来确定各待测位点的编辑概率、为各基础单元网络配置不同大小的预设窗口、训练第二学习参数对各基础
单元网络输出的基础编辑概率进行加权平均、配置编码器单元并训练第三学习参数来引入全局特征向量的方案,都是本发明提供的一些优选方案,旨在清楚地展示本发明的主要构思,并提供一些便于公众实施的具体实施方式,而非用于限制本发明的保护范围。可选地,在另一些基础的实施例中,预测模型也可以利用预先训练的相同学习参数,在同一神经网络模块达到根据各待测位点的特征矩阵分别确定各待测位点的碱基被单碱基编辑器编辑修改的编辑概率的基础效果。
80.如图3所示,在确定单碱基编辑器编辑修改指导序列中各待测位点的编辑概率之后,预测装置可以根据预设的概率阈值(例如:1%)对各待测位点的编辑概率进行筛选,以确定其中编辑概率大于或等于该概率阈值的至少一个待测位点为指导序列的至少一个可编辑位点。以图2所示的待编辑序列为例,单碱基编辑器只能编辑修改其中的c碱基。该指导序列中只有第4位待测位点x4及第16位待测位点x
16
的编辑概率会大于1%的概率阈值,也只有该第4位待测位点x4及该第16位待测位点x
16
属于该单碱基编辑器的可编辑位点。
81.为了计算不同编辑结果的概率,预测装置不仅需要确定各可编辑位点xi被编辑的编辑概率p(xi=1),还需要刻画各不同可编辑位点xi及xj之间的条件概率p(xi|xj)。该编辑概率p(xi=1)可以根据神经网络的输出g(xi)来确定,而该条件概率p(xi|xj)则需要根据各可编辑位点xi及xj之间的相关性来计算。
82.在一些实施例中,预测装置将每一个可编辑位点xi是否被编辑视作一个伯努利事件,并用一个马尔可夫网络对不同可编辑位点xi及xj之间的相关性进行建模。进一步地,为了简化模型,预测装置只考虑相邻的可编辑位点xi及x
i-1
之间的相关性。此时,链状的马尔可夫网络与链状的贝叶斯网络等价。
83.在计算各相邻可编辑位点xi及x
i-1
之间的条件概率p(xi|x
i-1
)时,预测装置可以首先将指导序列中各可编辑位点x4及x
16
,按位点序号组合成可编辑位点序列s={x4,x
16
}。之后,预测装置可以将可编辑位点序列s在整个贝叶斯网络的联合分布表示为p(x4,x
16
)=p(x4)p(x
16
|x4),并根据各相邻可编辑位点x4、x
16
之间的条件概率p(x4)及p(x
16
|x4),在贝叶斯网络进行各种单碱基编辑结果的联合分布表示,即:
84.p(x4=1,x
16
=1)=p(x4=1)*p(x
16
=1|x4=1)
ꢀꢀꢀꢀꢀꢀꢀ
(1)
85.p(x4=1,x
16
=0)=p(x4=1)*p(x
16
=0|x4=1)
ꢀꢀꢀꢀꢀꢀꢀ
(2)
86.p(x4=0,x
16
=1)=p(x4=0)*p(x
16
=1|x4=0)
ꢀꢀꢀꢀꢀꢀꢀ
(3)
87.p(x4=0,x
16
=0)=p(x4=0)*p(x
16
=0|x4=0)
ꢀꢀꢀꢀꢀꢀꢀ
(4)
88.如此,预测装置可以根据各种单碱基编辑结果的联合分布表示(1)~(4),确定需要计算的条件概率包括p(x4=1)、p(x4=0)、p(x
16
=1|x4=1)、p(x
16
=0|x4=1)、p(x
16
=1|x4=0)、p(x
16
=0|x4=0),共六个未知数。
89.之后,预测装置可以根据可编辑位点序列s中各相邻可编辑位点x4、x
16
之间的条件概率p(x
16
|x4),将各相邻可编辑位点x4、x
16
之间的编辑相关性表示为:
[0090][0091]
再之后,预测装置可以根据概率的定义确定:
[0092]
p(x4=0) p(x4=1)=1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0093]
p(x
16
=1|x4=1) p(x
16
=0|x4=1)=1
ꢀꢀꢀꢀꢀꢀꢀ
(7)
[0094]
p(x
16
=1|x4=0) p(x
16
=0|x4=0)=1
ꢀꢀꢀꢀꢀꢀꢀ
(8)
[0095]
再之后,预测装置可以根据神经网络的输出数据确定:
[0096]
p(x4=1)=g(x4)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0097]
p(x
16
=1|x4=0)(1-g(x4)) p(x
16
=1|x4=1)g(x4)=g(x
16
)
ꢀꢀ
(10)
[0098]
如此,预测装置即可利用在上述训练阶段预先训练的第四学习参数,在贝叶斯网络对公式(5)~(10)的六个方程求解,以计算上述p(x4=1)、p(x4=0)、p(x
16
=1|x4=1)、p(x
16
=0|x4=1)、p(x
16
=1|x4=0)、p(x
16
=0|x4=0)的六个条件概率。
[0099]
在确定上述p(x4=1)、p(x4=0)、p(x
16
=1|x4=1)、p(x
16
=0|x4=1)、p(x
16
=1|x4=0)、p(x
16
=0|x4=0)的六个条件概率之后,预测装置即可将其分别代入上述各种单碱基编辑结果的联合分布表示(1)~(4),计算各种单碱基编辑结果的联合分布表示的值,以分别确定单碱基编辑器输出图2所示的p1~p4的各种单碱基编辑结果的概率。
[0100]
基于以上描述,本发明提供了针对一种单碱基编辑器来预测其输出各种单碱基编辑结果的概率的实施方式。该单碱基编辑器包括但不限于aid-be3、be4max和abe8e中的任意一种。基于相同原理,技术人员还可以根据本发明提供的上述构思,采用类似的方法分别预测多种其他单碱基编辑器输出各种单碱基编辑结果的概率,在此不再赘述。
[0101]
如上所述,根据本发明的第二方面,本公开还提供一种单碱基编辑方法,能够根据单碱基编辑结果的预测结果自动选择合适的单碱基编辑器来进行单碱基编辑,从而高效地辅助并促进临床上突变的矫正。根据本发明的第四方面,本公开还提供一种单碱基编辑装置,能够通过实施该编辑方法来自动选择合适的单碱基编辑器来进行单碱基编辑,从而高效地辅助并促进临床上突变的矫正。
[0102]
以下将进一步结合一些单碱基编辑方法来介绍上述单碱基编辑装置的工作原理。本领域的技术人员可以理解,这些编辑方法只是本发明提供的一些非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一些便于公众实施的具体方案,而非用于限制上述编辑装置的全部工作方式或全部功能。同样地,该编辑装置也只是本发明提供的一种非限制性的实施方式,不对这些编辑方法中各步骤的执行主体构成限制。
[0103]
请参考图4,图4示出了根据本发明的一些实施例提供的自动选择单碱基编辑器来进行单碱基编辑的流程示意图。
[0104]
如图4所示,在本发明的一些实施例中,单碱基编辑装置可以首先根据单碱基编辑器容易发生的非目的基因型改变,确定由多个指导碱基按序排列构成的指导序列(guide rna)。之后,单碱基编辑装置可以在待编辑的核糖核酸(rna)序列中定位该多个按序排列的指导碱基,以确定该指导序列在该待编辑序列中的位置,并将该指导序列中的各位点分别定义为第1~20位点。再之后,预测装置可以在该待编辑序列中向该指导序列的两端分别延伸多个位点(例如:10个位点),以确定一条包含第-9~30位点的待测序列,并根据该多个按序排列的指导碱基将该指导序列的第1~20位点确定为预测模型的多个待测位点。
[0105]
在确定包含第-9~30位点的待测序列,以及包含第1~20位点的指导序列之后,单碱基编辑装置可以根据需要编辑的碱基类型,从上述胞嘧啶碱基编辑器(cbes)、腺嘌呤碱基编辑器(abes)等各种单碱基编辑器中选择多种适用的候选编辑器,并通过上述预测模型的训练阶段来确定各候选编辑器的学习参数。
[0106]
在确定多种候选编辑器及其对应的学习参数之后,单碱基编辑装置可以将上述包
含第-9~30位点的待测序列,以及上述包含第1~20位点的指导序列输入上述预测模型,并利用对应于当前候选编辑器的学习参数来实施上述单碱基编辑结果的预测方法,以确定该编辑器得到至少一种单碱基编辑结果的概率。之后,单碱基编辑装置可以根据各单碱基编辑器得到各单碱基编辑结果的概率,选择符合编辑需求的单碱基编辑器进行单碱基编辑。
[0107]
具体来说,在图4所示的实施例中,响应于预测模型输出的一种候选编辑器得到的至少一种单碱基编辑结果的概率,单碱基编辑装置可以将其中概率最高的单碱基编辑结果与编辑需求进行比对,以判断该单碱基编辑结果是否符合编辑需求。若该单碱基编辑结果符合编辑需求,则单碱基编辑装置将选择该候选编辑器来进行本次单碱基编辑。反之,若该单碱基编辑结果不符合编辑需求,则单碱基编辑装置将继续进行下一候选编辑器的结果预测,直到找到能够编辑需求的候选编辑器来进行本次单碱基编辑。通过逐个判断各候选编辑器是否符合编辑需求,该方案能够在找到符合编辑需求的候选编辑器后及时终止选择流程,从而提升单碱基编辑的效率。
[0108]
本领域的技术人员可以理解,图4所示的选择方案只是本发明提供的一种非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一种便于公众实施的具体方案,而非用于限制本发明的保护范围。
[0109]
可选地,在另一些实施例中,单碱基编辑装置也可以在确定各候选编辑器输出各种单碱基编辑结果的概率后,根据编辑需求选择输出对应单碱基编辑结果的概率最高,且达到概率阈值的候选编辑器来进行单碱基编辑。通过先完成所有候选编辑器的预测后再选择最符合编辑需求的候选编辑器,该方案能够利用最符合编辑需求的候选编辑器来进行单碱基编辑,从而提升单碱基编辑的成功率,以进一步避免出现非目的基因型的改变、脱靶效应等潜在的问题。
[0110]
本领域的技术人员可以理解,上述由单碱基编辑装置自动实施单碱基编辑方法中所有步骤的方案,只是本发明提供的一种非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一种便于公众实施的具体方案,而非用于限制本发明的保护范围。可选地,在另一些实施例中,上述单碱基编辑方法中的确定待测序列及指导序列、确定多种单碱基编辑器及其对应的学习参数等简单的步骤也可以由人工实现。
[0111]
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
[0112]
尽管上述的实施例所述的单碱基编辑结果的预测装置及单碱基编辑装置,是可以通过软件与硬件的组合来实现的。但是可以理解,该预测装置及该编辑装置也可以单独在软件或硬件中加以实施。对于硬件实施而言,该预测装置及该编辑装置可在一个或多个专用集成电路(asic)、数字信号处理器(dsp)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、处理器、控制器、微控制器、微处理器、用于执行上述功能的其它电子装置或上述装置的选择组合来加以实施。对软件实施而言,该预测装置及该编辑装置可通过在通用芯片上运行的诸如程序模块(procedures)和函数模块(functions)等独立的软件模块来加以实施,其中每一个模块执行一个或多个本文中描述的功能和操作。
[0113]
结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、
数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如dsp与微处理器的组合、多个微处理器、与dsp核心协作的一个或多个微处理器、或任何其他此类配置。
[0114]
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献