一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

确定PCR仪器的CT值方法、装置、设备和存储介质与流程

2023-02-01 22:27:34 来源:中国专利 TAG:

确定pcr仪器的ct值方法、装置、设备和存储介质
技术领域
1.本技术涉及生物医疗技术领域,特别是涉及一种确定pcr仪器的ct值方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.荧光定量pcr(realtime fluorescence quantitative pcr,qpcr)也称作实时荧光定量pcr。它是指在pcr反应体系中加入荧光基团,随着pcr反应的进行,pcr反应产物不断累积,荧光信号的强度也会等比例增加,利用荧光信号的累积情况,可以实时检测整个pcr进程。
3.为了监测pcr反应效率,可以监测pcr扩增过程中扩增产物的荧光强度值达到设定的荧光阈值时所经过的循环数,达到设定的荧光阈值所经过的循环数越小,效率越高,达到设定的荧光阈值所经过的循环数越大,效率越低,达到设定的荧光阈值所经过的循环数一般被称为ct值。
4.在确定ct值的时候,一般是在原始ct曲线中扣除基线,然后在扣除得到的ct曲线中,确定ct值。而基线一般是用户根据经验确定,如果用户确定的基线不准确,则会影响到ct值的准确性。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种确定pcr仪器的ct值方法、装置、计算机设备、存储介质和计算机程序产品。
6.本技术提供一种确定pcr仪器的ct值方法,所述方法包括:
7.获取原始ct曲线;
8.将所述原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,得到所述基线处理模型输出的针对所述原始ct曲线的基线斜率和基线截距;
9.根据所述基线斜率和基线截距确定的基线、以及所述原始ct曲线,得到校正ct曲线,在所述校正ct曲线上确定pcr仪器的ct值。
10.本技术提供一种确定pcr仪器的ct值装置,所述装置包括:
11.曲线获取模块,用于获取原始ct曲线;
12.模型预测模块,用于将所述原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,得到所述基线处理模型输出的针对所述原始ct曲线的基线斜率和基线截距;
13.曲线校正模块,用于根据所述基线斜率和基线截距确定的基线、以及所述原始ct曲线,得到校正ct曲线;
14.ct值确定模块,用于在所述校正ct曲线上确定pcr仪器的ct值。
15.本技术提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行上述方法。
16.本技术提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述方法。
17.本技术提供一种计算机程序产品,其上存储有计算机程序,所述计算机程序被处理器执行上述方法。
18.本技术中,将原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,使得基线处理模型可以考虑原始ct曲线的全局形态,在原始ct曲线的全局形态的基础上,预测出合适的基线斜率和基线截距,进而得到合适的基线;接着,在原始ct曲线中扣除合适的基线,得到准确的ct值。
附图说明
19.图1为一个实施例中ct曲线示意图;
20.图2a为一个实施例中原始ct曲线和基线的示意图;
21.图2b为一个实施例中校正ct曲线的示意图;
22.图3为一个实施例中确定pcr仪器的ct值方法的流程示意图;
23.图4为一个实施例中标注界面示意图;
24.图5为一个实施例中确定pcr仪器的ct值装置的结构框图;
25.图6为一个实施例中计算机设备的内部结构图。
具体实施方式
26.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
27.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本技术所描述的实施例可以与其它实施例相结合。
28.以下介绍本技术涉及的一些内容:
29.荧光定量pcr过程中,每经过一个循环可以收集一个荧光强度值,收集到的荧光强度值可以称为荧光强度原始值,根据各循环数下收集到的荧光强度原始值可以得到ct曲线,该ct曲线可以称为原始ct曲线,其中,原始ct曲线的横坐标表示循环数,纵坐标表示荧光强度原始值。
30.基线是指在pcr的最初几个循环中(一般为3-15个循环)的信号水平;此阶段的荧光信号变化量极小。低水平的基线信号相当于pcr反应的背景或噪声。
31.ct曲线如图1所示,ct曲线可以分为三个阶段:荧光背景信号阶段(基线期)、荧光信号指数扩增阶段和平台期。在荧光背景信号阶段,扩增的荧光信号被荧光背景信号所掩盖,无法判断产物量的变化;在平台期,扩增产物已不再呈指数级的增加,pcr的终产物量与起始模板量之间没有线性关系,根据最终的pcr产物量也不能计算出起始dna拷贝数;只有在荧光信号指数扩增阶段,pcr产物量的对数值与起始模板量之间存在线性关系。
32.荧光阈值:在ct曲线上人为设定的一个值,它可以设定在荧光信号指数扩增阶段
任意位置上,但一般荧光阈值的缺省值是pcr反应前3-15个循环荧光信号标准偏差的10倍。
33.ct值:pcr扩增过程中扩增产物的荧光强度值达到设定的荧光阈值时所经过的循环数。
34.在本领域中,基线判定是一个难题。基线是一条直线,通过基线斜率和基线截距,可以确定基线,基线斜率和基线截距一般由早期3-15个循环计算出,然后根据基线斜率和基线截距,计算所有循环数(一般为40个循环)对应的荧光强度基线值,从而一一对应的从原始ct曲线扣除这些荧光强度基线值。
35.基线截距很重要,决定了基线上下平移的位置,基线斜率也很重要,早期的斜率如果计算有偏差,基线后面延伸到更多循环时,偏差会越来越大;参照图2a,图中的直线a、b、c为3条基线,图中的曲线d为原始ct曲线,从原始ct曲线中扣除基线是:每一循环数(cycle)在原始ct曲线的荧光强度原始值减去其在基线上的荧光强度基线值,也即曲线上的40个圆点对应减去直线上的40个星号点。
36.前面3-15个循环的数据起伏比较大,既受pcr仪器的影响,也受试剂的影响。基线不准确,会影响原始ct曲线扣除基线后得到的校正ct曲线,进而导致ct值不准确,从而造成假阳性或假阴性。参照图2b,图中的曲线d-a、d-b和d-c分别为原始ct曲线d扣除基线a、b、c得到的校正ct曲线;图中的横线e对应的值为荧光阈值;可以看出,如果基线过大,荧光强度原始值减去荧光强度基线值所得到的荧光强度校正值就会过小,如果以图示横线e的荧光阈值为准,那么,校正ct曲线d-a存在假阴性,校正ct曲线d-b和d-c存在假阳性,也即,基线过大或过小直接造成假阳或假阴。
37.基于此,本技术提供一种确定pcr仪器的ct值方法,可以全局考虑原始ct曲线的形态,给原始ct曲线确定合适的基线,该方法可以由计算机设备执行,该方法包括图3所示的步骤:
38.步骤s301,获取原始ct曲线。
39.荧光定量pcr过程中,每经过一个循环收集一个荧光强度值,收集得到的荧光强度值可以称为荧光强度原始值,进而得到各循环数对应的荧光强度原始值,根据各循环数对应的荧光强度原始值所得到的曲线,可以称为原始ct曲线。
40.步骤s302,将所述原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,得到所述基线处理模型输出的针对所述原始ct曲线的基线斜率和基线截距。
41.原始ct曲线描述的各循环数下的荧光强度原始,反映了该原始ct曲线的全局形态,因此,基线处理模型可以考虑原始ct曲线的全局形态,从而给该原始ct曲线确定合适的基线斜率和基线截距。
42.步骤s303,根据所述基线斜率和基线截距确定的基线、以及所述原始ct曲线,得到校正ct曲线,在所述校正ct曲线上确定pcr仪器的ct值。
43.本步骤中,根据基线截距b和基线斜率k,可以得到基线的方程为y=k
×
x b。x为循环数,y为荧光强度基线值。
44.在得到基线和原始ct曲线后,可以从原始ct曲线中扣除基线,进而得到校正ct曲线。具体地,将各循环数在所述原始ct曲线上的荧光强度原始值减去在所述基线上的荧光强度基线值,得到各循环数对应的荧光强度校正值;根据各循环数对应的荧光强度校正值,形成校正ct曲线。
45.示例性地,当循环数为20时,将原始ct曲线上对应于循环数20的荧光强度原始值减去基线上对应于循环数20的荧光强度基线值,得到对应于循环数20的荧光强度校正值,按照该方式,可以得到各循环数对应的荧光强度校正值,根据各循环数对应的荧光强度校正值,形成校正ct曲线,如图2b示出的各校正ct曲线。
46.上述实施例中,将原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,使得基线处理模型可以考虑原始ct曲线的全局形态,在原始ct曲线的全局形态的基础上,预测出合适的基线斜率和基线截距,进而得到合适的基线;接着,在原始ct曲线中扣除合适的基线,得到准确的ct值。
47.在一个实施例中,获取针对基线处理模型的训练样本的步骤,包括:获取多条测试原始ct曲线,对各条测试原始ct曲线进行基线斜率和基线截距的标注;根据各条测试原始ct曲线描述的不同循环数下的荧光强度原始值、对各条测试原始ct曲线标注得到的基线斜率和基线截距,得到训练样本。
48.其中,标注界面如图4所示,在标注各测试原始ct曲线的基线斜率和基线截距时,考虑测试原始ct曲线的全局形态。在标注时,可以观察图4的基线(直线)和曲线(星号对应的线)的形态,确定是否修改基线斜率(slope)和基线截距(intercept),进而完成标注,修改的数值可以自动记录。
49.在对一条测试原始ct曲线标注完后,该条测试原始ct曲线描述的不同循环数下的荧光强度原始值、以及标注得到的基线斜率和基线截距,组成一个训练样本;由于测试原始ct曲线有多条,因此可以多个训练样本。
50.进一步地,在得到多个训练样本后,利用训练样本,得到基线处理模型的步骤,包括:将各条测试原始ct曲线所描述的不同循环数下的荧光强度原始值,输入神经网络;以神经网络输出的基线斜率和相应标注的基线斜率之间的差异最小化为目标、和以神经网络输出的基线截距和相应标注的基线截距之间的差异最小化为目标,调整所述神经网络的参数;将参数调整后的神经网络,作为基线处理模型。
51.也就是说,输入数据为:训练样本中的各条测试原始ct曲线所描述的不同循环数下的荧光强度原始,作为输出数据的标准数据为:训练样本中的标注得到的基线斜率和基线截距。
52.具体地,在得到多个训练样本,形成数据集后,可以将数据集划分为训练集和测试集,采用神经网络训练分别训练基线斜率和基线截距。
53.·
本实施例可以采用3层神经网络,1个输入层,1个隐藏层,1个输出层,可训练的参数是421个;
54.·
第1层神经网络有41个单元,就是输入的40个ct值和1个bias值;
55.·
第2层有11个单元,包括1个bias值;
56.·
第3层只有1个输出单元;
57.·
对于基线截距,训练比较简单,主要取决于最开始的几个原始数据;第1层到第2层使用激活函数“relu”,第2层到第3层可以不使用激活函数;
58.·
对于基线斜率,训练比较复杂,第1层到第2层使用激活函数“sigmoid”,第2层到第3层使用激活函数“tanh”;
59.·
优化使用“adam”,损失函数使用均方差损失函数。
60.上述实施例中,通过标注的方式,得到较佳的基线斜率和基线截距,提高基线处理模型的预测准确性;并且,在训练过程中,以测试原始ct曲线描述的各不同循环数下的荧光强度原始值,输入神经网络,以神经网络输出的基线斜率和相应标注的基线斜率之间的差异最小化为目标、和以神经网络输出的基线截距和相应标注的基线截距之间的差异最小化为目标,调整神经网络的参数,进而得到基线处理模型,使得基线处理模型具备基于原始ct曲线的全局形态,预测基线斜率和基线截距的能力。
61.在一个实施例中,在校正ct曲线上确定pcr仪器的ct值的步骤,具体可以包括:在所述校正ct曲线上存在等于荧光阈值的荧光强度校正值的情况下,将所述校正ct曲线上等于荧光阈值的荧光强度校正值对应的循环数作为pcr仪器的ct值。
62.在所述校正ct曲线上不存在等于荧光阈值的荧光强度校正值的情况下,按循环数从小到大的顺序,确定所述校正ct曲线上首个大于荧光阈值的荧光强度校正值;将所述校正ct曲线上与首个大于荧光阈值的荧光强度校正值对应的循环数,作为目标循环数;在所述目标循环数以及所述目标循环数的上一循环数之间,确定pcr仪器的ct值。
63.示例性地,在校正ct曲线上不存在等于荧光阈值的荧光强度校正值的情况下,若按循环数从小到大的顺序,确定该校正ct曲线首个大于荧光阈值的荧光强度校正值对应的循环数为i,由于第i个循环数时,校正ct曲线上的荧光强度校正值是大于荧光阈值的,那么达到荧光阈值的循环数应该在第i-1个循环数和第i个循环数之间,因此,本实施例在第i-1个循环数和第i个循环数之间确定ct值。
64.进一步地,可以利用插值处理的方式,确定达到荧光阈值的循环数,进而得到更为准确的ct值。具体地,将所述校正ct曲线中对应于所述目标循环数以及所述目标循环数的上一循环数的曲线段,作为粗等分曲线段;对所述粗等分曲线段进行线性插值处理,得到细等分曲线段;确定所述细等分曲线段上荧光强度校正值为所述荧光阈值的点,将所述点在所述细等分曲线段上的循环数作为pcr仪器的ct值。
65.示例性地,在目标循环数为第i个循环数的情况下,可以确定校正ct曲线上对应第i-1个循环数和第i个循环数的曲线段,并将该曲线段称为粗等分曲线段。在得到粗等分曲线段后,可以对该粗等分曲线段进行线性插值处理,插值精度可以是100等分,将插值处理得到的曲线段称为细等分曲线段。在该细等分曲线段中,横轴为细等分循环数,纵轴为细等分荧光强度校正值。
66.接着,确定细等分曲线段上荧光校正值为荧光阈值的点,若该点为细等分曲线段的第j个点,那么该点在所述细等分曲线段上的循环数为i-1 (j
×
0.01),将该i-1 (j
×
0.01)作为pcr仪器的ct值。
67.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
68.在一个实施例中,如图5所示,提供了一种确定pcr仪器的ct值装置,包括:
69.曲线获取模块501,用于获取原始ct曲线;
70.模型预测模块502,用于将所述原始ct曲线描述的不同循环数下的荧光强度原始值,输入基线处理模型,得到所述基线处理模型输出的针对所述原始ct曲线的基线斜率和基线截距;
71.曲线校正模块503,用于根据所述基线斜率和基线截距确定的基线、以及所述原始ct曲线,得到校正ct曲线;
72.ct值确定模块504,用于在所述校正ct曲线上确定pcr仪器的ct值。
73.在一个实施例中,所述装置还包括训练样本模块,用于获取多条测试原始ct曲线,对各条测试原始ct曲线进行基线斜率和基线截距的标注;根据各条测试原始ct曲线描述的不同循环数下的荧光强度原始值、对各条测试原始ct曲线标注得到的基线斜率和基线截距,得到训练样本。
74.在一个实施例中,所述装置还包括模型训练模块,用于将各条测试原始ct曲线所描述的不同循环数下的荧光强度原始值,输入神经网络;以神经网络输出的基线斜率和相应标注的基线斜率之间的差异最小化为目标、和以神经网络输出的基线截距和相应标注的基线截距之间的差异最小化为目标,调整所述神经网络的参数;将参数调整后的神经网络,作为基线处理模型。
75.在一个实施例中,曲线校正模块,还用于根据所述基线斜率和基线截距,得到基线;将各循环数在所述原始ct曲线上的荧光强度原始值减去在所述基线上的荧光强度基线值,得到各循环数对应的荧光强度校正值;根据各循环数对应的荧光强度校正值,形成校正ct曲线。
76.在一个实施例中,ct值确定模块,还用于在所述校正ct曲线上不存在等于荧光阈值的荧光强度校正值的情况下,按循环数从小到大的顺序,确定所述校正ct曲线上首个大于荧光阈值的荧光强度校正值;将所述校正ct曲线上与首个大于荧光阈值的荧光强度校正值对应的循环数,作为目标循环数;在所述目标循环数以及所述目标循环数的上一循环数之间,确定pcr仪器的ct值。
77.在一个实施例中,ct值确定模块,还用于将所述校正ct曲线中对应于所述目标循环数以及所述目标循环数的上一循环数的曲线段,作为粗等分曲线段;对所述粗等分曲线段进行线性插值处理,得到细等分曲线段;确定所述细等分曲线段上荧光强度校正值为所述荧光阈值的点,将所述点在所述细等分曲线段上的循环数作为pcr仪器的ct值。
78.关于确定pcr仪器的ct值装置的具体限定可以参见上文中对于确定pcr仪器的ct值方法的限定,在此不再赘述。上述确定pcr仪器的ct值装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
79.在一个实施例中,提供了一种计算机设备,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储确定pcr
仪器的ct值数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备还包括输入输出接口,输入输出接口是处理器与外部设备之间交换信息的连接电路,它们通过总线与处理器相连,简称i/o接口。该计算机程序被处理器执行时以实现一种确定pcr仪器的ct值方法。
80.本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
81.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述各个方法实施例中的步骤。
82.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
83.在一个实施例中,提供了一种计算机程序产品,其上存储有计算机程序,所述计算机程序被处理器执行上述各个方法实施例中的步骤。
84.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
85.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
86.以上的实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献