跳过主要内容

实时PCR数据的统计分析

抽象的

背景

尽管实时PCR广泛应用于生物医学科学,但仍然缺乏用于分析定量实时PCR的数据处理程序;特别是在适当的统计治疗领域。置信区间和统计显着性考虑不明确在许多当前数据分析方法中。基于标准曲线方法和其他有用的数据分析方法,我们展示并比较了四种统计方法和模型来分析实时PCR数据。

结果

在第一种方法中,建立了一个多元回归分析模型来估计基因和治疗效果的相互作用来推导ΔΔCt。在第二种方法中,提出了ANCOVA (analysis of covariance)模型,ΔΔCt可以从变量的影响分析中得到。其他两个模型包括计算ΔCt,然后是两组t试验和非参数类似的Wilcoxon试验。SAS程序是为所有四种模型开发的,并介绍了用于分析样本集的数据输出。此外,使用SAS开发和实现数据质量控制模型。

结论

具有SAS程序的实用统计解决方案是为实时PCR数据开发的,并使用SAS程序分析了示例数据集。使用各种模型和程序的分析产生了类似的结果。这里提出的数据质量控制和分析程序提供了使用实时PCR估计基因的相对表达的统计元素。

背景

实时PCR是基因表达分析最敏感和可靠定量的方法之一。它已广泛应用于微阵列验证,病原体定量,癌症定量,转基因拷贝数确定和药物治疗研究[1- - - - - -4].PCR具有三个阶段,指数相位,线性相位和平台相,如图所示1.指数阶段是PCR中最早的阶段,因为试剂不受限制,所以产物呈指数增长。线性相的特征是随着PCR试剂变得有限,产物呈线性增长。PCR最终将在后期的周期中达到平稳期,产物的数量不会因为一些试剂耗尽而改变。Real-time PCR利用了在理想条件下,指数阶段PCR产物的数量与初始模板的数量成正比的事实[56].在指数阶段,如果效率是完美的,即100%,PCR产物将在每个周期中理想地翻倍。如果PCR条件、引物特性、模板纯度和扩增子长度均为最佳,则有可能使PCR扩增效率在指数阶段接近100%。

图1
图1

实时聚合酶链反应.(A)给出了PCR循环数与PCR产物数量的理论曲线图。聚合酶链反应可以观察到三个阶段:指数阶段、线性阶段和平台阶段。(B)为PCR循环数与对数PCR产物量的理论图。面板(C)是ABI 7000实时PCR仪连续稀释实验的输出。

基因组DNA和反转录cDNA都可以作为实时PCR的模板。PCR的动态通常是通过DNA结合染料,如SYBR green或DNA杂交探针,如分子信标(Strategene)或Taqman探针(Applied Biosystems) [2].实时PCR的基础是具有扩增子数量的染料之间的直接正相关。如图所示(1B.1C),以对数2为基础的变换后的荧光信号与周期数的曲线将得到荧光信号的对数与原始模板量的线性范围。然后可以设置基线和阈值以进行进一步分析。基于log的荧光阈值水平的循环数被定义为Ct数,这是大多数实时PCR实验中观察到的值,因此是感兴趣的主要统计度量。

实时PCR数据是绝对和相对量化。绝对定量采用内部或外部的校准曲线来导出输入模板拷贝数。绝对量化的情况下,要确定正确的转录拷贝数的需求很重要,但是,相对定量足以满足大多数生理和病理研究。相对定量依赖于靶基因与参照基因表达和基因相同的靶样品中与参考样本的表达[之间的比较7].

由于相对定量是大多数实时PCR实验的目标,几个数据分析程序已经开发出来。两个数学模型的应用非常广泛:效率校准模型[78]和ΔΔCT模型[9].两种模型的实验系统是相似的。实验将包括一个对照样本和一个处理样本。对每个样品,从序列稀释的aliquos中加入一个用于内控的目的基因和一个内参基因进行PCR扩增。通常对每个稀释的浓度使用几个重复以获得扩增效率。PCR扩增效率可以定义为百分数(从0到1),也可以定义为PCR产物每周期增加的时间(从1到2)。除指定百分数扩增效率(PE)外,本文将PCR产物增加的百分数(E)称为扩增效率(1到2)。效率校准模型是一个更广义的ΔΔCt模型。首先根据cDNA输入(或对数cDNA输入)绘制Ct数,计算图的斜率以确定扩增效率(E)。然后将每个基因(靶基因或参考基因)的Ct数减去对照样本的Ct数,计算ΔCt。如式所示1,靶基因表达的治疗相对于对照的比率可从(E靶基因效率之间的比率来导出目标)到目标ΔCT的功率(ΔCT目标)和参考基因效率(E参考),以参考ΔCT的功率(ΔCT参考).如果靶基因和内参基因都达到最高的PCR扩增效率,则可以从效率校准模型衍生出ΔΔCt模型。在这种情况下,两者都以效率为目标(E目标)控制效率(e控制)等于2,表明扩增子在每个周期期间倍增,然后将有来自2源自的相同表达比-ΔΔCT79].

R 一种 T. 一世 O. E T. arg E. T. Δ C T. T. arg E. T. E R. E. F E. R. E. N. C E. Δ C T. R. E. F E. R. E. N. C E. E 问: 一种 T. 一世 O. N. 1 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaemOCaiNaemyzauMaemOzayMaemyzauMaemOCaiNaemyzauMaemOBa4Maem4yamMaemyzaugabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdkhaYjabdwgaLjabdAgaMjabdwgaLjabdkhaYjabdwgaLjabd6gaUjabdogaJjabdwgaLbqabaaaaaaakiaaxMaacaWLjaGaemyrauKaemyCaeNaemyDauNaemyyaeMaemiDaqNaemyAaKMaem4Ba8MaemOBa4MaeeiiaaccbiGae8xmaedaaa @ 79AC @

然而ΔCT.T.argET.CT.控制-CT.治疗和δCT.参考CT.控制-CT.治疗

比率= 2-ΔΔCT.等式2

然而ΔΔCT.=δ.CT.参考- ΔCT.T.argET.

尽管效率校准和ΔΔCT模型都广泛应用于基因表达研究,但在分析每个实验因素以及显着性测试的分析中,没有许多论文对统计考虑的讨论。使用实质性统计分析的少数研究之一使用®程序(8].本文提出的软件是基于效率校准模型,采用随机检验获得显著性水平。然而,文章并没有提供一个详细的模型,以说明不同的实验因素所涉及的影响。另一项实时PCR数据的统计研究使用简单线性回归模型通过Ct计算来估计比例[10.].但是,模型中使用了基于对数的荧光作为因变量,我们认为这并不能充分反映实时PCR数据的性质。因此,Ct应该作为统计分析的因变量,因为它是直接受治疗、浓度和样本效应影响的结果值。两项研究都使用了效率校准模型。尽管这两种方法都已发表,但许多发表的带有实时PCR数据的研究文章实际上并没有出现P值及置信区间[11.- - - - - -13.].我们认为,这些统计数据是可促进对数据的强大解释。

先天的,我们认为置信区间和PΔΔCT数据的值,因为这些直接影响比的解释是很重要的。如果没有正确的统计建模和分析,实时PCR数据的解释可能会导致研究人员以假阳性的结论,这是特别是在临床应用中潜在的麻烦。在此,我们开发了四种统计方法处理采用改良ΔΔCT法的实时PCR数据。统计方法可以适用于其他的数学模型进行修改。实施方法和数据控制SAS程序都在考虑实时PCR从业交钥匙工程数据分析。标准差,置信水平和P值直接从SAS输出呈现。我们还包括对在线补充材料中分析的样本数据集和SAS程序的分析。

结果与讨论

数据质量控制

从两种用于实时PCR数据相对定量的数学模型中,我们观察到数据质量标准之间的差异。对于效率校准方法,描述此过程的作者[7],假设不同实验样本(处理和对照)中每个基因(靶基因和参比基因)的扩增效率相同。相比之下,虽然不需要扩增效率为2,但ΔΔCt方法更严格,假设所有反应都要达到扩增效率为2。换句话说,产品的数量应该在每个周期翻倍[9].此外,ΔΔCT方法假设每个样品的PCR扩增效率为2,如果一组样品的PCR达到全扩增效率。然而,这种假设忽略了不同cDNA样品的效果。

可以通过相关模型检查数据质量。即使检查CT数和浓度之间的相关性可以提供有效的质量控制,也可以采取更好的方法来检查CT和对数之间的相关性(基本2)模板的变换浓度,这应该为每个的模板产生显着的简单线性关系基因和样品组合。例如,对于对照样品中的靶基因,CT数应与等式中简单的线性回归模型后的对数转换浓度相关联3..的方程,Xlcon代表对数转换的浓度,β0表示回归线的截距βcon代表回归线的斜率[14.].从回归分析来看,可接受的实时PCR数据应具有两个特点。首先,斜率不应与-1有显著差异。第二,所有四种基因和样本组合的斜率如表所示1不应该与彼此有显着不同。开发了一个SAS程序以在Program1_QC.SAS中执行数据质量控制(附加文件1).

表1中的样品的实时分析PCR数据。在该数据集,有两种类型的样品(处理组和对照);两个基因(参考和靶);和四个浓度基因和样品的每个组合的。对于数据质量控制和ANCOVA分析,实时PCR样品的数据集可以在四组根据样品和基因的组合进行分组。作为控制对象的组合效果被命名为第1组,治疗 - 靶组2,控制引用组3和治疗引用组4。

Ct =β0+βconXlcon+ε等式3.

输入数据被分组,如表所示1附加文件2.每一个基因和样本的组合被分为一组,从1到4。根据上述模型,使用SAS程序Proc Mixed对每组进行简单线性回归。估计了斜率的95%置信水平,预计与-1没有显著差异。用于分析样本数据集的缩写SAS输出见SASOutput.doc (附加文件3.).基于95%的置信水平,所有四个组的CT和对数转化浓度的倾斜度与-1没有显着差异。除了数字输出外,该程序还提供了数据质量的可视化,如图所示2,其中Ct数与对数转换模板浓度对应。Ct数与对数转换的浓度之间应观察到简单的线性关系。

图2
figure2

数据质量控制.这四个类别代表了样本与基因的四种不同组合,分别是对照样本中的内参基因、对照样本中的靶基因、处理样本中的内参基因和处理样本中的靶基因。每一类都应该推导出PCR产物的Ct和对数转换浓度之间的线性相关性,斜率为-1。

多元回归模型

ΔΔCt方法需要考虑几种影响,即治疗、基因、浓度和复制的影响。如果我们将这些效应视为定量变量,并有与这些多重效应及其相互作用相关的Ct数,我们可以建立一个多元回归模型,如式4所示。

CT.β0+βconX图标+β治疗X我请客+β基因X硫代+βcontreatX图标X我请客+βcongene.X图标X硫代+βgenetreat.X硫代X我请客+βcongenetreat.X图标X我请客X硫代+ε方程4

在这个模型中,CT是真正的依赖,β0是拦截,βXs为对应的X(独立)项的回归系数ε为误差项[14.].该模型考虑了浓度、处理、基因及其相互作用的影响。我们主要感兴趣的是基因和治疗之间的相互作用,它解决了治疗样本与对照样本中靶基因和内参基因之间的Ct差异程度:例如ΔΔCt。因此,ΔΔCt可以由β的不同组合值来估计genetreat..表中的四组1也代表了治疗和基因联合作用的选择。目的是统计检验治疗样本和对照样本中靶基因和内参基因之间的差异。因此,无效假设为靶基因和内参基因的Ct差异在治疗样本与对照样本中是相同的,可以用组合效应(CE)表示为:CE1-CE3 = CE2-CE4。另一个公式是:CE1-CE2-CE3+CE4 = 0,这将得到ΔΔCt的估计。如果不拒绝原假设,则ΔΔCt与0没有显著差异,否则,ΔΔCt可以从检验的估计中得到。这样我们就可以对β的不同组合效应进行检验genetreat.并从中估算出ΔΔCt。如式中的ΔΔCt公式所示2,如果ΔΔct等于0,则该比率为1,这表明对照和治疗之间的基因表达没有变化。

一个用于多元回归模型的SAS程序

SAS程序PROC GLM用于在Program2_MR.sas在ΔΔCT估计附加文件4..多元回归模型在模型语句中陈述。基因和治疗的综合效应在评估和对比声明中进行了评估。对比语句检验CE1-CE2-CE3+CE4 = 0的原假设,参数估计得到ΔΔCt值。说明SAS输入文件在附加文件5.多元回归的SAS输出位于SasOutput.doc(附加文件3.).

SAS输出对数据进行了非常全面的分析。我们对分析的两个方面感兴趣。首先,我们要测试ΔΔCt的值是否显著不同于0P= 0.05。如果ΔΔct与0没有显着差异,则我们得出结论治疗对靶基因表达没有显着影响;否则,结论了逆。如果效果显着,我们对ΔΔCt值的标准偏差感兴趣,我们可以从中得出如稍后所讨论的基因表达的比率。SAS输出为ΔΔct提供点估计(-0.6848)和标准误差(-0.1185)。PROC GLM或PROC混合在本申请中可互换。如果实验涉及多种生物学重复,还可以通过修改SAS程序来考虑复制效果。然后估计将是基因,治疗和复制的综合作用。

分析协方差和SAS代码

另一种接近实时PCR数据分析的方法是通过使用协方差(ANCOVA)的分析。可以导出简化模型将数据转换为如表所示的分组数据1附加文件2得到式5。

CT.β0+βconX图标+β集团Xigroup+βgroupconXigroupX图标+ε方程5

我们感兴趣的是两个问题。首先,四组的协方差调整后的平均值是否相等?第二,经内参基因校正后,治疗样本与对照样本的靶基因值Ct差异有多大?在这种情况下,null假设将是(μ2-μ1)-(μ4-μ3) = 0,并且测试将产生一个参数估计ΔΔCt,如Program3_ANCOVA所示。sas (附加文件6.).

实现ANCOVA模型的SAS代码与多元回归模型相似。SAS程序PROC GLM或PROC MIXED可用于实现ANCOVA模型;这里我们使用PROC MIXED。class语句定义了将对哪些变量进行显著性测试。在这种情况下,变量是浓度和群体,ANCOVA假设它们在本质上是共变的。使用对比和估计语句对群体效应进行对比,得到ΔΔCt(-0.6848),以及其标准误差(0.1185)和95%置信区间(-0.9262,-0.4435)。SAS输出具有置信度和Pvalue呈现在sasoutputs.doc中(附加文件3.).

简化的替代方案 -T-检验和wilcoxon两组检验

更简单的方法可以用来分析实时数据,每次实验都有生物重复。该方法的主要假设是,通过将靶基因的Ct数减去内参基因的Ct数,可以调节浓度、基因和复制的加性效应,得到ΔCt如表所示2.因此,用于治疗和控制的ΔCt可以很简单T.-test,将得到ΔΔCt的估计。

表2ΔCT计算。表显示ΔCT的计算,这是从由与靶基因中减去参考基因的CT数的。CON代表浓度。

作为非参数的替代T.-test,一个Wilcoxon两组检验也可以用来分析ΔCt的两组值。有两个假设t测试是两组ΔCt将具有高斯分布,它们将具有相同的差异。然而,这些假设在许多实时PCR实验中不适用于使用现实的小样本尺寸。因此,在这种情况下,无分布的Wilcoxon测试将是更强大和适当的替代方法[15.].

一个SAS程序已经开发了两种t测试和Wilcoxon两组测试如所附程序Program4_TW所示。sas (附加文件7.).SAS程序TTEST和单变量用于分析数据。SAS宏'MOSES.SAS'[15.附加文件8.已被雇用派对置信水平。SAS输入文件已在附加文件9.和SAS输出采样数据分析是可用的SASOutput.doc(附加文件3.).由于差异的估计是从对照样本中减去处理的,实际的ΔΔCt应该是输出估计的倒数。

四种方法的比较和数据呈现

表中给出了四种方法的比较3..多元回归和ANCOVA对ΔΔCt估计的结果完全相同,因为这两种方法使用相同的数学方法进行参数估计。的T.-test提供了与ΔΔCt相同的点估计,但是标准误差略大,导致置信区间较大。Wilcoxon两组检验提供了一个略小的ΔΔCt估计。四种方法的高度相似的结果验证了模型和SAS程序。模型和程序的选择将取决于实验设计和实验的严格程度和质量。然而,由于其非参数性质,最保守的检验是Wilcoxon两组检验,它是分布无关的。

表3四种方法的比较。表列出了ΔΔct,标准误差,P-值和置信区间由本文提出的四种方法得到。无论是SAS包还是使用的宏都不提供Wilcoxon两组检验的标准误差。我们认为置信区间对于进一步的数据转换是充分的。

数据质量控制

目前的许多实时PCR实验不包括标准曲线设计,也没有使用估计扩增效率的方法。我们认为real-time PCR数据如果没有适当的质量控制是不可靠的,因为real-time PCR的效率会对比例估计和动态范围产生显著影响。例如,PCR扩增效率(PE)为0.8时(即PCR产物增加20.8时间代替每循环的两次),ΔCt值为3只能转化为比率的5.27倍而不是8次。当ΔΔct或Δct值较大并且放大效率较低时,该问题变得放大,这可能导致严重倾斜的解释。

因此,我们根据本文中提出的SAS程序提出了根据模型的实时PCR数据质量控制的两个标准。首先,需要包括串联稀释模板的实验,以便估计每个样品的每个基因的扩增效率。一些研究人员假设每个基因的扩增效率在不同的样品中是相同的,因为使用相同的引物对和扩增条件。但是,我们发现样品效果对放大效率产生了影响。换句话说,当从不同的cDNA模板样品扩增时,扩增效率可能不同于相同的基因。因此,我们认为对每个基因的标准曲线和样品组合的实验设计作为最佳状态。其次,在最佳条件下,如果对对数(基于2的)模板量的CT次数的图应产生与-1没有显着不同的斜率,这表明了近2个放大效率。尽管效率校准模型和改性ΔΔCT模型耐受低于2的放大效率,但通过优化引物选择,扩增子长度和实验条件,可以获得与扩增效率的所有反应。根据我们的经验,维护附近的所有放大效率是在样品中达到同等放大效率的最佳方法,从而确保高质量的数据。还观察到,近2个放大效率可以有助于扩展比率估计的动态范围。

P-value、置信区间和数据表示

P-Value是显着水平的重要参数,置信区间有助于建立ΔΔCT估计的可靠范围。目前最新的实时PCR出版物不存在P-值和置信区间[11.- - - - - -13.].我们相信披露P当研究人员声称样本或治疗方法之间存在差异时,-值是重要的。在我们的节目中,所有的P- Values从测试Null假设,即ΔΔct等于0。因此,小P- 值表示该ΔΔCT为0,这表明一个显著效果显著不同。一的解释P -价值将取决于实验目标。例如,在P= 0.05在治疗组与对照实验中,我们可以声称的治疗有效果显著;和在组织对比实验中,我们可以声称的基因表达是组织中显著不同。

一些出版物的标准偏差与一个有意义的指标的比例呈现。然而,我们在此辩论,比率的标准偏差应该从ΔΔct的标准偏差导出;并且比率的置信区间应该源自ΔΔct的置信区间。换句话说,比率的点估计应该是2-ΔΔCT比例的置信区间应该是(2-ΔΔCtHCL, 2-ΔΔctlcl).由于Ct是实验过程中观察到的值,所以应该进行统计分析。直接按比率进行统计分析的做法是不恰当的。数据的表示需要参考ΔΔCt以及随后由2推导出的比率和置信区间——ΔΔCt。

具有扩增效率的实时PCR数据的统计分析小于2

如前所述,PCR扩增效率可以优化为约2,具有适当的扩增引物,RNA质量和cDNA合成方案。实时PCR引物设计中的最新进步允许更简单的实验优化[16.17.].然而,在严格控制实验条件的情况下,实时PCR的数据可能会出现不足。对于次优实时PCR数据有三种情况。在第一种情况下,所有PCR反应的扩增效率相同,但不同于2。在第二种情况下,PCR扩增效率仅因基因而异。换句话说,同一基因在所有生物样本中的扩增效率是相同的;然而,不同基因的扩增效率不同。在第三种情况下,PCR扩增效率因基因和样本的不同而不同。我们认为第三种情况的数据与许多其他情况报告的数据一样不可接受[10.18.].在任何这些方案中,调整后的ΔΔct可以通过在“估计”和“对比”的SAS程序的语句中包括PE来源于ANCOVA模型。

已经开发了几种方法来计算低质量数据的放大效率。其中一种方法称为“动态数据分析”,利用PCR反应的荧光史来计算扩增效率[19.20.].该方法的优点在于能够分析低质量的数据,避免了标准曲线,节省了成本。然而,由于数学上的复杂性和可靠性争议,该方法的应用并不像传统的标准曲线方法那样广泛[10.16.18.].在我们的方法中,已经存在标准曲线,可用于推导放大效率(E)。考虑方程中简单的线性回归模型3., 如果Xlcon表示基于10个基于对数转换的浓度,放大效率(E)是10(1 /坡) 10. - 1 / β con 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIXaqmcqaIWaamdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa @ 3921 @ 根据Ramussen 2001和Pfaffl 2001 [721.].在我们的模型中,Xlcon表示以2为基础的对数变换浓度,因此放大效率(E)为2(1 /坡) 2 - 1 / β con 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIYaGmdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa @ 3835 @ ,其中PE可表示为-(1/β)con).

在上面讨论的第一种情形中,所有PCR扩增的效率是相同的,但效率不等于1。则基因表达率可表示为:

R 一种 T. 一世 O. E - Δ Δ C T. 2 - 1 / β C O. N. ] - Δ Δ C T. 2 - Δ Δ C T. P E E 问: 一种 T. 一世 O. N. 6 MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpcqWGfbqrdaahaaWcbeqaaiabgkHiTiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabcUfaBjabikdaYmaaCaaaleqabaGaeyOeI0IaeiikaGIaeGymaeJaei4la8ccciGae8NSdi2aaSbaaWqaaGqaciab gavjab + ngaJjab + 9 + 5 gaubqabawccqggpaqkaagccqggdbqxdaahaawcbeqaaiabgkhitiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabikdaymaacaaaleqabagaeyoei0iaeuildqkaeuildqkaem4qamkaemidaqnaeiokaoiaemiuaalaemyraueaaogaaczcaiaaxmaacqwgfbqrcqwgxbqccqwg1bqdcqwghbqycqWG0baDcqWGPbqAcqWGVbWBcqWGUbGBcqqGGaaicqGF2aGnaaa@6ABA@

PE.= - (1 /βcon),ΔΔCt调整PE *ΔΔCT

在等式6,βcon与的Ct情节针对对数2基于浓度的汇集斜率。β.con可以用SAS中的相关函数计算,如Program5_LowQualityData.sas所示额外的文件10.在第二种情形中,扩增效率仅通过基因不同。根据公式1,我们有下面的方程,其中β0Ct对log的曲线的集合斜率是多少2(浓度)为每个基因。

R 一种 T. 一世 O. E T. arg E. T. Δ C T. T. arg E. T. E C O. N. T. R. O. L. Δ C T. C O. N. T. R. O. L. 2 - 1 / β C O. N. T arg E. T. ] Δ C T. T. arg E. T. 2 - 1 / β C O. N. C O. N. T. R. O. L. ] Δ C T. C O. N. T. R. O. L. 2 P E T. arg E. T. * Δ C T. T. arg E. T. - P E C O. N. T. R. O. L. * Δ C T. C O. N. T. R. O. L. E 问: 一种 T. 一世 O. N. 7 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaem4yamMaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9maalaaabaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWliiGacqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4MaemivaqLagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaaaaaGcbaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWlcqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4Maem4qamKaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9iabikdaYmaaCaaaleqabaGaeiikaGIaemiuaaLaemyrau0aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaWccqGHxiIkcqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabgkHiTiabdcfaqjabdweafnaaBaaameaacqWGJbWycqWGVbWBcqWGUbGBcqWG0baDcqWGYbGCcqWGVbWBcqWGSbaBaeqaaSGaey4fIOIaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaWccqGGPaqkaaGccaWLjaGaaCzcaiabdweafjabdghaXjabdwha1jabdggaHjabdsha0jabdMgaPjabd + gaVjabd6gaUjabbccaGGqaciab + Dda3aaa @ F60B @

PE.目标= - (1 /βcont),PE.控制= - (1 /βconControl),ΔΔCt调整PE.目标*ΔCt目标-PE.控制*ΔCt控制

在公式7中,βcontβconControl是CT的汇集斜率分别针对基于对数2的靶基因和参考基因的浓度。斜坡可以通过Program5_LowQualityData.sas计算(额外的文件10).的ΔΔCt调整可以用相同的程序计算。从理论上讲,当PCR扩增效率因基因和样本不同而不同时,也可以推导出第三种情况的方程。但在实际应用中,由于放大效率变化较大,我们不认为第三种方案的数据是可接受的[10.18.].

Program5_LowQuatilityData。sas在额外的文件10提供了在第一个和第二个场景中导出调整后的ΔΔCt的解决方案。的LowQualityData.txt中提供了不同基因扩增效率的数据集额外的文件11为了说明SAS程序的使用。数据集的质量较低,主要是由于实验中涉及有限数量的复制。计算四个步骤ΔΔCt调整.第一步是执行数据质量控制测试,如方法所示。从SAS输出中,我们可以得出结论,低标准数据集不符合2的要求-ΔΔCT方法,因为其中一组PCR扩增效率明显不同于1,如SASOutput.doc (附加文件3.).

第二步是通过观察lcon和类相互作用的III型平方和来检验相同的PCR效率(或斜率)。一个低P.值表示不同组(类)的PCR与对数转化浓度的相互作用,反过来表示不同组PCR之间的斜率不等。如果所有PCR扩增效率相等,则可计算汇集扩增效率,并将其整合到SAS程序中ΔΔCt调整计算。在这组数据中,Squares的III型总和具有一个P.值小于0.05,并且扩增效率不等于所有PCR。然后对每个基因进行等于等斜率的测试以确定每个基因的PCR扩增效率是否相同。对于任一种基因,扩增效率与0.05的α没有显着差异。可以在SasOutput.doc中找到所有III型的正方形输出总和(附加文件3.).

下一步是计算汇总的斜率(βcon)对于每个基因推导的百分比扩增效率(PE = - (1 /βcon))对于每个基因。基于基于CT和对数2的浓度之间的相关性导出汇总斜率。β.con对于两个基因的S分别为-1.0813和-1.0137,如sasoutput.doc所示(附加文件3.)对于低正式数据集的放大效率计算。用β.con, - (1 /βcon)和PE分别为0.925和0.987。的ΔΔCt调整然后可以用PES代替每种基因的PES计算,然后在“估计”和“对比”声明中。SAS程序如下额外的文件10

标题2'用调整后的效率计算deltadelact';

混合数据= tr2 =数据;

类类欺诈;

模型Ct = Con Class Con*Class/SOLUTION NOINT;

对比'拦截'课堂0.925-0.925-0.9870.987

估计“拦截”类0.925-0.925-0.9870.987/ cl;

用于分析的SAS输出在SASOutput.doc中(附加文件3.).的ΔΔCt调整因此-1.0901和变化是重要的吗P.价值非常小。该比率可以表示如标准ΔΔCT方法中所讨论的。该实施例中的比率的点估计为2.129,95%置信区间是(1.926,2.353)。

总的来说,在优化程度较低的PCR反应中,统计分析不仅复杂,而且在精度和效率方面也存在一定的问题。因此,在使用低质量的实时PCR数据进行统计分析时应谨慎,因为低质量的实时PCR数据容易因效率调整而产生误差[10.18.].

结论

在这份报告中,我们提出了实时PCR数据的统计分析四个模型和数据质量控制的一个过程中。SAS程序是为所有的应用程序开发,并分析样品的数据集。用不同的模型和程序的分析产生ΔΔCT和类似置信区间相同的估计。数据质量控制和分析程序,将有助于建立强大的系统研究与实时PCR相对基因表达。

方法

植物材料,RNA提取,实时PCR和样本数据集

示例数据集(表1)用于分析来自下面描述的实验。拟南芥蒂利亚纳(COL1)植物在23℃下在生长室中生长,14小时光,4周。用Rneasy植物迷你套件(Qiagen,Inc.)分离出总RNA(Qiagen,Inc.),从甲基己酸盐处理拟南芥, alamethecin治疗拟南芥用柱上DNA酶(Qiagen, Inc.)处理去除DNA污染。用iScript cDNA合成试剂盒(BioRad Laboratories)以20 μL反应将1微克总RNA合成为第一链cDNA。将cDNA稀释成10 ng/μL、2 ng/μL、0.4 ng/μL和0.08 ng/μL的浓度序列。使用Applied Biosystems公司的ABI 7000序列检测系统(Applied Biosystems)对每个浓度进行3个重复的实时PCR实验。以泛素为内参基因,引物序列为拟南芥利用Primer Express软件(Applied Biosystems)设计目的基因(MT_7)引物,序列分别为CCGCGGTACAAACCTTAATT (F)和TGGAACTCGATTCCCTCAAT (R), MT-7基因为MT_7拟南芥蒂利亚纳对法牛酸具有高催化特异性的蛋白质的基因AT3G44860 [22.].进行引物滴定和解离实验,避免引物二聚体或假扩增子干扰实验结果。real-time PCR实验结束后,内参基因和靶基因的Ct值均采用自动基线和手动阈值法提取。

实时PCR实验设计,数据输出,转换和编程

效率标定法和ΔΔCt法的一个主要局限性是仅使用一套cDNA样品来确定扩增效率。假设只要引物和扩增条件相同,其他cDNA样品的扩增效率也相同。然而,扩增效率不仅取决于引物的特性,而且在不同的cDNA样本之间也存在差异。仅用一组测试样品的标准曲线来推导放大效率,可能会忽略样品差异带来的误差。在我们的实验设计中,我们对所有样本和相关基因进行了四种浓度三次重复的标准曲线实验。ΔΔCt将仅从标准曲线得出,并对每个基因和样本组合的数据质量进行检查。本文以两个样品为例进行了分析。每个样品至少需要三个浓度的两个重复的pcr。虽然需要付出更多的努力,但严格的数据质量控制和基于统计模型的数据分析使数据更加可靠。

输出数据集包括CT号,基因名称,样本名称,集中和复制。我们使用了微软®Excel从ABI 7000序列分析系统中打开导出的Ct文件,然后将数据转换为制表符分隔的文本文件,以进行SAS处理。样本数据集如表所示1

所有程序均采用SAS 9.1 (SAS Institute)开发。

参考文献

  1. 1。

    克莱恩D:使用实时PCR技术定量:应用和限制。Mol Med的趋势2002年,8:257 - 260。10.1016 / s1471 - 4914 (02) 02355 - 9

    中科院文章谷歌学术

  2. 2。

    巴斯廷SA:实时逆转录聚合酶链反应测定mRNA的绝对定量。J Mol Endocrinol.2000年,25:169-93。10.1677 / jme.0250169

    中科院文章PubMed谷歌学术

  3. 3.

    Mocellin S, Rossi CR, Pilati P, Nitti D, Marincola FD:定量实时PCR:癌症研究中强大的盟友。Mol Med的趋势2003年,9:189 - 195。10.1016 / s1471 - 4914 (03) 00047 - 9

    中科院文章谷歌学术

  4. 4.

    Mason G,Provero P,Vaira Am,Accotto GP:利用实时荧光定量PCR技术估算转化植物的整合数量。BMC生物技术2002年,2:20.10.1186 / 1472-6750-2-20

    pmed中央文章PubMed谷歌学术

  5. 5.

    Heid CA, Stevens J, Livak KJ, Williams PM:实时定量PCR。基因组res.1996年,6:986-994。

    中科院文章PubMed谷歌学术

  6. 6.

    Gibson UE, Heid CA, Williams PM:一种新的实时定量RT-PCR方法。基因组res.1996年,6:995 - 1001。

    中科院文章PubMed谷歌学术

  7. 7。

    Pfaffl MW:实时RT-PCR中相对量化的新数学模型。诊断酸Res2001年,29:2002 - 2007。10.1093 / nar / 29.9.e45

    文章谷歌学术

  8. 8。

    pfaffl mw,horgan gw,dempfle l:相对表达软件工具(REST(C))用于实时PCR中相对表达结果的分组比较和统计分析。诊断酸Res2002年,30:E36。10.1093 / NAR / 30.9.e36

    pmed中央文章PubMed谷歌学术

  9. 9。

    Livak KJ, Schmittgen TD:利用实时荧光定量PCR技术分析相关基因表达数据-ΔΔct方法。方法2001年,25:402 - 408。10.1006 / meth.2001.1262

    中科院文章PubMed谷歌学术

  10. 10。

    Cook P,Fu C,Hickey M,Han Es,Miller Ks:SAS实时RT-PCR程序具有多个独立样本。生物技术2004年,37:990-995。

    中科院PubMed谷歌学术

  11. 11.

    Zenoni S, Reale L, Tornielli GB, Lanfaloni L, Porceddu A, Ferrarini A, Moretti C, Zamboni A, Speghini A, Ferranti F, Pezzotti M:下调佩妮矮牵牛α-扩展蛋白基因PhEXP1减少细胞壁中的晶状纤维素的数量,导致花瓣枝干的表型改变。植物细胞2004年,16:295-308。10.1105 / TPC.018705

    pmed中央中科院文章PubMed谷歌学术

  12. 12.

    Eleaume H,Jabbouri S:对实时定量RT-PCR中的两个标准化方法的比较金黄色葡萄球菌体外生长过程中的基因表达。J Micro方法2004年,59:363 - 370。10.1016 / j.mimet.2004.07.015

    中科院文章谷歌学术

  13. 13。

    沉H,他LF,Sasaki T,Yamamoto Y,Zheng Sj,Ligaba A,Yan XL,Ahn SJ,Yamaguchi M,Hideo S,Matsumoto S:柠檬酸盐分泌与铝应力下大豆根尖的调节耦合。转录,翻译和苏氨氨基磷酸化的um-调节血浆膜H的磷酸化+腺苷三磷酸酶。植物理性2005年,138:287 - 296。10.1104 / pp.104.058065

    pmed中央中科院文章PubMed谷歌学术

  14. 14。

    Kutner MH,Nachtsheim CJ,Neter J,William L:应用线性统计模型.第五版。麦格劳 - 山,伊尔文,加利福尼亚州;2005年。

    谷歌学术

  15. 15.

    霍尔丹M,Wolfe da:非参数统计方法.John Wiley and Sons,纽约;1973:503。

    谷歌学术

  16. 16.

    Bustin SA, Benes V, Nolan T, Pfaffl MW:定量实时RT-PCR - 一种观点。J Mol Endocrinol.2005年,34:597-601。10.1677 / JME.1.01755

    中科院文章PubMed谷歌学术

  17. 17。

    Pattyn F Speleman F De Paepe A Vandesompele J:RTPRIMERDB:实时PCR引物和探头数据库。诊断酸Res2003年,31日:122 - 123。10.1093 / nar / gkg011

    pmed中央中科院文章PubMed谷歌学术

  18. 18。

    Peirson Sn,Butler Jn,Foster RG:实验验证与定量实时PCR数据分析的新颖和常规方法。诊断酸Res2003年,31日:药剂。10.1093 / nar / gng073

    pmed中央文章PubMed谷歌学术

  19. 19。

    刘伟,圣达:基于聚合酶链反应动力学模拟的基于仿真的实时逆转录聚合酶链反应测定的新定量方法。学生物化学肛门2002年,302:52-59。10.1006 / abio.2001.5530

    中科院文章PubMed谷歌学术

  20. 20.

    Tichopad A,Dilger M,Schwarz G,Pfaffl MW:从单一反应装置中标准化测定实时PCR效率。诊断酸Res2003年,31日:e122。10.1093 / nar / gng122

    pmed中央文章PubMed谷歌学术

  21. 21.

    拉斯穆森r:量化光轮。快速循环实时PCR,方法和应用;海德堡.编辑:Meuer S, Wittwer C, Nakagawara K.施普林格出版社;2001:21-34。

    章节谷歌学术

  22. 22。

    杨勇,袁JS,罗斯Ĵ,诺埃尔JP,Pichersky E,陈F:一个拟南芥蒂利亚纳甲基转移酶能甲基化法尼酸。拱生物学习生物糖2005年,媒体。纠正证明证明

    谷歌学术

下载参考

作者信息

从属关系

作者

相应的作者

对应到C Neal Stewart JR

额外的信息

作者的贡献

JSY进行了实时PCR实验,建立了统计模型和SAS分析程序,并起草了文章。AR在SAS编程和数据建模方面提供了帮助。FC为实时PCR实验提供了帮助。中新社负责监督工作,概念化非参数要素,并最终确定草案。

电子补充材料

附加文件1:SAS程序实现数据质量控制过程。(SAS 864字节)

12859 _2005_824_moesm2_esm.txt

附加文件2:数据提供了Program1_QC的输入数据。sas和Program3_ANCOVA.sas。数据根据样本和基因的不同组合对Ct值进行了分组。(TXT 690字节)

附加文件3:所有分析的缩写SAS输出。(DOC 48 KB)

附加文件4:SAS程序实现多元回归模型并导出ΔΔct。(SAS 608字节)

12859_2005_824_MOESM5_ESM.txt

附加文件5:program2_mr.sas的输入数据,其中包含样本,基因,浓度和ct号。(TXT 1 KB)

附加文件6:SAS程序实现Ancova模型并导出ΔΔct。(SAS 441字节)

12859_2005_824_moesm7_esm.sas.

附加文件7:SAS程序在ΔCt上执行学生t测试和Wilcoxon两组测试来推导ΔΔCt。(SAS 580字节)

附加文件8:SAS程序是一个宏,用于导出Wilcoxon两组测试的置信区间。(SAS 5 KB)

附加文件9:program4_tw.sas的输入数据。数据仅包含示例名称和Δct。(TXT 408字节)

附加文件10:SAS程序对等式斜率进行测试,分组斜率和调整后的ΔΔct。(SAS 2 KB)

附加文件11:Program5_LowQualityData.sas的输入数据。(txt 317字节)

作者为图像提交的原始文件

下面是作者提交的原始图片文件的链接。

图1中作者的原始文件

图2中作者的原始文件

权利和权限

开放访问本文在“生物资源”中央有限公司的许可下公布了这是一个开放式访问条款,分配根据创意公约归欧宝体育2021足球欧洲杯买球平台因许可证的条款(https://creativecommons.org/licenses/by/2.0)提供任何介质中的不受限制使用,分发和再现,所以提供了正确的工作。

重印和权限

关于这篇文章

引用这篇文章

元,J.S.,芦苇,A.,陈,F.等等。实时PCR数据的统计分析。欧宝娱乐合法吗7,85(2006)。https://doi.org/10.1186/1471-2105-7-85

下载引用

关键词

  • 参考基因
  • 扩增效率
  • 数据质量控制
  • 简单线性回归模型
  • 对数转换后的浓度