跳到主要内容

实时PCR数据的统计分析

抽象的

背景

尽管实时PCR广泛应用于生物医学科学,但仍然缺乏用于分析定量实时PCR的数据处理程序;特别是在适当的统计治疗领域。置信区间和统计显着性考虑不明确在许多当前数据分析方法中。基于标准曲线方法和其他有用的数据分析方法,我们展示并比较了四种统计方法和模型来分析实时PCR数据。

结果

在第一种方法中,建立了一个多元回归分析模型来估计基因和治疗效果的相互作用来推导ΔΔCt。在第二种方法中,提出了ANCOVA (analysis of covariance)模型,ΔΔCt可以从变量的影响分析中得到。其他两个模型包括计算ΔCt,然后是两组t -检验和非参数类似Wilcoxon检验。针对所有四种模型开发了SAS程序,并给出了用于分析样本集的数据输出。在此基础上,建立了基于SAS的数据质量控制模型。

结论

具有SAS程序的实用统计解决方案是为实时PCR数据开发的,并使用SAS程序分析了示例数据集。使用各种模型和程序的分析产生了类似的结果。这里提出的数据质量控制和分析程序提供了使用实时PCR估计基因的相对表达的统计元素。

背景

实时荧光定量PCR是基因表达分析中最敏感、最可靠的定量方法之一。已广泛应用于微阵列验证、病原体定量、癌症定量、转基因拷贝数测定和药物治疗研究[1-4.].PCR具有三个阶段,指数相位,线性相位和平台相,如图所示1.指数阶段是PCR中最早的阶段,因为试剂不受限制,所以产物呈指数增长。线性相的特征是随着PCR试剂变得有限,产物呈线性增长。PCR最终将在后期的周期中达到平稳期,产物的数量不会因为一些试剂耗尽而改变。Real-time PCR利用了在理想条件下,指数阶段PCR产物的数量与初始模板的数量成正比的事实[5.6.].在指数相位PCR产物期间,如果效率是完美的,则在每个周期中理想地加倍,即100%。如果PCR条件,引物特性,模板纯度和扩增子长度是最佳的,则可以使PCR扩增效率接近指数阶段的100%。

图1
图1

实时聚合酶链反应.(A)给出了PCR循环数与PCR产物数量的理论曲线图。聚合酶链反应可以观察到三个阶段:指数阶段、线性阶段和平台阶段。(B)为PCR循环数与对数PCR产物量的理论图。面板(C)是ABI 7000实时PCR仪连续稀释实验的输出。

基因组DNA和逆转录的cDNA可以用作实时PCR的模板。通常通过Sybr Green或DNA杂交探针如分子信标或Taqman探针(Applied Biosystems)等DNA结合染料观察PCR的动态,例如Sybr Green或DNA杂交探针[2].实时PCR的基础是具有扩增子数量的染料之间的直接正相关。如图所示(1 b1 c),以对数2为基础的变换后的荧光信号与周期数的曲线将得到荧光信号的对数与原始模板量的线性范围。然后可以设置基线和阈值以进行进一步分析。基于log的荧光阈值水平的循环数被定义为Ct数,这是大多数实时PCR实验中观察到的值,因此是感兴趣的主要统计度量。

实时荧光定量PCR数据是绝对和相对定量的。绝对定量使用内部或外部校准曲线来推导输入模板拷贝数。在需要确定确切的转录本拷贝数的情况下,绝对定量是很重要的,而相对定量对于大多数生理和病理研究来说就足够了。相对量化依赖于靶基因与内参基因表达的比较,以及靶样本与内参样本中相同基因表达的比较[7.].

由于相对定量是大多数实时PCR实验的目标,已经开发了一些数据分析程序。应用非常广泛的有两种数学模型:效率校准模型[7.8.]和ΔΔCt模式[9.].两种模型的实验系统都是相似的。实验将涉及对照样品和处理样品。对于每个样品,将靶基因和用于内部对照的参考基因包括来自连续稀释的等分试样的PCR扩增。通常,几种重复用于每个稀释的浓度以导出扩增效率。PCR扩增效率可以定义为百分比(从0到1),或随着PCR产物每循环增加(1至2)的时间。除非指定为扩增效率(PE)百分比,否则我们将扩增效率(e)提及本文中的PCR产物增加(1至2)。效率校准模型是更广泛的ΔΔCT模型。首先绘制CT编号,针对cDNA输入(或对数cDNA输入),并计算图的斜率以确定放大效率(E)。然后通过从对照样品中减去CT靶样品来计算每个基因(靶或参考)的ΔCt。 As shown in Equation1,靶基因表达率与对照的比值可由靶基因效率(E目标)到目标ΔCt (ΔCt目标)和内参基因效率(E参考),请参阅ΔCt (ΔCt参考).如果目标和参考基因都达到其最高PCR扩增效率,则可以从效率校准模型导出ΔΔCT模型。在这种情况下,目标效率(例如目标)和控制效率(E控制) = 2,表示每个周期扩增子倍增,则由2得到相同的表达比——ΔΔCt[7.9.].

R. 一个 t o = E. t 参数 e t Δ C t t 参数 e t E. r e f e r e n c e Δ C t r e f e r e n c e E. u 一个 t o n 1 MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaemOCaiNaemyzauMaemOzayMaemyzauMaemOCaiNaemyzauMaemOBa4Maem4yamMaemyzaugabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdkhaYjabdwgaLjabdAgaMjabdwgaLjabdkhaYjabdwgaLjabd6gaUjabdogaJjabdwgaLbqabaaaaaaakiaaxMaacaWLjaGaemyrauKaemyCaeNaemyDauNaemyyaeMaemiDaqNaemyAaKMaem4Ba8MaemOBa4MaeeiiaaccbiGae8xmaedaaa@79AC@

ΔCtt参数=Ct控制-Ct治疗和ΔCt参考=Ct控制-Ct治疗

比率= 2-ΔΔCt等式2

ΔδCtCt参考——ΔCtt参数

虽然效率校准模型和ΔΔCt模型在基因表达研究中得到了广泛的应用,但对分析每个实验因素的影响以及显著性检验的统计考虑进行深入讨论的论文并不多。为数不多的采用大量统计分析的研究之一使用了REST®程序 [8.].本文提出的软件是基于效率校准模型,采用随机检验获得显著性水平。然而,文章并没有提供一个详细的模型,以说明不同的实验因素所涉及的影响。另一项实时PCR数据的统计研究使用简单线性回归模型通过Ct计算来估计比例[10].然而,基于对数的荧光被用作模型中的依赖变量,我们认为不充分反映实时PCR数据的性质。因此,CT应该是统计分析的依赖变量,因为它是通过治疗,浓度和样品效应直接影响的结果值。这两项研究都使用了效率校准的模型。尽管出版了这两种方法,但许多研究文章出版的实时PCR数据实际上不存在P.值及置信区间[11-13].我们认为,这些统计数据是可促进对数据的强大解释。

先天的,我们认为置信区间和P.ΔΔCt数据的价值是非常重要的,因为这些直接影响比率的解释。如果没有适当的统计建模和分析,对实时PCR数据的解释可能导致研究者得出假阳性结论,这在临床应用中尤其可能带来麻烦。在此,我们开发了四种统计方法来处理实时PCR数据,使用改进的ΔΔCt方法。通过修改,统计方法可以适用于其他数学模型。SAS项目实施的方法和数据控制与实时PCR从业者的想法,以交钥匙数据分析。标准差,置信水平和P.值直接从SAS输出呈现。我们还包括对在线补充材料中分析的样本数据集和SAS程序的分析。

结果与讨论

数据质量控制

从两种用于实时PCR数据相对定量的数学模型中,我们观察到数据质量标准之间的差异。对于效率校准方法,描述此过程的作者[7.假设每个基因(靶和参考)的扩增效率在不同的实验样品中是相同的(治疗和对照)。相反,虽然不需要2的放大效率,但是通过假设所有反应应达到2的放大效率,ΔΔCT方法更严格。换句话说,产物的量应该在每个周期期间加倍[9.].此外,ΔΔCT方法假设每个样品的PCR扩增效率为2,如果一组样品的PCR达到全扩增效率。然而,这种假设忽略了不同cDNA样品的效果。

可以通过相关模型检查数据质量。即使检查CT数和浓度之间的相关性可以提供有效的质量控制,也可以采取更好的方法来检查CT和对数之间的相关性(基本2)模板的变换浓度,这应该为每个的模板产生显着的简单线性关系基因和样品组合。例如,对于对照样品中的靶基因,CT数应与等式中简单的线性回归模型后的对数转换浓度相关联3..在等式中,Xlcon代表对数转换的浓度,β0.代表回归线的截距,βcon表示回归线的斜率[14].从回归分析来看,可接受的实时PCR数据应具有两个特点。首先,斜率不应与-1有显著差异。第二,所有四种基因和样本组合的斜率如表所示1不应该有明显的不同。开发了SAS程序来执行Program1_QC中的数据质量控制。sas (额外的文件1).

表1待分析的样品实时PCR数据。在这个数据集中,有两种类型的样本(处理和控制);两个基因(参照基因和靶基因);以及每种基因和样本组合的四种浓度。为了进行数据质量控制和ANCOVA分析,real-time PCR样本数据集可根据样本与基因的组合情况分为四组。对照组-靶组联合效应分为组1、治疗-靶组2、对照组-参照组3和治疗-参照组4。

ct =β.0.+βconXlcon+ε等式3.

输入数据分组如表所示1额外的文件2.每一个基因和样本的组合被分为一组,从1到4。根据上述模型,使用SAS程序Proc Mixed对每组进行简单线性回归。估计了斜率的95%置信水平,预计与-1没有显著差异。用于分析样本数据集的缩写SAS输出见SASOutput.doc (额外的文件3).基于95%的置信水平,所有四个组的CT和对数转化浓度的倾斜度与-1没有显着差异。除了数字输出外,该程序还提供了数据质量的可视化,如图所示2,其中CT编号绘制对数转换的模板浓度。在CT编号和对数转换的浓度之间应该观察到简单的线性关系。

图2.
figure2

数据质量控制.四类代表了四种不同组合的样品和基因组合,其是对照样品中的参考基因,对照样品中的靶基因,治疗样品中的参考基因,以及治疗样品中的靶基因。每个类应导出CT和对数之间的线性相关性,具有斜率-1的浓度PF PCR产品。

多元回归模型

ΔΔCt方法需要考虑几种影响,即治疗、基因、浓度和复制的影响。如果我们将这些效应视为定量变量,并有与这些多重效应及其相互作用相关的Ct数,我们可以建立一个多元回归模型,如式4所示。

Ct=β0.+βconX图标+β对待Xitreat+β基因Xigene+βcontreatX图标Xitreat+βcongeneX图标Xigene+βgenetreatXigeneXitreat+βcongenetreat.X图标XitreatXigene+ε方程4

在这个模型中,Ct是真实相关的β0.是拦截,βxs是相应x(独立)术语的回归系数,ε为误差项[14].该模型考虑浓度,治疗,基因及其相互作用的影响。我们主要对基因和治疗之间的相互作用感兴趣,这解决了治疗与对照样品的靶基因与参考基因之间的CT差异的程度:即,ΔΔct。因此可以从β的不同组合值估计ΔΔctgenetreat.表中的四组1也代表了治疗和基因联合作用的选择。目的是统计检验治疗样本和对照样本中靶基因和内参基因之间的差异。因此,无效假设为靶基因和内参基因的Ct差异在治疗样本与对照样本中是相同的,可以用组合效应(CE)表示为:CE1-CE3 = CE2-CE4。另一个公式是:CE1-CE2-CE3+CE4 = 0,这将得到ΔΔCt的估计。如果不拒绝原假设,则ΔΔCt与0没有显著差异,否则,ΔΔCt可以从检验的估计中得到。这样我们就可以对β的不同组合效应进行检验genetreat并从中估算出ΔΔCt。如式中的ΔΔCt公式所示2,如果ΔΔct等于0,则该比率为1,这表明对照和治疗之间的基因表达没有变化。

一个用于多元回归模型的SAS程序

在Program2_MR中使用SAS程序PROC GLM进行ΔΔCt估计。sas在额外的文件4.多元回归模型在模型语句中陈述。基因和治疗的综合效应在评估和对比声明中进行了评估。对比语句检验CE1-CE2-CE3+CE4 = 0的原假设,参数估计得到ΔΔCt值。说明SAS输入文件在额外的文件5多元回归的SAS输出位于SasOutput.doc(额外的文件3).

SAS输出对数据进行了非常全面的分析。我们对分析的两个方面感兴趣。首先,我们想测试ΔΔct值是否与0ΔΔct值明显不同P.= 0.05。如果ΔΔct与0没有显着差异,则我们得出结论治疗对靶基因表达没有显着影响;否则,结论了逆。如果效果显着,我们对ΔΔCt值的标准偏差感兴趣,我们可以从中得出如稍后所讨论的基因表达的比率。SAS输出为ΔΔct提供点估计(-0.6848)和标准误差(-0.1185)。PROC GLM或PROC混合在本申请中可互换。如果实验涉及多种生物学重复,还可以通过修改SAS程序来考虑复制效果。然后估计将是基因,治疗和复制的综合作用。

分析协方差和SAS代码

另一种接近实时PCR数据分析的方法是通过使用协方差(ANCOVA)的分析。可以导出简化模型将数据转换为如表所示的分组数据1额外的文件2得到式5。

Ct=β0.+βconX图标+β集团XIgroup.+βgroupconXIgroup.X图标+ε方程5

我们感兴趣的是两个问题。首先,四组的协方差调整后的平均值是否相等?第二,经内参基因校正后,治疗样本与对照样本的靶基因值Ct差异有多大?在这种情况下,null假设将是(μ2-μ1)-(μ4-μ3) = 0,并且测试将产生一个参数估计ΔΔCt,如Program3_ANCOVA所示。sas (额外的文件6).

实现Ancova模型的SAS代码类似于多元回归模型。可以采用SAS程序PROC GLM或PROC混合来实施ANCOVA模型;我们使用Proc在这里混合。类语句定义将分组哪些变量进行重要性测试。在这种情况下,变量是浓度和组,并且Ancova假设这些性质上是共同的。对比度和估计陈述用于对比组效应,其将产生ΔΔCt(-0.6848),以及其标准误差(0.1185)和95%置信区间(-0.9262,-0.4435)。SAS输出具有置信水平和P.值显示在sasoututs .doc (额外的文件3).

简化的替代品,T.- 最低和Wilcoxon两组测试

更简单的方法可以用来分析实时数据,每次实验都有生物重复。该方法的主要假设是,通过将靶基因的Ct数减去内参基因的Ct数,可以调节浓度、基因和复制的加性效应,得到ΔCt如表所示2.因此,用于治疗和控制的Δct可以进行简单t-test,将得到ΔΔCt的估计。

表2 ΔCt计算。表格为ΔCt的计算公式,该公式由目的基因Ct数减去内参基因Ct数得到。Con代表专注。

作为非参数的替代t-test,Wilcoxon两组测试也可用于分析两个ΔCt值的两个池。两个假设t -测试是两组ΔCt将具有高斯分布,它们将具有相同的差异。然而,这些假设在许多实时PCR实验中不适用于使用现实的小样本尺寸。因此,在这种情况下,无分布的Wilcoxon测试将是更强大和适当的替代方法[15].

一个SAS程序已经为两者开发t -测试和Wilcoxon两组测试,如附件程序4_TW.SAS所示(额外的文件7).采用SAS程序、TTEST和UNIVARIATE进行数据分析。SAS Macro的摩西。sas (15] 在额外的文件8已被雇用派对置信水平。SAS输入文件已在额外的文件9和用于样本数据分析的SAS输出可在SASOutput.doc (额外的文件3).由于差异的估计导出从对照样品中减去处理,因此实际ΔΔct应该是输出估计的倒数。

四种方法的比较和数据呈现

表中给出了四种方法的比较3..多元回归和ANCOVA产生与Δ​​ΔCT估计的结果完全相同的结果,因为两种方法都采用相同的数学方法进行参数估计。这t-test提供了与ΔΔCt相同的点估计,但是标准误差略大,导致置信区间较大。Wilcoxon两组检验提供了一个略小的ΔΔCt估计。四种方法的高度相似的结果验证了模型和SAS程序。模型和程序的选择将取决于实验设计和实验的严格程度和质量。然而,由于其非参数性质,最保守的检验是Wilcoxon两组检验,它是分布无关的。

表3四种方法的比较。该表列出了ΔΔCt,标准误差,P.- 从文章中提出的四种方法中衍生的价值和置信区间。SAS封装和宏都没有使用的宏为Wilcoxon两组测试提供标准错误。我们认为置信区间足以进一步进行数据转换。

数据质量控制

许多当前的实时PCR实验不包括标准曲线设计,也不包括它们使用方法来估计放大效率。我们争辩于这里,没有适当质量控制的实时PCR数据不可靠,因为实时PCR的效率可能对比率估计和动态范围产生重大影响。例如,如果PCR具有0.8的扩增效率(PE)的百分比(即PCR产物将增加20.8时间代替每循环的两次),ΔCt值为3只能转化为比率的5.27倍而不是8次。当ΔΔct或Δct值较大并且放大效率较低时,该问题变得放大,这可能导致严重倾斜的解释。

因此,我们根据本文中提出的SAS程序提出了根据模型的实时PCR数据质量控制的两个标准。首先,需要包括串联稀释模板的实验,以便估计每个样品的每个基因的扩增效率。一些研究人员假设每个基因的扩增效率在不同的样品中是相同的,因为使用相同的引物对和扩增条件。但是,我们发现样品效果对放大效率产生了影响。换句话说,当从不同的cDNA模板样品扩增时,扩增效率可能不同于相同的基因。因此,我们认为对每个基因的标准曲线和样品组合的实验设计作为最佳状态。其次,在最佳条件下,如果对对数(基于2的)模板量的CT次数的图应产生与-1没有显着不同的斜率,这表明了近2个放大效率。尽管效率校准模型和改性ΔΔCT模型耐受低于2的放大效率,但通过优化引物选择,扩增子长度和实验条件,可以获得与扩增效率的所有反应。根据我们的经验,维护附近的所有放大效率是在样品中达到同等放大效率的最佳方法,从而确保高质量的数据。还观察到,近2个放大效率可以有助于扩展比率估计的动态范围。

P.-value、置信区间和数据表示

P.-Value是显着水平的重要参数,置信区间有助于建立ΔΔCT估计的可靠范围。目前最新的实时PCR出版物不存在P.-值和置信区间[11-13].我们相信披露P.- 当研究人员索取样品或治疗之间的差异表达时,值是重要的。在我们出示的计划中,所有的P.-value来自于测试ΔΔCt等于0的空假设。因此,一个小P.-value表示ΔΔCt与0显著不同,说明效果显著。a的解释P -价值取决于实验目标。例如,在P.= 0.05,则说明处理效果显著;在组织比较实验中,我们可以断言基因表达在组织之间有显著差异。

一些出版物的标准偏差与一个有意义的指标的比例呈现。然而,我们在此辩论,比率的标准偏差应该从ΔΔct的标准偏差导出;并且比率的置信区间应该源自ΔΔct的置信区间。换句话说,比率的点估计应该是2——ΔΔCt比例的置信区间应该是(2——ΔΔCtHCL, 2-ΔΔctlcl).由于Ct是实验过程中观察到的值,所以应该进行统计分析。直接按比率进行统计分析的做法是不恰当的。数据的表示需要参考ΔΔCt以及随后由2推导出的比率和置信区间-ΔΔct。

对扩增效率小于2的实时PCR数据进行统计分析

如前所述,通过适当的扩增引物、RNA质量和cDNA合成方案,PCR扩增效率可优化为2左右。实时PCR引物设计的最新进展使实验优化变得更容易[1617].然而,在严格控制实验条件的情况下,实时PCR的数据可能会出现不足。对于次优实时PCR数据有三种情况。在第一种情况下,所有PCR反应的扩增效率相同,但不同于2。在第二种情况下,PCR扩增效率仅因基因而异。换句话说,同一基因在所有生物样本中的扩增效率是相同的;然而,不同基因的扩增效率不同。在第三种情况下,PCR扩增效率因基因和样本的不同而不同。我们认为第三种情况的数据与许多其他情况报告的数据一样不可接受[1018].在任何这些情况下,通过在SAS计划的“估计”和“对比”声明中包括PE,可以从ANCOVA模型中得到调整后的ΔΔCt。

已经开发了几种方法来计算低质量数据的放大效率。其中一种方法称为“动态数据分析”,利用PCR反应的荧光史来计算扩增效率[1920.].该方法的优点在于能够分析低质量的数据,避免了标准曲线,节省了成本。然而,由于数学上的复杂性和可靠性争议,该方法的应用并不像传统的标准曲线方法那样广泛[101618].在我们的方法中,已经存在一个标准曲线,可以用来推导放大效率(E)。考虑方程中简单的线性回归模型3., 如果Xlcon表示以10为基础的对数变换浓度,放大效率(E)为10- (1 /斜率) 10 1 / β con MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIXaqmcqaIWaamdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa@3921@ 根据Ramussen 2001和Pfaffl 2001 [7.21].在我们的模型中,Xlcon表示以2为基础的对数变换浓度,因此放大效率(E)为2- (1 /斜率) 2 1 / β con 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIYaGmdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa @ 3835 @ ,其中PE可表示为-(1/β)con).

在上面讨论的第一种情形中,所有PCR扩增的效率是相同的,但效率不等于1。则基因表达率可表示为:

R. 一个 t o = E. Δ Δ C t = [ 2 1 / β c o n Δ Δ C t = 2 Δ Δ C t * P. E. E. u 一个 t o n 6. MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpcqWGfbqrdaahaaWcbeqaaiabgkHiTiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabcUfaBjabikdaYmaaCaaaleqabaGaeyOeI0IaeiikaGIaeGymaeJaei4la8ccciGae8NSdi2aaSbaaWqaaGqaciab gavjab + ngaJjab + 9 + 5 gaubqabawccqggpaqkaagccqggdbqxdaahaawcbeqaaiabgkhitiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabikdaymaacaaaleqabagaeyoei0iaeuildqkaeuildqkaem4qamkaemidaqnaeiokaoiaemiuaalaemyraueaaogaaczcaiaaxmaacqwgfbqrcqwgxbqccqwg1bqdcqwghbqycqWG0baDcqWGPbqAcqWGVbWBcqWGUbGBcqqGGaaicqGF2aGnaaa@6ABA@

体育= - (1 /βcon),ΔΔct.调整=PE *ΔΔCt

在等式6,βcon为Ct与以对数2为基础的浓度的曲线的合并斜率。的βcon可以用SAS中的相关函数计算,如Program5_LowQualityData.sas所示额外的文件10.在第二种情况下,扩增效率仅因基因而异。根据方程1,我们有以下等式,其中β0.是CT的绘图坡度是否对日志2(浓度)为每个基因。

R. 一个 t o = E. t 参数 e t Δ C t t 参数 e t E. c o n t r o l Δ C t c o n t r o l = [ 2 1 / β c o n T. 参数 e t Δ C t t 参数 e t [ 2 1 / β c o n C o n t r o l Δ C t c o n t r o l = 2 P. E. t 参数 e t Δ C t t 参数 e t P. E. c o n t r o l Δ C t c o n t r o l E. u 一个 t o n 7. MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaem4yamMaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9maalaaabaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWliiGacqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4MaemivaqLagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaaaaaGcbaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWlcqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4Maem4qamKaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9iabikdaYmaaCaaaleqabaGaeiikaGIaemiuaaLaemyrau0aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaWccqGHxiIkcqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabgkHiTiabdcfaqjabdweafnaaBaaameaacqWGJbWycqWGVbWBcqWGUbGBcqWG0baDcqWGYbGCcqWGVbWBcqWGSbaBaeqaaSGaey4fIOIaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaWccqGGPaqkaaGccaWLjaGaaCzcaiabdweafjabdghaXjabdwha1jabdggaHjabdsha0jabdMgaPjabd + gaVjabd6gaUjabbccaGGqaciab + Dda3aaa@F60B@

体育目标= - (1 /βcont),体育控制= - (1 /βconControl),ΔΔct.调整=体育目标*Δct.目标-体育控制*Δct.控制

在等式7中,βcontβconControl分别为靶基因和内参基因的以对数为基础的浓度的Ct图的合并斜率。坡度可以通过Program5_LowQualityData计算。sas (附加文件10.).这ΔΔct.调整可以用相同的程序计算。从理论上讲,当PCR扩增效率因基因和样本不同而不同时,也可以推导出第三种情况的方程。但在实际应用中,由于放大效率变化较大,我们不认为第三种方案的数据是可接受的[1018].

program5_lowquatilitydata.sas附加文件10.提供解决方案,以在第一和第二场景中导出调整的ΔΔct。低正式DATA.txt中提供了具有不同基因的扩增效率的数据集.TXT附加文件11.来说明SAS程序的使用。由于实验中所涉及的重复次数有限,数据集的质量较低。计算的过程包括四个步骤ΔΔct.调整.第一步是执行如Methods所示的数据质量控制测试。从SAS输出中,我们可以得出结论,LowQualityData数据集不满足2的要求——ΔΔCt方法,因为其中一组PCR扩增效率明显不同于1,如SASOutput.doc (额外的文件3).

第二步是通过观察lcon和类相互作用的III型平方和来检验相同的PCR效率(或斜率)。一个低p值将指示不同组PCR(类)与对数转化的浓度的相互作用,这反过来表示不同的PCR组中的不等斜率。如果所有PCR放大效率相等,则可以计算汇总放大效率并将其集成到SAS程序中ΔΔct.调整计算。在这组数据中,III型平方和有ap值小于0.05,并且扩增效率不等于所有PCR。然后对每个基因进行等于等斜率的测试以确定每个基因的PCR扩增效率是否相同。对于任一种基因,扩增效率与0.05的α没有显着差异。可以在SasOutput.doc中找到所有III型的正方形输出总和(额外的文件3).

下一步是计算汇总的斜率(βcon),得到扩增效率百分比(PE = -(1/β))con)。汇集的斜率是基于Ct和基于对数的浓度之间的相关性而得到的。的βcons的两个基因分别为-1.0813和-1.0137,如SASOutput.doc (额外的文件3),用于计算LowQualityData数据集的放大效率。与βcon-(1 /βcon)和PE分别为0.925和0.987。的ΔΔCt调整然后用PEs将“估计”和“对比”语句中的每个基因替换为1进行计算。SAS程序如下所示附加文件10.

标题2“计算调整效率的三角洲”;

混合数据= tr2 =数据;

类类欺诈;

型号CT = CON类CON *类/解决方案NOINT;

对比“拦截”类0.925-0.925-0.9870.987;

估计“拦截”类0.925-0.925-0.9870.987/ cl;

运行;

分析的SAS输出在SasOutput.doc中(额外的文件3).的ΔΔCt调整因此-1.0901和变化是重要的吗p价值很小。该比值可以用标准ΔΔCt方法中讨论的方法表示。本例中比值的点估计为2.129,95%置信区间为(1.926,2.353)。

总的来说,在优化程度较低的PCR反应中,统计分析不仅复杂,而且在精度和效率方面也存在一定的问题。因此,在使用低质量的实时PCR数据进行统计分析时应谨慎,因为低质量的实时PCR数据容易因效率调整而产生误差[1018].

结论

在本报告中,我们提出了四种实时PCR数据的统计分析模型和一种数据质量控制程序。针对所有应用程序开发了SAS程序,并对一组样本数据进行了分析。不同模型和程序的分析得到了相同的ΔΔCt估计和相似的置信区间。数据质量控制和分析程序将有助于建立可靠的系统,以研究相对基因表达的实时PCR。

方法

植物材料,RNA提取,实时PCR和样本数据集

示例数据集(表1)用于分析来自下面描述的实验。拟南芥蒂利亚纳(COL1)植物在23℃下在生长室中生长,14小时光,4周。用Rneasy植物迷你套件(Qiagen,Inc.)分离出总RNA(Qiagen,Inc.),从甲基己酸盐处理拟南芥, alamethecin治疗拟南芥用柱上DNA酶(Qiagen, Inc.)处理去除DNA污染。用iScript cDNA合成试剂盒(BioRad Laboratories)以20 μL反应将1微克总RNA合成为第一链cDNA。将cDNA稀释成10 ng/μL、2 ng/μL、0.4 ng/μL和0.08 ng/μL的浓度序列。使用Applied Biosystems公司的ABI 7000序列检测系统(Applied Biosystems)对每个浓度进行3个重复的实时PCR实验。以泛素为内参基因,引物序列为拟南芥泛素基因是CacactccactTGGTCTTGCG(F)和TGGTTTTCGGGTGAGAGTCTTCA(R)。通过引物表达软件(应用生物系统)设计了靶基因(MT_7)的引物,并且序列是CCGCGGTACAAACCTTAATT(F)和TGGAACTCGATTCCCTCAAT(R)。mt-7基因是拟南芥蒂利亚纳对法牛酸具有高催化特异性的蛋白质的基因AT3G44860 [22].进行引物滴定和解离实验,使得没有引物调光器或假冒扩增子会干扰结果。在实时PCR实验后,用自动基线和手动阈值提取参考基因和靶基因的CT数。

实时PCR实验设计,数据输出,转化,编程

效率校准方法和ΔΔCT方法的主要限制是仅采用一组CDNA样品来确定扩增效率。假设只要引物和扩增条件是相同的,就可以应用于其他CDNA样品的相同的放大效率。然而,扩增效率不仅取决于引物特性,而且在不同的cDNA样品中也变化。使用标准曲线仅用于一组测试样本来导出放大效率可能会忽略采样差异引入的错误。在我们的实验设计中,我们已经进行了标准曲线实验,其中四种浓度为所有样品和所涉及的基因。ΔΔct仅导出标准曲线,并且针对每个基因和样品组合检查数据质量。作为一个例子,本文提出了对两个样品的分析。每个样品都需要三种浓度的两种重复的PCR。尽管需要更多的努力,但基于统计模型的严格数据质量控制和数据分析,数据更可靠。

输出数据集包括Ct数、基因名称、样本名称、浓度和重复数。我们使用了微软®Excel从ABI 7000序列分析系统中打开导出的CT文件,然后将数据转换为标签分隔文本文件进行SAS处理。示例数据集如表所示1

所有程序都与SAS 9.1(SAS Institute)开发。

参考

  1. 1.

    Klein D:实时荧光定量PCR技术的应用与局限性。Mol Med的趋势2002年,8:257-260。10.1016 / s1471-4914(02)02355-9

    中科院文章谷歌学者

  2. 2.

    参赛山:使用实时逆转录聚合酶链反应测定的mRNA绝对定量。J摩尔性2000年,25:169 - 93。10.1677 / jme.0.0250169

    中科院文章PubMed.谷歌学者

  3. 3.

    Mocellin S, Rossi CR, Pilati P, Nitti D, Marincola FD:实时定量PCR:癌症研究的强大盟友。Mol Med的趋势2003年,9:189 - 195。10.1016 / s1471 - 4914 (03) 00047 - 9

    中科院文章谷歌学者

  4. 4.

    Mason G, Provero P, Vaira AM, Accotto GP:通过定量实时PCR估算转化植物的集成次数。BMC生物技术2002年,2:20.10.1186 / 1472-6750-2-20

    pmed中央文章PubMed.谷歌学者

  5. 5。

    Heid Ca,Stevens J,Livak KJ,Williams PM:实时定量PCR。基因组Res1996年,6:986 - 994。

    中科院文章PubMed.谷歌学者

  6. 6。

    Gibson UE, Heid CA, Williams PM:一种新的实时定量RT-PCR方法。基因组Res1996年,6:995-1001。

    中科院文章PubMed.谷歌学者

  7. 7.

    Pfaffl MW:实时RT-PCR中相对量化的新数学模型。Nucl酸res.2001年,29:2002 - 2007。10.1093 / nar / 29.9.e45

    文章谷歌学者

  8. 8.

    pfaffl mw,horgan gw,dempfle l:相对表达软件工具(REST(C))用于实时PCR中相对表达结果的分组比较和统计分析。Nucl酸res.2002年,30:e36。10.1093 / nar / 30.9.e36

    pmed中央文章PubMed.谷歌学者

  9. 9.

    Livak KJ,Schmittgen Td:使用实时定量PCR和2分析相对基因表达数据——ΔΔCT方法。方法2001年,25:402 - 408。10.1006 / meth.2001.1262

    中科院文章PubMed.谷歌学者

  10. 10.

    Cook P,Fu C,Hickey M,Han Es,Miller Ks:SAS实时RT-PCR程序具有多个独立样本。生物技术2004年,37:990-995。

    中科院PubMed.谷歌学者

  11. 11.

    Zenoni S, Reale L, Tornielli GB, Lanfaloni L, Porceddu A, Ferrarini A, Moretti C, Zamboni A, Speghini A, Ferranti F, Pezzotti M:下调矮牵牛织布达α棒曲霉素的基因PhEXP1减少细胞壁中的结晶纤维素的量,导致花瓣肢体的表型变化。植物细胞2004年,16:295 - 308。10.1105 / tpc.018705

    pmed中央中科院文章PubMed.谷歌学者

  12. 12.

    Eleaume H, Jabbouri S:对实时定量RT-PCR中的两个标准化方法的比较金黄色葡萄球菌在体外生长期间的基因表达。J Micro方法2004年,59:363-370。10.1016 / J.Mimet.2004.07.015

    中科院文章谷歌学者

  13. 13.

    沈华,何丽芬,Sasaki T, Yamamoto Y,郑淑娟,Ligaba A, Yan XL, Ahn SJ, Yamaguchi M, Hideo S, Matsumoto S:铝胁迫下大豆根尖柠檬酸盐的分泌与调控。质膜的转录、翻译和苏氨酸磷酸化的上调+腺苷三磷酸酶。植物理性2005,138:287 - 296。10.1104 / pp.104.058065

    pmed中央中科院文章PubMed.谷歌学者

  14. 14.

    Kutner MH, Nachtsheim CJ, Neter J, William L:应用线性统计模型.第五版。麦格劳-希尔,欧文,CA;2005.

    谷歌学者

  15. 15。

    荷兰人M,沃尔夫DA:非参数统计方法.John Wiley and Sons,纽约;1973:503。

    谷歌学者

  16. 16。

    Bustin SA, Benes V, Nolan T, Pfaffl MW:定量实时RT-PCR——一个展望。J摩尔性2005,34:597-601。10.1677 / JME.1.01755

    中科院文章PubMed.谷歌学者

  17. 17.

    Pattyn F Speleman F De Paepe A Vandesompele J:RTPrimerDB:实时PCR引物和探针数据库。Nucl酸res.2003年,31日:122 - 123。10.1093 / nar / gkg011

    pmed中央中科院文章PubMed.谷歌学者

  18. 18.

    Peirson Sn,Butler Jn,Foster RG:实时荧光定量PCR数据分析的新方法和传统方法的实验验证。Nucl酸res.2003年,31日:药剂。10.1093 / nar / gng073

    pmed中央文章PubMed.谷歌学者

  19. 19.

    刘伟,圣达:一种基于聚合酶链反应动力学模拟的实时反转录定量聚合酶链反应检测新方法。学生物化学肛门2002年,302:52-59。10.1006 / abio.2001.5530

    中科院文章PubMed.谷歌学者

  20. 20.

    Tichopad A, Dilger M, Schwarz G, Pfaffl MW:从单一反应装置中标准化测定实时PCR效率。Nucl酸res.2003年,31日:E122。10.1093 / nar / gng122

    pmed中央文章PubMed.谷歌学者

  21. 21.

    拉斯穆森r:在灯笼夹上定量。快速循环实时荧光定量PCR方法及应用海德堡.编辑:Meuer S,Wittwer C,Nakagawara K. Springer Press;2001年:21-34。

    章节谷歌学者

  22. 22.

    杨勇,袁建生,Ross J, Noel JP, Pichersky E,陈飞:一个拟南芥蒂利亚纳甲基转移酶能够甲基化法牛酸。拱生物学习生物糖2005年出版社。校样校样

    谷歌学者

下载参考

作者信息

从属关系

作者

相应的作者

对应到C Neal Stewart Jr

额外的信息

作者的贡献

JSY进行了实时PCR实验,建立了统计模型和SAS分析程序,并起草了文章。AR在SAS编程和数据建模方面提供了帮助。FC为实时PCR实验提供了帮助。中新社负责监督工作,概念化非参数要素,并最终确定草案。

电子辅料

附加文件1:SAS程序实现数据质量控制进程。(SAS 864字节)

12859_2005_824_moesm2_esm.txt.

附加文件2:数据提供了Program1_QC的输入数据。sas和Program3_ANCOVA.sas。数据根据样本和基因的不同组合对Ct值进行了分组。(TXT 690字节)

附加文件3:所有分析的缩写SAS输出。(Doc 48 KB)

附加文件4:SAS程序实现多元回归模型并导出ΔΔct。(SAS 608字节)

12859 _2005_824_moesm5_esm.txt

附加文件5:Program2_MR的输入数据。sas,包含样本、基因、浓度和Ct值。(TXT 1 KB)

附加文件6:SAS程序实现了ANCOVA模型并导出ΔΔCt。(SAS 441字节)

12859 _2005_824_moesm7_esm.sas

附加文件7:SAS程序在ΔCt上执行学生t测试和Wilcoxon两组测试来推导ΔΔCt。(SAS 580字节)

附加文件8:SAS程序是宏,可源于Wilcoxon两组测试的置信区间。(SAS 5 KB)

附加文件9:program4_tw.sas的输入数据。数据仅包含示例名称和Δct。(TXT 408字节)

附加文件10:SAS程序对等式斜率进行测试,分组斜率和调整后的ΔΔct。(SAS 2 KB)

附加文件11:Program5_LowQualityData.sas的输入数据。(txt 317字节)

作者的原始提交的图像文件

以下是与作者的原始提交的图像的链接。

图1中作者的原始文件

图2中作者的原始文件

权利和权限

开放获取本文由BioMed Central Ltd授权发表。欧宝体育2021足球欧洲杯买球平台这是一篇开放获取的文章,是根据知识共享署名许可协议(https://creativecommons.org/licenses/by/2.0),允许在任何媒介上无限制地使用、分发和复制,但必须正确引用原作。

重印和权限

关于这篇文章

引用这篇文章

袁建生,陈飞。et al。实时PCR数据的统计分析。欧宝娱乐合法吗7,85(2006)。https://doi.org/10.1186/1471-2105-7-85

下载引用

关键字

  • 参考基因
  • 放大效率
  • 数据质量控制
  • 简单线性回归模型
  • 对数转换浓度