跳转到主要内容

实时PCR数据的统计分析

摘要

背景

尽管实时PCR广泛应用于生物医学科学,但仍然缺乏用于分析定量实时PCR的数据处理程序;特别是在适当的统计治疗领域。置信区间和统计显着性考虑不明确在许多当前数据分析方法中。基于标准曲线方法和其他有用的数据分析方法,我们展示并比较了四种统计方法和模型来分析实时PCR数据。

结果

第一种方法是建立一个多元回归分析模型,通过估计基因与治疗效果的交互作用得到ΔΔCt。在第二种方法中,我们提出了ANCOVA(协方差分析)模型,通过分析变量的影响可以得到ΔΔCt。其他两个模型包括计算ΔCt,然后是两组t -检验和非参数类似Wilcoxon检验。为所有四个模型开发了SAS程序,并给出了用于分析样本集的数据输出。此外,利用SAS开发并实现了数据质量控制模型。

结论

具有SAS程序的实用统计解决方案是为实时PCR数据开发的,并使用SAS程序分析了示例数据集。使用各种模型和程序的分析产生了类似的结果。这里提出的数据质量控制和分析程序提供了使用实时PCR估计基因的相对表达的统计元素。

背景

实时荧光定量PCR是基因表达分析中最敏感、最可靠的定量方法之一。已广泛应用于芯片验证、病原体定量、肿瘤定量、转基因拷贝数测定和药物治疗研究[1- - - - - -4]。PCR具有三个阶段,指数相位,线性相位和平台相,如图所示1。指数阶段是PCR中最早的阶段,由于试剂不受限制,产物呈指数增长。线性相的特征是随着PCR试剂的限制,产物呈线性增加。在随后的循环中,PCR最终将达到平台期,产物的数量不会因为某些试剂的耗用而发生变化。实时PCR利用了一个事实,即在理想条件下,指数期PCR产物的数量与初始模板的数量成正比[5,6]。在指数相位PCR产物期间,如果效率是完美的,则在每个周期中理想地加倍,即100%。如果PCR条件,引物特性,模板纯度和扩增子长度是最佳的,则可以使PCR扩增效率接近指数阶段的100%。

图1
图1

实时聚合酶链反应。(A)描述了PCR周期数与PCR产物量的理论图。pcr可观察到三个相:指数相、线性相和平台相。(B)表示对对数PCR产物量的PCR周期数的理论图。面板(C)是由ABI 7000实时PCR仪进行的一系列稀释实验的结果。

基因组DNA和逆转录的cDNA可以用作实时PCR的模板。通常通过Sybr Green或DNA杂交探针如分子信标或Taqman探针(Applied Biosystems)等DNA结合染料观察PCR的动态,例如Sybr Green或DNA杂交探针[2]。实时PCR的基础是染料与扩增子数量之间的直接正相关。如图(1 b1 c),基于对数2的转化荧光信号的曲线与循环数将产生线性范围,荧光信号的对数与原始模板量相关。然后可以设置基线和阈值以进一步分析。阈值基于荧光阈值水平的循环次数定义为CT号,这是在大多数实时PCR实验中观察到的值,因此是感兴趣的主要统计指标。

Real-time PCR数据进行了绝对定量和相对定量。绝对定量采用一个内部或外部校准曲线来导出输入模板拷贝数。当需要确定确切的转录本拷贝数时,绝对定量是很重要的,然而,相对定量对于大多数生理和病理研究是足够的。相对定量依赖于目的基因与内参基因表达的比较,以及同一基因在目标样本与参比样本中的表达[7]。

由于相对定量是大多数实时PCR实验的目标,一些数据分析程序已经发展。两种应用非常广泛的数学模型:效率校准模型[7,8]和ΔΔCt模型[9]。两种模型的实验系统相似。该实验将包括一个对照样本和一个处理样本。对于每个样本,一个目的基因和一个内控基因被包括PCR扩增序列稀释的等分。通常,每个稀释的浓度要进行多次重复以获得扩增效率。PCR扩增效率可以定义为百分比(从0到1),也可以定义为每个周期PCR产物增加的时间(从1到2)。效率校准模型是一个更一般化的ΔΔCt模型。首先对cDNA输入量(或对cDNA输入量的对数)绘制Ct数,计算plot的斜率,确定扩增效率(E)。每个基因(靶基因或参考基因)的Ct数减去对照样本的靶样本的Ct数,计算ΔCt。如式所示1,治疗组与对照组的靶基因表达比例可由靶基因效率(E目标)到目标的力量ΔCt (ΔCt目标)和内参基因效率(E参考),以参考的力量ΔCt (ΔCt参考)。如果目标基因和内参基因均达到最高的PCR扩增效率,则可从效率校正模型导出ΔΔCt模型。在这种情况下,两者的目标效率(E目标)和控制效率(E控制) = 2,表示每个周期扩增子加倍,则从2推导出的表达比例相同——ΔΔCt(7,9]。

R 一个 t o = ( E t 参数 e t ) Δ C t t 参数 e t ( E r e f e r e n c e ) Δ C t r e f e r e n c e E u 一个 t o n 1 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaemOCaiNaemyzauMaemOzayMaemyzauMaemOCaiNaemyzauMaemOBa4Maem4yamMaemyzaugabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdkhaYjabdwgaLjabdAgaMjabdwgaLjabdkhaYjabdwgaLjabd6gaUjabdogaJjabdwgaLbqabaaaaaaakiaaxMaacaWLjaGaemyrauKaemyCaeNaemyDauNaemyyaeMaemiDaqNaemyAaKMaem4Ba8MaemOBa4MaeeiiaaccbiGae8xmaedaaa @ 79AC @

ΔCtt参数=Ct控制-Ct治疗和δCt参考=Ct控制-Ct治疗

比率= 2——ΔΔCt方程2

ΔΔCtCt参考——ΔCtt参数

尽管效率校准和ΔΔCT模型都广泛应用于基因表达研究,但在分析每个实验因素以及显着性测试的分析中,没有许多论文对统计考虑的讨论。使用实质性统计分析的少数研究之一使用®程序(8]。本文提出的软件是基于效率校准模型,并采用随机检验获得显著性水平。然而,文章并没有提供一个详细的模型,不同的实验因素所涉及的影响。另一项对real-time PCR数据的统计研究采用简单的线性回归模型,通过Ct计算来估计比例[10]。然而,以对数为基础的荧光作为模型的因变量,我们认为这并不能充分反映实时PCR数据的性质。由此可见,Ct应作为统计分析的因变量,因为它是直接受处理、浓度和样本效应影响的结果值。两项研究都使用了效率校准模型。尽管这两种方法都有发表,但很多使用real-time PCR数据发表的研究文章实际上都没有出现P值和置信区间[11- - - - - -13]。我们认为,这些统计数据是可促进对数据的强大解释。

先天的,我们认为置信区间和PΔΔCt数据的价值是非常重要的,因为这些直接影响着比率的解释。如果没有正确的统计建模和分析,实时PCR数据的解释可能导致研究者得出假阳性的结论,这在临床应用中尤其有潜在的麻烦。在此,我们开发了四种用于处理实时PCR数据的统计方法,使用改进的ΔΔCt方法。经过修改,该统计方法可以适用于其他数学模型。SAS计划实施的方法和数据控制与实时PCR从业人员在交钥匙数据分析。标准差,置信水平和P值直接从SAS输出呈现。我们还包括对在线补充材料中分析的样本数据集和SAS程序的分析。

结果与讨论

数据质量控制

从两种数学模型进行实时PCR数据的相对量化,我们观察数据质量标准之间的差异。对于效率校准的方法,提交人描述了这个程序的[7假设每个基因(靶和参考)的扩增效率在不同的实验样品中是相同的(治疗和对照)。相反,虽然不需要2的放大效率,但是通过假设所有反应应达到2的放大效率,ΔΔCT方法更严格。换句话说,产物的量应该在每个周期期间加倍[9]。此外,ΔΔCT方法假设每个样品的PCR扩增效率为2,如果一组样品的PCR达到全扩增效率。然而,这种假设忽略了不同cDNA样品的效果。

可以通过相关模型检查数据质量。即使检查CT数和浓度之间的相关性可以提供有效的质量控制,也可以采取更好的方法来检查CT和对数之间的相关性(基本2)模板的变换浓度,这应该为每个的模板产生显着的简单线性关系基因和样品组合。例如,对于对照样品中的靶基因,CT数应与等式中简单的线性回归模型后的对数转换浓度相关联3.。的方程,XLCON.代表对数转换的浓度,β0表示回归线的截距,和βcon表示回归线的斜率[14]。可接受的实时PCR数据应具有来自回归分析的两个特征。首先,坡度与-1不应显着不同。其次,如表所示,所有四种基因组合的斜率和样品1不应该与彼此有显着不同。开发了一个SAS程序以在Program1_QC.SAS中执行数据质量控制(额外的文件1)。

表1分析样本real-time PCR数据。在这组数据中,有两种类型的样本(处理和对照);两个基因(参照和靶基因);每种基因和样本的组合有四种浓度。为便于数据质量控制和ANCOVA分析,real-time PCR样本数据集可根据样本与基因的组合分为4组。Control-Target联合作用命名为1组、Treatment-Target 2组、Control-Reference 3组、Treatment-Reference 4组。

Ct =β0+βconXLCON.+ε方程3

输入数据分组如表所示1额外的文件2。每个基因和样本的组合被分为1 - 4组。基于上述模型,采用SAS程序Proc Mixed对各组进行简单线性回归。估计了斜坡的95%置信水平,预计与-1没有显著差异。用于分析样本数据集的简化SAS输出显示在SASOutput.doc (额外的文件3)。基于95%的置信水平,所有四个组的CT和对数转化浓度的倾斜度与-1没有显着差异。除了数字输出外,该程序还提供了数据质量的可视化,如图所示2,其中Ct数是对转换后的模板浓度的对数。Ct数与对数转换浓度之间应观察到简单的线性关系。

图2
figure2

数据质量控制。四类代表了四种不同组合的样品和基因组合,其是对照样品中的参考基因,对照样品中的靶基因,治疗样品中的参考基因,以及治疗样品中的靶基因。每个类应导出CT和对数之间的线性相关性,具有斜率-1的浓度PF PCR产品。

多元回归模型

ΔΔCt法需要考虑几个效应,即处理效应、基因效应、浓度效应和重复效应。如果我们将这些效应作为定量变量,并得到与这些多重效应及其相互作用相关的Ct数,我们可以建立一个多元回归模型,如式4所示。

Ct=β0+βconX图标+β治疗Xitreat+β基因X硫代+β体验X图标Xitreat+βcongene.X图标X硫代+βgenetreat.X硫代Xitreat+βcongenetreat.X图标XitreatX硫代+ε方程4

在这个模型中,CT是真正的依赖,β0是拦截,βxs为对应的X(独立)项的回归系数,和ε是错误项[14]。该模型考虑了浓度、处理、基因及其相互作用的影响。我们主要感兴趣的是基因和治疗之间的相互作用,这涉及到治疗和对照样本中靶基因和内参基因的Ct差异程度:即ΔΔCt。因此,ΔΔCt可以由β的不同组合值来估计genetreat.。表中的四个组1还代表了治疗和基因组合效应的选择。目标是统计测试治疗靶和参考基因与对照样品的参考基因之间的差异。因此,零假设是靶标和参考基因之间的CT差异在治疗方面存在于对照样品中,其可以通过组合效应(CE)表示为:CE1-CE3 = CE2-CE4。替代公式将是:CE1-CE2-CE3 + CE4 = 0,这将产生ΔΔct的估计。如果没有拒绝空假设,则ΔΔCt不会显着不同,否则,ΔΔct可以从测试的估计导出。通过这种方式,我们可以对β的不同组合效果进行测试genetreat.并估计它的ΔΔct。如等式中的ΔΔCT公式所示2,如果ΔΔct等于0,则该比率为1,这表明对照和治疗之间的基因表达没有变化。

用于多元回归模型的SAS程序

Program2_MR中使用SAS程序PROC GLM进行ΔΔCt估计。sas在额外的文件4。多元回归模型在模型语句中说明。基因和治疗的组合作用在估计和对比声明中评估。在对比度语句中测试CE1-CE2-CE3 + CE4 = 0的空假设,参数估计产生ΔΔct值。SAS输入文件可用额外的文件5多元回归的SAS输出位于SasOutput.doc(额外的文件3)。

SAS输出提供了对数据的非常全面的分析。我们对分析的两个方面感兴趣。首先,我们想测试ΔΔCt的值是否与0的值有显著差异P= 0.05。如果ΔΔCt与0差异不显著,则说明治疗对靶基因表达没有显著影响;否则,就得出逆。如果效果显著,我们对ΔΔCt值的标准差感兴趣,从中我们可以推导出后面讨论的基因表达比率。SAS输出为ΔΔCt提供点估计(-0.6848)和标准误差(-0.1185)。PROC GLM或PROC MIXED在这个应用程序中是可互换的。如果实验涉及多个生物复制,也可以通过修改SAS程序来考虑复制效应。然后对基因、处理和复制的综合效果进行估计。

分析协方差和SAS代码

实时PCR数据分析的另一种方法是使用协方差分析(ANCOVA)。通过将数据转换为分组数据,可以得到一个简化的模型,如表所示1额外的文件2得到方程5。

Ct=β0+βconX图标+β集团Xigroup+βgroupconXigroupX图标+ε方程5

我们对两个问题感兴趣。首先,四组之间的协方差调整平均值相等吗?第二,经内参基因校正后,处理样本与对照样本靶基因值的Ct差异是什么?在这种情况下,原假设为(μ2-μ1)-(μ4-μ3) = 0,测试将得到一个参数估计ΔΔCt,如Program3_ANCOVA所示。sas (额外的文件6)。

实现Ancova模型的SAS代码类似于多元回归模型。可以采用SAS程序PROC GLM或PROC混合来实施ANCOVA模型;我们使用Proc在这里混合。类语句定义将分组哪些变量进行重要性测试。在这种情况下,变量是浓度和组,并且Ancova假设这些性质上是共同的。对比度和估计陈述用于对比组效应,其将产生ΔΔCt(-0.6848),以及其标准误差(0.1185)和95%置信区间(-0.9262,-0.4435)。SAS输出具有置信水平和P值在SASOutputs.doc (额外的文件3)。

简化的替代品,T- 最低和Wilcoxon两组测试

更简化的替代方案可用于分析每个实验的生物重复的实时数据。这种方法的主要假设是通过从参考基因的CT靶基因减去CT数的靶基因来调节浓度,基因和复制的添加剂效果,这将提供ΔCt,如表所示2。因此,对于ΔCt的处理和控制可以简单t- 最低,它将产生ΔΔct的估计。

表2 ΔCt计算。表中为ΔCt的计算,由目的基因Ct数减去内参基因Ct数得到。Con代表专注。

作为非参数替代t-test,一个Wilcoxon两组检验也可以用来分析ΔCt值的两个池。两个假设t -测试是两组ΔCt将具有高斯分布,它们将具有相同的差异。然而,这些假设在许多实时PCR实验中不适用于使用现实的小样本尺寸。因此,在这种情况下,无分布的Wilcoxon测试将是更强大和适当的替代方法[15]。

SAS项目已经针对这两者开发出来t -测试和Wilcoxon两组测试见附件程序Program4_TW。sas (额外的文件7)。采用SAS程序、TTEST、UNIVARIATE对数据进行分析。SAS宏的摩西。sas (15] 在额外的文件8已被雇用派对置信水平。SAS输入文件已在额外的文件9样本数据分析的SAS输出可以在SASOutput.doc (额外的文件3)。由于差异的估计导出从对照样品中减去处理,因此实际ΔΔct应该是输出估计的倒数。

四种方法和数据介绍的比较

表中的四种方法的比较3.。对于ΔΔCt估计,多元回归和ANCOVA得到完全相同的结果,因为这两种方法使用相同的数学方法进行参数估计。的t- 最低提供相同的点估计ΔΔct,但是,标准误差略大,这导致更大的置信区间。Wilcoxon两组测试提供略微较小的ΔΔct估计。来自四种方法的高度相似的结果验证了所呈现的模型和SAS程序。模型和计划的选择将取决于实验设计和实验的严格性和质量。然而,由于其非参数性质,最保守的测试是Wilcoxon两组测试,其与分布无关。

表3四种方法的比较。表列出了ΔΔct,标准误差,P-值和置信区间由本文提出的四种方法导出。无论是SAS包还是使用的宏都没有提供Wilcoxon两组测试的标准错误。我们认为置信区间对于进一步的数据转换是充分的。

数据质量控制

目前的许多实时PCR实验都没有采用标准曲线设计,也没有采用估计扩增效率的方法。我们认为没有适当质量控制的实时PCR数据是不可靠的,因为实时PCR的效率可能会对比率估计和动态范围产生重大影响。例如,如果PCR的扩增效率(PE)为0.8(即PCR产物将增加20.8时间代替每循环的两次),ΔCt值为3只能转化为比率的5.27倍而不是8次。当ΔΔct或Δct值较大并且放大效率较低时,该问题变得放大,这可能导致严重倾斜的解释。

因此,根据本文提出的SAS程序模型,我们提出了实时PCR数据质量控制的两个标准。首先,需要进行一系列模板稀释实验,以估计每个基因与每个样本的扩增效率。由于使用相同的引物对和扩增条件,一些研究者认为在不同的样本中,每个基因的扩增效率是相同的。然而,我们发现样本效应确实对放大效率有影响。换句话说,从不同的cDNA模板样本中扩增同一基因,其扩增效率可能是不同的。因此,我们认为以每个基因和样本组合的标准曲线为最优的实验设计。其次,在最优条件下,如果Ct数对对数(2为基础)的模板量的plot应该产生一个与-1没有显著差异的斜率,这表明近2的扩增效率。虽然效率校正模型和修正后的ΔΔCt模型都允许扩增效率低于2,但通过优化引物选择、扩增子长度和实验条件,使所有反应的扩增效率接近2是最可靠的。根据我们的经验,保持所有扩增效率在2附近是使样品间扩增效率相等从而保证高质量数据的最好方法。研究还发现,接近2的放大效率有助于扩大比值估计的动态范围。

P-Value,置信区间和数据介绍

P-Value是显着水平的重要参数,置信区间有助于建立ΔΔCT估计的可靠范围。目前最新的实时PCR出版物不存在P-值和置信区间[11- - - - - -13]。我们相信披露P当研究人员声称样本或处理之间存在差异时,-值是重要的。在我们的节目中,所有的P- Values从测试Null假设,即ΔΔct等于0。因此,小P-value表示ΔΔCt与0显著不同,说明效果显著。对a的解释P-价值将取决于实验目标。例如,在P= 0.05,说明治疗效果显著;在一个组织比较实验中,我们可以断言基因表达在不同组织中是显著不同的。

一些出版物的标准偏差与一个有意义的指标的比例呈现。然而,我们在此辩论,比率的标准偏差应该从ΔΔct的标准偏差导出;并且比率的置信区间应该源自ΔΔct的置信区间。换句话说,比率的点估计应该是2——ΔΔCt比例的置信区间应该是(2——ΔΔCtHCL, 2-ΔΔctlcl)。由于CT是从实验程序中观察到的值,因此应该是统计分析的主题。直接执行统计分析的实践是不合适的。数据的呈现需要参考ΔΔct,然后是ΔΔct,随后衍生自2的比率和置信区间-ΔΔct。

对扩增效率小于2的实时PCR数据进行统计学分析

如前所述,通过适当的扩增引物、RNA质量和cDNA合成方案,可以优化PCR扩增效率约为2。实时PCR引物设计的最新进展使实验优化变得更容易[16,17]。然而,无论对实验条件的严格控制如何,都可能发生少于理想的实时PCR数据。有三种情况用于次优实时PCR数据。在第一场景中,所有PCR反应具有相同的放大效率,但效率与2.在第二种情况下,PCR扩增效率仅由基因不同。换句话说,在所有生物样品中相同的基因相同的扩增效率是相同的;然而,扩增效率在不同的基因之间变化。在第三种情况下,PCR扩增效率因基因和样品而异。我们认为第三种情况下的数据是不可接受的,因为许多其他人报告了[10,18]。在任何这些方案中,调整后的ΔΔct可以通过在“估计”和“对比”的SAS程序的语句中包括PE来源于ANCOVA模型。

已经开发了几种方法来计算低质量数据中的放大效率。这种方法之一是所谓的“动态数据分析”,其中使用PCR反应的荧光历史来计算扩增效率[19,20.]。该方法的优势在于能够分析低质量的数据,并避免使用标准曲线来节约成本。然而,由于数学复杂性和可靠性争议,该方法不如传统的标准曲线法应用广泛[10,16,18]。在我们的方法中,已经存在一个标准曲线,可以用来推导放大效率(E)3., 如果XLCON.表示基于10个基于对数转换的浓度,放大效率(E)是10(1 /坡)或者 10 ( 1 / β con ) MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIXaqmcqaIWaamdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa@3921@ 根据Ramussen 2001和Pfaffl 2001 [7,21]。在我们的模型中,XLCON.表示基于2的对数转换浓度,因此放大效率(E)为2(1 /坡)或者 2 ( 1 / β con ) 的MathType @ MTEF @ 5 @ 5 + = feaafiart1ev1aaatCvAU​​fKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = VR0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqaIYaGmdaahaaWcbeqaaiabgkHiTiabcIcaOiabigdaXiabc + caVGGaciab = j7aInaaBaaameaacqqGJbWycqqGVbWBcqqGUbGBaeqaaSGaeiykaKcaaaaa @ 3835 @ ,PE可以表示为 - (1 /βcon)。

在上述第一场景中,所有PCR扩增具有相同的效率,但效率不等于1.那么基因表达的比例可以在以下等式中表示。

R 一个 t o = E Δ Δ C t = ( 2 ( 1 / β c o n ) ] Δ Δ C t = 2 Δ Δ C t * P E E u 一个 t o n 6 MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpcqWGfbqrdaahaaWcbeqaaiabgkHiTiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabcUfaBjabikdaYmaaCaaaleqabaGaeyOeI0IaeiikaGIaeGymaeJaei4la8ccciGae8NSdi2aaSbaaWqaaGqaciab gavjab + ngaJjab + 9 + 5 gaubqabawccqggpaqkaagccqggdbqxdaahaawcbeqaaiabgkhitiabfs5aejabfs5aejabdoeadjabdsha0baakiabg2da9iabikdaymaacaaaleqabagaeyoei0iaeuildqkaeuildqkaem4qamkaemidaqnaeiokaoiaemiuaalaemyraueaaogaaczcaiaaxmaacqwgfbqrcqwgxbqccqwg1bqdcqwghbqycqWG0baDcqWGPbqAcqWGVbWBcqWGUbGBcqqGGaaicqGF2aGnaaa@6ABA@

PE.= - (1 /βcon),ΔΔCt调整=PE *ΔΔCt

在等式6,βcon为以Ct对以对数2为基础的浓度的图的汇集斜率。的βcon可以使用相关函数在SAS中计算,如Program5_LowQualityData所示。sas在附加文件10.。在第二种情况下,扩增效率仅因基因而异。根据方程1,我们有以下方程,其中β0是CT的绘图坡度是否对日志2(浓度)为每个基因。

R 一个 t o = ( E t 参数 e t ) Δ C t t 参数 e t ( E c o n t r o l ) Δ C t c o n t r o l = ( 2 ( 1 / β c o n T 参数 e t ) ] Δ C t t 参数 e t ( 2 ( 1 / β c o n C o n t r o l ) ] Δ C t c o n t r o l = 2 ( P E t 参数 e t Δ C t t 参数 e t P E c o n t r o l Δ C t c o n t r o l ) E u 一个 t o n 7 MathType@MTEF@5@5@ + = feaafiart1ev1aaatCvAUfKttLearuWrP9MDH5MBPbIqV92AaeXatLxBI9gBaebbnrfifHhDYfgasaacH8akY = wiFfYdH8Gipec8Eeeu0xXdbba9frFj0 = OqFfea0dXdd9vqai = hGuQ8kuc9pgc9s8qqaq = dirpe0xb9q8qiLsFr0 = vr0 = vr0dc8meaabaqaciaacaGaaeqabaqabeGadaaakeaacqWGsbGucqWGHbqycqWG0baDcqWGPbqAcqWGVbWBcqGH9aqpdaWcaaqaaiabcIcaOiabdweafnaaBaaaleaacqWG0baDcyGGHbqycqGGYbGCcqGGNbWzcqWGLbqzcqWG0baDaeqaaOGaeiykaKYaaWbaaSqabeaacqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaaaaakeaacqGGOaakcqWGfbqrdaWgaaWcbaGaem4yamMaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaakiabcMcaPmaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9maalaaabaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWliiGacqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4MaemivaqLagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaaaaaGcbaGaei4waSLaeGOmaiZaaWbaaSqabeaacqGHsislcqGGOaakcqaIXaqmcqGGVaWlcqWFYoGydaWgaaadbaGaem4yamMaem4Ba8MaemOBa4Maem4qamKaem4Ba8MaemOBa4MaemiDaqNaemOCaiNaem4Ba8MaemiBaWgabeaaliabcMcaPaaakiabc2faDnaaCaaaleqabaGaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaaaaaaakiabg2da9iabikdaYmaaCaaaleqabaGaeiikaGIaemiuaaLaemyrau0aaSbaaWqaaiabdsha0jGbcggaHjabckhaYjabcEgaNjabdwgaLjabdsha0bqabaWccqGHxiIkcqqHuoarcqWGdbWqcqWG0baDdaWgaaadbaGaemiDaqNagiyyaeMaeiOCaiNaei4zaCMaemyzauMaemiDaqhabeaaliabgkHiTiabdcfaqjabdweafnaaBaaameaacqWGJbWycqWGVbWBcqWGUbGBcqWG0baDcqWGYbGCcqWGVbWBcqWGSbaBaeqaaSGaey4fIOIaeuiLdqKaem4qamKaemiDaq3aaSbaaWqaaiabdogaJjabd + gaVjabd6gaUjabdsha0jabdkhaYjabd + gaVjabdYgaSbqabaWccqGGPaqkaaGccaWLjaGaaCzcaiabdweafjabdghaXjabdwha1jabdggaHjabdsha0jabdMgaPjabd + gaVjabd6gaUjabbccaGGqaciab + Dda3aaa@F60B@

PE.目标= - (1 /βcont),PE.控制= - (1 /β康诺),ΔΔCt调整=PE.目标*ΔCt目标-PE.控制*ΔCt控制

在公式7中,βcontβ康诺是CT的汇集斜率分别针对基于对数2的靶基因和参考基因的浓度。斜坡可以通过Program5_LowQualityData.sas计算(额外的文件10)。的ΔΔCt调整可以用相同的程序进行计算。从理论上也可以推导出第三种情况下PCR扩增效率因基因和样本而异的公式。但是在实际应用中,由于放大效率的显著变化,我们不认为第三种情况的数据是可以接受的[10,18]。

program5_lowquatilitydata.sas额外的文件10提供了在第一和第二个场景中派生调整后的ΔΔCt的解决方案。文中的LowQualityData.txt提供了一个基因扩增效率不同的数据集额外的文件11说明SAS程序的使用。数据集的质量较低,主要原因是实验中涉及的重复次数有限。的计算涉及四个步骤ΔΔCt调整。第一步是执行方法中所示的数据质量控制测试。从SAS输出中,我们可以得出结论,LowQualityData数据集不满足2的要求——ΔΔCt方法,因为一组PCR的扩增效率与1有显著差异,如SASOutput.doc (额外的文件3)。

第二步是通过观察lcon和类相互作用的第III类平方和来测试相等的PCR效率(或斜率)。一个低p值表示不同聚合酶链反应组(类)与对数转换浓度的交互作用,这又表示不同聚合酶链反应组之间的斜率不相等。如果所有PCR扩增效率相等,则可以计算出聚合扩增效率并整合到SAS程序中ΔΔCt调整计算。在这组数据中,Squares的III型总和具有一个p值小于0.05,并且扩增效率不等于所有PCR。然后对每个基因进行等于等斜率的测试以确定每个基因的PCR扩增效率是否相同。对于任一种基因,扩增效率与0.05的α没有显着差异。可以在SasOutput.doc中找到所有III型的正方形输出总和(额外的文件3)。

下一步是计算集合斜率(βcon(PE = -(1/βcon))对于每个基因。基于基于CT和对数2的浓度之间的相关性导出汇总斜率。的βcon两个基因的s分别为-1.0813和-1.0137,SASOutput.doc (额外的文件3),用于计算LowQualityData数据集的放大效率。与βcon-(1 /βcon)或PE可以分别为每个基因计算0.925和0.987。的ΔΔCt调整然后可以用PEs替换“估计”和“对比”语句中的每个基因1进行计算。SAS程序如下额外的文件10

标题2:计算调整效率的deltadeltaCt;

PROC混合数据= tr2 =数据;

班级纳税;

模型Ct = Con Class Con*Class/SOLUTION NOINT;

对比'拦截'课程0.925-0.925-0.9870.987;

估计“拦截”类0.925-0.925-0.9870.987/ cl;

运行;

分析的SAS输出在SASOutput.doc (额外的文件3)。的ΔΔCt调整因此是-1.0901吗p价值非常小。该比率可以表示如标准ΔΔCT方法中所讨论的。该实施例中的比率的点估计为2.129,95%置信区间是(1.926,2.353)。

总体而言,在较少优化的PCR反应中,统计分析不仅复杂,而且损害了精度和效率。因此,应当在使用低质量实时PCR数据进行统计分析时进行谨慎,这可能由于效率调整而容易引入错误[10,18]。

结论

在本报告中,我们提出了实时PCR数据的四种统计分析模型和一种数据质量控制程序。为所有应用程序开发了SAS程序,并分析了一组样本数据。采用不同的模型和方案进行分析,得出了相同的ΔΔCt估计值和相似的置信区间。数据质量控制和分析程序将有助于建立可靠的实时荧光定量PCR相关基因表达研究系统。

方法

植物材料,RNA提取,实时PCR和样本数据集

示例数据集(表1)用于分析来自下面描述的实验。拟南芥蒂利亚纳(Col1)植株在生长室内23°C、14小时光照下生长4周。用RNeasy Plant Mini Kit (Qiagen, Inc.)从甲基茉莉酸处理的植物中分离总RNA拟南芥, alamethecin治疗拟南芥用柱DNA酶(QIAGENGEN,INC.)处理除去和对照植物和DNA污染。使用ISCICT cDNA合成试剂盒(Biorad Laboratories),在20μl反应中合成一个微RNA的一个微RNA。然后将cDNA稀释成10ng /μl,2ng /μl,0.4ng /μl和0.08ng /μl浓度系列。使用来自应用生物系统(应用生物系统)的ABI 7000序列检测系统对每个浓度进行实时PCR实验的三种重复。泛素被用作参考基因,并底漆序列拟南芥泛素基因为CACACTCCACTTGGTCTTGCG (F)和TGGTCTTTCCGGTGAGAGTCTTCA (R),目的基因MT_7引物采用Primer Express软件(Applied Biosystems)设计,序列为CCGCGGTACAAACCTTAATT (F)和TGGAACTCGATTCCCTCAAT (R)拟南芥蒂利亚纳对法牛酸具有高催化特异性的蛋白质的基因AT3G44860 [22]。引物滴定和分离实验,以避免引物二聚物或假扩增物干扰结果。real-time PCR实验结束后,分别提取内参基因和目的基因Ct数,自动基线和手动阈值。

实时PCR实验设计、数据输出、转换、编程

效率校准法和ΔΔCt方法的主要局限性是只使用一套cDNA样本来确定扩增效率。我们假设,只要引物和扩增条件相同,其他cDNA样本也可以采用相同的扩增效率。然而,扩增效率不仅取决于引物的特性,而且在不同的cDNA样本中也存在差异。仅用一组被测样品的标准曲线计算扩增效率可能忽略了样品差异所带来的误差。在我们的实验设计中,我们对所有样本和相关基因进行了四种浓度的三次重复的标准曲线实验。ΔΔCt将仅从标准曲线得出,并对每个基因和样本组合的数据质量进行检查。文中以两个样本为例进行了分析。每个样本至少需要3个浓度的2个重复的pcr。尽管需要付出更多的努力,但由于没有严格的数据质量控制和基于统计模型的数据分析,数据更加可靠。

输出数据集包括Ct数、基因名称、样本名称、浓度和复制。我们使用了微软®Excel打开从ABI 7000序列分析系统导出的Ct文件,然后将数据转换为tab分隔的文本文件以进行SAS处理。示例数据集如表所示1

所有程序都与SAS 9.1(SAS Institute)开发。

参考文献

  1. 1.

    克莱恩D:实时荧光定量PCR技术的应用及局限性。Mol Med的趋势2002年,8:257 - 260。10.1016 / s1471 - 4914 (02) 02355 - 9

    中科院文章谷歌学术

  2. 2.

    参赛山:mRNA的绝对定量使用实时逆转录聚合酶链反应分析。J摩尔性2000年,25:169-93。10.1677 / jme.0250169

    中科院文章PubMed谷歌学术

  3. 3.

    Mocellin S,Rossi Cr,Pilati P,Nitti D,Marincola FD:实时定量PCR:癌症研究的强大盟友。Mol Med的趋势2003年,9:189-195。10.1016 / s1471-4914(03)00047-9

    中科院文章谷歌学术

  4. 4.

    Mason G,Provero P,Vaira Am,Accotto GP:利用实时荧光定量PCR估计转化植株的整合数。BMC生物技术2002年,2:20.10.1186 / 1472-6750-2-20

    pmed中央文章PubMed谷歌学术

  5. 5.

    Heid Ca,Stevens J,Livak KJ,Williams PM:实时定量PCR。基因组Res1996年,6:986 - 994。

    中科院文章PubMed谷歌学术

  6. 6.

    Gibson UE, Heid CA, Williams PM:一种实时定量RT-PCR的一种新方法。基因组Res1996年,6:995 - 1001。

    中科院文章PubMed谷歌学术

  7. 7.

    Pfaffl MW:实时RT-PCR中相对量化的新数学模型。诊断酸Res2001年,29日:2002-2007。10.1093 / nar / 29.9.e45

    文章谷歌学术

  8. 8.

    pfaffl mw,horgan gw,dempfle l:相对表达软件工具(REST(C))用于实时PCR相对表达结果的群体比较和统计分析。诊断酸Res2002年,30:e36。10.1093 / nar / 30.9.e36

    pmed中央文章PubMed谷歌学术

  9. 9。

    Livak KJ, Schmittgen TD:采用实时荧光定量PCR对相关基因表达数据进行分析——ΔΔCT方法。方法2001年,25:402-408。10.1006 / meth.2001.1262

    中科院文章PubMed谷歌学术

  10. 10。

    Cook P,Fu C,Hickey M,Han Es,Miller Ks:用于具有多个独立样本的实时RT-PCR的SAS程序。生物学技术2004年,37:990-995。

    中科院PubMed谷歌学术

  11. 11.

    Zenoni S,Reale L,Tornielli GB,Lanfaloni L,Porcenddu A,Ferrarini A,Moretti C,Zamboi A,Speghini A,Ferranti F,Pezzotti M:Downregulation的佩妮矮牵牛α棒曲霉素的基因phexp1减少细胞壁中的晶体纤维素,导致花瓣肢的表型变化。植物细胞2004年,16:295 - 308。10.1105 / tpc.018705

    pmed中央中科院文章PubMed谷歌学术

  12. 12.

    Eleaume H,Jabbouri S:对实时定量RT-PCR中的两个标准化方法的比较金黄色葡萄球菌体外生长过程中的基因表达。J Micro方法2004年,59:363 - 370。10.1016 / j.mimet.2004.07.015

    中科院文章谷歌学术

  13. 13.

    Shen H, He LF, Sasaki T, Yamamoto Y, Zheng SJ, Ligaba A, Yan XL, Ahn SJ, Yamaguchi M, Hideo S, Matsumoto S:铝胁迫下柠檬酸分泌及其对大豆根尖的调控。质膜H的转录、翻译和苏氨酸导向的磷酸化上调+腺苷三磷酸酶。植物理性2005年,138:287-296。10.1104 / pp.104.058065.

    pmed中央中科院文章PubMed谷歌学术

  14. 14.

    Kutner MH, Nachtsheim CJ, Neter J, William L:应用线性统计模型。第五版。麦格劳-希尔,欧文,CA;2005.

    谷歌学术

  15. 15.

    沃尔夫·霍兰德:非参数统计方法。John Wiley和Sons,纽约;1973年:503。

    谷歌学术

  16. 16.

    Bustin SA, Benes V, Nolan T, Pfaffl MW:实时荧光定量RT-PCR——一个新视角。J摩尔性2005年,34:597-601。10.1677 / JME.1.01755

    中科院文章PubMed谷歌学术

  17. 17.

    patyn F, Speleman F, De Paepe A, Vandesompele J:RTPRIMERDB:实时PCR引物和探头数据库。诊断酸Res2003年,31:122-123。10.1093 / nar / gkg011

    pmed中央中科院文章PubMed谷歌学术

  18. 18.

    Peirson Sn,Butler Jn,Foster RG:实时荧光定量PCR数据分析的新方法和传统方法的实验验证。诊断酸Res2003年,31:药剂。10.1093 / nar / gng073

    pmed中央文章PubMed谷歌学术

  19. 19。

    刘伟,圣达:基于聚合酶链反应动力学模拟的反转录聚合酶链反应实时定量分析新方法。肛门生物化学2002年,302:52-59。10.1006 / abio.2001.5530

    中科院文章PubMed谷歌学术

  20. 20.

    Tichopad A, Dilger M, Schwarz G, Pfaffl MW:标准测定实时PCR效率从一个单一反应设置。诊断酸Res2003年,31:e122。10.1093 / nar / gng122

    pmed中央文章PubMed谷歌学术

  21. 21。

    拉斯穆森R:LightCycler的量化。快速循环实时荧光定量PCR方法及其应用海德堡。编辑:Meuer S、Wittwer C、中川原K.施普林格出版社;2001:21-34。

    谷歌学术

  22. 22。

    Yang Y, Yuan JS, Ross J, Noel JP, Pichersky E, Chen F:一个拟南芥蒂利亚纳甲基转移酶能够甲基化法尼索酸。拱生物学习生物糖2005年出版社。校正校样校正校样

    谷歌学术

下载参考

作者信息

隶属关系

作者

通讯作者

对应到C Neal Stewart Jr

额外的信息

作者的贡献

JSY公司进行了实时PCR实验,开发了统计模型和SAS分析程序,并起草了文章。AR在SAS编程和数据建模方面提供了帮助。FC在实时PCR实验中提供了帮助。中新社负责监督工作,概念化非参数元素,并最终定稿。

电子补充材料

附加文件1:SAS程序实现数据质量控制过程。(SAS 864字节)

附加文件2:数据提供Program1_QC的输入数据。sas和Program3_ANCOVA.sas。数据根据样本与基因组合的不同对Ct值进行了分组。(TXT 690字节)

附加文件3:所有分析的缩写SAS输出。(DOC 48 KB)

附加文件4:SAS程序实现多元回归模型并导出ΔΔct。(SAS 608字节)

附加文件5:Program2_MR的输入数据。其中含有样品、基因、浓度和Ct数。(TXT 1 KB)

附加文件6:SAS程序实现Ancova模型并导出ΔΔct。(SAS 441字节)

附加文件7:SAS程序在ΔCt上执行学生t测试和Wilcoxon两组测试来派生ΔΔCt。(SAS 580字节)

附加文件8:SAS程序是一个宏,用于派生Wilcoxon两组测试的置信区间。(SAS 5 KB)

附加文件9:program4_tw.sas的输入数据。数据仅包含示例名称和Δct。(TXT 408字节)

附加文件10:SAS程序对等式斜率进行测试,分组斜率和调整后的ΔΔct。(SAS 2 KB)

附加文件11:Program5_LowQualityData.sas的输入数据。(TXT 317字节)

作者为图片提交的原始文件

以下是作者提交的图片原始文件的链接。

图1的作者原始文件

图2的作者原始文件

权利和权限

开放获取本文由BioMed Central Ltd.授权出版。欧宝体育2021足球欧洲杯买球平台这是一篇开放获取的文章,在知识共享署名许可(https://creativecommons.org/licenses/by/2.0),允许在任何媒介上不受限制地使用、分发和复制,但前提是原稿被适当引用。

重印和权限

关于这篇文章

引用这篇文章

袁建生,李爱民,陈芳。et al。实时PCR数据的统计分析。欧宝娱乐合法吗7,85(2006)。https://doi.org/10.1186/1471-2105-7-85

下载引用

关键字

  • 参考基因
  • 扩增效率
  • 数据质量控制
  • 简单线性回归模型
  • 对数转换后的浓度
\