跳过主要内容GydF4y2Ba

CHIPIN:基于跨转录恒定基因的信号不变性的ChIP-seq样本间标准化GydF4y2Ba

抽象的GydF4y2Ba

背景GydF4y2Ba

多项研究依赖于芯片SEQ实验来评估基因调制和药物处理对蛋白质结合和染色质结构的影响。然而,大多数方法通常用于跨条件归属芯片-SEQ绑定强度信号的标准化,GydF4y2Ba如。GydF4y2Ba,对相同数量的读取的归一化,要么采用跨条件的恒定信噪比,或基于条件之间具有本质上不同信号的基因组区域的校正因子估计。芯片SEQ信号的不准确标准化又可以导致错误的生物学结论。GydF4y2Ba

结果GydF4y2Ba

我们开发了一个新的R包,Chipin,允许在不可用的尖峰信息时跨不同条件/样品归一化芯片-SEQ信号,但基因表达数据是手头的。我们的归一化技术基于假设,平均而言,在表达水平在样品/条件下的基因的调节区域中,应观察到芯片-SEQ信号的差异。除了归一化芯片-SEQ信号之外,Chipin还提供了输出多个图表,并计算允许用户评估归一化效率的统计数据,并限定所用抗体的特异性。除芯片-SEQ之外,还可以使用芯片,而无需限制开放染色质ATAC-SEQ或DNase超敏反数据。我们在几个芯片-SEQ数据集上验证了Chipin方法,并记录了与几种常用的归一化技术相比的卓越性能。GydF4y2Ba

结论GydF4y2Ba

Chipin方法在不可用的尖峰实验时提供跨条件的芯片-SEQ信号标准化的新方法。该方法在GitHub上提供的用户友好的R包中实现:GydF4y2Bahttps://github.com/boevalab/chipin.GydF4y2Ba

背景GydF4y2Ba

在过去的十年中,染色质免疫沉淀,然后进行测序(芯片-SEQ)成为研究基因组蛋白-DNA相互作用的重要技术。特别地,芯片-SEQ技术的应用允许研究基因转录机制,包括对组蛋白的转录因子和后期修饰的角色进行洞察。例如,证明了组蛋白修饰(乙酰化,甲基化,磷酸化,泛素化和Sumoylation)通常涉及转录调控。赖氨酸的乙酰化(GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba组蛋白H3的赖氨酸27(H3K27ac)与赖氨酸甲基化时的基因表达激活有关(GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba., H3K27me3和H3K9me3)通常与转录抑制有关[GydF4y2Ba1.GydF4y2Ba]使用ChIP-seq技术,可以获得组蛋白修饰和转录因子结合位点的准确位置。GydF4y2Ba

芯片SEQ技术包括三个主要步骤:(1)在活细胞中的其基因组DNA底物中的蛋白质或转录因子等蛋白质的共价交联;(2)使用针对感兴趣蛋白质的抗体捕获蛋白质-DNA复合物的分离和碎片;(3)通过逆转交叉链路和纯化后通过高通量测序分析免疫沉淀DNA。CHIP-SEQ技术经常用于比较两个或多种条件下感兴趣的蛋白质的DNA结合。然而,由于技术偏差,在若干条件下比较芯片-SEQ信号仍然是一个具有挑战性的问题。首先,通过跨样品的染色质免疫沉淀的可变效率阻抗信号比较。其次,芯片SEQ实验受到片段长度分布的可变性,并且可以表现出由DNA扩增偏压引起的读数的差异。这些偏差在一起会导致芯片SEQ信号的假想变化并导致错误的生物学结论。因此,有强烈需要归一化程序,可以纠正上述效果,尤其是当尖峰信息时[GydF4y2Ba2.GydF4y2Ba],依靠添加来自不同生物体的染色质和抗体(Spike-in)并允许更好的样本间标准化是不可用的。事实上,今天大多数涉及ChIP-seq的实验工作都没有使用Spike-in信息[GydF4y2Ba2.GydF4y2Ba]。GydF4y2Ba

在大多数研究中,ChIP-seq信号归一化是使用每个样本的测序片段总数来进行的。数据按常数因子缩放,例如使用函数“GydF4y2Ba巴姆比GydF4y2Ba“由”脱​​索“包提供[GydF4y2Ba3.GydF4y2Ba]不幸的是,这种标准化方法没有考虑免疫沉淀和DNA扩增偏差效率的差异。其他方法,如Liang和Keleş的芯片序列(NCIS)标准化[GydF4y2Ba4.GydF4y2Ba],它扩展了顺式基因组[GydF4y2Ba5.GydF4y2Ba],用于信号归一化控制样品。这里,基因组分为非重叠箱;将归一化因子计算为GydF4y2Ba\(r=\frac{{\mathop\sum\nolimits{i\in B}{\text{ChIP}}\{\text{signal}}}}}{{\mathop\sum\nolimits{i\in B}{\text{Control}}\{\text{signal}}}}}GydF4y2Ba, 在哪里GydF4y2BaBGydF4y2Ba对应于属于背景的一组箱。在cisgenome [GydF4y2Ba5.GydF4y2Ba[作者]作者将背景区域确定为具有总计数量的地区GydF4y2Ba\(t \ Le 1 \)GydF4y2Ba和宽度GydF4y2Ba\(w = 100 \)GydF4y2Ba,以及归一化因子GydF4y2Ba\(r \)GydF4y2Ba在NCIS中,边际芯片/控制比与总计数之比用于确定GydF4y2Ba\ \ (t)GydF4y2Ba和GydF4y2Ba\(w \)GydF4y2Ba以数据适应方式,最后定义集合GydF4y2BaBGydF4y2Ba.GydF4y2Ba

更复杂的方法[GydF4y2Ba6.GydF4y2Ba,GydF4y2Ba7.GydF4y2Ba,GydF4y2Ba8.GydF4y2Ba]允许用户确定差异富集区域,同时解决标准化问题,但不提供结果的标准化配置文件。例如,在ChIPnorm中[GydF4y2Ba7.GydF4y2Ba[估计背景,局部基因组偏置被移除,最后使用量子标准化解决归一化问题。MacS2,最常用的芯片SEQ分析工具之一[GydF4y2Ba9GydF4y2Ba],允许识别差分峰值(功能GydF4y2BaBDGDIFFGydF4y2Ba)但不提供所得到的归一化曲线。基于局部加权回归(黄土)方法的两步非线性归一化方法是由Taslim等人开发的。[GydF4y2Ba8.GydF4y2Ba]。要在多个样本上比较芯片SEQ数据,方法使用指数正常模拟差异GydF4y2BaKGydF4y2Ba混合模型,并使用拟合模型根据局部错误发现率选择与差异结合位点相关的区域[GydF4y2Ba6.GydF4y2Ba]基于每个样本的累积读数计数曲线的斜率计算的最近的归一化方法。虽然功能强大,但这些用于差分峰呼叫的方法不提供归一化芯片-SEQ密度配置文件作为输出。GydF4y2Ba

我们的团队最近已经开发了一种简单的归一化方法,百合,基于匹配所有条件的强峰内的信号[GydF4y2Ba10.GydF4y2Ba]。归一化因子被计算为这些常见区域中的密度值的比率。重要的是,百合管道基于显式校正拷贝数变异的芯片-SEQ配置文件[GydF4y2Ba11.GydF4y2Ba[因此可用于比较不同癌症样本或癌症和健康组织之间的信号。GydF4y2Ba

总之,现有方法通常根据公共芯片-SEQ峰值或仅使用控制来评估归一化参数,并且不接受其他信息,GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba。,基因表达,建立基线。在本文中,我们通过为芯片-SEQ数据帧间归一化创建用户友好的R包来填充此差距。该方法基于生物学假设,即在样品上具有恒定表达的基因,平均相似蛋白质结合强度。实际上,通过许多研究记录了基因表达与染色质标记或转录因子结合的沉积之间的相关性[GydF4y2Ba12.GydF4y2Ba,GydF4y2Ba13.GydF4y2Ba,GydF4y2Ba14.GydF4y2Ba,GydF4y2Ba15.GydF4y2Ba](另请参见附加文件。)GydF4y2Ba1.GydF4y2Ba:图S1)。GydF4y2Ba

执行GydF4y2Ba

我们提出了一种称为ChIPIN的归一化方法,用于跨多个条件的碎片密度信号的ChIP-seq样本间归一化。我们的方法基于以下假设:平均而言,真实的ChIP-seq信号在基因的调控区域中不应观察到差异,这些基因在不同样本/条件下的表达是恒定的。我们的算法包括三个主要步骤(图。GydF4y2Ba1.GydF4y2BaA) 。另外,第4步允许用户验证所用抗体的特异性。该工具作为一个用户友好的R包实现,可在GitHub上在线获得(GydF4y2Bahttps://github.com/boevalab/chipin.GydF4y2Ba).前三个步骤对应于包的第一个函数,称为GydF4y2BaCHIPIN_normalizeGydF4y2Ba,在“GydF4y2Ba在条件/样品之间确定具有恒定表达的基因GydF4y2Ba“,”GydF4y2Ba构建包含芯片序列强度值的矩阵GydF4y2Ba“和”GydF4y2Ba执行规范化GydF4y2Ba附加步骤由包的第二个函数执行,称为GydF4y2Baplot_expression.GydF4y2Ba,在“GydF4y2Ba作为基因表达水平的函数谱分析芯片-SEQ强度Tss周围的强度GydF4y2Ba“ 部分。GydF4y2Ba

图。1GydF4y2Ba
图1GydF4y2Ba

筹码包装的轮廓。GydF4y2BaA.GydF4y2Ba在Chipin中实施的四个步骤。GydF4y2BaBGydF4y2Ba用作芯片SEQ信号标准化的基线的“常态基因”(红色)的定义:“常数基因”是具有从基因表达式不同范围的读数的最低标准偏差的10%(默认)(默认)(默认)(100垃圾箱)。GydF4y2BaCGydF4y2Ba“恒定基因”的基因体区域和周围侧翼区域(± GydF4y2BaNGydF4y2BaKB,GydF4y2BaNGydF4y2Ba = 4 Kb by default) are rescaled to 40 Kb (default) and segmented into bins (default bin length: 10 bp). TSS: transcription start site; TE: transcription end site.DGydF4y2Ba定量标准化的主要步骤。在Chipin中,定量标准化分别应用于芯片-SEQ强度信号的一定范围内的基因子集(GydF4y2BaKGydF4y2Ba团体,GydF4y2BaKGydF4y2Ba = 20.GydF4y2Ba默认情况下)。GydF4y2BaEGydF4y2Ba密度曲线下面积的差异用于评价标准化过程的成功GydF4y2Ba

我们的包的输出包括正常化的.Bigwig文件,可直接在IGV软件上查看。归一化配置文件可以用作用于调用差分绑定的软件的输入,GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba。,HMCAN-DIFF [GydF4y2Ba16.GydF4y2Ba]。GydF4y2Ba

在条件/样品之间确定具有恒定表达的基因GydF4y2Ba

Chipin方法基于假设,平均而言,应在表达在样品/条件的基因的调节区域中观察到真真芯片-SEQ信号的差异。这些基因由包装使用基因表达数据(RNA-SEQ或微阵列)确定。为此目的,我们计算来自RNA-SEQ实验的每个基因的数百万(CPM)值的平均值和标准偏差或未从RNA-SEQ实验或解锁的微阵列值。为了在每种表达值中提取等百分比的“常态”,根据基因表达的平均值,我们将所有基因分成100个相等大小的组。我们将最小变量定义为“常数”基因作为在每个表达式组中显示样本/条件(默认值:10%)的最小标准偏差值的基因(图。GydF4y2Ba1.GydF4y2BaB,“恒定基因”以红色描绘)。此步骤的输出是具有基因坐标的标准文件。GydF4y2Ba

除了CPM格式之外,用户还可以以每百万映射的读取(FPKM)或每千千万读数(TPM)的成绩单的成绩单提供表达数据,其中读数为基因长度;在这种情况下,Chipin将使用可用的转录注释(外显子长度)将FPKM或TPM计数变为与CPM成比例的值。GydF4y2Ba

构建包含芯片序列强度值的矩阵GydF4y2Ba

使用用户提供的.Bigwig浓度文件和包含“常量基因”的坐标,Chipin为每个样本/条件计算跨“常数基因”的信号的坐标,并且它们的侧翼区域(±N kb,n = 4)计算默认情况下)(图。GydF4y2Ba1.GydF4y2BaC)。对于此步骤,我们使用该功能“GydF4y2Ba计算机矩阵GydF4y2Ba“由”脱​​索“包提供[GydF4y2Ba3.GydF4y2Ba]。这GydF4y2Ba计算机矩阵GydF4y2Ba功能提供了将所有基因重新划衡到相同长度的可能性(默认值:40 kB)。然后将基因体上游和下游的重新分配的基因体积及其额外的侧翼区域进行分段为垃圾箱(默认箱尺寸:10bp)。最后,计算每个基因的每个箱的平均信号。该步骤的输出是每个样本/条件的一个矩阵,其元素对应于每个箱和每种基因的累积密度信号(图。GydF4y2Ba1.GydF4y2BaC)。GydF4y2Ba

值得注意的是,Chipin没有明确地考虑到输入或IGG控制轨道。相反,我们建议用户使用其中一个可用的工具使用已经为后台信号标准化的密度轨道。在这项研究中,我们使用了HMCAN软件的.bigwig输出[GydF4y2Ba11.GydF4y2Ba].事实上,HMCan的峰值呼叫允许校正芯片序列信号的拷贝数和GC内容偏差;它通过用反映芯片样本噪声比的常数减去控制信号来降低背景噪声。GydF4y2Ba

执行规范化GydF4y2Ba

对于每个样本/条件,使用“deepTools”在前一步中获得的矩阵来推断标准化参数。用户可以选择两种标准化策略:分位数和线性标准化,如下所述。CHIPIN还提供了说明标准化过程成功的指标:(i)统计数据显示归一化程序前后平均信号曲线之间的相对差异;(ii)归一化前后“恒定基因”转录起始位点(TSS)周围信号的可视化。我们进一步描述了用户可以选择的两种可能的归一化策略。GydF4y2Ba

非零拦截线性回归GydF4y2Ba

该步骤的目标是在所有样本/条件相当的所有样本/条件下进行密度值。在这里,我们选择其中一个条件作为参考(默认值:样本在所有条件下具有中位信号强度)。我们使用参考密度分布分别计算每个样本的回归系数,然后使用这些系数归一化密度分布。更详细地,对于每个样本和参考,我们首先从所计算的密度矩阵计算每个箱的平均信号“GydF4y2Ba构建包含芯片序列强度值的矩阵GydF4y2Ba“节(图。GydF4y2Ba1.GydF4y2BaC)。然后,我们对这些平均强度值的非零截距执行线性回归:GydF4y2Ba\(\ ovline {s} _ {current \,sample} \)GydF4y2Ba与参考样本相反GydF4y2Ba\(\ ovline {s} _ {参考\,sample} \)GydF4y2Ba.对于每个样本,具有非零截距的线性回归提供GydF4y2Ba\(\alpha\)GydF4y2Ba和GydF4y2Ba\(\beta\)GydF4y2Ba这最小化了平方误差的总和GydF4y2BaεGydF4y2Ba在:GydF4y2Ba

$$\overline{S}{Current\,Sample}=\alpha*\overline{S}{Reference\,Sample}+\beta+\varepsilon$$GydF4y2Ba

给予GydF4y2Ba\(\alpha\)GydF4y2Ba和GydF4y2Ba\(\beta\)GydF4y2Ba对于每个样本/条件,然后纠正每个条件中的密度分布:GydF4y2Ba

$ $ S_{当前\ \样本,纠正}= \马克斯\离开({0 \离开({S_{当前\样本}-β\}\右)/α\}\右),$ $GydF4y2Ba

此转换应用于原始导航文件中可用的芯片-SEQ信号强度值。GydF4y2Ba

分位数归一化GydF4y2Ba

执行定量标准化,芯片-SEQ信号强度矩阵计算“GydF4y2Ba构建包含芯片序列强度值的矩阵GydF4y2Ba“第一次对具有相似结合强度的基因取平均值(附加文件GydF4y2Ba2.GydF4y2Ba:图S2,基因组的默认数量GydF4y2Ba\(k)GydF4y2Ba = 20). The quantile normalization is then performed on averaged intensities of these\(k)GydF4y2Ba基因组(无花果。GydF4y2Ba1.GydF4y2Bad)和发现的归一化函数应用于来自.bigwig文件的原始芯片-seq信号强度值。使用来自R包“统计数据”的函数来学习以获取来自每个组的非归一化值的归一化值的数学转换。GydF4y2Ba

作为基因表达水平的函数谱分析芯片-SEQ强度Tss周围的强度GydF4y2Ba

Chipin包提供了根据基因表达值围绕基因TSSS周围的平均芯片SEQ信号的可能性。基因表达数据,所有基因的FPKM值或微阵列值,用三组分为三组GydF4y2BaKGydF4y2Ba-平均聚类:高、中、低表达基因。然后使用密度分布图显示这三组基因TSS周围的芯片序列信号(参见GydF4y2Ba鉴定所用抗体的特异性GydF4y2Ba章节中的应用示例)。GydF4y2Ba

结果GydF4y2Ba

与其他三种标准化技术相比,我们验证了CHIPIN:(i)对相同读取次数的标准化,(ii)基于在最强共享峰值中匹配信号的思想的LILY方法[GydF4y2Ba10.GydF4y2Ba(iii)基于浓度分布的转折点的计算,基于匹配基因组滑动窗口中的信号的最新归一化方法之一ChipSeqspikeinfree之一[GydF4y2Ba6.GydF4y2Ba]。我们将归一化与相同数量的读数相同,因为它已经是芯片-SEQ信号的最广泛使用的归一化技术。事实上,当应用于特征在相同的技术复制的条件时,这种归一化策略提供了稳定可值得信赖的结果。另外两种方法虽然没有涵盖整个归一化方法,但代表了标准化策略背后的两个假设:基于最强和另一个 - 在整体信号上的一个假设。GydF4y2Ba

要执行比较,我们使用使用HMCAN软件获得的芯片-SEQ密度(.bigwig文件)[GydF4y2Ba11.GydF4y2Ba]。在我们对方法的比较中,我们解决了两个问题:(i)Chipin归一化策略可以有效地匹配跨条件和跨复制的信号密度吗?(ii)芯片归一化是否保持蛋白质结合密度信号之间的生物差异?GydF4y2Ba

芯片有效地匹配平均密度曲线,用于“恒定基因”的TSS周围的区域GydF4y2Ba

我们评估了Chipin在对应于跨条件下的转录变异的基因的基因组区域中匹配芯片-SEQ密度谱的性能。该分析进行了两种数据集:用于H3K27AC(未发布数据)和红细胞瘤细胞系的五种人肾上腺皮质癌样品,具有抗SPI1的多屈霉素诱导的SHRNA,在两个条件下进一步称为H3K27AC的SHSPI1-A2B分析:(1)使用SPI1-过度表达:SPI1 ++,和(2)SPI1-压缩:SPI1- [GydF4y2Ba17.GydF4y2Ba]。GydF4y2Ba

人肾上腺皮质癌标本的结果GydF4y2Ba

首先,我们应用了两种芯片归一化方法(线性回归和定量标准化),以及为5人肾上腺皮质癌样品获得的三种其他技术到H3K27AC型材。为了评估归一化程序的效果,我们计算并比较了标准化前后“恒定基因”的TSSS的平均芯片-SEQ密度值。与三种其他方法相反,芯片均匀的线性和定量标准化允许除去该组低变性基因的H3K27AC平均密度值之间的显着差异(图。GydF4y2Ba2.GydF4y2Ba).GydF4y2Ba

图2GydF4y2Ba
图2.GydF4y2Ba

五H3K27AC数据集肾上腺皮质癌的归一化效率的比较。将平均密度信号显示为“恒定基因”的TSSS周围的8 KB区域。第一图对应于归一化之前的平均信号。抗体:AB4729(兔多克隆,ABCAM)GydF4y2Ba

我们量化了每个标准化程序前后五个样本密度曲线之间的差异(表1)GydF4y2Ba1.GydF4y2Ba)为此,我们将“恒定基因”TSS周围8kb的区域分为3个区域,区域1(− 4KB,− 1 Kb),第2区(− 1KB, + 1 Kb)和3区(+ 1KB, + 4 Kb)(图。GydF4y2Ba1.GydF4y2BaE) 。通过密度曲线下面积百分比的平均差异来评估每个样品/条件之间的差异(表1)GydF4y2Ba1.GydF4y2Ba).在对应于启动子区域并参与基因表达的调节的中央区域(区域2)中,Chipin实现了比其他方法更好的性能。实际上,初始差异为34.75%,在归一化之前通过芯片缩减量仅为1.8%(定量标准化),而最佳的公共方法百合,导致归一化轮廓之间的差异的18%。GydF4y2Ba

表1平均密度曲线间的平均百分比差(图。GydF4y2Ba2.GydF4y2Ba)在“恒定基因”TSSs周围的三个区域(图。GydF4y2Ba1.GydF4y2Bae)GydF4y2Ba

鼠SHSPI1-A2B细胞系的结果GydF4y2Ba

为了进一步验证CHIPIN的性能,我们分析了第二个数据集,即H3K27ac的shSpi1-A2B细胞系,在两种情况下:(i)Spi1过度表达:Spi1++,和(ii)Spi1抑制:Spi1−. 对于每个条件,我们都有两个可用的技术复制品:复制品1和2。为了说明批量效应校正的重要性,我们进一步将复制品1用于Spi1++条件,将复制品2用于Spi1− 验证CHIPIN方法的条件。同时,在Replicate 1中标准化为相同的读取次数为我们提供了基本事实(图。GydF4y2Ba3.GydF4y2Ba一种)。GydF4y2Ba

图3.GydF4y2Ba
图3.GydF4y2Ba

shSpi1-A2B细胞系中H3K27ac谱在重复内正常化效率的比较(GydF4y2BaA.GydF4y2Ba)和跨复制(GydF4y2BaBGydF4y2Ba).将平均密度信号显示为“恒定基因”的TSSS周围的8 KB区域。第一图对应于归一化之前的平均信号。抗体:兔抗H3K27AC(AB4729,ABCAM);条件:SPI1 ++ - SPI1过表达,SPI1 - 由一个肿瘤诱导的shRNA压抑的spi1 - spi1GydF4y2Ba

我们施加了对SPI1 ++和SPI1-条件计算的三种其他标准化技术的三种其他归一化技术,以及用于SPI1 ++和SPI1-条件的H3K27AC密度(图。GydF4y2Ba3.GydF4y2BaB,表格GydF4y2Ba2.GydF4y2Ba).CHIPIN使用分位数标准化和线性回归(标准化后差异的0.06%和0.1%)几乎完美地匹配了“恒定基因”的两条平均密度曲线GydF4y2BavsGydF4y2Ba38%的差异在中央区2的正常化之前)。所有其他方法的应用还允许通过分别使用相同数量的读数,ChipSeqspikeinfree和百合的标准化,从而缩小两种条件(从38%到7.6%,11.9%和17.2%之间的差异缩小)。达到芯片的性能(图。GydF4y2Ba3.GydF4y2BaB,表格GydF4y2Ba2.GydF4y2Ba).GydF4y2Ba

表2 H3K27AC密度曲线之间的百分比差异(图。GydF4y2Ba3.GydF4y2Bab)在围绕“恒定基因”的TSSS的三个区域中(图。GydF4y2Ba1.GydF4y2Bae)GydF4y2Ba

CHIPIN保留了不同条件下ChIP-seq密度信号的生物学差异GydF4y2Ba

随着芯片归一化程序使用围绕“恒定基因”的专门基因组区域,我们评估了维持在整个条件下差异表达的基因的芯片-SEQ信号的生物差异的方法效率。我们在SPI1-A2B小鼠小鼠细胞系(FC> 1.5,FDR调节的T-Test P值<0.05)中提取差异表达的基因差异表达,然后在SPI1-A2B小鼠小鼠细胞系(FC> 1.5,调节的T检验P值<0.05)中,然后分析激活剂组蛋白标记H3K27AC的密度分布在施加归一化程序后,在SPI1 ++条件下在SPI1 ++条件下调节的基因的TSS的附近(图。GydF4y2Ba4.GydF4y2Ba).GydF4y2Ba

图4.GydF4y2Ba
图4.GydF4y2Ba

Chipin的归一化效率与三种其他方法在SHSPI1-A2B细胞中对应于差异表达基因的基因组区域中的归一化效率的比较(穿过重复)。GydF4y2BaA.GydF4y2Ba在“Spi1++”- Spi1过表达和“Spi1−”- Spi1抑制两种情况下,被Spi1下调和上调的基因TSSs周围的H3K27ac密度谱。GydF4y2BaBGydF4y2Ba区域1–3中H3K27ac信号的差异(图。GydF4y2Ba1.GydF4y2BaE)被Spi1上调和下调的基因启动子;轴表示Spi1++和Spi1−条件下密度值的差异。正确的归一化程序会导致观测结果靠近对角线(GydF4y2Ba\ (y = x \)GydF4y2Ba,灰色虚线)GydF4y2Ba

考虑到基因转录水平和H3K27ac启动子信号之间的强线性相关性(Pearson R = 0.83,附加文件GydF4y2Ba3.GydF4y2Ba:图S3),我们可以估计Spi1++和Spi1中基因TSS周围H3K27ac密度之间的预期变化− 上调和下调基因的条件:下调和上调基因的预测平均位移分别为-22.7和19.2,对应于绝对位移值之间的比率1.18(图。GydF4y2Ba4.GydF4y2BaC)。确实,相同读取次数的内复制归一化导致了信号的可比移位比(图。GydF4y2Ba4.GydF4y2BaC和S2),证实了我们的建模策略。GydF4y2Ba

当跨条件中的归一化时,在四个测试的方法中,削片素(使用线性和定量标准化),提供了最接近预期的结果(图。GydF4y2Ba4.GydF4y2Bab,c)。百合性和归一化在相同数量的读取中施用导致SPI1 ++和SPI1-的H3K27AC密度曲线之间的差异,该条件对于由SPI1下调的基因比上调基因更强,而不是上调基因(图。GydF4y2Ba4.GydF4y2BaA).相反,ChIPSeqSpikeInFree的归一化结果是,上调基因的H3K27ac密度比下调基因高得多。因此,我们得出结论,在这个生物例子上,CHIPIN优于其他三种方法。GydF4y2Ba

鉴定所用抗体的特异性GydF4y2Ba

ChIP-seq实验的质量在很大程度上取决于所用抗体的效率和特异性。事实上,使用非特异性抗体可能会导致错误的生物学结论。因此,根据基因表达值分析基因TSS周围的平均ChIP-seq信号是验证已知生物模式是否正确的好方法尊敬[GydF4y2Ba18.GydF4y2Ba]。一个人可以使用GydF4y2Ba牧师GydF4y2Ba有关兴趣蛋白质对基因表达蛋白质的影响的已知信息:高表达基因倾向于具有更强的“活性”组蛋白标记的信号(GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2BaH3K27ac和H3K4me3)和转录因子在其启动子周围结合,而沉默基因或低表达基因往往具有更强的“阻遏”组蛋白标记信号(GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba。,H3K27ME3和H3K9ME3)在他们的TSS附近[GydF4y2Ba19.GydF4y2Ba]。GydF4y2Ba

在这里,我们提供了一个例子GydF4y2Baplot_expression.GydF4y2Ba芯片封装的功能允许检测抗体的非特异性结合(图。GydF4y2Ba5.GydF4y2Ba).GydF4y2Ba

图5.GydF4y2Ba
图5.GydF4y2Ba

CHIPIN生成的图,用于评估所用两种抗体的特异性:GydF4y2BaA.GydF4y2Ba抗体AB4729(ABCAM)在肾上腺皮质癌样品中对抗H3K27AC(未发表),GydF4y2BaBGydF4y2Ba抗体ACM39155(活性基序)在SHSPI1-A2B细胞中的H3K27ME3(未发表)。对于AB4729,正如预期的,高表达的基因显示比中等或低表达的基因更高水平的H3K27Ac;虽然对于ACM39155,高表达的基因显示出对H3K27ME3下游TSS(红色)的强度增加。这表明靶向H3K27甲基化的该抗体对乙酰化赖氨酸的潜在非特异性结合,还通过Rothbart等人记载。[GydF4y2Ba20.GydF4y2Ba]GydF4y2Ba

我们在两种芯片SEQ实验上施加了芯片素:在SHSPI1-A2B细胞中的肾上腺皮质癌样品(抗体AB4729,ABCAM)和H3K27ME3中的H3K27Ac(抗体ACM39155,活性基序)。组蛋白修饰芯片-SEQ数据与RNA-SEQ实验偶联测量相应样品中的基因表达。Chipin产生了三组基因的TSSS周围的平均密度分布的平均分布:低,培养基和高表达基因(图。GydF4y2Ba5.GydF4y2Ba).GydF4y2Ba

正如预期的那样,对于肾上腺皮质癌样品,围绕的谱系TSS的密度与鉴定使用的抗体的特异性和高质量的基因表达呈正相关(图。GydF4y2Ba5.GydF4y2Ba一种)。然而,令人惊讶的是,在SHSPI1-A2B细胞中,高表达的基因(图。GydF4y2Ba5.GydF4y2BaB,红色)在基因立即下游区域(高达1kb下游TS)显示了H3K27ME3的非常高的平均密度信号。在一定程度上也可以在某种程度上看到这种增加,并且可能与靶向H3K27甲基化的抗体ACM39155的非特异性结合有关我们用于该实验的抗体。实际上,最近对抗体特异性的研究表明,除了靶向抑制标记H3K27ME3之外,活性基序抗体39155还可以结合几种乙酰化赖氨酸[GydF4y2Ba20.GydF4y2Ba]本例展示了CHIPIN在评估抗体特异性和评估ChIP-seq数据集质量方面的效用。GydF4y2Ba

讨论GydF4y2Ba

我们提供了一个新的R包,驰聘,对于芯片起密度信号的样本间或条件间归一化,这是一个强制性的步骤,以使转录因子或组蛋白标记结合跨生物条件强度的比较。我们提供了两个归一化方法的选择:具有非零截距和定量标准化的线性回归。两种方法比我们测试的其他公开的归一化方法更有效(图。GydF4y2Ba2.GydF4y2Ba,GydF4y2Ba3.GydF4y2Ba,GydF4y2Ba4.GydF4y2Ba).GydF4y2Ba

Chipin用作大多数峰值呼叫者生成的输入.bigwig文件。但是,在我们的验证研究中,我们优先于HMCAN软件[GydF4y2Ba11.GydF4y2Ba]。实际上,HMCAN是一个峰值呼叫者,其纠正GC内容和拷贝数偏置,并且如果提供了输入实验,则会去除背景信号。强烈建议使用HMCAN的使用,以进行癌症样本的比较拷贝数像差谱的差异。GydF4y2Ba

我们的方法最初是针对ChIP-seq数据开发的,它可以在不受任何限制的情况下用于其他密度分布,例如针对ATAC-seq或DNase超敏数据构建的密度分布[GydF4y2Ba21.GydF4y2Ba[从ATAC-SEQ实验中说明了用于比较不同地区的染色质可接受性的标准化方法的选择对于帮助避免假生物解释,对不同地区的染色质可接受性进行比较至关重要。据报道,推动者可访问性与基因表达呈正相关[GydF4y2Ba22.GydF4y2Ba,使用跨条件/样本的表达是恒定的基因,如CHIPIN所实现的,代表了对ATAC-seq数据进行归一化的合适解决方案。GydF4y2Ba

值得注意的是,当靶向蛋白在其中一个样品/条件下沉默或沉默时,不应使用我们的方法。相反,应该采用Spike-in协议,其次是与适当的方法进行归一化,占峰值信息,GydF4y2BaEGydF4y2Ba.GydF4y2BaGGydF4y2Ba。,HMCAN-DIFF [GydF4y2Ba16.GydF4y2Ba],以确定差异富集区。GydF4y2Ba

在这里,我们使用两个数据集来比较CHIPIN与其他可用的归一化方法。对于第二组数据,在两种条件下分析shSpi1-A2B细胞系中的H3K27ac,每种条件下有两个重复。为了验证我们的方法,我们在第一个条件下选择复制1,在第二个条件下选择复制2,这样批量效果更强。在这个比较中,CHIPIN的表现优于其他方法。GydF4y2Ba3.GydF4y2Ba,GydF4y2Ba4.GydF4y2Ba;桌子GydF4y2Ba1.GydF4y2Ba,GydF4y2Ba2.GydF4y2Ba).然而,我们还评估了芯片在相同复制/批次内获得的芯片-SEQ密度分布的设置中的芯片素的性能(图。GydF4y2Ba3.GydF4y2BaA.GydF4y2Ba4.GydF4y2Ba一个,附加文件GydF4y2Ba4.GydF4y2Ba:图S4和附加文件GydF4y2Ba5.GydF4y2Ba:表S1)。重要的是,在这种情况下,CHIPIN的性能也优于其他标准化方法。但是可以看出,对相同读取次数的标准化也提供了几乎完美的结果(额外的文件)GydF4y2Ba5.GydF4y2Ba:表S1,附加文件GydF4y2Ba4.GydF4y2Ba:图S4)。该分析表明,当比较不同的重复时,在比较不同的复制时,在相同的读取数量的归一化时可以对在同一批次内进行的实验中进行归一化。GydF4y2Ba

结论GydF4y2Ba

在这里,我们提出了一种新的方法,用于在没有峰值数据的情况下对芯片序列数据进行条件间归一化。该方法基于这样一个假设,即平均而言,在不同条件下稳定表达或沉默的基因调控区中的蛋白结合在不同条件下也是恒定的。我们提供了一种选择参数和选项。特别是,用户可以在具有非零截距的线性归一化和分位数归一化之间进行选择。该方法在GitHub上提供的用户友好的R包中实现:GydF4y2Bahttps://github.com/boevalab/chipin.GydF4y2Ba.在GitHub Vignette中提出了几个例子,并提供了测试数据。GydF4y2Ba

可用性和要求GydF4y2Ba

项目名称:CHIPINGydF4y2Ba

项目主页:欧宝直播官网appGydF4y2Bahttps://github.com/boevalab/chipin.GydF4y2Ba

操作系统:LinuxGydF4y2Ba

编程语言:RGydF4y2Ba

其他要求:脱索GydF4y2Ba

许可证:GNU GPLGydF4y2Ba

非学者使用的任何限制:没有限制GydF4y2Ba

可用性数据和材料GydF4y2Ba

CHIPIN的代码、示例和自述可在GydF4y2Bahttps://github.com/boevalab/chipin.GydF4y2Ba.本研究中使用的未发表的芯片SEQ数据集可根据要求提供。GydF4y2Ba

缩写GydF4y2Ba

芯片SEQ:GydF4y2Ba

染色质免疫沉淀,然后进行测序GydF4y2Ba

CPM:GydF4y2Ba

百万分之一GydF4y2Ba

FPKM:GydF4y2Ba

每千票次乘积每千次映射的碎片GydF4y2Ba

TPM:GydF4y2Ba

每千百万百万读的成绩单GydF4y2Ba

TSS:GydF4y2Ba

转录起始位点GydF4y2Ba

参考GydF4y2Ba

  1. 1。GydF4y2Ba

    Kouzarides T.染色质修饰及其功能.细胞.2007;128:693–705。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  2. 2。GydF4y2Ba

    Chen K,等人。被忽视的事实:对于几乎所有基因组的分析,尖峰控制的基本需求。Mol细胞Biol。2016; 36:662-7。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  3. 3.GydF4y2Ba

    Ramírezf等。DEEPTOOLS2:用于深序数据分析的下一代Web服务器。核酸RES。2016; 44:W160-165。GydF4y2Ba

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  4. 4.GydF4y2Ba

    Liang K,KeleşS.Chip-SEQ数据的标准化控制。欧宝娱乐合法吗BMC生物信息学。2012; 13:199。GydF4y2Ba

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  5. 5.GydF4y2Ba

    Ji H,等。分析芯片和芯片序列数据的集成软件系统。Nat Biotechnol.2008;26:1293–300。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  6. 6.GydF4y2Ba

    金H,等。ChipSeqspikeInfree:一种芯片-SEQ标准化方法,以揭示组蛋白修改的全局变化而无需尖峰。生物信息学。2020; 36:1270-2。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  7. 7.GydF4y2Ba

    Nair Nu,等Chipnorm:用于标准化和识别组蛋白修饰芯片-SEQ库中差分区域的统计方法。Plos一个。2012; 7:E39573。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  8. 8.GydF4y2Ba

    Taslim C等人。芯片-SEQ数据的比较研究:归一化和结合模式表征。生物信息学。2009; 25:2334-40。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  9. 9。GydF4y2Ba

    张y等。基于模型的芯片SEQ(MAC)分析。基因组Biol。2008; 9:R137。GydF4y2Ba

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  10. 10。GydF4y2Ba

    Boeva v等人。转录电路定义的神经母细胞瘤细胞同一性的异质性。NAT Genet。2017; 49:1408-13。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  11. 11.GydF4y2Ba

    Ashoor H,等HMCAN:使用芯片-SEQ数据检测癌症样本中染色质修饰的方法。生物信息学。2013; 29:2979-86。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  12. 12.GydF4y2Ba

    Barski A等人。人类基因组中组蛋白甲基化的高分辨率分析。细胞。2007; 129:823-37。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  13. 13。GydF4y2Ba

    Guillon N等。致癌EWS-FLI1蛋白结合体内具有潜在转录激活功能的GGAA微卫星序列。PLoS ONE.2009;4:e4932。GydF4y2Ba

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  14. 14。GydF4y2Ba

    Karlićr等。组蛋白修饰水平是基因表达的预测性。PROC NATL ACAD SCI。2010; 107:2926-31。GydF4y2Ba

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  15. 15.GydF4y2Ba

    ridinger-saison m等人。SPI-1 / PU.1通过在红细胞血症中通过聚集的DNA占用术激活转录。核酸RES。2012; 40:8927-41。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  16. 16.GydF4y2Ba

    Ashoor H,等HMCAN - 差异:一种检测具有不同遗传特征的细胞中组蛋白修饰变化的方法。核酸RES。2017; 45:E58-E58。GydF4y2Ba

    PubMedGydF4y2Bapmed中央GydF4y2Ba谷歌学者GydF4y2Ba

  17. 17.GydF4y2Ba

    Rimmelé P,等。Spi-1 / PU。1.participates in erythroleukemogenesis by inhibiting apoptosis in cooperation with Epo signaling and by blocking erythroid differentiation. Blood. 2007;109:3007–14.

    文章GydF4y2Ba谷歌学者GydF4y2Ba

  18. 18.GydF4y2Ba

    Nie Y,等。人类淋巴母细胞系转录因子结合位点附近的组蛋白修饰模式。PLoS ONE。2013;8:e60002。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  19. 19。GydF4y2Ba

    Young MD等。ChIP-seq分析揭示了不同的H3K27me3基因与转录活性相关。核酸学报2011;39:7415-27。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  20. 20。GydF4y2Ba

    Rothbart SB,等。评估组蛋白抗体特异性的交互式数据库。摩尔细胞。2015;59:502–11。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  21. 21。GydF4y2Ba

    Reske JJ等人。ATAC-SEQ标准化方法可以显着影响差分可访问性分析和解释。表观遗传蛋白。2020; 13:22。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  22. 22。GydF4y2Ba

    Cao J等人。染色质可用性的关节分析和成千上万的单细胞中的基因表达。科学。2018; 361:1380-5。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

  23. 23。GydF4y2Ba

    戴维斯加利福尼亚州。DNA元素(编码)的百科全书:数据门户更新。核酸RES。2018; 46:D794-801。GydF4y2Ba

    中科院GydF4y2Ba文章GydF4y2Ba谷歌学者GydF4y2Ba

下载参考GydF4y2Ba

确认GydF4y2Ba

我们感谢GuillaumeAssié和JérômeBertherat提供肾上腺皮质癌肿瘤样品在图1中的方法验证。GydF4y2Ba2.GydF4y2Ba.GydF4y2Ba

资金GydF4y2Ba

这项工作由Center National De La Recherche Scientifique的机构支持资助,Institut National de LaSantéetdeLoghercheMédicale,Actip-Avenir,Arc-Avenir,Arc基金会[arc-rac16002ksa-R15093ks],以及“我是谁?”卓越实验室ANR-11-Labx-0071,由法国政府通过其投资D'Avenir计划资助,由法国国家研究机构[ANR-11-IDEX-0005-02]经营至V.B.(薪资,数据生成,基础设施);SIRIC CARPEM [没有。INCA-DGOS-INSERM_12561]至G.K.(薪水);L'Institut国家du癌症[20141plbio06-1]至C.G.,M.E.(数据生成);InstitutThématique多人癌症[C13104L]至C.G(数据生成);Ministèredel'CenseignementSupérieur到S.G;RégionIle-de-France [Ardoc,N°17012698]至L.P.(薪水)。GydF4y2Ba

作者信息GydF4y2Ba

隶属关系GydF4y2Ba

作者GydF4y2Ba

贡献GydF4y2Ba

LP开发了该方法,进行了分析并起草了稿件。VB引导分析并修订了手稿。GK,SG,ME和CG生成了数据。所有作者阅读并认可的终稿。GydF4y2Ba

通讯作者GydF4y2Ba

通信GydF4y2Ba瓦伦蒂娜boeva.GydF4y2Ba.GydF4y2Ba

伦理宣言GydF4y2Ba

道德认可和参与同意GydF4y2Ba

不适用。GydF4y2Ba

同意出版GydF4y2Ba

不适用。GydF4y2Ba

竞争利益GydF4y2Ba

两位作者宣称他们没有相互竞争的利益。GydF4y2Ba

附加信息GydF4y2Ba

出版商的注意GydF4y2Ba

欧宝体育黑玩家Springer Nature在公布的地图和机构附属机构的管辖权主张方面保持中立。GydF4y2Ba

补充信息GydF4y2Ba

附加文件1:图S1。GydF4y2Ba

作为基因表达功能的K562细胞系中选定转录因子的ChIP-seq密度谱。使用的ENCODE数据集:ENCSR492FKD (ZNF257)、ENCSR271RRH (ZNF253)、ENCSR121SPB (KLF10)、ENCSR844JVU (TCFL5)、ENCSR946BXO (BRCA1)、ENCSR153HNT (STAG1)、ENCSR549PVK (PATZ1)、ENCSR017EJY (DLX4)。对ENCFF928NYA和ENCFF003XKT两个重复的基因表达进行了平均评估[GydF4y2Ba23.GydF4y2Ba]。GydF4y2Ba

附加文件2:图S2GydF4y2Ba

.基因组定量定量标准化。在平均平均的串联结合强度下进行量化标准化GydF4y2BaKGydF4y2Ba基因组(默认GydF4y2BaKGydF4y2Ba = 20); gene groups are defined based on the strength of the overall binding signal (averaged across all samples), so that each gene group corresponds to the specific ChIP-seq signal intensity: from the lowest (group 1) to the highest (groupKGydF4y2Ba).为了获得基因组,我们将所有样本(由deepTools构建)的ChIP-seq密度值连接矩阵(GydF4y2BaA.GydF4y2Ba,示出了两个样本),计算跨越垃圾箱的信号强度的平均值和每个基因的样本(GydF4y2BaBGydF4y2Ba),根据总体平均强度值对基因进行排序(GydF4y2BaCGydF4y2Ba),然后建立GydF4y2BaKGydF4y2Ba通过分裂整组基因来划分基因组(GydF4y2BaDGydF4y2Ba)因此每个基因组代表一定范围的芯片SEQ强度信号。GydF4y2Ba

附加文件3:图S3。GydF4y2Ba

线性回归适应SPI1 ++条件和H3K27AC密度的基因表达。在FPKM中评估基因表达,并且芯片-SEQ H3K27AC最大密度对应于在复制1和2之间平均的基因TSS周围的2kB窗口中的最大密度。芯片-SEQ信号被标准化为CG含量,拷贝数偏置HMCAN的背景噪音[GydF4y2Ba11.GydF4y2Ba]。GydF4y2Ba

附加文件4:图S4。GydF4y2Ba

Chipin的归一化效率的比较和三种其他方法在对应于SHSPI1-A2B细胞中的差异表达基因的基因组区域(复制1用于两种条件)。抗体:AB4729(ABCAM)对抗H3K27AC;GydF4y2BaA.GydF4y2Ba在两种情况下,Spi1下调和上调基因TSS周围的H3K27ac密度分布:“Spi1++”-Spi1过度表达,”Spi1−”—Spi1被抑制。GydF4y2BaBGydF4y2Ba区域1–3中H3K27ac信号的差异(图。GydF4y2Ba1.GydF4y2BaE)被Spi1上调和下调的基因启动子;轴表示Spi1++和Spi1−条件下密度值的差异。正确的归一化程序会导致观测结果靠近对角线(GydF4y2Ba\ (y = x \)GydF4y2Ba,灰色虚线)。GydF4y2Ba

附加文件5:表S1。GydF4y2Ba

H3K27ac密度曲线之间的百分比差异(图。GydF4y2Ba3.GydF4y2Baa)在围绕“常态基因”的TSSS的三个区域中(图。GydF4y2Ba1.GydF4y2BaE) 。GydF4y2Ba

权限GydF4y2Ba

开放访问GydF4y2Ba本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问GydF4y2Bahttp://creativecommons.org/licenses/by/4.0/GydF4y2Ba.Creative Commons公共领域奉献豁免(GydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/GydF4y2Ba)适用于本条中提供的数据,除非数据信用额度中另有规定。GydF4y2Ba

重印和权限GydF4y2Ba

关于这篇文章GydF4y2Ba

通过Crossmark验证货币和真实性GydF4y2Ba

引用这篇文章GydF4y2Ba

Polit,L.,Kerdivel,G.,Gregoricchio,S。GydF4y2Ba等等。GydF4y2BaChipin:Chip-SEQ基于转录恒定基因的信号不变性的样品间标准化。GydF4y2Ba欧宝娱乐合法吗22,GydF4y2Ba407(2021)。https://doi.org/10.1186/s12859-021-04320-3GydF4y2Ba

下载引文GydF4y2Ba

关键词GydF4y2Ba

  • 芯片SEQ.GydF4y2Ba
  • 打开染色质GydF4y2Ba
  • 正常化GydF4y2Ba
  • 密度配置文件GydF4y2Ba
  • 基因表达GydF4y2Ba
  • 算法GydF4y2Ba
  • R包GydF4y2Ba