跳过主要内容

NUCOME:哺乳动物基因组中核小体组织参考景观的全面数据库

抽象的

背景

核小体组织参与多种生物体内的许多调节活动。然而,由于缺乏全面的数据质量控制(QC)评估和公共数据集的数据质量参差不齐,整合哺乳动物基因组核小体组织的研究非常有限。

结果

NUCOME是一个专注于过滤合格的核心组织的数据库,基于QC度量,覆盖人类和鼠标中的各种细胞类型的景观。过滤策略保证了核心组织的质量参考景观,并豁免用户从冗余数据集选择和处理。的NUCOME数据库在全基因组规模和个体位点水平上提供标准化、合格的数据源和信息的核小体组织特征。

结论

NUCOME为核小体组织的整合分析提供有价值的数据资源。的NUCOME可于http://compbio-zhanglab.org/NUCOME

背景

核小核心是真核染色质的基本单位,并通过与DNA结合蛋白的相互作用参与调节活动,包括调节因子,染色质改造,组蛋白伴侣和聚合酶[1].已经在多个物种中建立了全基因组核小体组织图谱,并报道了几种特定调控元件的一致核小体定位模式。例如,核小体作为转录因子(tf)相互作用的屏障独联体监管元素。无核小体区域(NFR)和规则间隔的核小体阵列与转录起始密切相关[123.4].核小体重塑对核小体动力学至关重要,它去除、滑动和重新定位核小体以克服障碍并促进转录起始和延伸[3.567].核小体在转录起始位点(TSSs)和其他调控元件上的保守定位模式强调了核小体组织在调控活动中的重要性。

此外,以往的研究表明,组织和疾病特异性核小体组织广泛存在于哺乳动物基因组中,并参与细胞分化[89),重新编程(910,组织损伤[111213]和疾病[141516].大多数研究集中于识别特定的核小体组织特征,并将这些特征与转录活性或染色质修饰联系起来。细胞类型特异性核小体组织通常表明染色质环境涉及不同的调节因子和细胞过程[17].因此,核小体的组织图谱对于获得染色质结构、修饰及其在调控功能中的关系的全景视图至关重要。然而,与组蛋白修饰、DNA甲基化和转录因子等其他类型的调控景观相比,核小体的组织尚未得到充分的探索。

阻碍核小体结构和调控功能研究的主要困难有两个。首先,核小体占据了基因组的很大比例,这就需要对人类和小鼠的核小体组织图谱进行相当高的测序深度。在我们之前的研究中,测序覆盖率已被证明会影响数据质量[18].测序覆盖的影响使得公开的核小体组织图在数据质量方面差异很大。第二个难点在于分析方法,也受到数据质量的限制。目前,研究人员通常通过在大量基因或基因组区域上聚集核小体的组织特征来说明核小体的组织特征,而忽略了个体基因或基因组区域之间的差异。然而,有研究表明,TSSs、转录因子结合位点和组蛋白修饰区普遍存在核小体组织模式的异质性[1920.].

为了系统地探索核心的调节功能,迫切需要进行核心组织景观的全面和专用数据库,以管理,探索和分析这些数据资源。MNASE-SEQ是生成核小组组织地图最广泛使用的技术[2122].哺乳动物基因组的大尺寸是实验中的一个主要挑战,需要非常高的测序深度;因此,MNase-seq数据分析是复杂和耗时的。我们建立了一个综合数据库,命名为NUCOMEnleosome.O组织引用的景观Ammalian G.enomes),它组织MNase-seq数据集并描述核小体的组织特征。的NUCOME数据库解决了上面提到的困难,这些难以结合质量控制(QC)评估和汇集样品。以下是三个主要特征NUCOME数据库:(1)NUCOME通过标准化的分析管道和QC指标,管理和过滤大量的人和小鼠MNase-seq数据。(2)NUCOME为各种人类和小鼠细胞和组织类型提供高质量的核小体组织参考景观,提供更可靠的核小体组织信息。(3)NUCOME提供包含多个模块的web界面,包括处理后的数据下载,量化基因组区域内信息核小体组织特征的分析模块,以及以单个基因或位点方式显示不同细胞或组织类型间多个核小体组织特征的搜索模块。目前,有一些数据库专注于策划核小体组织图。例如,NucMap数据库[23]收集不同物种的公共数据集,而不基于质量过滤数据,而另一项研究总结核小体组织数据资源[24].与可用的核心组织组织地图数据库相比,NUCOME在基于QC的数据过滤方面具有优势,不仅免除了用户对冗余数据的选择,而且验证了量化核小体组织信息的可靠性和准确性。

结构和内容

核小体组织参考基于QC评估和样本汇集的景观过滤

NUCOME重点过滤合格的人和小鼠MNase-seq数据。我们从基因表达综合(GEO;https://www.ncbi.nlm.nih.gov/geo/),并从Sequence Read Archive (SRA;http://www.ncbi.nlm.nih.gov/sra).数据来源包括69种小鼠细胞或组织类型和33种人类细胞或组织类型(附加文件1:表S1, S2)。所有数据都使用一个名为CAM的标准化分析管道进行处理,该管道是我们之前开发的[18],附带针对MNase-seq数据的qc测量。本文介绍了6种QC测量方法:测序覆盖率、AA/TT/AT二核苷酸频率、核小体DNA长度、TSSs处核小体缺失、TSSs下游核小体模糊度和DNase超敏感位点(DHSs)处核小体阵列的富集。QC测量显示,公共的MNase-seq数据质量在样本之间有很大的差异(附加文件1:图S1)。为了避免用户在样本间选择高质量数据时产生困惑,我们基于质量排名与样本汇集相结合的策略确定核小体组织参考景观(图)。1一个)。我们根据三个总结QC指示器从相同的细胞或组织类型中排名样本(n好,C更好的和R更好的),这是由六个QC测量值计算得出的(图。1b)如下。N是第一级指标,表示每个样品被评价为“通过”的QC测量的数量。C更好的是第二级指标,表示优先级高于同一细胞类型样品平均质量的QC测量的数量。R更好的是第三阶指标,表示每个样本的6个QC测量值的阶分位数之和。样本的最终排名顺序依赖于NC更好的和R更好的,每个细胞或组织类型的顶部样品被选择为“高质量样品”(图。1一个)。我们还汇集了具有高相关的样品,以产生“汇集样品”(图。1c).“高质量样本”被定义为每个细胞类型和处理条件的参考核小体组织图,除非“高质量样本”包含在用于构建“汇集样本”的样本中(详见方法)。

图。1
图1

MNase-seq数据的过滤和池化策略一个结合基于QC测量的数据过滤和样本池化的景观选择工作流程。bCD4 + T细胞中的样品中的QC测量等级样本的示例。灰色框表示所有CD4 + T电池的平均QC测量秩数,红色框表示具有更高QC秩数量的样本与平均水平相比,而蓝框表示具有较低QC等级数量的样本与平均水平。c.作为CD4+ T细胞样本间相关性分析的一个例子,Pearson相关系数被标记在盒子里

TSSS和DHSS上的核心组织功能

我们以单个基因或基因组区域的方式设计tss和dhs的多个信息核小体组织特征,以显示不同基因或基因组区域之间的异质性。高质量的核小体组织参考景观有两个主要好处。首先,QC评估确认了这些核小体组织特征在单个基因或DHS上的可靠性。然后,由于高质量和高覆盖率的特点,过滤和池化策略使参考景观更具可比性。

实用与讨论

我们将tss和dhs的核小体组织参考景观和核小体组织特征整合到一个可用的数据库中,命名为NUCOMEhttp://compbio-zhanglab.org/NUCOME).核小体组织参考景观允许用户进行自己的分析,在数据预处理和质量控制方面没有困难。显示TSSs和DHSs的核小体组织特征,探讨细胞或组织类型的差异。

NUCOME包括三个分析或搜索模块(图。2),即(a)“NuP浏览器”(核小体定位浏览器),(b)“TSS-centered Annotation”和(c)“DHS-centered Annotation”。此外,NUCOME还包括一个“下载”模块,提供下载标准化处理文件或文本文件的访问,这些文件存储在tss和dhs上的核小体组织特征。

图2
figure2

文章的内容和结构NUCOME数据库

下面简要说明模块的解释。对于分析和搜索模块,我们提供了它们的使用和应用示例。第一个例子探索了MNase-seq数据用于预测TF结合事件的扩展使用,以说明核小体组织与其他调控因子的相互作用机制。第二个例子说明了单个基因样本间核小体组织和转录活性之间的相关性。第三个例子显示了几种细胞类型中个体DHS的核小体组织特征,表明了DNA可及性的差异。

NUCOME提供合格的核小体组织参考景观

NUCOME为用户提供了一种方便的方法来下载文件,在“下载”模块中进行标准化处理(图。3.).核小体占用和核小族阵列的Bigwig文件允许用户在任何基因组区域上进行分析。储存核体组织的其他文件预先储存核体组织的特征对于用户来说是探讨核体组织在个体基因或DHS中的调节功能。此外,还提供了在该模块中提供UCSC浏览器中核体组织配置文件的可视化。

图3.
图3

的来源NUCOME数据库

可用的数据

核小体组织改善转录因子结合位点预测

“NUP浏览器”模块为用户提供了友好且灵活的平台,可在任何基因或基因组区域中查询核体组织信息。'NUP浏览器'模块量化描述局部染色质结构的多核组织特征,包括核小体占用,核小体阵列评分,核小体耗尽水平和核小体剖面。文本格式输出允许用户在不遇到数据处理和过滤中的困难的情况下执行核小体定位分析。“NUP浏览器”还通过绘制目标区域上的核小体剖面的平均曲线和热图来显示分析结果(图。4一个)。

图4.
装具

NuP Browser模块的解释和应用示例。一个NuP Browser模块的操作和结果展示。b在GM12878细胞系中ELF1结合预测模型中阳性样品或阴性样品的平均核心剖面。红线表示与芯片SEQ峰重叠的ELF1主题命中。橙色线表示不与芯片SEQ峰重叠的ELF1主题命中。cELF1预测模型的ROC曲线和AUC分数。橙色线表示模型的预测性能,只有主题分数。蓝线表示包含核体组织特征的模型的预测性能。dELF1在GM12878细胞系中实际的TF结合状态及预测结果。有两个例子在引入核小体组织特征后被识别出来,而没有被预测模型识别出来

既往研究证实,转录因子周围的核小体定位模式可能提示转录因子的调节功能,并在基因表达中发挥预测作用[19].在这里,我们探索了通过引入信息核小体组织来预测TF结合的能力。我们使用logistic线性回归来匹配36个ChIP-seq数据集中覆盖人类6种不同细胞类型的tf的结合状态(附加文件1通过对DNA序列的motif评分和这些位点的核小体组织特征进行评分。然后,我们进行受试者工作特征(receiver operating characteristic, ROC)曲线分析,以AUC评分评价预测的性能(详见Methods)。例如,平均曲线显示,ELF1在GM12878细胞系中更倾向于结合核小体占用率低、核小体消耗水平高的位置(图1)。4b).核小体组织特征显著提高了AUC评分(图。4c).核小体的组织特征能够比motif评分更好地区分阳性和阴性motif(图2)。4d).为了总结核小体组织在TF结合位点预测中的整体表现,我们分别针对特定细胞类型中的每个TF训练了两个预测模型,并比较了纳入核小体组织特征时的预测能力。结果表明,在预测模型中加入核小体组织特征后,AUC评分普遍提高(附加文件1:图S2A)。由于核体组织对TF结合的染色蛋白可接近性的影响,可能导致改善。所有TFS中的改进不等于,并且通过添加核小组组织功能(附加文件,可以将TFS分为改进的_G和改进的组。1:图开通)。我们发现TF结合预测的改善与固有DNA基序预测的贡献显著负相关(附加文件1:图S2C)。此外,在TF结合位点预测模型中引入核小体组织特征,普遍提高了模型的敏感性、准确性、F1评分和AUC评分,部分提高了特异性和FPR (Additional file)1:图S2D)。综上所述,这些结果表明,来自“NuP浏览器”模块的核小体组织信息可以广泛用于阐明哺乳动物的转录调节程序。

核小体组织调控转录活性

'TSS-enseed Annotation'模块允许用户在其目标基因上请求多个核体组织特征。搜索结果显示在含有核小体耗尽水平,核小体阵列评分,核占占率,+ 1个核心位置,接头长度,链接长度的标准偏差的表中的表中的核心归零率,标准偏差和在不同细胞或类型中的TSS中的1kb下游的核体数量(无花果。5a,请参见方法)。

图5.
figure5

“以tss为中心的注释”模块的解释和应用实例。一个“以tss为中心的标注”模块的操作和结果展示。b将47个样本分为高表达水平和低表达水平Nanog小鼠的基因。c这两类样本在几个核小体组织特征上的差异。通过秩和检验计算p值。d基因表达水平与核小体组织特征的相关性。皮尔森相关系数被标记在散点图的上面。核小体的结构特征是cd包括在TSS 1 KB箱上游的核小族阵列分数,TSS上的核小体耗尽水平,TSS的TSS和接头长度上的核心占据TSS 1 KB箱中的连接

核小体组织与转录活性之间的关系已经被许多先前的研究所阐明,在特定细胞类型中,根据表达水平分类的基因聚合核小体组织概况策略。以往的研究表明,高表达的基因在TSSs上往往有明显的核小体游离区(NFRs),对应于TSSs上核小体占用率较低。关于典型核小体定位模式,高表达基因在TSSs下游的核小体间距更有规律[25].拿着Nanog以基因为例,搜索结果显示多能细胞的核小体耗竭水平往往高于其他细胞类型(图。5a),与高度转录的活动吻合Nanog多能细胞中的基因。可以通过不集中的注释模块提供的核体组织特征来解释上述相关性是否存在于各种细胞类型中的个体基因上。在鼠标中,我们在表达水平之间进行了相关分析Nanog47种细胞类型或处理条件下TSS的核小体组织特征(图2)。5罪犯)。核小体阵列评分和核小体耗竭水平与表达水平呈显著正相关,与之前的知识相一致。然而,核小体占据率和连接子长度与表达水平呈较低的负相关。在这种情况下,我们得出结论,以前的知识不能完全解释核小体组织和转录活性之间的关系在个体基因水平。通过该搜索模块,用户可以通过单个基因的方式,深入探索核小体介导的不同细胞类型或处理条件之间的调控特征。

核小体组织影响基因组的可及性和转录因子的结合

“以国土安全部为中心的注释”模块与“以tss为中心的注释”模块在核小体组织特征、操作和结果展示方面相似。与“以tss为中心的注释”模块相比,“以dhs为中心的注释”提供了不同细胞类型或处理条件下的单个dhs的更多特征(图)。6a,请参见方法)。

图6
figure6

“以dhs为中心的注释”模块的解释和应用实例。一个“以dhs为中心的标注”模块的操作和结果展示。bIGV浏览器显示了四种细胞系的核小体占用情况和TF结合状态。c四种细胞系的核小体耗竭水平和核小体占用率。盒子的颜色对应于里面的颜色b,代表不同种类的细胞系

在这里,我们通过整合“DHS-centered Annotation”提供的核小体组织特征和转录因子结合的公开ChIP-seq数据,探索了核小体组织与DNA可达性和转录因子结合事件之间的关系。在前两个DHSs的情况下,MCF-7特异性TF结合事件伴随着较高的核小体消耗水平和较低的核小体占用率。在另一种情况下,DHS在所有细胞系中都被tf占据,核小体占据信号支持DNA在这些细胞系中是高度接近的。核小体消耗水平显示相反的结果(图。6b, c)。这可以通过邻近核小体和核小体游离区宽度的影响来解释。通过该模块,用户可以探索核小体组织在局部染色质结构中的调节功能以及dna -蛋白质相互作用。

结论

NUCOME是一个综合数据库,组织MNase-seq数据的合格数据源,并提供人类和小鼠各种细胞和组织类型的核小体组织参考景观。NUCOME在web界面中提供模块,用于以下三个主要功能:(1)查询任意基因组区域的核小体组织信息,并提供文本格式输出供用户下游分析使用;(2)查询不同样本中单个基因或DHS的核小体组织特征;(3)查询下载数据源。鉴于核小体组织参与各种调控活动,而且NUCOME是一个全面的数据库,组织由QC测量监督的核心组织引用的景观,这是一种有价值的资源,可用于阐明人和小鼠的转录监管计划的全景视图。

方法

核小体组织参考景观过滤

NUCOME根据六项质量控制措施过滤核小体组织样本。测序覆盖范围、AA/TT/AT二核苷酸频率、核小体DNA长度、TSSs处核小体耗竭和DHSs处定位正确的核小体阵列富集的定义已在前面进行了描述[18].TSSs下游核小体模糊定义为+ 1、+ 2、+ 3、+ 4核小体距离的方差系数(CV),核小体位置定义为局部最大位置。对于核小体DNA长度的测量,样本按测量值对146 bp的偏差按升序排列。对于下游TSSs的核小体模糊度测量,根据测量值对样本进行升序排序。对于其他四项测量,样本是根据测量值降序排列的。对于每个样品,除了测序范围外,每个QC测量都有一个“通过”或“失败”标签。AA/TT/AT二核苷酸频率、核小体DNA长度、TSSs处核小体耗尽和DHSs处定位良好的核小体阵列富集的“通过”和“失败”标准以前已定义[18].对于TSSS下游的核心模糊性,具有低于0.4的值的样品被定义为“通过”,而其他值被定义为“失败”。

对于每个细胞或组织类型,通过三个指标选择高质量的样本。首先,每个样本的“通过”QC测量的总数被定义为第一级指标(N在无花果。1a).然后,我们计算每个样本的QC测量的数量,以使rank分位数优于样本的平均rank分位数来自与第二个指标(C)相同的细胞类型更好的在无花果。1a).第三,我们计算每个样本所有QC测量值的秩分位数之和作为第三指标(R)更好的在无花果。1a).样本的最终排序顺序由排序N决定C更好的和R更好的先后。对于每个细胞或组织类型,最高级别的样本被选为“高质量样本”(附加文件)1:图中S11一个)。

对于每个细胞或组织类型,“汇集样本”由来自同一细胞类型的高度相关的样本汇集。首先,我们计算了每个样本在整个基因组1 kb窗口内的核小体占用率。然后计算同一细胞类型样品与处理条件之间的Pearson相关系数。Pearson相关系数高于0.6的样本被合并为“合并样本”(附加文件1:图中的S2。1一个)。

“高质量样本”被定义为每个细胞类型和处理条件的参考核小体组织景观,除非“高质量样本”包含在用于构建“汇集样本”的样本中。滤除覆盖率低于5倍的样本。

TSS和DHS的核小体结构特征

在这里,我们定义了TSSs和DHSs上的几个核小体组织特征,并计算了这些特征在每个参考核小体组织图的单个基因或DHS上。

根据从TSS到下游1kb区域的核小体阵列平均信号与给定样本的全基因组平均信号计算TSS下游核小体阵列评分。TSS的核小体消耗水平计算为TSS的核小体占用不足程度。位点中心200bp bin的最大核小体占用被定义为Ncenter,并且围绕两侧跨越200bp的最大核微核占用率被定义为N背景.如果N中心是比N背景,该位点核小体耗竭水平赋值为0。否则,计算位点的核小体耗尽水平为1 -N中心/N背景.TSS的核小体占用率计算为TSS中心100 bp的核小体占用率信号的平均值。

计算+ 1核小体、核小体数目、连接子长度和连接子长度的标准差如下。首先,扫描每个TSS的核小体占用概况,并从TSS到下游1 kb的bin进行平滑处理。检测局部最大信号,确定与TSS的相对距离为候选核小体位置。如果相邻的核小体位置小于100 bp,则核小体占据率较高的核小体位置保持不变。最后,确定了TSS下游的核小体位置。第一个核小体位置被定义为+ 1核小体。连接子长度计算为相邻核小体位置间的平均距离减去147bp,这是核小体DNA的标准长度。在确定核小体位置后,可以计算出连接子长度和核小体数量的标准差。如果+ 1核小体无法检测到,则将+ 1核小体、连接子长度和连接子长度标准差存储为-1,便于识别。如果核小体的数目小于2,则连接子长度和连接子长度的标准差以-1存储。 If the number of nucleosomes was less than 3, the standard deviation of linker length was stored as -1.

用与tss相同的方法计算DHSs上的核小体组织特征。有两个主要区别。同时计算DHS上游的核小体阵列评分。通过扫描DHS上游1kb的核小体占用谱,计算-1核小体、核小体数量、连接子长度和连接子长度的标准差。

预测TF结合位点

我们从Cistrome DB数据库收集了TF芯片SEQ数据[26]作为实际的TF绑定轮廓。通过数据库中提供的QC测量选择合格的芯片SEQ样本。通过使用Binoch [Cinoch,我们将整个基因组扫描每个TF的显着主题命中[27].对于每个TF ChIP-seq样本,与TF结合峰重叠的motif命中被定义为阳性样本(结合位点)。阴性样品被定义为其他motif命中,没有与ChIP-seq样品中任何检测峰重叠(未结合位点)。所有阳性和阴性样本均用于评估TF结合预测。模型的训练和测试采用了十倍交叉验证策略。BINOCh计算的母题评分是第一预测因子。核小体组织特征作为第二预测因子,提高了预测性能。在这里,我们在预测模型中包括基序命中的核小体消耗水平和核小体占用率,以及基序命中侧翼的核小体阵列得分。首先,采用与TSS上核小体耗竭水平相同的方法计算基序命中的核小体耗竭水平,将给定的位点替换为基序命中的中心。然后,计算基序命中的核小体占用率为位点中心100 bp bin处的平均核小体占用率。 The nucleosome array score on the upstream or downstream 1 kb bin of the site was calculated as the average nucleosome array profile signal upstream or downstream of the 1 kb bin of the given site.

通过对基序评分和核小体组织信息进行评分,用R中的“glm”函数进行logistic线性回归,以匹配实际的TF结合状态(结合或未结合)。R软件包‘pROC’通过计算不同阈值下的真阳性率和真阴性率来评估预测能力,R中‘AUC’函数计算的曲线下面积(AUC)评分作为评价TF结合预测性能的指标。以AUC (motif评分+核小体组织信息)- AUC (motif评分)计算预测改进量。

数据和材料的可用性

NUCOME数据库可在http://compbio-zhanglab.org/NUCOME.标准化的分析管道CAM可在https://github.com/TongjiZhanglab/CAM

缩写

MNase:

微核核酸核酸酶

质量控制:

质量控制

TFs:

转录因子

非功能性需求:

无核细胞区域

tss:

转录起始站点

国土安全部:

DNase高度敏感的网站

鹏:

接受者操作特性

AUC:

曲线下面积

参考

  1. 1.

    赖WKM,PUGH BF。了解核细胞组动力学及其与基因表达和DNA复制的链接。NAT Rev Mol Cell Biol。2017; 18:548-62。

    CAS文章谷歌学者

  2. 2.

    张志强,张志强,张志强,等。酵母基因组中核小体统计定位的屏障核小体模型。基因组研究》2008;18:1073 - 83。

    CAS文章谷歌学者

  3. 3.

    海纳SJ,顾伟,Carone BR, Landry BD, Rando OJ, Mello CC,等。esBAF抑制胚胎干细胞普遍存在的非编码转录。基因Dev。2015;29:362 - 78。

    CAS文章谷歌学者

  4. 4.

    Teves SS, Weber CM, Henikoff S.通过核小体转录。生物化学学报。2014;39:577-86。

    CAS文章谷歌学者

  5. 5.

    Racki LR,Narlikar GJ。ATP依赖性染色质重塑酶:两个头更好,恰好不同。CurrOpin Genet Dev。2008; 18:137-44。

    CAS文章谷歌学者

  6. 6.

    引用本文:王志强,王志强,王志强,等。在干细胞发育过程中,核小体重定位连接DNA(去甲基化)和差异CTCF结合。基因组研究》2014;24:1285 - 95。

    CAS文章谷歌学者

  7. 7.

    Petesch SJ, Lis JT。在转录延长过程中克服核小体屏障。趋势麝猫。2012;28:285 - 94。

    CAS文章谷歌学者

  8. 8.

    李副总裁李Y,舒尔茨,邓C, G,沈Y,土司BK, et al。Setd1a和NURF在红细胞谱系的形成和分化过程中介导染色质动态和基因调控。核酸学报2016;44:7173-88。

    CASPubMedpmed中央谷歌学者

  9. 9.

    West JA, Cook A, Alver BH, Stadtfeld M, Deaton AM, Hochedlinger K,等。在细胞分化和重编程过程中,核小体占据在关键调控区域的局部变化。Nat Commun。2014;5:4719。

    CAS文章谷歌学者

  10. 10.

    等。依赖于gata3的细胞重编程需要染色质重塑器激活域依赖的招募。基因组医学杂志。2016;十七36。

    文章谷歌学者

  11. 11.

    Bochkis IM,Przybylski D,Chen J,Regev A.与年龄哺乳动物肝脏的代谢改变相关的核微血症的变化。细胞批准。2014; 9:996-1006。

    CAS文章谷歌学者

  12. 12.

    Chambers SM, Shaw CA, Gatza C, Fisk CJ, Donehower LA, Goodell MA。老化的造血干细胞功能下降和表现出表观遗传失调。公共科学图书馆杂志。2007;5:e201。

    文章谷歌学者

  13. 13.

    金俊,王光良,王光良,等。表观遗传改变在与年龄相关的肝脏功能障碍中发挥关键作用。衰老细胞。2010;9:895 - 910。

    CAS文章谷歌学者

  14. 14.

    陈磊,陈凯,李伟,等。MeCP2在神经元成熟时与非cg甲基化DNA结合,影响转录和Rett综合征的发病时间。中国科学院院刊2015;112:5509-14。

    CAS文章谷歌学者

  15. 15.

    王志强,王志强,王志强,等。癌症进展中的人类基因组的核小体综合图谱。Oncotarget。2016;7:13429-45。

    文章谷歌学者

  16. 16.

    Gomez NC, Hepperla AJ, Dumitru R, Simon JM, Fang F, Davis IJ。重复元素中染色质的广泛可及性将干细胞与人类癌症联系起来。细胞众议员2016;17:1607-20。

    CAS文章谷歌学者

  17. 17.

    引用本文:王志强,王志强,王志强,等。胚胎干细胞发育过程中的全基因组核小体定位。国家结构与社会科学学报2012;19:1185-92。

    CAS文章谷歌学者

  18. 18.

    胡胜,陈旭,廖建军,陈勇,赵超,张亚明。一种基于MNase-seq数据的质量控制管道。PLoS ONE。2017; 12: e0182771。

    文章谷歌学者

  19. 19.

    Maehara k,Ohkawa Y.核心定位模式在转录因子功能中的探索。SCI批准。2016; 6:19620。

    CAS文章谷歌学者

  20. 20.

    Kundaje A, Kyriazopoulou-Panagiotopoulou S, librecht M, Smith CL, Raha D, Winters EE, et al.;染色质环境在调控元件上的普遍异质性和不对称性。基因组研究》2012;22:1735-47。

    CAS文章谷歌学者

  21. 21.

    休斯AL,兰多OJ。核小体在体内定位的机制。生物物理学报。2014;43:41-63。

    CAS文章谷歌学者

  22. 22.

    刘学森。识别和减轻下一代染色质生物学测序方法的偏差。Nat Rev Genet. 2014; 15:709-21。

    CAS文章谷歌学者

  23. 23.

    刘赵Y,王J,梁F, Y,王问,张H,等。NucMap:跨物种的全基因组核小体定位图数据库。核酸Res. 2019;47: D163-9。

    CAS文章谷歌学者

  24. 24.

    Teif VB。核小体定位:在线资源和工具。短暂的Bioinform。2016;17:745-57。

    CAS文章谷歌学者

  25. 25.

    核小体稳定性和动力学的功能作用。简明功能基因组学。2015;14:50-60。

    CAS文章谷歌学者

  26. 26.

    Mei S,Qin Q,Wu Q,Sun H,Zheng R,Zang C等人。Cistrome数据浏览器:人体和鼠标中的芯片SEQ和染色质无障碍数据的数据门户。核酸RES。2017; 45:D658-62。

    CAS文章谷歌学者

  27. 27.

    刘学森。BINOCh:来自核小体占用变化的结合推断。生物信息学。2011;27:1867-8。

    CAS文章谷歌学者

下载参考

确认

我们感谢廖吉在项目前期所做的贡献。

资金

国家自然科学基金项目(no . 31970642)。国家重点研发计划项目(no . 2017YFA0102600, no . 2016YFA0100400);国家自然科学基金项目(no . 32030022,31721003)。关键词:岩石力学,数值模拟,数值模拟,数值模拟资助方不参与研究的设计、数据的收集、分析和解释以及手稿的撰写。

作者信息

从属关系

作者

贡献

CX有助于数据处理,数据库建立,网站建设和稿件写作。YH参加网站建设。LG为数据库模块设计应用示例。ZY设计该项目并参与稿件写作。所有作者都读过并批准了稿件。

相应的作者

对应于Guifen刘勇张

道德声明

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

两位作者宣称没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

额外的文件1

:补充表格和数字。表S1是人类用于样品过滤的各种细胞和组织类型的MNASE-SEQ数据的概述。表S2是小鼠中各种细胞和组织类型的MNASE-SEQ数据的概述,用于样品过滤。表S3是TF绑定预测模型中使用的TFS的芯片-SEQ数据的摘要。图S1显示了收集的所有MNASE-SEQ样本的QC测量概述。图S2显示核体组织特征改善了TF结合预测。

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

陈旭东,杨华,刘国强。et al。NUCOME:哺乳动物基因组中核小体组织参考景观的全面数据库。欧宝娱乐合法吗22,321(2021)。https://doi.org/10.1186/S12859-021-04239-021-04239-0.

下载引用

关键字

  • 核小体
  • 数据库
  • 转录调控
  • MNase