跳到主要内容

DeltaNeTS+:利用基因表达和转录调控网络阐明药物和疾病的机制

摘要

背景

了解疾病和药物的分子靶点,对于阐明疾病的发病机制和药物的作用机制,推动药物的发现和治疗方案的制定都是至关重要的。在这方面,高通量基因转录谱已成为一项领先的技术,可以生成疾病或药物化合物引起的转录改变的全基因组数据。然而,由于控制基因转录过程的基因调控网络的复杂性,基于基因表达差异确定直接基因靶点,特别是在间接(下游)效应背景下,是困难的。

结果

在这项工作中,我们开发了一种网络分析方法,称为DeltaNeTS+,用于从基因转录谱推断药物和疾病的直接基因靶点。DeltaNeTS+使用基因调控网络模型,利用基因表达数据识别基因转录的直接干扰。重要的是,DeltaNeTS+能够结合稳态和时程表达谱,以及利用有关基因网络结构的信息。我们证明了DeltaNeTS+在利用复杂生物中的基因表达数据预测基因目标方面的能力,包括秀丽隐杆线虫以及人类细胞系(t细胞和Calu-3)。更具体地说,在应用于甲型H1N1流感(猪流感)和H5N1(禽流感)感染的时间进程基因表达谱时,DeltaNeTS+阐明了两种流感毒株引起的动态细胞扰动的关键差异。

结论

DeltaNeTS+是一个强大的网络分析工具,用于从基因表达谱推断基因目标。如案例研究所示,通过结合基因网络结构的可用信息,DeltaNeTS+可以从小样本量中准确预测直接基因靶点(~ 10秒)。DeltaNeTS+支持将静态和动态表达数据与从基因组信息中提取的转录网络结构相结合,这对于个性化医疗至关重要,因为个性化医疗可以针对个体患者进行治疗。DeltaNeTS+可从以下网站免费下载:http://www.github.com/cabsel/deltanetsplus

背景

分析药物与疾病的分子机制是药物研究的中心任务。对于药物,这个任务包括识别与化合物相互作用与其药理活性相关的分子靶点。了解药物的分子作用机制(MOA)不仅对确定药物的疗效,而且对确定任何潜在的毒副作用都很重要。另一方面,对一种疾病的分子机制的深入了解可能导致对其发病机制的更好理解,并可能产生新的和更好的治疗方案。在这方面,基因转录谱已经成为一个可行的高通量平台,用于药物发现和药物靶标识别[12]及研究疾病的发病机制[3.]. 然而,利用基因转录谱确定药物或疾病发挥作用的直接分子靶点仍然是一个重大的生物信息学挑战。由药物或疾病引起的基因表达变化可能直接由药物或疾病的作用引起,也可能间接作为下游或次级效应引起。由于基因表达是一个高度调控的过程,涉及到一个复杂的、上下文特定的基因调控网络(GRN),因此从基因转录谱中描绘直接和间接的基因靶点更加复杂。

从基因转录数据推断基因靶点已经提出了许多策略[4.]. 一般来说,这些策略分为两大类:比较分析法和网络分析法。前者涉及将感兴趣的转录谱与已知靶点的参考谱库进行比较[125.6.[假设转录谱中的肖像表明分子靶标中的相似性。后一类方法使用GRN模型来考虑分析基因表达数据时的基因转录规则。许多网络分析方法,尤其是因果分析[7.8.]及需求[9.],采用grn的图模型,其中节点表示基因,边表示基因与基因的相互作用。在这里,基因靶标识别通常被表述为使用基因转录谱的统计假设检验。另一组网络分析方法,包括通过多元回归(NIR)进行网络识别[10,网络识别(MNI)的动作方式[11],稀疏立方程模型(SSEM)12]和DeltaNet [13,依赖于基因转录调控网络的机制模型。通过调用伪稳态假设,从基因表达数据中推断基因目标被重新定义为一个回归问题。一般来说,当一个基因的表达明显偏离GRN模型基于其转录因子(TFs)表达的预测时,该基因作为潜在靶点的得分较高。

在这里,我们提出了一种大大改进了我们之前算法DeltaNet的网络分析方法[13为了解决两个缺点:时间序列数据的分析和对GRN结构的先验信息掺入。正如我们早前证实[14], DeltaNet在使用时间序列转录数据时表现较差,原因是潜在的稳态假设无效。这种问题可能适用于类似的伪稳态假设算法,如NIR、MNI和SSEM。显然需要适应时间序列表达数据,因为它们构成了一类重要的基因表达数据集。一个显著的例子是Connectivity Map (CMap),它包括来自9种不同细胞类型的超过150万个时间序列基因表达谱,覆盖大约5000个小分子化合物和3000个遗传试剂。

任何网络分析方法的第二个缺点是在分析中所采用的基因网络模型的不确定性。在DeltaNet,以及NIR, MNI和SSEM中,GRN是作为中间步骤或隐含推理从基因表达数据中重建的。但是,正如我们和其他许多人所表明的那样[1516,这样的GRN重构是一个待定问题,因此重构的GRN往往具有很高的不确定性。与此同时,在过去十年中,我们在转录调控元件的定位方面也取得了巨大进展[17,启动子/增强子活性的测量[18],以及TF结合基序和结合位点的鉴定[19]. 这些信息使GRN图的重建成为可能~ 人类300种细胞类型[20].因此,在网络分析范式中,将GRN结构上的不同数据集与基因转录数据结合起来进行基因靶标推断显然是有机会和必要的。

在这项工作中,我们开发了Deltanets +。Deltanets +能够将稳态和时间序列基因转录数据组合用于基因目标评分。Deltanets +进一步能够将GRN结构的现有信息结合到目标推断。我们展示了甄子英+过度熟悉的程序的优越性,包括TSNI(时间序列网络识别)[21),需求9.和差异表达分析,利用复杂生物的基因转录数据集,包括秀丽隐杆线虫和人类。值得注意的是,DeltaNeTS+的应用 从感染H5N1(禽流感)和H1N1(猪流感)的人肺Calu-3细胞获得的基因表达数据显示,细胞对这两种毒株的反应存在关键差异。

方法

DeltaNeTS +

DeltaNeTS+是一种从时间序列基因表达数据中推断因果基因靶点的网络分析方法。DeltaNeTS+依赖于基因转录过程的常微分方程(ODE)模型,如下[22]:

$ $ \压裂{{dr_ {k}}} {dt} = u_ {k} \ mathop \刺激\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n} r_ {j} ^{{现代{kj}}} - d_ {k} r_ {k} $ $
(1)

在哪里R.K.表示基因浓度K.转录物(mRNA),K.D.K.表示基因的转录和降解速率常数K.分别一种kj表示基因的调控j在基因K.,N是基因的数目。大小和的迹象一种kj分别指出监管互动的强度和模式。肯定的一种kj表示激活,同时为负值一种kj表明镇压。常做的,一种jj’s被假定为零(即没有自我监管循环)。采用伪稳态假设和对数变换,Eq. (1)可以简化为,

$ $ c_ {ki} = \ mathop \总和\ limits_ {j = 1} ^ {n}现代{kj} c_{他}+ p_ {ki} $ $
(2)

在哪里Cki=日志2R.ki/R.kb)表示基因mRNA水平的log-two change (log2FC)K.治疗之间的样本一世和相应的控制B.,P.ki日志(= (ki/D.ki) / (kb/D.kb)表示样品处理的效果一世在基因K.。变量P.ki是感兴趣的未知变量。公式中的公式(2)显示基因表达的变化K.通过其转录调控因子产生的间接效应(Eq. (2)和直接效应(Eq.()中的最后一项)2)).更具体地说,是变量P.ki给出基因表达的倍数变化量K.这不能用其转录调控因子的折叠变化表达来解释。在这里,我们使用P.ki作为对基因直接扰动的衡量K.的治疗。正(负)P.ki表明处理引起较高(较低)的基因水平K.转录比什么是从基因的转录因子或调节的变化预期。在一般情况下,幅度较大P.ki,对基因的干扰越强K.在样品中我。

由于对于一个给定的处理(例如,技术重复,多个时间点),我们通常会有多个样本,因此我们可以将相同的扰动分配给所有相关的样本。为m不同的治疗方法m样品(m<m),则可考虑矩阵向量形式的方程:

$${\mathbf{C}}={\mathbf{AC}}+{\mathbf{PZ}$$
(3)

在哪里CN × mlog2fc的矩阵N基因在m样品,一种N × N矩阵的一种kj描述GRN,P.N × m扰动系数矩阵,以及Z.是一个m × m指定特定扰动变量的{0,1}映射矩阵P.给适当的样本。请注意,Z.成为一个m × m当扰动被视为在整个系统中是不同的时,单位矩阵m样本。

对于时间序列数据,我们假设mRNA浓度在采样时间点之间变化

$ ${\文本日志}{}\离开({r_ {k} ^ {l + 1}} \右)= s_ {k} ^ {l} t +文本日志}{}{\ \离开({r_ {k} ^ {l}} \) \;{\文本为}{}\;t_ {l} \ t \识别t_ {l + 1} $ $识别
(4)

在哪里\ (t_ {l} \识别)表示l -时间点,\(r{k}^{l}\)是基因的mRNA浓度吗K.L.-时间点,和\ (s_ {k} ^ {l} \)是两个时间点之间的斜率。用情商。1),的对数的一阶导数R.K.可以改写为:

$ $ \压裂{{d{\文本日志}{}\离开({r_ {k}} \右)}}{dt} = \压裂{{u_ {k}}} {{r_ {k}}} \ mathop \刺激\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n} r_ {j} ^{{现代{kj}}} - d_ {k} = u_ {k} \ exp \离开({\ mathop \总和\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n}现代{kj} \ log \离开({r_ {j}} \右)- \日志\左({r_{k}}} \右)- d_{k}$$
(5)

通过替换等式(4.)R.K.在情商。5.)时,可导出下式(t_{l} \le t \le t_{l + 1}\)

$ $ \压裂{{d{\文本日志}{}\离开({r_ {k}} \右)}}{dt} = u_ {k} \ exp \离开({\ mathop \总和\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n}现代{kj} \离开({s_ {j} ^ {l} t +文本日志}{}{\ \离开({r_ {j} ^ {l}} \右)}\右)- \离开({s_ {k} ^ {l} t +文本日志}{}{\ \离开({r_ {k} ^ {l}} \右)}\右)}\右)——d_ {k} $ $
(6)

等式的导数(6.)(即对数(R.K.))在式(4.).

$ $ \压裂{{d ^{2}{\文本日志}{}\离开({r_ {k}} \右)}}{{dt ^ {2}}} = 0 = u_ {k} \ exp \离开({\ mathop \总和\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n}现代{kj} \离开({s_ {j} ^ {l} t +文本日志}{}{\ \离开({r_ {j} ^ {l}} \右)}\右)- \离开({s_ {k} ^ {l} t +文本日志}{}{\ \离开({r_ {k} ^ {l}} \右)}\右)}\)\左({\ mathop \ \ limits_总和{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n}现代{kj} s_ {j} ^ {l} - s_ {k} ^ {l}} \右)$ $
(7)

在这里,K.D.K.都是相同的L.th和L.+ 1个时间点,即该时间窗内的扰动为常数。自K.以及等式中的指数项(7.)总是积极的,剩下的术语应该为零。因此,可变之间的以下关系\ (s_ {k} ^ {l} \)网络系数一种kj可获得:

$ $ s_ {k} ^ {l} = \ mathop \总和\ limits_{{\开始{数组}{* c {20}} {j = 1} \ \ {j \ ne k} \ \ \结束{数组}}}^ {n}现代{kj} s_ {j} ^ {l} $ $
(8)

式的矩阵形式(8.)N基因和m样品如下:

$${\mathbf{S}}={\mathbf{AS}$$
(9)

在哪里S.N × m由时间序列log2fc数据计算出的斜率矩阵。在DeltaNeTS+中,时间序列基因表达谱的斜率在每个采样时间点使用二阶精确有限差分近似计算[23].第一个时间点和最后一个时间点分别采用前向和后向有限差分法,中间时间点采用中心差分法。至少,计算时间斜率只需要两个时间点,但有更多的时间点可以实现更高精度的有限差分。

组合式(3.)和Eq(9.), DeltaNeTS+计算未知变量一种P.用下面的公式一行一行地计算:

$ $ \[{\离开开始{数组}{* c{20}}{{\眉题{\ mathbf {c}}} _ {k} ^ {{{T \文本 }}} } \\ {{\ 眉题{\ mathbf{年代}}}_ {k} ^ {{{T \文本 }}} } \\ \ 结束{数组}}({\ \]= \左右开始{数组}{* c{20}}{{\眉题{\ mathbf {c}}} {T ^{{\文本 }}} } & {\ mathbf {Z}} \ \{{\眉题{\ mathbf{年代}}}{T ^{{\文本 }}} } & {\ mathbf{0}}{数组}}\ \ \ \端)\[{\开始离开数组{}{* c {20}}{{\ mathbf{一}}_ {k} ^ {{{T \文本 }}} } \\ {{\ mathbf {P}} _ {k} ^ {{{T \文本 }}} } \\ \ 结束{数组}}\]$ $
(10)

在哪里\({\overline{\mathbf{C}}}{k}^{{}}\)\({\眉题{\ mathbf{年代}}}_ {k} ^ {{}} \)一种K.,P.K.是矩阵的行向量\({\眉题{\ mathbf {C}}} \)\({\眉题{\ mathbf{年代}}}\)一种,P.基因K.0.m × m零矩阵。的矩阵\({\眉题{\ mathbf {C}}} \)\({\眉题{\ mathbf{年代}}}\)归一化的log2FC和斜率矩阵\ ({\ mathbf {C}} \)\({\mathbf{S}}\)这样每个矩阵都有一个2范数,等于矩阵中样本数的平方根(即矩阵的列数)。标准化被设置来平衡两个矩阵在决定中的贡献一种P.

在DeltaNeTS+中,当GRN的结构信息对每个基因都是可用的时候K.,我们有关于它的转录因子的信息,我们可以减少Eq中所述问题的维度(10的推论一种仅适用于与基因TFs相关的基因子集K.

$ $ \[{\离开开始{数组}{* c{20}}{{\眉题{\ mathbf {c}}} _ {k} ^ {{{T \文本 }}} } \\ {{\ 眉题{\ mathbf{年代}}}_ {k} ^ {{{T \文本 }}} } \\ \ 结束{数组}}({\ \]= \左右开始{数组}{* c{20}}{{\眉题{\ mathbf {c}}} _{{{文本\ {TF}} _ {k}}} {T ^{{\文本 }}} } & {\ mathbf {Z}} \ \{{\眉题{\ mathbf{年代}}}_{{{文本\ {TF}} _ {k}}} {T ^{{\文本 }}} } & {\ mathbf{0}} \ \ \{数组}结束} \右]\[{\离开开始{数组}{* c {20}} {{\ mathbf{一}}_{{{文本\ {TF}} _ {k}}} {T ^{{\文本 }}} } \\ {{\ mathbf {P}} _ {k} ^ {{{T \文本 }}} } \\ \ 结束{数组}}\]$ $
(11)

下标TF在哪里K.是指基因的对应基因的转录因子的所述子集K.。方程(11)用岭回归求解得到\ ({\ mathbf{一}}_{{{文本\ {TF}} _ {k } }}^{{}}\)\ ({\ mathbf {P}} _ {k} ^ {{}} \)整个GRN的矩阵[24]. 当GRN结构未提供或不可用时,DeltaNeTS+求解等式(10),利用LASSO正则化方法预测稀疏矩阵一种K.P.K.[14].我们实现了LASSO [25在DeltaNeTS+中使用GLMNET算法k -折叠交叉验证(默认)K. = 10) [26].因此,DeltaNeTS+能够处理的最小样本数是K.样本。

基因表达数据

我们将DeltaNeTS+应用于时间序列的基因表达数据秀丽隐杆线虫胚胎(27],人脐血CD4+T细胞[28]和人肺癌Calu-3细胞[293031].为秀丽隐杆线虫从基因表达综合数据库(GEO)中获取胚胎、log2强度数据,并通过稳健多阵列平均(RMA)方法进行归一化[32](注册号:GSE2180和GSE51162)。基因表达的Log2FC及其统计意义(Benjamini–Hochberg调整P.值)在各时间点基因敲除和野生型之间的条件,使用在一个线性拟合模型和经验贝叶斯法计算limmaBioconductor包。探针组被映射到官方的基因符号celegans.db。在多个探针集映射到一个基因符号的情况下,我们从调整了最小平均值的探针集取log2FCP.值除以样本。

对于人T细胞,通过分位数归一化的log2强度数据来自GEO(登录号:GSE17851)。以同样的方式秀丽隐杆线虫,计算基因敲除与野生型条件在每个时间点之间的log2FC值limma。探针集被映射到GEO中Illumina human-6 v2.0表达串珠芯片数据中的基因符号(登录号:GPL6102),对于映射到同一基因的多个探针集,调整平均最小的探针集P.选择所有样品的价值。

对于Calu-3数据,我们编辑了原始数据安捷伦全人类基因组4 × 44 K来自GSE33264的IFN-α和IFN-γ实验的微阵列数据[31]以及GSE37571和GSE33142用于H1N1和H5N1试验[2930]. 原始数据采用背景校正和标准化方法normexp斯蒂利韦方法在limma生物导体包装。每个时间点病毒(或干扰素)和模拟样本之间的log2FCs使用limma,以及他们的统计数字P.benjamin - hockberg方法调整的值。探针组被映射到官方的基因符号hgug4112a.db包中。对于一个有多个探针集的基因,我们从调整平均最小的探针集中选择数据P.价值。

在对时间序列数据进行预处理时,我们使用具有统计学显著性log2FC相邻时间点的线性插值值替换任何没有统计学显著性的时间序列log2FC基因表达数据。请注意,统计显著性(P.值)至少需要三次重复,因此,仅当三次或更多重复可用时,才使用上述相邻时间点进行线性插值。除非另有说明,否则我们使用Benjamini–Hochberg调整P.价值观< 0.05以建立统计显著性。如果基因的log2FC值在任何时间点都不具有统计学意义,我们将log2FC设置为零。

基因调控网络

grn for.秀丽隐杆线虫胚胎数据集是通过TF基因相互作用获得的秀丽隐杆线虫在DNA数据库中[33[其中通过基于TF-DNA复合物的已知3D结构计算结合亲和力来鉴定TF结合基质及其调节基因的影响。grn for.秀丽隐杆线虫由48个转录因子到15738个基因的355080条边组成。

同时,人类T细胞和Calu-3数据集的GRN分别从调节电路数据库中可获得的人类脐血来源细胞和人类上皮肺癌细胞的TF基因相互作用中获得[20].我们只使用了在Regulatory Circuit数据库中信心评分大于0.1的tf基因相互作用。人类t细胞和Calu-3的grn分别由11,955条边指向438个TFs指向2,385个基因和42,145条边指向515个TFs指向7,125个基因组成。

TSNI和需求实施

TSNI [21,下载MATLAB子程序https://dibernardo.tigem.it/softwares/time-series-network-identification-tsni并将其应用于秀丽隐杆线虫,人类t细胞和Calu-3干扰素数据。优化TSNI中主成分数的参数为nPC = 1。只使用第一个主成分。需求(9.[我们从Biocomodions安装了需求R包[34) (https://www.bioconductor.org),并应用了与DeltaNeTS+分析相同的GRNs方法。

Calu-3数据的富集分析

在干扰素案例研究中,采用每种方法(DeltaNeTS+、TSNI和log2FC)排名前50位的基因进行Gene Ontology (GO)和Reactome pathway enrichment分析,使用enricr [35].对于甲型流感病毒感染个案研究,平均P.values of DeltaNeTS+ for each phase (phase 1: 0 to 7 h, phase 2: 7 to 18 h, phase 3: > 18 h) were used for the gene set enrichment analysis (GSEA) of Reactome pathways [36]使用反应[37在R.富集分析之前,基因排序的基础上平均P.对于每个时间阶段,在GSEA期间排除无干扰评分的基因。之后,进行显著性评分(− 日志10P.富集的途径的值)与从GSEA阳性富集得分途径中计算。图1中的结果的图示。2只显示Reactome层次结构中最高级别的路径信息(https://reactome.org/PathwayBrowser),显著性得分为最佳显著性得分(最高−log)10P.值)。

加权基因共表达网络分析(WGCNA)

WGCNA[38]应用于H1N1(流感A/CA/04/09)和H5N1(流感A/VN/1203/04)样本的DeltaNeTS+评分。H1N1数据时间从9点(0、3、7、12、18、24日,30日,36岁,和48 h)和H5N1数据来自6个时间点(0、3、7、12、18、24 h)。在WGCNA分析中,我们计算模块用最少的200个基因使用签署网络选项(对振动功率= 18)。然后,使用R中的ReactomePA和clusterProfiler包对每个模块进行GO和Reactome富集分析。

结果

预测基因扰动

我们从时间序列推断基因扰动试验DeltaNeTS +的性能秀丽隐杆线虫以及来自RNA干扰(RNAi)实验的人类T细胞基因表达谱。DeltaNeTS+生成基因微扰分数P.ki使用整个GRN的所有基因。P.ki表示对基因表达的扰动强度K.在示例一世. 在下文中,我们使用扰动分数的大小对DeltaNeTS+预测的基因目标进行排序。这个秀丽隐杆线虫数据集包括三个遗传扰动实验[27],每一个都提供了10个时间点的基因表达数据skn-1及朋友-1击倒shRNA墨西哥人-3或-1突变细胞。人类T细胞数据集包括shRNA敲除STAT6后4个时间点测量的时间序列基因表达数据[28](见表1).当将DeltaNeTS+应用于这些数据时,基因调控网络图为秀丽隐杆线虫和人类t细胞作为先验信息(见方法).

表1基因靶标的排名预测秀丽隐杆线虫以及由DeltaNeTS+、TSNI、DeMAND和log2FC幅度组成的人类t细胞数据集。排名是根据GRN中每个算法的所有基因的目标分数的大小计算的方法

为了比较,我们使用TSNI生成了基因靶预测[21]及需求[9.]以及基于log2FC值大小的值。对于log2FC分析,基因目标候选基因按log2FCs绝对值的降序排列,而对于需求,基因按统计值的升序排列P.失调的价值[9.]. 对于TSNI,我们使用第一个主成分生成基因靶预测,因为在使用1到3之间的主成分的试验中,该设置提供了最好的准确性。我们还比较了两种不同情况下基因靶预测的准确性;第一种情况是基因扰动是时不变的,另一种情况是允许基因扰动随时间变化。由于上述数据集中的样本数量较少,当不使用GRN结构时,使用LASSO应用DeltaNeTS+(参见方法)和之前的DeltaNet算法导致一个空的目标预测,其中扰动得分P.是0。

表格1显示被shRNA或突变的基因的排名秀丽隐杆线虫与基因扰动的人T细胞数据设置为时间不变,即,对于来自相同治疗/条件的所有样品,基因扰动是相同的。除了skn-1, DeltaNeTS+放置已知目标(墨西哥人3,朋友-1,-1和STAT6)是前10位候选基因靶点。值得注意的是,在几乎所有情况下,DeltaNeTS+对已知目标的排名都高于TSNI、DeMAND和log2FC分析。转录因子skn-1调控与氧化应激反应和寿命相关的关键生物通路秀丽隐杆线虫[39]. 沉默skn-1改变大量基因(> 10,000)的转录,这使得这些样品中真正的基因扰动的鉴定使鉴定。在这里,由妇女妇女预测的基因靶数大部分比乘以更高的级别skn -1是由skn-1(见附加文件1).然而,DeltaNeTS+能够skn-1远高于TSNI, DeMAND和log2FC。

当使用时变扰动(即相同处理/条件下不同时间样本的目标可能不同)时,DeltaNeTS+再次优于TSNI、DeMAND和log2FC三种方法,如图所示。1。早期时间点样本的log2FC实际上给出了直接基因扰动的合理准确指示(见附加文件)2:表S1-S2)。但是,在后来的时间点,log2FC大小成为直接基因靶标的一个非常不准确的指标。这种趋势是预期的,因为随着时间的推移,基因扰动的下游效应将逐步掩盖真正的基因目标身份。相比之下,DeltaNeTS+预测精度在采样时间上的下降要温和得多,这表明它对于时间采样的选择具有更高的鲁棒性(参见附加文件)2:表S1-S2)。请注意,TSNI和DeMAND只提供了一个整体的目标预测,而不是针对不同的时间点。

图1
图1

排名预测的淘汰赛目标。箱形图的分布表示同一实验各时间点的排名。DeltaNeTS+的基因靶标排序为红色,TSNI、DeMAND和log2FC分析的基因靶标排序为蓝色、绿色和灰色。*P.值<0.1和**P.值< 0.01的Wilcox符号秩检验DeltaNeTS与其他方法

预测干扰素-α和干扰素-γ作用机制

接下来,我们测试了DeltaNeTS+在区分来自同一蛋白质家族的两种相关化合物的比活性方面的能力:干扰素-α(IFN-α)和干扰素-γ(IFN-γ)。这项任务具有挑战性,因为这两种信号蛋白通过不同的信号途径触发免疫系统的共同反应。IFN-α和IFN-γ是通过单独的信号通路(分别称为I型和II型信号通路)诱导针对病毒感染的先天免疫应答的细胞因子。IFN-α信号通过I型IFN受体,随后形成复合物IRF9、STAT1和STAT2,激活IFN-α/β刺激基因(ISG)的转录。同时,II型IFN受体接收IFN-γ信号,导致含有γ干扰素激活位点(GAS)的基因转录[4041].基因表达数据来自之前的一项研究,该研究使用了人类肺癌细胞Calu-3 [31].我们使用人类上皮性肺癌细胞GRN结构作为DeltaNeTS+的先验信息(见方法).为了检测被两种干扰素治疗方法干扰的细胞通路,我们对每种方法中排名最高的50个基因进行了GO(生物过程)和Reactome通路富集分析[35].

表格2总结了从DeltaNeTS+、DeMAND和log2FC分析(调整后)中预测的顶级基因靶点富集的GO术语和Reactome通路P.值< 0.01;详细的结果在附加文件3.).TSNI预测的前50个基因靶点对GO和Reactome通路均无统计学意义的富集。DeltaNeTS+微扰分析的富集GO和Reactome项正确地指出了这两种干扰素作用的不同信号通路。除了干扰素特异性信号之外,与主要组织相容性复合体(MHC) II类抗原相关的途径,由IFN-γ刺激基因CIITA诱导[42],也被富集在DeltaNeTS +分析IFN-γ的数据,但不能用于IFN-α的数据。在另一方面,顶部log2FC基因显示了富集分析更多样化的过表达的途径,有望为log2FC表情反映了两种干扰素的直接和间接的影响。虽然与IFN-α和IFN-γ的不同的信号传导途径。其中的顶部富集log2FC GO和Reactome通路,该信号通路具体到每一个干扰素是跨列在富集的结果对于两个干扰素。对于需求,对于虽然型IFN-γ的数据I和II干扰素信号传导途径是从需求预测为IFN-α的数据富集没有检测到干扰素信号。相比于DeltaNeTS +,log2FC和需求是在分化的特定信号转导途径通过IFN-α和IFN-γ的行为能力较差。

表2干扰素-α和-γ治疗的反应性途径富集分析

流感病毒感染过程中的网络扰动分析

最后,我们应用DeltaNeTS+分析了H1N1和H5N1流感病毒感染Calu-3细胞的基因表达数据,目的是阐明这两种重要的流感病毒株之间的异同。H1N1病毒株是2009年猪流感爆发的原因,并因其在人类中的高传染性而闻名。另一方面,H5N1毒株是一种禽流感亚型,毒性严重,死亡率高达60%。这种高致病性导致越来越多的人关注其致病分子机制[43]. 在DeltaNeTS+分析之后,我们进行了GSEA以发现过度表达的反应体途径[37]和WGCNA[38]分析,以鉴定基因模块具有类似动态扰动,使用由DeltaNeTS +产生的基因扰动分数。

数字2描述了富集(调整)的反应体途径P.价值观< 0.01,见方法)的三个感染阶段:早期(第一阶段:0-7小时),中期(第二阶段:7-18小时)和晚期(第三阶段:> 18小时)(完整结果见附加文件4.).H1N1和H5N1引发了许多相同的细胞途径,但往往处于不同的阶段。预期,免疫反应,如细胞因子信号和先天免疫系统,触发两种病毒感染大致相同的趋势随时间推移。然而,其他途径被不同的时间调节。在仅在H5N1感染中显著富集的途径中,与g蛋白偶联受体(GPCR)信号和肌动蛋白细胞骨架(肌肉收缩)相关的途径,已知这两种途径都被病毒进入过程劫持(图)。2) [184445].另一方面,程序性细胞死亡和DNA损伤(染色质组织和DNA修复)仅在H1N1感染早期到中期的数据中显著富集。先前的一项研究报道,在H5N1感染的Calu-3细胞中死亡信号分子下调[46],一种与在H5N1的苯织特+分析结果中没有对编程细胞死亡的富集的浓缩的一致。在H1N1感染后期阶段富集的其他途径是缺口,WNT和RHO GTP酶信号传导,与细胞增殖相关的途径[4748]. 这些通路与组蛋白簇1家族相关,并且基于DeltaNeTS+扰动分数,预测为负扰动(见附加文件)5.).负扰动表明H1N1感染抑制了细胞增殖。

图2
figure2

从DeltaNeTS的基因集富集分析中总结了关键的Reactome途径+预测。点的大小和颜色表示得分(负对数-10P.值),用于富集的反应物项。流感感染期分为3个阶段:第1阶段= 0-7 h,第2阶段= 7-18 h,第3阶段≥18 h

除了富集分析外,我们还将WGCNA应用于DeltaNeTS+基因扰动预测,根据随时间变化的扰动模式对基因进行分组。在这种情况下,WGCNA发现了一些基因簇,这些基因簇的扰动分数由P.基于基因-基因相关性得出的拓扑重叠,矩阵高度相似。在WGCNA结果中,每组中的时程扰动值可由该组中的第一个主分量表示,称为特征基因。图形3.显示了由WGCNA识别的七个组的特征基因摄动谱,和表3.提供了每组富集的GO和Reactome通路的总结(详情见附加文件6和7)。对于最小的组M7,没有发现明显富集的通路。

图3
图3

WGCNA的特征基因谱应用于H1N1和H5N1 A型流感感染的DeltaNeTS+扰动评分(红色:H1N1,蓝色:H5N1)

DeltaNeTS的表3 WGCNA模块+扰动分数

M1组、M4组和M5组分别与细胞周期阻滞、病毒侵入和细胞基质屏障有关。对这些群体来说,H1N1和H5N1的扰动迹象是相同的,但H5N1的扰动幅度更大。对于这两种菌株,感染作用抑制细胞周期阻滞和细胞基质屏障(负扰动),并激活病毒进入途径(正扰动)。对于M2组和M3组,两个A型流感毒株的扰动迹象是相反的。在H5N1感染中,M2组诱导病毒RNA转录、翻译和复制,而M3组强烈抑制病毒防御和免疫机制。相反,在H1N1感染中,病毒RNA复制过程被抑制,但抗病毒机制的基因被适度诱导。综上所述,GSEA WGCNA DeltaNeTS + H1N1病毒和H5N1感染H1N1 Calu3表明,相比之下,更致命的H5N1感染了病毒活动增加入口过程,增加细胞周期阻滞的压迫,以及免疫系统的抑制和程序性细胞死亡。

讨论

DeltaNeTS+是一个用于分析基因表达数据的网络扰动分析工具,它生成对给定处理或样本中直接基因表达扰动的预测。DeltaNeTS+在我们之前的算法DeltaNeTS的基础上,DeltaNeTS能够利用基因表达的时间序列数据集,并增加了利用GRN结构信息的能力。GRN结构信息的整合使得从少量样本中准确预测基因靶点成为可能,这比我们之前的DeltaNet和DeltaNet方法具有优势。基因的直接基因扰动是基于测量的基因差异表达与GRN模型基于其转录因子表达预测的差异表达之间的差异来计算的。我们将DeltaNeTS+与三种策略进行了比较,包括(1)差异表达分析,(2)基于GRN模型的目标推理方法TSNI [21],(3)网络扰动分析方法DeMAND,该方法依赖于Kullback-Leibler发散的统计假设检验[9.].之所以选择比较方法,是因为它们是基因靶推断中最常用和被引用最多的方法,并且能够处理时间序列数据。DeltaNeTS+与TSNI最相似[21,因为这两种方法都依赖于线性回归公式和时间序列数据。而TSNI采用主成分分析(PCA)对未知GRN矩阵进行降维一种和摄动矩阵P.,DeltaNeTS +采用正则化策略(岭回归或LASSO,取决于GRN结构的可用性)。TSNI无法容纳GRN结构的信息。

将GRN结构信息添加到DeltaNeTS+中是非常有益的,可以提高基因靶标预测,特别是当数据集只包含少量样本时。应用DeltaNet +和DeltaNet之前的算法秀丽隐杆线虫、T细胞和Calu-3数据集未合并GRN结构,返回空基因目标预测(P.0.;数据未显示)。这里,通过使用可用的GRN结构,使用岭回归实现了DeltaNeTS+,岭回归中未知GRN矩阵的维数一种被简化为已知的tf基因调控。所示秀丽隐杆线虫和人类t细胞案例研究,DeltaNeTS+能够使用GRN结构预测遗传扰动,精度更高,比比较方法更可靠。此外,DeltaNeTS+排名较高的基因靶标与真基因靶标密切相关,例如,由真基因靶标直接调控的基因(见附加文件)1). 利用GRN结构信息的能力非常重要。由于大规模项目(如ENCODE)的成功,高质量的细胞类型特异性基因调控网络近年来变得更加可用[17]和FANTOM5 [49].ARACNE等先进的网络推理工具[50]还有MINDy[51使我们能够从我们感兴趣的细胞的基因表达数据中反向工程出一个特定于环境的网络。

请注意,DeltaNeTS+能够结合时间序列和稳态转录组数据集,以提高基因靶预测的准确性。例如,当我们将稳态转录组数据集(GSE51162)添加到训练秀丽隐杆线虫在DeltaNeTS+的GRN模型中,我们能够提高预测基因靶点的等级-1突变(见附加文件2:表S3)。反之,基因靶预测秀丽隐杆线虫从时间序列和稳态数据的组合中使用GRN模型比单独使用稳态数据更好(参见附加文件)2:图S1)。虽然整合GRN结构信息使DeltaNeTS+能够使用少量样本预测基因靶标,但上述结果表明,大量样本可以提高准确性。DeltaNeTS+在基因目标预测中无缝集成时间序列和稳态数据的能力,意味着DeltaNeTS+将能够利用更大的可用转录组数据集库,避免对每种数据集运行单独的分析。

将DeltaNeTS+应用于分析与H1N1和H5N1感染相关的基因干扰靶标,使我们对两种A型流感毒株之间的作用机制的差异有了深入的了解。一般来说,致病性强的H5N1毒株比致病性弱但传染性强的H1N1毒株诱发更强、更快的扰动(图1)。23.). 值得注意的是,H5N1感染表现出强烈的病毒进入过程和病毒复制诱导以及细胞周期阻滞抑制,所有这些都是确保病毒成功增殖的策略。致病性H5N1感染也表明抑制病毒防御机制。此外,H1N1感染的严重程度较低也与成功激活细胞死亡和抑制细胞增殖有关,这些途径对抑制病毒的进展至关重要。

结论

DeltaNeTS +是用于从基因表达数据集的基因推断的转录扰动有效的网络分析方法。The ability of DeltaNeTS+ to integrate both steady-state and time-course gene expression data and available information of gene regulatory network structure enables accurate prediction of gene targets from limited number of samples (~ 10 s). The application of DeltaNeTS+ to influenza A infection datasets in human Calu-3 give insights into the key functional perturbations that differ between highly virulent H5N1 avian flu and highly transmissible H1N1 swine flu. Insights on the molecular mechanisms of drugs and diseases from gene target predictions provide important information for drug discovery and treatment formulations. The ability to marry gene expression profiles with transcriptional network structures derived from genomic information, as done in DeltaNeTS+, is crucial for understanding diseases and for formulating individualized treatments in the era of personalized medicine.

数据和材料的可用性

项目名称:DeltaNeTS +。项目主页:欧宝直播官网apphttp://www.github.com/cabsel/deltanetsplus. 操作系统:与平台无关。编程语言:R。其他要求:R 3.6.3或更高。许可证:GNU GPL。非学术人员使用的任何限制:需要许可证。

缩写

阿拉伯国家:

算法准确蜂窝网络的重构

提出:

连通图

需求:

基于网络失调的行为检测机制

编码:

DNA元素百科全书

FANTOM5:

哺乳动物基因组功能注释

气体:

γ干扰素激活位点

走:

基因本体论

GPCR:

g蛋白耦合的受体

GRN:

基因调控网络

GSEA:

基因集富集分析

干扰素-α:

干扰素-α.

干扰素-γ:

干扰素-γ.

研究小组:

干扰素-α/β刺激基因

套索:

最小绝对收缩和选择运算符

Log2FC:

对数2褶皱变化

MHC:

主要的组织相容性复合物

明迪:

网络动力学的调制推理

MNI:

网络识别的作用方式

农业部:

作用机理

近红外光谱:

多元回归网络辨识

歌唱:

常微分方程

主成分分析:

主成分分析

RMA:

健壮的Multi-array平均

RNAi:

RNA干扰

SSEM:

稀疏联立方程模型

TF:

转录因子

TSNI:

时间序列网络辨识

WGCNA:

加权基因共表达网络分析

参考文献

  1. 1.

    Subramanian A, Narayan R, Corsello SM, Peck DD, Natoli TE, Lu X, Gould J, Davis JF, Tubelli AA, Asiedu JK,。下一代连接图:L1000平台和前1,000,000个人资料。细胞。2017; 171(6):1437-1452.E1417。

    中科院PubMed公共医学中心文章谷歌学术

  2. 2.

    Lamb J, Crawford ED, Peck D, modelell JW, Blat IC, Wrobel MJ, Lerner J, Brunet J- p, Subramanian A, Ross KN,。连接图:使用基因表达签名来连接小分子,基因和疾病。科学。2006; 313(5795):1929-35。

    中科院文章谷歌学术

  3. 3.

    关键词:转录调控,基因工程,基因工程,基因工程细胞。2013;152(6):1237 - 51。

    PubMed公共医学中心文章中科院谷歌学术

  4. 4.

    蔡HN,罗斯FP。通过计算系统生物学发现的药物靶点。J Biol Chem。2011; 286(27):23653-8。

    中科院PubMed公共医学中心文章谷歌学术

  5. 5.

    Iorio F、Bosotti R、Scacheri E、Belcastro V、Mithbaokar P、Ferriero R、Murino L、Tagliaferri R、Brunetti Pierri N、Isacchi A、,。药物作用模式的发现和药物从转录反应的重新定位。中国科学院院刊。2010;107(33):14621-6。

    中科院PubMed文章谷歌学术

  6. 6.

    Hughes TR, Marton MJ, Jones AR, Roberts CJ, Stoughton R, Armour CD, Bennett HA, Coffey E, Dai H, He YD,。通过表达式配置文件的纲要发现功能。细胞。2000;102(1):109 - 26所示。

    中科院PubMed文章谷歌学术

  7. 7.

    卡特利特荷兰大学、巴格内西AJ大学、安格勒S大学、西格兰T大学、拉德W大学、埃利斯顿大学、普拉特D大学。反向因果推理:将定性因果知识应用于高通量数据的解释。BMC生物信息。2013;14(1):340.

    文章谷歌学术

  8. 8。

    克莱默A,绿色Ĵ,波拉德ĴJR,Tugendreich S.因果分析别出心裁途径分析方法。生物信息学。2013; 30(4):523-30。

    PubMed公共医学中心文章中科院谷歌学术

  9. 9。

    Woo JH, Shimoni Y, Yang WS, Subramaniam P, Iyer A, Nicoletti P, Rodríguez Martínez M, López G, Mattioli M, Realubit R,。用网络摄动分析阐明复合作用机理。细胞。2015;162(2):441 - 51。

    中科院PubMed公共医学中心文章谷歌学术

  10. 10.

    Gardner TS di Bernardo D Lorenz D Collins JJ。通过表达谱推断遗传网络和识别复合作用模式。科学。2003;301(5629):102 - 5。

    中科院PubMed文章谷歌学术

  11. 11

    di Bernardo D, Thompson MJ, Gardner TS, Chobot SE, Eastwood EL, Wojtovich AP, Elliott SJ, Schaus SE, Collins JJ。利用反向工程基因网络在全基因组范围内进行化学基因组分析。生物科技Nat》。2005;23(3):377 - 83。

    PubMed文章中科院谷歌学术

  12. 12

    Cosgrove EJ,Zhou Y,Gardner TS,Kolaczyk ED.通过基于网络的mRNA表达谱筛选预测扰动的基因靶点。生物信息学。2008;24(21):2482–90.

    中科院PubMed公共医学中心文章谷歌学术

  13. 13

    不,古纳万河。从基因表达谱推断药物和化合物的基因靶点。生物信息学。2016;32(14):2120–7.

    中科院PubMed公共医学中心文章谷歌学术

  14. 14

    从时间过程表达数据推断因果基因靶点。IFAC-PapersOnLine。2016; 49(26): 350 - 6。

    文章谷歌学术

  15. 15

    Szederkényi G, Banga JR, Alonso AA。复杂生物网络的推理:可区分性问题和基于优化的解决方案。BMC Syst Biol. 2011;5(1):177。

    PubMed公共医学中心文章谷歌学术

  16. 16

    关键词:基因调控网络;集合推理;PLoS ONE。2014; 9 (8): e103812。

    PubMed公共医学中心文章谷歌学术

  17. 17

    Dunham I Kundaje A, Aldred SF, Collins PJ, Davis CA, Doyle F, Epstein CB, Frietze S, Harrow J,。人类基因组中DNA元素的完整百科全书。大自然。2012;489:57。

    中科院文章谷歌学术

  18. 18。

    张毅、王春晖、比恩鲍姆里、李庚、法瓦罗R、颜茜、林杰、大鹅、波姆、王娥、,。染色质连接图揭示了动态的启动子-增强子的长期关联。大自然。2013;504:306。

    中科院PubMed公共医学中心文章谷歌学术

  19. 19。

    魏春林,吴Q,维加VB,邱金平,吴平,张T,沙哈布A,勇HC,傅Y,翁Z,。人类基因组中p53转录因子结合位点的全球图谱。细胞。2006;124(1):207 - 19所示。

    中科院PubMed文章谷歌学术

  20. 20.

    Marbach D, Lamparter D, Quon G, Kellis M, Kutalik Z, Bergmann S.组织特异性调节电路揭示了复杂疾病的可变模块扰动。Nat方法。2016;13(4):366 - 70。

    PubMed公共医学中心文章中科院谷歌学术

  21. 21.

    班萨尔M,德拉加塔G,迪贝尔纳多D。从时程基因表达谱推断基因调控网络和复合作用模式。生物信息学。2006;22(7):815–22.

    中科院PubMed文章谷歌学术

  22. 22.

    廖建军,Boscolo R,杨永利,Tran LM, Sabatti C, Roychowdhury副总裁。网络成分分析:生物系统中调节信号的重建。美国国家科学院学报。2003; 100(26): 15522 - 7。

    中科院PubMed文章谷歌学术

  23. 23.

    环境科学家和工程师的数值偏微分方程:第一个实践课程。纽约:施普林格;2005.

    谷歌学术

  24. 24.

    李海峰,李海峰。非正交问题的岭回归有偏估计。技术计量学。1970;12(1):55 - 000。

    文章谷歌学术

  25. 25.

    回归收缩和通过套索选择。中国科学(d辑:地球科学)1996;58(1):267-88。

    谷歌学术

  26. 26.

    弗里德曼Ĵ,Hastie的T,用于经由坐标下降广义线性模型Tibshirani R.正则化路径。j stat softw。2010; 33(1):1-22。

    PubMed公共医学中心文章谷歌学术

  27. 27.

    Baugh LR,Hill Aa,Claggett JM,Harfe K,Wen JC,Slonim DK,Brown El,Hunter CP。Homo欧宝直播官网appdomain蛋白PAL-1指定C-elegans胚胎中的谱系特定的监管网络。发展。2005; 132(8):1843-54。

    中科院PubMed文章谷歌学术

  28. 28.

    Elo LL,Jarvenpaa H,Tuomela S,Raghav S,Ahlfors H,Laurila K,Gupta B,Lund RJ,Tahvanainen J,Hawkins Rd,。全基因组谱白细胞介素-4和人Th2细胞的编程STAT6转录因子调控的。免疫。2010; 32(6):852-62。

    中科院PubMed文章谷歌学术

  29. 29.

    McDermott JE, Shankaran H, Eisfeld AJ, Belisle SE, Neuman G, Li CJ, McWeeney S, Sabourin C, Kawaoka Y, Katze MG,。人类细胞培养、小鼠和猕猴模型系统中宿主对高致病性禽流感病毒感染的保守应答BMC Syst Biol. 2011;5:190。

    PubMed公共医学中心文章谷歌学术

  30. 30.

    Menachery VD, Eisfeld AJ, Schafer A, Josset L, Sims AC, Proll S, Fan SF, Li CJ, Neumann G, Tilton SC,. 致病性流感病毒和冠状病毒利用相似和对比的方法来控制干扰素刺激的基因反应。Mbio。2014;5(3):e01174-14。

    PubMed公共医学中心文章中科院谷歌学术

  31. 31.

    Selinger C,Tisoncik-Go J,Menachery VD,Agnihothram S,法律GL,Chang J,Kelly Sm,Sova P,律师Rs,Katze Mg。细胞因子系统方法证明了基因不同的MERS-COV分离株之间的先天和促炎宿主反应的差异。BMC基因组。2014; 15:1161。

    文章中科院谷歌学术

  32. 32.

    Barrett T, Wilhite SE, Ledoux P, Evangelista C, Kim IF, Tomashevsky M, Marshall KA, phillip KH,谢尔曼总理,Holko M,. NCBI GEO:功能基因组学数据集更新存档。《核酸研究》,2013年;41(D1):D991-5。

    中科院文章谷歌学术

  33. 33.

    Pujato男,Kieken楼老八AA,Tapinos N,DNA结合从3D模型的转录因子基序菲塞A.预测;识别TLX3调节的基因。核酸RES。2014; 42(22):13500-12。

    中科院PubMed公共医学中心文章谷歌学术

  34. 34.

    Lawrence M, Huber W, Pages H, Aboyoun P, Carlson M, Gentleman R, Morgan MT, Carey VJ。计算和注释基因组范围的软件。计算机科学与技术。2013;9(8):e1003118。

    中科院PubMed公共医学中心文章谷歌学术

  35. 35

    Kuleshov MV, Jones MR, Rouillard AD, Fernandez NF, Duan QN, Wang ZC, Koplev S, Jenkins SL, Jagodnik KM, Lachmann A,。丰富:一个全面的基因集富集分析web服务器2016年更新。核酸Res. 2016;44(W1): W90-7。

    中科院PubMed公共医学中心文章谷歌学术

  36. 36

    克罗夫特D公司、蒙多AF公司、霍华德R公司、米拉西奇M公司、魏泽尔J公司、吴总经理、考迪M公司、加拉帕蒂P公司、吉列斯皮M公司、坎达尔先生、,。Reactome路径知识库。42(D1): D472-7。

    中科院PubMed文章公共医学中心谷歌学术

  37. 37

    余彩霞,何启元。ReactomePA:一个R/Bioconductor包,用于反应通路分析和可视化。摩尔Biosyst。2016;12(2):477 - 9。

    中科院PubMed文章公共医学中心谷歌学术

  38. 38

    加权相关网络分析的R包。BMC Bioinform。2008;9:559。

    文章中科院谷歌学术

  39. 39

    SKN-1/Nrf2转录因子可以通过不同的机制保护秀丽隐杆线虫免受氧化应激和延长寿命。衰老细胞。2017;16(5):1191 - 4。

    中科院PubMed公共医学中心文章谷歌学术

  40. 40.

    艾哈迈德CMI,Johnson HM。IFN-Gamma及其受体亚基IFNGR1在IFN-Gamma活化基因的启动子位点募集到IFN-γ-活化的序列元素:IFNGR1中的转移活性的证据。J免疫酚。2006; 177(1):315-21。

    中科院PubMed文章谷歌学术

  41. 41.

    李艾杰,阿什卡AA。I型和II型干扰素的双重性质。前免疫球蛋白。2018;9:2061.

    PubMed公共医学中心文章中科院谷歌学术

  42. 42.

    Steimle V,Siegrist Ca,Mottet A,Lisowskagrospierre B,Mach B.通过反辐期仪基因菌介导的干扰素-γ的MHC类-I78表达的调节。科学。1994年; 265(5168):106-9。

    中科院PubMed文章谷歌学术

  43. 43.

    陈辉,高凤峰,舒玉玲,陈辉。H5N1型流感病毒的暴发与生物学特性。细胞研究》2010;20(1):51 - 61。

    中科院PubMed文章谷歌学术

  44. 44.

    Edinger到,Pohl Mo,Stertz S.流感进入病毒:宿主因子和抗病毒目标。J Gen Virol。2014; 95:263-77。

    中科院PubMed文章谷歌学术

  45. 45.

    关键词:流感病毒,肌动蛋白,细胞骨架,极化上皮细胞细胞Microbiol。2007;9(7):1672 - 82。

    中科院PubMed文章谷歌学术

  46. 46.

    许金平、李恒生、张世昌、陈若薇、元公里、莫正平、尼科尔斯·庄信万丰、佩里斯·JSM、陈世伟。高致病性禽流感H5N1病毒通过激活STAT3延迟凋亡反应。Sci代表英国。2016;6:3621.

    谷歌学术

  47. 47.

    哈加RB,雷德利AJ。Rho GTPases:癌症细胞生物学中的调节和作用。小GTPase。2016;7(4):207–21.

    中科院PubMed公共医学中心文章谷歌学术

  48. 48.

    肖云飞,永旭,唐波,秦勇,张建文,张东,谢锐,杨思明。Notch和Wnt信号通路在癌症中的重要作用和潜在治疗靶点(综述)。中华医学杂志。2016;48(2):437-49。

    中科院PubMed文章谷歌学术

  49. 49.

    Forrest ARR Kawaji H, Rehli M, Baillie JK, de Hoon MJL, Haberle V, Lassmann T, Kulakovskiy IV, liio M, Itoh M,。启动子水平的哺乳动物表达图谱。大自然。2014;507(7493):462。

    中科院PubMed文章谷歌学术

  50. 50.

    Margolin AA, Nemenman I, Basso K, Wiggins C, Stolovitzky G, Dalla Favera R, Califano a . ARACNE:一种用于重建哺乳动物细胞环境中的基因调控网络的算法。BMC Bioinform。2006;7:S7。

    文章中科院谷歌学术

  51. 51.

    王克、齐藤M、比西基尔斯卡BC、阿尔瓦雷斯MJ、林WK、拉班达里P、沈Q、尼曼一世、巴索K、马戈林AA、,。人类B细胞中转录因子活性翻译后调节因子的全基因组鉴定。生物科技Nat》。2009;27 (9):829 - u884。

    中科院PubMed公共医学中心文章谷歌学术

下载参考

确认

我们要感谢审查人员提出的建设性和有益的意见。

资金

HN和RG感谢苏黎世联邦理工学院研究基金的支持。资助方在研究的设计、数据的收集、分析和解释以及手稿的撰写中没有任何作用。

作者信息

从属关系

作者

贡献

HN和RG设计了这项研究。他写了代码。HN、JH和PC进行了数据分析。HN、JES和RG解释了结果。HN、PC、JES和RG撰写了手稿。所有作者都已阅读并批准了最终手稿。

相应的作者

通信Rudiyanto Gunawan.

道德宣言

伦理批准和同意参与

不适用。

同意出版

不适用。

竞争利益

作者声明他们没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

额外的文件1

。在秀丽隐杆线虫数据集中排名高于真实靶点的基因

附加文件2:表S1

. 通过DeltaNeTS+和log2FC分析,对C。elegans数据集。表S2。在人类T细胞数据的STAT6 siRNA实验中,通过DeltaNeTS+和log2FC分析对每个时间点的基因目标进行排序。表S3。时间序列C的DeltaNeTS+基因靶点预测。elegans数据(GSE2180)仅使用时间序列数据,并使用时间序列和稳态(GSE51152)数据集的组合。图S1。通过DeltaNeTS+对稳态C进行基因目标排序。elegans数据(GSE51162),仅使用在稳态数据集上学习的GRN模型,并使用在稳态和时间序列(GSE2180)数据集上训练的GRN模型(*P.Wilcox符号秩检验值< 0.05)

额外的文件3

。通过DeltaNeTS+、DeMAND和log2FC分析,富集GO项和Reactome通路预测顶级基因靶点

额外的文件4

。在H1N1和H5N1流感的三个阶段的反应途径富集分析 - 钙霉素的感染:早期(第1期:0-7Hr),中间(第2期:7-18小时)和晚期(第3阶段:> 18Hrs)

额外的文件5

。DeltaNeTS+分析Calu-3中H1N1和H5N1甲型流感感染:早期(第一阶段:0-7小时)、中期(第二阶段:7-18小时)和晚期(第三阶段:>18小时)

额外的文件6

。GO富集分析源自DeltaNeTS的WGCNA模块+对Calu-3中H1N1和H5N1流感a感染的分析(调整p值< 0.5的术语用红色突出显示)

额外的文件7

. 源自Calu-3中流感A感染DeltaNeTS+分析的WGCNA模块的反应体途径富集分析(q值<0.1的途径以红色突出显示)

权利和权限

开放存取本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/. 知识共享公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条中提供的数据,除非数据信用额度中另有规定。

重印和许可

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

Noh,H.,Hua,Z.,Chrysinas,P。et al。DeltaNeTS+:利用基因表达和转录调控网络阐明药物和疾病的机制。欧宝娱乐合法吗22,108(2021)。https://doi.org/10.1186/s12859-021-04046-2

下载引用

关键字

  • 基因表达
  • 基因监管网络
  • 基因的目标
  • 药物发现
  • 的作用机制
\