跳转到主要内容gydF4y2Ba

Coronavirus网络资源管理器:挖掘大规模知识图表,用于SARS-COV-2对宿主细胞功能的影响gydF4y2Ba

摘要gydF4y2Ba

背景gydF4y2Ba

利用先前确定的病毒与人类宿主蛋白的相互作用,我们应用基于机器学习的方法,在生物医学文献衍生的大规模知识图谱中,将SARS-CoV-2病毒蛋白与相关宿主生物学功能、疾病和通路连接起来。我们的目标是探索SARS-CoV-2如何干扰宿主细胞的各种功能,并在宿主基因中识别可能通过重新利用现有药物来调节对抗COVID-19的药物靶点。这里使用的机器学习模型涉及基因嵌入,利用从文献中整理的因果基因表达签名。与其他基于网络的药物再利用方法相比,我们的方法明确考虑了效应的方向,区分了激活和抑制。gydF4y2Ba

结果gydF4y2Ba

我们构建了70个网络,将SARS-COV-2病毒蛋白连接到各种生物学功能,疾病和反映病毒生物学,临床观察和在Covid-19的情况下的途径。结果以互动网络可视化形式呈现通过Web界面,Coronavirus网络资源管理器(CNE),允许探索潜在的实验证据。我们发现,现有的药物靶向这些网络中的基因在对Covid-19的临床试验中的药物中强烈富集。gydF4y2Ba

结论gydF4y2Ba

本文提出的方法可以确定COVID-19发病机理的生物学上可信的假设,明确地联系到SARS-CoV-2感染患者的免疫学、病毒学和病理学观察。可重复使用药物的发现是由相关功能端点的先验知识驱动的,这些功能端点反映了已知的病毒生物学或临床观察,因此提示了潜在的作用机制。我们相信CNE提供了超越传统网络方法的相关见解,可以成为药物再利用的宝贵工具。CNE的网址是gydF4y2Bahttps://digitalInsights.qiagen.com/coronavirus-network-explorer.gydF4y2Ba。gydF4y2Ba

背景gydF4y2Ba

严重急性呼吸综合征冠状病毒2(SARS-COV-2)是冠状病毒家族的成员,是大流行Covid-19的病因。与其他正链RNA病毒一样,其编码的蛋白质在复制循环的各个阶段与感染的宿主细胞的蛋白质相互作用,包括参与免疫反应的人[gydF4y2Ba1gydF4y2Ba]。因此,这些蛋白质可能是抗病毒策略发展的靶点。在永生化人类细胞中,与过表达的SARS-CoV-2病毒蛋白结合的人类宿主蛋白以前曾通过亲和纯化质谱筛选鉴定[gydF4y2Ba2gydF4y2Ba,它为研究使用基于网络的方法的病毒与主机的交互提供了一个起点。我们在这篇论文中的目标是阐明允许病毒蛋白影响一系列宿主细胞和免疫功能的可能分子机制,这些功能已被证明与COVID-19相关,在第二步中,确定可能干扰这些机制的药物。gydF4y2Ba

对与病毒蛋白相互作用的宿主蛋白进行了初步功能表征,并筛选了现有抗COVID-19药物靶点[gydF4y2Ba2gydF4y2Ba]。随后的工作通过进一步将SARS-CoV-2病毒蛋白整合到人类相互作用组中,并使用网络生物学方法来识别现有的药物以实现再利用[gydF4y2Ba3.gydF4y2Ba那gydF4y2Ba4.gydF4y2Ba那gydF4y2Ba5.gydF4y2Ba],在某些情况下还利用基因表达数据[gydF4y2Ba1gydF4y2Ba那gydF4y2Ba6.gydF4y2Ba]。Gysi等人[gydF4y2Ba5.gydF4y2Ba]系统地探索了最先进的基于接近和扩散的网络算法,以及基于图卷积网络的算法,其主要目标是对候选药物进行排序,并使用基因注释探索疾病共病和组织特异性。gydF4y2Ba

在这项工作中,我们将SARS-CoV-2病毒蛋白整合到一个大规模知识图(KG)中,该知识图除了包含蛋白质相互作用组外,还利用了生物医学文献中提供的各种因果关系。与上述方法相比,这些关系具体区分了激活和抑制作用,因此可以预测药物对宿主功能的作用方向,这在临床或疾病中很重要。例如,临床观察[gydF4y2Ba7.gydF4y2Ba那gydF4y2Ba8.gydF4y2Ba那gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba10.gydF4y2Ba那gydF4y2Ba11.gydF4y2Ba]表明SARS-CoV-2具有激活凝血功能的作用(已在许多晚期患者中检测到严重凝血功能障碍),这促使我们特别寻找具有抑制凝血功能的药物,以抵消病毒的作用。与上述纯交互组驱动的网络生物学方法相比,本文所描述的方法的优势在于,通过整合文献中其他因果关系形式的实验证据,我们能够更好地阐明相关的生物学机制,并提出可重复使用的药物,专门针对阻断或抵消观察到的临床终点。gydF4y2Ba

我们的算法使用机器学习(ML)方法来通过激活或抑制来应对给定宿主功能来应对或预测的优先考虑基因。这种方法基于分布式表示[gydF4y2Ba12.gydF4y2Ba]基因作为嵌入在高维矢量空间中的载体。已经从蛋白质 - 蛋白质相互作用获得了这样的基因嵌入[gydF4y2Ba13.gydF4y2Ba和共同表达[gydF4y2Ba14.gydF4y2Ba,也用于功能预测[gydF4y2Ba15.gydF4y2Ba那gydF4y2Ba16.gydF4y2Ba]。相反,在这里,我们从已知的对其他基因表达的因果效应中构建嵌入,从文献中整理,明确区分上调和下调。这样做的好处是效果的方向已经被编码在嵌入向量中了。gydF4y2Ba

总共涉及病毒蛋白和许多相关的“端点”功能的70个网络,并通过名为Coronavirus Network Explorer(CNE)的Web界面来为社区提供。这些网络代表了受病毒感染影响的大宿主生物学。包括免疫信号传导途径(例如IL-1,IL-6,IL-8),因为它们是广泛的描述炎症环境对Covid-19患者的影响[gydF4y2Ba17.gydF4y2Ba]。我们还包括显示在肺炎,呼吸衰竭和心肌炎如肺炎,呼吸衰竭和心肌炎等患者中观察到的生物终点的网络[gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba10.gydF4y2Ba那gydF4y2Ba18.gydF4y2Ba那gydF4y2Ba19.gydF4y2Ba]。一组网络代表了复杂的病毒生命周期及其对应的宿主反应(例如复制、出芽、进入、抗病毒反应),最后,我们还包括了可能被病毒自身复制/增殖或传播所劫持的功能网络(例如,内吞作用和内质网应激反应)[gydF4y2Ba20.gydF4y2Ba]。附加文件中显示了KG中包含的端点函数的完整列表gydF4y2Ba1gydF4y2Ba:表S1。gydF4y2Ba

实现gydF4y2Ba

算法概述gydF4y2Ba

KG的三个子图在我们的方法的不同步骤中发挥了特定的作用:(1)蛋白质-蛋白质相互作用网络(PPI),(2)因果基因表达网络(CGE),(3)因果基因功能网络(CGF)。CGE包含描述基因对其他基因表达的因果关系的关系,而CGF由基因和功能之间的因果关系组成,可以是生物过程、疾病或整个通路。数字gydF4y2Ba1gydF4y2Ba概述我们的方法:作为第一步,我们在PPI中的病毒蛋白周围构建网络社区(图。gydF4y2Ba1gydF4y2Baa)包括直接交互式以及“特定”的第二邻居,即排除网络集线器。使用利用CGE和CGF的ML算法,然后我们构建基因邻域,这些功能包括优先考虑或预测到重要因果效应的基因(图。gydF4y2Ba1gydF4y2Bab)。然后通过交叉相交,病毒和功能邻域连接病毒蛋白(图。gydF4y2Ba1gydF4y2Bac).为了创建额外的网络上下文,通过基于KG路径的启发式算法,从函数邻域中添加额外的基因来扩展上一步构建的子网络。由此产生的网络中的基因被认为是干扰病毒蛋白对特定功能的影响的潜在药物靶点,因此用现有药物进行注释,作为重新利用的候选药物(图。gydF4y2Ba1gydF4y2Bad)。gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

方法概述。gydF4y2Ba一种gydF4y2BaPPI中病毒蛋白周围的网络邻域,包括直接相互作用物和特定的第二邻域。gydF4y2BaB.gydF4y2Ba围绕终点函数的基因邻域,其包含优先考虑或预测基于利用CGE和CGF的ML模型是重要的因果效应的基因。gydF4y2BaCgydF4y2Ba函数邻域的病毒社区。gydF4y2BadgydF4y2Ba使用涉及最短路径的启发式在kg中添加网络上下文。得到的网络中的基因被视为干扰病毒蛋白的功能效果的潜在药物靶标,并用现有的药物注释gydF4y2Ba

知识图gydF4y2Ba

KG是一个拥有大约12万个节点和370万条边的大规模网络,它们表示来自生物医学文献的先验知识。KG中的节点是指基因、化合物、药物、microRNAs和功能(生物过程、疾病、通路)。不同的边缘类型代表了多种功能机制,如基因表达与转录、激活与抑制、磷酸化、蛋白-蛋白结合等。KG是由QIAGEN知识库构建的[gydF4y2Ba21.gydF4y2Ba那gydF4y2Ba22.gydF4y2Ba],一个结构化的生物医学内容集合(使用本体),该集合从过去20年的文献中手动整理,还集成了第三方数据库的内容。KG有三个不同的子图,它们在这里提出的方法中扮演特定的角色:蛋白质-蛋白质相互作用网络(PPI),因果基因表达网络(CGE)和因果基因功能网络(CGF)。CGE包含描述基因对其他基因表达因果关系的关系,而CGF是由基因和功能之间的因果关系组成。此外,CGF中的功能是按照层次结构组织的(作为本体的一部分),父母通常继承他们后代的基因关联。CGE和CGF中的每一个因果边缘都有一个正或负的标志来指示效应的方向,即它是导致增加还是减少(或激活/抑制)。大多数因果关系代表了涉及间接影响的实验观察。在CGF中,基因通路边缘与基因功能边缘的处理方式相同,即基因(通过人工管理)与通路整体的激活或抑制作用相关联。KG中的所有边通常都捆绑了来自不同实验情境的一些潜在文献发现,因此边缘符号反映了所有这些情境中的共识。gydF4y2Ba

药物和目标gydF4y2Ba

从QIAGEN知识库中获取药物和靶标信息[gydF4y2Ba22.gydF4y2Ba]在其他数据库中绘制,例如,药物银行[gydF4y2Ba23.gydF4y2Ba]。目前(截至2020年12月19日)QIAGEN知识库中有1533种药物靶点和4824种药物(包括组合)。gydF4y2Ba

病毒蛋白周围的基因邻居gydF4y2Ba

我们在PPI中构建了27种病毒蛋白的网络邻域,其中包括Gordon等人的直接相互作用物[gydF4y2Ba2gydF4y2Ba]以及第二邻居(图。gydF4y2Ba1gydF4y2Baa).总共有330种宿主蛋白直接与病毒蛋白结合,其中41种可以映射到ML模型。如果第二邻居基因与第一个邻居的交互边缘是“特定的”,即在保留节点度的随机网络中找到这条边的概率很小,则将第二邻居基因添加到这个集合中。这背后的想法是,我们想要一些信心,病毒蛋白的存在会对其邻近基因的活动产生实际的因果影响。对于通过“枢纽”基因的两跳蛋白质-蛋白质相互作用,这种信心很低。此外,包括所有的第二邻域将导致2314个(在ML模型中)中的1453个基因的组合病毒邻域,超过完整网络的63%,因此明显不特异性。在两个给定节点之间找到一条边的概率gydF4y2Ba\ (n_1 \)gydF4y2Ba那gydF4y2Ba\(甲烷\)gydF4y2Ba在随机网络中保留(预期)PPI的节点度大致gydF4y2Ba\(p = \ frac {d_1d_2} {2e} \)gydF4y2Ba(当gydF4y2Ba\(d_1 \)gydF4y2Ba那gydF4y2Ba\ (d_2 \)gydF4y2Ba足够小)在哪里gydF4y2Ba\(d_1 \)gydF4y2Ba那gydF4y2Ba\ (d_2 \)gydF4y2Ba是节点的度数吗gydF4y2Ba\ (n_1 \)gydF4y2Ba那gydF4y2Ba\(甲烷\)gydF4y2Ba,gydF4y2BaE.gydF4y2Ba为网络边的总数。因此我们构建一个分数gydF4y2Ba\(s = \ left(\ sum _ {g'} \ frac {2e} {d_ {g'} d_g} \右)^ { - 1} \)gydF4y2Ba对于每个相邻的基因gydF4y2BaggydF4y2Ba病毒蛋白的蛋白质,总和通过中间基因的所有两跳路径运行gydF4y2Ba\(G'\)gydF4y2Ba。然后通过预选的分数切断来确定包括在邻域中的第二邻居的数量gydF4y2Ba\ (s_0 \)gydF4y2Ba,要求gydF4y2Ba\(s 。对于CNE,我们选择了gydF4y2Ba\ (s_0 = 0.001 \)gydF4y2Ba导致124个基因的病毒网络邻域的总大小,其仍然粗略地是直接交互式的数量的顺序(而不是整个网络的大小)。越来越多gydF4y2Ba\ (s_0 \)gydF4y2Ba会让更多的基因与功能社区相交,但也会引入更多的噪音(“假阳性”),同时减少吗gydF4y2Ba\ (s_0 \)gydF4y2Ba,可能达到没有第二个邻居的点,将增加与功能的重要连接的可能性(“假否定”)。本文的结果对精确选择不敏感gydF4y2Ba\ (s_0 \)gydF4y2Ba。gydF4y2Ba

基因邻居功能gydF4y2Ba

围绕宿主功能的基因邻域是由优先级或被预测为给定功能的重要因果效应的基因构成的。gydF4y2Ba1gydF4y2Bab)。为此,我们使用基于机器学习的新算法,利用CGE和CGF,涉及两部分,是在高维矢量空间中构建基因嵌入的无监督步骤,以及获得基因函数关系的监督步骤。在假设表达关系编码关于基因函数的信息时,通过利用来自文献的下游因果基因表达特征并在CGE中表示,无预测的步骤通过利用下游因果基因表达签名来构建基因特征载体。重要的是将其与表达数据集中发现的基因表达模式区分开来:这里,表达签名是从单独发表的基因对基因表达或转录关系而非数据集创建的。然后,监督步骤在CGF中使用CGF中的签名因果基因函数关系作为训练数据使用线性最小二乘性回归模型。为了围绕功能构建基因社区,基因函数分数被映射到agydF4y2BazgydF4y2Ba-分数,并且只有被认为是“显著”的基因(gydF4y2Ba\(| Z |> 2 \)gydF4y2Ba)是包括在内。注意,该方法在底层网络中合并了边缘符号。因此,与现有的基因功能预测方法不同[gydF4y2Ba24.gydF4y2Ba],它可以区分激活(gydF4y2Ba\ (z > 0 \)gydF4y2Ba)及抑制(gydF4y2Ba\(z <0 \)gydF4y2Ba)效果。给定函数的高分基因包括两个已经通过CGF中的边缘连接到功能的基因,以及纯粹预测的那些。这些可以认为在基因函数和基因表达网络的基础上表现出一些“一致性”。因此,该算法执行预测和优先级,因为并非CGF中的所有现有边缘都必须具有高分度。gydF4y2Ba

基因嵌入gydF4y2Ba

下面我们把CGE看作是一个二部图(见图。gydF4y2Ba2gydF4y2Ba),即调控基因和被调控基因是不同的,即使它们指的是同一基因。我们定义有符号的,加权的gydF4y2Ba\ (N \乘以M \)gydF4y2Ba邻接矩阵gydF4y2BaW.gydF4y2Ba那gydF4y2Ba\ (W_ {ij} = \压裂{s_ {ij}} {\ sqrt {N_i}} \)gydF4y2Ba和gydF4y2Ba(s_{ij}\in \{-1, 0,1 \}\)gydF4y2Ba,其行代表了gydF4y2BaNgydF4y2Ba我们希望计算嵌入的基因以及列是下游表达签名的基因。边缘标志gydF4y2Ba\(s_ {ij} \)gydF4y2Ba是对上调的阳性,下调负责,以及gydF4y2Ba\ (N_i \)gydF4y2Ba是由基因调节的基因总数gydF4y2Ba我gydF4y2Ba。它是gydF4y2Ba\(s_ {ij} = 0 \)gydF4y2Ba如果没有边缘。为了计算基因嵌入,我们采用奇异值分解的低秩近似[gydF4y2Ba25.gydF4y2Ba] 的gydF4y2BaW.gydF4y2Ba那gydF4y2Ba

$$ \ begin {对齐} w \ attum u \ sigma v ^ t,\ end {对齐} $$gydF4y2Ba

其中列gydF4y2Ba\(n \ times k \)gydF4y2Ba矩阵gydF4y2Ba你gydF4y2Ba是正定矩阵的特征向量gydF4y2Ba\ (S = WW ^ T \)gydF4y2Ba,对应于它的顶部gydF4y2BaK.gydF4y2Ba特征值(gydF4y2Ba\(\ sigma \)gydF4y2Ba是一个对角线gydF4y2Ba\(k \ times k \)gydF4y2Ba矩阵和gydF4y2BaV.gydF4y2Ba是gydF4y2Ba\(m \ times k \)gydF4y2Ba)。我们可以想到gydF4y2Ba你gydF4y2Ba将代表单个基因的一个热点编码载体投射到gydF4y2BaK.gydF4y2Ba-维嵌入向量,即这些嵌入向量是的行gydF4y2Ba你gydF4y2Ba。请注意,gydF4y2Ba我\ \ (U ^你=)gydF4y2Ba。体重因素gydF4y2Ba\ \(压裂{1}{\ sqrt {N_i}} \)gydF4y2Ba被选择使得CGE中具有不同节点度的基因进行平等。注意到这一点gydF4y2Ba\(S_ {II} = 1 \)gydF4y2Ba对所有人gydF4y2Ba我gydF4y2Ba。对于CNE,将嵌入的维度设定为gydF4y2Ba\(k = 100 \)gydF4y2Ba(见交叉验证)。此外,为了确保模型中包括的基因周围存在足够的内容覆盖,我们需要包括在CGE中具有至少10个下游表达调节基因的基因。gydF4y2Ba

图2gydF4y2Ba
figure2gydF4y2Ba

基于CGE双标图的基因嵌入方法与签名的加权邻接矩阵gydF4y2BaW.gydF4y2Ba。行的行gydF4y2BaW.gydF4y2Ba表示调节基因(为其构建嵌入),列是下游表达签名的基因。边缘标志gydF4y2Ba\(s_ {ij} \)gydF4y2Ba是对上调的阳性,下调负责,以及gydF4y2Ba\ (N_i \)gydF4y2Ba是由基因调节的基因总数gydF4y2Ba我gydF4y2Ba。它是gydF4y2Ba\(s_ {ij} = 0 \)gydF4y2Ba如果没有边缘。基因嵌入计算使用的奇异值分解的低秩近似gydF4y2BaW.gydF4y2Ba那gydF4y2Ba(w \ uply u \ sigma v ^ t \)gydF4y2Ba,其中矩阵gydF4y2Ba你gydF4y2Ba将一个热编码载体投影,代表单个基因gydF4y2BaK.gydF4y2Ba- 嵌入嵌入向量gydF4y2Ba

基因功能预测和优先排序gydF4y2Ba

来自CGF的因果基因函数关系被捕获在一个有符号的二部邻接矩阵中gydF4y2BaygydF4y2Ba,具有表示基因的行,以及表示下游功能的列。我们只包括那些gydF4y2BaNgydF4y2Ba对应于矩阵行的基因gydF4y2BaW.gydF4y2Ba。它是gydF4y2Ba\(y_ {ij} = 1 \)gydF4y2Ba如果是基因的影响gydF4y2Ba我gydF4y2Ba发挥作用gydF4y2BajgydF4y2Ba是激活的,gydF4y2Ba\(y_ {ij} = -1 \)gydF4y2Ba如果它是抑制的,否则gydF4y2Ba\ (Y_ {ij} = 0 \)gydF4y2Ba如果之间没有边缘gydF4y2Ba我gydF4y2Ba和gydF4y2BajgydF4y2BaCGF。其思想是将上述计算得到的基因嵌入向量作为线性模型中的特征向量来预测基因的效果gydF4y2Ba我gydF4y2Ba在函数gydF4y2BajgydF4y2Ba。为每一个函数gydF4y2BajgydF4y2Ba另外,我们最小化了均方误差gydF4y2Ba

$ ${对齐}L_j = \ \开始压裂{1}{N} \总和_{我}(\ mathbf {x} _i \ cdot \ mathbf{\β}_j-Y_ {ij}) ^ 2 \{对齐}$ $gydF4y2Ba

关于gydF4y2Ba\(\ mathbf {\ beta} _j \)gydF4y2Ba,在那里gydF4y2Ba\(\ mathbf {x} _i \)gydF4y2Ba是个gydF4y2BaK.gydF4y2Ba- 嵌入基因载体的二维基因gydF4y2Ba我gydF4y2Ba,gydF4y2Ba\(\ mathbf {\ beta} _j \)gydF4y2Ba是一个gydF4y2BaK.gydF4y2Ba函数的维参数向量gydF4y2BajgydF4y2Ba。它遵循gydF4y2Ba

$$$gydF4y2Ba

在哪里gydF4y2Ba\ (\ mathbf {y} _j \)gydF4y2Ba是个gydF4y2BajgydF4y2Bath列向量gydF4y2BaygydF4y2Ba,并有符号的预测“分数”gydF4y2Ba

$$ \ begined {对齐} p_ {ij} = \ mathbf {x} _i \ cdot \ mathbf {\ beta} _j \ neg {aligned} $$gydF4y2Ba

是?的正交投影gydF4y2Ba\ (\ mathbf {y} _j \)gydF4y2Ba的列向量张成的子空间gydF4y2Ba你gydF4y2Ba那gydF4y2Ba

$$\begin{align} P = UU^T y \end{align}$$gydF4y2Ba

为了在我们映射的功能上进行分数比较gydF4y2Ba\(p_ {ij} \)gydF4y2Ba至gydF4y2BazgydF4y2Ba-cores.gydF4y2Ba\ (Z_ {ij} \)gydF4y2Ba对于每个功能gydF4y2BajgydF4y2Ba另外,gydF4y2Ba

$$ \ begined {对齐} z__ {ij} = \ frac {p_ {ij} - \ text {mean} _i(p_ {ij})} {\ text {std} _i(p_ {ij})},\结束{对齐} $$gydF4y2Ba

在所有基因上接管平均值和标准偏差gydF4y2Ba我gydF4y2Ba。与CGE一样,为了确保足够的内容覆盖范围,我们只考虑与CGF中至少10个基因相关的功能,即在矩阵中至少有10个非零项gydF4y2BaygydF4y2Ba。gydF4y2Ba

交叉验证gydF4y2Ba

通过随机从CGF中随机删除边缘,训练模型来测试我们模型的预测准确性,然后评估可以预测那些移除的边缘的程度。为了避免函数之间的人工依赖性,我们将自己限制为模型所涵盖的子集中的“叶子”的那些。为了创建平衡测试集,我们随机挑选gydF4y2BangydF4y2Ba矩阵的条目gydF4y2BaygydF4y2Ba它的值是1,gydF4y2BangydF4y2Ba具有值-1和2的条目gydF4y2BangydF4y2Ba项是0。这个过程重复了一遍gydF4y2BakgydF4y2Ba时间创造gydF4y2BakgydF4y2Ba独立的测试集。对每个测试集,选择的元素gydF4y2BaygydF4y2Ba设为零,模型就用这个新矩阵进行训练gydF4y2BaygydF4y2Ba、受试者工作特征(ROC),并根据计算结果确定精度召回曲线gydF4y2BazgydF4y2Ba分数。需要注意的是,严格地说,零gydF4y2BaygydF4y2Ba,也就是说,在CGF中缺乏基因功能边并不是训练或测试集中的一个真正的负面例子,因为这仅仅意味着在文献中没有关于因果基因功能效应的发现。这并不意味着有实验证据表明这种效应不存在。因此,我们做出(合理的)假设,绝大多数零元素gydF4y2BaygydF4y2Ba对应真反例,测试集中可能存在的少数“假”反例对测试结果没有显著影响。从这个角度来看,预测也可以看作是发现了“错误的”负条目gydF4y2BaygydF4y2Ba,即CGF中缺少边缘。gydF4y2Ba

图3gydF4y2Ba
图3gydF4y2Ba

基因函数预测的交叉验证。gydF4y2Ba一种gydF4y2Ba边缘预测的平均ROC (TPR:真阳性率,FPR:假阳性率)。gydF4y2BaB.gydF4y2Ba边缘预测的平均精度召回曲线,指示不同精度级别的绝对Z分数切断。gydF4y2BaCgydF4y2Ba边缘预测的AUC作为嵌入维数的函数gydF4y2BaK.gydF4y2Ba。最优嵌入维数为gydF4y2Ba\ (K \ \)约100gydF4y2Ba,较小的值gydF4y2BaK.gydF4y2Ba导致垫底,而更大的值导致过度装备。gydF4y2BadgydF4y2Ba平均ROC用于边缘符号预测。gydF4y2BaegydF4y2Ba边缘符号预测的平均查准率曲线(蓝色:激活vs抑制预测,橙色:抑制vs激活预测)。误差条和曲线周围的灰色区域代表重复测试估计的标准偏差gydF4y2Ba

特别是,我们评估了两个预测任务:(1)使用绝对阈值来预测边缘的存在gydF4y2BazgydF4y2Ba分数,|gydF4y2BazgydF4y2Ba|和(2)预测边缘符号,即其效果是否正在激活或抑制,使用阈值gydF4y2BazgydF4y2Ba分数本身。对于情况(1),我们使用带有4的完整测试集gydF4y2BangydF4y2Ba示例,如果(2)测试集限于2gydF4y2BangydF4y2Ba非零示例。结果如图所示。gydF4y2Ba3.gydF4y2Ba为了gydF4y2Ba\ \ (n = 1000)gydF4y2Ba,gydF4y2Ba\(k = 20 \)gydF4y2Ba。数字gydF4y2Ba3.gydF4y2Baa、b表示案例(1)嵌入维数的平均ROC曲线和precision-recall曲线gydF4y2Ba\(k = 100 \)gydF4y2Ba,与最优情况w.r.t.即ROC曲线下面积(AUC)接近,见图。gydF4y2Ba3.gydF4y2Bac),AUCgydF4y2Ba\ (= 0.6413 \)gydF4y2Ba。对于围绕功能构建基因邻域,我们感兴趣的是具有最高绝对的基因gydF4y2BazgydF4y2Ba-cores(gydF4y2Baz \ (| | > 2 \)gydF4y2Ba在CNE中),这对应于我们的测试场景中召回率低的情况。如图所示。gydF4y2Ba3.gydF4y2BaB我们在零召回的极限中达到大约90%的精度,而在边界案例中gydF4y2Ba\ (z | | = 2 \)gydF4y2Ba精度约为80%。探测激活和抑制边缘之间的判别的情况(2)具有与预测与未知标志的边缘之间的激活或禁止的预测相对应的两个子情况,这导致图2中的两个单独的精密召回曲线。gydF4y2Ba3.gydF4y2Bae.我们发现两种情况在零召回限下的准确率均大于90%。需要注意的是,对于第一个病例只需要绘制一条ROC曲线(见图)。gydF4y2Ba3.gydF4y2Bad),通过简单地翻转曲线来获得第二个子壳的ROC,导致相同的AUC获得gydF4y2Ba\ (= 0.7602 \)gydF4y2Ba。作为交叉检验,为了检验是否存在隐藏的偏差,我们还使用了随机的、正态分布的基因嵌入向量(即不应反映任何函数关系的随机特征)进行了检验,如预期的那样,这会导致不可预测的模型(AUC)gydF4y2Ba\(\ \ \)gydF4y2Ba0.5)。gydF4y2Ba

假设网络建设gydF4y2Ba

通过病毒邻域和功能邻域交叉获得的网络(见图。gydF4y2Ba1gydF4y2BaC)建立从病毒蛋白到给定端点功能的连接,可能通过预测的基因功能关系。因为,一般来说,这些网络包含很少的基因来自功能邻域,我们包括额外的高绝对基因gydF4y2BazgydF4y2Ba-scores可以通过KG的边缘连接,因此很可能在病毒蛋白影响端点功能的机制中发挥作用。为此,我们采用了一种基于最短路径的简单启发式算法(见图。gydF4y2Ba1gydF4y2Bad)通过从病毒蛋白到终点函数的kg,其中边缘权重(即单边距离)作为绝对的逆几何平均值gydF4y2BazgydF4y2Ba- 相邻节点的拍摄(“gydF4y2BazgydF4y2Ba“对于没有一个的节点,例如,”端点函数,病毒蛋白和一些病毒相互作用宿主蛋白设定为1)。该选择导致从功能邻域中富集的高分基因富集的路径。对于最终的假设网络,我们从连接到相同端点函数的单一病毒蛋白构建的所有网络的联盟。在某些情况下,我们还包括稍长的路径,以增加网络大小。假设网络是KG的子图,其代表来自文献的支持实验证据对所选终点函数的预计病毒效应。gydF4y2Ba

软件实现和用户界面gydF4y2Ba

这里描述的算法在Python中使用标准的科学计算堆栈(Numpy,Pandas,Sklearn等)来实现。我们还实现了一个可公开访问的基于Web的接口,通过该接口,可以访问计算的网络以进行交互式探索。该界面使用户能够选择特定的端点函数,以及效果的方向(激活或抑制)被认为对该功能进行感染SARS-COV-2。在得到的显示网络中(参见图4和图5中的示例。gydF4y2Ba4.gydF4y2Ba那gydF4y2Ba5.gydF4y2Ba那gydF4y2Ba6.gydF4y2Ba)用户可以单击任何实体(节点或边缘)以从文献中揭示底层的结果,或所选实体本身的描述。基因节点的颜色表示特定基因是否被推断为被激活(橙色)或抑制(蓝色),以便在端点函数上实现预选效果。此外,我们还通过相关信号通路注释了基因,根据其预测的激活状态着色。无法推断激活状态的节点,因为它们仅由无符号绑定边缘连接,或者不符合得分阈值,以白色显示。作为现有药物靶标的基因标有紫色边界。选择这样的节点将显示针对该基因的药物以及每个药物对端点函数的预测效果。Web应用程序还允许用户搜索特定的基因或途径,以便缩小仔细的网络数量。gydF4y2Ba

图4gydF4y2Ba
装具gydF4y2Ba

可以解释如何通过Covid-19感染增加宿主功能“血液凝聚”的分子网络。SARS-COV-2蛋白(用黑色8尖图标表示)结合并且可能影响宿主蛋白(各种形状)的活性,导致血液凝固的增加。宿主蛋白和宿主功能的橙色表示预测的活性增加,而蓝色表示预测的活性下降。使用QIAGEN知识图和机器学习技术构建网络,如本文所述gydF4y2Ba

图5gydF4y2Ba
figure5gydF4y2Ba

可以解释宿主通过Covid-19感染如何合同“肺炎”的分子网络。SARS-COV-2蛋白(用黑色8尖图标表示)结合并且可能影响宿主蛋白(各种形状)的活性,导致肺炎的增加。宿主蛋白和宿主功能的橙色表示预测的活性增加,而蓝色表示预测的活性下降。使用QIAGEN知识图和机器学习技术构建网络,如本文所述gydF4y2Ba

图6gydF4y2Ba
figure6gydF4y2Ba

这一分子网络可能解释了COVID-19感染如何增加宿主途径“IL6信号传导”。SARS-CoV-2蛋白(用黑色8尖图标表示)与宿主蛋白(各种形状)结合并可能影响宿主蛋白的活性,导致IL6信号转导增加。宿主蛋白和宿主功能的橙色表示预测的活性增加,而蓝色表示预测的活性下降。使用QIAGEN知识图和机器学习技术构建网络,如本文所述gydF4y2Ba

结果gydF4y2Ba

功能分析gydF4y2Ba

在函数周围构建基因邻域的ML模型(见实现)。gydF4y2Ba1gydF4y2Bab)总共覆盖2314个基因,所有这些基因都包含在PPI中,因此有可能在病毒社区中获得。基因邻域计算了11532种功能,包括276条通路、4155种疾病和7101种生物过程。SARS-CoV-2病毒所有第一和第二相邻蛋白与ML模型覆盖的蛋白相交的结合共包含124个基因。功能社区平均包括108个基因(stdev: 18)。gydF4y2Ba

虽然这项工作的主要目标是选择功能终点并使用与Covid-19相关的临床观察结果的先验知识和其潜在的生物学构建相应的网络,但我们也可能询问病毒和功能社区的交叉点是否能够进行统计分析没有先前的信息,自己拿起相关的生物过程,疾病或途径。为此,我们计算了Fisher的确切测试(FET)gydF4y2BapgydF4y2Ba价值测量功能邻域基因丰富的124个病毒邻域基因的所有11532个功能。重要的功能(gydF4y2Ba\ (le 0.05 p \ \)gydF4y2Ba)列于附加档案gydF4y2Ba1gydF4y2Ba:表S2-S4。特别是我们在最显着的疾病中发现了心室,心脏毒性和肺肺泡蛋白变性的纤维化,以及病毒的释放,三酰基甘油的积累,内皮组织功能障碍,以及最重要的生物过程中的胆固醇的吸收。这并不令人惊讶,因为肺和心血管并发症是Covid-19的已知表现之一。此外,由于SARS-COV-2具有脂质包膜,胆固醇生物合成在组装和复制中起重要作用。有趣的是,重要的功能列表还提出了神经系统意义(例如大脑损伤,异常脑髓髓鞘,释放5-羟基对胺,神经元的外尿剂,以及多巴胺能神经元的活化)。已知在患者中观察到神经效应;例如,存在嗅觉功能和味道的广泛病例[gydF4y2Ba26.gydF4y2Ba]。CNE中包含的一些预选功能也同样重要:高尔基体的破碎和降解、胆固醇的浓度、病毒的释放、CDK5信号(参与有丝分裂后过程)以及肺炎、高血压和心包腔水肿等疾病。gydF4y2Ba

假设网络gydF4y2Ba

假设网络(图。gydF4y2Ba1gydF4y2Bad)为附加文件中选定的70个端点函数构造gydF4y2Ba1gydF4y2Ba:表S1,并包含在CNE中。总的来说,我们发现27个SARS-COV-2病毒蛋白中的18个在这些网络中的至少一种中表示,其含有在函数附近存在的基因的平均13.6%(STDEV:5.3%)(图。gydF4y2Ba1gydF4y2Bab).假设网络实例如图所示。gydF4y2Ba4.gydF4y2Ba(血液的凝聚),图。gydF4y2Ba5.gydF4y2Ba(肺炎)和图。gydF4y2Ba6.gydF4y2Ba(IL6信令)。出于可用性的目的,在CNE中,我们还具有相关规范途径的网络节点,提供了基因和功能描述,并显示了底层边缘的文献结果。CNE通过在端点函数上预先选择所需的效果(促进或抑制),允许对基因和药物效应进行交互式探索。gydF4y2Ba

药物和目标gydF4y2Ba

我们评估了附加文件中70个端点函数对应的所有假设网络gydF4y2Ba1gydF4y2Ba:表1所列药物和靶标。我们还特别选择了24个端点函数(子集S),它们的预期药物效果(促进或抑制)方向是明显的(见附加文件)gydF4y2Ba1gydF4y2Ba:表S1)。在接下来的分析中,我们只考虑单一的化合物药物,即所有的药物组合都被预先排除。还需要注意的是,我们只包括包含在ML模型中的宿主靶标的药物。总的来说,我们发现2382种药物和551种药物靶点原则上可以通过这种方式获得。至少有一个假设网络中存在466种药物和118种相应靶点。其中196种药物是“一致的”(见附加文件)gydF4y2Ba1gydF4y2Ba:Table S5), i.e. for at least one of the 24 functions in the subset S, the computed drug effect on the function corresponds to the desired drug effect (promotion or suppression), 71 drugs are “inconsistent”, i.e. the opposite is the case, and for 199 drugs we could not easily determine the direction of the effect because information whether the drug acts as an agonist or antagonist was not available in the drug-target database (see Implementation) used, or the drug was not in any of the networks in subset S.

为了将我们的假设网络中发现的466种药物与目前正在进行临床试验的药物进行比较,我们从ClinicalTrials.gov下载了一份COVID-19临床试验列表[gydF4y2Ba27.gydF4y2Ba],将药物名称规格化并排除药物组合后,组装成一个包含506种药物的表,其中110种可以映射到ML模型中。这些药物,连同他们目前测试的临床试验的数量,在附加文件中列出gydF4y2Ba1gydF4y2Ba:表S6,注意到,在假设网络中预测它们中的哪一个。结果,我们发现假设网络中存在的466种药物中的54种药物是目前在临床试验中的110种药物中,并且可以在ML模型中获得。这在图2中的Venn图中示出。gydF4y2Ba7.gydF4y2Baa(所有药物)和Fig。gydF4y2Ba7.gydF4y2BaB(只有ML模型中可访问的药物)。作为进一步的结果,我们发现30个重叠药物是一致的,8是不一致的,并且16个具有未知的效果方向。在假设网络中存在的药物在临床试验中强烈富集(赔率比:4.35,FETgydF4y2BapgydF4y2Ba值:8.10gydF4y2Ba\(\ times 10 ^ { - 13} \)gydF4y2Ba),以及也在临床试验中的预测药物,在多个(gydF4y2Ba\(> 5 \)gydF4y2Ba)临床试验(优势比:4.69,FETgydF4y2BapgydF4y2Ba值:0.00291)。gydF4y2Ba

图7gydF4y2Ba
figure7gydF4y2Ba

目前在临床试验中的药物的Venn图(来自Clinicaltrials.gov [gydF4y2Ba27.gydF4y2Ba]),包括在CNE假设网络中,或预测到[gydF4y2Ba5.gydF4y2Ba]。gydF4y2Ba一种gydF4y2Ba所有药物(不包括药物组合)。gydF4y2BaB.gydF4y2Ba在我们的模型中表示的药物子集。我们发现,在假设网络中出现的466种药物中,有54种属于目前临床试验的110种药物,并且在ML模型中可获得。在假设网络中存在的药物在临床试验中强烈富集(赔率比:4.35,FETgydF4y2BapgydF4y2Ba值:8.10gydF4y2Ba\(\ times 10 ^ { - 13} \)gydF4y2Ba),以及也在临床试验中的预测药物,在多个(gydF4y2Ba\(> 5 \)gydF4y2Ba)临床试验(优势比:4.69,FETgydF4y2BapgydF4y2Ba值:0.00291)。我们将结果与Gysi等人预测的100个次级评分药物的结果进行比较。[gydF4y2Ba4.gydF4y2Ba,并在维恩图中添加了相应的数字。他们的方法预测的药物中临床试验药物的数量是24个,而我们的是54个。Gysi等预测的28种药物[gydF4y2Ba4.gydF4y2Ba),其中8种药物同时出现在临床试验中gydF4y2Ba

为了与其他利用网络生物学预测可重复使用药物的方法取得联系,我们将我们的结果与Gysi等人获得的100种得分最高的药物进行了比较。gydF4y2Ba4.gydF4y2Ba],并将相应的数字添加到图中的维恩图中。gydF4y2Ba7.gydF4y2Ba。他们的方法预测的药物中临床试验药物的数量是24个,而我们的是54个。Gysi等预测的28种药物[gydF4y2Ba4.gydF4y2Ba]在假设网络中也发现,这些药物中的8种药物同时存在于临床试验组中。有趣的是,6种药物(地塞米松,氢化胞蔻体,甲基己酮,预烯烷,泼尼松龙和泼尼松)具有相同的靶标,糖皮质激素受体(NR3C1),而另外两种(Secukinumab和Rivaroxaban)靶向促炎细胞因子IL17A,并凝结因子F10。gydF4y2Ba

讨论gydF4y2Ba

与现有的网络生物学方法相比[gydF4y2Ba2gydF4y2Ba那gydF4y2Ba3.gydF4y2Ba那gydF4y2Ba4.gydF4y2Ba那gydF4y2Ba5.gydF4y2Ba那gydF4y2Ba6.gydF4y2Ba[基于互蛋白酶,这里呈现的方法利用KG中表示的文献策划的原因关系作为附加信息。它依赖于优先考虑已知的因果基因函数关系的算法,并预测被认为对潜在生物学最重要的新的算法,包括其效果方向(激活或抑制)。这用于构建“假设网络”,kg的子图,显示来自文献的相关实验观察,因此允许生物学解释与较鲜明的“黑匣子”相反确定合理的分子机制与现有网络方法相反。通过鉴定影响功能终点的现有目标,我们已经将我们的方法进行了应用方法,这些目标是代表已知的病毒效应,或临床观察和共同生命。因此,除了与与病毒相互作用的宿主蛋白的关系之外,药物预测也由外部信息驱动。这具有提供预测药物效应的更好生物解释性的优点,但与现有方法相比[gydF4y2Ba2gydF4y2Ba那gydF4y2Ba3.gydF4y2Ba那gydF4y2Ba4.gydF4y2Ba那gydF4y2Ba5.gydF4y2Ba那gydF4y2Ba6.gydF4y2Ba在没有使用这种信息的情况下,仅基于药物目标的网络连接来进行预测。此外,我们的方法能够明确区分激活和抑制可以考虑的药物效应,以便选择最有希望的重新估算的候选人。gydF4y2Ba

与Gysi等人的工作进行比较。[gydF4y2Ba4.gydF4y2Ba[目的]通过与Covid-19模块相交的疾病网络模块获得的其结果,与Covid-19模块相交,符合来自功能分析的研究结果(参见结果)。在其100个次级评分药物的列表中,24名与我们编制的临床试验中的药物列表(见结果)。相比之下,我们构建的70个假设网络涵盖的54种药物也在临床试验清单中。解释可能是,由于我们的方法由反映已知的临床表现的功能终点驱动,因此它更接近医学群落评估,了关于目前临床试验中的药物反映的药物的疗效。应当注意,这里呈现的方法仅限于具有宿主靶标的药物,因此不能检测靶向病毒蛋白或RNA的抗病毒药物。gydF4y2Ba

CNE可能漏掉一些药物(例如甲氨蝶呤和羟氯喹在[gydF4y2Ba4.gydF4y2Ba但在我们的方法中没有),因为它们的(相关)目标目前没有被包含2314个基因的基因功能优先排序的底层ML模型所覆盖。这是因为我们采取了保守的方法,要求被包含的基因通过KG中的带符号的边充分连接(参见实现)。更多的基因可以通过放松这些要求或在未来管理额外的内容来添加。同样,我们的方法目前受到Gordon等人数据集的限制[gydF4y2Ba1gydF4y2Ba]并且可以通过包括其他数据来扩展。应当注意,我们的方法不涉及任何明确评分,并且只需收集调节与病毒 - 相互作用宿主蛋白相关的靶标的药物并影响给定的功能终点,因此预测的药物数量取决于包括的终点集。假设网络将文献中的实验证据暴露为kg的造成关系,有助于阐明依赖性生物机制。正在进行的工作专注于使这些机制更明确,例如通过从已知途径的建立的因果级联,或添加组织和细胞类型上下文。gydF4y2Ba

下面我们将从生物学的角度更详细地讨论三个假设网络。gydF4y2Ba

凝固的血液gydF4y2Ba

大多数感染SARS-CoV-2的人会出现轻度至中度的呼吸道疾病,并能迅速恢复。然而,在某些情况下,严重的疾病会导致主要的病理生理结果,有时甚至是致命的结果。诸如心血管、肾脏和呼吸系统疾病等合并症导致了这些患者的严重程度。一个明显的影响是SARS-CoV-2感染后止血方式的改变。严重的凝血功能障碍可能出现,并与危重患者的死亡率增加有关。SARS-CoV-2感染诱发促凝状态,可能导致血管渗漏和弥散性血管内凝血。促炎失衡被认为是严重COVID-19中出现的这种无法控制的凝血后果的关键因素之一[gydF4y2Ba7.gydF4y2Ba那gydF4y2Ba8.gydF4y2Ba那gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba10.gydF4y2Ba那gydF4y2Ba11.gydF4y2Ba那gydF4y2Ba28.gydF4y2Ba]。此处所示的网络(图。gydF4y2Ba4.gydF4y2Ba)显示了参与凝血级联反应的一些关键宿主分子(如F3/组织因子、F10、PLAT/纤溶酶原激活物)和血管生成平衡相关的血管生成因子或分子(如F2RL1/蛋白酶激活受体2和EDN1/内皮素1)之间的相互关系,PF4/血小板因子4和一些病毒蛋白(nsp9, nsp13, orf3a, orf9c, orf8)。gydF4y2Ba

COVID-19的严重程度通常是高细胞因子血症(“细胞因子风暴”)的后果,其趋化因子急剧增加及其细胞后果(如中性粒细胞增多、血小板减少、内皮炎)。因此,该网络还显示了在严重COVID-19预后中发现的促炎分子或信号通路(IL1B、IL6、IL8、IL17a)增加和趋化因子信号通路(CXCR4信号通路、CCL5)上调的贡献。该网络强调了了解这些因素之间的分子相互作用的重要性,最近显示,抗凝治疗似乎可以降低COVID-19重症患者的死亡率。gydF4y2Ba

肺炎gydF4y2Ba

病毒性肺炎合并急性呼吸窘迫综合征(ARDS)是COVID-19的极端后果之一,需要机械通气治疗。病情严重的患者会在一系列突发事件后发展为进行性呼吸衰竭。这些患者功能失调的免疫反应会诱发这些事件,其特征是I型、III型IFN低,高促炎环境,趋化因子分泌升高,肺中髓系细胞和T细胞的高浸润,最后是严重的肺水肿和肺炎[gydF4y2Ba29.gydF4y2Ba那gydF4y2Ba30.gydF4y2Ba那gydF4y2Ba31.gydF4y2Ba]。这个网络(无花果。gydF4y2Ba5.gydF4y2Ba)显示了I型干扰素、白细胞介素、糖皮质激素受体、病毒感染的传感器、JAK/STAT通路或凝血级联元件和可能促进肺炎的关键冠状病毒蛋白之间可能的相互作用。gydF4y2Ba

IL6-SignalinggydF4y2Ba

IL6是一种重要的脂肪型白细胞介素,其通过JAK / Stat(特别是jak1和stat3)和Mapk途径信号。它由免疫细胞(树突细胞,巨噬细胞,B细胞和上皮细胞)表达,并且涉及许多生物学过程,包括细胞存活,凋亡,T细胞的成熟,Th / Th2 / Th17分化/平衡和炎症。IL6被描述为促炎细胞因子,响应于IL1B和TNF刺激分泌。Covid-19的严重或危重病例与高水平的IL6(在细胞因子风暴期间)和低淋巴细胞计数[gydF4y2Ba18.gydF4y2Ba那gydF4y2Ba32.gydF4y2Ba那gydF4y2Ba33.gydF4y2Ba那gydF4y2Ba34.gydF4y2Ba]。此外,较高的il - 6水平与发生ARDS的风险相关。因此,临床试验目前正在进行中,设计使用单克隆抗体治疗(Tocilizumab和Sarilumab)靶向IL6,因为IL6似乎是致命结果的关键促进因子之一。该网络中描述的IL6信令(图。gydF4y2Ba6.gydF4y2Ba)包括所有主要的促炎细胞因子(IL1B、IL17、TNF和IL6)。炎症信号的几个关键分子也存在,如RELA, IKBKB, RIPK1以及MAPK信号。据认为,所有这些基因或被上调,或被预测被激活,并将参与普遍增加的IL6信号及其在COVID-19的不幸后果。gydF4y2Ba

结论gydF4y2Ba

我们介绍了Coronavirus网络资源管理器(CNE),该工具探索SARS-COV2如何通过与宿主基因的交互干扰各种细胞功能。我们的方法涉及通过将病毒蛋白与机器学习算法预测的宿主基因连接到给定的功能上下文中最相关的宿主基因来“挖掘”大规模文献衍生的知识图。结果显示为网络,其中边缘代表节点之间的实验观察到的关系,表明Covid-19发病机制的基本分子机制。我们已经讨论了一系列这些网络,以证明我们的方法可以识别生物合理的假设,在SARS-COV-2感染患者中看到的实际免疫学,病毒学和病理观察结果。gydF4y2Ba

CNE还可用于寻找现有药物,以便重新用于抗COVID-19,以及潜在的新的药物靶点。与其他基于网络的方法的一个重要区别是,这里的可重复使用药物的发现是由反映已知病毒生物学或临床观察的相关功能端点的先验知识驱动的。因此,提出的药物有生物学背景支持,表明潜在的作用机制。我们的方法的另一个优点是,它明确区分了激活和抑制的因果效应,因此在药物再利用的背景下,它可以区分激动剂和拮抗剂。一项对我们网络中包括的所有药物的调查发现,其中50多种已经进入临床试验,这是我们方法有效性的另一个指标。尽管仍有许多改进之处,但我们认为CNE提供了对COVID-19发病机制的相关见解,超出了传统的基于交互组的网络方法,可以成为药物重新利用的宝贵工具。gydF4y2Ba

可用性和需求gydF4y2Ba

  • 项目名称:Coronavirus网络资源管理器(CNE)gydF4y2Ba

  • 项目主页:htt欧宝直播官网appps://digitalInsights.qiagen.com/coronavirus-network-explorergydF4y2Ba

  • 操作系统(s):独立于平台的gydF4y2Ba

  • 编程语言:n / agydF4y2Ba

  • 其他需求:现代网络浏览器(Chrome, Firefox,或Safari)gydF4y2Ba

  • 许可证:CNE创建的网络由CC凭借许可证涵盖。gydF4y2Ba

  • 非学者使用限制:无gydF4y2Ba

可用性数据和材料gydF4y2Ba

Coronavirus网络资源管理器(CNE)已自由地提供给科学界作为基于Web的资源gydF4y2Bahttps://digitalInsights.qiagen.com/coronavirus-network-explorer.gydF4y2Ba。每个交互式网络都有一个单独的URL,可以单独共享。网络也可以通过计算方式访问(在jupiter笔记本中提供的代码,请参阅附加文件gydF4y2Ba2gydF4y2Ba),可在Qiagen Ingenuity途径分析(IPA)中获得(gydF4y2Bahttps://www.qiagen.com/qiagen-ipa.gydF4y2Ba),允许在其他数据集上下文中进行探索。IPA在市场上可以买到。为了再现基因功能预测方法,在jupiter笔记本中提供了示例数据和代码(参见附加文件)gydF4y2Ba2gydF4y2Ba)。gydF4y2Ba

缩写gydF4y2Ba

CNE:gydF4y2Ba

Coronavirus网络资源管理器gydF4y2Ba

公斤:gydF4y2Ba

知识图gydF4y2Ba

PPI:gydF4y2Ba

蛋白质蛋白质相互作用网络gydF4y2Ba

CGE:gydF4y2Ba

因果基因表达网络gydF4y2Ba

CGF:gydF4y2Ba

因果基因函数网络gydF4y2Ba

ml:gydF4y2Ba

机器学习gydF4y2Ba

场效应晶体管:gydF4y2Ba

确切概率法gydF4y2Ba

ARDS:gydF4y2Ba

急性呼吸窘迫综合征gydF4y2Ba

鹏:gydF4y2Ba

接收器操作特性gydF4y2Ba

AUC:gydF4y2Ba

ROC曲线下的区域gydF4y2Ba

参考文献gydF4y2Ba

  1. 1。gydF4y2Ba

    Kumar N,Mishra B,Mehmood A,Mohammad A,Mukhtar MS。综合网络生物学框架阐明了SARS-COV-2发病机制的分子机制。iscience 2020; 23(9):101526gydF4y2Ba

  2. 2。gydF4y2Ba

    Gordon DE, Jang GM, Bouhaddou M, Xu J, Obernier K, White KM, O’Meara MJ, Rezelj VV, Guo JZ, Swaney DL, Tummino TA, Hüttenhain R, Kaake RM, Richards AL, Tutuncuoglu B, Foussard H, Batra J, Haas K, Modak M, Kim M, Haas P, Polacco BJ, Braberg H, Fabius JM, Eckhardt M, Soucheray M, Bennett MJ, Cakir M, McGregor MJ, Li Q, Meyer B, Roesch F, Vallet T, Mac Kain A, Miorin L, Moreno E, Naing ZZC, Zhou Y, Peng S, Shi Y, Zhang Z, Shen W, Kirby IT, Melnyk JE, Chorba JS, Lou K, Dai SA, Barrio-Hernandez I, Memon D, Hernandez-Armenta C, Lyu J, Mathy CJP, Perica T, Pilla KB, Ganesan SJ, Saltzberg DJ, Rakesh R, Liu X, Rosenthal SB, Calviello L, Venkataramanan S, Liboy-Lugo J, Lin Y, Huang X-P, Liu Y, Wankowicz SA, Bohn M, Safari M, Ugur FS, Koh C, Savar NS, Tran QD, Shengjuler D, Fletcher SJ, O’Neal MC, Cai Y, Chang JCJ, Broadhurst DJ, Klippsten S, Sharp PP, Wenzell NA, Kuzuoglu-Ozturk D, Wang H-Y, Trenker R, Young JM, Cavero DA, Hiatt J, Roth TL, Rathore U, Subramanian A, Noack J, Hubert M, Stroud RM, Frankel AD, Rosenberg OS, Verba KA, Agard DA, Ott M, Emerman M, Jura N, von Zastrow M, Verdin E, Ashworth A, Schwartz O, d’Enfert C, Mukherjee S, Jacobson M, Malik HS, Fujimori DG, Ideker T, Craik CS, Floor SN, Fraser JS, Gross JD, Sali A, Roth BL, Ruggero D, Taunton J, Kortemme T, Beltrao P, Vignuzzi M, García-Sastre A, Shokat KM, Shoichet BK, Krogan NJ. A SARS-CoV-2 protein interaction map reveals targets for drug repurposing. Nature 2020;583(7816):459–468

  3. 3.gydF4y2Ba

    Sadegh S,Matschinske J,Blumenthal DB,Galindez G,Kacprowski T,List M,Nasigigerdeh R,Oubounyt M,Pichlmair A,Rose Td,Salgado-AlbarránM,SpäthJ,Stukalov A,Wenke NK,Yuan K,Pauling JK,Baumbach J.探索SARS-COV-2病毒 - 宿主药物互联蛋白,用于药物修复。NAT 2020; 11(1):3518。gydF4y2Ba

    谷歌学者gydF4y2Ba

  4. 4.gydF4y2Ba

    周y,侯y,沉杰,黄y,mart丁w,程f。基于网络的毒药重新促进新型冠状病毒2019-ncov / sars-cov-2。细胞Discov(2020); 6(1):14。gydF4y2Ba

    谷歌学者gydF4y2Ba

  5. 5.gydF4y2Ba

    Gysi DM,ítalo做valle Zitnik M,Ameli A,GaN X,Varol O,Ghiassian SD,Patten J,Davey R,Loscalzo J,BarabásiA-L。网络医学框架识别Covid-19的药物修复机会。ARXIV:2004.07229(2020年)gydF4y2Ba

  6. 6。gydF4y2Ba

    Prasad, K, Khatoon F, Rashid S, Ali N, AlAsmari AF, Ahmed MZ, Alqahtani AS, Alqahtani MS, Kumar V.基于网络生物学视角的COVID-19先天免疫应答中枢基因和通路。Int J Biol Macromol 2020; 163:1-8。gydF4y2Ba

    谷歌学者gydF4y2Ba

  7. 7。gydF4y2Ba

    Ackermann M,Verleden Se,Kuehnel M,Haverich A,Welte T,Laenger F,Vanstapel A,Werlein C,Stark H,Tzankov A,Li WW,Li VW,Mentzer Sj,Jonigk D.肺血管内皮炎,血栓形成和血管生成在Covid-19。n Engl J Med 2020; 383(2):120-8。gydF4y2Ba

    谷歌学者gydF4y2Ba

  8. 8.gydF4y2Ba

    Becker,R.C.: Covid-19更新:Covid-19相关的凝血病。J Thromb Thrombolys 2020; 50(1):54-67。gydF4y2Ba

    谷歌学者gydF4y2Ba

  9. 9.gydF4y2Ba

    Costanzo L、Palumbo FP、arita G、Antignani PL、Arosio E、Failla G.凝血功能障碍、血栓栓塞并发症和肝素在COVID-19肺炎中的使用。静脉淋巴系统紊乱的诊断与治疗。中华泌尿外科杂志。2020;gydF4y2Ba

    谷歌学者gydF4y2Ba

  10. 10。gydF4y2Ba

    Terpos, E., Ntanasis-Stathopoulos, I., Elalamy, I., Kastritis, E., Sergentanis, T.N., Politou, M., Psaltopoulou, T., Gerotziafas, G., Dimopoulos, M.A.: Hematological findings and complications of COVID-19. Am J Hematol 2020;95(7):834–847.

    谷歌学者gydF4y2Ba

  11. 11.gydF4y2Ba

    Teuwen,L.-A.,Geldhof,V.,Pasut,A.,Carmeliet,P .: Covid-19:血管系统释放出来。NAT Rev Immunol 2020; 20(7):389-391。gydF4y2Ba

    谷歌学者gydF4y2Ba

  12. 12.gydF4y2Ba

    Hinton Ge。学习概念的分布式表示。:1986年第八届年度认知科学会的诉讼程序; 12gydF4y2Ba

  13. 13。gydF4y2Ba

    Cho,H.,Berger,B.,Peng,J .:多网络拓扑集成基因功能分析的多网络拓扑。2016年电池系统; 3(6):540-5485。gydF4y2Ba

    谷歌学者gydF4y2Ba

  14. 14。gydF4y2Ba

    杜,J.,Jia,P.,Dai,Y.,Tao,C.,Zhao,Z.,Zhi,D .: Gene2Vec:基于共表达的基因分布表示。BMC Genom 2019; 20(4)(4):82。gydF4y2Ba

    谷歌学者gydF4y2Ba

  15. 15.gydF4y2Ba

    Nelson, W., Zitnik, M., Wang, B., Leskovec, J., Goldenberg, A., Sharan, R.:网络嵌入作为计算生物学的范例。前面。麝猫。2019;10:381。gydF4y2Ba

    谷歌学者gydF4y2Ba

  16. 16.gydF4y2Ba

    陈Q,李琦,谭k,乔y,潘S,江t,陈ypp。基于网络的基因功能预测方法。简短的Funct基因组。2021; ELAB006。gydF4y2Ba

  17. 17。gydF4y2Ba

    Chevrier S,Zurbuchen Y,Cervia C,Adamo S,Raeber Me,De Souza N,Sivapatham S,Jacobs A,Bachli E,Rudiger A,Stüssi-relling M,Huber Lc,Schaer Dj,Nilsson J,Boyman O,Bodenmiller,B.一个明显的先天免疫签名标志着轻度到严重的Covid-19的进展。细胞Rep Med 2021; 2(1):100166。gydF4y2Ba

    谷歌学者gydF4y2Ba

  18. 18.gydF4y2Ba

    Weiskopf D,Schmitz Ks,Raadsen MP,Grifoni A,Okba NMA,Edeneman H,Van Den Akker JPC,Molenkamp R,Koopmans MPG,Van Gorp Ecm,Haagmans Bl,De Swart RL,Sette A,De Vries Rd。Covid-19急性呼吸窘迫综合征患者中SARS-COV-2特异性T细胞的表型和动力学。SCI免疫素。2020; 5(48):EABD2071。gydF4y2Ba

  19. 19.gydF4y2Ba

    Kochi An,Tagliari AP,Forleo GB,FassiniGM,Tondo C. Covid-19患者的心脏和心律失常并发症。J Cardiovasc电泳2020; 31(5):1003-8。gydF4y2Ba

    谷歌学者gydF4y2Ba

  20. 20。gydF4y2Ba

    Daniloski Z, Jordan TX, Wessels H-H, Hoagland DA, Kasela S, Legut M, Maniatis S, Mimitou EP, Lu L, Geller E, Danziger O, Rosenberg BR, Phatnani H, Smibert P, Lappalainen T, tenOever BR, Sanjana NE. Identification of required host factors for SARS-CoV-2 infection in human cells. Cell 184(1), 92–10516 (2021).

    谷歌学者gydF4y2Ba

  21. 21。gydF4y2Ba

    QIAGEN知识库。gydF4y2Bahttps://digitalInsights.qiagen.com/products-overview/qiagen-knowledge-base/gydF4y2Ba。2021年2月2日访问gydF4y2Ba

  22. 22。gydF4y2Ba

    KrämerA,Green J,Pollard J JR.,Tugendreich S.因果性途径分析方法。生物信息学2013; 30(4):523-30。gydF4y2Ba

    谷歌学者gydF4y2Ba

  23. 23。gydF4y2Ba

    Wishart DS, Feunang码,郭AC,瞧EJ, Marcu,格兰特JR Sajed T,约翰逊D,李C, Sayeeda Z, Assempour N, Iynkkaran我,刘Y, Maciejewski,盖尔N,威尔逊,下巴L,卡明斯R, Le D,彩球,诺克斯C,威尔逊DrugBank50: DrugBank数据库的一个主要更新为2018。核酸研究2017;46(D1): 1074-82gydF4y2Ba

    谷歌学者gydF4y2Ba

  24. 24。gydF4y2Ba

    赵y,王继,陈继,张X,郭m,yu g。基因本体学对基因功能预测的文献综述。前群2020; 11:400。gydF4y2Ba

    谷歌学者gydF4y2Ba

  25. 25。gydF4y2Ba

    马可夫斯基,I.:低秩逼近:算法,实现,应用。通信与控制工程。施普林格,伦敦(2011)。gydF4y2Ba

    谷歌学者gydF4y2Ba

  26. 26。gydF4y2Ba

    Brann DH,原慎司T,发现C, Lipovsek M, Van den Berge K,龚B,机会R,麦考利IC,周H-J,弗莱彻RB, Das D,街道K, de Bezieux人力资源,崔Y-G, Risso D, Dudoit年代,Purdom E,轧机J,赫克曼于RA, Matsunami H,洛根DW, Goldstein BJ, Grubb女士,Ngai J,SARS-CoV-2进入基因在嗅觉系统中的非神经元表达提示了covid -19相关嗅觉缺失的机制。Sci放置2020;6 (31):eabc5801。gydF4y2Ba

  27. 27。gydF4y2Ba

    ClinicalTrials.gov。gydF4y2Bahttps://clinicaltrials.govgydF4y2Ba。2020年12月19日通过。gydF4y2Ba

  28. 28.gydF4y2Ba

    唐,N,白,H.,陈,X.,龚,J.,Li,D.,Sun,Z .:抗凝血治疗与凝血病的严重冠状病毒疾病中的死亡率下降有关。J Thromb寄生2020; 18(5):1094-9。gydF4y2Ba

    谷歌学者gydF4y2Ba

  29. 29。gydF4y2Ba

    Hadjadj J•N, Barnabei L, Corneau, Boussier J,史密斯N,父亲H, Charbit B, Bondet V, Chenevier-Gobeaux C,布雷莱特P,卡莉N, Gauzit R, Morbieu C, Pene F,马林N,罗氏N, Szwebel一,merkle SH, Treluyer J-M,一D, Mouthon L,布兰科C, Tharaux P-L, Rozenberg F,费舍尔,达菲D, F Rieux-Laucat, Kerneis年代,梗B. COVID-19重症患者I型干扰素活性和炎症反应受损。科学369;2020(6504):718 - 24。gydF4y2Ba

    谷歌学者gydF4y2Ba

  30. 30.gydF4y2Ba

    Lee JS, Park S, Jeong HW, Ahn JY, Choi SJ, Lee H, Choi B, Nam SK, Sa M, Kwon J-S, Jeong SJ, Lee HK, Park SH, Park S-H, Choi JY, Kim S-H, Jung I, Shin E-C. Immunophenotyping of COVID-19 and influenza highlights the role of type I interferons in development of severe COVID-19. Sci Immunol. 2020;5(49):eabd1554.

  31. 31.gydF4y2Ba

    Schulte-Schrepping J,Reusch N,Paclik D,BaßlerK,Schlickeiser S,Zhang B,KrämerB,Krammer T,Brumhard S,Bonaguro L,De Domenico E,Wendisch D,Grasshoff M,Kapellos Ts,Beckstette M,Pecht T那Saglam A, Dietrich O, Mei H.E, Schulz A.R, Conrad C, Kunkel D, Vafadarnejad E, Xu C-J, Horne A, Herbert M, Drews A, Thibeault C, Pfeiffer M, Hippenstiel S, Hocke A, Müller-Redetzky H, Heim K-M, Machleidt F, Uhrig A, Bosquillon de Jarcy L, Jürgens L, Stegemann M, Gläsenkamp CR, Volk H-D, Goffinet C, Landthaler M, Wyler E, Georg P, Schneider M, Dang-Heine C, Neuwinger N, Kappert K, Tauber R, Corman V, Raabe J, Kaiser KM, Vinh MT, Rieke G, Meisel C, Ulas T, Becker M, Geffers R, Witzenrath M, Drosten C, Suttorp N, von Kalle C, Kurth F, Händler K, Schultze JL, Aschenbrenner AC, Li Y, Nattermann J, Sawitzki B, Saliba A-E, Sander LE, Angelov A, Bals R, Bartholomäus A, Becker A, Bezdan D, Bonifacio E, Bork P, Clavel T, Colome-Tatche M, Diefenbach A, Dilthey A, Fischer N, Förstner K, Frick J-S, Gagneur J, Goesmann A, Hain T, Hummel M, Janssen S, Kalinowski J, Kallies R, Kehr B, Keller A, Kim-Hellmuth S, Klein C, Kohlbacher O, Korbel JO, Kurth I, Landthaler M, Li Y, Ludwig K, Makarewicz O, Marz M, McHardy A, Mertes C, Nöthen M, Nürnberg P, Ohler U, Ossowski S, Overmann J, Peter S, Pfeffer K, Poetsch AR, Pühler A, Rajewsky N, Ralser M, Rieß O, Ripke S, Nunes da Rocha U, Rosenstiel P, Saliba A-E, Sander LE, Sawitzki B, Schiffer P, Schulte E-C, Schultze JL, Sczyrba A, Stegle O, Stoye J, Theis F, Vehreschild J, Vogel J, von Kleist M, Walker A, Walter J, Wieczorek D, Ziebuhr J. Severe COVID-19 is marked by a dysregulated myeloid cell compartment. Cell 2020;182(6):1419–144023

  32. 32。gydF4y2Ba

    COVID-19患者的e - T细胞反应Nat Rev Immunol 2020;20(9): 529-536。gydF4y2Ba

    谷歌学者gydF4y2Ba

  33. 33。gydF4y2Ba

    Giamarellos-Bourboulis EJ, Netea MG, Rovina N, Akinosoglou K, Antoniadou A, Antonakos N, Damoraki G, Gkavogianni T, Adami M-E, Katsaounou P, Ntaganou M, Kyriakopoulou M, Dimopoulos G, Koutsodimitropoulos I, Velissaris D, Koufargyris P, Karageorgos A, Katrini K, Lekakis V, Lupse M, Kotsaki A, Renieris G, Theodoulou D, Panou V, Koukaki E, Koulouris N, Gogos C, Koutsoukou A. Complex immune dysregulation in COVID-19 patients with severe respiratory failure. Cell Host Microbe 2020;27(6):992–10003.

    谷歌学者gydF4y2Ba

  34. 34。gydF4y2Ba

    Herold T, Jurinovic V, Arnreich C, Lipworth BJ, Hellmuth JC, von Bergwelt-Baildon M, Klein M, Weinberger T.升高的IL-6和CRP水平预测COVID-19患者需要机械通气。中华人民共和国过敏临床杂志2020;gydF4y2Ba

    谷歌学者gydF4y2Ba

下载参考gydF4y2Ba

致谢gydF4y2Ba

我们要感谢Bob Rebres和Andreea Pasare进行指导和讨论。我们感谢Shawn Bauer对手稿的批判阅读,特别感谢Craig Upson帮助构建CNE。gydF4y2Ba

资金gydF4y2Ba

这项工作没有收到外部资金,而是在QIAGEN(凯杰)定期雇佣作者的过程中进行的。QIAGEN(凯杰)作为一个组织,在本研究的设计、数据的收集、分析、解释或手稿的撰写中没有扮演任何角色。gydF4y2Ba

作者信息gydF4y2Ba

隶属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

所有作者都协作地构思了这个想法并为Coronavirus网络资源管理器的设计做出了贡献。A.K.开发了算法,并进行了功能分析,药物评估和交叉验证测试;A.K.,J.G.和D.S.促成了Web界面的开发;J.N.B.,S.T.和M.J.定义了相关的终点职能列表,并提供了科学指导;A.K.和J.N.B.写了稿件的主要部分。所有作者阅读并认可的终稿。gydF4y2Ba

通讯作者gydF4y2Ba

对应于gydF4y2BaandreaskrämergydF4y2Ba。gydF4y2Ba

伦理宣言gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

不适用。gydF4y2Ba

同意出版gydF4y2Ba

不适用。gydF4y2Ba

利益争夺gydF4y2Ba

A.K, J.N.B, S.T, d.s., m.j.和J.G.是QIAGEN公司的员工。gydF4y2Ba

额外的信息gydF4y2Ba

出版商的注意事项gydF4y2Ba

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。gydF4y2Ba

补充信息gydF4y2Ba

额外的文件1。gydF4y2Ba

补充表S1-S6。gydF4y2Ba

额外的文件2。gydF4y2Ba

朱庇特笔记本与示例代码和数据。gydF4y2Ba

权利和权限gydF4y2Ba

开放访问gydF4y2Ba本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料包括在文章的创作共用许可中,除非在材料的信用线中另有说明。如果材料没有包含在文章的创作共用许可证中,而您的预期使用不被法律法规允许或超过允许的使用,您将需要直接获得版权持有人的许可。如欲浏览本许可证的副本,请浏览gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba。Creative Commons公共领域奉献豁免(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本文提供的数据,除非在数据的信用额度中另有说明。gydF4y2Ba

再版和权限gydF4y2Ba

关于这篇文章gydF4y2Ba

通过十字标记验证货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

Krämer,A.,Billaud,JN。,Tugendreich,S。gydF4y2Ba等等。gydF4y2Ba冠状病毒网络浏览器:挖掘大规模知识图,了解SARS-CoV-2对宿主细胞功能的影响。gydF4y2Ba欧宝娱乐合法吗22,gydF4y2Ba229(2021)。https://doi.org/10.1186/s12859-021-04148-xgydF4y2Ba

下载引用gydF4y2Ba

关键词gydF4y2Ba

  • 新型冠状病毒肺炎gydF4y2Ba
  • 知识图gydF4y2Ba
  • 药物再利用gydF4y2Ba
  • 网络生物学gydF4y2Ba
\gydF4y2Ba