跳过主要内容gydF4y2Ba

联合嵌入模型预测mirna与疾病的相关性gydF4y2Ba

摘要gydF4y2Ba

背景gydF4y2Ba

来自生物学实验的累积证据已经证实,miRNA在诊断和治疗复杂疾病方面具有重要作用。然而,传统的医学实验耗时长、成本高,无法找到未经证实的miRNA与疾病的相互作用。因此,发现miRNA与疾病的潜在关联将有助于减少疾病的发病机制,并有利于疾病治疗。虽然,现有的方法使用不同的计算算法在寻找潜在的miRNA与疾病的相互作用方面具有良好的性能。我们仍然需要做一些工作来改进实验结果。gydF4y2Ba

结果gydF4y2Ba

本文提出了一种新的联合嵌入模型来预测MiRNA疾病相关性(CEMDA)。miRNA与疾病的联合嵌入信息由成对嵌入和节点嵌入两部分组成。与以往只以节点为中心,简单计算miRNA与疾病相似度的异构网络方法相比,我们的方法融合了成对嵌入,更加注重捕捉相关信息背后的特征,当每个节点只有一个嵌入时,它比前一种情况更好地建模细粒度的成对关系。首先,我们从支持的miRNA疾病对、疾病语义相似性和miRNA功能相似性构建异构网络。通过上述异质网络,我们找到了每一个确认的miRNA和疾病的所有相关背景路径。元路径由节点连接,然后输入到门循环单元(GRU),直接学习miRNA和疾病之间更精确的相似性度量。这里,使用多头注意机制对每个元路径的隐藏状态进行加权,并通过多个网络层获得miRNA和疾病元路径中的相似信息传输机制。其次,将miRNA和疾病的成对嵌入输入多层感知器(MLP),该感知器关注成对关系中更重要的片段。最后,我们结合基于元路径的节点嵌入和成对嵌入以及代价函数来学习和预测miRNA疾病关联。验证我们研究结果的源代码和数据集显示在gydF4y2Bahttps://github.com/liubailong/CEMDAgydF4y2Ba.gydF4y2Ba

结论gydF4y2Ba

CEMDA在漏一交叉验证和五倍交叉验证中的性能分别为93.16%和92.03%。结果表明,与其他方法相比,CEMDA具有更好的性能。在3例肺癌、乳腺癌、前列腺癌、胰腺癌患者中,HDMM V2.0中被确认的miRNAs在前50名中分别为48、50、50、50名。进一步验证了本文方法的可行性和有效性。gydF4y2Ba

同行审查报告gydF4y2Ba

背景gydF4y2Ba

微核糖核酸(microrbonucacids, miRNAs)是一种小的非编码RNA分子,包含约21-22个核苷酸,在转录后水平和细胞过程中具有重要作用[gydF4y2Ba1gydF4y2Ba].实验已经证实,mirna参与了心脏疾病的诊断和医疗[gydF4y2Ba2gydF4y2Ba,心血管疾病,恶性肿瘤,精神障碍和糖尿病。例如,医学实验表现出miR-33对照胆固醇稳态[欧宝直播官网appgydF4y2Ba3.gydF4y2Ba].因此,找出与疾病相关的miRNAs对于医学学者来说至关重要。许多医疗技术,例如微阵列和PCR,已经被用来探索miRNA与疾病的关联[gydF4y2Ba4gydF4y2Ba].虽然,传统的医学实验具有高成本和耗时的局限性。因此,许多研究人员致力于设计计算方法以寻找未识别的miRNA和疾病相互作用,以便他们可以重新汇编缺点[gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba的传统实验方法]。gydF4y2Ba

近年来,人们开发了许多新颖的计算方法来发现miRNA与疾病的相互作用。其中,这些方法大致可以分为两类:基于相似度的方法和基于机器学习的方法。鉴于功能相似的mirna与类似疾病密切相关的假设,许多测量方法都采用基于相似性的方法。例如,Jiang等人提出了第一种将疾病表型信息与miRNA信息结合起来预测miRNA与疾病相互作用的方法[gydF4y2Ba7gydF4y2Ba].然而,这种方法也有一些缺点。以两个miRNA相互重叠的靶基因数量作为计算miRNA功能相似度评分的标准是不合理的,这说明忽略了间接邻居是不充分的。根据功能相似性、miRNA簇和miRNA家族,Xuan等对未标记的miRNA进行评分。然而,他们使用的miRNA相似网络限制了他们的实验性能[gydF4y2Ba8gydF4y2Ba].Chen等人将随机游走算法应用于miRNA与疾病关联的预测[gydF4y2Ba9gydF4y2Ba].然而,该方法在构建功能上类似的网络构建miRNA的局限性,这使得它无法预测没有确认的相关miRNA的新疾病。然后,陈等人。在分数内和分数之间进行综合,以对未经证实的miRNA和疾病协会进行排名[gydF4y2Ba10gydF4y2Ba].此外,Zhao等在没有使用任何已知mirna与疾病关联的情况下,创新性地构建了miRNA-lncRNA-disease network(DCSMDA),将miRNA-lncRNA关联和lncRNA-disease关联结合起来,间接预测miRNA-disease的相互作用[gydF4y2Ba11gydF4y2Ba].总之,相似性计算方法的主题是构建网络模型,并且使用不同的方法来测量网络中节点之间的相似性,以预测miRNA和疾病相互作用,其中大部分是由构造网络的质量限制节点之间的模型和不完全的关系。gydF4y2Ba

除了基于相似性措施的方法,探讨与机器学习算法的潜在miRNA疾病相互作用也是该领域的重要学术方法。与基于相似性的方法不同,直接计算网络中节点之间的相似性,基于机器学习的研究致力于提取固有的特征和设计有效的分类算法以找到miRNA和疾病关联。例如,江等人。从未经验证的miRNA病对随机提供负样品,并将SVM施加为预测分类器[gydF4y2Ba12gydF4y2Ba].与上述方法不同的是,Chen等人设计了一种不需要负样本的半监督分类方法[gydF4y2Ba13gydF4y2Ba].为了解决数据不足和数据噪声问题,Liang等设计了基于l1 -范数的目标函数[gydF4y2Ba14gydF4y2Ba].陈等。考虑到发生频率的鉴别特征选择了判别特征[gydF4y2Ba15gydF4y2Ba].进一步,Zhao等人将多个弱分类器与boosting结合来加强分类[gydF4y2Ba16gydF4y2Ba].此外,矩阵分解[gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba]和协作过滤[gydF4y2Ba19gydF4y2Ba都有助于揭示mirna与疾病的关系。例如,Mao等设计了基于基因组数据融合的方法,采用贝叶斯概率矩阵分解模型(Bayesian probistic Matrix Factorization model)融合多源数据(MDBPMF)。他们创新性地为矩阵提供了一个很好的近似,并能够通过评估它在无形数据上的表现来概括它[gydF4y2Ba20.gydF4y2Ba].此外,有大量的工作是预测miRNA和疾病的关联,这是有前景的发展自编码[gydF4y2Ba21gydF4y2Ba],节点嵌入[gydF4y2Ba22gydF4y2Ba]、深度学习和结构化深度网络嵌入(SDNE) [gydF4y2Ba23gydF4y2Ba].gydF4y2Ba

然而,目前的方法在预测未证实的miRNA与疾病的相互作用方面具有良好的性能。我们还需要做一些工作来提高实验性能。一方面,许多论文表明,以往的节点中心方法只是通过应用内积或欧氏距离等相似性度量来计算相似度[gydF4y2Ba24gydF4y2Ba],忽略两个节点之间隐藏的相对信息。另一方面,一些方法在很大程度上限制了从miRNA疾病关联中获取内在信息和鉴别特征。此外,一些方法不适合没有确认的miRNA的新疾病。gydF4y2Ba

以节点为中心的方法没有考虑两个节点之间隐藏的相对信息。由此,我们引入了“对”的概念。我们认为“对”可以更好地捕捉两个节点之间隐藏的相对特征。为了获得有效的节点间的相对特征,需要同时对两个节点间的特征进行变换,我们称之为“对嵌入”。例如,无花果。gydF4y2Ba1gydF4y2Ba展示了miRNA和疾病嵌入的可视化,其中每个miRNA分配一个嵌入。大多数疾病的名称都包含与身体器官相关的关键字,这些关键字可以是代表疾病类型的特征。我们假设miR-21簇与多种疾病类型有关,如胰腺癌[gydF4y2Ba25gydF4y2Ba),乳腺癌。而miR-17簇[gydF4y2Ba26gydF4y2Ba,被认为是致癌基因,仅在肺癌中过表达。由于每一个miRNA都有一个单一的包埋,所以它必须被包埋在所有不同疾病类型中的最佳单点上。因此,肺癌被认为与miR-17有关,而在预测时与miR-21无关。然而,事实上,在临床试验中,miR-21已被证实与肺癌相关[gydF4y2Ba27gydF4y2Ba].另一方面,如图所示。gydF4y2Ba2gydF4y2Ba,如果我们能嵌入每一对mirna -疾病,使每对mirna独立地捕捉其相关特征。(“靶疾病”,miR-21)对可能比(“靶疾病”,miR-17)对与“肺癌”相关的有效对关系更密切。综上所述,成对嵌入比节点嵌入更能准确地捕捉成对关系背后的隐藏特征。gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

节点嵌入gydF4y2Ba

图2gydF4y2Ba
图2.gydF4y2Ba

对嵌入gydF4y2Ba

元路径是由一系列节点组成的一些链接,可以用来保持节点之间的关联,探索异构网络中的结构信息。Shi等人提出了一种通过执行随机游走来揭示关系的算法[gydF4y2Ba28gydF4y2Ba].他们使用miRNA-target accialions和疾病 - 基因相互作用以鉴定潜在的miRNA疾病。但是,模型强烈依赖于上一个节点以预测网络中的下一个节点[gydF4y2Ba29gydF4y2Ba],忽略每个节点对元路径的贡献不同,无法逐步优化它。与Shi的工作不同,我们开发了一种新的MiRNA与疾病关联预测组合嵌入模型,以了解MiRNA与疾病的相似性特征。我们认为,成对嵌入可以更好地捕获两个节点之间的特征。然后,MLP使我们能够在确认的miRNA和疾病对中构建细粒度的成对关系。我们从已鉴定的miRNA疾病对、疾病语义相似性和miRNA功能相似性构建异质网络。根据上述异质网络,我们在miRNA疾病异质网络中找到了每个已确认的miRNA和疾病的所有相关上下文路径。然后,通过节点将关联的上下文路径连接起来,我们建议采用基于元路径的节点嵌入来获得在模型训练过程中对元路径有较高贡献的特征。通过迭代训练,优化参数以获得更好的预测效果。为了激励相关元路径,采用多头注意机制对每个序列的隐藏状态进行加权,并补偿模型训练中meth路径的依赖损失。通过这种方式,可以通过多个网络层获得miRNA和疾病元路径中的相似信息传输机制。最后,我们将成对嵌入和节点嵌入相结合,比单一嵌入更好地预测异构网络中的细粒度关系。同时,CEMDA适用于具有未知miRNA信息的新疾病。我们的方法优于其他最先进的方法,具有miRNA疾病成对嵌入和基于元路径的节点嵌入相结合的能力。全球LOOCV和5倍交叉验证的结果表明,CEMDA的AUCs分别达到93.16%和92.03%。此外,三种乳腺癌、肺癌、胰腺癌、前列腺癌和结直肠癌的病例研究表明,我们的方法取得了显著的效果。gydF4y2Ba

结果gydF4y2Ba

首先,我们提出了实验方法和评价标准。其次,与五种经典方法进行了对比,分析了CEMDA的计算结果。最后,通过三种案例研究验证了本文方法的实验性能。gydF4y2Ba

实验方法和评估标准gydF4y2Ba

从HMDD V2.0中收集5430个经实验鉴定的mirnas与疾病的相互作用[gydF4y2Ba30.gydF4y2Ba]考虑到预测工作中的数据集。我们在实验中应用全球LoooCV和五倍交叉验证策略。然后,每个已验证的miRNA和疾病对都被充当测试样品,另一种对作为全球LOOCV中的训练样本进行视图。同时,在五倍交叉验证中随机分为五个等级组的miRNA和疾病关联。然后,四组被视为训练集,另一个剩余的是作为测试集。我们重复五倍交叉验证50次以减少随机性,然后计算平均结果。提取所有元路径,其长度小于4,因为我们发现太长的元路径有助于提高性能并在计算资源中增加太多。gydF4y2Ba

我们的曲线AUC,这被视为评估以下方法相比的性能标准下考虑区域。gydF4y2Ba

与最先进的方法的比较gydF4y2Ba

为了验证我们的实验结果,我们将CEMDA与ICFMDA进行了比较[gydF4y2Ba19gydF4y2Ba], IMCMDA [gydF4y2Ba18gydF4y2Ba], WBSMDA [gydF4y2Ba10gydF4y2Ba], RLSMDA [gydF4y2Ba13gydF4y2Ba]和KATZBNRA [gydF4y2Ba31gydF4y2Ba].图中显示了全球LOOCV和五倍交叉验证中最先进的五种比较方法。gydF4y2Ba3.gydF4y2Ba和gydF4y2Ba4gydF4y2Ba,分别。此外,我们与DCSMDA比较[gydF4y2Ba11gydF4y2Ba]在全球LOOCV和MDBPMF中[gydF4y2Ba20.gydF4y2Ba在五倍交叉验证中。由于这两种方法只有一个结果,所以下图中没有显示。如图所示。gydF4y2Ba3.gydF4y2Ba,CEMDA拥有的93.16%,在全球LOOCV最高AUC,揭示了它与其他五种方法相比,具有卓越的性能。此外,ICFMDA,IMCMDA,WBSMDA,RLSMDA,KATZBNRA和DCSMDA的的AUC是90.67%,83.87%,88.95%,87.47%,90.98%和81.55%之间。此外,图。gydF4y2Ba4gydF4y2Ba结果表明,在五倍交叉验证实验中,CEMDA的预测效果最好。CEMDA、ICFMDA、IMCMDA、WBSMDA、RLSMDA、KATZBNRA和MDBPMF的auc分别为92.03%、%90.45%、81.09%、80.05%、83.39%、89.72%和87.55%。因此,这一结果表明,CEMDA在发现未经证实的miRNA与疾病的关联方面是可靠的。gydF4y2Ba

图3gydF4y2Ba
图3.gydF4y2Ba

CEMDA,ICFMDA,IMCMDA,WBSMDA,RLSMDA和Katzbnra在全球LoooCV的实验结果gydF4y2Ba

图4gydF4y2Ba
图4.gydF4y2Ba

CEMDA、ICFMDA、IMCMDA、WBSMDA、RLSMDA、KATZBNRA五次交叉验证的实验结果gydF4y2Ba

有对嵌入与无对嵌入CEMDA的比较gydF4y2Ba

在全局LOOCV和五倍交叉验证的基础上,比较了双嵌入和无双嵌入的CEMDA。结果如图所示。gydF4y2Ba5gydF4y2Ba和gydF4y2Ba6gydF4y2Ba结果表明,对嵌入增强了全局LOOCV和五重交叉验证策略的有效性,说明对嵌入在CEMDA中起着重要作用。首先,当每个节点只有一个嵌入时,成对嵌入比之前更有助于建模细粒度的成对关系。第二,成对嵌入对元路径中的关联节点产生激励。通过多层感知器获取mirna -疾病对的特征信息,增强相似性信息的传递。gydF4y2Ba

图5gydF4y2Ba
图5.gydF4y2Ba

采用对嵌入和不采用对嵌入的全局LOOCV的CEMDA实验结果gydF4y2Ba

图6gydF4y2Ba
图6.gydF4y2Ba

CEMDA的实验结果与对嵌入和没有一对与五倍交叉验证嵌入gydF4y2Ba

CEMDA不同元路径长度的比较gydF4y2Ba

参数元路径长度是CEMDA中信息提取的关键要素。不同的参数值导致不同的信息尺度。通过全局LOOCV和五倍交叉验证,比较了不同元路径长度的实验性能。数据gydF4y2Ba7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba说明实验结果。我们发现当元路径长度增加时性能更好。随着元路径长度的增加,包含了更多的相关节点,为模型训练带来了丰富的元路径信息和丰富的特征。换句话说,该方法可以整合节点之间更长期的依赖关系。数据gydF4y2Ba7gydF4y2Ba和gydF4y2Ba8gydF4y2Ba表明元路径长度增加,但CEMDA的性能明显下降。因为元路径的长度较长,所以信息在它所包含的段中重复更多,这对性能的贡献较小。经过多次试验,我们决定将3L作为下面方法中元路径的最大长度。gydF4y2Ba

图7gydF4y2Ba
图7.gydF4y2Ba

不同元路径长度的CEMDA在全局LOOCV中的实验结果gydF4y2Ba

图8gydF4y2Ba
图8.gydF4y2Ba

不同元路径长度的CEMDA的五倍交叉验证实验结果gydF4y2Ba

投影尺寸的影响gydF4y2Ba

我们分别比较了几种投影维数的影响gydF4y2Ba\(z \)gydF4y2Ba在式(gydF4y2Ba11gydF4y2Ba)在全局LOOCV和五倍交叉验证下的CEMDA结果。数字gydF4y2Ba9gydF4y2Ba显示不同投影尺寸下CEMDA的AUC值gydF4y2Ba\(z \)gydF4y2Ba经全局LOOCV和五倍交叉验证。在公式中(gydF4y2Ba11gydF4y2Ba),我们使用5种不同的投影尺寸,分别是32、64、128、256和512。说明AUC随投影维度值的增加呈现小幅上升趋势。此外,我们还对512的投影维数进行了测试实验,由于大量的计算和数据噪声,在训练过程中效果略有下降。由此,我们最终选定投影尺寸为256。gydF4y2Ba

图9gydF4y2Ba
图9.gydF4y2Ba

CEMDA流程图gydF4y2Ba

案例研究gydF4y2Ba

通过三种案例研究进一步验证miRNA与疾病的相互作用。在第一个病例研究中,我们利用肺癌和乳腺癌的HDMM V2.0作为数据集,发现相关的未经验证的miRNAs。最后,我们将发现的候选mirna与两个公共数据库dbDEMC [gydF4y2Ba32gydF4y2Ba]及PhenomiR [gydF4y2Ba33gydF4y2Ba]验证其准确性。gydF4y2Ba

据报道,肺癌是一种压倒一切的致命疾病,在世界范围内造成许多人死亡[gydF4y2Ba34gydF4y2Ba].生物医学发现,一个人越早发现肺癌,他的存活率可能就越高。医学实验已经证明,mirna对肺癌的诊断和治疗有巨大的影响[gydF4y2Ba35gydF4y2Ba]. 如表所示gydF4y2Ba1gydF4y2Ba,第一列包含前50个,第二列列出了前26-50。其中,通过两种公共数据库支持的生物实验结果,证明前50名候选的48名与肺癌有关。只有2个未经证实的mirnas。例如,HSA-MIR-421在表中排名第一gydF4y2Ba1gydF4y2Ba,已被证明能促进非小细胞癌症的增殖[gydF4y2Ba36gydF4y2Ba]. 因此,我们的预测模型的性能为研究提供了一个新的视角。gydF4y2Ba

表1中的顶端与肺癌相关的miRNA 50gydF4y2Ba

乳腺癌是一种普遍存在的肿瘤,在世界各地的女性中死亡率很高。未来死于乳腺肿瘤的人数将高达300万[gydF4y2Ba37gydF4y2Ba].MIR-142-3P与乳腺癌有关的证据已在生物实验中验证。我们采用CEMDA验证乳腺癌相关的miRNA,并选择表中包含的50个相关的miRNAgydF4y2Ba2gydF4y2Ba.结果表明,前50名的mirna均得到上述数据库的支持。排名第一的Hsa-mir-140已被证实能促进乳腺肿瘤细胞的扩散[gydF4y2Ba38gydF4y2Ba].因此,新颖的研究结果表明CEMDA为乳腺肿瘤预测提供了强有力的证据。gydF4y2Ba

表2中的顶部与乳腺癌关联的miRNA 50gydF4y2Ba

然后,在第二个案例研究中,我们要验证这个方法是否适用于新的疾病没有证实相关的miRNA的生物实验。我们首先选择了前列腺癌,因为它是最普遍的癌症,男性的世界。据说,超过一百万人患前列腺疾病的2018 [死在异国他乡gydF4y2Ba39gydF4y2Ba].首先,我们将所有与前列腺癌相关的miRNA-disease关联从HMDD 2.0设置为0,然后进行CEMDA验证前列腺癌相关mirna。结果显示在附加文件gydF4y2Ba1gydF4y2Ba:表S1显示前50位的mirna均经dbDEMC和PhenomiR验证。其次,为了进一步了解更多的新疾病,我们开展了胰腺癌的研究。胰腺癌病例的结果载于附加文件gydF4y2Ba1gydF4y2BaS2:表。HMDD、dbDEMC和PhenomiR中也包含了预测的前50个mirna。因此,本病例提示CEMDA适用于未证实相关miRNAs的新疾病。gydF4y2Ba

最后,我们实施了第三个案例研究,以确定用旧版本的HMDD数据训练的CEMDA是否可以验证新版本的HMDD中新的输入miRNA和疾病对。我们使用HMDD 3.0 [gydF4y2Ba40gydF4y2Ba]、dbDEMC和PhenomiR来确定结果。大肠癌病例研究的发现包含在附加文件中gydF4y2Ba1gydF4y2Ba:表S3。所有排名前50位的miRNA都由HMDD 3.0、dbDEMC和PhenomiR支持。gydF4y2Ba

鉴于三种案例研究的结果,我们总结了,我们的方法在预测未经证实的miRNA和疾病相互作用时是有效的。gydF4y2Ba

讨论gydF4y2Ba

实验结果表明,与五种经典方法相比,基于全局LOOCV和五重交叉验证,CEMDA具有更好的预测性能。此外,针对五种疾病的三种个案研究也支持本方法的结果。首先,我们提取出miRNA和疾病异质网络中已确认的miRNA与疾病对的所有元路径实例,从miRNA与疾病的相互作用中获得复杂的关联。通过节点连接元路径,然后输入到GRU,以学习更准确的miRNA与疾病之间的相似性度量。考虑到元路径中存在不同贡献值的节点,采用多头注意机制对每个伴侣路径的隐藏状态进行加权,通过多个网络层得到miRNA与疾病的元路径中的相似性信息传递机制。其次,利用MLP获取已证实的miRNA与疾病对的相关信息。通过应用捕捉成对关系背后特征的成对嵌入,我们可以获得细粒度关联。最后,设计了基于元路径的节点嵌入和成对嵌入,以整合来自元路径实例的节点和边缘信息。综上所述,CEMDA在建模细粒度的两两关系以及考虑不同节点在miRNA和疾病异质网络中的贡献方面取得了很好的预测效果。gydF4y2Ba

方法gydF4y2Ba

图中显示了CEMDA预测miRNA和疾病相关性的框架。gydF4y2Ba9gydF4y2Ba.首先,利用多种相似度方法计算miRNA整合相似度和疾病整合相似度。其次,我们从实验验证的miRNA与疾病关联、miRNA整合相似性和疾病整合相似性构建了异构网络。第三,我们开发了一种新的联合嵌入模型来提取相关信息来预测未识别的miRNA和疾病的关联。该模型由mirna与疾病的成对嵌入、基于元路径的节点嵌入和结合嵌入预测mirna与疾病的关联组成。成对嵌入采用了多层次线性规划,对成对关系中的重要部分给予更多的关注。然后,将不同维度的mirna和疾病的初始表示投影到同一个向量空间中。基于节点对关联上下文路径进行序列化,然后使用GRU学习对元路径贡献较大的节点特征。采用多头注意机制对每个序列的隐藏状态进行加权,通过多个网络层获得整个元路径信息。结合对嵌入和基于元路径的节点嵌入,定义损失函数,得到mirna与疾病的最终表征。gydF4y2Ba

miRNA和疾病的结构异构网络gydF4y2Ba

MiRNA与疾病关联网络结构gydF4y2Ba

HMDD V2.0由支持的实验MiRNA疾病相互作用组成,这是一个通用数据库。在本文中,我们采用了邻接矩阵gydF4y2Ba\(A \在{R} ^ {米\ n次} \)gydF4y2Ba表达受支持的miRNA和疾病协会。在哪里,gydF4y2Ba\ \(米)gydF4y2Ba和gydF4y2Ba\ (n \)gydF4y2Ba分别代表miRNA和疾病的数量。元素gydF4y2Ba\({a} _ {ij} \)gydF4y2Ba等于1,这意味着miRNAgydF4y2Ba\({r}{i}\)gydF4y2Ba与疾病有关gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba. 否则,,gydF4y2Ba\({a} _ {ij} \)gydF4y2Ba在矩阵中等于0。我们利用HMDD 2.0版本的数据集来构造矩阵。如数据集所示,495个mirna与383种疾病之间有5430种关联。我们定义的gydF4y2Ba\(m = 495 \)gydF4y2Ba和gydF4y2Ba\ \ (n = 383)gydF4y2Ba. 总的来说,邻接矩阵gydF4y2Ba\(一种\)gydF4y2Ba采用构建miRNA和疾病协会网络。gydF4y2Ba

疾病综合类似网络建设gydF4y2Ba

为了使实验模型更加准确和可靠的,我们调查王某等人的工作[gydF4y2Ba41gydF4y2Ba]然后利用医学主题标题(MeSH)[gydF4y2Ba42gydF4y2Ba]以计算疾病的语义相似度。我们计算疾病综合类似网络gydF4y2Ba\(SD \)gydF4y2Ba通过聚集疾病语义相似性gydF4y2Ba\(ss \)gydF4y2Ba和疾病高斯相互作用剖面核相似度gydF4y2Ba\(GD\)gydF4y2Ba如下:gydF4y2Ba

$ $ SD \离开({d_ {}, d_ {j}} \右)= \左\{{\开始{数组}{l *{20}}{党卫军\离开({d_ {}, d_ {j}} \右)}\ hfill & {d_{我}\;\;d_ {j} \; \;结合\;语义\;相似性}\ hfill \ \ {GD \离开({d_ {}, d_ {j}} \右)}\ hfill &{否则}\ hfill \ \ \{数组}}结束\ $ $gydF4y2Ba
(1)gydF4y2Ba

在哪里gydF4y2BaGD \ \(左({d} _ {}, {d} _ {j} \) \)gydF4y2Ba代表疾病高斯互动轮廓核相似性。gydF4y2Ba

假设如果两种疾病有更多相同的祖先主题标题,它们将在语义上更相似。在上述公式中(gydF4y2Ba1gydF4y2Ba),gydF4y2Ba\ (SS \离开({d} _ {}, {d} _ {j} \) \)gydF4y2Ba表示疾病的组合语义相似度gydF4y2Ba\({d} _ {I} \)gydF4y2Ba和gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba.对于第一种疾病语义相似性方法,我们根据Wang等人定义的网格服用疾病语义相似性。对于任何类型的疾病gydF4y2Ba\ (D \)gydF4y2Ba,它可以由指向的非循环图表表示gydF4y2Ba\ ((DAG \左(D \右))\)gydF4y2Ba,其中包含祖先疾病节点集和每个父节点指向子节点的边。它们定义了疾病的贡献gydF4y2Ba\ (d \)gydF4y2Ba在gydF4y2Ba\(DAG(D)\)gydF4y2Ba如下:gydF4y2Ba

$ $ D1_ {D} \离开(D \右)= \ \{{\开始{数组}{l * {20}} 1 \ hfill &{如果\;D = D} \ hfill \ \{马克斯\{\δ* D1_ {D} \离开({D ^{\ '}} \右)| D ^ {\ '} \ D儿童\}}\ hfill &{如果\;D \ ne D} \ hfill \ \ \{数组}}结束\ $ $gydF4y2Ba
(2)gydF4y2Ba

在哪里gydF4y2Ba\三角洲(\ \)gydF4y2Ba是语义衰减贡献因子(0) < ∆ < 1). 本文引用了Xuan等人的研究[gydF4y2Ba8gydF4y2Ba]并设定因素gydF4y2Ba\三角洲(\ \)gydF4y2Ba到0.5。然后是疾病的语义价值gydF4y2Ba\ (D \)gydF4y2Ba的语义贡献值之和是多少gydF4y2Ba\ (D \)gydF4y2Ba和所有的祖先节点如下:gydF4y2Ba

$$ dv1 \ left(d \ light)= \ mathop \ sum \ limits_ {d \在t \ left(d \ recte)} d1_ {d} \ left(d \ recte)$$gydF4y2Ba
(3)gydF4y2Ba

在哪里gydF4y2Ba\(t(d)\)gydF4y2Ba指疾病的所有祖先节点gydF4y2Ba\ (D \)gydF4y2Ba包括自己在gydF4y2Ba\ (DAG \)gydF4y2Ba图。gydF4y2Ba

最后,他们计算出疾病之间的第一个疾病语义相似度gydF4y2Ba\({d} _ {I} \)gydF4y2Ba与疾病gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba如下:gydF4y2Ba

$ $小说\离开({d_ {}, d_ {j}} \右)= \压裂{{\ mathop \总和\ nolimits_ {{T d \ \离开({d_{我}}\)\ T帽\离开({d_ {j}} \右)}}\离开({D1_ {{d_{我}}}\离开(d \右)+ D1_ {{d_ {j}}} \离开(d \右)}\右)}}{{DV1 \离开({d_{我}}\右)+ DV1 \离开({d_ {j}} \右)}}$ $gydF4y2Ba
(4)gydF4y2Ba

轩等。[gydF4y2Ba8gydF4y2Ba]定义了提供疾病语义价值的第二种方法gydF4y2Ba\ (D \)gydF4y2Ba.假设某些特殊疾病可能对疾病有较高的贡献gydF4y2Ba\ (D \)gydF4y2Ba,他们对疾病的语义贡献有另一个定义gydF4y2Ba\ (d \)gydF4y2Ba如下:gydF4y2Ba

$$ D2_ {d} \左(d \右)= - 日志\压裂{{的\;数\;的\; DAG的\; inluding \; d {}}} {的\; numbuer \;的\;疾病} $$gydF4y2Ba
(5)gydF4y2Ba

时,语义相似度gydF4y2Ba\ (SS2 \左({d} _ {}, {d} _ {j} \) \)gydF4y2Ba之间的gydF4y2Ba\({d} _ {I} \)gydF4y2Ba和gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba计算为自己和他们的共同祖先节点的贡献百分比,如下所示:gydF4y2Ba

$$ ss2 \ left({d_ {i},d_ {j}} \ revion)= \ frac {{\ mathop \ sum \ nolimits _ {{d \ in t \ left({d_ {i}} \右)\左键({d_ {j}} \ revent)}}}左({d2 _ {{d_ {{d_ {}}左(d \右)+ d2 _ {{d_ {j}}}左(d\ \右)} \右)}} {{dv2 \ left({d_ {i} \ \右)+ dv2 \ left({d_ {j}} \ right)}}}}} $$gydF4y2Ba
(6)gydF4y2Ba

最终,第一疾病语义相似度计算方法和第二疾病语义相似度计算方法,算术平均作为疾病语义相似度gydF4y2Ba\ (SS \离开({d} _ {}, {d} _ {j} \) \)gydF4y2Ba如下:gydF4y2Ba

$ $党卫军\离开({d_ {}, d_ {j}} \右)= \压裂{{{}魔法石,第1章\离开({d_ {}, d_ {j}} \右)+ SS2{} \离开({d_ {}, d_ {j}} \右)}}{2}$ $gydF4y2Ba
(7)gydF4y2Ba

最后,根据公式(1),我们计算疾病综合相似度网络gydF4y2Ba\ (SD \离开({d} _ {}, {d} _ {j} \) \)gydF4y2Ba.gydF4y2Ba

miRNA集成相似性网络结构gydF4y2Ba

根据Wang等人的研究,具有相似功能的miRNA通常与语义相似的疾病相关[gydF4y2Ba42gydF4y2Ba].我们通过合并miRNA的功能相似性来计算miRNA的相似性gydF4y2Ba\(fs \)gydF4y2Ba和高斯相互作用剖面核相似度gydF4y2Ba\(通用\)gydF4y2Ba如下:gydF4y2Ba

$ $ SM \离开({r_ {}, r_ {j}} \右)= \左\{{\开始{数组}{l * {20}} {{} FS \离开({r_ {}, r_ {j}} \右)}\ hfill & {r_{我}\;\;r_ {j} \; \;功能\;相似性}\ hfill \ \{通用\离开({r_ {}, r_ {j}} \右)}\ hfill &{否则}\ hfill \ \ \{数组}}结束\ $ $gydF4y2Ba
(8)gydF4y2Ba

在哪里gydF4y2Ba\(fs \ left({r} _ {i},{r} _ {j}右)\)gydF4y2Ba(gydF4y2Ba\(i\in\left[{1495}\right],j\in[{1383}])\)gydF4y2Ba表示之间的miRNA功能相似性gydF4y2Ba\({r}{i}\)gydF4y2Ba和gydF4y2BargydF4y2BajgydF4y2Ba.gydF4y2Ba通用汽车gydF4y2Ba(gydF4y2BargydF4y2Ba我gydF4y2Ba,gydF4y2BargydF4y2BajgydF4y2Ba)表示mirna的高斯相互作用谱核相似性gydF4y2Ba\({r}{i}\)gydF4y2Ba和gydF4y2Ba\({r} _ {j} \)gydF4y2Ba.受益于王的任务,miRNA的功能相似gydF4y2Ba\(fs \ left({r} _ {i},{r} _ {j}右)\)gydF4y2Ba从他们的研究中下载gydF4y2Ba

此外,赵等人。计算miRNA之间的高斯相似性计算gydF4y2Ba\({r}{i}\)gydF4y2Ba和miRNAgydF4y2Ba\({r} _ {j} \)gydF4y2Ba如下 [gydF4y2Ba16gydF4y2Ba]:gydF4y2Ba

$ $通用\离开({r_ {}, r_ {j}} \右)= \ exp \离开({- \ alpha_第四{r} \离开({r_{我}}\右)- IV \离开({r_ {j}} \右)^{2}}\右)$ $gydF4y2Ba
(9)gydF4y2Ba

在哪里gydF4y2Bar \ (IV({} _{我})\)gydF4y2Ba,gydF4y2Bar \ (IV \离开({}_{我}\)\)gydF4y2Ba是个gydF4y2Ba我gydF4y2Ba和第gydF4y2BajgydF4y2Ba- 矩阵行gydF4y2Ba\(一种\)gydF4y2Ba,分别。范围gydF4y2Bar \({\α}_ {}\)gydF4y2Ba内核带宽控制如下:gydF4y2Ba

$$ \ alpha_ {r} = \ frac {{\ alpha_ {r0}}} {{\ frac {1} {m} \ mathop \ sum \ nolimits_ {i = 1} ^ {m} IV \ left({r_{i}} \ over)^ {2}}} $$gydF4y2Ba
(10)gydF4y2Ba

初始内核带宽参数在哪里gydF4y2Ba\({\ alpha} _ {r0} \)gydF4y2Ba设置为1。gydF4y2Ba

最后,我们可以提供miRNA集成的相似网络gydF4y2Ba\(SM\)gydF4y2Ba如公式(gydF4y2Ba8gydF4y2Ba)。gydF4y2Ba

综上所述,我们将miRNA与疾病关联网络、miRNA整合相似性网络、疾病整合相似性网络结合,构建miRNA与疾病异质性网络。我们将MiRNA和疾病异质网络定义为一个无向图gydF4y2BaGgydF4y2Ba= (gydF4y2Ba五、 EgydF4y2Ba),包括的miRNA(gydF4y2Ba\ \(米)gydF4y2Ba)和疾病(gydF4y2Ba\ (D \)gydF4y2Ba)。gydF4y2BaVgydF4y2Ba由miRNA和疾病淋巴结组成。gydF4y2BaEgydF4y2Ba表示包含三种边类型的边集,例如:gydF4y2Ba\(m \ to d \)gydF4y2Ba或者gydF4y2Ba\(d \至M \)gydF4y2Ba表示的miRNA与疾病相关,gydF4y2Ba\ (M M \ \)gydF4y2Ba建议两个miRNA节点是相似的gydF4y2Ba\ (D D \ \)gydF4y2Ba揭示了两个疾病节点之间的界限。gydF4y2Ba

MiRNA和疾病异质网络中的Meta-PAT路径提取gydF4y2Ba

miRNA和miRNA和疾病异质网络中的miRNA和相关疾病之间存在一种或多种路径。元路径意味着miRNA和疾病之间的间接和复合连接,有助于了解miRNA和疾病协会的信息和复杂结构。在其序列中确认的miRNA和疾病结合之间存在不同的荟萃路径。为方便起见,我们解释了下面的元路径实例。gydF4y2Ba

首先,我们定义了该元路径gydF4y2Ba\(p \)gydF4y2Ba与gydF4y2BaL-长度gydF4y2Ba作为序列的形式gydF4y2Ba\(m\到{N}_{1}\到\cdots {N}_{i}\到\cdots d\)gydF4y2Ba.在哪里,gydF4y2Ba\ \(米)gydF4y2Ba和gydF4y2Ba\ (d \)gydF4y2Ba是从验证miRNA和疾病对用HMDD2.0,gydF4y2Ba\ ({N} _{我}\ \左\ {M, D \ \} \)gydF4y2Ba.不同类型的元路径可以帮助理解为什么两个节点紧密相关。因为从一个节点到另一个节点的路径也可以与多种类型相关联,这些类型构建了路径的不同语义。例如,的元路径类型gydF4y2Ba\(d \ to d \ to {\ rm {m}} \)gydF4y2Ba表明,如果一种疾病与一个miRNA有关,那么与该疾病相似的其他疾病也可能与该miRNA有关。的元路径类型gydF4y2Ba\ (M D \ \ {\ rm {M}} \)gydF4y2Ba表明,如果一个miRNA与疾病相关,那么其他与该miRNA相似的miRNA将可能与疾病相关。有不同的米路径实例gydF4y2BaL-长度gydF4y2Ba之间的标识gydF4y2Ba米gydF4y2Ba和gydF4y2BadgydF4y2Ba如图所示。gydF4y2Ba10gydF4y2Ba.例如,证实gydF4y2Ba\ ({m} _ {2} \)gydF4y2Ba和gydF4y2Ba\({d} _ {2} \)gydF4y2Ba对具有不同长度的不同实例,一个元路径实例gydF4y2Ba\ ({P} _ {7} = {m} _ {2} \ {m} _ {2} \ d {} _ {3} \ d {} _ {2} \)gydF4y2Ba是一个gydF4y2Ba3-LengthgydF4y2Ba和gydF4y2Ba\({p} _ {2} = {m} _ {4} \到{d} _ {1} \到{d} _ {4} \)gydF4y2Ba是一个gydF4y2Ba长度gydF4y2Ba.gydF4y2Ba

图10gydF4y2Ba
图10.gydF4y2Ba

具有不同长度的元路径示例gydF4y2Ba

最后,提取网络中已确认的miRNA与疾病的所有元路径实例。gydF4y2Ba

mirna疾病成对嵌入gydF4y2Ba

miRNA和疾病的线性变换gydF4y2Ba

我们拿走了gydF4y2Ba\(一世\)gydF4y2Ba- miRNA相似性矩阵的第一行gydF4y2Ba\(SM\)gydF4y2Ba作为初始特征gydF4y2Ba\(一世\)gydF4y2Ba个miRNA的。以同样的方式,我们把gydF4y2BajgydF4y2Ba疾病相似性矩阵中的-th行gydF4y2Ba\(SD \)gydF4y2Ba作为特征gydF4y2Ba\ (j \)gydF4y2Bath疾病。然后,mirna和疾病的初始特征由于维度的不同,通过线性变换投影到同一个向量中。gydF4y2Ba

我们投射出miRNA的特征gydF4y2Ba\(r \)gydF4y2Ba到gydF4y2Ba\(z \)gydF4y2Ba- 如下所示:gydF4y2Ba

$ $ {\ varvec {h}} _ {r} = {\ varvec {W}} ^ {r} \ cdot {\ varvec {x}} _ {r} $ $gydF4y2Ba
(11)gydF4y2Ba

同样,疾病的最初特征gydF4y2BadgydF4y2Ba投射到gydF4y2Ba\(z \)gydF4y2Ba- 如下所示:gydF4y2Ba

$$ {\ varvec {H}} _ {d} = {\ varvec【W}} ^ {d} \ CDOT {\ varvec {X}} _ {d} {} $$gydF4y2Ba
(12)gydF4y2Ba

在哪里gydF4y2Ba\({{\ varvec {h}}} _ {r},{{\ varvec {h}}} _ {d}}gydF4y2Ba是miRNA的投射特征吗gydF4y2BargydF4y2Ba与疾病gydF4y2BadgydF4y2Ba,分别。gydF4y2Ba\({{\ varvec {x}}} _ {r} \)gydF4y2Ba和gydF4y2Ba\ ({{\ varvec {x}}} _ {d} \)gydF4y2Ba是miRNA的初始特征吗gydF4y2BargydF4y2Ba与疾病gydF4y2BadgydF4y2Ba.gydF4y2Ba\({\varvec{W}}}{R}\in{\mathbb{R}}}{Z*m}\)gydF4y2Ba是一个线性变换矩阵投射到495维矩阵gydF4y2Ba\(z \)gydF4y2Ba维空间gydF4y2Ba\ ({{\ varvec {W}}} ^ {D} \在{\ mathbb {R}} ^ {Z * n} \)gydF4y2Ba是一个线性变换矩阵,可以将383维上的matix投入到gydF4y2Ba\(z \)gydF4y2Ba维空间。gydF4y2Ba

无花果。gydF4y2Ba9gydF4y2Ba,带有阴影的节点是初始miRNA和疾病的转换表示。gydF4y2Ba

mirna与疾病相互作用的MLP编码器gydF4y2Ba

给予miRNA嵌入gydF4y2Ba\ ({{\ varvec {h}}} _ {r} \在{\ mathbb {r}} ^ {Z} \)gydF4y2Ba疾病嵌入gydF4y2Ba\({\varvec{h}}}{d}\in{\mathbb{R}}^{Z}\)gydF4y2Ba作为gydF4y2Ba\ (Com \离开({{\ varvec {h}}} _ {{\ varvec {r}}}, {{\ varvec {h}}} _ {d} \) \在{\ mathbb {r}} ^ {4 z} \)gydF4y2Ba,则使用agydF4y2Ba\ \(米)gydF4y2Ba- 层的多层感知器(MLP)以嵌入的miRNA-疾病相互作用(gydF4y2Ba\({{\ varvec {H}}} _ {R},{{\ varvec {H}}} _ {d} \)gydF4y2Ba)gydF4y2BaZgydF4y2Ba维向量。对嵌入器是gydF4y2Ba\({\ varvec {g}} \ left(r,d \右)\)gydF4y2Ba.首先,将miRNA包埋与疾病包埋结合,形成MLP的初始输入。gydF4y2Ba

$ $ {\ varvec {h}} ^{\左(0 \右)}= {\ varvec {Com}} \离开({{\ varvec {h}} _ {r}, {\ varvec {h}} _ {d}} \右)左= \ [{{\ varvec {h}} _ {r}, {\ varvec {h}} _ {d}, {\ varvec {h}} _ {r} \保监会{\ varvec {h}} _ {d}, {\ varvec {h}} _ {r} + {\ varvec {h}} _ {d}} \右]$ $gydF4y2Ba
(13)gydF4y2Ba
$ $ {\ varvec {h}} ^{{\离开({\ varvec {l}} \右)}}= \左\{{\开始{数组}{l * {20}} {ReLU \离开({{\ varvec {W}} ^{{\离开({\ varvec {l}} \右)}}\ cdot {\ varvec {h}} ^{{\离开({{\ varvec {l}} - 1} \右)}}+ {\ varvec {b}} ^{{\离开({\ varvec {l}} \右)}}}\右),\四0 < l < m} \ hfill \ \ {{\ varvec {W}} ^{{\离开({\ varvec {l}} \右)}}\ cdot{\ varvec {h}} ^{{\离开({{\ varvec {l}} - 1} \右)}}+ {\ varvec {b}} ^{{\离开({\ varvec {l}} \右)}},\四l = m} \ hfill \ \ \{数组}结束\ varvec {}} \ $ $gydF4y2Ba
(14)gydF4y2Ba
$ $ {\ varvec {g}} \离开({{\ varvec {r}}, {\ varvec {d}}} \右)= {\ varvec {h}} ^{{\离开({\ varvec {m}} \右)}}$ $gydF4y2Ba
(15)gydF4y2Ba

其中°表示元素 - 方向矢量乘法,gydF4y2Ba\(ReLU\)gydF4y2Ba(gydF4y2Ba\ \ (x)gydF4y2Ba)表示gydF4y2Ba\(max \ left(0,x右)\)gydF4y2Ba和gydF4y2Ba\ ({\ varvec {g}} \离开({\ varvec {r}}, {\ varvec {d}} \) \在{\ mathbb {r}} ^ {X} \)gydF4y2Ba.我们在隐层上使用dropout,并将MLP的最后一层输出视为对嵌入。我们把gydF4y2BaggydF4y2Ba(·),为2层MLP,其中每个层具有100个藏单位。gydF4y2Ba

对嵌入的有效性gydF4y2Ba

回想一下,节点嵌入的局限性之一是,如果miRNA经常在元路径中一起出现,不管miRNA是否与疾病相关,它会无意中使miRNA和疾病彼此相似。然后,我们提出了一个对效度分类器gydF4y2Ba\π(\ \)gydF4y2Ba:gydF4y2Ba\({\mathbb{R}}}^{X}\to{\mathbb{R}}\)gydF4y2Ba区分miRNA-disease对是否为有效对,用二元交叉熵损失表示如下:gydF4y2Ba

$$Loss{N}=y{r,d}\sigma\left[{\pi\left({\varvec{g}}}\left({r,d}\right)}\right)}\right]+\left({1-y{r,d}\right)\left({1-\sigma\left[{\pi\left({\varvec{g}\left({r,d}\right)}\right)}\right)$$gydF4y2Ba
(16)gydF4y2Ba
$$ Y_ {R,d} = \左\ {{\开始{阵列} {* {20}升} {{} 1,} \ hfill&{miRNA的{} r \;是\;关联\;具有\;疾病\; d} \ hfill \\ {0,} \ hfill&{{}的miRNA {} r \;是\;不\;关联\;具有\;疾病\; d} \ hfill \\?\ {端阵列}} \右。$$gydF4y2Ba
(17)gydF4y2Ba

\ \(π(\ cdot) \)gydF4y2Ba是具有ReLU激活的2层MLP。gydF4y2Ba

元路基于节点嵌入gydF4y2Ba

元路径的多头注意嵌入gydF4y2Ba

在异构网络中,元路径由一系列节点连接起来,可以保存重要的结构信息。根据元路径实例gydF4y2Ba\(p \)gydF4y2Ba连接已确认的miRNAgydF4y2Ba\(r \)gydF4y2Ba与疾病gydF4y2Ba\ (d \)gydF4y2Ba,连接的可测量特征隐含在序列中gydF4y2Ba\(p \)gydF4y2Ba.序列gydF4y2Ba\(p \)gydF4y2Ba表示为gydF4y2Ba\({\ {{\ varvec {X}}} _ {1},{{\ varvec {X}}} _ {2},\ cdots {{\ varvec {X}}} _ {N-1},{{\ varvec {X}}} _ {N} \} \)gydF4y2Ba,在那里,gydF4y2Ba\({\varvec{X}}}{1}={{\varvec{h}}}}{r}\)gydF4y2Ba,gydF4y2Ba\ ({{\ varvec {X}}} _ {n} = {{\ varvec {h}}} _ {d} \)gydF4y2Ba.考虑到元路径中不同节点对元路径的重要性不同,GRU可以学习对序列有贡献的重要节点,适合序列数据学习。我们使用GRU来生成gydF4y2Ba\(z \)gydF4y2Ba-空间向量gydF4y2Ba\(p \)gydF4y2Ba.GRU计算隐藏状态gydF4y2Ba\({{\ varvec {h}}} _ {t}}gydF4y2Ba与gydF4y2Ba\({{\ varvec {h}}} _ {t-1} \)gydF4y2Ba和gydF4y2Ba\ ({{\ varvec {X}}} _ {t} \)gydF4y2Ba作为输入,gydF4y2Ba\(t \在[1,n] \)gydF4y2Ba,这如下所示。gydF4y2Ba

$ $ {\ varvec {z}} _ {{\ varvec {t}}} =σ\ \离开({{\ varvec {W}} _ {{{\ varvec {zx}}}} \ cdot {\ varvec {X}} _ {{\ varvec {t}}} + {\ varvec {W}} _ {{{\ varvec {zh型}}}}\ cdot {\ varvec {h}} _ {{{\ varvec {t}} - 1}} + {\ varvec {b}} _ {{\ varvec {z}}}} \右)$ $gydF4y2Ba
(18)gydF4y2Ba
$$ {\ varvec {R}} _ {{\ varvec {吨}}} = \西格玛\左({{\ varvec【W}} _ {{{\ varvec {RX}}}} \ CDOT {\ varvec{X}} _ {{\ varvec {吨}}} + {\ varvec【W}} _ {{{\ varvec {rh的}}}} \ CDOT {\ varvec {H}} _ {{{\ varvec {吨}} - 1}} + {\ varvec {b}} _ {{\ varvec {R}}}} \右)$$gydF4y2Ba
(19)gydF4y2Ba
$ $ {\ varvec {g}} _ {{\ varvec {t}}} =左双曲正切\ [{{\ varvec {W}} _ {{{\ varvec {hx}}}} \ cdot {\ varvec {X}} _ {{\ varvec {t}}} + {\ varvec {W}} _ {{{\ varvec {hh}}}} \ cdot \离开({{\ varvec {r}} _ {{\ varvec {t}}} \保监会{\ varvec {h}} _ {{{\ varvec {t}} - 1}}} \右)+ {\ varvec {b}} _ {{\ varvec {h}}}} \右]$ $gydF4y2Ba
(20)gydF4y2Ba
$$ {\ varvec {h}}} = {\ varvec {t}}} = {\ varvec {z}}} \ {{\ varvec {z}}} \ cir {\ varvec {h}} _ {{{{\varvec{t}} - 1}} + \left( {1 - {\varvec{z}}_{{\varvec{t}}} } \right) \circ {\varvec{g}}_{{\varvec{t}}}$$
(21)gydF4y2Ba

在哪里gydF4y2Ba\({\varvec{\sigma}}\)gydF4y2Ba是一个符合统治功能,和gydF4y2Ba\ ({{\ varvec {W}}} _ {{\ varvec {z}} {\ varvec {x}}}{\在{\ mathbb {R}}} ^ {x \ z} \)gydF4y2Ba,gydF4y2Ba\ ({{\ varvec {W}}} _ {{\ varvec {r}} {\ varvec {x}}}{\在{\ mathbb {r}}} ^ {x \ Z} \)gydF4y2Ba,gydF4y2Ba\({\varvec{W}}}}{\varvec{h}{\varvec{x}}{\in{\mathbb{R}}}}^{x\times Z}\)gydF4y2Ba,gydF4y2Ba\ ({{\ varvec {W}}} _ {{\ varvec {z}} {\ varvec {h}}} \在{\ mathbb {R}} ^ {X \乘以X} \)gydF4y2Ba,gydF4y2Ba\ ({{\ varvec {W}}} _ {{\ varvec {r}} {\ varvec {h}}} \在{\ mathbb {r}} ^ {X \乘以X} \)gydF4y2Ba,gydF4y2Ba\ ({{\ varvec {W}}} _ {{\ varvec {h}} {\ varvec {h}}} \在{\ mathbb {R}} ^ {X \乘以X} \)gydF4y2Ba,gydF4y2Ba\({{\ varvec {B}}} _ {{\ varvec {Z}}} \在{\ mathbb {R}} ^ {X},{{\ varvec {B}}} _ {{\ varvec {R}}} \在{\ mathbb {R}} ^ {X},{{\ varvec {b}}} _ {{\ varvec {H}}} \在{\ mathbb {R}} ^ {X}\)gydF4y2Ba.gydF4y2Ba

我们应用辍学到隐藏的状态更新向量gydF4y2BaggydF4y2BatgydF4y2Ba如下:gydF4y2Ba

$ $ {\ varvec {h}} _ {{\ varvec {t}}} = {\ varvec {z}} _ {{\ varvec {t}}} \保监会{\ varvec {h}} _ {{{\ varvec {t}} - 1}} + \离开({1 - {\ varvec {z}} _ {{\ varvec {t}}}} \) \保监会\离开({{\ varvec {d}} \离开({{\ varvec {g}} _ {{\ varvec {t}}}} \右)}\右)$ $gydF4y2Ba
(22)gydF4y2Ba

在哪里gydF4y2Ba\({\ varvec {d}}(\ cdot)\)gydF4y2Ba是定义如下的函数差:gydF4y2Ba

$${\varvec{d}}\left({\varvec{X}}\right)=\left\{\begin{array}{*{20}l}{{\varvec{mask}}\circ{\varvec{X}}\hfill&{if\;列车\;相位}\hfill\\{\left({1-q}\right){\varvec{X}}}\hfill&{others}\hfill\\\ end{array}}\right$$gydF4y2Ba
(23)gydF4y2Ba

在哪里gydF4y2Ba\(q\)gydF4y2Ba退学率和gydF4y2Ba\({\ varvec {m}} {\ varvec {a}} {\ varvec {s}} {\ varvec {k}} \)gydF4y2Ba是一个向量,它是从与成功概率的贝努利分布采样得到gydF4y2Ba\(1-Q \)gydF4y2Ba.gydF4y2Ba

我们得到一个嵌入矩阵gydF4y2BahgydF4y2Ba在{\ (\ \ mathbb {R}} ^ {n \ Z} \)gydF4y2Ba经过元路径实例的GRU训练gydF4y2Ba\(p \)gydF4y2Ba.gydF4y2Ba\(z \)gydF4y2Ba- 通过聚合提取含量载体gydF4y2Ba\({\ varvec {h}} \)gydF4y2Ba与细心的池。元路径实例中每个节点的贡献度量如下:gydF4y2Ba

上周{{{{{{{{{{{{{{{{{{{{{}}}}}{{{{{{{{{{{{{{{{{{{{{{}}}}{{{{{{{{{{{{{{}}}}}}{{{{{{{{}}}}}}{{{{{{{{{}}}}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}cdot{\varvec{h}}{{\varvec{j}}}\right}$$gydF4y2Ba
(24)gydF4y2Ba

在哪里gydF4y2Ba\ ({\ varvec {M}} \在{\ mathbb {R}} ^ {Z} \)gydF4y2Ba是训练过的注意力参数向量,gydF4y2Ba\(I \ in \ left [1,n \ oft],j \在[1,n] \中)gydF4y2Ba.gydF4y2Ba

提取的载体由来自矩阵的向量的加权和载体形成gydF4y2Ba\({\ varvec {h}} \)gydF4y2Ba如下:gydF4y2Ba

$ $ {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{\ varvec {p}}} = \ mathop \总和\ limits_ {{{\ varvec{我}}= 1}}^ {{\ varvec {n}}} {\ varvec{\α}}_ {{\ varvec{我}}}\ cdot {\ varvec {h}} _ {{\ varvec{我}}}$ $gydF4y2Ba
(25)gydF4y2Ba

为了使注意参数的学习保持稳定,我们将注意机制扩展到多头注意,引导注意gydF4y2BaKgydF4y2Ba次级和平均产出的次数如下:gydF4y2Ba

{{{{{{{{{{{{{{{{{{{{{{{{}}}}{{{{{{{{{{{{{{}}}}}}}{{{{{{{{{{{{{}}}}{{{{{{}}}}}{{{{{{{}}}}}{{{{{{{{{}}}}}}}}{{{{{{{{{{{{{}}}}}}}}}}}{{{{{{{{{{{{{{{{{{{}}}}}}}}}}}{{{{{{{{{{{}}}}}}}}}}}}}}}}{{{{{{{{{{{{{{{{{{{{{{{{}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}{n}}{\varvec{\alpha}}{{\varvec{i}}}}{{\varvec{K}}}\cdot{\varvec{h}}}{{\varvec{i}}}}右)$$gydF4y2Ba
(26)gydF4y2Ba

其中ΣΣ表示连接,gydF4y2Ba\({\ varvec {\ alpha}} _ {{\ varvec {i}}} ^ {{\ varvec {k}}}}}gydF4y2Ba标准化注意系数在gydF4y2Ba\(K\)gydF4y2Ba- 关注。gydF4y2Ba

注意力感知多个元路径实例的融合来代表miRNA疾病协会gydF4y2Ba

用于连接确认的miRNA的元路径实例gydF4y2Ba\(r \)gydF4y2Ba与疾病gydF4y2Ba\ (d \)gydF4y2Ba,元路径实例可能具有不同的长度。具有相同元路径长度的元路径实例表现出不同的连接贡献gydF4y2BargydF4y2Ba我gydF4y2Ba和gydF4y2BadgydF4y2BajgydF4y2Ba由于序列中节点的差异,我们称之为元路径类型。例如gydF4y2Ba\({M} _ {2} \为{米} _ {4} \为{d} _ {3} \为{d} _ {4} \)gydF4y2Ba和gydF4y2Ba{m}_{4}\to {d}_{1}\to {d}_{4}\gydF4y2Ba列于图中。gydF4y2Ba10gydF4y2Ba.由于两个元路径实例中涉及的相关信息不相同。合并具有相同长度的不同元路径实例的全局信息,以指示之间的连接gydF4y2Ba\(r \)gydF4y2Ba和gydF4y2BadgydF4y2Ba,我们关注关注。gydF4y2Ba

$$ {\ varvec {E}} ^ {{\ varvec {P}}} = RELU \左({{\ varvec {ATT}} _ {P} \ CDOT {\ varvec {H}} _ {{{\varvec {R}},{\ varvec {d}}}} ^ {{\ varvec {p}}}} \右)$$gydF4y2Ba
(27)gydF4y2Ba
$ $ \离开({\ varvec {e ^{\ '}}} \右)^ {p} = \压裂{{\ exp \离开({{\ varvec {e}} ^ {{\ varvec {p}}}} \右)}}{{\ mathop \总和\ nolimits_{问\ p} \ exp \离开({{\ varvec {e}} ^ {{\ varvec {q}}}} \右)}}$ $gydF4y2Ba
(28)gydF4y2Ba
$ $ {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{\ varvec {P}}} =乙状结肠\离开({\ mathop \总和\ limits_{在P P \} \离开({\ varvec {e ^{\ '}}} \右)^ {{\ varvec {P}}} \ cdot {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{\ varvec {P}}}} \右)$ $gydF4y2Ba
(29)gydF4y2Ba

在哪里gydF4y2Ba\({{\ varvec {a}} {\ varvec {a}} {\ varvec {t}}} {{\ varvec {p}}} \ in {\ mathbb {r}}} ^ {z}\)gydF4y2Ba参数是否在元路径实例中gydF4y2Ba\(p \)gydF4y2Ba.gydF4y2Ba\ ({{\ varvec {e}}} ^ {p} \)gydF4y2Ba指示元路径实例的贡献gydF4y2Ba\(p \)gydF4y2Ba的gydF4y2Ba\({r}{i}\)gydF4y2Ba和gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba.gydF4y2Ba\({{{\varvec{e}}}}{{{{{{{\prime}}}}}}{{\varvec{p}}}}}\)gydF4y2Ba与Meta-Path类型的所有元路径实例中的SoftMax功能标准化gydF4y2Ba\(p \)gydF4y2Ba.对所有gydF4y2Ba\ (p p \ \)gydF4y2Ba,综合表示之间的联系gydF4y2Ba\({r}{i}\)gydF4y2Ba和gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba如式(可以由所有的元路径实例的加权和来获得gydF4y2Ba29gydF4y2Ba)。gydF4y2Ba

注意感知融合多个meta路径来表示miRNA疾病关联gydF4y2Ba

我们定义的元路径类型gydF4y2Ba我\ (P {} _ {} \)gydF4y2Ba,gydF4y2Ba\(左我\ \ [1,N \] \)gydF4y2Ba和的特征证实的miRNAgydF4y2Ba\({r}{i}\)gydF4y2Ba与疾病gydF4y2Baj d \ ({} _ {} \)gydF4y2Ba通过不同的元路径类型结合如gydF4y2Ba\ ({{\ varvec {h}}} ^ {{P} _{我}}{\在{\ mathbb {R}}} ^ {Z} \)gydF4y2Ba.假设不同类型和长度的贡献不同,利用注意机制得到最终表征。gydF4y2Ba

$ $ {\ varvec {w}} ^ {{P_{我}}}= ReLU \离开({{\ varvec {att}} _ {{P_{我}}}\ cdot {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{P_{我}}}}\右)$ $gydF4y2Ba
(30)gydF4y2Ba
$ $ {\ varvec {w}} ^ {{\ '} {P_{我}}}= \压裂{{\ exp \离开({{\ varvec {w}} ^ {{{\ varvec {P}} _ {{\ varvec{我 }}} }} } \ 右)}}{{\ mathop \总和\ nolimits_ {{P_在P}{我}\}\ exp \离开({{\ varvec {w}} ^ {{{\ varvec {P}} _ {{\ varvec{我 }}} }} } \ 右)}}$ $gydF4y2Ba
(31)gydF4y2Ba
$ $ {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{\ varvec {P}}} = \ mathop \总和\ limits_ {{P_{我}\在P}} {\ varvec {w}} {^ {\ '}} ^ {{P_{我}}}\ cdot {\ varvec {h}} _ {{{\ varvec {r}}, {\ varvec {d}}}} ^ {{P_{我}}}$ $gydF4y2Ba
(32)gydF4y2Ba

在哪里gydF4y2Ba\({\varvec{a}}{\varvec{t}{\varvec{t}}}{{P}{i}}{\in{\mathbb{R}}}{Z}\)gydF4y2Ba是具有不同路径长度的参数gydF4y2Ba我\ (P {} _ {} \)gydF4y2Ba.gydF4y2Ba\ ({{\ varvec {w}}} ^ {{P} _{我}}\)gydF4y2Ba指示元路类型的贡献gydF4y2Ba我\ (P {} _ {} \)gydF4y2Ba的连接。gydF4y2Ba\ ({{\ varvec {w}} {^ {\ '}}} ^ {{P} _{我}}\)gydF4y2Ba用所有元路径的软MAX函数标准化。所以,gydF4y2Ba\({{\ varvec {h}}} _ {r,d} ^ {p} {\ in {\ mathbb {r}}} ^ {z}}gydF4y2Ba代表与路径长度注意所有数学路径。gydF4y2Ba

最后是miRNA的表达gydF4y2Ba\(r \)gydF4y2Ba与疾病gydF4y2Ba\ (d \)gydF4y2Ba与上述机制建模了与元路径的重要信息的相互作用。gydF4y2Ba

通过联合包埋预测mirna与疾病的相关性gydF4y2Ba

最后,我们得到了miRNA和疾病的最终代表gydF4y2Ba\({{\ varvec {h}}} _ {u} ^ {p} \)gydF4y2Ba,包括miRNA和疾病协会的总信息。参数gydF4y2Ba\({{\ varvec【W}}} ^ {R} {{\ varvec【W}}} ^ {d} {{\ varvec {A}} {\ varvec {吨}} {\ varvec {吨}}} _ {p} \)gydF4y2Ba和gydF4y2Ba\({{\ varvec {a}} {\ varvec {t}} {\ varvec {t}}} _ {pi}}} _ {pi}}gydF4y2Ba进行培训,以获得尽可能正确的特征。训练我们的模型的主要目的是使miRNA和疾病异质网络中相关的两个节点之间的距离尽可能小。同时,我们希望使成对嵌入和基于元路径的节点嵌入相似。因此,我们通过联合包埋预测miRNA与疾病的关系。gydF4y2Ba

我们获得了基于元路径的节点嵌入的跨熵,如下所示:gydF4y2Ba

$$ Loss_ {M} = \ mathop \总和\限制_ {{\左({R,d} \右)\在{\ mathcal {P}}}} \日志乙状结肠\左({{\ varvec {H}} \左({R,d} \右)} \右){} - \ mathop \总和\限制_ {{\左({R,d} \右)\ notin {\ mathcal {P}}}} \日志乙状结肠\左({ - {\ varvec {H}} \左({R,d} \右)} \右)$$gydF4y2Ba
(33)gydF4y2Ba

在哪里gydF4y2Ba\ (\ mathcal P {} \)gydF4y2Ba是带有支持的关系的一组正对。可以通过最小化以下损耗函数来学习参数。我们将上述两个损耗函数组合起来以获得最终损失函数,如下所示:gydF4y2Ba

$ $ =损失Loss_ {N} + \λLoss_ {M} - (1 - {\ uplambda}) Loss_ {reg} $ $gydF4y2Ba
(34)gydF4y2Ba

\({损失}_ {Reg} \)gydF4y2Ba是为了防止过度拟合正规化。我们分析了AUC与价值gydF4y2Ba\λ(\ \)gydF4y2Ba从0到1,间隔为0.1。它表示当gydF4y2Ba\λ(\ \)gydF4y2Ba设置为0.5时,CEMDA获得了更好的结果。因此,我们设定gydF4y2Ba\λ(\ \)gydF4y2Ba到0.5。gydF4y2Ba

可用性数据和材料gydF4y2Ba

支持这项研究发现的数据集可在gydF4y2Bahttps://github.com/liubailong/CEMDAgydF4y2Ba. CEMDA的web服务可从以下网址获得:gydF4y2Bahttp://132.232.17.50:8080/CEMDA.jspgydF4y2Ba

缩写gydF4y2Ba

CEMDA:gydF4y2Ba

结合嵌入模型来预测miRNA的疾病协会gydF4y2Ba

GRU:gydF4y2Ba

门复发单位gydF4y2Ba

简要:gydF4y2Ba

多层的PerceptrongydF4y2Ba

LOOCV:gydF4y2Ba

全局留一交叉验证gydF4y2Ba

microrna:gydF4y2Ba

Microribonucleic酸gydF4y2Ba

网:gydF4y2Ba

医学主题词gydF4y2Ba

参考文献gydF4y2Ba

  1. 1.gydF4y2Ba

    Huang HY, Lin YCD, Li J, Huang KY, Shrestha S, Hong HC, et al. miRTarBase 2020更新实验验证的microRNA-target相互作用数据库。核酸Res. 2020;2020:145 - 8。gydF4y2Ba

    谷歌学者gydF4y2Ba

  2. 2.gydF4y2Ba

    陈鹏,王德东,陈辉,周泽忠,何小林。酵母中基本基因的非本质性为人类疾病的治疗提供了见解。基因组研究》2016;26(10):1355 - 62。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  3. 3.gydF4y2Ba

    郑勇,姜树斌,张海英,张锐,龚迪强。鹅脂肪肝中miR-33表达检测及靶基因验证中华医学杂志。2015;16(6):12737-52。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  4. 4.gydF4y2Ba

    谢法U,荣格JY。大数据分析:对雪旺细胞在周围神经变性和再生芯片和实验数据的比较研究。神经翻译。2019; 14(6):1099。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  5. 5.gydF4y2Ba

    陈旭,谢东,赵强,尤志。microrna与复杂疾病:从实验结果到计算模型。短暂的Bioinform。2019;20(2):515 - 39。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  6. 6.gydF4y2Ba

    张H,梁益,汉SY,彭C,李Y.长链非编码RNA和蛋白质相互作用:从实验结果基于网络的方法计算模型。int j mol sci。2019; 20(6):1284。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  7. 7.gydF4y2Ba

    基于基因组数据整合的疾病相关microrna优先排序方法。见:生物医学工程和信息学国际会议记录。2010;2270 - 4。gydF4y2Ba

  8. 8.gydF4y2Ba

    宣鹏,韩凯,郭明,高艳华,李建斌,丁杰,等。基于加权k最相似近邻预测与人类疾病相关的micrornaPLoS ONE。2013;八8。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  9. 9.gydF4y2Ba

    陈米,廖湾,李祖。基于双层随机步行的全局相似性方法,用于预测MicroRNA-疾病协会。SCI批准。2018; 8(1):1-16。gydF4y2Ba

    谷歌学者gydF4y2Ba

  10. 10。gydF4y2Ba

    陈X,燕cc,张x,you z,deng lx,liu y等。WBSMDA:Mirna-疾病协会预测的分数内和之间的分数。SCI REP。2016; 6:21106。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  11. 11.gydF4y2Ba

    赵春春,匡伦,王林,等。基于距离相关集的microrna疾病相关性预测。BMC Bioinform。2018;19:141。gydF4y2Bahttps://doi.org/10.1186/s12859-018-2146-xgydF4y2Ba.gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  12. 12.gydF4y2Ba

    江Q,王G,张T等人。基于支持向量机预测人微小伤疾病。IEEE关于生物信息学和生物医学的国际会议。2010年,第467-472页。gydF4y2Ba

  13. 13.gydF4y2Ba

    陈X,燕GY。半监督学习潜能的人微小RNA疾病关联的推断。SCI代表2014; 4:5501。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  14. 14.gydF4y2Ba

    梁c,yu sp,luo JW。用于识别疾病相关候选MiRNA的自适应多视图多标签学习。PLOS计算BIOL。2019; 15(4):E1006931。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  15. 15.gydF4y2Ba

    陈X,Sun LG,赵Y.NCMCMDA:通过邻域约束矩阵完成的miRNA-疾病关联预测。生物信息学的简报。2020。gydF4y2Ba

  16. 16.gydF4y2Ba

    赵颖,陈旭,尹建军。基于自适应增强的mirna与疾病相关性预测模型。生物信息学,2019,35(22):4730 - 8。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  17. 17.gydF4y2Ba

    陈X,王cc,yin j,你zh。基于随机林的新型人体miRNA-疾病协会推断。摩尔核酸。2018; 13:568-79。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  18. 18.gydF4y2Ba

    陈旭,王磊,曲娟,关宁宁,李建强。基于归纳矩阵补全预测mirna与疾病的关联。生物信息学。2018;34(24):4256 - 65。gydF4y2Ba

    CAS.gydF4y2BaPubMedgydF4y2Ba谷歌学者gydF4y2Ba

  19. 19.gydF4y2Ba

    姜永涛,刘廷涛,余丽华,严春成,卞慧娟。预测协同过滤与mirna疾病的关联。Neuroinformatics。2018;16(3 - 4):363 - 72。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  20. 20gydF4y2Ba

    毛刚,王少林,张伟。基于贝叶斯概率矩阵分解模型的MicroRNA与疾病相关性预测。中华医学杂志。2019;26(9):1030-9。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  21. 21.gydF4y2Ba

    陈振华,王新科,高鹏,刘慧娟,宋伯生。基于相似性和拓扑结构预测疾病相关microRNA。8细胞。2019;(11):1405。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  22. 22.gydF4y2Ba

    Zeng XX, Wang W, Deng GS, Bing JX, Zou qiang . neural networks用于潜在疾病相关microrna的预测。核酸分子。2019;16:566-75。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  23. 23.gydF4y2Ba

    龚YC,牛YQ,张W,李XH。一种基于网络嵌入的MiRNA疾病关联预测多信息集成方法。BMC生物信息。2019;20(1):468.gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  24. 24.gydF4y2Ba

    张C,赵黄,陆玉,等。CAMEL:作者识别的内容感知和元路径增强度量学习。万维网。2018年gydF4y2Ba

  25. 25.gydF4y2Ba

    王Y,郑FS,王ZB,Lu JB,张HY。圆形RNA循环SLC7A6通过大量海绵MIR-21充当非小细胞肺癌中的肿瘤抑制剂。细胞周期。2020; 19(17):2235-46。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  26. 26。gydF4y2Ba

    张晓军,李玉玲,齐鹏飞,马志林。MiR-17-92的生物学特性及其在肺癌中的研究进展。国际医学杂志。2018;15(13):1443-8。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  27. 27。gydF4y2Ba

    孙q,挂m,郭xd,邵wl,zeng gq。miRNA-21和BTG2在肺癌中的表达及意义。肿瘤Biol。2013; 34(6):4017-26。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  28. 28。gydF4y2Ba

    史海波,徐军,张国栋,徐立德,李春强,王磊,等。通过miRNA靶点和疾病基因之间的功能联系,行走相互作用组以确定人类miRNA与疾病的关联。BMC Syst Biol. 2013;7(1):101。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  29. 29。gydF4y2Ba

    明新,吴怡。将元路径相似性与用户偏好相结合,实现top-N推荐。国际人工智能技术与应用会议(TAAI)。2019年,第1-6页。gydF4y2Ba

  30. 30.gydF4y2Ba

    李勇,邱春霞,屠军,耿波,杨继成,蒋志忠,等。HMDD v2.0:实验支持的人类microRNA和疾病关联的数据库。核酸Res. 2013;42(D1): 1070-4。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  31. 31。gydF4y2Ba

    李SR,谢MZ,刘XQ。基于二分网络建议和Katz模型的新方法来预测潜在的微型疾病关联。前群体。2019; 10:1147。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  32. 32。gydF4y2Ba

    杨Z,仁F,刘CN,他SM,Sun G,Gao Q等。DBDEMC:人类癌症中差异表达miRNA的数据库。欧宝体育2021足球欧洲杯买球平台生物化的中央。2010; 11:S5。gydF4y2Ba

    CAS.gydF4y2Ba谷歌学者gydF4y2Ba

  33. 33。gydF4y2Ba

    徐志强,张志强,张志强,等。PhenomiR:疾病和生物过程中microRNA表达的知识库。基因组医学杂志。2010;11:R6。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  34. 34。gydF4y2Ba

    临床医师的癌症杂志。癌症统计。2017;67(1):7-30。gydF4y2Ba

    谷歌学者gydF4y2Ba

  35. 35.gydF4y2Ba

    萧WD,钟益,吴吕,杨德克斯,叶Sq,张米。微稻草在肺癌中的预后价值:系统评价与荟萃分析。Mol Clin Oncol。2019; 10(1):67-77。gydF4y2Ba

    CAS.gydF4y2BaPubMedgydF4y2Ba谷歌学者gydF4y2Ba

  36. 36.gydF4y2Ba

    李应祥,崔学明,李亚东,张婷婷,李少英。miR-421表达上调与非小细胞肺癌预后不良相关。癌症管理2018;10:2627-33。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  37. 37.gydF4y2Ba

    Mansoori B,Mohammadi A,Ghasabi M,Shirjang S,Dehghan R,Montazeri v等。miR-142-3p作为肿瘤抑制剂miRNA在调节肿瘤性,侵袭和侵袭人乳腺癌的迁移,靶向摇杆1表达。J Cell Physiol。2019; 234(6):9816-25。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  38. 38.gydF4y2Ba

    何玉军,邓飞,赵淑娟,钟少林,赵建华,王丹东,等。miRNA-mRNA网络分析显示,miR-140-5p通过靶向GLUT1抑制乳腺癌糖酵解。表观基因组学。2019;11(9):1021 - 36。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  39. 39.gydF4y2Ba

    Voss G, Haflidadóttir BS, Järemo H, Persson M, Ivkovic CT, Wikström P, Ceder Y.通过上调E-Cadherin和EpCAM调节前列腺癌细胞的细胞-细胞粘附。致癌作用。2019;41(7):865 - 74。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  40. 40gydF4y2Ba

    黄泽,施建国,高yx,崔厘米,张某,李杰,等。HMDD v3.0:用于通过实验支持的人类微小疾病协会的数据库。核酸RES。2018; 47(D1):D1013-7。gydF4y2Ba

    文章gydF4y2Ba谷歌学者gydF4y2Ba

  41. 41gydF4y2Ba

    王丹,王军,陆敏,宋飞,崔庆华。基于microRNA相关疾病推断人类microRNA功能相似性和功能网络生物信息学,2010,26(13):1644 - 50。gydF4y2Ba

    CAS.gydF4y2Ba文章gydF4y2Ba谷歌学者gydF4y2Ba

  42. 42gydF4y2Ba

    以至于CE。医学主题标题(MeSH)。中华医学杂志。2000;88(3):265-6。gydF4y2Ba

    CAS.gydF4y2BaPubMedgydF4y2Ba谷歌学者gydF4y2Ba

下载参考gydF4y2Ba

致谢gydF4y2Ba

我们感谢编辑和匿名审稿人的意见和建议。gydF4y2Ba

资金gydF4y2Ba

这项工作得到了“中国矿业大学建设的双重定额专项基金”,2018 Zo.30号。“该资助者在研究设计,数据收集和稿件的准备中没有作用。gydF4y2Ba

作者信息gydF4y2Ba

隶属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

BL和LZ构思了预测方法,实施了实验,对实验结果进行了分析,并撰写了论文。XZ和zl1采集数据并进行实验。XZ和ZL2对论文进行了修改。所有作者都已阅读并批准了最终论文。gydF4y2Ba

相应的作者gydF4y2Ba

对应于gydF4y2Ba雷张gydF4y2Ba或者gydF4y2Ba(李gydF4y2Ba.gydF4y2Ba

道德声明gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

不适用。gydF4y2Ba

同意出版物gydF4y2Ba

不适用。gydF4y2Ba

相互竞争的利益gydF4y2Ba

作者声明在本文的研究、作者身份和出版方面没有潜在的利益冲突。gydF4y2Ba

补充资料gydF4y2Ba

出版商的注意事项gydF4y2Ba

欧宝体育黑玩家施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。gydF4y2Ba

补充信息gydF4y2Ba

额外的文件1gydF4y2Ba

.个案研究的补充表格。gydF4y2Ba

权利和权限gydF4y2Ba

开放获取gydF4y2Ba本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.创作共用及公共领域专用豁免书(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本文提供的数据,除非在数据的信贷额度中另有说明。gydF4y2Ba

重印和权限gydF4y2Ba

关于这篇文章gydF4y2Ba

通过CrossMark验证货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

刘波,朱旭东,张磊。gydF4y2Baet al。gydF4y2Ba联合嵌入模型预测mirna与疾病的相关性。gydF4y2Ba欧宝娱乐合法吗22,gydF4y2Ba161(2021)。https://doi.org/10.1186/s12859-021-04092-wgydF4y2Ba

下载引用gydF4y2Ba

关键字gydF4y2Ba

  • miRNA和疾病相互作用gydF4y2Ba
  • Meta-pathgydF4y2Ba
  • 对嵌入gydF4y2Ba
  • 节点嵌入gydF4y2Ba
  • 联合嵌入gydF4y2Ba
\gydF4y2Ba