跳到主要内容GydF4y2Ba

SNF-NN:利用相似网络融合和神经网络预测药物-疾病相互作用的计算方法GydF4y2Ba

抽象的GydF4y2Ba

背景GydF4y2Ba

药物重新定位是一种用于鉴定批准的药物的新型治疗潜力的制药研究的新出现方法,并发现未经处理的疾病的治疗方法。由于其时间和成本效率,药物重新定位在与传统的De Novo药物发现过程相比优化药物开发过程中起作用。基因组学的进步以及大规模公开数据的大规模增长以及高性能计算能力的可用性,进一步激励了计算药物重新定位方法的发展。更近来,机器学习技术的兴起与强大的计算机的可用性一起,使得计算药物的区域重新定位了一个激烈的活动区域。GydF4y2Ba

结果GydF4y2Ba

本文提出了一种基于深度学习的神经网络框架SNF-NN,利用药物相关相似度信息、疾病相关相似度信息和已知的药物-疾病相互作用预测新的药物-疾病相互作用。该框架提供了与药物和疾病相关的异质相似性信息,以预测新的药物-疾病相互作用。SNF-NN采用相似性选择、相似性网络融合和高度调谐的神经网络模型来预测新的药物-疾病相互作用。通过与9种基线机器学习方法的性能比较,评价了SNF-NN的鲁棒性。提出的框架优于所有基线方法(GydF4y2Ba\(AUC-ROC\)GydF4y2Ba= 0.867,和GydF4y2Ba\(AUC-PR\)GydF4y2Ba= 0.876),使用分层10倍交叉验证。为了进一步证明SNF-NN的可靠性和耐用性,两个数据集被用来验证公平提议的框架的对7最近的国家的最先进的方法,药物,疾病相互作用预测性能。SNF-NN实现与分层10倍交叉验证性能显着GydF4y2Ba\(AUC-ROC\)GydF4y2Ba范围从0.879到0.931和GydF4y2Ba\(AUC-PR\)GydF4y2Ba从0.856到0.903。此外,通过验证预测未知的未知药物疾病相互作用和公布的研究来验证SNF-NN的效率。GydF4y2Ba

结论GydF4y2Ba

综上所述,将异质网络的相似性度量和深度学习模型整合在一起,用于预测新的药物与疾病的相互作用,可以显著促进药物重新定位的计算研究。SNF-NN的数据和实现可在GydF4y2Bahttp://pages.cpsc.ucalgary.ca/ tnjarada / snf-nn.phpGydF4y2Ba.GydF4y2Ba

背景GydF4y2Ba

人类一直面临着各种疾病。在过去,这些疾病或者导致死亡,残疾或恢复,并且没有工具,会影响结果。向前迈进一大步是,某些物质或药物可以减轻疾病的症状,甚至从疾病帮助恢复的发现。随着时间的推移,药物的石板已被确定或多种疾病的发展。但是仍然存在,一些对于没有药物已被发现或发展至今疾病。GydF4y2Ba

其中一个原因是,新药研发是一项昂贵,冗长,复杂和危险的过程。根据非常最近的研究,新的FDA批准的药物,针对不同的治疗领域的平均估计的研究和开发成本的范围0.8和4.5十亿美元之间。GydF4y2Ba1GydF4y2Ba].如此高的成本是由于与高失败率的临床前试验相关的支出。此外,传统的GydF4y2Ba德诺维GydF4y2Ba开发新治疗剂的策略包括许多步骤,这些步骤可能需要长达17年的时间,成功率不到10%[GydF4y2Ba2GydF4y2Ba].GydF4y2Ba

需要开发新的药物的疾病,其目前的药物有令人不快的副作用,新出现的疾病,如非常需要GydF4y2Ba新型冠状病毒肺炎GydF4y2Ba最近的一项研究报告称,全球约有7000种没有任何治疗方法的罕见疾病,影响着4亿多人[GydF4y2Ba3.GydF4y2Ba].GydF4y2Ba

尽管制药业在新药研发方面投入了大量资金,但由于相关风险因素(如副作用),新批准药物的数量也在显著减少[GydF4y2Ba4.GydF4y2Ba]. 这个R.e is, therefore, a need for innovative drug development strategies that overcome the limitations of the traditional德诺维GydF4y2Ba战略。GydF4y2Ba

近年来,药物重新定位已经成为一种强有力的替代方案GydF4y2Ba德诺维GydF4y2Ba大约30%的新FDA批准的治疗药物和疫苗是由于成功的药物重新定位研究[GydF4y2Ba5.GydF4y2Ba].药物重新定位是鉴定现有药物的新疗效和发现未经处理的疾病治疗的过程。药物排雷策略在优化开发新药的临床前过程中发挥了乐图作用,并通过其时间和成本效益给予搁置,撤回和失败的药物第二次机会。GydF4y2Ba

传统的药物重新定位研究通常侧重于揭示药物作用模式(MoA)的相似性[GydF4y2Ba6.GydF4y2Ba],揭示新型药物适应症[GydF4y2Ba7.GydF4y2Ba],研究药物化合物之间的共同特征[GydF4y2Ba8.GydF4y2Ba],或者发现药物和疾病[之间的关系GydF4y2Ba9.GydF4y2Ba].这些研究中的一个主要挑战是区分药物的实际分子靶点和成百上千的额外基因产物,这些基因产物由于靶点活性的变化而间接受到影响。因此,经典的统计模型和方法在检测大量基因中的药物分子靶点时是无效的。GydF4y2Ba

此外,仅使用一种数据来源是许多传统药物重新定位方法的一大缺点,因为这些方法可能只能恢复对活生物体行为的部分知识。此外,丢失、有偏差和不准确的数据等障碍可能会影响这些模型的性能。例如,由于不同实验条件(如患者年龄、环境变量)的变化等原因,可靠的基因表达签名可能难以定义,这可能导致基因表达签名的数据差异,从而导致数据存在偏差。此外,当这些基因被用作药物靶点时,基因表达可能并不总是发生显著变化,这可能导致数据不准确。此外,由于缺乏药物靶点的高分辨率结构数据,在遵循化学结构和分子信息策略时,很难识别潜在的药物靶点相互作用。因此,这些方法的推论和发现的主张可能是不可持续的。因此,在开发计算药物重新定位模型时,整合来自各种来源的数据可能是克服这些挑战的一种方法。GydF4y2Ba

技术的快速进步允许开发用于推断潜在的治疗应用的有效计算模型。这些计算模型已被用于识别现有药物的治疗潜力,可用于引导耗时和昂贵的临床试验。此外,可以考虑通过计算模型预测的新药疾病相互作用以进一步验证(例如,功能性富集分析和Meta分析)。这些模型可以大致分为三个类别[GydF4y2Ba10GydF4y2Ba那GydF4y2Ba11GydF4y2Ba].GydF4y2Ba

第一类包括数据挖掘的基于模型推断脱靶药物相互作用和鉴定新药物的重新定位的候选者。这种模型是基于文本挖掘和语义技术构建的。例如,塔里等。[GydF4y2Ba12GydF4y2Ba[介绍了一种新的方法,它使用文本挖掘来从公共可用来源检索数据,以便构建一组逻辑事实。然后使用逻辑事实以及代表药物机制特性的逻辑规则,以构建用于鉴定现有药物的治疗潜力和新颖适应症的自动推理模型。此外,Rastegar-Mojarad等。[GydF4y2Ba13GydF4y2Ba]开发了一种方法,使用的文本挖掘的数据来推断药物基因和基因 - 疾病语义预测。然后,语义预测是用来编译潜在的药物 - 疾病对的排名列表。此外,朱等人。[GydF4y2Ba14GydF4y2Ba]利用临床药替昔甙(PGX)数据来构建药皂组网本体语言(WOL)型材。然后用于鉴定FDA批准的乳腺癌药物的药物替代科学组织。GydF4y2Ba

第二类是指基于网络的模型,依靠生物和生物医学实体的异构网络捕获未知的药物 - 疾病相互作用。这样的模型使用的网络分析技术(例如,二分图,聚类,网络中心措施)来发现信息的关系。例如,告知李与卢[GydF4y2Ba15GydF4y2Ba]建立有监督学习二部图模型,捕捉药物靶点之间的隐含信息,从而基于药物成对相似性识别药物靶点适应症。此外,Tan等人[GydF4y2Ba16GydF4y2Ba[构建了一种药物 - 药物相互作用网络,然后基于作用模式聚集成模块以识别新型药物靶标指示。此外,Luo等人。[GydF4y2Ba17GydF4y2Ba[基于全面相似度量和双随机步行,引入了一种名为MBIRW的新方法,以识别潜在的药物重新定位应用。GydF4y2Ba

第三类涵盖基于机器学习的模型,识别新的毒病相互作用和现有药物的潜在治疗用途。Such models used classification techniques [e.g., Logistic Regression (LR), Naïve Bayesian (NB), Support Vector Machines (SVM), Random Forest (RF)], collaborative filtering [e.g., Matrix Factorization (MF)], and more recently deep learning [e.g., Neural Network (NN), Autoencoder (AE)] for binary classification, multiclass classification, and values prediction. For instance, Gottlieb et al. [18GydF4y2Ba, Yang和Agarwal [GydF4y2Ba19GydF4y2Ba],Wang等人。[GydF4y2Ba20GydF4y2Ba],哦等人。[GydF4y2Ba21GydF4y2Ba]分别采用LR,RF,SVM和NB来预测药物重新定位候选者。此外,Ozsoy等人。[GydF4y2Ba22GydF4y2Ba]基于帕累托支配和协作滤波的推荐系统,以识别毒性疾病协会。在邻居药物中共享的疾病用于推断出现有药物的潜力和新颖的适应症。此外,Luo等人。[GydF4y2Ba23GydF4y2Ba]介绍了一种基于奇异值阈值算法的药物重新定位推荐系统(DRRS),用于识别异构药物疾病网络中的药物重新定位候选对象。最近,Liu等人[GydF4y2Ba24GydF4y2Ba],张等[GydF4y2Ba25GydF4y2Ba, Xuan等人[GydF4y2Ba26GydF4y2Ba],和Zhang等。[GydF4y2Ba27GydF4y2Ba]引入NRLMF,CMFDD,DisDrugPred,DRIMC识别候选药物治疗适应症。然而,这些模型都没有充分利用广泛使用的药物和疾病数据源。不解决可能对预测精度产生实质性影响数据中的噪声和冗余的问题。此外,大多数这些方法中已经考虑药物和疾病的相似性信息。此外,这些车型都无法克服的高度倾斜的金标准药物 - 疾病交互信息的问题。GydF4y2Ba

在这项研究中,一个综合框架,SNF-NN,其通过使用相似性度量,相似性选择,相似网络融合(SNF),以及神经网络(NN)深学习模式,提高药物 - 疾病相互作用的预测精度,并预测新颖药物相互作用的疾病。使用已知的药物相互作用的疾病,并从不同的药物相关的和疾病相关的信息的数据集生成的非常丰富的异构相似信息时,执行新的相互作用的预测。材料部分将讨论在这项研究中所使用的数据集。SNF-NN的各部分在方法部分中描述。在结果和讨论部分,所提出的稳健性是通过比较其与基准性能以及国家的最先进的机器学习模型验证。在预测新型药物 - 疾病相互作用进一步证明SNF-NN的效率,预测未知的药物 - 疾病相互作用对临床试验和已发表的研究验证。GydF4y2Ba

方法GydF4y2Ba

使用三个基准数据集验证SNF-NN的鲁棒性。每个基准数据集包括已知的药物-疾病相互作用、药物相关的相似信息类型以及疾病相关的相似信息类型。第一个被称为SND的基准数据集与两个数据集(即CDATA集)一起组装和使用[GydF4y2Ba17GydF4y2Ba]及LRSSL [GydF4y2Ba28GydF4y2Ba],在以前的研究中使用[GydF4y2Ba17GydF4y2Ba那GydF4y2Ba23GydF4y2Ba那GydF4y2Ba26GydF4y2Ba那GydF4y2Ba27GydF4y2Ba那GydF4y2Ba28GydF4y2Ba].GydF4y2Ba

其中,每个数据集的药物-疾病相互作用用一个二进制矩阵表示GydF4y2Ba\(在r ^ {\; m \ times n} \)GydF4y2Ba,在那里GydF4y2BamGydF4y2Ba和GydF4y2BaN.GydF4y2Ba分别是特定数据集中检索到的药物数量和疾病数量。条目GydF4y2Ba\({Y_ IJ} \在{0,1} \)GydF4y2Ba如果药物无效,则设置为1GydF4y2Ba\ (r_i \)GydF4y2Ba治疗习惯用于治疗表明疾病GydF4y2Ba\(d_j \)GydF4y2Ba, 除此以外GydF4y2Ba\(y_ {ij} \)GydF4y2Ba如果之间的相互作用,则设置为0GydF4y2Ba\ (r_i \)GydF4y2Ba和GydF4y2Ba\(d_j \)GydF4y2Ba是未知的。GydF4y2Ba

每个数据集中的药物相关的相似性类型由一组二进制邻接矩阵表示GydF4y2BaSRGydF4y2Ba,每个二进制邻接矩阵GydF4y2Ba\(sr \在r ^ {\; m \ times m} \)GydF4y2Ba, 和GydF4y2BamGydF4y2Ba是所有与药物相关的相似类型中药物的不同数量。条目的值GydF4y2Ba\(sr_ {ij} \在[0,1] \中)GydF4y2Ba量化药物之间的相似性GydF4y2Ba\ (r_i \)GydF4y2Ba和GydF4y2Ba\(r_j \)GydF4y2Ba,其中1表示完全相似,0表示绝对不同。为了处理同一数据集中的药物同义词和/或跨不同的数据集,药物化学,通用或商业名称被映射到他们的药物银行的加入号码(DBans)。此映射必须使用同义词合并药物的记录。GydF4y2Ba

每个数据集中与疾病相关的相似类型由一组二元邻接矩阵表示GydF4y2BaSDGydF4y2Ba,每个二进制邻接矩阵GydF4y2Ba在R ^ {\ (sd \ \;n \ n} \)GydF4y2Ba, 和GydF4y2BaN.GydF4y2Ba是所有与疾病相关的相似性类型的孤立的疾病。条目的值GydF4y2Ba\ (sd_在[0,1]{ij} \ \)GydF4y2Ba量化疾病之间的相似性GydF4y2Ba\(d_i \)GydF4y2Ba和GydF4y2Ba\(d_j \)GydF4y2Ba,其中1表示完全相似,0表示绝对不同。为了处理疾病的同义词,将疾病名称映射到它们的UMLS的概念唯一标识符(CUI),并合并具有同义词的疾病记录。GydF4y2Ba

关于基准数据集的更多细节见表1GydF4y2Ba1GydF4y2Ba.GydF4y2Ba

表1基准数据集的详细信息GydF4y2Ba

SND基准数据集GydF4y2Ba

SND基准数据集来自各种生物和生物医学数据源。它由三种不同类型的信息组成,即药物-疾病相互作用数据、药物相关相似度数据和疾病相关相似度数据。GydF4y2Ba

从两个广泛使用的数据来源收集药物疾病交互数据(即金标准数据),即药物银行[GydF4y2Ba29GydF4y2Ba]和回报[GydF4y2Ba30GydF4y2Ba]. 金标准数据包括867种FDA批准的药物、803种疾病和8684种临床报告和/或实验验证的药物-疾病相互作用,稀疏度为98.75%。GydF4y2Ba

与药物相关的相似性数据具有10个网络,基于以下:(1)靶蛋白质相互作用,(2)副作用,(3)化学结构,(4)去分子函数,(5)去生物过程,(6)去细胞组分,(7)代谢酶,(8)蛋白质序列,(9)解剖治疗化学分类码,(10)药物成对相互作用。GydF4y2Ba

疾病相关的相似性数据有14个网络,基于:(1)控制基因,(2)HPO基因,(3)基于文献的基因,(4)控制变异体,(5)基于文献的变异体,(6)微RNA,(7)长非编码RNA,(8)HPO表型,(9)IS-A分类学,(10)信息论相似性,(11)GO术语,(12)隐性语义相似性,(13)语义和基因功能,以及(14)策划的关联类型本体。GydF4y2Ba

附加文件中提供了有关毒品相关和疾病相关的相似性数据的进一步细节GydF4y2Ba1GydF4y2Ba.提供了所有相似性和交互矩阵GydF4y2Bahttp://pages.cpsc.ucalgary.ca/ tnjarada / snf-nn.phpGydF4y2Ba.GydF4y2Ba

Cdataset基准数据集GydF4y2Ba

Cdataset基准数据集是从之前的一项研究中检索的[GydF4y2Ba17GydF4y2Ba].它由三种不同类型的信息组成,即药物-疾病相互作用数据、药物相关相似度数据和疾病相关相似度数据。GydF4y2Ba

毒性疾病相互作用数据包括药物业库中列出的593名FDA批准的药物[GydF4y2Ba29GydF4y2Ba],在在线孟德尔遗传(OMIM)中登记的313种疾病,以及1933种已知的药物-疾病相互作用,稀疏度为98.96%。GydF4y2Ba

药物相关的相似性数据包括基于化学结构的一个网络。规范简化的分子输入线进入系统(微笑)[GydF4y2Ba31GydF4y2Ba]从药物银行数据库中提取[GydF4y2Ba29GydF4y2Ba].使用CDK计算药物两两相似度[GydF4y2Ba32GydF4y2Ba]和tanimoto得分[GydF4y2Ba33GydF4y2Ba] 2-D化学指纹。GydF4y2Ba

疾病相关的相似性数据基于从OMIM数据库获得的人类表型的一个网络[GydF4y2Ba34GydF4y2Ba].疾病配对相似使用主题词[计算GydF4y2Ba35GydF4y2Ba]以及本文引入的语义相似度度量[GydF4y2Ba36GydF4y2Ba].GydF4y2Ba

LRSSL基准数据集GydF4y2Ba

LRSSL基准数据集获取本文[GydF4y2Ba28GydF4y2Ba].它由三种不同类型的信息组成,即药物-疾病相互作用数据、药物相关相似度数据和疾病相关相似度数据。GydF4y2Ba

fda批准的763种药物与681种疾病之间的药物-疾病相互作用数据为3051例,稀疏度为99.41%。GydF4y2Ba

药物相关的相似性数据包含基于(1)化学结构的三个网络,(2)靶蛋白域,(3)去靶蛋白注释。从Pubchem数据库中检索药物的药物化学指纹[GydF4y2Ba37GydF4y2Ba].药物靶蛋白的蛋白结构域是从InterPro的蛋白质家族数据库中提取[GydF4y2Ba38GydF4y2Ba].GO的分子功能和靶蛋白的生物过程术语从UNIPROT数据库中提取[GydF4y2Ba39GydF4y2Ba].GydF4y2Ba

与疾病相关的相似性数据包括一种基于从OMIM数据库检索的人类表型的网络[GydF4y2Ba34GydF4y2Ba].病的成对相似性是使用MimMiner语义相似性度量[计算GydF4y2Ba36GydF4y2Ba].GydF4y2Ba

方法GydF4y2Ba

问题描述GydF4y2Ba

一组毒品GydF4y2Ba\(R={R_1,R_2,\ldots,R_m}\)GydF4y2Ba和一套疾病GydF4y2Ba(D = {d_1,d_2,\ldots,d_n})GydF4y2Ba定义为GydF4y2BamGydF4y2Ba和GydF4y2BaN.GydF4y2Ba是药物的数量GydF4y2BaR.GydF4y2Ba和疾病中GydF4y2BaD.GydF4y2Ba, 分别。为了GydF4y2BaR.GydF4y2Ba我们定义基于不同的药物有关的数据集和药物之间的一组相似的邻接矩阵GydF4y2BaSRGydF4y2Ba,在那里GydF4y2Ba\(sr = {sr_1,sr_2,\ ldots,sr_k} \)GydF4y2Ba和GydF4y2BaK.GydF4y2Ba是药物相关数据集的数量。每个药物相似性邻接矩阵的尺寸是GydF4y2Ba\(m \乘以m\)GydF4y2Ba; 哪里GydF4y2BamGydF4y2Ba是跨越不同的药物数量GydF4y2BaK.GydF4y2Ba与药物相关的数据集和GydF4y2Ba\(SR_A(R_U,R_W)\)GydF4y2Ba表示这对药物的用量GydF4y2Ba\(r_u \)GydF4y2Ba和GydF4y2Ba\(r_w \)GydF4y2Ba都是一样的基础上与毒品有关的数据集GydF4y2Ba一种GydF4y2Ba.所有的价值观GydF4y2BaSRGydF4y2Ba相似性邻接矩阵在[0,1]的范围内,其中0表示绝对不同,1表示一对药物之间的完美相似性。同样,让一组疾病之间的相似性邻接矩阵,GydF4y2BaD.GydF4y2Ba,基于与不同的疾病相关的数据集定义GydF4y2BaSDGydF4y2Ba,在那里GydF4y2Ba\(sd = {sd_1,sd_2,\ ldots,sd_l} \)GydF4y2Ba在哪里GydF4y2BaL.GydF4y2Ba是与疾病相关的数据集的数量。每个疾病相似性邻接矩阵的维数为GydF4y2Ba\(n \ times n \)GydF4y2Ba; 哪里GydF4y2BaN.GydF4y2Ba是整个疾病的数量GydF4y2BaL.GydF4y2Ba与疾病相关的数据集。的价值GydF4y2Ba\(sdÈb(dÈx,dÈz)\)GydF4y2Ba说明这对病有多严重GydF4y2Ba\ (d_x \)GydF4y2Ba和GydF4y2Ba\(d_z \)GydF4y2Ba是基于疾病相关的数据集GydF4y2BaB.GydF4y2Ba.在所有的值GydF4y2BaSDGydF4y2Ba相似性邻接矩阵在[0,1]的范围内,其中0表示绝对不相似,1表示两种疾病之间的完全相似。接下来,这组药物之间的相互作用GydF4y2BaR.GydF4y2Ba以及一系列的疾病GydF4y2BaD.GydF4y2Ba被定义为二进制矩阵GydF4y2BayGydF4y2Ba的维度GydF4y2Ba\(m乘以n\)GydF4y2Ba其中GydF4y2Ba\ (y_ {ij} = 1 \)GydF4y2Ba假药GydF4y2Ba\ (r_i \)GydF4y2Ba与疾病相互作用GydF4y2Ba\(d_j \)GydF4y2Ba, 和GydF4y2Ba\ (y_ {ij} = 0 \)GydF4y2Ba如果没有已知的药物证明GydF4y2Ba\ (r_i \)GydF4y2Ba与疾病相互作用GydF4y2Ba\(d_j \)GydF4y2Ba.考虑到矩阵GydF4y2BayGydF4y2Ba,以及两组矩阵GydF4y2BaSRGydF4y2Ba和GydF4y2BaSDGydF4y2Ba,目的是预测新的药物疾病相互作用GydF4y2BayGydF4y2Ba.GydF4y2Ba

SNF-NN方法的描述GydF4y2Ba

SNF-NN方法作为一种新方法,通过利用药物相关的相似性信息,疾病相关的相似性和已知的药物疾病相互作用,对毒性疾病相互作用发现提供洞察力。SNF-NN集成了相似度测量,相似性选择,相似性网络融合(SNF)和神经网络(NN),并进行了非线性分析,提高了药物疾病相互作用预测精度。GydF4y2Ba

SNF-NN方法由四个步骤组成。In the first step, it acquires drug-related information (e.g., drug-target proteins, drug-chemical structures, drug-side effects), disease-related information (e.g., disease-gene associations, disease-miRNA associations, disease phenotypes), and known drug-disease interactions information from various sources. Next, it leverages the most literature-recognized similarity measure for each drug-related or disease-related information type to calculate pairwise drug or disease similarity for that specific drug-related or disease-related information type. Furthermore, it calculates the Gaussian Interaction Profile (GIP) similarity for drug pairs and disease pairs based on the known drug-disease interactions. In the second step, it uses a heuristic process to select the most insightful and less redundant subset of drug and disease similarity types. In the third step, it utilizes a non-linear similarity network fusion method to integrate the vetted drug and disease similarity types. In the fourth step, it initially performs a Cartesian product on the fused drug and disease similarity information concatenating the feature vectors of each drug-disease pair. Finally, it feeds the concatenated feature vectors and known drug-disease interactions to a multi-layer neural network to predict novel interactions between input drug-disease pairs. The overall workflow of the SNF-NN approach is shown in Fig.1GydF4y2Ba.GydF4y2Ba

图1GydF4y2Ba
图1GydF4y2Ba

SNF-NN方法的整体工作流程GydF4y2Ba

计算相似性度量GydF4y2Ba

计算每个药物相关和疾病相关数据集的两两相似度,以量化每个药物对或疾病对之间的共享特征。对于每种药物相关和疾病相关的信息类型采用了文献中公认的最多的相似度度量。药物与疾病的两两相似值在一对药物或疾病之间的范围[0,1],其中0表示相似度最小,1表示相似度最大。此外,我们还假设,在已知的药物-疾病相互作用中,与疾病相互作用的一对药物对新疾病的作用也类似。同样,假设已知的药物与疾病相互作用的一对疾病在被新药治愈后也会表现出相同的行为。因此,利用药物-疾病相互作用信息计算高斯相互作用谱核[GydF4y2Ba40GydF4y2Ba]药物对或疾病对之间的个人资料相似性。GydF4y2Ba

每种药物GydF4y2BaR.GydF4y2Ba在药物-疾病相互作用数据集中,用数据集中疾病的二元特征向量表示GydF4y2BaFGydF4y2Ba(GydF4y2BaR.GydF4y2Ba),其中疾病相互作用的不存在或存在分别由0或1编码。同样,每种疾病GydF4y2BaD.GydF4y2Ba在药物疾病相互作用中,数据集由数据集中的药物的二元特征向量表示GydF4y2BaGGydF4y2Ba(GydF4y2BaD.GydF4y2Ba),其中药物相互作用的存在或不存在是通过0或1,分别编码。成对药物和疾病简档的相似性值是通过由平均每药物和药物相互作用每疾病疾病的相互作用,分别除以归一化。GydF4y2Ba

$$ \ {开始对准}&SR _ {(GIP)}(R_A,R_B)= EXP \大(\压裂{ - \ tau蛋白米{|| F(R_A)-f(R_B)||} ^ 2} {\总和_ {i = 1} ^ {米} {{| F(R_I)|} ^ 2}} \大),\\&SD _ {(GIP)}(D_A,D_B)= EXP \大(\压裂{ -\ tau蛋白N {||克(D_A)-g(D_B)||} ^ 2} {\总和_ {J = 1} ^ {N} {{| G(D_J)|} ^ 2}} \大)\ {端对齐} $$GydF4y2Ba

参数在哪里GydF4y2Ba\(\ tau蛋白\)GydF4y2Ba控制核心带宽,GydF4y2BamGydF4y2Ba和GydF4y2BaN.GydF4y2Ba是药物疾病相互作用数据集的药物和疾病总数,GydF4y2Ba\(| f(r|i)|\)GydF4y2Ba对于药物相互作用的疾病的人数GydF4y2Ba\ (r_i \)GydF4y2Ba那GydF4y2Ba\(| g(d_j)| \)GydF4y2Ba是疾病的药物相互作用的数量吗GydF4y2Ba\(d_j \)GydF4y2Ba.这里,GydF4y2Ba\(\ tau蛋白\)GydF4y2Ba简单地设置为1,如van laarhoven等人所示。[GydF4y2Ba40GydF4y2Ba].GydF4y2Ba

相似性选择GydF4y2Ba

SNF-NN适用于任何与药物相关和疾病相关的相似类型。然而,在尝试整合这些不同的相似类型时,这种药物相关和疾病相关的相似性类型的质量,丰富性和相关性是必不可少的。数据不一致和冗余可能导致综合药物相关的相似性矩阵中的噪声。因此,我们使用由Olayan等人引入的有效方法。[GydF4y2Ba41GydF4y2Ba],以选择信息量最大、见解最深刻、冗余较少的药物相似性度量子集组合。该启发式相似性选择过程包括四个步骤,并在[GydF4y2Ba42GydF4y2Ba].GydF4y2Ba

相似网络融合GydF4y2Ba

这一步的目标是将上一步中信息量大且冗余少的相似矩阵集成到一个全面的药物相似矩阵中,该矩阵捕获来自相似矩阵集合的共享信息和任何互补知识。因此,给定一组药物相似度矩阵,我们使用Wang等人提出的相似度网络融合方法构造融合相似度矩阵[GydF4y2Ba43GydF4y2Ba].给定一组药物相似性矩阵,SNF方法使用基于消息传递理论的迭代非线性过程,将给定集合整合到一个综合矩阵中。SNF迭代地应用K到最近邻居(KNN)算法将每个药物相似性矩阵与来自其他药物相似性矩阵的信息一起更新,直到获得代表尽可能良好的药物相似性矩阵的药物相似性矩阵。GydF4y2Ba

由于在上一步选择的药物相关和疾病相关的相似矩阵的子集,这一步的目的是将这些选择相似矩阵整合成两个综合相似矩阵药物和疾病。因此,给定一组的药物和疾病的多个相似度矩阵,分别迭代非线性相似网络融合过程被施加到构造两个稠合的药物 - 药物和疾病的疾病相似性矩阵,分别。这些两个稠合的相似性矩阵捕获来自跨药物和疾病的相似性矩阵的共享信息和任何补充的知识,分别。GydF4y2Ba

神经网络模型GydF4y2Ba

神经网络结构定义可以对神经网络模型的预测性能产生显着影响。作为一种有效的神经网络结构,前馈多层Perceptron网络类型最近在计算生物学领域获得了广泛的关注。这种神经网络中的信息只能在一个方向上移动,从输入层向输出层向前移动到输出层;因此,网络中没有周期或环路。输入层包含神经网络的初始数据;隐藏层是中间层,其中所有计算发生,输出层产生给定数据输入的结果。神经网络中的每层由许多计算神经元或单位组成。神经元在下一层中连接到一组神经元。每个神经元具有重量值,其可以定义为神经元对下一层的神经元的影响。每个神经元的输入值都乘以神经元的权重,以获得通过传递到下一个图层的神经元的输出值。 The performance and speed of learning of a neural network model are highly dependent on the number of hidden layers, along with the number of neurons in each hidden layer. Herein, a fully connected feed-forward multi-layer perceptron network model is introduced to further improve the accuracy of predicting drug-disease interactions in a deep-learning manner.

为了实现最佳的整体准确性,执行繁琐的过程来调整深神经网络模型的各种超公数。实际上,隐藏层的数量,每层神经元的数量,每个层后面施加的激活函数的类型,以及每层的学习辍学率[GydF4y2Ba44GydF4y2Ba]应指定。此外,其他超参数包括GydF4y2Ba\(\α\)GydF4y2Ba那GydF4y2Ba\(\ beta _1 \)GydF4y2Ba那GydF4y2Ba\(\beta\u 2\)GydF4y2Ba, 和GydF4y2Ba\(\ epsilon \)GydF4y2Ba为亚当优化算法[GydF4y2Ba45GydF4y2Ba]重量和偏差参数[GydF4y2Ba46GydF4y2Ba]、纪元数和批大小可能需要检查。GydF4y2Ba

值得一提的是,每个超参数的重要性取决于训练的数据,有些超参数可能比其他的更重要。例如,调整隐藏层的数量、每一层的神经元数量或学习速率有时会产生巨大的差异。GydF4y2Ba

要决定神经网络体系结构,嵌套交叉验证[GydF4y2Ba47GydF4y2Ba]用于系统地组织超参数调整过程,使其更高效,同时收敛到合适的超参数设置。在不使用嵌套交叉验证的情况下应用hyperparameters优化过程将导致模型过度拟合,因为相同的数据用于优化和评估模型性能。嵌套交叉验证中的超参数调整如下:GydF4y2Ba

  1. (1)GydF4y2Ba

    模型超参数设置为特定值。GydF4y2Ba

  2. (2)GydF4y2Ba

    输入数据集分为三个折叠。GydF4y2Ba

  3. (3)GydF4y2Ba

    使用当前超参数值和两个数据集折叠对模型进行训练。GydF4y2Ba

  4. (4)GydF4y2Ba

    该模型是使用所选择的超参数值和剩余的数据集折叠(试验组)进行试验。GydF4y2Ba

  5. (5)GydF4y2Ba

    重复步骤3和4,直到每个数据集折叠被视为测试集。GydF4y2Ba

  6. (6)GydF4y2Ba

    记录模型性能结果和超级计值的组合。GydF4y2Ba

  7. (7)GydF4y2Ba

    对HyperParameter值的所有组合进行步骤1到6。GydF4y2Ba

  8. (8)GydF4y2Ba

    超参数值的组合将导致选择最佳的整体性能。GydF4y2Ba

以下超参数和相关值被用来对神经网络模型结构决定:GydF4y2Ba

  • 隐藏层数:{1,2,3,4,5}GydF4y2Ba

  • 每个隐藏层中的神经元数量:{100200300400500}GydF4y2Ba

  • 激活功能:GydF4y2Ba

    • 逻辑钝化GydF4y2Ba\(\ sigma(z)= \ frac {1} {1 + e ^ { - z}} \)GydF4y2Ba

    • 双曲线切线GydF4y2Ba\(tanh(z)= \ frac {sinh(z)} {cosh(z)} = \ frac {e ^ zz-e ^ { - z}} {e ^ z + e ^ { - z}} \)GydF4y2Ba

    • 线性整流函数GydF4y2Ba\(Relu(z)= max(0,z)\)GydF4y2Ba

  • 辍学率:{0.3,0.35,0.4。,0.45,0.5}GydF4y2Ba

通过具有300个神经元的4个隐藏层的深神经网络模型实现了最佳性能,每层具有300神经元的漏出率为0.35。整流的线性单元激活功能应用于所有隐藏层中的所有神经元。如预测毒性疾病相互作用是二进制分类问题,逻辑SIGMOID激活函数被施加到输出层,并且二进制交叉熵丢失函数用于计算损耗值。GydF4y2Ba

此外,深度神经网络模型在初始化时产生最佳结果[GydF4y2Ba48GydF4y2Ba用于初始化权重和偏置参数和ADAM优化算法以更新这些参数。如[GydF4y2Ba45GydF4y2Ba],Adam的超参数设置如下:GydF4y2Ba

  • 学习率GydF4y2Ba\((\α )\)GydF4y2Ba:1E-3。GydF4y2Ba

  • 一阶矩估计的指数衰减率GydF4y2Ba\((\ beta _1)\)GydF4y2Ba: 0.9GydF4y2Ba

  • 该指数衰减率的二阶矩估计GydF4y2Ba\((\ beta _2)\)GydF4y2Ba:0.999GydF4y2Ba

  • 数值稳定性的小常数GydF4y2Ba(\ \(ε)\)GydF4y2Ba:1E-7GydF4y2Ba

最后,模型是批量输入的批量输入为100.对于不同的数据集,EPOCH的数量设置为100。所有培训的深度神经网络模型,嵌套交叉验证结果中的封面设置和性能都在附加文件中呈现GydF4y2Ba1GydF4y2Ba.GydF4y2Ba

结果和讨论GydF4y2Ba

数据集GydF4y2Ba

为了评估SNF-NN,从各种资源组装了一个新的基准数据集SND。此外,两个基准数据集,即cdataset [GydF4y2Ba17GydF4y2Ba]及LRSSL [GydF4y2Ba28GydF4y2Ba],以验证所提出的方法。CDATA集和LRSSL数据集用于评估最先进的计算药物重新定位方法[GydF4y2Ba17GydF4y2Ba那GydF4y2Ba23GydF4y2Ba那GydF4y2Ba26GydF4y2Ba那GydF4y2Ba27GydF4y2Ba那GydF4y2Ba28GydF4y2Ba].每个数据集是一种异质网络,包括已知的药物疾病相互作用,药物相似性网络,疾病相似性网络。使用的数据集的统计信息在表中报告GydF4y2Ba1GydF4y2Ba.GydF4y2Ba

评价标准GydF4y2Ba

这里,描述了用于验证SNF-NN的鲁棒性和预测性能的系统评估标准。首先,进行分层的10倍交叉验证,并且SND,CDATASET和LRSSL数据集的每个金标准被分成训练和测试集,以防止对模型性能的任何过乐观的评估。在分层的10倍交叉效应期间,已知的药物疾病相互作用(即阳性关系),其具有匹配数量的未知药物疾病相互作用(即负面关系)被随机分成十套。每个集合具有相同数量的正负关系。在每个交叉验证试验中,又将九集作为训练集被删除,而剩余集表示测试集。以不同的随机种子值重复10倍交叉验证,计算平均性能,以避免任何高方差和偏置的交叉验证评估。GydF4y2Ba

在实践中,通过观察深度神经网络模型在学习/训练过程中的表现,可以学到很多关于深度神经网络模型的知识。对于每个epoch,记录模型训练指标(即准确性和损失),并创建两个图来描述训练模型的学习过程。这两个图提供了对模型学习过程的洞察,比如它在各个时代的收敛速度,以及它是否已经收敛。GydF4y2Ba

随后,计算混淆矩阵评估度量。这些度量是真正的正(TP),True负(TN),假正(FP)和假阴性(Fn)。要将事物放入透视图中,TP表示正确预测的已知RDI,而TN表示由模型正确预测的未知RDI。然而,FP表示预测的未知RDI,并且Fn表示未被模型预测的已知RDI。准确性 (GydF4y2BaACC.GydF4y2Ba)、特异性(GydF4y2Ba规格GydF4y2Ba), 精确 (GydF4y2Ba预处理GydF4y2Ba), 记起 (GydF4y2BarecGydF4y2Ba),以及F1-得分(GydF4y2BaFGydF4y2Ba1)评价度量计算的性能比较。GydF4y2Ba

$ ${对齐}acc = \ \开始压裂{TP + TN} {TP + TN + FP + FN} \ \规范= \压裂{TN} {TN + FP} \ \ prec = \压裂{TP} {TP + FP} \ \ rec = \压裂{TP} {TP + FN} \ \ f1 = 2 \ \压裂{精密\ *回忆}{精度+回忆}\{对齐}$ $GydF4y2Ba

此外,Matthews相关系数(GydF4y2BaMCC.GydF4y2Ba)被采用来评估所提出的模型。GydF4y2BaMCC.GydF4y2Ba广泛应用于二进制分类机学习模型的生物信息学领域[GydF4y2Ba49GydF4y2Ba]. 这个GydF4y2BaMCC.GydF4y2Ba定义如下:GydF4y2Ba

$$\begin{aligned}MCC=\frac{TP\times TN-FP\times FN}{\sqrt{(TP+FP)(TP+FN)(TN+FP)(TN+FN)}\end{aligned}$$GydF4y2Ba

此外,曲线 - 接收器操作员特征下的区域(GydF4y2Ba\(AUC-ROC\)GydF4y2Ba)和曲线下的区域 - 精密召回(GydF4y2Ba\(AUC-PR\)GydF4y2Ba)用作主要性能评估度量。GydF4y2Ba\(AUC-ROC\)GydF4y2Ba显示真正的正面(即,正确预测的已知RDI)和错误阳性(即错误预测的未知RDI)之间的权衡,最终给出了模型成功的分类率。然而,GydF4y2Ba\(AUC-PR\)GydF4y2Ba在处理超过98.5%稀疏性的高度倾斜的金标准数据集时,提供更丰富的模型性能图片[GydF4y2Ba50GydF4y2Ba].GydF4y2Ba

三个基准数据集(即,SND,CDATASET,LRSSL)和上述八个评估度量(即,GydF4y2BaACC.GydF4y2Ba那GydF4y2Ba规格GydF4y2Ba那GydF4y2Ba预处理GydF4y2Ba那GydF4y2BarecGydF4y2Ba那GydF4y2BaFGydF4y2Ba1.GydF4y2BaMCC.GydF4y2Ba那GydF4y2Ba\(AUC-ROC\)GydF4y2Ba那GydF4y2Ba\(AUC-PR\)GydF4y2Ba)来评估SNF-NN模型的各个方面的性能。GydF4y2Ba

通过将其性能与九种基线机学习分类模型进行比较,即StageWise添加剂多级建模指数(SAMME)丢失函数来验证SNF-NN模型的有效性GydF4y2Ba51GydF4y2Ba],决策树(DT)GydF4y2Ba52GydF4y2Ba],基于拉普拉斯近似的高斯过程分类(GPC)[GydF4y2Ba53GydF4y2Ba],k - 最近的邻居(knn)[GydF4y2Ba54GydF4y2Ba],高斯朴素贝叶斯(GNB)GydF4y2Ba55GydF4y2Ba],二次判别分析(QDA)[GydF4y2Ba56GydF4y2Ba]、随机森林(RF) [GydF4y2Ba57GydF4y2Ba]线性支持向量机(SVM)和径向基函数(RBF)支持向量机[GydF4y2Ba58GydF4y2Ba].为了公平比较,将上一节所述的相似性选择与融合应用于所有与药物和疾病相关的相似性信息类型,并将集成的药物和疾病相似性矩阵作为基线方法的输入。值得注意的是,这些模型的参数对其性能有很大的影响。因此,对每个模型的参数进行了调优,并报告了最佳性能。使用所有的基准数据集和评价指标与9个基准模型进行比较。GydF4y2Ba

SNF-NN方法的鲁棒性通过与用于药物-疾病相互作用预测的五种最先进的机器学习方法(即MBiRW)的性能进行比较来验证[GydF4y2Ba17GydF4y2Ba],SCMFDD [GydF4y2Ba25GydF4y2Ba],DRRS [GydF4y2Ba23GydF4y2Ba],DISCRUGPRED [GydF4y2Ba26GydF4y2Ba]和DRIMC [GydF4y2Ba27GydF4y2Ba]. 此外,两种最先进的基于矩阵分解的药物-疾病相互作用预测方法(即KBMF[GydF4y2Ba59GydF4y2Ba]和nrlmf [GydF4y2Ba24GydF4y2Ba])也包括在比较中。值得注意的是,先前使用CDATASET和LRSSL基准数据集进行评估七种最先进的模型[GydF4y2Ba27GydF4y2Ba].因此,相同的基准数据集用于公平地评估七种最先进方法的SNF-NN。这GydF4y2Ba\(AUC-ROC\)GydF4y2Ba和GydF4y2Ba\(AUC-PR\)GydF4y2Ba用作评估指标。GydF4y2Ba

最后,通过验证预测的未知药物疾病相互作用(即假阳性相互作用)来验证SNF-NN方法预测新型毒性疾病相互作用的能力,以反对最新的临床试验研究和药品指示资源GydF4y2BaClinicaltrials.gov.GydF4y2Ba[GydF4y2Ba60GydF4y2Ba],GydF4y2Ba劳动银行GydF4y2Ba[GydF4y2Ba29GydF4y2Ba], 和GydF4y2BaPubMedGydF4y2Ba[GydF4y2Ba61GydF4y2Ba].GydF4y2Ba

评价结果GydF4y2Ba

培训过程中的SNF-NN性能GydF4y2Ba

SNF-NN在训练过程中的性能是使用准确度和损失度量来捕获的,在训练期间,三个基准数据集中的每个数据集都有两个图。GydF4y2Ba

图形GydF4y2Ba2GydF4y2Ba显示SND,CDATASET和LRSSL基准数据集训练集的模型准确性。注意到,在前20个时期,所有基准数据集的准确性趋势跳跃到0.85以上,这意味着深度神经网络模型正在快速学习。此外,最后一次时期的精度趋势似乎是稳定的,这意味着所选择的时期的数量是合适的,并且不再接受SNF-NN方法。GydF4y2Ba

图形GydF4y2Ba3.GydF4y2Ba分别显示了SND、Cdataset和LRSSL基准数据集训练集上的模型丢失。研究发现,各基准数据集的损失趋势迅速减小,这意味着深度神经网络模型快速逼近局部最小值。最后一个epoch的损失趋势是稳定的,这意味着选择的epoch数量是合适的,SNF-NN方法不能再训练了。GydF4y2Ba

图2GydF4y2Ba
figure2GydF4y2Ba

SNF-NN培训SND,CDATASET和LRSSL数据集的培训精度GydF4y2Ba

图3GydF4y2Ba
图3GydF4y2Ba

训练集SND,Cdataset和LRSSL数据集的SNF-NN损失GydF4y2Ba

基线机学习模型的SNF-NN性能比较GydF4y2Ba

SNF-NN的总体可靠性和有效性通过针对9台广泛使用基线机器学习模型评价其性能研究(即,SAMME,DT,GPC,KNN,GNB,QDA,RF,线性SVM,RBF-SVM)。与基线方法SNF-NN的性能的比较是使用上的三个基准数据集(即,SND,Cdataset,LRSSL)分层10倍交叉验证。基于所有评价指标的比较结果来定义此前列在表GydF4y2Ba2GydF4y2Ba那GydF4y2Ba3.GydF4y2Ba, 和GydF4y2Ba4.GydF4y2Ba.上一节中描述的相似性选择和融合应用于与每个基准数据集中的药物相关和疾病相关的相似性信息类型,并且融合相似度矩阵用作基线方法的输入。GydF4y2Ba

如表所示GydF4y2Ba2GydF4y2Ba,SNF-NN优于SND基准数据集上的所有基线方法,在大多数评估度量方面具有显着差异(GydF4y2BaACC.GydF4y2Ba= 0.796,GydF4y2BarecGydF4y2Ba= 0.816,GydF4y2BaFGydF4y2Ba1 = 0.800,GydF4y2BaMCC.GydF4y2Ba= 0.593,GydF4y2Ba\(AUC-ROC\)GydF4y2Ba= 0.867,和GydF4y2Ba\(AUC-PR\)GydF4y2Ba= 0.876)。GydF4y2Ba

此外,结果在表GydF4y2Ba3.GydF4y2Ba证明了SNF-NN在CDATA集基准数据集上的性能优于所有机器学习方法,且与大多数评估指标相比差异很大(GydF4y2BaACC.GydF4y2Ba= 0.783,GydF4y2BaFGydF4y2Ba1 = 0.790,GydF4y2BaMCC.GydF4y2Ba= 0.569,GydF4y2Ba\(AUC-ROC\)GydF4y2Ba= 0.879,和GydF4y2Ba\(AUC-PR\)GydF4y2Ba= 0.856).GydF4y2Ba

此外,表格GydF4y2Ba4.GydF4y2Ba验证所提出的方法对LRSSL基准数据集的整体性能,几乎所有评估指标都有显着差异(GydF4y2BaACC.GydF4y2Ba= 0.846,GydF4y2Ba预处理GydF4y2Ba= 0.821,GydF4y2BarecGydF4y2Ba= 0.793,GydF4y2BaFGydF4y2Ba1 = 0.807,GydF4y2BaMCC.GydF4y2Ba= 0.617,GydF4y2Ba\(AUC-ROC\)GydF4y2Ba= 0.936,GydF4y2Ba\(AUC-PR\)GydF4y2Ba= 0.903)。GydF4y2Ba

虽然这一点GydF4y2Ba规格GydF4y2Ba度量被定义为评价机器学习方法在预测负关系(即没有RDIs)方面的性能,SNF-NN主要预测正关系(即新的RDIs)。因此,SNF-NN在该方面没有最高的性能并不显著GydF4y2Ba规格GydF4y2Ba评价指标。GydF4y2Ba

最后,值得强调的是GydF4y2BaFGydF4y2Ba1个度量被定义为谐波的平均值GydF4y2Ba预处理GydF4y2Ba和GydF4y2BarecGydF4y2Ba;因此,SNF-NN没有相对于的最高性能并不令人惊讶GydF4y2Ba预处理GydF4y2Ba和GydF4y2BarecGydF4y2Ba当它有最好的GydF4y2BaFGydF4y2Ba1个值。GydF4y2Ba

表2 SNF-NN在SND基准数据集上与基线机器学习方法的性能比较GydF4y2Ba
表3 CDATA集基准数据集上SNF-NN与基线机器学习方法的性能比较GydF4y2Ba
表4 LRSSL基准数据集上SNF-NN与基线机器学习方法的性能比较GydF4y2Ba

SNF-NN性能与最先进的药物疾病相互作用预测模型的比较GydF4y2Ba

通过评估SNF-NN与7个最先进的药物-疾病相互作用预测模型(即KBMF)的性能,验证了SNF-NN的稳健性[GydF4y2Ba59GydF4y2Ba],nrlmf [GydF4y2Ba24GydF4y2Ba],mbirw [GydF4y2Ba17GydF4y2Ba],DRRS [GydF4y2Ba23GydF4y2Ba],SCMFDD [GydF4y2Ba25GydF4y2Ba],DISCRUGPRED [GydF4y2Ba26GydF4y2Ba]和DRIMC [GydF4y2Ba27GydF4y2Ba]. 这个comparison of SNF-NN performance with state-of-the-art models is conducted using stratified 10-fold cross-validation on the Cdataset and LRSSL benchmark datasets. Herein, it is important to highlight that the seven state-of-the-art models were previously evaluated using both Cdataset and LRSSL benchmark datasets and the the\(AUC-ROC\)GydF4y2Ba和GydF4y2Ba\(AUC-PR\)GydF4y2Ba评估指标[GydF4y2Ba27GydF4y2Ba]. 比较结果如表所示GydF4y2Ba5.GydF4y2Ba和GydF4y2Ba6.GydF4y2Ba.GydF4y2Ba

如表所示GydF4y2Ba5.GydF4y2Ba,SNF-NN超过CDATA基准数据集上所有七种最先进的模型(GydF4y2Ba\(AUC-ROC\)GydF4y2Ba= 0.879,和GydF4y2Ba\(AUC-PR\)GydF4y2Ba= 0.856),差异显著为55.5%GydF4y2Ba\(AUC-PR\)GydF4y2Ba公制。GydF4y2Ba\(AUC-PR\)GydF4y2Ba在处理高度倾斜的数据集时,是一个功能强大且信息丰富的度量[GydF4y2Ba50GydF4y2Ba].GydF4y2Ba

此外,表格GydF4y2Ba6.GydF4y2Ba通过在LRSSL基准数据集上验证其性能来确认提出的方法的稳健性。SNF-NN通过改善来实现卓越的性能GydF4y2Ba\(AUC-ROC\)GydF4y2Ba2.8%,和GydF4y2Ba\(AUC-PR\)GydF4y2Ba由56.7%,这表明SNF-NN的在高度偏斜黄金标准数据集预测新颖药物疾病相互作用可靠性和有效性。GydF4y2Ba

表5 SNF-NN与最先进模型的性能比较,用于CDATASET基准数据集上的毒性疾病交互预测GydF4y2Ba
表6在LRSSL基准数据集上,SNF-NN与最先进的药物-疾病相互作用预测模型的性能比较GydF4y2Ba

SNF-NN的效率预测新型毒性疾病相互作用(重新定位候选人)GydF4y2Ba

虽然计算模型正确预测已知药物-疾病相互作用至关重要,但最重要的任务是确定新的药物-疾病相互作用或假阳性作为重新定位候选。GydF4y2Ba

为了进一步研究所提出的方法的可靠性,将SND数据集的随机选择的五千个未知药物疾病相互作用馈送到SNF-NN模型。SNF-NN模型预测350种与350种药物相关的新型药物疾病相互作用,其中至少五种新的治疗用途与24种药物有关,一种新的治疗用途与194种药物有关。GydF4y2Ba

前五种药物的新药疾病相互作用是针对临床,药物银行或Pubmed的批准临床试验研究验证了批准的临床试验,并发现了实质性证据。在前34个预测的药物疾病相互作用中,25(73.5%)的交互实际上是有效的,但它们在SND基准数据集中未注释。GydF4y2Ba

例如,相互作用GydF4y2BaLoteprednol.GydF4y2Ba药物和GydF4y2Ba干眼综合征GydF4y2Ba在所提出的模型预测它的同时,在SND金标准数据集中未注释。另一个例子是之间的相互作用GydF4y2Ba司帕沙星GydF4y2Ba药物和GydF4y2Ba肺炎克雷伯氏菌引起的肺炎GydF4y2Ba疾病,也是由SNF-NN模型成功识别的。桌子GydF4y2Ba7.GydF4y2Ba介绍SNF-NN预测的前五大药物的新药物-疾病相互作用及其证据来源。此外,SNF-NN预测的所有680种新药物-疾病相互作用的列表在附加文件中报告GydF4y2Ba1GydF4y2Ba.GydF4y2Ba

表7 SNF-NN预测的前五种药物的新型药物疾病相互作用以及其证据来源,其中连字符表明了先前未知的药物疾病相互作用GydF4y2Ba

结论GydF4y2Ba

在本研究中,引入了一种新的基于深度学习的模型,称为SNF-NN,用于预测新的药物-疾病相互作用,利用已知的药物-疾病相互作用,药物相关和疾病相关的相似性信息。用三个基准数据集验证了该方法的有效性。初步计算SNF-NN的准确性和损失趋势,以评价所提出的深度神经网络模型的训练过程。随后,通过与9种基线机器学习方法以及7种最先进的药物-疾病相互作用预测模型的性能比较,验证了SNF-NN的可靠性和鲁棒性。虽然由于缺乏已知的相互作用,预测新的RDIs是一个非常具有挑战性的问题,但SNF-NN的评价指标值明显高于其他方法GydF4y2Ba\(AUC-ROC\)GydF4y2Ba范围从0.879到0.931和GydF4y2Ba\(AUC-PR\)GydF4y2Ba从0.856到0.903。综上所述,本研究的研究结果表明,异质相似网络可用于开发卓越的计算药物再利用方法,这些方法具有出色的性能和改进的可解释性。这些方法可以从整合相似性度量和深度学习模型来预测新的药物-疾病相互作用中显著受益。GydF4y2Ba

可用性数据和材料GydF4y2Ba

支持这项研究结果的数据来自第三方;特别是两个基准数据集,即Cdataset [GydF4y2Ba17GydF4y2Ba]及LRSSL [GydF4y2Ba28GydF4y2Ba]已经下载并在本研究中使用过。GydF4y2Ba

参考GydF4y2Ba

  1. 1.GydF4y2Ba

    Wouters OJ,Mckee M,Luyten J。估计的研发投资需要为2009 - 2018年带来新药。贾马。2020; 323(9):844-53。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  2. 2.GydF4y2Ba

    Ashburn Tt,雷神KB。药物重新定位:识别和开发现有药物的新用途。NAT Rev Disp Discov。2004; 3(8):673-83。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  3. 3.GydF4y2Ba

    公共卫生与罕见病:不再是矛盾修辞法。预防慢性疾病2016;13:E05。GydF4y2Ba

    谷歌学术搜索GydF4y2Ba

  4. 4.GydF4y2Ba

    Walters WP,Green J,Weiss JR,Murcko Ma。药用化学家实际上是什么?一个50年的回顾。J Med Chem。2011; 54(19):6405-16。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  5. 5.GydF4y2Ba

    Chong Cr,Sullivan DJ。旧药物的新用途。自然。2007; 448(7154):645-6。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  6. 6.GydF4y2Ba

    Iorio的楼Bosotti R,Scacheri E,贝尔卡斯特罗V,Mithbaokar P,Ferriero R,穆里诺L,Tagliaferri R,Brunetti的-Pierri N,Isacchi A,等人。从转录反应行动和药物重新定位的药物模式探索。PROC NATL ACAD SCI。2010; 107(33):14621-6。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  7. 7.GydF4y2Ba

    Gloeckner C, Garner AL, Mersha F, Oksov Y, Tricoche N, Eubanks LM, Lustigman S, Kaufmann GF, Janda KD。重新定位一种用于治疗被忽视的热带病盘尾丝虫病的现有药物。中国科学院院刊。2010;107(8):3424-9。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  8. 8.GydF4y2Ba

    凯泽MJ,Setola V,欧文JJ,Laggner C,阿巴斯AI,Hufeisen SJ,詹森NH,Kuijer MB,Matos的RC,陈TB,等人。预测已知药物的新分子靶标。自然。2009; 462(7270):175。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  9. 9.GydF4y2Ba

    达德利JT,德斯潘德T,巴特AJ。利用药物-疾病关系进行计算药物重新定位。简短的生物信息。2011;12(4):303–11.GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  10. 10。GydF4y2Ba

    李继,郑S,陈B,Butte Aj,Swamidass Sj,Lu Z.一种计算药物重新定位目前趋势调查。简短生物形式。2015; 17(1):2-12。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  11. 11.GydF4y2Ba

    Jarada TN,Rokne JG,计算药物重新定位的Alhajj R.回顾:策略,方法,机遇,挑战和方向。J Cheminformatics。2020; 12(1):1-23。GydF4y2Ba

    文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  12. 12GydF4y2Ba

    塔里LB,帕特尔JH。系统性药物再利用日粗糙的文本挖掘。在:库马尔V,Tipney H,编辑器。生物医学文献挖掘。分子生物学方法(方法和协议)。纽约,NY:Humana公司出版社。2014; 1159:253-67。GydF4y2Bahttps://doi.org/10.1007/978-1-4939-0709-0_14GydF4y2Ba.GydF4y2Ba

  13. 13GydF4y2Ba

    拉斯特加·莫贾拉德M、埃拉亚维利RK、李德、普拉萨德R、刘H。一种通过基于文献的发现对药物重新定位候选方案进行排序的新方法。2015年:IEEE生物信息学和生物医学国际会议(BIBM)。IEEE;2015年,第页。669–74.GydF4y2Ba

  14. 14GydF4y2Ba

    朱琦、陶聪、沈芙、蔡志强。通过利用网络本体语言(OWL)和化学信息学方法,探索药物基因组学知识库(PharmGKB)以重新定位乳腺癌药物。2014年:生物计算。世界科学杂志;2014年,第页。172–82.GydF4y2Ba

  15. 15GydF4y2Ba

    Li J,Lu Z。使用药物成对相似性计算药物重新定位的新方法。在:2012 IEEE生物信息学和生物医学国际会议。IEEE;2012. p。1-4。GydF4y2Ba

  16. 16GydF4y2Ba

    杨瑞,徐旭,陈旭,王艳,马辉,刘旭,吴旭,陈勇,刘林,等。通过整合化学结构相似性和基因语义相似性生成的“表达谱”进行药物重新定位。摩尔BioSyst。2014; 10(5): 1126 - 38。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  17. 17GydF4y2Ba

    罗H,王家,李米,罗杰,彭X,吴F-X,基于综合相似措施和双随机步行算法的药物重新定位。生物信息学。2016; 32(17):2664-71。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba公共医学中心GydF4y2Ba谷歌学术搜索GydF4y2Ba

  18. 18.GydF4y2Ba

    Gottlieb A,Stein Gy,Ruppin E,Sharan R.预测:一种推断新药指示的方法,适用于个性化药物。MOL SYST BIOL。2011; 7(1):496。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  19. 19.GydF4y2Ba

    杨L,琼脂P.基于临床副作用的系统药物重新定位。Plos一个。2011; 6(12):E28025。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  20. 20。GydF4y2Ba

    王Y,陈S,邓仁,王Y.核心基于核结构,分子活性和表型数据的基于核的整合药物重新定位。Plos一个。2013; 8(11):E78518。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  21. 21。GydF4y2Ba

    哦,安杰,尹伊。一种基于网络的分类模型,用于推导新的药物-疾病关联并评估其分子作用。公共科学图书馆一号。2014;9(10):e111668。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  22. 22。GydF4y2Ba

    Ozsoy MG, Özyer T, Polat F, Alhajj R.通过采用推荐系统处理过程,实现药物重新定位。BMC Bioinform。2018;19(1):136。GydF4y2Ba

    文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  23. 23。GydF4y2Ba

    罗浩,李敏,王胜,刘强,李勇,王军。基于低秩矩阵近似和随机算法的药物重新定位算法。34生物信息学。2018;(11):1904 - 12所示。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  24. 24GydF4y2Ba

    刘y,吴米,苗,赵p,李x-l。邻域正则逻辑矩阵分解,用于药物 - 目标交互预测。PLOS计算BIOL。2016; 12(2):E1004760。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  25. 25GydF4y2Ba

    张伟,岳X,林W,吴W,刘R,黄楼刘F.使用约束相似矩阵分解预测药物 - 疾病的关联。BMC生物素。2018; 19(1):1-12。GydF4y2Ba

    文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  26. 26GydF4y2Ba

    轩P,Cao Y,张T,王X,潘S,通过纳入药物和疾病的预测整合来重新定位。生物信息学。2019; 35(20):4108-19。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  27. 27GydF4y2Ba

    张宽,徐辉,李X,高Q,王L. DRIMC:使用贝叶斯电感矩阵完成改进的药物重新定位的方法。生物信息学。2020; 36(9):2839-47。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  28. 28GydF4y2Ba

    梁X,张P,颜L,富Y,彭楼瞿L,邵呒,陈勇,陈Z. LRSSL:预测和解释药病协会基于使用稀疏子空间,学习数据集成。生物信息学。2017; 33(8):1187至1196年。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba谷歌学术搜索GydF4y2Ba

  29. 29GydF4y2Ba

    Wishart DS、Feunang YD、Guo AC、Lo EJ、Marcu A、Grant JR、Sajed T、Johnson D、Li C、Sayeda Z等。Drugbank 5.0:2018年Drugbank数据库的重大更新。核酸研究2017;46(D1):D1074-82。GydF4y2Ba

    公共医学中心GydF4y2Ba文章GydF4y2BaCASGydF4y2BaPubMedGydF4y2Ba谷歌学术搜索GydF4y2Ba

  30. 30.GydF4y2Ba

    布朗先生,帕特尔·克杰。用于药物重新定位的标准数据库。Sci数据。2017;4:170029.GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  31. 31。GydF4y2Ba

    魏宁格博士。微笑,一种化学语言和信息系统。1.介绍方法和编码规则。化学信息计算机科学杂志。1988;28(1):31–6.GydF4y2Ba

    CASGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  32. 32。GydF4y2Ba

    Steinbeck C,Han Y,Kuhn S,Horlacher O,Luttmann E,Willighagen E.化学开发套件(CDK):用于化学和生物信息学的开源Java库。J Chem Inf Comput SCI。2003; 43(2):493-500。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  33. 33。GydF4y2Ba

    分类与预测的基本数学理论。IBM内部技术报告;1957.GydF4y2Ba

  34. 34。GydF4y2Ba

    Hamosh A,Scott AF,Amberger Js,Bocchini Ca,McKusick VA。在线孟德利亚遗产在人(OMIM),人类基因和遗传遗传学的知识库。核酸RES。2005; 33(LOMP-1):D514-7。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba谷歌学术搜索GydF4y2Ba

  35. 35。GydF4y2Ba

    李普斯科姆。医学主题标题(MeSH)。公牛医学图书馆协会,2000年;88(3):265.GydF4y2Ba

    CASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  36. 36GydF4y2Ba

    Van Driel MA、Bruggeman J、Vriend G、Brunner HG、Leunissen JA。人类现象的文本挖掘分析。我是吉内特。2006;14(5):535–42.GydF4y2Ba

    PubMedGydF4y2Ba文章GydF4y2BaCASGydF4y2Ba公共医学中心GydF4y2Ba谷歌学术搜索GydF4y2Ba

  37. 37GydF4y2Ba

    Kim S,Thiessen Pa,Bolton Ee,Chen J,Fu G,Gindulyte A,Han L,He J,He S,Shoemaker Ba等。Pubchem物质和复合数据库。核酸RES。2015; 44(D1):D1202-13。GydF4y2Ba

    PubMedGydF4y2Ba公共医学中心GydF4y2Ba文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  38. 38GydF4y2Ba

    Mitchell A, Chang H-Y, Daugherty L, Fraser M, Hunter S, Lopez R, mccanulla C, McMenamin C, Nuka G, Pesseat S, et al.;InterPro蛋白家族数据库:15年后的分类资源。核酸Res. 2015;43(D1): D213-21。GydF4y2Ba

    PubMedGydF4y2Ba文章GydF4y2Ba公共医学中心GydF4y2Ba谷歌学术搜索GydF4y2Ba

  39. 39GydF4y2Ba

    T. U. Consortium。UNIPROT:通用蛋白质知识库。核酸RES。2016; 45(D1):D158-69。GydF4y2Ba

  40. 40.GydF4y2Ba

    Van Laarhoven T,Nabuurs SB,Marchiori E.高斯互动谱预测药物目标相互作用。生物信息学。2011; 27(21):3036-43。GydF4y2Ba

    PubMedGydF4y2Ba文章GydF4y2BaCASGydF4y2Ba谷歌学术搜索GydF4y2Ba

  41. 41。GydF4y2Ba

    Olayan RS、Ashoor H、Bajic VB。DDR:使用图形挖掘和机器学习方法预测药物-靶相互作用的有效计算方法。生物信息学。2018;34(7):1164–73.GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  42. 42。GydF4y2Ba

    Jarada TN,罗克恩JG,Alhajj R.Sunf-CVAE:使用相似性网络融合和集体变分性自动化器预测毒性疾病交互的计算方法。基于Knowl的系统。2020; 212:106585。GydF4y2Ba

    文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  43. 43。GydF4y2Ba

    王B、梅兹利尼A、德米尔F、菲姆M、图Z、布鲁德诺M、海贝凯恩斯B、戈登堡A。相似性网络融合,用于在基因组尺度上聚合数据类型。Nat方法。2014;11(3):333.GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  44. 44。GydF4y2Ba

    Dropout:一种防止神经网络过拟合的简单方法。中国机械工程。2014;15(1):1929 - 1958。GydF4y2Ba

    谷歌学术搜索GydF4y2Ba

  45. 45。GydF4y2Ba

    Kingma DP,BA J. ADAM:随机优化的方法。2014. Arxiv预印刷品GydF4y2Baarxiv:1412.6980GydF4y2Ba.GydF4y2Ba

  46. 46。GydF4y2Ba

    Rumelhart de,Hinton Ge,Williams RJ。通过错误传播学习内部表示。技术。代表加州Univ San Diego La Jolla认知科学Inst;1985年。GydF4y2Ba

  47. 47。GydF4y2Ba

    Cawley GC,Talbot NL。在绩效评估中的模型选择和后续选择偏差中的过度拟合。J Mach Learn Res。2010; 11(JUL):2079-107。GydF4y2Ba

    谷歌学术搜索GydF4y2Ba

  48. 48GydF4y2Ba

    他K,张X,任S,Sun J.深入整流器:超越了Imagenet分类的人力水平表现。在:IEEE计算机愿景国际会议的诉讼程序;2015. p。1026-34。GydF4y2Ba

  49. 49GydF4y2Ba

    B. W. Matthews,“T4噬菌体溶菌酶的预测和观察二次结构的比较”GydF4y2Ba生物化学与生物物理学报(BBA)-蛋白质结构GydF4y2Ba,卷。405,没有。2,第442-451,1975。GydF4y2Ba

  50. 50.GydF4y2Ba

    戴维斯J,戈德里奇M。精确回忆与ROC曲线之间的关系。摘自:《第23届机器学习国际会议记录》;2006年,第页。233–40.GydF4y2Ba

  51. 51.GydF4y2Ba

    朱建军,邹海涛。多级多目标优化设计。统计界面。2009;2(3):349 - 60。GydF4y2Ba

    文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  52. 52.GydF4y2Ba

    萨法万SR,决策树分类方法的兰德格里伯D.调查。IEEE Trans Syst Man Cyber​​n。1991; 21(3):660-74。GydF4y2Ba

    文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  53. 53。GydF4y2Ba

    拉斯穆森CE,Nickisch H.高斯过程机器学习(GPML)工具箱。J Mach Learn Res。2010; 11:3011-5。GydF4y2Ba

    谷歌学术搜索GydF4y2Ba

  54. 54。GydF4y2Ba

    沉M,萧y,戈布拉克A,Gombar vk,Tropsha A. k-incelliby邻近QSPR的制定和验证药物候选人的代谢稳定性。J Med Chem。2003; 46(14):3013-20。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  55. 55。GydF4y2Ba

    陈TF,戈卢布GH,莱韦克塔RJ。更新公式和用于计算样本方差的成对算法。在:COMPSTAT。第五届研讨会在图卢兹1982年施普林格举行;1982年第30-41。GydF4y2Ba

  56. 56。GydF4y2Ba

    弗里德曼jh。正常判别分析。J AM Stat Assoc。1989; 84(405):165-75。GydF4y2Ba

    文章GydF4y2Ba谷歌学术搜索GydF4y2Ba

  57. 57。GydF4y2Ba

    Susnow Rg,Dixon SL。利用鲁棒分类技术来预测人细胞色素P450 2D6抑制。J Chem Inf Comput SCI。2003; 43(4):1308-15。GydF4y2Ba

    CASGydF4y2BaPubMedGydF4y2Ba文章GydF4y2Ba公共医学中心GydF4y2Ba谷歌学术搜索GydF4y2Ba

  58. 58。GydF4y2Ba

    支持向量机和基于核的学习方法。剑桥:剑桥大学出版社;2004.GydF4y2Ba

    谷歌学术搜索GydF4y2Ba

  59. 59。GydF4y2Ba

    KASKIS khan S. Kernelized Bayesian矩阵分解的Gönenm。:国际机械学习会议;2013. p。864-72。GydF4y2Ba

  60. 60。GydF4y2Ba

    Gillen JE,TST T,IDE NC,McCray AT。ClinColithrials.gov基于Web的数据输入系统的设计,实施和管理。在:MedInfo;2004. p。1466-70。GydF4y2Ba

  61. 61。GydF4y2Ba

    NIH。pubmed。(2020)。GydF4y2Bahttps://www.ncbi.nlm.nih.gov/pubmmed/GydF4y2Ba. 于2020年12月访问。GydF4y2Ba

下载参考GydF4y2Ba

致谢GydF4y2Ba

没有确认报告。GydF4y2Ba

资金GydF4y2Ba

无需申报资金信息。GydF4y2Ba

作者信息GydF4y2Ba

隶属关系GydF4y2Ba

作者GydF4y2Ba

贡献GydF4y2Ba

TNJ开发了方法,进行了实验,写了草稿,并对手稿的一系列版本进行了检查。JGR制定了方法,对手稿的一系列版本进行了检查,提供了指导和反馈,这些指导和反馈逐渐整合到手稿中,并对手稿进行了审查。RA开发了方法学,通过手稿的一系列版本,提供指导和反馈,逐步集成到手稿中,并审查手稿。所有作者阅读并批准了最终的手稿。GydF4y2Ba

通讯作者GydF4y2Ba

对应于GydF4y2Bareda alhajj.GydF4y2Ba.GydF4y2Ba

道德宣言GydF4y2Ba

伦理批准和同意参与GydF4y2Ba

不适用。GydF4y2Ba

同意出版GydF4y2Ba

所有作者同意发表。GydF4y2Ba

利益争夺GydF4y2Ba

没有竞争利益申报。GydF4y2Ba

额外的信息GydF4y2Ba

出版说明GydF4y2Ba

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。GydF4y2Ba

补充信息GydF4y2Ba

附加文件1。GydF4y2Ba

SND基准数据集。GydF4y2Ba

权利和权限GydF4y2Ba

开放存取GydF4y2Ba本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问GydF4y2Bahttp://creativecommons.org/licenses/by/4.0/GydF4y2Ba. 知识共享公共领域奉献豁免(GydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/GydF4y2Ba)适用于本文中提供的数据,除非另有用入数据的信用额度。GydF4y2Ba

再版和权限GydF4y2Ba

关于这篇文章GydF4y2Ba

通过CrossMark验证货币和真实性GydF4y2Ba

引用这篇文章GydF4y2Ba

SNF-NN:利用相似网络融合和神经网络预测药物-疾病相互作用的计算方法。GydF4y2Ba欧宝娱乐合法吗22,GydF4y2Ba28(2021)。https://doi.org/10.1186/s12859-020-03950-3GydF4y2Ba

下载引用GydF4y2Ba

关键词GydF4y2Ba

  • 计算药物重新定位GydF4y2Ba
  • 药物相似度措施GydF4y2Ba
  • 相似网络融合GydF4y2Ba
  • 机器学习GydF4y2Ba
  • 深度学习GydF4y2Ba
\GydF4y2Ba