跳到主要内容

通过探索界面邻居性能改善的DNA结合热点残留预测方法

抽象的

背景

DNA结合的热点是显性和基本残留物,其贡献了大多数含有含有的蛋白质-DNA界面的含有约束力的无限化能量。作为识别热点的实验方法是耗时且昂贵的,高效的计算方法是作为实验方法的替代途径出现的。

结果

这里,我们介绍了一种新的计算方法,被称为INPPDH,用于热点预测。为了提高预测性能,我们提取包含传统特征和新的界面邻居的混合特征。要删除冗余和无关的功能,使用两步特征选择策略采用功能选择。最后,选择7个最佳特征的子集,以使用支持向量机构造预测器。基准数据集上的结果表明,该提出的方法产生明显更好的预测精度,而不是文献中先前公布的方法。此外,用于INPPDH的用户友好的Web服务器是很好的,并且可以自由使用http://bioinfo.ahu.edu.cn/inpppdh.

结论

通过鉴于蛋白质-DNA复合物的结构,我们开发了一种精确改进的预测模型,INPPDH,用于蛋白质-DNA结合界面的热点残留物。此外,我们确定了一个全面而有用的特征子集,包括所提出的界面邻特征,具有识别热点残留的重要强度。我们的结果表明,这些特征比先前所考虑的传统特征更有效,并且界面邻特征和传统特征的组合可以支持创建用于有效预测蛋白质DNA复合物中的热点残留物的判别特征。

背景

蛋白质-DNA相互作用是几乎所有生物过程的基础,例如DNA复制和基因调节[1]。先前的研究表明,蛋白质的结合能在相互作用面的分布不是平均的[2,3.]。只有一个小型和互补的界面残留物被称为热点,主要贡献到具有束缚的自由能。识别用于理解蛋白质-DNA相互作用的潜在生物机制的热点至关重要[4]它们在癌症中的作用[5,6]。已经应用了丙氨酸扫描诱变等实验方法,以研究DNA结合的热点[7]。作为识别热点的实验技术效率低下,劳动密集型,需要开发计算方法以预测热点。

已经开发了几种计算方法以识别蛋白质DNA复合物中的热点。一类基于分子力学,例如被称为Sampdi [8]和prempdi [9]预测蛋白质-DNA在畸形残留突变时结合可自由能的变化。和基于图形的方法称为MCSM-NA [10.]可以预测单氨基酸突变对蛋白质 - 核酸亲和力的影响。这些方法达到了可比的结果,以预测蛋白质-DNA界面中的热点残留物。然而,这些预测器需要高质量的输入结构,因为它们的预测基于蛋白质结构的模拟。在我们的透水的基于特征的方法中prpdh [11.[我们使用了支持向量机(SVM)和10所选择的最佳功能,以提高DNA绑定热点的预测性能。

在这项研究中,我们开发了一种改进的基于结构的蛋白质-DNA热点预测模型,其被称为INPPDH,其综合了在以前的热点预测任务中使用的传统属性[12.,13.,14.,15.]新的界面邻居属性(Inps)。从这些功能,使用两步特征选择方法选择全面和强大的功能子集。基于所选功能,构建了SVM分类器以进行预测。实证研究表明,与最先进的预测器相比,我们的方法在预测热点方面达到了更好的性能。可提供INPPDH的Web服务器http://bioinfo.ahu.edu.cn/inpppdh.

结果与讨论

两步特征选择方法评估

我们在本研究中使用的特征选择是两步战略。我们将SVM-RFE应用为第一步特征选择并获得11个功能。据报道,SVM-RFE通常根据其相关性和互补性提供对等级特征的标准,但在要考虑的功能中没有裁员[16.],因此我们实现了第二步去除了高相关性的潜在冗余特征。我们计算了11个特征之间的Pearson相关系数,并以0.65的阈值去除潜在的冗余特征。最后,通过两步特征选择方法得到7个最优特征组。

数字1展示了特征选择前后的性能对比,其中24个特征表示没有特征选择的模型,11个特征表示一次特征选择的模型,7个特征表示两步特征选择的模型。我们可以看到,在进行两步特征选择后,模型的AUC得分最高,为0.839。与单步11个特征和24个原始特征相比,AUC评分有所提高\(\ mathrm {with} \)0.018和0.074分别。

图。1
图1

培训集上具有原始24个功能的模型的ROC曲线,一步11个功能和两步7功能

我们进一步评估了一步11个特征和两步7特征之间的相关系数。这两个特征子集的相关热图在图2中示出。2。显而易见的是,在11个特征中,相关系数超过0.9的4对特征。并且对于两步选择的7个特征,所有相关系数都在0.65以下。它还表明,基于ASA和INP的特征之间的相关系数通常高于其他特征之间的相关系数。另外,这些特征如PSI(Iupac肽骨干扭转角PSI)和EIG(特征媒介指数)与基于ASA和INP的特征差别相关。因此,我们推断出这些特征之间存在互补性。总之,我们得出结论,两步特征选择可以实现更大的冗余性能。

图2
图2.

一步11特征和两步7特征的相关热图。最低相关系数到最高相关系数用数字0-1表示。每个区块的数量是两个特征的相关系数

评估特征重要性

在这项研究中,我们提出了基于ASA和CASA的两种界面邻域特性(INPS),并获得了总共8个INP。在所选择的7个最佳功能中,其中2个(INP1-SASA和INP2-CSRSA)是新编码的。为了更好地了解Inppdh中使用的这些功能的相对贡献,并探讨每个功能的相对重要性,我们比较了Inppdh的交叉验证性能,从分析中删除了每个功能(表1)。删除INP1-SASA导致INPPDH的性能显着降低,这强调了此功能的重要性。以下是PSI和INP2-CSRSA。另外,这两个特征在正确预测的热点残留情况下显示出更多贡献,分别为0.178和0.081的ΔSen。半球形C的特征α.-Cβ联系号码(HBCN)没有显着影响性能。我们得出结论,两种新编码的INP功能通过其个人和合作角色在选定的7个功能中的个人和合作角色对预测模型进行了明显的改进。

表1对训练集的单一特征性能的评估

与其他方法进行比较

为了进一步验证我们模型的性能,我们将其性能与最先进的方法进行了比较,包括绑定亲和力更改预测因子(SAMPDI,PREMPDI和MCSM-NA)和我们之前的方法(PRPDH)。通过将测试设置为这些方法的Web服务器,我们获得了预测结果。结果显示在表中2。与其他四种方法相比,我们的方法在ppdh中显示出较高的成功率。我们方法的AUC值为0.833,其他方法的AUC值在0.661-0.764范围内。因此,我们的方法可以有效地区分蛋白质- dna界面中的热点和非热点。我们的方法可以正确地预测热点从数据集森= 0.731 = 0.731之前,这意味着inpPDH可以正确地预测73.1%的真实热点从这个数据集(灵敏度),和73.1%的预测热点被认为是真正的热点(精度)。我们之前的PrPDH方法能够有效地识别非热点(SPE = 0.816),但与inpPDH相比,它不能正确识别热点(SEN = 0.692)。inpPDH的AUC值比PrPDH高6.9个百分点(每种方法的详细预测结果见Additional file1)。此外,在ppdh的其他测量中,F1得分(0.731)、MCC得分(0.547)、ACC得分(0.781)在所有测试方法中仍然具有竞争力。我们进一步进行了统计分析,以显示这些比较的差异是否具有统计学意义。具体来说,我们随机选取测试集10次,得到10个均衡的子集,其中热点20个,非热点20个。我们计算了这些方法在每个子集中的AUC值,以及inpPDH与其他方法之间的AUC p值[17.]。可以观察到,INPPDH具有比0.05小于0.05的P值的其他方法。从这些分析中,我们可以看到,与预测DNA结合的热点残留物的其他可用方法相比,我们的特征的方法提供了更好的预测性能。

表2在测试集上的其他方法的性能比较

结论

由于仅发布了几项研究来探讨DNA结合蛋白质热点,因此需要开发更准确和有效的计算方法来预测热点残留物。在这项研究中,我们提出了一种称为INPPDH的基于特征的方法,以区分来自蛋白质DNA界面残留物的热点。我们的型号INPPDH的性能首先通过十倍交叉验证进行评估,并通过独立的测试集进行进一步验证。显然,与现有的热点预测方法相比,我们的方法可以提供有利的性能。此外,我们基于ASA特征开发了两种界面邻居性,结果表明,这些界面邻居性能有效地描述差异并有助于蛋白质DNA结合事件。我们认为,Inppdh可以是用于准确识别DNA绑定热点的有用工具,并且Web服务器实现可以自由使用http://bioinfo.ahu.edu.cn/inpppdh.

在我们未来的工作中,一方面,我们将尝试基于高级机器学习方法开发更复杂的预测方法,如深度学习方法,另一方面,我们将探讨更好地描述的更多特征特征,更好地描述了不同的能量贡献蛋白质DNA界面残留物。

材料和方法

数据集

本研究中使用的数据集与我们以前的工作中使用的数据集prpdh [11.]。我们从dbAMEPNI中收集了108个蛋白质- dna复合物[18.]和sampdi [8[取下冗余序列以确保任何两个蛋白质序列的相似性不超过40%。通过这些过程,我们获得了64个复合物的数据集,包括88个热点和126个非热点。将这些复合物随机分为训练组(40个络合物)和测试组(24个络合物)。最终的训练集由62个热点和88个非热点组成,最终测试组包括26个热点和38个非热点。

特征表示

为了构建可以将热点与非热点区分开的预测器,我们共生成了24个特征,包括基于序列和基于结构的特征,以测试特征选择方法并培训我们的模型。表中可以在表格中找到这些24个候选功能的详细列表3.。请注意,表中的前4个功能和第13个,第14次,第15和第15个功能对正确预测热点残留物的有效性表现出了有效的性能,这些性能已经用作我们之前工作中的功能的一部分[11.]。其余17个功能是本研究中提出的新功能。更详细的这些功能的描述如下所示。

表3本研究中使用的特征概述

溶剂可接近的表面积

从先前的研究中,我们了解到,溶剂可接近的表面积(ASA)特征是识别的并且有效地将DNA结合残基与非结合残留物区分在DNA结合残留物表面上的[19.]。我们采用了NACCESS程序[20.]计算每个接口残留的绝对ASA和相对ASA (RSA)。我们从ASA和RSA中提取了两个属性:total(所有原子值之和)和side-chain(所有侧链原子值之和)。CASA,即从单体状态(未结合)到蛋白质- dna复合物形成(结合)的一个残基的ASA变化计算如下:)= asamono() - ASACOMP(),asamono()和Asacomp()为目标接口残留的ASA分别在单体和复合物中。我们还通过相同的等式计算了CRSA(络合物时残留物的RSA变化)。此外,残留物的未结合和结合状态之间的绝对ASA(RASA)和相对ASA(RRSA)的相对变化被计算为我们以前的工作中的[13.]:RASA()= casa(/ ashamono(),RRSA()= CRSA(/ rsamono()。因此,有12种不同的ASA特征(表3.)。

特征传染媒介中心性指数

氨基酸网络的分析有助于揭示蛋白质的功能区,结构,稳定性和折叠[21.],氨基酸网络中的节点表示界面残基,边表示两个残基之间的相互作用。为了衡量网络中节点的影响,我们使用网络蛋白质结构分析(nap)计算特征向量中心性指数[22.] 程序。

骨干角和联系号码

在本研究中,我们使用蛋白质二次结构的定义(DSSP)[23.]计算肽骨干扭转角psi,并且我们计算了C的联系人号码α.-Cβ使用蜘蛛3的半个球体[24.]。

氢键

我们计算使用HBPLUS的界定状态中供体残留的氢键数[25.]。

界面附近的属性

现有的方法一般只从目标残差本身提取特征来预测给定残差是否可能是热点,不能很好地代表真实情况。在此基础上,我们针对每个目标残差定义了两种界面邻域特性(INPs)和8个INP功能(表3.)由以下方程产生:

$$ \ mathrm {inp} 1 \ left(i \ light)= \ frac {{\ mathrm {asa} _ {\ mathrm {mono}} \ left(i \ recte)} {\ frac {1} {n} \ sum_ {j = 1} ^ {n} {\ mathrm {asa}} left(j \ light)} - \ frac {{\ mathrm {asa}} _ {\ mathrm{comp}}左(i \ rote)} {\ frac {1} {n} \ sum_ {j = 1} ^ {n} {\ mathrm {asa} _ {\ mathrm {comp}} leve(J \右)} $$
(1)
$$ \ mathrm {inp} 2 \ left(i \ light)= \ frac {\ mathrm {casa}(i)} {\ frac {1} {n} \ sum_ {j = 1} ^ {n} \ mathrm{casa}(j)} $$
(2)

在哪里j是位于6.5Å的球体内的目标残渣邻居残留物12.] C.α.界面上的原子,和n是邻居残留的总数。

两步特点选择

对于本研究中使用的小尺寸的数据集,过度的功能更可能导致过度装备。在这里,我们实现了两步的特征选择策略,以删除可能的冗余功能。在第一步中,我们使用基于SVM的递归特征消除(SVM-RFE)[26.]过滤性能不佳的功能。SVM-RFE是一种基于包装器的方法,它使用权重幅度作为评估每个功能的重要性。对于每次迭代,它排除了最后一次排名的功能,训练过程停止,直到产生最佳性能。在第二步中,我们计算了从第一步中所选特征中的Pearson相关系数,并根据我们之前的研究基于我们的研究,从第一步中删除了具有高正相关阈值0.65的潜在冗余特征[27.]。

模型建设

作为一种广泛使用的机器学习算法,SVM能够在小尺寸的训练集上实现有利的分类结果[28.]。我们在我们以前的工作中比较了SVM [11.[其他分类算法,如随机林,天真贝叶斯和K-inteleBours,发现SVM在训练和测试集上表现出这些算法。所以我们继续在这项工作中申请SVM。具体来说,我们应用了libsvm [29.[径向基函数(RBF)内核构建模型。同时,十倍交叉验证用于设计我们的方法并近似训练数据集上的预测性能。为了提高预测器的性能,容量参数C和内核参数γ.使用网格搜索方法尝试SVM。我们设置了范围C从0.1到10和γ.从0.005到0.5,并在训练集上使用十倍交叉验证,以根据我们之前的研究来测量不同的参数[30.]。最佳参数Cγ分别为4.5%和0.05。

评估标准

为了量化我们预测方法的性能,我们采用敏感性(森),特异性(SPE),精度(Pre),F1得分(F1),精度(ACC)和Matthews相关系数(MCC)测量[31.,32.]通过以下方程式:

森$ $ = TP / (TP + FN) $ $
(3)
$ $ SPE = TN / (TN + FP) $ $
(4)
$$前= TP /(TP + FP)$$
(5)
$$ f1 = \ frac {2 \ times sen \ times pre} {sen + pre} $$
(6)
$$ \ mathrm {ACC} = \ FRAC {TP + Tn} {TP + TN + FP + FN} $$
(7)
$$ mcc = \ frac {tp \ times tn-fp \ time fn} {\ sqrt {(tp + fp)(tp + fn)(tn + fp)(tn + fn)}} $$
(8)

其中TP,FP,Tn和Fn表示真正的阳性(正确预测的热点残留)的数量,假阳性(非热点残留物错误地预测为热点),真正的负(正确预测的非热点残留)和假分别为阴性(热点残留物不正确地预测为非热点)。

为了完整起见,我们还绘制了接收器操作特征(ROC)曲线来评估在这项工作中的性能。ROC曲线(AUC)下的归一化区域可以测量分类器的性能。

可用性数据和材料

数据和工具在网站上自由提供:http://bioinfo.ahu.edu.cn/inpppdh.

缩写

SVM:

支持矢量机器

Inps:

界面邻居属性

IUPAC:

肽骨干扭转角度

PSI:

Psi.

Eig:

特征传染媒介中心性指数

HBCN:

半球形Cα-Cβ联系号码

森:

灵敏度

SPE:

特异性

前面:

精确

F1:

F1得分

ACC:

准确性

世纪挑战集团:

Matthews相关系数

鹏:

接收器操作特性

AUC:

ROC曲线下的区域

作为一个:

可访问的表面积

RSA:

相对的ASA

小睡:

蛋白质结构的网络分析

DSSP:

蛋白质二次结构的定义

SVM-RFE:

基于SVM的递归特征消除

RBF:

径向基功能

参考

  1. 1。

    Jones KA, Kadonaga JT, Rosenfeld PJ, Kelly TJ, Tjian R.:激活真核转录和DNA复制的细胞DNA结合蛋白。细胞。1987年,48(1):79 - 89。

    CAS.文章谷歌学术

  2. 2。

    Clackson T,Wells Ja。激素受体界面中的结合能的热点。科学。1995年; 267(5196):383-6。

    CAS.文章谷歌学术

  3. 3.

    Moreira是Fernandes Pa,Ramos MJ。热点 - 对蛋白质 - 蛋白质界面的综述氨基酸残基。蛋白质结构功能生物素。2007; 68(4):803-12。

    CAS.文章谷歌学术

  4. 4.

    Bogan Aa,刺ks。蛋白质界面中热点的解剖。J Mol Biol。1998年; 280(1):1-9。

    CAS.文章谷歌学术

  5. 5。

    Xi J,Li A,王M.Hetrcna:一种基于基于矩阵分解框架的异质肿瘤样本鉴定复发性拷贝数交替的新方法。IEEE / ACM反式计算BIOL BIOINF。2020; 17(2):422-34。

    文章谷歌学术

  6. 6。

    Xi J,Yuan X,Wang M,Li A,Li X,Huang Q.通过子空间学习与子组鉴定的推断亚组特异性司机基因。生物信息学。2020; 36(6):1855-63。

    CAS.PubMed.谷歌学术

  7. 7。

    井JA。蛋白质 - 蛋白质界面的系统突变分析。方法酶。1991; 202:390-411。

  8. 8。

    彭Y,Sun L,Jia Z,Li L,Alexov E.使用改进的MM / PBSA方法预测蛋白质-DNA在畸形突变时结合自由能量:Sampdi WebServer。生物信息学。2018; 34(5):779-86。

    CAS.文章谷歌学术

  9. 9。

    关键词:PremPDI,错义突变,蛋白质- dna相互作用,分子生物学PLoS compput biology . 2018;14(12):e1006615。

    文章谷歌学术

  10. 10。

    Pires de,ascher db。MCSM-NA:预测突变对蛋白质 - 核酸相互作用的影响。核酸RES。2017; 45(W1):W241-6。

    CAS.文章谷歌学术

  11. 11.

    张S,Zhao L,Zheng C-H,夏J.一种基于特征的方法,以预测蛋白质DNA结合界面的热点。简短生物形式。2020; 21(3):1038-46。

    文章谷歌学术

  12. 12.

    潘y,王z,Zhan W,Deng L.使用集合方法计算蛋白质RNA复合物中的结合能量热点的计算鉴定。生物信息学。2017; 34(9):1473-80。

    文章谷歌学术

  13. 13。

    夏j-f,赵x-m,宋j,huang d-s。API:通过将突出指数与溶剂可接近性结合,精确预测蛋白质界面中的热点。BMC生物素。2010; 11(1):174。

    文章谷歌学术

  14. 14。

    朱克,米切尔·杰克。KFC2:基于接口溶剂,原子密度和可塑性的知识的热点预测方法。蛋白质结构功能生物素。2011; 79(9):2671-83。

    CAS.文章谷歌学术

  15. 15。

    夏j,yue z,di y,zhu x,zheng c-h。基于突出指数,伪疏水性和电子离子相互作用伪能功能预测蛋白质界面中的热点。oncotarget。2016; 7(14):18065。

    文章谷歌学术

  16. 16。

    刘玲,熊勇,高辉,魏德强,Mitchell JC, Zhu X. dbAMEPNI:一个蛋白质-核酸相互作用的丙氨酸诱变效应数据库。数据库》2018。https://doi.org/10.1093/database/bay034

    文章PubMed.pmed中央谷歌学术

  17. 17。

    Xiong Y,Zhu X,Dai H,Wei DQ。蛋白质表面对DNA结合残基预测的计算方法调查。方法Mol Biol。2018; 1754:223-34。

    CAS.文章谷歌学术

  18. 18。

    Hubbard S. naccess:计算可见性的程序。伦敦大学生物化学与分子生物学系;1992年。http://www.bioinf.manchester.ac.uk/naccess

  19. 19。

    燕W,周J,Sun M,Chen J,Hu G,Shen B.氨基酸网络构建理解蛋白质结构和功能。氨基酸。2014; 46(6):1419-39。

    CAS.文章谷歌学术

  20. 20。

    Chakrabarty B,Parekh N. Naps:蛋白质结构的网络分析。核酸RES。2016; 44(W1):W375-82。

    CAS.文章谷歌学术

  21. 21。

    Kabsch W,砂光机C.蛋白二级结构词典:氢键和几何特征的模式识别。生物二聚糖res生物摩尔。1983; 22(12):2577-637。

    CAS.谷歌学术

  22. 22。

    Heffernan R,杨Y,Paliwal K,周Y.通过长短期内存双向复发性神经网络捕获非局部相互作用,用于改善蛋白质二级结构,骨干角,接触号和溶剂可接近性的预测。生物信息学。2017; 33(18):2842-9。

    CAS.文章谷歌学术

  23. 23。

    麦当劳·伊克克,桑顿杰姆。满足蛋白质中的氢键电位。J Mol Biol。1994年; 238(5):777-93。

    CAS.文章谷歌学术

  24. 24。

    Guyon I,Weston J,Barnhill S,VAPNik V.基因选择用于使用支持向量机的癌症分类。马赫学习。2002; 46(1-3):389-422。

    文章谷歌学术

  25. 25。

    郑n,李米,赵立,张b,杨y,zheng c-h,xia J.对有害同义突变预测计算方法的比较与集成。简短生物形式。2020; 21(3):970-81。

    CAS.文章谷歌学术

  26. 26。

    Chi M,Feng R,Bruzzone L.具有原始SVM的高光谱遥感数据,用于小型训练数据集问题。Adv Space Res。2008; 41(11):1793-9。

    文章谷歌学术

  27. 27。

    C-C,Lin C-J。libsvm:支持向量机的库。ACM Trans Intely Syst Technol(TIST)。2011; 2(3):27。

    谷歌学术

  28. 28。

    夏j-f,赵x-m,黄d-s。使用META预测器预测蛋白质 - 蛋白质与蛋白质序列的相互作用。氨基酸。2010; 39(5):1595-9。

    CAS.文章谷歌学术

  29. 29。

    邓A,张H,王W,张j,风扇d,陈p,王b.开发计算模型基于XGBoost算法预测蛋白质 - 蛋白质互动网站。int j mol sci。2020; 21:2274。

    CAS.文章谷歌学术

  30. 30.

    王B,王L,郑C,Xiong Y.蛋白质相互作用网站预测的不平衡数据处理策略。IEEE / ACM反式计算BIOL BIOINFORM。2019年。https://doi.org/10.1109/tcbb.2019.2953908

    文章PubMed.pmed中央谷歌学术

  31. 31。

    Mundra Pa,Rajapakse JC。SVM-RFE用MRMR滤波器进行基因选择。IEEE Trans Nanobiosci。2010; 9(1):31-7。

    文章谷歌学术

  32. 32。

    Shi F,Yao Y,Bin Y,Zheng C-H,Xia J.使用基于特征的方法的人类基因组的有害同义变种的计算鉴定。BMC MED GENOMICS。2019; 12(1):12。

    文章谷歌学术

下载参考

致谢

作者感谢我们实验室所有成员的宝贵讨论。

关于这个补充剂

本文已作为一部分发布欧宝娱乐合法吗BMC生物信息学卷22补充3,2021:2019年智能计算国际会议的会议记录(ICIC 2019):生物信息学。补充的完整内容可在线提供//www.christinemj.com/articles/supplements/volume-22-supplement-3

资金

中国国家自然科学基金(62072003,61672037,31301101,u19a2064和11835014)支持这项工作,是安徽省领先人才队(2019-16)的招聘计划,中国博士生科学基金会赠款(2018M630699),安徽省博士后科学基金会补助金(2017B325),上海市科技重大项目(2018SHZDZX01)和张江实验室。出版费用由61672037资助。资助机构在研究和收集,分析和数据的解释方面没有作用,以及编写稿件。

作者信息

隶属关系

作者

贡献

JX和YB设计了项目,SZ和LZ收集了数据,SZ,LW,LZ和JX分析了数据,ML(LI),ML(LIU),KL和YB在项目期间提供了建设性的建议和讨论,JX,sz和lw写了稿件。所有作者阅读并认可的终稿。

相应的作者

对应于燕南垃圾箱或者朱峰夏

伦理宣言

伦理批准并同意参与

不适用。

同意出版

不适用。

相互竞争的利益

提交人声明他们没有竞争利益。

附加信息

出版商的注意事项

欧宝体育黑玩家《自然》杂志对已出版的地图和附属机构的管辖权主张保持中立。

补充信息

附加文件1:表S1

。测试集上Inppdh,PRPDH,SAMPDI,PREMPDI和MCSM-NA的详细预测结果

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

张,S.,王,L.,赵,L.等等。通过探索界面邻居性能改善的DNA结合热点残留物预测方法。欧宝娱乐合法吗22,253(2021)。https://doi.org/10.1186/s12859-020-03871-1.

下载引用

关键词

  • 蛋白质DNA复合物
  • 热点
  • 界面邻居
  • 支持矢量机器
  • 功能选择