跳到主要内容GyD.F4y2Ba

JEDI:Java基本动态检查员 - 分子轨迹分析工具包GyD.F4y2Ba

摘要GyD.F4y2Ba

背景GyD.F4y2Ba

主成分分析(PCA)通常被应用于生物聚合物的原子轨迹,以提取描述生物相关运动的基本动力学。虽然PCA的应用很简单,但缺乏专门的软件来促进工作流程和分子动力学模拟数据的分析,从而充分利用PCA的力量。Java基本动态检查器(JEDi)软件是以前JED软件的一个重大升级。GyD.F4y2Ba

结果GyD.F4y2Ba

采用多线程,JEDI具有用户友好的界面,以控制快速工作流程,以便在各种空间分辨率和次区域内询问生物聚合物的构象动作,包括多链蛋白。JEDI具有基于笛卡尔的坐标(CPCA)和内部距离对坐标(DPPCA)的选项,以构建协方差(Q),相关(R)和部分相关(P)矩阵。用于准确估计协方差的收缩和异常值阈值。使用异常值和Inlier滤波器量化稀有事件的效果。在统计模型中施加稀疏阈值识别潜在相关的动作。在分层方法中,首先用单独的局部CPCA计算计算小规模的原子运动以获得实例化。然后,特征规定的PCA会产生大规模运动的快速准确。所有残留对的本地CPCA会产生所有残留残留动态联轴器的地图。此外,内核PCA是实现的。JEDI输出默认提供高质量的PNG图像,具有文本文件的选项,包括对齐坐标,几个度量,这些指标量化移动性,与其特征值的移动性,PCA模式以及位移向量投影到顶部主模式上。 JEDi provides PyMol scripts together with PDB files to visualize individual cPCA modes and the essential dynamics occurring within user-selected time scales. Subspace comparisons performed on the most relevant eigenvectors using several statistical metrics quantify similarity/overlap of high dimensional vector spaces. Free energy landscapes are available for both cPCA and dpPCA.

结论GyD.F4y2Ba

JEDi是一个方便的工具包,应用多元统计的最佳实践,对类似生物聚合物的基本动力学进行比较研究。JEDi通过许多集成工具和视觉辅助来检查和量化移动性和动态相关性的相似/差异,帮助识别功能机制。GyD.F4y2Ba

背景GyD.F4y2Ba

生物聚合物的分子动力学(MD)模拟的广泛使用[GyD.F4y2Ba1GyD.F4y2Ba]为分析原子轨迹的统计工具创造了更大的需求。彻底的分析有助于识别负责生物功能的机制。分子构象由具有等于自由度(DOF)的尺寸的尺寸的载体空间表示,通常作为所选原子的笛卡尔坐标。内部DOF也可以采用,例如成对原子之间的距离。[GyD.F4y2Ba2GyD.F4y2Ba那GyD.F4y2Ba3.GyD.F4y2Ba某些距离对可以表征一种功能性运动,在某些情况下可以通过实验测量,如肌凝蛋白所示。[GyD.F4y2Ba4.GyD.F4y2Ba]主成分分析(PCA)是一种来自多变量统计的方法,以减少矢量空间的维度,允许基本动态(ED)[GyD.F4y2Ba5.GyD.F4y2Ba[大分子]以少量的集体运动表示。[GyD.F4y2Ba3.GyD.F4y2Ba那GyD.F4y2Ba6.GyD.F4y2Ba那GyD.F4y2Ba7.GyD.F4y2Ba]GyD.F4y2Ba

图1GyD.F4y2Ba
图1GyD.F4y2Ba

JEDI工作流程概述GyD.F4y2Ba

计算ED可以考虑使用专用软件或MD仿真程序[GyD.F4y2Ba8.GyD.F4y2Ba那GyD.F4y2Ba9.GyD.F4y2Ba]在其输出的轨迹上执行PCA。[GyD.F4y2Ba10GyD.F4y2Ba然而,执行ED的MD程序缺乏进行彻底分析的复杂性。独立程序Bio3D [GyD.F4y2Ba11GyD.F4y2Ba]在R中运行,将其实用性限制为低吞吐量负载。modetask [GyD.F4y2Ba12GyD.F4y2Ba从命令行或作为pymol插件运行。ModeDask用于PCA和正常模式分析,并提供良好的可视化,但具有最小的统计分析功能。jed的独立软件[GyD.F4y2Ba13GyD.F4y2Ba]提供一种大规模比较分析的手段,并且具有比Bio3D或Modetask更多的统计分析工具,加上jed通过提供聚合物脚本提供良好的可视化。尽管很多优势,JED需要陡峭的学习曲线使用。GyD.F4y2Ba

使用Java Essential Dynamics(JED)作为先行者,JEDI软件包括新颖的分层PCA方法,添加了更多的统计工具和多线程以实现实时分析。JEDI处理高吞吐量分析,涉及大量输入文件,同时用于通过从单个输入文件转换开关的对比分析来控制GyD.F4y2Ba检查GyD.F4y2Ba细节的分子运动。GyD.F4y2Ba

JED用户的反馈表示希望使用不同的分辨率来检查编号为动态的DOF的数量。进行了几个请求来改进用户界面,以便更容易检查高维数据和统计输出。除了解决这些问题之外,Jedi还有新的功能,可以量化稀有事件的作用,并使更容易同时采用不同的统计模型。意识到大多数任务是多次重复的,很明显,需要一种便于和连贯地执行全面的实时操作的工具包。GyD.F4y2Ba

在这份报告中,我们从两个方面描述了JED的重大升级。首先,用户界面已经完全改变,使用自动化重复分析的工作流来执行数据检查。由于简化的用户界面使得控制如何使用显式用户选项检查数据变得容易,因此先前的高障碍学习曲线大大减少。其次,软件包中还包含了其他新颖的计算算法,如层次PCA,它在分析高空间分辨率的大型系统、统计矩阵的稀疏化以提取潜在的相关运动以及过滤器以量化罕见事件的影响方面提供了独特的能力。由于将重点放在数据检查上,JED软件现在被称为Java基本动力学的JEDiGyD.F4y2Ba检查员GyD.F4y2Ba。GyD.F4y2Ba

JEDI工具集的示意图如图2所示。GyD.F4y2Ba1GyD.F4y2Ba。JEDi工具箱中用于计算和解释单个和多个分子轨迹的ED的分析工具的范围包括:(1)具有多级空间分辨率(或粗粒度)的原子/残留物的多个子集的规范和自由度的分布式选择;(2)四阶以下所有变量的统计矩,通过阈值法选择变量;(3)离群值处理,包括离群值的去除和基于阈值的离群值的选择,通过模型对模型的比较;(4)最优协方差条件;(5)多种类型的主成分分析,包括一种新的层次cPCA,确定子集中所有残基之间的耦合分数,并将dpPCA推广到任何原子对的选择;(6)利用协方差、相关矩阵和偏相关矩阵建立了三种PCA模型,并进行了定量子空间比较;(7)有十几种经过PCA滤波的核PCA分析,可快速处理;(8)默认的综合图形输出,包括PyMol脚本,以可视化个人主组件(PC)模式和基本运动在用户选择的时间尺度为电影;(9)从顶部两种PC模式创建自由能面; (10) A verbose option allows flat files to be given as part of its output. The output files are compressed in bzip2 format to reduce storage requirements. Finally, JEDi is programmed with multi-threading to complete all the analyses rapidly.

实现GyD.F4y2Ba

在多元统计数据中,PCA的过程通常应用于三种类型的统计模型,由协方差矩阵给出,GyD.F4y2Ba问:GyD.F4y2Ba,相关矩阵,GyD.F4y2BaR.GyD.F4y2Ba和部分相关矩阵,GyD.F4y2BaP.GyD.F4y2Ba。对于所有三种统计模型,执行光谱分解。特征向量称为PC模式。特征值的等级排序GyD.F4y2Ba问:GyD.F4y2Ba从最高到最高量量化集体变量的变化。GyD.F4y2Ba

在拟调和近似内[GyD.F4y2Ba14GyD.F4y2Ba],PC模式来自GyD.F4y2Ba问:GyD.F4y2Ba与位置坐标相关联的是等效于振动的正态,其中最大的变化对应于最低频率的运动[GyD.F4y2Ba15GyD.F4y2Ba]。因此,主成分分析GyD.F4y2Ba问:GyD.F4y2Ba提供类似于正常模式分析的ED的描述。应用PCA onGyD.F4y2BaR.GyD.F4y2Ba允许跟踪相关动量而不偏向大振幅运动。应用PCA onGyD.F4y2BaP.GyD.F4y2Ba在删除所有其他变量的效果之间产生变量之间的相关性。PCA在标准统计措施上的应用GyD.F4y2Ba问:GyD.F4y2Ba那GyD.F4y2BaR.GyD.F4y2Ba, 和GyD.F4y2BaP.GyD.F4y2Ba在ED的上下文中,已经在多变量统计中使用。[GyD.F4y2Ba13GyD.F4y2Ba]。GyD.F4y2Ba

对齐构象GyD.F4y2Ba

分子轨迹提供描述一组抽样构象的快照(帧),表示为GyD.F4y2Ba(\ \ {X (t) \} \)GyD.F4y2Ba在哪里GyD.F4y2BaT.GyD.F4y2Ba是一个离散帧索引。向量GyD.F4y2BaXGyD.F4y2Ba可以描述系统内的原子子集。所有原子坐标都在一组标准格式PDB文件中读取。利用该信息,可以在不同水平的原子分辨率,从所有原子到α碳原子的各个水平研究任何残留物。对于由...组成的子集GyD.F4y2BamGyD.F4y2Ba原子,GyD.F4y2BaXGyD.F4y2Ba是维数为3的列向量GyD.F4y2BamGyD.F4y2Ba因为每个atom都有(GyD.F4y2BaXGyD.F4y2Ba那GyD.F4y2BayGyD.F4y2Ba那GyD.F4y2BaZ.GyD.F4y2Ba)坐标。GyD.F4y2Ba

为GyD.F4y2BaNGyD.F4y2Ba的观察,GyD.F4y2BamGyD.F4y2Ba与位置协方差矩阵相关的原子GyD.F4y2BaXGyD.F4y2Ba那GyD.F4y2BayGyD.F4y2Ba和GyD.F4y2BaZ.GyD.F4y2Ba每个原子的坐标由GyD.F4y2Ba\(3m \ times n \)GyD.F4y2Ba数据矩阵,GyD.F4y2Ba一种GyD.F4y2Ba。3.GyD.F4y2BamGyD.F4y2Ba行定义了系统的构造和GyD.F4y2BaNGyD.F4y2Ba列表示在轨迹中采样的帧数,这些轨迹描述了分子构象如何及时发展。分子构象变形为系统的质量和方向随时间变化而变化。由于全局翻译和旋转,所有帧都使用原子的分子间对应集(IC)对齐。GyD.F4y2Ba

使用四元数对准方法对每个帧的构象与参考结构对齐[GyD.F4y2Ba13GyD.F4y2Ba]。通常选择参考结构作为一个轨道上的构象之一。参考结构的选择是任意的,但是在整个分析过程中必须使用相同的参考结构。为了便于跨许多系统进行比较分析,对齐坐标GyD.F4y2Ba\ \ {X_a \} \ ()GyD.F4y2Ba每个轨道中的每个构象在ICS中有相同的原子对齐到相同的参考结构。绝地输出对齐坐标GyD.F4y2Ba\ \ {X_a \} \ ()GyD.F4y2Ba对于与指定的参考PDB结构同步的所有轨迹,并在后续计算中使用,例如执行位移投影图。GyD.F4y2Ba

这GyD.F4y2Ba一种GyD.F4y2Ba数据矩阵表示关于IC的对齐坐标,其具有减去这些坐标的平均值。因此,GyD.F4y2Ba\(A = \{X_a - \rangle X_a \rangle}\)GyD.F4y2Ba然后,GyD.F4y2Ba\(q =(aa ^ t)/(n-1)\)GyD.F4y2Ba,在那里GyD.F4y2Ba\ (^ T \)GyD.F4y2Ba是数据矩阵的转置。这GyD.F4y2Ba\ \ (3 m \ * 3米)GyD.F4y2Ba问:GyD.F4y2Ba矩阵是真实的和对称的,它只能保证实际的特征向量和特征向量的真实组件。二次形式的GyD.F4y2Ba问:GyD.F4y2Ba确保所有特征值都是非负面的。这种形式的计算GyD.F4y2Ba问:GyD.F4y2Ba非常常见,因为它为人口协方差矩阵提供了一个简单的无偏估计。当使用距离对时,不需要对齐数据,因为在转换和旋转中的原子对之间的距离是不变的。GyD.F4y2Ba

统计抽样GyD.F4y2Ba

提供了量化采样充足性和执行异常检测的各种方法。为了评估每个变量(或DOF)的采样程度,计算每个变量和Kaiser-Meyer-Olkin(KMO)统计的采样充足(MSA)的测量[GyD.F4y2Ba16GyD.F4y2Ba那GyD.F4y2Ba17GyD.F4y2Ba]。确定分子动力学(MD)轨迹中的异常值的问题是复杂的,因为重要的功能机制可以通过在模拟期间没有很好地采样的稀有事件来触发重要的功能机制,但这些异常值面临被抛出分析的风险。此外,如果没有采样一些DOF,则完全忽略这些变量并不谨慎,尽管知道统计推断较弱的地方是有价值的。纳入或排除异常值对协方差矩阵具有重大影响。因此,实现了协方差矩阵估计的最佳实践。GyD.F4y2Ba

众所周知,样本协方差矩阵GyD.F4y2Ba问:GyD.F4y2Ba如上定义,在上面定义,通常为人口协方差矩阵提供差的估计器,当样本的数量不大于变量的数量时。出于这个原因,自适应协方差收缩(ACS)算法[GyD.F4y2Ba18GyD.F4y2Ba实施以获得改进的协方差估计。ACS收缩的目标矩阵是“GyD.F4y2Ba对角线 - 不平等GyD.F4y2Ba“。ACS算法基于样本协方差矩阵的条目的方差确定最佳收缩强度。GyD.F4y2Ba

图2GyD.F4y2Ba
图2.GyD.F4y2Ba

一种GyD.F4y2Ba异常处理和协方差估算。GyD.F4y2BaB.GyD.F4y2Ba矩阵R和P的稀疏化GyD.F4y2Ba

以前,JED使用了一种稀有事件收缩(RES)算法,该算法基于用户定义的阈值替换检测到的异常值,其中每个DOF的平均值。RES算法保留在JEDI中,因为它提供了通过设置低异常阈值来显着增加收缩的优点,并且通过设置高分子阈值有效地关闭收缩。RES和ACS方法的组合产生了对协方差矩阵的稳健无偏的估计。见图。GyD.F4y2Ba2GyD.F4y2Ba一种。准确的估计GyD.F4y2Ba问:GyD.F4y2Ba转化为准确的估计GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba因为相关矩阵和偏相关矩阵是由协方差矩阵推导出来的。随着收缩,统计模型的后续谱分解产生了更可靠的见解,这是由于在使用子采样时通过交叉验证改善了一致性。GyD.F4y2Ba

矩阵调理GyD.F4y2Ba

的倒数GyD.F4y2Ba问:GyD.F4y2Ba在计算偏相关矩阵时使用。对于的逆GyD.F4y2Ba问:GyD.F4y2Ba存在,来自光谱分解的零特征值GyD.F4y2Ba问:GyD.F4y2Ba不能发生。评估最小特征值的物理相关性是很重要的GyD.F4y2Ba问:GyD.F4y2Ba就数据的最后一个重要数字而言。由于从记录位置坐标的PDB文件获得数据,因此距八千年千万千分之一的任何不确定性(通过标准偏差)低于基线噪声。为了适应这种物理现实,默认的楼层阈值GyD.F4y2Ba\ (10 ^ {6} \)GyD.F4y2Ba平方的抗埃(Eghrom)应用于特征值GyD.F4y2Ba问:GyD.F4y2Ba。在频谱分解之后GyD.F4y2Ba问:GyD.F4y2Ba, 这GyD.F4y2Ba问:GyD.F4y2Ba通过其特征向量的外产物重建矩阵,其中所有特征值小于地板阈值被替换为阈值。该重建过程是在准确的逆转时对类似方法进行正规化的方法的改进GyD.F4y2Ba问:GyD.F4y2Ba是必要的。[GyD.F4y2Ba19GyD.F4y2Ba]使用物理基础的地板阈值手术,倒立GyD.F4y2Ba问:GyD.F4y2Ba(称为精确矩阵)始终存在,然后使用来计算GyD.F4y2BaP.GyD.F4y2Ba。GyD.F4y2Ba

基本动态的特征GyD.F4y2Ba

光谱分解产生每个具有特征值的特征向量,其定义一组完整的正交集体模式。当特征值从中GyD.F4y2Ba问:GyD.F4y2Ba绘制从最高到最高方差排序的模式指数,通常出现“SCEEA图”指示使用小部分的模式捕获大部分分子运动。这些模式定义了描述具有最大幅度的动作的“基本子空间”。此处理已成为标准的实践,如JED,JEDI提供了所有常用输出,例如SCE块,用于每个PC模式的平均方形波动(MSF)的绘图,以及来自用户指定的顶部模型组的组合MSF。GyD.F4y2Ba

当大规模运动基础的生物功能(例如域之间的铰链弯曲运动)时,基本子空间捕获功能动态。然而,当功能运动的幅度小于与功能无关的主导运动,例如摆动C-Terminus未绑定到功能,那么顶部模式GyD.F4y2Ba问:GyD.F4y2Ba不会生物学相关。因此,JEDI允许用户将PCA应用于系统内的子区域。通过选择不需要连续的原子子集,可以识别生物学上相关的运动,否则会在分析整个系统时被遗漏。此外,统计模型GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba提供不同的见解GyD.F4y2Ba问:GyD.F4y2Ba不提供。GyD.F4y2Ba

为GyD.F4y2BaR.GyD.F4y2Ba,特征值大于1的PC模态表明可能存在生物相关的相关运动。随着特征值的增加,原始变量数量的增加会产生影响。为GyD.F4y2BaP.GyD.F4y2Ba,最大特征值为2.由于部分相关性,将有许多变量与特征值附近。[GyD.F4y2Ba20.GyD.F4y2Ba] PC模式GyD.F4y2BaR.GyD.F4y2Ba在变量之间存在相关性的位置,而PC模式来自GyD.F4y2BaP.GyD.F4y2Ba指向增强或抑制相关运动的变量。比较GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba矩阵可以帮助识别子集中的“抑制变量”和“激活变量”。[GyD.F4y2Ba20.GyD.F4y2Ba那GyD.F4y2Ba21GyD.F4y2Ba那GyD.F4y2Ba22GyD.F4y2Ba那GyD.F4y2Ba23GyD.F4y2Ba那GyD.F4y2Ba24GyD.F4y2Ba]GyD.F4y2Ba

在进行频谱分解后GyD.F4y2Ba问:GyD.F4y2Ba那GyD.F4y2BaR.GyD.F4y2Ba, 和GyD.F4y2BaP.GyD.F4y2Ba统计模型,将对齐的构象投影到所选顶部模式上以产生散点图。这些散点图显示位移矢量投影(DVP),其中原点由用户选择的构象或原点处于在集合中的所有构象所采取的平均位置处定义的主要组件。这些散点图允许在构象空间的二维横截面中检查集体动态,以促进比较。Jedi以图形方式输出此信息,其中轨迹的每个季度具有不同的颜色,以便可以追踪时间的演变。总之,JEDI提供方便的工具来量化基础/不同的基本子空间与每种类型统计模型的顶部模式相对较好的工具。GyD.F4y2Ba

异常值和inlier过滤GyD.F4y2Ba

一种对删除异常值衍生的基本子空间差异的比较技术,然后选择它们表征罕见事件的效果。该过程在每个变量上设置Z分数阈值,或可选地进行MAD分数[GyD.F4y2Ba25GyD.F4y2Ba]。在每个帧中,查看每个变量,如果变量的值低于设置阈值,则说该变量被称为Inlier,否则是一个异常值。使用相同的RES方法通过通过变量的平均值(或中位数)替换所识别的Inlier或异常值,构建了两个不同的协方差矩阵与inliers和异常值相关联。两个协方差矩阵的不同结果以及两个GyD.F4y2BaR.GyD.F4y2Ba和二GyD.F4y2BaP.GyD.F4y2Ba随后使用诸如子空间比较的任何可用工具进行从每个协方差矩阵导出的统计模型。最终者的基本动作的差异与异常值收集了罕见事件如何影响分子功能的洞察。GyD.F4y2Ba

统计矩阵的稀疏化GyD.F4y2Ba

为了询问相关动作的特征,阈值适用于稀疏性GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba矩阵。见图。GyD.F4y2Ba2GyD.F4y2Ba湾用户可以分别为这些分析设置阈值。稀疏将低于阈值的矩阵条目设置为零。由于这些低值易受噪声的影响,稀疏的基质通过减小运动的影响来突出相关的动作。这些稀疏矩阵的后续光谱分解提供了所选择的感兴趣区域内相关动力的清晰视图。GyD.F4y2Ba

出现提示时,JEDI对原始(未置换的)和稀疏矩阵进行PCA分析,然后定量比较所得到的子空间。此外,JEDI将允许用户比较相应的条目GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba。当这些条目中差异的绝对值大于用户定义的阈值时,两个变量之间的相关性会被其他变量增强或抑制(DOF)。绝地生成一个2D地图对应的矩阵元素在哪里GyD.F4y2BaP.GyD.F4y2Ba比内在更大或更少GyD.F4y2BaR.GyD.F4y2Ba,并超过设置阈值。此地图标识了相互作用GyD.F4y2Ba启用GyD.F4y2Ba或者GyD.F4y2Ba压制GyD.F4y2Ba相关动作。可以使用此功能GyD.F4y2BaP.GyD.F4y2Ba和GyD.F4y2BaR.GyD.F4y2Ba矩阵或其任何稀疏版本。GyD.F4y2Ba

确定变量之间重要相互作用的关键是在条目之间的绝对差异中设置适当的阈值GyD.F4y2BaP.GyD.F4y2Ba和GyD.F4y2BaR.GyD.F4y2Ba矩阵,并检查不同水平的差异的差异方向。因此,使用具有各种阈值的稀疏矩阵可以引起与分子功能相关的物理成对相互作用。GyD.F4y2Ba

在空间和统计决议中进行权衡GyD.F4y2Ba

有效的统计分析需要平衡空间分辨率水平与数据的固有自由度。考虑一个有20个原子、10个重原子、4个主原子和1个碳原子的残留物。请注意,重原子是非氢原子。在这种情况下,有60个自由度可用。如果选择全原子级的分辨率,则考虑全部60自由度。在重原子分辨率下,考虑30 DOF。主干分析(定义N-C-C-O原子)涉及12自由度。α -碳分析仅使用3 DOF。不是所有的自由度都能提供同样的信息。例如,3自由度的α碳原子是常用的,因为它能很好地跟踪残基的整体运动,尽管残基内部的构象变化信息丢失了。GyD.F4y2Ba

增加空间分辨率允许探索构象运动的更详细的细节,但是随着采样相同数量的帧,考虑更多的DOF,统计分辨率降低。除了降低统计推断外,增加空间分辨率是否会增加计算时间,其中CPU时间执行频谱分解量表为GyD.F4y2Ba\(DOF ^ 3 \)GyD.F4y2Ba。跟踪更多数据的其他复杂性具有需要解释的更高维数据集。通常,增加空间分辨率降低统计分辨率,反之亦然。因此,JEDI能够在具有指定空间分辨率的系统内选择子区域,以优化该权衡以阐明功能机制。GyD.F4y2Ba

分层PCA和分布式DOFGyD.F4y2Ba

同时增加空间和统计决议,这是一个小说GyD.F4y2Ba分层GyD.F4y2Ba采用PCA (HPCA)。据我们所知,HPCA被提出为协方差分裂[GyD.F4y2Ba26GyD.F4y2Ba,但没有以同样的方式实现。在这里,HPCA使用残差来定义分布式自由度的一套完整的构建块。每个剩余部分都有指定数量的自由度(GyD.F4y2BaHGyD.F4y2Ba),表示残体中所有原子或所有重原子的局部构象运动。这些都是GyD.F4y2Ba分散式GyD.F4y2Ba通过对每个残基应用cPCA得到一组特征向量,我们称之为GyD.F4y2Baeigenresidue.GyD.F4y2Ba,以及我们呼叫的一组PC(广义坐标)GyD.F4y2BaResiduepcs.GyD.F4y2Ba。然后使用那些残留物来构建新的协方差基质,其当因偶象和卷曲而导致ED的原子水平近似。GyD.F4y2Ba

为了使这种方法起作用,需要对整个感兴趣的区域以及该区域内的每个残基使用相同的排列构象。换句话说,整个计算必须使用一个单一的坐标系。这也确保了结果将与直接的强力方法一致。使用单一的全局对齐,为每个残留存储一组残留epc。残留epcs的数量用来表示一个残留定义了该残留的DOF的数量。残差模态是一组代表残差模态内部运动的广义坐标,其中顶层模态捕获了大部分大规模运动。值得一提的是,如果使用每个残留的所有残留epcs, HPCA将给出与标准cPCA方法完全相同的结果,并且需要大约相同的CPU时间。GyD.F4y2Ba

由于协方差PCA的性质,顶部PC模式(即大多数相关的特征率)捕获在每个残留物内局部发生的主要原子动作。因此,容易控制所需的空间分辨率,其中较小GyD.F4y2BaHGyD.F4y2Ba通过较少的空间分辨率产生更快的计算。整个系统或所选择的次区域,由不完全的基本组织表示。对应于特征的每个DOF在整个残留物中编码分布式信息。掉落GyD.F4y2BaDOF.GyD.F4y2Ba意味着信息在概念上类似的方式被丢弃,以及当碳α原子用于表示蛋白质中的整个残基时。然而,与碳α方法不同,在每个残留物内发生的最相关的构象运动是在最初的大多数本征中优先考虑。因此,递减返回设置为GyD.F4y2BaHGyD.F4y2Ba是增加了。GyD.F4y2Ba

通过HPCA,可以为数千个残留物进行ALL-ATOM分析。例如,一种蛋白质GyD.F4y2BamGyD.F4y2Ba残留使用GyD.F4y2Ba\(h = 3 \)GyD.F4y2Ba(即每次残留的3个特征率),每次残留捕获3个分布的DOF。这GyD.F4y2Ba\ \ (3 m \ * 3米)GyD.F4y2Ba协方差矩阵与碳α方法相同。在常见的做法中,仅考虑具有最大方差的顶级PC模式,如SCREE图所示,HPCA提供了出色的近似。此外,HPCA的计算时间将大大提高并且允许在内存使用情况下显着降低。GyD.F4y2Ba

在分析大型蛋白质的主要大规模运动时,不需要保留原子级的细节。在本例中,设置GyD.F4y2Ba\(h = 1 \)GyD.F4y2Ba提供足够的准确性。用户可以覆盖GyD.F4y2Ba\(h = 3 \)GyD.F4y2Ba默认设置GyD.F4y2BaHGyD.F4y2Ba满足特定需求。作为一般的拇指,GyD.F4y2BaHGyD.F4y2Ba对于大型系统来说应该很小,并且对于较小的系统制作更大。GyD.F4y2Ba

残留残留耦合图GyD.F4y2Ba

特征化还用于表征残留残留偶联。对于两个或更多个残留物,用户选择一组感兴趣的残留物。在全原子水平处,该残留物集合定义了对准的子区域,其中对于所选区域内的每个残留物对分别进行对准,然后分别为每个残基计算所有特征率。对于每对残留物,一个GyD.F4y2Baeigenresiduepair.GyD.F4y2Ba由每个参与的残留物和相关的PC构成的特征化构成,称为GyD.F4y2BaResiduePairpcs.GyD.F4y2Ba生成。GyD.F4y2Ba

选择GyD.F4y2BaHGyD.F4y2Ba每次残留的DOF(ResiduePairpcs)导致aGyD.F4y2Ba\ \ (2 h乘以2 h \)GyD.F4y2Ba模式耦合协方差矩阵(MCCM)。在在MCCM上执行特征值分解之后,从MCCM的PC模式的组件的第1和第2部分分别对应于给定的残留物对中的第1和第2特征序列。引入评分功能以量化每个残留物的每个PCM模式的参与程度。GyD.F4y2Ba

计算PC模式的每个组件的平均方形波动(MSF)。由于每个模式都是归一化的,因此在所有组件上的MSF的总和是1.在第1个和第2个组件上求和MSFGyD.F4y2BaK.GyD.F4y2Ba-th模式导致GyD.F4y2Ba\(w_1(k)\)GyD.F4y2Ba和GyD.F4y2Ba\(w_2(k)\)GyD.F4y2Ba重量,在哪里GyD.F4y2Ba\(w_1(k) + w_2(k) = 1\)GyD.F4y2Ba。这些重量给出了残留物1和2的相应分数GyD.F4y2BaK.GyD.F4y2Ba-th模式。什么时候GyD.F4y2Ba\(w_1(k)\)GyD.F4y2Ba在接近50%时,残差之间存在强模耦合。模态耦合强度随GyD.F4y2Ba\(w_1(k)\)GyD.F4y2Ba偏离50%的偏差。评分函数定义为GyD.F4y2Ba\(s = \ sum _ {k = 1} ^ h g(w_1(k) - w_1(k))\ lambda(k)/ tr(mccm)\)GyD.F4y2Ba在哪里GyD.F4y2Ba\(\ lambda(k)\)GyD.F4y2Ba是特征值GyD.F4y2BaK.GyD.F4y2Ba-th MCCM的PC模式,GyD.F4y2BaTR.GyD.F4y2Ba()是跟踪操作,和GyD.F4y2BaGGyD.F4y2Ba是高斯概率密度以0为中心,标准偏差设定为0.25。请注意,差异范围,GyD.F4y2Ba\ ((w_2 - w_1) \)GyD.F4y2Ba在-1和1之间。此评分功能平滑地量化了每个模式的模式耦合程度,由模式捕获的数据中的数据百分比加权。GyD.F4y2Ba

模式耦合强度的评分函数依赖于GyD.F4y2BaHGyD.F4y2Ba。影响得分函数的最相关信息来自顶尖的特征,这就是增加的原因GyD.F4y2BaHGyD.F4y2Ba超越了Scree Point导致得分的边际变化。但是,由于MCCM的大小增加,因此不会出现超常模式的快速收敛,因为模式的大小增加为GyD.F4y2BaHGyD.F4y2Ba增加。尽管如此,分数慢慢收敛,稳定的结果通常发生GyD.F4y2Ba\(h> 9 \)GyD.F4y2Ba。因为计算非常快,GyD.F4y2Ba\(h = 12 \)GyD.F4y2Ba用作默认值以确保产生定性一致的结果。表示所选子区域中所有残基对的残基 - 残基偶联倾斜的基质的热图图像作为输出。用户可以改变GyD.F4y2BaHGyD.F4y2Ba监控结果的灵敏度。GyD.F4y2Ba

依赖和特性的总结GyD.F4y2Ba

绝地的Java代码可以从:(https://github.com/charlesdavid/JEDi)下载。GyD.F4y2Ba

关键资源包括可执行JAR文件、输入文件和用户手册(附加文件1)。附加资源提供了关于PCA、基本动态和示例数据集。绝地武士是用Java编写的。要运行JEDi的机器应该安装JRE版本1.8或更高。程序可以从已编译的源文件或提供的可执行jar文件运行。GyD.F4y2Ba

依赖性GyD.F4y2Ba

以下外部库是必需的,并与JEDI程序打包:GyD.F4y2Ba

  • Jama Matrix:Jama-1.0.3.jarGyD.F4y2Ba

  • Java Commons:JCOMMON-1.0.23.JARGyD.F4y2Ba

  • Apache Commons压缩:Commons-compress-1.19.jarGyD.F4y2Ba

  • JFReeChart:JFreeChart-1.0.19.jar,jfreeChart-1.0.19-explieshing.jar,jfreechart-1.0.19-swt.jarGyD.F4y2Ba

  • PDF估计量:estimatePDF.jarGyD.F4y2Ba

特征GyD.F4y2Ba

  1. 1GyD.F4y2Ba

    多线程GyD.F4y2Ba。Jedi_Driver_Mt.java类实例化了使用多线程运行Jedi的所有方法。用户必须分配CPU和内存资源。GyD.F4y2Ba

  2. 2GyD.F4y2Ba

    任务管理GyD.F4y2Ba。检查高维数据依赖于指定要执行的分析以及相关的分析参数。通过在包含所有所需信息的单个输入文件中读取Jedi驱动程序类,使JEDI运行的任务是简单的。GyD.F4y2Ba

  3. 3.GyD.F4y2Ba

    用户手册GyD.F4y2Ba。有关如何在JEDI用户手册中提供JEDI中的每个任务的详细信息,请参阅有关如何应用方法的建议。GyD.F4y2Ba

  4. 4.GyD.F4y2Ba

    预由步骤GyD.F4y2Ba。初步运行为作为轨迹数据读入的PDB文件中的所有原子生成一个JEDi格式的坐标矩阵文件。这个初始步骤可以使后续的子集分析执行得更快。它还可以保证用于子集选择的指定原子/残基以矩阵形式正确表示。在此步骤之后,除了用于执行坐标对齐的参考PDB文件外,不使用初始PDB文件。预处理步骤的输入高亮显示如下:GyD.F4y2Ba

    • PDB文件可以是标准格式的单链或多链。GyD.F4y2Ba

    • PDB文件可能是未压缩的,压缩,栅格,Bzpipper或Tarred。GyD.F4y2Ba

    • Jedi将使用标题“原子”或“hetatm”处理PDB记录。GyD.F4y2Ba

    预处理步骤的输出亮点是:GyD.F4y2Ba

    • 变量统计图:平均值,方差,偏度,峰度GyD.F4y2Ba

    • 执行最佳对齐之前和之后的原子坐标矩阵(当DOOUTPUTCOORDINATES = TRUE)GyD.F4y2Ba

    • 构象RMSD和残留RMSF。GyD.F4y2Ba

    • PDB文件中的b因子,替换为残留的RMSF。GyD.F4y2Ba

  5. 5.GyD.F4y2Ba

    分析类型GyD.F4y2Ba。用户可以指定多个子区域(GyD.F4y2Ba子集GyD.F4y2Ba原子)用于使用不同级别的分析GyD.F4y2Ba解析度GyD.F4y2Ba,不同的GyD.F4y2Ba类型GyD.F4y2Ba主成分分析。分析类型的重点是:GyD.F4y2Ba

    • 所有的原子GyD.F4y2Ba\(\右箭头\)GyD.F4y2BaPDB中的所有原子。GyD.F4y2Ba

    • 所有原子层次GyD.F4y2Ba

    • 重原子GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba所有的原子,除了氢。GyD.F4y2Ba

    • 重型原子等级GyD.F4y2Ba

    • 骨干GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba4个骨架原子(N-C-C-O)。GyD.F4y2Ba

    • α碳GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba\(\ text {c} _ \ alpha \)GyD.F4y2Ba仅原子。GyD.F4y2Ba

    • 原子清单GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba用户定义的原子。GyD.F4y2Ba

    • 距离对GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba用户定义的一对原子。GyD.F4y2Ba

    • 个人残留物GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba残留物中的所有原子。GyD.F4y2Ba

    • 残留对GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba所有耦合得分。GyD.F4y2Ba

  6. 6.GyD.F4y2Ba

    统计模型GyD.F4y2Ba。选择三个GyD.F4y2Ba模型GyD.F4y2Ba类型:GyD.F4y2Ba

    • 协方差(始终执行)GyD.F4y2Ba

    • 相关性GyD.F4y2Ba

    • 部分相关性GyD.F4y2Ba

  7. 7.GyD.F4y2Ba

    可视化GyD.F4y2Ba。用户可以选择最相关模式的数量以保留和通过子集可视化。可以进行两种类型的可视化:GyD.F4y2Ba

    • 个人模式动态。GyD.F4y2Ba

    • 所选顶级模式的动态组合。GyD.F4y2Ba

  8. 8.GyD.F4y2Ba

    数据探索GyD.F4y2Ba。有许多参数,用户可以调整以改变检查过程中分析的特性。这些分析的输出通知用户基本动态的性质,以帮助阐明生物学功能背后的机制。用于定制检查的输入亮点是:GyD.F4y2Ba

    • ed的维度GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba顶级模式的数量。GyD.F4y2Ba

    • 分层PCA.GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba特征数量的数量。GyD.F4y2Ba

    • 异常处理GyD.F4y2Ba\(\右箭头\)GyD.F4y2Baz分数或MAD分数。GyD.F4y2Ba

    • 原子子集GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba方差,歪斜,血管症。GyD.F4y2Ba

    • 下采样GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba斯特罗布帧。GyD.F4y2Ba

    • 框架的选择GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba用于盆分析。GyD.F4y2Ba

    • SparsificationGyD.F4y2Ba\(\右箭头\)GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba门槛。GyD.F4y2Ba

    • 内核pca.GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba类型和参数。GyD.F4y2Ba

    • 自由能源面GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba平滑水平。GyD.F4y2Ba

    • 冗长GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba输出文件类型。GyD.F4y2Ba

    数据检查的输出亮点是:GyD.F4y2Ba

    • 平均,方差,偏斜,每个变量的Kurtosis。GyD.F4y2Ba

    • MSA分数和KMO统计数据。GyD.F4y2Ba

    • 统计模型GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba情节GyD.F4y2Ba问:GyD.F4y2Ba那GyD.F4y2BaR.GyD.F4y2Ba那GyD.F4y2BaP.GyD.F4y2Ba矩阵。GyD.F4y2Ba

    • 所有特征值为GyD.F4y2Ba问:GyD.F4y2Ba那GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba。GyD.F4y2Ba

    • Scee和累积百分比差异图。GyD.F4y2Ba

    • 每种模式为MSFGyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba未加权的加权。GyD.F4y2Ba

    • 降低矩阵GyD.F4y2Ba\(\右箭头\)GyD.F4y2Baatom到残留物。GyD.F4y2Ba

    • 位移矢量投影(DVP)。GyD.F4y2Ba

    • 最顶层的电脑模式GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba问:GyD.F4y2Ba那GyD.F4y2BaR.GyD.F4y2Ba和GyD.F4y2BaP.GyD.F4y2Ba。GyD.F4y2Ba

    • 高质量的PNG图像GyD.F4y2Ba\(\右箭头\)GyD.F4y2Ba默认输出。GyD.F4y2Ba

  9. 9.GyD.F4y2Ba

    子空间的比较GyD.F4y2Ba。强大的工具套件可以在不同的统计模型和所选子区域之间进行定量子空间比较。输出亮点是:GyD.F4y2Ba

    • 累积重叠(CO)。GyD.F4y2Ba

    • 均方根内积(RMSIP)。GyD.F4y2Ba

    • 每个子空间随机比较。GyD.F4y2Ba

    • 规范主角(PA)。[GyD.F4y2Ba27GyD.F4y2Ba]GyD.F4y2Ba

    • 统计模型之间的比较。GyD.F4y2Ba

  10. 10GyD.F4y2Ba

    独立司机GyD.F4y2Ba。可以运行其他Java程序以执行比较分析或其他分析。这些程序是:GyD.F4y2Ba

    • Viz_Driver:可以为Q,R和P结果的个体和基本动作用于PC - 模式的任何用户选择的窗口,对应于观察不同时间尺度的分子动作,具有对参数的微量控制。GyD.F4y2Ba

    • pool_driver:池将多个轨迹一起放入单个数据集中,以便于对数据集合进行另一个Jedi分析。GyD.F4y2Ba

    • SSA_Driver:在一对轨迹之间运行比较。输出是CO,RMSIP和CANONICAL PA。GyD.F4y2Ba

    • Fes_Driver:为任意两个用户选择的PC模式创建自由能表面。GyD.F4y2Ba

    • kpca_driver.java:使用选项执行内核PCA分析以选择内核并使用PCA输出或原始数据。GyD.F4y2Ba

图3GyD.F4y2Ba
图3.GyD.F4y2Ba

一种GyD.F4y2Ba-GyD.F4y2BaD.GyD.F4y2Ba将前四个瞬间显示为JEDI输出,用于在轨迹上运行分析驱动程序时立即检查。这些可用于评估原子的一般统计行为,并选择残留的子集以进行进一步分析。在GyD.F4y2BaE.GyD.F4y2Ba显示了每个原子的MSA,也是在分析运行期间检查检查的用于检查。最后GyD.F4y2BaFGyD.F4y2Ba显示RMSF,是评估MD仿真行为的常见度量GyD.F4y2Ba

结果GyD.F4y2Ba

通过分析两种β -内酰胺酶的MD轨迹,阐明了JEDi的主要特征。本文给出的结果是在高性能计算机(HPC)上生成的。除了分析整个生物分子的全原子模型之外,用户可以在现代笔记本电脑上进行典型的计算。然而,在HPC上运行JEDi充分利用了多线程。希望在同一次运行中执行多个分析的用户可以请求与同时运行的分析一样多的处理器。这允许用户在各种情况下以各种方式实时检查数据。GyD.F4y2Ba

MD模拟GyD.F4y2Ba

用于说明目的的模拟是TEM-1和TEM-52β-内酰胺酶的全原子分子动力学模拟。为500次进行模拟GyD.F4y2Bans.GyD.F4y2Ba每一个都使用了GROMACS MD模拟软件,每个轨迹产生10000个构象。详细的参数和协议的模拟已经发表之前。[GyD.F4y2Ba28GyD.F4y2Ba]GyD.F4y2Ba

跑吉迪GyD.F4y2Ba

包装为Java库,Jedi也分发为JAR文件。每个独立jar都将参数文件作为输入。主jaR文件jedi_driver_mt.jar读取由一组键值对组成的主要参数文件,指定要运行的分析,数据文件读取,以及每个分析的参数。JEDI参数文件专为“即插即用”功能而设计。此格式可以轻松地通过命令行手动编辑文件,并通过脚本进行自动编辑用于高吞吐量应用程序。主输入文件指示JEDI执行预处理,在所有选定的模型上运行所有方法,并执行所有选定的分析,以及修改用户可维护的设置。GyD.F4y2Ba

绝地的输出被路由到程序执行期间创建的目录。在输出目录的顶层可以找到关于每个子集的统计信息,以及选择输出的轨迹文件。执行的每个分析都由从多线程环境中的线程池中分配的不同线程处理,该线程将输出定向到子目录,在子目录中,每个统计模型都被分配到自己的目录。这确保线程不冲突,输出被干净地隔离。对于每个分析,JEDi都以压缩的bzip2形式提供原始数据,用于高效的内存存储,以及高质量的PNG文件,这些文件提供对结果的即时访问,供用户考虑,而无需使用第三方绘图软件。GyD.F4y2Ba

图4GyD.F4y2Ba
图4.GyD.F4y2Ba

可视化TEM-1的基本动态的差异GyD.F4y2Ba一种GyD.F4y2Ba没有异常值校正,GyD.F4y2BaB.GyD.F4y2Ba删除异常值,和GyD.F4y2BaCGyD.F4y2Ba选定选项。使用1.96的Z-Score截止值完成异常处理。投影由时间序列着色,红色是轨迹的开头,蓝色为止。数字GyD.F4y2BaD.GyD.F4y2Ba在异常值删除的基本子空间和无校正模式的选择模式之间显示RMSIP。我们看到基本子空间非常相似(GyD.F4y2Ba\ \ (> 0.9)GyD.F4y2Ba没有校正和异常拆卸的标识,表明异常值不会显着影响蛋白质的基本动态。无校正和异常值选择空间之间的RMSIP在投影中低得多,我们看到第一PC模式在模拟开始时由分子的放松运动主导GyD.F4y2Ba

工作流GyD.F4y2Ba

绝地工作流包含两个步骤。首先在预处理步骤中将原始结构信息转换为方便的矩阵格式;绝地可以以标准PDB格式读写数据。在预处理步骤中,将解析指定目录中的所有PDB文件,并将其转换为轨迹矩阵。可以为引用PDB文件提供完整的路径名,该文件用于需要坐标对齐的方法。来自不同文件的多个轨迹可以放置在不同的目录中。所有的轨迹对齐到相同的参考结构,使用所有帧之间共享的ICS中的原子来保持可解释性。当比较多个轨迹时,JEDi可以通过池化驱动程序(带有可选的向下采样)将它们合并为一个进行比较分析。重要的是,轨迹只有在共享相同原子的情况下才能被合用,并且它们必须在PDB文件中以相同的顺序列出。GyD.F4y2Ba

JEDI分析的第二步是执行PCA。Jedi支持alpha碳,骨干,重原子和所有原子水平的CPCA,重型原子和所有原子水平的分层PCA,指定原子,单个残留PCA和残留对耦合分析之间的DPPCA。所有这些都可以以多线程方式运行,以便有效计算。除了PCA之外,还执行PCA输出的后处理,包括子空间分析,内核PCA,自由能景观的构建,通过各种模式或叠加的eD可视化。JEDI工具集的示意图在图2中示出。GyD.F4y2Ba1GyD.F4y2Ba。GyD.F4y2Ba

图5GyD.F4y2Ba
图5.GyD.F4y2Ba

机械位置构象在前2个主要成分上的投影GyD.F4y2Ba一种GyD.F4y2Ba阿尔法碳GyD.F4y2BaB.GyD.F4y2Ba骨干GyD.F4y2BaCGyD.F4y2Ba重原子和GyD.F4y2BaD.GyD.F4y2Ba所有原子水平。随着原子细节的越来越多的分辨率,该小子集的投影细节随附增加。相比之下GyD.F4y2BaE.GyD.F4y2Ba-GyD.F4y2BaHGyD.F4y2Ba显示没有的ICS集的漏斗GyD.F4y2Ba

统计数据GyD.F4y2Ba

为每个位置坐标计算最多4个顺序的统计矩,并以高质量的PNG输出文件可视化,以便快速访问。这些统计数据的示例如图4所示。GyD.F4y2Ba3.GyD.F4y2Ba。每个曲线图为X,Y和Z组件提供了一个不同的线,并绘制抗原子数。这些时刻通知用户如何选择要分析的原子子集。用户可以指定用于差异,偏斜和峰度的不同阈值,以构建区域的原子子集,其中仅包括满足或超过这些阈值的原子。GyD.F4y2Ba

为研究罕见事件的影响,提供了离群滤波和内隐滤波。统计模型的建立要么只包括内线,要么只包括异常值。对统计模型进行了主成分分析,其内部线和异常值之间会有差异。这些差异可以通过子空间比较来量化。图中显示了该程序的一个实例。GyD.F4y2Ba4.GyD.F4y2Ba。使用异常处理进行分析TEM-1 MD仿真轨迹,以判断模拟质量。异常值分析表明,在轨迹的开始时存在罕见事件,这可能在模拟中跟踪放松。对于成功的异常处理,应明智地选择z-score或Mad阈值,以确保在Inlier和异常值集中进行适当的采样。保守地,建议使用[0.675,1.96]的Z谱得分范围。GyD.F4y2Ba

图6.GyD.F4y2Ba
图6.GyD.F4y2Ba

随着稀疏阈值的增加,相关分析。GyD.F4y2Ba一种GyD.F4y2Ba那GyD.F4y2BaCGyD.F4y2Ba, 和GyD.F4y2BaE.GyD.F4y2Ba显示来自每个分析的顶部两个平方模式,阈值分别分别示出了如何在每个模式中编码的信息如何更加稀疏地定位。GyD.F4y2BaB.GyD.F4y2Ba那GyD.F4y2BaD.GyD.F4y2Ba, 和GyD.F4y2BaFGyD.F4y2Ba显示由PCA捕获的前10个模式的子集的总均方根波动(RMSF)。这表明当模态变得更加局域化时,本质子空间中的总信息大致守恒。最后,g)给出了用于稀疏分析的RMSIP与非稀疏分析的比较GyD.F4y2Ba

多分辨率分析GyD.F4y2Ba

通过汇集驾驶员汇集TEM-1和TEM-52β-内酰胺酶的轨迹来说明多分辨率分析。为了检查分子动力学的多水平描述的影响,考虑了包含机械部位的5个残基的子集。该子集是通过将残留物列表传递给仅包含所需的残留号的JEDI来指定。所选残留物是SER70,LYS73,SER130,GLU166和LYS234 [GyD.F4y2Ba29GyD.F4y2Ba]。cPCA上GyD.F4y2Ba问:GyD.F4y2Ba使用α碳,骨干,重物和全原子分辨率在轨迹的该轨迹上进行。GyD.F4y2Ba

图7.GyD.F4y2Ba
图7.GyD.F4y2Ba

一种GyD.F4y2Ba对于整个TEM-1蛋白,显式的所有原子PCA的scree图与HPCA使用1,2,3个特征残基进行比较,显示捕获的方差接近精确方差。GyD.F4y2BaB.GyD.F4y2Ba与所有原子主成分分析发现的特征向量相比,HPCA的迭代RMSIP显示为1、2和3个特征残基。对每个氨基酸仅使用一个特征残基就可以重构高达80%的显式分析,而包含更多自由度则可以将其提高到95%GyD.F4y2Ba

子区域运动在顶部两个PC模式上的投影如图4所示。GyD.F4y2Ba5.GyD.F4y2Ba用于四个分辨率级别的A-D。随着原子分辨率的水平增加,在投影空间中存在相应的分辨率增加。值得注意的是,α碳和骨架子集之间存在很大差异(图。GyD.F4y2Ba5.GyD.F4y2Baa, b)与重原子和全原子子集的比较(图。GyD.F4y2Ba5.GyD.F4y2Bac, d).在更高的分辨率下,每个分子的轨迹投影中出现多个团簇,表明亚稳定构象态之间的动态跃变。这些盆地在低分辨率下不易识别。以高分辨率探测小区域的能力有助于揭示控制分子功能的盆地。有趣的是,TEM-1和TEM-52在所有分辨率水平上都保持了整体的差异。GyD.F4y2Ba

在确定蛋白质的大规模运动时,使用PCA考虑多分辨率分析。数字GyD.F4y2Ba5.GyD.F4y2BaE-H显示整个蛋白质内的IC残基的相同分辨率漏斗。从全原子分析中,全球范围内没有明显的增益。出现此结果是因为整个蛋白质的大构象动作Eclips在高分辨率下观察到的小幅度运动。正如预期的那样,α碳或骨干PCA可用于全局分析,而目标重物或全原子分析对于提取机械信息的小残留子是有用的。GyD.F4y2Ba

SparsificationGyD.F4y2Ba

R和P标准化统计基质的稀疏允许澄清顶部方形模式中的原子运动。选择稀疏阈值的选择,以维持中等的RMSIP分数但去除许多微小相关的相互作用时,可以究竟可以看到哪个原子有助于可以指示分子功能的关键集体运动。GyD.F4y2Ba

稀疏对TEM-1的机械残留的运动的影响如图2所示。GyD.F4y2Ba6.GyD.F4y2Ba。数据GyD.F4y2Ba6.GyD.F4y2Baa,b使用正常(不稀释的)相关矩阵从PCA显示顶部两个平方模式和顶部10模式上的RMSF。顶部方形模式表明第二个残留物中的原子Lys73在相关的运动中起重要作用,但是基本动态在子集中的许多原子上铺展。这在RMSF的广泛分布中表示。GyD.F4y2Ba

数字GyD.F4y2Ba6.GyD.F4y2BaC,D和E,F示出了相同的信息,但是PCA分别在流出的相关矩阵上进行,分别为0.5和0.7的阈值。随着稀疏的增加,方形模式中的背景噪声降低。有趣的是,它视觉上变得明显参与最高相关动作的原子发生在残留物Lys73和Lys234中。超过10模式的RMSF图表明基本子空间中包含的总信息与稀疏阈值无关。这通过具有稀疏和普通PC模式的PC模式之间的RMSIP可以是量化的,如图4所示。GyD.F4y2Ba6.GyD.F4y2Bag.对于较高的阈值,单个模态的重叠很小,但随着子空间维数的增加,RMSIP再次增加。稀疏的基本动力学也可以通过绝地可视化驱动程序生成的pymol脚本直接在分子上可视化。本节中讨论的动议的影片在附加文件2中提供。GyD.F4y2Ba

分层PCA.GyD.F4y2Ba

为了说明层次PCA (HPCA)的等价性和优越性,我们对整个蛋白质进行了1、2、3个特征残基的全原子PCA和全原子HPCA的显式分析,并进行了比较。采用子空间分析来评价结果的相似性。数字GyD.F4y2Ba7.GyD.F4y2Ba展示在HPCA计算中使用的越来越多的特征分之下,基本子空间的总方差方法接近用蛮力所有原子PCA计算的真实方差。GyD.F4y2Ba

从子空间比较显示的全原子HPCA和全原子HPCA的RMSIP如图所示。GyD.F4y2Ba7.GyD.F4y2Ba湾高 (GyD.F4y2Ba\ \ (> 0.8)GyD.F4y2Ba)两个子空间之间的RMSIP表明,即使是一个特征残基也能捕获蛋白质的整体运动。随着特征留数的增加,精度增加。对于同一个碳分析的计算成本,使用三个特征残基可以得到一个非常高的(GyD.F4y2Ba\(> 0.95 \)GyD.F4y2Ba)RMSIP到明确的所有原子方法。该示例清楚地表明HPCA是蛮力所有原子PCA的偏差近似,同时显着减少计算时间。GyD.F4y2Ba

图8GyD.F4y2Ba
图8.GyD.F4y2Ba

的活性位点残基的残基对交互分数:GyD.F4y2Ba一种GyD.F4y2BaTEM-1和GyD.F4y2BaB.GyD.F4y2BaTEM-52。残留物对的相互作用评分可以从0-100的范围内,其中0表示不相互作用,100表示​​最大相互作用。GyD.F4y2BaCGyD.F4y2Ba显示两个交互网络(TEM-52减去TEM-1)的差异,以突出相互作用网络的差异GyD.F4y2Ba

图9.GyD.F4y2Ba
图9.GyD.F4y2Ba

一种GyD.F4y2Ba-GyD.F4y2Ba一世GyD.F4y2Ba在调用KPCA例程时显示由JEDi计算的一些内核。在每个图中,绝地武士用时间序列给构象上色,将轨迹分成四段,分别用红、蓝、绿、黄表示GyD.F4y2Ba

图10.GyD.F4y2Ba
图10GyD.F4y2Ba

吉迪的自由能量表面输出。GyD.F4y2Ba一种GyD.F4y2Ba显示左侧视图和GyD.F4y2BaB.GyD.F4y2Ba显示右侧视图GyD.F4y2Ba

残留对耦合GyD.F4y2Ba

计算残余物耦合作为热图在图2中示出。GyD.F4y2Ba8.GyD.F4y2Baa、b分别为TEM-1和TEM-52的活性位点残基。许多残基之间有很高的交互分数,表明它们的成对运动是相关的。在无花果。GyD.F4y2Ba8.GyD.F4y2Bac示出了两种酶的相互作用矩阵(TEM-52减去TEM-1)的差异。得到的残余对偶联的变化是稀疏的,表明两种酶的大多数残基对相互作用网络是相似的。然而,当其中一种残留物是Lys73或Lys234时,存在残留残留偶联的含量。残留对耦合的下降表示TEM-52中的运动不太耦合。该结果与TEM-52结合位点一致,比TEM-1的特异性较少。GyD.F4y2Ba

子空间分析GyD.F4y2Ba

子空间分析函数随着子空间维数的增加迭代计算RMSIP,并通过与等价向量空间和子空间维数的多次随机比较得到的z分数进行比较来估计每个RMSIP分数的显著性。对整个基本子空间运行额外的分析以获得多个指标。当多个PCA模型是被分析为同一子集的原子(包括sparsification结果),或者显式的PCA和HPCA选择同样的子集(分辨率),然后将自动完成子空间分析比较,和输出定向到子目录的标签。GyD.F4y2Ba

分子运动的可视化GyD.F4y2Ba

Jedi包括一个程序,该程序从笛卡尔PCA中获取特征向量,并生成每个模式和基本子空间所描述的动态的高质量电影。有关如何动画的详细信息,请在原始jed文件中给出[GyD.F4y2Ba13GyD.F4y2Ba]。此驱动程序已重构具有新功能,现在产生更新的Pymol脚本,用于查看原子的细节。在附加文件中提供整个分子和子集运动的例子GyD.F4y2Ba1GyD.F4y2Ba。对可视化进行了JED中没有的几个改进和扩展。这些电影的例子可以在附加文件中找到GyD.F4y2Ba2GyD.F4y2Ba。GyD.F4y2Ba

内核pca.GyD.F4y2Ba

JEDi包含一组程序,这些程序接收PCA分析的输出,并将它们导入用户选择的内核中进行KPCA分析。PCA预处理确保内核的输入包含原始数据中最关键的元素,同时大大减少计算时间。JEDi提供了十几种不同的内核来研究数据中非线性特性的存在。用户可以打开这个特性并选择应用哪个内核。这些核的例子如图所示。GyD.F4y2Ba9.GyD.F4y2BaA-L作为高质量的PNG图像进行即时检查。GyD.F4y2Ba

自由能景观GyD.F4y2Ba

绝地包含一个程序,它利用最上面的两台pc或dvp来计算自由能面。这些图从两个不同的角度呈现为三维散点图。可以打开这个功能,并为每个PCA分析生成图形输出。这个输出的一个例子可以在图中看到。GyD.F4y2Ba10GyD.F4y2BaA,B,其中高质量的PNG图像给出了两个不同的观点,以帮助识别景观的几何形状。GyD.F4y2Ba

结论GyD.F4y2Ba

我们开发了一个以Java编写的基本动态分析工具包,执行许多对多元统计数据的最佳实践的任务。Jedi Toolkit提供的功能比目前可用的工具更多。分析方法是集成的,并且由于多线程,在很大程度上处理。独特的方面包括:子区域和分辨率选择,基于稀有事件的基于阈值的处理分为两组,异常值和最基,完整的PCA分析和子空间比较;R和P矩阵的稀疏性具有完整的PCA分析,子空间比较和激活器和抑制器可变检测;使用分布式DOF的分层PCA用于所有尺寸的所有原子和重型原子组;残留对相互作用分析;距离对PCA;Atom列表PCA;使用迭代RMSIP分数和主角的子空间方便分析; visualization of essential motions and individual PCA modes; the inclusion of 3 PCA models - covariance, correlation, and partial correlation. A detailed user manual (as a PDF) is made available with the download of the JEDi software package (Additional File 1). The program can be run from compiled source or from executable jar files. Additional resources include example test cases with all JEDi results.

可用性和系统要求GyD.F4y2Ba

  • 项目名GyD.F4y2Ba: Java基本动态检查器GyD.F4y2Ba

  • 项目主页欧宝直播官网appGyD.F4y2Ba: https://github.com/charlesdavid/JEDiGyD.F4y2Ba

  • 操作系统GyD.F4y2Ba:平台独立GyD.F4y2Ba

  • 编程语言GyD.F4y2Ba:Java.GyD.F4y2Ba

  • 其他需求GyD.F4y2Ba:JRE版本1.8或更高版本GyD.F4y2Ba

  • 执照GyD.F4y2Ba:GNU GPL 3GyD.F4y2Ba

  • 没有限制使用GyD.F4y2Ba如需复制和发展,请引证GyD.F4y2Ba

数据和材料的可用性GyD.F4y2Ba

不适用。GyD.F4y2Ba

缩写GyD.F4y2Ba

PCA:GyD.F4y2Ba

主成分分析GyD.F4y2Ba

吉迪:GyD.F4y2Ba

Java Essential Dynamics InspectorGyD.F4y2Ba

杰德:GyD.F4y2Ba

Java必不可少的动力GyD.F4y2Ba

cpca:GyD.F4y2Ba

笛卡尔主成分分析GyD.F4y2Ba

dpPCA:GyD.F4y2Ba

距离对主成分分析GyD.F4y2Ba

问:GyD.F4y2Ba

协方差矩阵GyD.F4y2Ba

r:GyD.F4y2Ba

相关矩阵GyD.F4y2Ba

P:GyD.F4y2Ba

部分相关矩阵GyD.F4y2Ba

PDB:GyD.F4y2Ba

蛋白质数据库GyD.F4y2Ba

MD:GyD.F4y2Ba

分子动力学GyD.F4y2Ba

DOF:GyD.F4y2Ba

自由度GyD.F4y2Ba

艾德:GyD.F4y2Ba

基本动态GyD.F4y2Ba

PC:GyD.F4y2Ba

主要成分GyD.F4y2Ba

集成电路:GyD.F4y2Ba

分子通信集GyD.F4y2Ba

MSA:GyD.F4y2Ba

测量抽样充足率GyD.F4y2Ba

KMO:GyD.F4y2Ba

Kaiser-Meyer-OlkinGyD.F4y2Ba

ACS:GyD.F4y2Ba

自适应协方差收缩GyD.F4y2Ba

RES:GyD.F4y2Ba

稀有事件萎缩GyD.F4y2Ba

MSF:GyD.F4y2Ba

平均平方波动GyD.F4y2Ba

DVP:GyD.F4y2Ba

位移矢量投影GyD.F4y2Ba

疯狂的:GyD.F4y2Ba

平均绝对偏差GyD.F4y2Ba

HPCA:GyD.F4y2Ba

分层主成分分析GyD.F4y2Ba

MCCM:GyD.F4y2Ba

模态耦合协方差矩阵GyD.F4y2Ba

JRE:GyD.F4y2Ba

Java运行时环境GyD.F4y2Ba

表示:GyD.F4y2Ba

均方根偏差GyD.F4y2Ba

RMSF:GyD.F4y2Ba

根均线波动GyD.F4y2Ba

RMSIP:GyD.F4y2Ba

根均线内部产品GyD.F4y2Ba

PA:GyD.F4y2Ba

主角GyD.F4y2Ba

CO:GyD.F4y2Ba

累积重叠GyD.F4y2Ba

高性能计算:GyD.F4y2Ba

高性能计算GyD.F4y2Ba

KPCA:GyD.F4y2Ba

内核主成分分析GyD.F4y2Ba

参考文献GyD.F4y2Ba

  1. 1.GyD.F4y2Ba

    hollingsworth sa,dror ro。所有的分子动力学模拟。神经元。2018; 99(6):1129-43。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  2. 2.GyD.F4y2Ba

    Ernst M,Sittel F,股票G.蛋白质动力学的接触和距离的主要成分分析。J Chem Phys。2015; 143(24):12-6401。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  3. 3.GyD.F4y2Ba

    David CC, Jacobs DJ。主成分分析:一种测定蛋白质基本动力学的方法,2014;pp。193 - 226。新泽西州托托瓦,Humana出版社。GyD.F4y2Bahttps://doi.org/10.1007/978-1-62703-658-0_11GyD.F4y2Ba

  4. 4.GyD.F4y2Ba

    Trivedi DV, David C, Jacobs DJ, Yengo CM。Switch ii突变体揭示了myosin v. Biophys J .的核苷酸和肌动蛋白结合区域之间的耦合。2012年,102(11):2545 - 55。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  5. 5。GyD.F4y2Ba

    Amadei A, Linssen AB, Berendsen HJ。蛋白质的基本动力学。蛋白质的结构、功能和生物活性。1993;17(4):412-25。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  6. 6。GyD.F4y2Ba

    Jolliffe它。统计中的施普林格级数。主成分分析。2002; 29。GyD.F4y2Ba

  7. 7。GyD.F4y2Ba

    伊顿ml。多变量统计:矢量空间方法。纽约,纽约:Wiley;1983年。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  8. 8。GyD.F4y2Ba

    亚伯拉罕MJ,Murtola T,Schulz R,PállS,史密斯JC,Hess B,Lindahl E. Gromacs:通过从笔记本电脑到超级计算机的多级并行性高性能分子模拟。softwarex。2015; 1:19-25。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  9. 9。GyD.F4y2Ba

    案例DA,Cheatham Te III,Darden T,Gohlke H,Luo R,Merz Km JR,Onufriev A,Simmerling C,Wang B,Woods RJ。琥珀生物分子仿真程序。j计算化学。2005; 26(16):1668-88。GyD.F4y2Bahttps://doi.org/10.1002/jcc.20290GyD.F4y2Ba。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  10. 10。GyD.F4y2Ba

    Roe Dr,Cheatcham Te III。PTRAJ和CPPTRAJ:用于处理和分析分子动力学轨迹数据的软件。J Chem理论计算。2013; 9(7):3084-95。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  11. 11.GyD.F4y2Ba

    Grant Bj,Rodrigues AP,Elsawy Km,McCammon Ja,Caves Ls。Bio3d:蛋白质结构比较分析的R包。生物信息学。2006; 22(21):2695-6。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  12. 12.GyD.F4y2Ba

    罗斯C,Nizami B,Glenister M,Sheik Amamuddy O,Atilgan AR,阿特本C,Tastan BishopÖ。模式任务:大规模蛋白质运动工具。生物信息学。2018; 34(21):3759-63。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  13. 13.GyD.F4y2Ba

    David CC,Singam Era,Jacobs DJ。杰德:蛋白质轨迹比较分析的Java基本动态程序。欧宝娱乐合法吗BMC生物信息学。2017; 18(1):271。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  14. 14.GyD.F4y2Ba

    Lindorff-Larsen K,Ferkinghoff-Borg J.蛋白质合奏的相似措施。Plos一个。2009; 4(1):4203。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  15. 15.GyD.F4y2Ba

    David CC, Jacobs DJ。从结构中表征蛋白质运动。J Mol图模型。2011; 31:41-56。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  16. 16。GyD.F4y2Ba

    Cerny Ba,Kaiser HF。因子分析相关矩阵采样充分性测量的研究。多功能行业RES。1977; 12(1):43-7。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  17. 17。GyD.F4y2Ba

    Kaiser高频。第二代小瞬间。心理测量欧宝直播官网app学,1970,35(4):401 - 15所示。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  18. 18。GyD.F4y2Ba

    使用多个收缩目标的大协方差矩阵的收缩估计。arXiv预印本GyD.F4y2BaarXiv: 1809.08024GyD.F4y2Ba2018年。GyD.F4y2Ba

  19. 19。GyD.F4y2Ba

    Ettayapuram Ramaprasad AS, Uddin S, Casas-Finet J, Jacobs DJ。将突变单链抗体片段的动态耦合分解为稳定和不稳定效应。J Am Chem Soc. 2017;139(48): 17508-17。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  20. 20。GyD.F4y2Ba

    Artner R,Wellingerhof PP,Lafit G,Loossens T,Vanpaemel W,Tuerlinckx F.部分相关矩阵的形状。交流统计理论方法。2020; 1-18。GyD.F4y2Bahttps://doi.org/10.1080/03610926.2020.1811338GyD.F4y2Ba。GyD.F4y2Ba

  21. 21。GyD.F4y2Ba

    Chooi C.经典和合作抑制?简体(四月)。2020; 1-5。GyD.F4y2Ba

  22. 22。GyD.F4y2Ba

    Ludlow L,Klein K.抑制器变量:“是”与“充当”的差异。j stat教育。2014; 22(2):1-28。GyD.F4y2Ba

  23. 23。GyD.F4y2Ba

    Olusegun Am,Muktar A,Kabir Kn,Adamu Ia,Abubakar UA。变量与其他变量的部分相关性如何使抑制器变量案例变得良好。int j adv stat probab。2015; 3(2):210。GyD.F4y2Bahttps://doi.org/10.14419/ijasp.v3i2.5400GyD.F4y2Ba。GyD.F4y2Ba

  24. 24。GyD.F4y2Ba

    Pandey S,Elliott W.社会工作研究中的抑制因子变量:在多元回归模型中识别的方法。J SOC SOC工作RES。2010; 1(1):28-40。GyD.F4y2Bahttps://doi.org/10.5243/jsswr.2010.2GyD.F4y2Ba。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  25. 25。GyD.F4y2Ba

    Leys C,Ley C,Klein O,Bernard P,Licata L.检测异常值:请勿使用标准偏差围绕平均值,使用中位数周围的绝对偏差。J EXP SOC SCIECOL。2013; 49(4):764-6。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  26. 26。GyD.F4y2Ba

    Van Aalten DM,De Groot BL,Findlay JB,Berendsen HJ,Amadei A.计算蛋白质基本动态的技术的比较。j计算化学。1997年; 18(2):169-81。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  27. 27。GyD.F4y2Ba

    苗族,本以色列A.关于rn中子空间之间的主角。线性代数。1992年; 171(92):81-98。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  28. 28。GyD.F4y2Ba

    农民J,Kanwal F,Nikulsin N,Tsilimigras MC,Jacobs DJ。量化分子动力学模拟轨迹之间相似性的统计措施。熵。2017; 19(12):646。GyD.F4y2Ba

    谷歌学术GyD.F4y2Ba

  29. 29。GyD.F4y2Ba

    Palzkill T.扩展光谱耐药性突变在改变TEM,CTX-M和KPCβ-内酰胺酶的特异性时的结构和机械基础。前Mol Biosci。2018; 5:16。GyD.F4y2Ba

下载参考GyD.F4y2Ba

致谢GyD.F4y2Ba

我们要感谢我们的软件用户和测试人员的深思熟虑反馈,使这项工作能够不断提高。GyD.F4y2Ba

资金GyD.F4y2Ba

没有获得这项工作的资金。GyD.F4y2Ba

作者信息GyD.F4y2Ba

隶属关系GyD.F4y2Ba

作者GyD.F4y2Ba

贡献GyD.F4y2Ba

CCD共同编写了论文并开发了代码库。CSA共同编写了纸张并在多个数据集上运行程序。DJJ共同写下了纸张并构思了分层PCA方法。所有作者阅读并认可的终稿。GyD.F4y2Ba

通讯作者GyD.F4y2Ba

对应于GyD.F4y2BaCharles C. DavidGyD.F4y2Ba。GyD.F4y2Ba

道德声明GyD.F4y2Ba

伦理批准并同意参与GyD.F4y2Ba

不适用。GyD.F4y2Ba

同意出版GyD.F4y2Ba

不适用。GyD.F4y2Ba

利益争夺GyD.F4y2Ba

提交人声明他们没有竞争利益。GyD.F4y2Ba

附加信息GyD.F4y2Ba

出版商的注意事项GyD.F4y2Ba

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。GyD.F4y2Ba

补充信息GyD.F4y2Ba

附加文件1。GyD.F4y2Ba

JEDI用户手册GyD.F4y2Ba

附加文件2。GyD.F4y2Ba

补充图像:ZIP档案的MPEG电影GyD.F4y2Ba

权利和权限GyD.F4y2Ba

开放获取GyD.F4y2Ba本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问GyD.F4y2Bahttp://creativecommons.org/licenses/by/4.0/GyD.F4y2Ba。“创作共用公共领域”豁免书(GyD.F4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/GyD.F4y2Ba)适用于本文中提供的数据,除非另有用入数据的信用额度。GyD.F4y2Ba

再版和权限GyD.F4y2Ba

关于这篇文章GyD.F4y2Ba

通过十字标记验证货币和真实性GyD.F4y2Ba

引用这篇文章GyD.F4y2Ba

David,C.C.,Avery,C.S.&Jacobs,D.J.JEDI:Java基本动态检查员 - 分子轨迹分析工具包。GyD.F4y2Ba欧宝娱乐合法吗22,GyD.F4y2Ba226(2021)。https://doi.org/10.1186/s12859-021-04140-5GyD.F4y2Ba

下载引用GyD.F4y2Ba

关键词GyD.F4y2Ba

  • 基本动态GyD.F4y2Ba
  • 主成分分析GyD.F4y2Ba
  • 分层主成分分析GyD.F4y2Ba
  • 内核主成分分析GyD.F4y2Ba
  • 稀疏主成分分析GyD.F4y2Ba
  • 子空间分析GyD.F4y2Ba
  • 异常检测GyD.F4y2Ba
  • 罕见的事件GyD.F4y2Ba
  • 协方差收缩GyD.F4y2Ba
\GyD.F4y2Ba