跳过主要内容

RPocket:一个直观的RNA口袋拓扑信息数据库,包含RNA配体数据资源

抽象的

背景

RNA通过与其他分子的相互作用调节多种生物功能。配体通常结合在RNA口袋,以触发结构变化或功能。因此,探索和可视化RNA口袋,阐明RNA-配体复合物形成的结构和识别机制是至关重要的。

结果

在这项工作中,我们开发了一个用户友好的生物信息工具,Rpocket。该数据库为RNA口袋,RNA-Ligand交互信息和功能位点提供几何尺寸,质心,形状,二级结构元件。我们从94个非冗余RNA-配体复合物结构中提取了240个RNA口袋。我们开发了RPDescriptor,以定量计算口袋几何特征。然后通过掺入序列,二次结构和几何组合来进行几何信息进行RNA-配体结合分析。这种新方法利用结构的原子级精度和核苷酸级三级相互作用。结果表明,较高级拓扑模式确实改善了三级结构预测。我们还提出了RNA-配体复合物形成的潜在机制。静电相互作用负责远程识别,而VAR DER WALS和用于短距离结合和优化的疏水触点。这些相互作用对可以被认为是指导复杂结构建模和药物设计的距离约束。

结论

Rpocket数据库将促进RNA-Ligand工程来调节生物或医疗应用的复杂形成。Rpocket可在http://zhaoserver.com.cn/rpocket/rpocket.html.

背景

RNA通过与其他分子的相互作用调节多种生物功能。目前认识到,超过70%的人类基因组被转录为非编码RNA [1].相比之下,1.5%的人类基因组编码蛋白质,并且只有0.05%的人类基因组被鉴定为蛋白质靶向药物发育。人类可能产生超过15,000个长编码RNA [1]因此,即使这些非编码RNA中的一小部分最终也可能被证明是与疾病相关的药物靶点。例如,HIV-tat RNA与乙酰丙嗪的结合可以抑制tat-TAR相互作用[2]此外,核黄素通过靶向黄素RNA核苷开关而表现出抗菌特性[3.]类似地,最近的一项研究表明,核苷酸类似物抑制剂通过与病毒依赖性RNA聚合酶结合,在一个重要分子中参与了新冠病毒-19的发病机制[4.].因此,据信RNA更广泛参与各种调节过程。

目前,一些实验方法可以确定RNA-配体结构。不幸的是,柔性RNA分子是挑战性的,以良好地结晶和通过X射线晶体学确定。此外,电子显微镜昂贵且耗时。由于这些技术限制,可用的RNA-Ligand实验结构很少(2月19日,2020年2月19日)。一些计算方法可以通过同源片段模拟预测RNA和RNA-配体结构[5.6.7.8.9.101112,分子动力学模拟[13141516]或对接[171819].然而,由于对rna -配体结合结构原理的了解有限,预测高精度的rna -配体结构仍然具有挑战性。

有几个现有的RNA相关数据库和工具提供序列、结构或相互作用信息(附加文件1如:(1)结构数据库(PDB、NAD、PDB- ligand、R-bind)提供了rna -配体配合物的三级结构信息、配体的结构和理化性质[20.212223];(2) rna -配体实验数据库(NALDB、SMMRNA、KDBI)提供了rna -配体形成的化学反应信息和动力学数据[242526];(3)RNA对接数据集和工具(RRDB,HNADOCK,DABLSCORERNA和LIGANDRNA)提供对接算法,评分功能和对接基准[17272829];(4)RNA口袋检测工具(3 V,Caver和Pocketfinder)识别RNA口袋和口袋尺寸[30.3132].但是,这些数据库中的可用信息不能直接用于RNA配体研究。分析的RNA口袋和结合位点仍然最小。因此,迫切需要全面和更新的RNA口袋数据库,尤其是针对药物发育的RNA中的口袋。

在这里,我们对94个非冗余RNA配体复合物结构中的240个口袋进行了系统分析。我们首先分析了所有已鉴定的RNA囊的二级结构特征模式。然后,我们引入RPS描述符来定量计算口袋拓扑特性。此外,我们对RNA-配体相互作用特征进行了统计分析。我们的结果表明,一些带电的相互作用对可能提供长程的指导力,使RNA和配体结合在一起。然后,短程相互作用优化和稳定了绑定。结构拓扑特征的不同尺度可以改善RNA结构预测和RNA相关药物设计。我们还开发了一个用户友好的生物信息学工具RPocket,以促进配体设计或RNA工程,从而调节生物或医学应用中的复合物形成。

结构和内容

为了让生物学家更好地获取RNA口袋的信息,我们建立了一个用户友好的在线数据库:RPocket。RPocket包含94个rna -配体复合物结构的240个口袋信息(非冗余)。构建RPocket数据库的工作流程如图所示。1

图1
图1

RPocket数据库构建的工作流。一种269 RNA-配体结构用于分析。B.为了获得非冗余数据集,我们使用CD-Hit服务器对269个结构进行了序列比对。我们使用了两个身份截断(0.80和0.95)来获得相对松散和更严格的非冗余数据集:RBL75和RBL94(0.80和0.95序列身份截断的75和94簇)。C使用Ligplot +和基于距离的计算识别相互作用信息和配体结合位点。D.功能基序由RERGNA程序识别。RegRNA通过整合已发表文献和RNA基序数据库中的调节性RNA基序来识别RNA基序。E.3v服务器采用滚动探针法检测口袋。F使用RPDescriptor生成RNA口袋形状分布和分类。G计算配体官能团、氢键和非键相互作用、二级结构模式和口袋拓扑信息,并在RPocket服务器中提供

(A) 2020年2月19日之前,利用蛋白质数据库中的REST API高级搜索接口提取1448个rna的PDB结构文件和序列FASTA文件[33]这里,我们只考虑了带有配体的单链RNA分子(剩余298个条目)。然后,我们去除了短的(少于10个核苷酸)和高度复杂的(超过500个核苷酸)如果RNA有几个NMR结构,则选择第一个结构模型。在该筛选步骤后,剩余269个RNA配体结构。

(b)获取非冗余数据集,我们使用CD-HIT服务器执行了269结构的序​​列对齐[34].我们使用了两个身份截止值(0.80和0.95)来获得相对宽松,更严格的非冗余数据集:RBL75和RBL94(75和94簇为0.80和0.95序列标识截止值)[8.3435].我们执行了RMSD计算,以反映每个集群中代表和其他结构之间的分歧[36].在该网站上可以下载两个非冗余数据集中的所有代表性结构以及代表性与类成员之间的RMSD。例如,非冗余数据集中的一个簇有24个rna配体复合物。代表性结构是鸟嘌呤核开关(PDB编码:3FO4)。我们计算了3FO4与所有其他rna配体配合物之间的RMSDs。rmsd为0.30±0.19 Å,表明集群中的rna高度相似(附加文件)1: 无花果。1).在这里,我们分析了RBL94中代表的94个rna -配体的结构原理。

(C)我们通过基于距离的计算确定了rna配体结合位点。如果RNA和配体之间的距离小于4Å,一个核苷酸就被认为是一个结合位点。使用Ligplot +与HBPLUS程序生成了详细的交互作用[3738].Ligplot +可以在原子水平上提供RNA和配体之间的氢键和非键接触。

(d)通过reave计划确定功能图案[39].RegRNA通过整合已发表的文献和RNA motif数据库中的调控RNA motif来识别这些RNA motif。功能基序可分为12类:转录基序、Pre-mRNA基序、翻译基序、UTR基序、mRNA降解元件、RNA顺式调节元件、RNA编辑位点、核开关、RNA结构模式、功能RNA序列、RNA-RNA相互作用区域和用户自定义基序。此外,利用RNA FRABASE 2.0鉴定并生成了堆叠碱基、内环、凸起环、发夹环、多分支环和假结的二级结构单元[404142].所有已识别的功能图案都可以在Rpocket网站上下载。

(E) 3v服务器使用滚动探针方法检测口袋[30.434445].通过围绕范德瓦尔斯表面滚动两个虚拟探针(壳探针和溶剂探针)来计算体积和表面积[30.43444546].我们使用默认的半径值(10 Å为壳层探针半径,3 Å为溶剂探针半径)提取RNA口袋。

(f)我们开发了rpdescriptor(R.NA.P.ocketD.Escriptor)计算RNA分子的口袋几何特征。RPDescriptor可以基于惯性比率的标准化主矩(NPRS)生成两个描述符[47].通过突出两个描述符(以下)可以通过突出两个描述符在等腰三角形上显示RNA口袋的形状(\(rpd_ {1} \)\(rpd_ {2} \))到二维平面上。我们定义了一个形状相似度评分\ (s_{我}\)允许定量归类口袋。

(g)配体官能团,氢键和非粘合相互作用,二次结构图案和口袋拓扑信息被计算并提供在RPocket服务器中。

实用与讨论

一个用于RNA口袋信息的用户友好的生物信息学工具已经丢失。这种局限性促使我们开发了RPocket,一个用户友好的web服务器,使用一个简单的图形用户界面来分析RNA口袋。RPocket的一些高级特性包括:(1)包含从94个非冗余rna配体结构中提取的240个口袋信息;(2)显示序列、二级结构及rna -配体相互作用特征模式;(3)利用口袋的体积、表面积、形状相似度等几何拓扑信息构建数据库;(4)提供可视化工具,供用户缩放和旋转结构;(5)提供一个可执行脚本供用户进行口袋拓扑分析。(6)提供了预测或模拟RNA结构的相关工具。RPocket web服务器是一个可靠的和用户友好的工具,便于RNA口袋研究,而无需安装程序在本地。

RPocket由八个模块组成:主页、搜索、可视化、下载、链接、教程、统欧宝直播官网app计和联系人。Home欧宝直播官网app模块简要介绍了RPocket数据库,并导航到其他模块。用户可以使用Search模块识别和提取口袋信息(图。2).Search模块由四个部分组成:下拉搜索框、RNA集群汇总表、RNA描述表和序列预览模块。下拉搜索框可以通过定义序列标识截止、RNA类和PDB ID来识别RNA。RNA集群信息表显示了代表性RNA与其他成员之间的RMSD。一个全面的信息表包括三个部分:实验,rna -配体相互作用,口袋几何信息。用户可以点击突出显示的链接查看综合体的详细交互图,并下载口袋的结构文件。序列预览模块显示配体结合位点,带有突出标签的序列基序。口袋拓扑信息与功能基序的结合将指导rna相关药物的筛选和对接。在可视化模块中,用户可以上传和研究口袋结构。在下载模块中,用户可以下载xlsx格式的口袋信息和MRC格式的口袋结构。 The Links module provides the RNA pocket shape classification scripts and other useful links to help RNA-related drug development and vaccine design. The Tutorial module offers the introduction to use the RPocket and the abbreviation for the RPocket database. Some results of data analysis are shown in the Statistics module. The Contacts module provides emails for users to comment or ask questions. More detail about RPocket database utility is described in Additional files (Additional file1:部分用户界面和实用程序和图。8-11)。

图2
图2.

RPocket服务器的搜索模块。用户界面显示了RNA簇,RNA-配体相互作用,口袋拓扑和序列motif特征模式

实现

口袋识别和拓扑计算

通过3v程序使用滚动探针方法对所有口袋进行了识别[30.434445].分子的坐标叠加在立方网格上。通过计算探头球的平移自由度来检测口袋。如果探针触点在分子上具有两个以上原子的探针接触,则记录探针的中心[43].这些离散位置构成了袋的滚动边界[44].采用离散体积法计算体积和表面积值。这里我们使用RNA口袋检测的测试参数,外壳探针半径为10 Å,溶剂探针半径为3 Å [30.].使用以下公式计算有效半径

$$ {\文本{R}} _ {{{\文本{EFF}}}} = \压裂{{3V_ {P}}} {{A_ {P}}} $$
(1)

在哪里\(v_ {p} \)\(a_ {p} \)表示体积和表面积。球度(Ψ)用于测量口袋与球体之间的相似性,公式如下

$$ \ psi = \ frac {{a_ {s}}} = \ frac {{\ left({36 \ pi v_ {p} ^ {2}} \ over)^ {1/ 3}} {{a_ {p}}} = \ frac {{\ pi ^ {1/3} \ left({6v_ {p}} \ revaly)^ {2/3}}} {{a_ {P}}} $$
(2)

\(现代{年代}\)表示体积与口袋容量相同的球体的表面积,\(v_ {p} \).这\ (r_ c {} \)是确定口袋位置的质心[3148].

口袋几何特征分析和分类

利用归一化主惯性比(NPRs)对RNA囊袋的几何特征进行了识别。NPRs通过将用主惯性矩(PMI)计算出的两个描述符投影到二维平面上来显示三维分子的形状[47].以前的研究开发了一些方法来计算蛋白质的PMI [49].但这些方法不能直接用于RNA口袋计算。因此,我们开发了RPDescriptor (R.NA.P.ocketD.Escriptor)计算RNA分子的口袋几何特征。数字3.是RPDescriptor的工作流程为特定的口袋(1evv_1)为例。

图3
图3.

RPDescriptor的工作流程。RPDescriptor的过程包含五个步骤:一种从NetCDF格式创建袖珍坐标文件;B.惯性瞬间计算;C通过将三角形和几何中心O的三个顶点突出到二维平面上,通过将两个描述符投射到二维平面上并分类口袋来生成口袋NPR空间图。D.计算形状相似度

第一步是为NPR分析生成RNA口袋的坐标文件(图。3.A) 。Chimera将240个MRC格式的pocket文件转换为网络通用数据格式(NetCDF)。在NetCDF中,长度为AÅ、宽度为bÅ、高度为cÅ的盒子被划分为n(n = a*b*c)大小为1Å的小网格。三维坐标对每个网格在框(i,j,k)中的位置进行编码。i,j,k的值分别是从0到a-1,b-1和c-1的整数。每个网格的值F(i,j,k)为1或0。口袋结构由值为1的网格组成。由于口袋密度贴图是统一的,因此我们在网格中心用坐标(i)提取每个值为1的网格 + 0.5,j + 0.5,k + 0.5).

第二步骤是PMI和RNA口袋拓扑描述符计算(图。3.B).质心可以用RPDescriptor来计算。进一步计算了绕质心转动的惯性张量。采购经理人指数(\ (I_ {11} \)\(i_ {22} \)\(i_ {33} \))值按升序获得。最后,RNA口袋拓扑描述符,\(rpd_ {1} \)\(rpd_ {2} \),使用公式生成(3.).

$$ rpd_ {1} = \ frac {{i_ {11}}} {{{i_ {33}}},\; rpd_ {2} = \ frac {{{i_ {22}}} {{i_ {33}}$$
(3)

第三步是定量地计算口袋形状空间并分类口袋的形状(图。3.C)。通过突出两个描述符,形状可以直观地显示在一个等腰三角形上(\(rpd_ {1} \)\(rpd_ {2} \))到二维平面上。左上方,右上右下角对角线分别对应于标准杆,球体或盘形。根据计算,等腰三角形的几何中心是o\(\ left({\ frac {1} {2},\ frac {5} {6}} \)\).然后,连接三角形的O点和三个顶点。形状空间可分为三类:球形,圆盘和杆状口袋定性。

第四步是计算形状相似度分数(图。3.d)。这\ (s_ {1} \) = \(rpd_ {1} \) + \(rpd_ {2} \)- 1,\ (s_ {2} \) = 2—2*\(rpd_ {2} \), 和\(s_{3}\) = \(rpd_ {2} \)\(rpd_ {1} \)分别表示口袋的球形、圆盘状、棒状度[50].在这里,我们定义了形状相似度分数\ (s_{我}\)这样就可以用公式(4.).的价值\ (s_{我}\)是来自\(\ frac {1} {3} \)为1。点啊,\ (s_{我}\) = max\ \(左({s_{1} = \压裂{1}{3},\;s_{2} = \压裂{1}{3},\;s_{3} = \压裂{1}{3}}\)\) = \(\ frac {1} {3} \).对于这三个顶点,\ (s_{我}\)= 1。如果\ (s_{我}\) = \ (s_ {1} \),口袋又分为球形和球形两种\ (s_{我}\)表示球形。如果\ (s_{我}\) = \ (s_ {2} \)\(s_{3}\)时,口袋分为碟状型或杆状型,并且\ (s_{我}\)表示盘状度或杆状度。我们观察到两种形状分类方法(定性和定量)是等价的。

$ $ s_ + s_ {1} {2} + s_ {3} = 1, \; \; s_{我}={\文本{马克斯(s}} _ {{1 }} {,}\;{\ 文本{年代}}_ {{2 }} {,}\;{\ 文本{年代}}_ {{3}}{)}$ $
(4)

结果

RNA口袋概述

我们对从94个非冗余RNA - 配体复合结构中提取的240个RNA口袋进行了系统分析(附加文件5.:文件夹S1)。RNA可折叠成各种构象并影响不同的功能。代表性RNA包括44个核糖开关、15个适体RNA、7个核酶、5个tRNA、4个rRNA、3个小RNA、2个xrRNA、1个mRNA、1个端粒RNA和13个其他RNA[51](附加文件1: 无花果。2).例如,RPocket数据集包含44个核糖开关和147个核糖开关口袋。核开关RNA可以结合小分子通过构象改变来调节基因表达。了解核糖开关口袋为抗生素药物设计提供了一种潜在的功能改变机制和解决方案。为了反映特征分析在口袋几何形状上的差异,我们使用NPRs对所有口袋的拓扑特征进行了分析。RNA口袋可分为三类:球形口袋(50个),圆盘状口袋(39个),杆状口袋(151个)1: 无花果。3.).

RNA口袋的拓扑特征

口袋拓扑特性有助于鉴定针对靶特异性结合的小分子。我们使用滚动探针方法分析了拓扑属性(体积,表面积和有效半径属性)3 V程序[30.].所有口袋的平均体积(m)和标准偏差(σ)为1440.9±2329.4Å3..三个大口袋被删除,因为它们的体积大于m + 3σ(附加文件1: 无花果。4.).然后,我们计算了形状相似性分数(\ (s_{我}\))(附加文件1:表S2)。数字4.A–C显示杆状袋(体积为985Å3.,表面积为676Å2,有效半径4.60 Å)比球形(体积536Å3.,380埃的表面积2,有效半径为4.21 Å)和圆盘状(体积为802Å3.,表面积508 Å2,有效半径为4.37 Å)口袋。进一步分析形状相似度,定量地反映口袋形状。连续相似度评分为\(\ frac {1} {3} \)1级1表示是球形或圆盘或杆的标准形状。年级\(\ frac {1} {3} \)表示形状非常不规则。球形、圆盘状和棒状口袋的形状相似性得分分别为0.47、0.49和0.61(图。4.d)。结果表明,具有棒状形状的RNA口袋通常是高杆形的,而球形和盘状类别分别面临高度球形和圆形的形状。

图4
图4.

表面积的几何信息分布(一种)、体积(B.),有效半径(C)和形状相似性分数(D.),分别用于每个口袋类别。中值用绿色表示

我们对50配体结合和190个非配体结合袋进行了对比分析,以获得配体结合的拓扑原理。我们根据使用RPDescriptor根据其几何形状分类RNA口袋。有9个球形,8个盘状,以及50个配体绑定口袋中的33个杆状口袋。190个非配体结合袋的几何形状分布类似,其是41个球状,32个盘状,117个杆状袋。为了进一步反映配体结合和非配体结合袋的形状分布的几何特征,产生具有袋尺寸信息的NPR空间分布图。数字5.表明配体结合和非配体结合袋的形状分布是相似的。我们还观察到RNA中口袋的位置是相同的。这些结果强调了非配体结合口袋作为小分子靶的潜力。此外,随着用于配体结合和非配体结合的RNA袋的增加口袋体积的球状丧失与蛋白质袋是一致的,表明RNA可以被认为是蛋白质等药物靶标[50].我们进一步比较了配体绑定和非绑定口袋之间的体积和表面积(附加文件1: 无花果。5.).它显示大多数配体绑定口袋(〜75%),体积在200到2000之间3..配体绑定口袋的体积和表面积(982Å3.中位容积和622Å3.中位数)大于非配体绑定口袋(803Å3.成交量中位数为543 Å3.平均面积)。配体结合可能影响口袋呼吸运动。

图5
图5.

配体结合袋和非配体结合袋的NPR分布。颜色代码显示每个口袋的体积大小

RNA囊的二级结构模式

配体结合位点通常位于特定的RNA二级结构中。与错误的二级结构结合可能会破坏相互作用和结构稳定性[52].因此,我们分析了所有RNA口袋结合位点的二次结构分布(附加文件3.:表S2)。这里,我们关注的是未配对循环单元。在球状、碟状和杆状口袋中有10、11、15种次级图案。数字6.表明,球形口袋位于发夹环(22%),内部发夹环(17.1%),内环(14.6%),多刺线 - 内环(12.2%),多分支环(9.8%)),多刺发 - 发夹环(9.8%)等(14.5%)。在内部环路(15.8%)中观察到盘状袋,然后是多分支环(15.8%),内部发夹环(15.8%),发夹环(13.2),内部多刺发 - 发夹 - 凸起环(10.5%),多刺发 - 发夹环(7.9%)等(21%)。棒状口袋位于内部环(19.4%),发夹环(17.2%),内发夹环(13.4),内部多刺挛环(12.7%),多刺发 - 发夹环(8.2%),多重- 枝路(8.2%),其他(20.9%)。球形口袋通常比其他两种类型更小。这种口袋通常位于发夹环中,有四到五个核苷酸[53].我们进一步计算了相邻环之间的基对的数量。结果表明,最相邻环的距离小于六个碱基对(86.5%)(附加文件1: 无花果。6.).注意,这些串联环的92.6%通常处于相同的形状口袋。

图6
图6.

RNA口袋中的二级结构图案。灰色圆圈表示球形袋。红色馅饼代表一个圆盘状口袋。蓝色矩形代表棒状口袋

我们分析了从RNA-配体结合位点提取的核苷酸的分布(附加文件4.:表S3)。应注意,G核苷酸的平均分布(35.6%)明显高于(22.1%),C(20.6%)和U(21.7%)(图。7.b)。核苷酸G更容易与小分子形成氢键。鉴定RNA序列基序可以帮助我们理解RNA-配体相互作用和功能[54].因此,我们进一步进行了RNA-配体相互作用核苷酸的序列模式分析。例如,我们考虑连续对称序列,“GU”和“UG”,作为同一主题。RNA-配体相互作用有39个序列基序(图。7.一种)。这sequence motif of ‘GU’ (11.7%), ‘GG’ (8.8%), ‘GA’ (8.8%), ‘GC’ (8.1%), ‘AU’ (5.7%), ‘CC’ (5.3%), ‘AC’ (4.9%), ‘UGG’ (4.9%), ‘CU’ (3.5%), ‘AA’ (3.2%), ‘UGC’ (2.8%), ‘AUC’ (2.8%), ‘AAC’ (2.5%), ‘ACU’ (1.8%), and ‘GUC’ (1.8%) are observed more than five times in all the RNA-ligand interactions. Previous studies have indicated that the motifs ‘GU’, ‘GG’, ‘GA’, ‘GC’ can modulate metal-binding specifically [55]。一些序列模式已被确定为RNA复合物形成的重要基序。例如,先前的研究表明,一些蛋白质特异性结合富含UC区域的AR(雄激素受体)mRNA,并在前列腺癌细胞AR表达的转录后调节中发挥作用[56].此外,最重复的三核苷酸UGG(283中的14个)由硝基胺癌MAZF(序列特异性毒素的嗜酸酯核酸酶)特异性识别,并选择性地促进RNA降解[57].

图7
图7.

主题(一种)和结合位点(B.)RNA-配体结构的分布。统计学基因分析与确认的功能序列一致。G核苷酸(35.6%)的平均分布显着高于(22.1%),C(20.6%),u(21.7%)

短期和长期相互作用的贡献

我们鉴定了RNA-Ligand相互作用,并使用Ligplot +分析了交互模式(附加文件4.:表S3)。图8.A显示16S RNA与庆大霉素C1A(GE)的结合,棒状口袋中的氨基糖苷类抗生素之一(体积为979Å3.).参与RNA-配体相互作用的两个氢键和八个非键合相互作用。应注意,氢键位于相邻核苷酸(A21,G22)和8个非键合相互作用分散在RNA口袋的其他部分中。另外两个例子显示了类似的特征。短期和远程相互作用分布在小分子的不同部分中并稳定RNA和小分子之间的相互作用(图。8.B,C).我们还分析了94种代表性rna中参与氢键和非键相互作用的所有配体官能团(附加文件)1: 无花果。7.和附加文件6.:文件夹S2)。结果表明远程(极性或静电)相互作用将配体和RNA带到一起。然后,短的非键相互作用优化RNA-配体结合。此外,我们分析了口袋和配体的尺寸。Sam在空间中的音量最小,其次是GE,G4P具有最大的尺寸,这与口袋尺寸一致。结果表明药物筛选的两个步骤。首先,RNA口袋和小分子之间的尺寸和形状应大致相同。其次,应考虑通常短 - 和长相互作用以优化RNA-配体结合。

图8
图8.

配体结合囊的例子。一种16S RNA与庆大霉素C1A(PDB:1ByJ)结合,B.与鸟嘌呤四磷酸盐(G4P)(PDB:6DME)结合的PPGPP核糖织物,C与S-腺苷甲硫氨酸(SAM)结合的SAM-IV核糖开关(PDB:6UET)。配体和口袋是在青色和粉红色的彩色。用红色弧强调van der waals和堆叠交互。氢键被用绿色虚线表示。碳,氮和氧原子显示为黑色,奶油和红色球体

拓扑模式改进了三级结构预测

目前,已经成功地应用于RNA三级结构预测的结构基配对和环形元件。然而,对更高级结构元素组合的理解仍然有限。我们的结果表明,92.6%的串联环(距离小于六个碱基对)通常在相同的形状口袋中。为了测试结构元素的更高级别比例可以识别天然的RNA结构,我们在给定的测试组上运行了四个流行的RNA三级结构预测程序(3drna,Rnacompos,SimRNA和vfold3d),以构建几个三级结构并评估预测准确性(附加文件1: 无花果。6.额外的文件7.:文件夹S3)。所有的测试都可以从我们的网站下载。我们将预测结构分为具有相同口袋拓扑(TS)和具有不同口袋拓扑(TD)的串连环。数字9.显示针对天然结构测量的全原子根平均方偏差(RMSD)。具有TS特性的预测结构显示下RMSDS(1.71±1.66埃),而具有TD特性的预测结构呈现得更大的RMSD(7.23±4.43)。结果表明,高级拓扑模式的不同尺度可以改善RNA三级结构预测。

图9
图9.

用于测试RNA的预测3D结构的RMSD值。3D结构由3DRNA,RNACOMPOS,SIMRNA和VFOLD3D产生。我们将预测结构分为具有相同口袋拓扑(TS)和具有不同口袋拓扑(TD)的串连环。红色点表示具有TS特性的结构。这些结构(红色点)通常达到比具有TD特性的预测结构的较低的RMS值(蓝点)

结论

在这项工作中,我们提出rpdescriptor来定量计算RNA口袋的拓扑性质。然后结合序列和二级结构信息对拓扑信息进行rna -配体结合分析。这种新方法既利用了原子级的结构精度,又利用了残渣级的三级相互作用。总之,这些结果表明,长距离的相互作用使配体和RNA结合在一起。然后,短的非键相互作用优化和稳定rna -配体结合。我们还开发了一种用户友好的生物信息学工具,RPocket,以促进rna配体工程,以调节生物或医学应用的复合物形成。

数据和材料的可用性

所有补充资料及资料,可于网页下载,网址为欧宝直播官网apphttp://zhaoserver.com.cn/rpocket/rpocket.html.

参考

  1. 1.

    Deigan WK, Hajdin CE, Weeks KM。用类药物小分子靶向RNA的原理。Nat Rev Drug discovery . 2018; 17:547-58。

    文章CAS谷歌学者

  2. 2.

    Du Z,Lind Ke,James TL。通过计算筛选鉴定的与TAT-焦油相互作用纳米摩尔抑制剂复合的焦油RNA的结构。Chem Biol。2002; 9(6):707-12。

    CASPubMed文章公共医学中心谷歌学者

  3. 3.

    Serganov A,Huang L,Patel DJ。黄素单核苷酸核糖瘤的辅酶识别与基因调节。自然。2009; 458:233-7。

    CASPubMed公共医学中心文章谷歌学者

  4. 4.

    王Q,吴j,王h,高y,rao z. sars-cov-2聚合酶RNA复制的结构基础。细胞。2020; 182:417-28。

    CASPubMed公共医学中心文章谷歌学者

  5. 5.

    做CB,Woods Da。Batzoglou AS:Contrafold:RNA二级结构预测,没有基于物理的模型。生物信息学。2006; 22(14):E90。

    CASPubMed文章公共医学中心谷歌学者

  6. 6.

    王赵Y, J,曾庆红C,肖Y评价RNA二级结构预测碱基对和拓扑。Biophys众议员2018;4(3):123 - 32。

    CAS文章谷歌学者

  7. 7.

    建Y,王X,邱j,王H,Zeng C.直接:通过整合结构模式直接:RNA接触预测。BMC生物素。2019; 20:1-12。

    CAS文章谷歌学者

  8. 8.

    王J,赵Y,朱C,肖Y 3 drnascore:距离和扭转角依赖评估3 d核糖核酸结构的函数。核酸学报2015;43(10):63。

    文章CAS谷歌学者

  9. 9.

    王黄赵Y, Y, Z锣,Y, J,肖Y自动化和快速建立三维RNA结构。Sci众议员2012;2(1):734。

    PubMed公共医学中心文章CAS谷歌学者

  10. 10.

    RNA三维结构分析与预测。纽约:施普林格;2011.

    谷歌学者

  11. 11.

    应用低温扫描电镜和原位x射线衍射研究建筑材料水化。武汉理工大学学报。2011;33(1):1 - 10。

    谷歌学者

  12. 12.

    张勇,王静,肖勇。3dRNA:利用改进的模板库构建RNA三维结构。计算机结构生物技术J. 2020; 18:2416-23。

    CASPubMed公共医学中心文章谷歌学者

  13. 13.

    赵烨,简烨,刘Z,刘H,刘Q,陈聪,李Z,王莉,黄HH,曾聪。网络分析揭示球茎型凝集素二聚体形成的识别机制。报告。2017;7(1):2876。

    谷歌学者

  14. 14.

    莱B,Jun WX。配体与加入腺嘌呤核糖纤维型适体的分子动力学模拟。PHOTE REV E. 2019; 100(2-1):22412-22412。

    谷歌学者

  15. 15.

    王勇,刘涛,余涛,谭志军,张伟。盐对单RNA碱基对热力学和动力学的影响。RNA。2020; 26(4): 470 - 80。

    PubMed公共医学中心文章谷歌学者

  16. 16.

    鲍磊,王杰,肖勇.RNA分子周围金属离子的动力学.物理版E.2019;99(1):012420。

    CASPubMed文章谷歌学者

  17. 17

    闫益,盛,H. RRDB:RNA-RNA对接和得分的全面和非冗余基准。生物信息学。2017; 34(3):453-8。

    文章CAS谷歌学者

  18. 18

    Daldrop P,Reyes FE,Robinson DA,Hammond CM,Lilley DM,Batey RT,Brenk R.通过RNA配体对接发现的嘌呤核糖开关新配体。化学生物学。2011;18(3):324-35。

    CASPubMed公共医学中心文章谷歌学者

  19. 19

    Bujnicki JM,Irina T.DARS-RNP和Quasi-RNP:蛋白质-RNA对接的新统计潜力。BMC生物素。2011; 12(1):348。

    文章CAS谷歌学者

  20. 20。

    Burley Sk,Charmi B,Bi C,Sebastian B,Chen L,Crichlow GV,Christie Ch,Ken​​neth D,Di Cl,Duarte JM。RCSB蛋白质数据库:用于探索生物大分子3D结构的强大新工具,基本生物学,生物医学,生物技术,生物工程和能源科学中的基础和应用研究和教育。核酸RES。2020; 49(D1):D437-51。

    公共医学中心文章CAS谷歌学者

  21. 21。

    Berman HM,Olson WK,Beveridge DL,Westbrook J,Schneider B.核酸数据库。核酸三维结构的综合关系数据库。Biophys J. 1992; 63(3):751-9。

    CASPubMed公共医学中心文章谷歌学者

  22. 22.

    Jae-min S,DOO-HO C.PDB-Ligand:基于PDB的配体数据库,用于配体结合结构的自动化和定制分类。核酸RES。2005; 33:D238-41。

    谷歌学者

  23. 23.

    摩根BS,三巴BG,Donlic A,Karloff DB,Hargrove Ae。R-BINK:用于探索和开发RNA靶向化学探针的交互式数据库。ACS Chem Biol。2019; 14(12):2691-700。

    CASPubMed公共医学中心文章谷歌学者

  24. 24.

    苏博德K,米什拉阿克。NALDB:针对核酸的小分子的核酸配体数据库。数据库2016;2016:1–11.

    谷歌学者

  25. 25.

    Ankita M,Surabhi S,Isha G,Saurabh L,Sharma DK,拉曼P.Smmrna:RNA小分子调节剂的数据库。核酸RES。2014; 42(D1):132-41。

    文章CAS谷歌学者

  26. 26.

    季志林,陈旭,甄志杰,姚立新,韩丽玲,杨文坤,钟pc, Puy HS, Tay YT, Muhammad A. KDBI:生物分子相互作用动力学数据库。核酸学报2003;31(1):255-7。

    CASPubMed公共医学中心文章谷歌学者

  27. 27.

    他j,王俊,陶鹤,萧y,huang sy。HNAdock:用于建模RNA / DNA-RNA / DNA 3D复合结构的核酸对接服务器。核酸RES。2019; 47:W35-42。

    CASPubMed公共医学中心文章谷歌学者

  28. 28.

    Pfeffer P,Gohlke H.预测RNA?配体相互作用的基于RNA知识的药物评分函数.化学Inf模型.2007;47(5):1868-76。

    CASPubMed文章公共医学中心谷歌学者

  29. 29

    Philips A, Milanowska K, Lach G, Bujnicki JM。配体rna:计算预测rna -配体相互作用。RNA。2013; 19(12): 1605 - 16。

    CASPubMed公共医学中心文章谷歌学者

  30. 30.

    Voss NR,Gerstein M. 3V:腔,通道和裂缝计算器和提取器。核酸RES。2010; 38:W555-62。

    CASPubMed公共医学中心文章谷歌学者

  31. 31。

    Petřekm,otyepka m,Banášp,košinováp,kočaj,damborskýj.caper:探索来自蛋白质裂解,口袋和空腔的途径的新工具。BMC生物素。2006; 7(1):316。

    文章CAS谷歌学者

  32. 32。

    一个J. Pocketome通过对配体结合信封的全面鉴定和分类。中国生物医学工程学报。2005;4(6):752-61。

    CAS文章谷歌学者

  33. 33。

    Berman H,Westbrook J,Feng Z,Gilliland G,Bhat T,Weissig H,Shindyalov I,Bourne P.蛋白质数据库。核酸RES。2000; 28(1):235-42。

    CASPubMed公共医学中心文章谷歌学者

  34. 34.

    富L,NIU B,Zhu Z,Wu S,Li W.CD-HIT:加速为聚类下一代测序数据。生物信息学。2012年; 28(23):3150-2。

    CASPubMed公共医学中心文章谷歌学者

  35. 35.

    李伟,高德泽。Cd-hit:一种用于聚类和比较大组蛋白质或核苷酸序列的快速程序。生物信息学。2006;22(13):1658。

    CASPubMed文章公共医学中心谷歌学者

  36. 36.

    Delano WL。聚合物分子图形系统。Proteins struct funct生物蛋白。2014; 30:442-54。

    谷歌学者

  37. 37.

    LigPlot+:用于药物发现的多种配体-蛋白相互作用图。J Chem Inf Model. 2011;51(10): 2778-86。

    CASPubMed文章公共医学中心谷歌学者

  38. 38.

    麦当劳·伊克克,桑顿杰姆。满足蛋白质中的氢键电位。J Mol Biol。1994年; 238(5):777-93。

    CASPubMed文章公共医学中心谷歌学者

  39. 39.

    黄海佳,贾洪聪,关华杰,黄HD。RERGNA:识别调控RNA基序和元件的集成网络服务器。核酸研究。2006;34:W429-34。

    CASPubMed公共医学中心文章谷歌学者

  40. 40。

    RNA二级结构的组合学。离散应用数学。1998;88(1-3):207-37。

    文章谷歌学者

  41. 41。

    Jin EY, Qin J, Reidys CM。带有伪结的RNA结构的组合学。数学学报。2008;70(1):45-67。

    CASPubMed文章公共医学中心谷歌学者

  42. 42。

    Popenda M, Szachniuk M, Blazewicz M, Wasik S, Burke EK, Blazewicz J, Adamiak RW。RNA FRABASE 2.0:一个先进的网络访问数据库,具有搜索RNA结构中的三维片段的能力。BMC Bioinform。2010;11。

  43. 43。

    Lee Bk,Richards FM。蛋白质结构的解释:静态可接近性估算。J Mol Biol。1971; 55(3):379-400。

    CASPubMed文章公共医学中心谷歌学者

  44. 44。

    理查兹曼氏金融。面积、体积、包装和蛋白质结构。生物物理学报。1997;6(1):151-76。

    CASPubMed文章公共医学中心谷歌学者

  45. 45。

    Connolly ml。分析分子表面计算。j appl crystallogr。1983; 16(5):548-58。

    CAS文章谷歌学者

  46. 46.

    Sanner MF,Olson AJ,Spehner JL。降低表面:计算分子表面的有效方法。生物聚合物。1996年; 38(3):305-20。

    CASPubMed文章公共医学中心谷歌学者

  47. 47.

    Sauer Whb,Schwarz Mk。组合库的分子形状多样性:宽生物活性的先决条件。J Chem Inf Comput SCI。2003; 43(3):987-1003。

    CASPubMed文章公共医学中心谷歌学者

  48. 48.

    Marialuisa PC,蒂姆米,珍妮特MT。Porewalker:一种新型工具,用于识别和表征其三维结构的跨膜蛋白通道。PLOS计算BIOL。2009; 5(7):E1000440。

    文章CAS谷歌学者

  49. 49.

    汤普森洛杉矶,埃尔曼JA。小分子文库的合成与应用。化学启1996;96(1):555。

    CASPubMed文章公共医学中心谷歌学者

  50. 50。

    Wirth M,Volkamer A,Zoete V,Rippmann F,Michielin O,稀释M,Sauer WHB。蛋白质口袋和配体形状比较及其在虚拟筛选中的应用。j计算辅助mol des。2013; 27(6):511-24。

    CASPubMed文章谷歌学者

  51. 51。

    Rizvi NF,Smith GF。RNA作为小分子可用靶标。Bioorg Med Chem Lett。2017; 2017(27):5083-8。

    文章CAS谷歌学者

  52. 52。

    托马斯JR,Hergenrother PJ。用小分子靶向RNA。Chem Rev. 2008; 108(4):1171-224。

    CASPubMed文章谷歌学者

  53. 53。

    Groebe博士,Uhlenbeck OC。RNA发夹环稳定性的表征。核酸RES。1988; 16(24):11725。

    CASPubMed公共医学中心文章谷歌学者

  54. 54。

    麦克TJ,Ocker DJ,Gutell RR,GaUtheret D,CaseDa,Sampath R.Rnamotif,RNA二级结构定义和搜索算法。核酸RES。2001; 29(22):4724-35。

    CASPubMed公共医学中心文章谷歌学者

  55. 55。

    王伟,赵军,韩强,王刚,杨刚,Shallop AJ,刘杰,Gaffney BL, Jones RA。通过侧翼碱基调节RNA金属结合:GC、串联GU和串联GA位点的15N NMR评估。acta photonica sinica . 2009;28(5-7): 424-34。

    CAS文章谷歌学者

  56. 56。

    Bu B,YeAP DC,VOON JP,Vivian R. HUR和Poly(C) - 挤出蛋白在雄激素受体信使RNA的3'-未翻译区域内对保守的UC富含基序的新颖结合。J Biol Chem。2002; 277(30):27183-92。

    文章CAS谷歌学者

  57. 57。

    Miyamoto T, Yokota A, Ota Y, Tsuruga M, Aoi R, Tsuneda S, Noda N.欧洲亚硝基单胞菌MazF特异性识别UGG Motif并促进选择性RNA降解。Microbiol前面。2018;9:2386。

    PubMed公共医学中心文章谷歌学者

下载参考

确认

不适用。

资金

国家自然科学基金项目11704140 (no . YZ), no . 12175081(no . YZ);教育部高校基础研究与运行自主科研基金项目CCNU20TS004 (no . YZ)。关键词:岩石力学,边坡稳定性,数值模拟,数值模拟资助方在研究的设计、收集、分析和数据解释以及手稿的撰写中没有任何作用。

作者信息

隶属关系

作者

贡献

T.Z.建立服务器并执行大多数计算分析。H.W.和C.Z.有助于构建服务器。Y.Z.监督整体研究,分析了数据,并写了论文。所有作者都已经阅读并赞成最终的手稿。

通讯作者

对应于Yunjie赵

道德声明

宣言

提交人声明他们提供了数据和代码公众可访问。

伦理批准和同意参与

不适用。

同意发布

不适用。

利益争夺

所有作者声明本文没有利益冲突。

附加信息

出版说明

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

额外的文件1

.补充材料。该文件包括引入Rpocket,补充材料图1-11和补充材料表1。

附加文件2.表S1

:本研究涉及的rna配体复合物。

附加文件3.表S2

:RNA口袋的几何信息和袋位于袋的次级结构元件。

额外的文件4。表S3

:RNA-配体复合物的结合位点和参与与RNA相互作用的配体的官能团。

附加文件5.文件夹S1

:所有RNA口袋的结构。

额外的文件6。文件夹S2

: rna -配体配合物相互作用信息。

附加文件7.文件夹S3

:九种实验结构及其建模结构和口袋。

附加文件8.文件夹S4

:用于RNA口袋形状分类的RPDescriptor程序代码。

权利和权限

开放获取本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

周,T.,王,H.,Zeng,C。et al。Rpocket:具有RNA-Ligand数据资源的RNA Pocket拓扑信息的直观数据库。欧宝娱乐合法吗22,428(2021)。https://doi.org/10.1186/s12859-021-04349-4

下载引用

关键字

  • 袖珍数据库
  • RNA-配体相互作用
  • 结构预测
  • 药物发现