跳转到主要内容

配对结束的小RNA测序揭示了先前从传统单读数据分析报告的ISOMIR序列曲目中可能的高度估计

抽象的

背景

下一代测序允许发现miRNA同种型,称为Isomirs。一些ISOMIR源自预先发方法,前体前体,导致长度变体。通过在末端的基质或内部基础编辑的基础上进行额外的变异性,导致相对于模板DNA序列的碱基差异。我们假设迄今为止报告的ISOMIR变异的某些组成部分可能是由于系统的技术噪音而不是真实的。

结果

我们开发了XICRA管道,以分析ISOMIR水平的小RNA测序数据。我们利用了使用单个或合并读取的能力来比较ISOMIR结果来自单个读取(SR)的配对端(PE)读取,以解决相对于ISOMIR中发现的典型miRNA的可检测序列差异是真正的生物变化或测序中错误的结果。我们检测到SR和PE数据之间的不可忽略的系统差异,主要影响推定的内部编辑ISOMIR,以及更小的频率终端长度改变ISOMIR。这与识别小RNA测序数据集的真实ISOMIR相关。

结论

我们得出结论,源自测序误差和/或数据处理的潜在伪影可能导致高度估计miRNA同种型的丰度和多样性。注释ISOMiRNOME的努力应该考虑到这一点。

背景

MicroRNAs (miRNAs)是一类小的非编码rna (ncRNAs),平均长度为21-23个核苷酸(nt)。它们作为内源性调节分子,通过诱导靶mRNA沉默和衰减在转录后调节基因表达,已被广泛研究[1]。除了mRNA功能的负调节之外,还有其他的作用被提出[2]。初级miRNA转录本(pri-miRNA)主要被RNAses III (Drosha和DGCR8)的复合物切割,产生一个或多个前体miRNA (pre-miRNA),也称为发夹[3.]。在Dicer加工之后,发夹被夹在短的双链RNA中。得到的链中的一种(定义为成熟miRNA)与蛋白质Argonaut 2(前2)结合,并掺入RNA诱导的沉默复合物(RISC)中[4.]。对mRNA结合的靶特异性由种子区介导(由miRNA核苷酸位置2-8定义)[5.[中央位置和偏移碱中的miRNA的其他部分也已显示调节miRNA功能[6.7.)(附加文件1:图S1)。

基于该日期执行的下一代测序(NGS)的大多数miRNA表达研究已经总结了将所有读取的映射到具有或没有错配的特定miRNA基因座或miRNA序列,并将其分配给单个miRNA实体(MiRBase参考数据库条目)。然而,这种类型的分析忽略了并非所有读取与miRBase中的成熟参考序列相同的事实[8.]。小RNA测序NGS方法揭示了MiRNA通常以多种序列变体或同种型的形式出现(称为ISOMIR)[9.10]。这些ISOMIR主要通过在预先生前加工期间的不精确或替代切割以及转录后修改[11],包括末端核苷酸转移酶的非模板添加[121314]或通过腺苷脱氨酶编辑[15)(附加文件1:图S1)。这些变化会影响miRNA的稳定性、亚细胞定位、靶点亲和力和靶点特异性[1617]。许多关于表达更丰富的ISOMIR的报告比其各自的参考规范MiRNA突出了ISOMIR变体的生物学相关性[18]。此外,作为区分不同癌症类型的生物标志物,同质异构体可能比miRNAs提供更多信息[19]并显示人与人之间的差异[20.]。

重要的是,目前还缺乏完善的实验验证方法来补充具有同质ir水平分辨率的NGS。针对mirna的商业qPCR检测旨在识别典型形式,对于不同的相应的同质ir异构体可能有不同程度的特异性[21.]。

来自规范参考的miRNA序列的偏差是许多研究纠正技术源的许多研究的重点,例如对交叉映射的影响[22.),或尽量减少文库准备过程中结扎造成的偏差和伪影[23.]。不同研究之间的比较受到不同方法由于结扎而在图书馆内容中引入的偏差和随后的选择性扩增导致miRNA曲线的不完全或扭曲的表示[24.]。过去的研究解决了这些问题已经基于SR数据分析。最近,PE读取分析被提出了挖掘基础组成模式,以识别通过PE读对对准依赖于纠错的A-I转换编辑的miRNA,但作者没有看其他类型的变化[25.]。为了解决ISOMIR中发现的碱基差异是真正的生物变化还是来自测序中的误差的合成伪像的结果,我们将PE读取与SR读取的SR从小RNA测序实验进行比较。

据我们所知,迄今为止开发的检测同质ir多样性的软件工具并没有将PE考虑在内。这是可以理解的,因为大多数数据是SR主要由于测序成本的限制。我们开发了XICRA,一个用于分析小RNA测序(small RNA-seq)数据的管道,它可以检测和定量miRNA中的同质ir水平变化。作为先决条件,管道必须能够同时处理SR和PE读取。它以压缩的fastq文件作为输入,执行质量检查,在同一对中合并读取,使用第三方工具映射它们,如miraligner [26.],srnabench [27.]或擎天演员[28.]并为每个样本生成一个GTF文件,使用Mirtop通过“牌照”唯一标识符采用最新建议的命名共识的ISOMIR。用于鉴别差异表达的管道测试,以确定哪些ISOMIR在条件下显着上调或下调。应用相同的功能来评估SR和合并的PE读数之间的相对差异,以评估是否由于测序误差而被错误地推断出是否有任何ISOMIR序列。

结果

为了在具有基于配对的终端读取的误差校正功能的ISOMIR水平下对ISOMIR水平的系统分析,我们在名为XICRA的房屋中建立了一个新的管道(参见方法部分中的详细描述和图2中的方案。1)。首先,我们在模拟数据上测试了几个工具(包括sRNAbench、OPTIMIR和miraligner)的性能。利用模拟数据可以确定同质ir检测的特异性和敏感性。从独立的模拟读取生成中获得的100个重复被用于在硅中产生模拟R1和R2读取。每个重复随机选择100个mirna,随机生成变异类型,每个变异类型选择单个同质异构体序列。在每个重复中,总共有10,000个同质异构体(isomiRs)被用作测序读取模拟软件的输入,参数来自于我们实验数据中使用的相同类型的测序器(HiSeq2500, Illumina)。三种工具的比较显示使用miraligner的灵敏度和特异性最高(附加文件23.:图。S2 A,B)。因此,我们选择在随后对实验样本的分析中使用该软件。

图。1
图1

XICRA管道工作流程:从单读(SR)或对端(PE)读取作为输入,用于评估差异异构ir表达的步骤。绿色表示在管道中实现的模块。深蓝色方块表示中间结果,浅蓝色虚线方块表示最终结果。红框对应每个模块中使用的软件,蓝框对应XICRA外部软件,XICRA也用于分析结果

我们将SR模式定义为从单个读取导出的ISOMIR调用,以及PE模式作为从相同读对的连接R1和R2导致的ISOMIR调用导出的ISOMIR调用。当SR模式中的单个读取到ISOMIR时,虽然在PE模式中的相应合并读取的情况下,我们可以得出结论,从SR数据分析源自自己的ISOMIR计数是假阳性的,而应该被滤波。

在初始探索中,比较SR和PE模式中的模拟读取,我们已经检测到相对于PE分析的SR分析中的单核苷酸变体(ISO_SNV)型变体的过度陈述。有趣的是,单独的R1数据似乎具有相似甚至增强的敏感性来检测ISOMIR变体,但它的精确度较小,这意味着它导致比PE测序更为误报(附加文件4.5.:图。S3 A,B)。

一旦管道到位并验证,我们继续在我们的实验样本衍生的真实数据上测试它(附加文件10:表S1显示了预处理统计数据)。对于ISOMIR分配不一致,第一级分析看起来更详细地研究。在检查SR和PE模式下检查ISOMIR类型分配频率时,可以识别一些ISOMIR类型的比例中的偏差。我们再次观察到具有内部SNV(种子SNV或中央区域SNV Isomirs)分配给ISOMIR的滤波读数的更高比例的滤波读数。

我们进一步测试了允许一些不匹配(高达8%,PE_8)或读对合并步骤中的不匹配(0%,PE_0)的效果。结果表明,SR模式调用往往具有相对于两个PE模式调用的ISO_SNV相关ISOMIR的过度陈述。然后,我们在比较(称为SR1和SR2中,从R1和R2读取的比较中包括两个SR模式调用,即使R2读取自己几乎不会用于实际情况。SR模式呼叫均产生较高比例的非规范ISOMIR类型。允许不匹配导致这些类的较高频率可能是由于具有比R1读取更高的误差率的R2读取(图。2)。IsomiR调用在四种不同的模式(SR1, SR2, PE_0和PE_8)之间明显不同(附加文件6.:图。S4)。此外,由于几个改变的共存(“混合”型)的共存,大多数无法通过MIRTOP归类的大多数ISOMIR。这组ISOMIR是在实验数据集中最少的代表。在默认FASTQ-JOIN参数(PE_8)下,从SR1或SR2到PE模式时检测到的ISO_SNV变体的数量减少。当PE读取被合并时不允许任何错误(PE_0),分配给ISO_SNV类的读取总数进一步减少。PE_8和PE_0的结果之间的这种差异建议在基于PE数据分析ISOMIR分集时,应避免读对与读对之间不匹配的公差。

图2
figure2

一个对每个isomiR类和每个分析类别鉴定的唯一miRTOP序列进行分类和比较:PE_0 (PE分析,parameter fastq-join 0%百分比差异);PE_8 (PE analysis, parameter fastq-join 8% percentage difference);SR1(单端读R1)和SR2 (SE读R2)。混合isomiR类对应复合miRTOP类(例如:snv_seed,iso_add3p;iso_snv_seed iso3p;等等)。b每个ISOMIR类类别的重叠结果显示每个排序模式识别的ISOMIR类型的唯一MIRTOP序列分布。c所有同质异构体按方法分类的重叠结果的维恩图

通过应用差异miRNA表达分析方法,我们超出了描述性分析。结果显示了许多ISO_SNV相关的变量类,以在SR与PE模式下差异表达,由DESEQ和GSEA(图。3., 桌子1)。然而,由于这些差异表达的iso_snv isomiRs的表达水平非常低,所以就总reads的影响而言,影响几乎可以忽略不计(附加文件7.:图。S5)。

图3.
图3

GSEA浓缩的阴谋。预先排序的GSEA分析使用DESEq2在相同样本的SR和PE数据集(30个正常血清样本,筛选至少10个样本中存在的miRNA和同质ir序列)之间的归一化log2FoldChange估计数作为度量。对每一类同质ir的富集情况进行了评估。只有iso_snv类isomiRs表现出明显的富集。一个ISO_SNV,biso_5p,cISO_3P,diso_add3e规范浓缩的阴谋。请参见表1对于完整的输出结果

表1 SR中ISOMIR型富集的GSEA输出结果与PE数据比较。大小对应于从每个ISOMIR类型检测到的唯一序列的数量;丰富分数和错误发现率Q值(FDR Q值)如GSEA分析所提供

搜索文献和基因组数据库我们只能识别具有PE数据的一些公共miRNA测序数据集。我们测试了我们的观察可以从发表的非酒精脂肪肝病的研究中进行数据[29.)(附加文件11:表S2显示预处理统计数据)。结果(附加文件8.9.:图。S6 A,B)显示出类似的趋势和行为。

讨论

由于成本考虑到NGS的文献中的大多数研究用SR使用SR。我们假设ISOMIR水平的小RNA-SEQ PE数据分析可能有助于区分miRNA差异表达分析的分辨率。我们在源自健康人血清样品的PE模式下进行了小的RNA文库。这为我们提供了有机会评估ISOMIR分析的结果可以通过PE读取可以改善与仅使用前进SR1(或反向SR2)的分析的分析。我们的结果将支持PE测序可能导致更精确的分析,以检测到单独检测的少数变体的成本,它们可以在难以序列的区域中,这通常具有来自替代的较差的序列质量Strand。

我们测试了两个不同的PE读对合并条件。FASTQ-JOIN的默认值是在两个成对读数之间的对齐中允许高达8%的错误(用于MIRNA将需要1或2次核苷酸差异)。这原则上可能导致在读取的歧义和低质量的情况下保留测序误差,或者在r2中的呼叫中缺失(导致冲突的位置被错误地解决,有利于MiRBase成熟miRNA参考的不匹配)。

对比SR1和SR2的性能,R2积累了更多的误差,基于SR2的推断isomiR多样性比SR1模式分析更高。沿着读取长度的质量差异可以解释为什么一些特定的同质ir类型频率不同于所使用的读取。Illumina的质量倾向于下降的前几个周期,由于在Illumina的合成测序中使用的基本呼叫校准程序的性质。根据我们的研究结果,由于前几个碱基的错误率略高,可以推测R1可能与种子区snv的人工异snv同质异构体中富集。相反,R2可能在miRNA和同质异构体序列的3 '端有错误。通过PE_8模式抵消这些错误,允许失配,既会纠正来自R1读错误的iso_snv变体,也会增强来自R2读错误的iso_3add和iso_3p变体。PE-0模式,在连接步骤中零错配公差,将是最保守的,更接近事实,将被推荐以更低的计数率为代价。

触发这一点的机制可以是R1读取映射到ISO_SNV ISOMIR可能是本质上的质量较差的,并且可能没有R2读取足够的质量,并且不符合FASTQ加入步骤的条件。或者,在相同的读对与匹配规范miRNA序列的相同读对中的r2应该具有比R1更好的质量。这将支持膨胀的艺术iso_snv计数的假设来自质量差的读取误差。

当SR和PE比较时,对同质ir类型富集的GSEA分析表明,iso_snv的富集伴随着典型同型异构体的耗尽(这意味着当使用SR调用的iso_snv同质irs时,在PE模式下被指定为典型)。

虽然在我们的特殊结果中,ISO_SNV ISOMIRS代表了男性和女性样本之间的差异表达ISOMIR的相当小比例,但在其他研究中,可能仍然值得测试这一点,以便考虑到那些是人类的ISOMIR,只要样本已经存在在PE模式下测序。已经提出了诸如使用独特的分子标识符(UMIS)的替代方案来消除PCR复制品并对排序误差进行正确,但包含特殊适配器和额外的所需测序深度所涉及的成本可以使用PE读取代替。

我们的工作不允许在文献结果中推断SR数据流行率对成熟miRNA谱和异质粒差异表达的影响的结论。我们可以假设,来自PE测序的数据可以帮助减少噪声和人工制品,并防止SR数据可能产生的任何假阳性结果。

由于同质异构体的种子区和中心区是与mRNA相互作用的区域,发现内部SNV同质异构体呼叫很可能是由测序错误产生的,这可能会影响后续的分析,并使推导出的关于假定功能结果的结论产生偏差。我们的研究结果是相关的,因为在种子区与snv的同质异构体在生物学和机制水平上对miRNA调控功能的重要性。此外,我们的发现可以通过帮助定义真正的同质异构体,帮助解决同质异构体变异对miRNA生物标志物评估的验证和诊断分析的发展所带来的挑战。

我们的研究具有局限性,因为它只通过不匹配的读对透露的测序误差来解决噪声,并且受到使用的软件工具中的偏差。此外,除了生物信息分析数据处理外,影响ISOMIR分析的额外变异源可能来自图书馆制剂的关键因素,例如酶促步骤,适配器序列和尺寸选择程序。这些不同参数的优化取决于通过替代方法使用控制和验证。现有技术使ISOMIR数据结果具有固有的嘈杂和难以验证。为了能够比较不同的研究,需要广泛采用数据格式和诸如MIRTOP等MIRTOP的命名法,以便能够比较不同的研究。旧数据集的重新分析可以使可以恢复和重新诠释以前的工作。将需要收敛到最佳分析策略和软件标准化。该领域的未来工作应解决所有这些问题。协调一致的努力应该有助于提高我们对miRNA生物学的理解,并通过利用和挖掘真正的ISOMIR多样性来识别基于miRNA的生物标志物。

结论

我们可以得出结论,PE测序提高了小RNA测序数据中的isomiR呼叫。

内部变异isomiR调用是SR测序数据中常见的伪影。通过GSEA对SR与PE预排序的isomiR类进行基因集合富集分析,SR数据与PE数据相比具有显著的iso_snv富集。SR和PE模式测序之间存在影响内部编辑的isomiR (iso_snv)水平的系统差异。在SR模式中,许多可检测的内序列变异异构体可能是假阳性。

SR数据中,血清中差异表达的miRNAs中有相当一部分是iso_snv异构irs,可以通过PE模式过滤掉。其中许多是在非常低的表达水平上发现的,通常通过阈值或通用的DESeq2 DE分析过滤步骤来删除。相比之下,大多数差异调控的典型miRNA和长度变异isomiR类型(iso_5p、iso_3p和iso_add3)可以在SR数据中可靠地检测到。发现更多的同质异构体比规范的mirna被调节。

应谨慎进行内部RNA编辑miRNA结果。在SR模式测序中检测到的大多数推定的内部序列变体可能是伪造的。这意味着RNA编辑可能不会像提出的ISOMIR生物发生那样普遍存在。使用ISO_SNV过滤的SR测序可能足以进行ISOMIR分辨率。PE测序产生更好的质量读数。然而,PE比SR的成本更高,所述研究在大多数研究中都可以使用。对于大多数研究的ISOMIR级别分析,可以指示从SR数据过滤掉ISO_SNV命中。

通过替代方法验证ISOMIR,特别是对于从SR数据集导出的ISO_SNV来说,但由于高误率,这可能是技术上不可行或效率低下。不断降低的测序成本可以允许通过PES测序作为重点在于ISOMIR变异的未来miRNA研究中的优选方法。

方法

RNA提取,文库制备和Illumina测序

我们提取总RNA从30从健康人血清样本,匿名献血者同意的一个单独部分的循环与miRCURY RNA RNA生物标志物发现隔离包Biofluids (Exiqon)飙升与Exiqon RNA激增(1:50)混合的推荐量筛选了50µl。由于RNA浓度太低,无法用分光光度法或荧光法测定,RNA质量用microRNA QC PCR Panel进行评估。用miRCURY LNA™Universal RT microRNA PCR (Exiqon)逆转录2µl总RNA后获得的cDNA,用5µl稀释1:50得到96孔(V1.RO)。Exiqon使用外部加刺法控制miRNA的产量,并分析特异性miRNA以评估溶血。在罗氏LightCycler 480仪器(Roche)上进行10µl体积的定量PCR反应。所有样本包含在分析等效microrna的内容和低水平的溶血(ΔCq (mir - 23 - - mir - 451)从4.46到6.47,低于7)的测定拒绝极限值。我们建立索引库使用TruSeq小RNA工具包(Illumina公司)从所有剩余的RNA提取200µl(~ 48µl,相当于~ 192µl血清)。根据生物分析仪峰值定量,文库产物在预期尺寸约142 bp处以等摩尔量聚集在一起。使用Pippin prep系统(SAGE Science)选择30个文库的大小,该系统含有3%琼脂糖和115-165 bp范围内的无染料Marker F,以富集miRNA产品,并在大小选择步骤中减少样品之间的差异。测序数据由HiSeq 2500系统和v3 SBS试剂(Illumina)解析的2 × 50 nt reads组成。30个样本中有2个被排除,因为它们在PCA探索性分析中是明显的异常值,且文库收益率较差。 The final dataset consists of 28 samples.

小RNA-seq分析管道

为了分析小RNA-seq PE数据,我们开发了XICRA管道(https://github.com/HCGB-IGTP/XICRA)。它是用python开发的,带有多个独立的模块,并且可以作为pip包(https://pypi.org/project/xicra/)。这个管道被设计为采用fastq格式的配对端读,修剪适配器和低质量的碱基对位置,并合并重叠的读对(R1和R2)。参照基因组的映射步骤(用户定义)将连接的reads分配给所有主要的RNA生物类型,包括miRNA和同质异构体、tRNA片段(tRFs)和piwi相关RNA (piRNAs)。然后,XICRA使用连接reads在同质ir水平产生miRNA分析,用户可以通过标准化输出选择多种软件。生成每个样本的结果,分析和总结所有样本在一个单一的表达式矩阵。这些信息可以在miRNA或同质ir水平上处理(单序列),但也可以对各同质ir变异类型进行总结。可以使用附带的R包XICRA轻松地访问统计摘要。统计(https://github.com/HCGB-IGTP/XICRA.stats)。尽管管道被设计为接受对端读取,但它也接受单端读取。管道工作流程如图所示。1

XICRA使用cutadapt [30.]对于适配器修剪分析。默认修剪预设参数设置是:要保留所有读取,无论是否找到适配器,都有10%的最大适配器匹配错误率(不匹配,插入和删除),以及3bp最小重叠长度。用户必须为修剪分析提供特定的适配器序列。可以使用FASTQC对每个样本执行可选的先前质量检查步骤[31.在进行微调分析之前。使用MultiQC软件对所有样本的结果进行汇总[32.]。

一旦读取适配器修剪,该工具使用FastQ-Join ea-utils [33.]加入两个PE读取,如果提供,则在重叠结束上。除了加入的读取外,此工具还会生成两个文件,其中R1和R2无法加入的读取。作为默认值,将最小重叠设置为6bp,并且将读取的读取的最大允许差异设置为0%以保留100%匹配读对确保高质量排序信息。可以使用提供的不同选项进行修改参数。

XICRA管道可以继续处理加入的PE读取或SR读取。实施了两级映射。使用明星的第一级曲线RNA生物型[34.]对参照基因组和特征进行映射[35.]来提取和量化类的读取数量。第二层次专门关注小的RNA亚类。在这里,我们描述了在XICRA中实现的miRNA分析,但该管道的模块化和多功能性使其可以非常简单地详细包括其他RNA生物型分析。

对于ISOMIR分辨率水平的miRNA分析,XICRA允许用户使用miraligner [26., sRNAbench from sRNAtoolbox []27.]或擎天演员[28.]。每个软件都使用不同的策略,可能产生不同的结果[36.]。我们将它们包括在内,因为它们允许遵循miRTOP软件执行的标准化程序,并采用miR。Gff3文件格式[37.]。同样,管道模块化的实现将允许添加更多的软件融合和适应miRTOP和miR。gff3格式。对于上面提到的每一个软件和包含在XICRA的miRNA模块中的默认参数都被使用。可以使用提供的不同选项修改其中一些参数。miRNA模块的结果是生成注释,根据miRTOP建议的分类方案,根据序列修改(包括iso_5p、iso_3p、iso_add、iso_snv、iso_snv_seed、iso_snv_central_offset、iso_snv_central、iso_snv_central_suppl)将异构irs分类为类。最后的转换步骤,从每个样品miR。将Gff3文件转换为单个表达式矩阵执行。该文件用作差分表达式(DE)分析的输入。提供了每个唯一序列的信息,索引名称包含miRNA、变体类型和miRTOP提供的牌照(唯一标识符,UID)。由相同或不同miRNA的不同修饰产生的序列级重复条目被丢弃。 An additional matrix is provided containing the sequence information for each encrypted UID.

ISOMIR水平的每个样品读数矩阵总结成单个表达式矩阵,其用作感兴趣的比较组之间的DE分析的输入。我们生成了一个额外的R包(XICRA.STATS),它有助于检索这些矩阵,并解析所提供的每个唯一索引名中包含的信息。The DE analysis can be done aggregating data at the mature miRNA level (i.e. hsa-miR-501-3p), by isomiR class (i.e. hsa-miR-501-3p_iso_5p), by specific length variant cluster (i.e. hsa-miR-501-3p_iso_3p:-2) or with the sequence of the read itself as the counting data. This is useful since different types of modification may coexist in a single sequence, and non-templated additions and internally edited sequences can differ leading to isomiRs that can fall into different categories or be derived from different mature miRNAs. DE analysis is performed outside of the tool with DESeq2 package in R [38.]。

应用于同质异构体的基因集合富集分析

我们改编了基因集富集分析(GSEA)工具[39.[MiRNA SiRNA IsoOform'Gene Sets'按类类型分组所有类标识符(包括ISO_5P,ISO_3P,ISO_ADD,ISO_SNV,ISO_SNV_SEED,ISO_SNV_CONDRAL_OFFSET,ISO_SNV_CONDRAL,ISO_SNV_CENDRAL_SUPP)。发出基因表达结果,用于预先排名模式分析,与LOG2FOLD变化度量排序的默认设置。基因套是由血清中检测到的男性和女性个体的IsomiRNOME,该研究中使用的房屋产生的数据集。在整理所有样品中修剪后获得的所有独特序列在ISOMIR水平上注释并通过ISOMIR类型分组。每个ISOMIR基因集由分配给特定ISOMIR类型的所有唯一序列组成。

Venn图

描绘调节基因之间重叠的Venn图是使用r中的GTOOLS包中的VENN功能进行制备[40]。

外配对端读小RNA测序数据集

我们在NCBI SRA数据库中搜索了使用Illumina配对端读生成的小RNA测序数据集。很少有数据集符合我们的过滤标准。我们发现了一个属于一个项目(GEO GSE114923;PRJNA473134)研究了非酒精性脂肪酸性肝病(NAFLD)中的miRNA生物标志物。实验设计包括8例患者,分为对照组和病例组,数据集采用对端NextSeq 500对端库进行测序。参阅原版刊物的其他详情[29.]。

我们使用XICRA和三种不同的软件(Srnabench,Miraligner和Optimir)使用配对结束信息和单端读取(分别为R1和R2)来完全分析。对于修剪过程,我们用作适配器序列相应的NebNext库适配器。一旦为每个软件和读取类型生成了ISOMIR表达式矩阵,我们使用了R包XICRA.STATS用于解析R中的信息和DESEQ2 [38.使用上述实验设计(病例vs.对照)分析DE同质异构体或miRNAs。

计算机模拟

为了说明对端读取在同质ir水平分析中的潜力,我们生成了计算机模拟来测试单端或对端读取的技术错误的影响。我们遵循了Amsel等人之前描述的isomiR计算机模拟指南[36.]。我们使用多个高吞吐量测序配置文件创建了生物变化和技术变型,并使用在几种情况下检测到的ISOMIR的灵敏度和精度来评估模拟的性能。查看生物信息脚本和细节的详细信息(https://github.com/hcgb-igtp/xicra/tree/master/bmc_bioinformatics_paper/simulation.)。

生物变异

我们创造了人工miRNA亚型HOMO SAPIENS.miRBase的成熟和发夹序列(V.21)[41.]。我们还将每个miRNA的标准fasta序列添加到生成的变异数据集中。从生成的变异频率表中,我们选择了100个mirna,丢弃一些随机变异,生成生成的变异类型的随机分布频率。为了简化解释和评估,对于每个变异类型,我们选择了单一的亚型。对于每个变异类型,我们将每个成熟miRNA产生的100个序列的总数量对应的频率包括在内。因此,用预设的频率模拟了总共10,000个序列。

技术模拟

对于生成的每个生物数据集,我们使用了艺术[42.使用Fillumina Hiseq2500和MiseQ-V1测序系统配置文件,使用配对端模式模拟下一代测序(NGS)读取。我们根据长度分组所有异形型,并为每个长度子集生成NGS仿真,以最后将它们全部合并为每个文件,每个文件都相应地读取。我们为每个输入Fasta序列使用了10倍测序覆盖范围。如前所述[36.],由于ART模拟的性质,我们不得不解析并省略大约一半的读取生成,因为它们是反向补全的。我们只丢弃了反向补充的R1和相应的R2。由于我们在生物变异过程中基于频率的实现,我们确保了当对每个序列应用相同的覆盖并丢弃反向补体时,在NGS模拟中产生的生物变异频率将保持不变。对每一种模拟的变型,观察到的范围从5-500次不等。

绩效评估

我们评估了使用NGS仿真数据集和管道XICRA使用PE读取MiRNA ISOMIR分析的性能。对于每个数据集,我们使用使用配对端模式和R1和R2读取的单端模式使用MiRNA模块。对于配对端模式,我们最初使用两个不同的连接百分比差异截止(FASTQ-JOIN参数)来测试使用100%完美R1和R2读取或允许沿最小默认重叠的默认差异(8%)的效果。长度截止(6 BP)。对于单端模式,我们使用了模拟的总R1读取或总R2,使用SEQTK软件反转[43.分别)。我们使用XICRA中可用的三种不同软件:miraligner、sRNAbench和OPTIMIR在isomiR水平上生成了miRNA分析。

使用生成的生物变化频率作为每个数据集的真正阳性,我们评估了针对每个软件和读取类型检测到的ISOMIR的量。对于配对结束读取,我们还使用了不同的百分比差异截止值。对于每个ISOMIR,检测到的计数被归类为:当观察到的计数符合预期计数时,真实的阳性(TP);当观察到的计数超过预期计数时,误报(FP)被错误分配;当观察到的计数没有获得最低预期计数时,假阴性(FN)。我们计算了敏感性或召回为TP /(TP + Fn)和TP /(TP + FP)的精度或特异性。我们还报告了真正的否定(TN)在未观察到预期计数,并且当新的变体或miRNA出现并未预期的新生isomirs。我们使用ggplot2绘制结果[44.]对于每个软件和类型的类型。

可用性数据和材料

本工作产生的数据可在以下网址查阅https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE155370。分析管道可访问https://github.com/HCGB-IGTP/XICRA。模拟数据和脚本位于https://github.com/HCGB-IGTP/XICRA/tree/master/BMC_bioinformatics_paper。其他外部数据集摘要注释和过程信息可在以下地方获得:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=gse114923.和原始测序数据下载https://www.ncbi.nlm.nih.gov/bioproject/?term=PRJNA473134。本研究中分析的Reads定位于人类基因组参考GRCh38.87 (ftp://ftp.ensembl.org/pub/release-87/gtf/homo_sapiens/homo_sapiens.grch38.87.gtf.gz.)和miRBase v21发夹和成熟microRNA参考数据库(ftp://mirbase.org/pub/mirbase/21/)。

缩写

德:

微分表达式

GSEA:

基因设定浓缩分析

门店:

下一代测序

体育:

Paired-end

pe_0:

合并之前允许的配对结束模式0不匹配

PE_8:

配对结束模式,合并之前允许8%不匹配

SR:

单一的阅读

SR1:

来自R1的单个读取模式读取

SR2:

R2读取的单个读取模式读取

R1:

阅读1

R2:

阅读2

SNV:

单核苷酸变异

参考文献

  1. 1.

    Iwakawa Ho,Tomari Y. MicroRNA的功能:mRNA衰减和翻译镇压。趋势细胞BIOL。2015; 25(11):651-65。

    CASPubMed.文章谷歌学者

  2. 2。

    Hausser J,Zavolan M. miRNA-靶相互作用的鉴定及后果 - 超出基因表达的抑制。NAT Rev Genet。2014; 15(9):599-612。

    CASPubMed.文章pmed中央谷歌学者

  3. 3.

    金正日VN。MicroRNA生物起源:协调裁剪和切粒。细胞生物学杂志。2005;6(5):376-85。

    CASPubMed.文章pmed中央谷歌学者

  4. 4.

    Bartel DP。MicroRNAs:基因组学、生物发生、机制和功能。细胞。2004;116(2):281 - 97。

    CAS文章谷歌学者

  5. 5.

    Lewis BP,Burge CB,Bartel DP。保守的种子配对通常由腺苷侧翼表明成千上万的人类基因是MicroRNA靶标。细胞。2005; 120(1):15-20。

    CASPubMed.文章pmed中央谷歌学者

  6. 6.

    Shin C, Nam JW, Farh KK, Chiang HR, Shkumatava A, Bartel DP。扩展microRNA靶向代码:具有中心配对的功能位点。38摩尔细胞。2010;(6):789 - 802。

    CASPubMed.pmed中央文章谷歌学者

  7. 7.

    Broughton JP, Lovci MT, Huang JL, Yeo GW, Pasquinelli AE。种子之外的配对支持microRNA靶向性。摩尔细胞。2016;64(2):320 - 33所示。

    CASPubMed.pmed中央文章谷歌学者

  8. 8.

    Neilsen CT,Goodall GJ,Bracken CP。ISOMIRS-动态微罗的忽视曲目。趋势类型。2012; 28(11):544-9。

    CASPubMed.文章谷歌学者

  9. 9.

    Marti E, Pantano L, Banez-Coronel M, Llorens F, minons - moyano E, Porta S, Sumoy L, Ferrer I, Estivill X.通过大规模并行测序检测到控制和亨廷顿病脑区的无数miRNA变异。核酸杂志2010;38(20):7219-35。

    CASPubMed.pmed中央文章谷歌学者

  10. 10.

    Morin Rd,O'Connor MD,Griffith M,Kuchenbauer F,Delaney A,Prabhu Al,Zhao Y,McDonald H,Zeng T,Hirst M,屋檐CJ,Marra Ma。大规模平行测序在人胚胎干细胞中微小谱分析和发现的应用。Genome Res。2008; 18(4):610-21。

    CASPubMed.pmed中央文章谷歌学者

  11. 11.

    Ameres SL,扎莫尔警局。多样的microRNA序列和功能。细胞生物学杂志。2013;14(8):475-88。

    CASPubMed.文章pmed中央谷歌学者

  12. 12.

    Burroughs AM, Ando Y, de Hoon MJ, Tomaru Y, Nishibu T, Ukekawa R, Funakoshi T, Kurokawa T, Suzuki H, Hayashizaki Y, Daub CO. A comprehensive survey of 3’ animal miRNA modification events and a possible role for 3’ adenylation in modulating miRNA targeting effectiveness. Genome Res. 2010;20(10):1398–410.

    CASPubMed.pmed中央文章谷歌学者

  13. 13。

    Wyman SK,KNOUF EC,Parkin RK,Fritz Br,Lin DW,Dennis Lm,Krouse Ma,Webster PJ,TeWari M.通过多种核苷酸转移酶转录MiRNA变体的发术产生有助于miRNA转录组复杂性。Genome Res。2011; 21(9):1450-61。

    CASPubMed.pmed中央文章谷歌学者

  14. 14。

    Yang A,Bofill-de Ros X,Shao TJ,Jiang M,Li K,Villanueva P,Dai L,Gu S. 3'uridylation与非规范目标曲目赋予Mirnas。Mol细胞。2019; 75(3):511-522 E514。

    CASPubMed.pmed中央文章谷歌学者

  15. 15.

    Blow MJ, Grocock RJ, van Dongen S, Enright AJ, Dicks E, Futreal PA, Wooster R, Stratton MR. human microRNAs的RNA编辑。基因组医学杂志。2006;7 (4):R27。

    PubMed.pmed中央文章CAS谷歌学者

  16. 16.

    bobottle - de Ros X, Yang A, Gu S. IsomiRs:将miRNA抑制工具箱扩展到种子之外。生物化学与生物物理学报,2020;1863(4):194373。

    CASPubMed.文章谷歌学者

  17. 17.

    Tan GC, Chan E, Molnar A, Sarkar R, Alexieva D, Isa IM, Robinson S, Zhang S, Ellis P, Langford CF, Guillot PV, Chandrashekran A, Fisk NM, Castellano L, Meister G, Winston RM, Cui W, Baulcombe D, Dibb NJ。5 ' isomiR变异具有重要的功能和进化意义。中国生物医学工程学报(英文版);2014;

    CASPubMed.pmed中央文章谷歌学者

  18. 18.

    Karlsen TA, Aae TF, Brinchmann JE。46个人血浆外泌体中microrna和同质异构体的稳定谱分析。Sci众议员2019;9(1):19999。

    CASPubMed.pmed中央文章谷歌学者

  19. 19.

    Telonis AG,​​Magee R,Hone P,Chervoneva I,Londin E,Rigoutsos I.关于MiRNA同种型的存在或不存在的知识可以成功地区分32种TCGA癌症类型。核酸RES。2017; 45(6):2973-85。

    CASPubMed.pmed中央文章谷歌学者

  20. 20.

    Londin er,Rigoutsos I.人类淋巴细胞系中的ISOMIR表达谱表现出人口和性别依赖性。oncotarget。2014; 5(18):8790-802。

    PubMed.pmed中央文章谷歌学者

  21. 21.

    Dellett M, Simpson DA。对分子诊断的microRNA PCR方法优化的考虑。专家Rev Mol Diagn. 2016;16(4): 407-14。

    CASPubMed.文章pmed中央谷歌学者

  22. 22.

    de Hoon MJ, Taft RJ, Hashimoto T, Kanamori-Katayama M, Kawaji H, Kawano M, Kishima M, Lassmann T, Faulkner GJ, Mattick JS, Daub CO, Carninci P, Kawai J, Suzuki H, Hayashizaki Y.交叉映射和高通量测序文库中成熟microrna编辑位点的鉴定。基因组研究》2010;20(2):257 - 64。

    PubMed.pmed中央文章CAS谷歌学者

  23. 23.

    金永平,金永平,张洪平,尤克,金永平。偏见最小化量化microRNA揭示了广泛的选择性处理和3 '端修饰。核酸研究进展[j] .中国生物医学工程学报,2019;47(5):2630-40。

    CASPubMed.pmed中央文章谷歌学者

  24. 24.

    Wright C,Rajpurohit A,Burke Ee,Williams C,Collado-Torres L,Kimos M,Brandon NJ,Cross AJ,Jaffe Ae,Weinberger Dr,Shin Jh。小RNA测序中多种偏置的综合评估揭示了广泛使用的方法性能的显着差异。BMC基因组学。2019; 20(1):513。

    PubMed.pmed中央文章CAS谷歌学者

  25. 25。

    Galipon J,Ishii R,Ishiguro S,Suzuki Y,Kondo S,Okada-Hatakeyama M,Tomita M,Ui-Tei K.高质量的重叠配对结束读取,用于检测小RNA上的A-to-I编辑。方法Mol Biol。2018; 1823:167-83。

    CASPubMed.文章谷歌学者

  26. 26。

    Pantano L,Estivill X,Marti E.Seqbuster,用于加工和分析小RNA数据集的生物信息工具,揭示了人胚胎细胞中普遍存在的miRNA修饰。核酸RES。2010; 38(5):E34。

    PubMed.文章CAS谷歌学者

  27. 27。

    Rueda A,Barturen G,Leburbron R,Gomez-Martin C,Alganza A,Oliver JL,Hackenberg M. Srnatoolboolbox:一组小型RNA研究工具集成。核酸RES。2015; 43(W1):W467-473。

    CASPubMed.pmed中央文章谷歌学者

  28. 28.

    本论文主要研究方向为:Thibord F、Perret C、Roux M、Suchon P、Germain M、Deleuze JF、Morange PE、Tregouet DA。OPTIMIR是一种将全基因组基因型数据整合到miRNA序列比对分析中的新算法。RNA。2019; 25(6): 657 - 68。

    CASPubMed.pmed中央文章谷歌学者

  29. 29.

    Lopez-Riera M, Conde I, Quintas G, Pedrola L, Zaragoza A, Perez-Rojas J, Salcedo M, Benlloch S, Castell JV, Jover R.无创预测NAFLD严重程度:对先前假设的血清microRNA生物标志物进行全面、独立的验证。Sci众议员2018;8(1):10606。

    PubMed.pmed中央文章CAS谷歌学者

  30. 30.

    Martin M.Cutadapt从高吞吐量测序读取中删除适配器序列。Embnetjournal。2011; 17(1):3。

    谷歌学者

  31. 31.

    FastQC。高通量序列数据的质量控制工具。http://www.bioinformatics.babraham.ac.uk/projects/fastqc/。访问了2020年6月30日。

  32. 32.

    Ewels P, Magnusson M, Lundin S, Kaller M. MultiQC:在一个报告中总结多个工具和样品的分析结果。生物信息学。2016;32(19):3047 - 8。

    CASPubMed.pmed中央文章谷歌学者

  33. 33.

    处理生物测序数据的命令行工具。https://github.com/expressionanalysiss/ea -utils.。访问了2020年6月30日。

  34. 34.

    Dobin A,Davis Ca,Schlesinger F,Drenkow J,Zaleski C,JH​​A S,Batut P,Chaisson M,Gingeras TR。星:超快通用RNA-SEQ对齐器。生物信息学。2013; 29(1):15-21。

    CAS文章谷歌学者

  35. 35.

    Liao Y, Smyth GK, Shi W. featurects:一个高效的通用程序,用于分配序列读取到基因组特征。生物信息学。2014;30(7):923 - 30。

    CAS文章谷歌学者

  36. 36.

    Amsel D, Vilcinskas A, Billion A.评价高通量同源异构体识别工具:阐明早期的同源异构体Triceolium castaneum.。BMC生物素。2017; 18(1):359。

    文章CAS谷歌学者

  37. 37。

    马Desvignes T, loh P, Eilbeck K, J, Urgese G,弗洛姆B,悉德J, Aparicio-Puerta E,巴雷拉V, Espin R, Thibord F, Bofill-De Ros X, Londin E, Telonis AG) Ficarra E,弗里德兰德先生,Postlethwait JH, Rigoutsos我,哈肯伯格M, Vlachos, Halushka可,淡水沼泽l . microrna的统一和isomiR研究:mirGFF3格式和mirtop API。生物信息学。2020;(3):698 - 703。

    CASPubMed.文章谷歌学者

  38. 38。

    DESeq2对RNA-seq数据的fold change和dispersion的调节估计。基因组医学杂志。2014;15(12):550。

    PubMed.pmed中央文章CAS谷歌学者

  39. 39。

    Subramanian A,Tamayo P,Mootha VK,Mukherjee S,Ebert Bl,Gillette Ma,Paulovich A,Pomeroy SL,Golub Tr,Lander Es,Mesirov JP。基因设定富集分析:一种基于知识的解释基因组表达谱的方法。Proc Natl Acad Sci USA。2005; 102(43):15545-50。

    CASPubMed.文章pmed中央谷歌学者

  40. 40.

    用于绘制数据的各种R编程工具。https://github.com/talgalili/gplots.。访问了2020年6月30日。

  41. 41。

    Kozomara A,Griffiths-Jones S. Mirbase:集成MicroRNA注释和深序数据。核酸RES。2011; 39(数据库问题):152-7。

    文章CAS谷歌学者

  42. 42。

    黄伟,李磊,马思杰,一种新一代测序读取模拟器。生物信息学,2011,28(4):593 - 4。

    PubMed.pmed中央文章CAS谷歌学者

  43. 43.

    SEQTK:一个用于处理FASTA或FASTQ格式的序列数据的程序工具包。https://github.com/lh3/seqtk。访问了2020年6月30日。

  44. 44.

    威克哈姆,编辑。GGPLOT2:高雅图形进行数据分析。柏林:斯普林克;2009年。

    谷歌学者

  45. 45.

    陈敏,郭德华,徐辉,陈敏华。小鼠视网膜和RPE/脉络膜中极其复杂的小rna群体。眼科科学,2013;54(13):8140-51。

    PubMed.文章CAS谷歌学者

  46. 46.

    Pantano L,Isomi R. Wikipedia,免费百科全书。UTC 8月29日,13:29。https://en.wikipedia.org/w/index.php?title=isomir &oldid=975607072https://en.wikipedia.org/wiki/IsomiR#/media/File:Isomirs.jpg。访问了2020年6月30日。

下载参考

致谢

这项工作最初是ALDH在Wagenigen大学和研究部(wurl -Wagenigen University)获得生物信息学硕士学位时的一个实习项目,由LS和Sandra Smit博士共同指导。我们感谢匿名献血者,他们同意献血,并从中提取血清循环RNA用于小RNA库的制备。我们还感谢提供或收集血清样本和书面知情同意的医生、护士和技术人员,包括Joan Grífols、Pilar Monleon和护理人员(Banc de Sang i Teixits、Can Ruti、Badalona)。我们感谢来自Vall d’hebron肿瘤研究所(VHIO)癌症基因组组的Ana Vivancos, Ginevra Caratù和Francesco Mancuso对测序的支持。我们感谢来自IGTP高性能计算单元的科学系统管理Iñaki Martinez de Ilarduya和Lloyd Goodman。特别感谢对故障排除的支持,请向Michael Hackenberg (universsidad de Granada)就sRNA工具箱问题和Lorena Pantano (Harvard T.H. Chan公共卫生学院)就miRTOP问题提供支持。

资金

这项工作和出版费用由Instituto de Salud Carlos III (ISCIII)赠款PI10-01154 (Proyectos de Investigación en Salud)提供给LS。资助机构,ISCIII,没有在研究的设计,收集,分析,解释数据,或撰写手稿中发挥任何作用。JFSH是ISCIII通过Acción Estratégica en Salud 2018(由欧洲区域发展基金/欧洲社会基金联合资助;CA18/00019(与técnico bioinformático de apoyo A la investigación en los IIS acreditados de IIS相反)。该研究小组被加泰罗尼亚generitat de Catalunya正式认可为GRPRE (2017 SGR 484)。

作者信息

从属关系

作者

贡献

ALDH最初设计该工具用于SR和PE reads的miRNA和isomiR分析,并对数据进行初步分析;JFSH开发了流水线,创建了python包,添加了附加参数,对数据进行最终分析,解释结果并起草了稿件;RP完成了从血清RNA提取到测序文库制备的所有实验步骤;LS构思了研究,分析解释了研究结果并撰写了论文。所有作者已阅读并批准最终稿件。

相应的作者

对应于Lauro Sumoy

伦理宣言

伦理批准和同意参与

本文中使用的数据经西班牙Badalona的德国Trias i Pujol医院伦理审查委员会批准(参考文献:PI-13-084)。来自献血志愿者的原始血清样本是从与当地血库(Banc de Sang i Teixits, Can Ruti, Badalona, Spain)的商业协议提供的血液样本中获得的,这些血液样本获得了每个捐赠者的知情书面同意。

同意出版

不适用。

利益争夺

作者们宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

额外的文件1:

图S1: miRNA和同质异构体的生物发生概述(改编自[45]的图1,经版权持有人视觉和眼科研究协会许可,并可免费访问维基百科图片内容[46.])。

附加文件2:

A:三种不同软件的仿真统计,从左到右依次为miraligner, OPTIMIR和sRNAbench,不同读取类型的颜色:红色,对端(PE);绿色,单端R1 (R1);蓝色,SE R2 (R2)。统计从上到下,Sensitivity,计算为TP/(TP+FN);精密度或特异性,以TP/(TP+FP)计算;新一代为检测到的新的非预期异构体总数。我们用0% fastq的PE读取来显示结果。

附加文件3:

图S2 B:三种不同软件的仿真统计,从左到右(miraligner, OPTIMIR和sRNAbench),不同读取类型的颜色:红色,对端(PE);绿色,单端R1 (R1);蓝色,SE R2 (R2)。统计从上到下,Sensitivity,计算为TP/(TP+FN);精密度或特异性,以TP/(TP+FP)计算;新一代为检测到的新的非预期异构体总数。我们用0% fastq的PE读取来显示结果。

额外的文件4:

图S3 A:使用Miraligner软件的模拟结果分类和比较Mirigner软件,每个ISOMIR类和每个分析类别分析:PE_0(PE分析,参数FASTQ-JOIN 0%百分比差);PE_8 (PE analysis, parameter fastq-join 8% percentage difference);SR1(单端读R1)和SR2 (SE读R2)。我们表示总平均读计数(A)和检测到的唯一同质异构体计数(B)。

额外的文件5:

B:使用miraligner软件从模拟结果中对miRTOP序列进行分类和比较,对于每个isomiR类和每个分析类别:PE_0 (PE分析,参数fastq-join 0%百分比差异);PE_8 (PE analysis, parameter fastq-join 8% percentage difference);SR1(单端读R1)和SR2 (SE读R2)。我们表示总平均读计数(A)和检测到的唯一同质异构体计数(B)。

附加文件6:

图S4:针对每类分析和每个ISOMIR类型类别的分析和分组的重叠ISOMIR的VENN图:a)规范;b)ISO_3P;c)ISO_5P;d)ISO_ADD3P;e)ISO_SNV;f)iso_snv_cental;g)iso_snv_central_offset;h)iso_snv_central_supp;i)ISO_SNV_Central_seed;j)混合类别。

额外的文件7:

图S5:每个异构ir类类别的重叠结果,显示了总读累积读计数分布到每个测序模式识别的异构ir类型。

额外的文件8:

A:使用miraligner软件对GEO项目GSE114923的miRTOP序列进行分类和比较,对于每个isomiR类和每个分析类别:PE_0 (PE分析,参数fastq-join 0%百分比差异);PE_8 (PE analysis, parameter fastq-join 8% percentage difference);SR1(单端读R1)和SR2 (SE读R2)。我们表示总平均读计数(A)和检测到的唯一同质异构体计数(B)。

附加文件9:

B:使用miraligner软件对GEO项目GSE114923的miRTOP序列进行分类和比较,对于每个isomiR类和每个分析类别:PE_0 (PE分析,参数fastq-join 0%百分比差异);PE_8 (PE analysis, parameter fastq-join 8% percentage difference);SR1(单端读R1)和SR2 (SE读R2)。我们表示总平均读计数(A)和检测到的唯一同质异构体计数(B)。

额外的文件10:

表S1:室内测序供血者的所有28份血清样本的小RNA测序数据处理统计(GSE155370;)。

额外的文件11:

表S2:来自公共数据集的NAFLD患者的所有16个等离子体样本的小RNA测序数据处理统计数据(GSE114923)。

权利和权限

开放获取本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。“创作共用公共领域”豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

桑切斯·埃雷罗(Sanchez Herrero), J.F。等等。配对结束的小RNA测序揭示了从传统单读数据分析中报告的ISOMIR序列曲目中可能的高度估计。欧宝娱乐合法吗22日,215(2021)。https://doi.org/10.1186/s12859-021-04128-1

下载引用

关键词

  • microrna的
  • ISOMIR.
  • 配对结束排序
\