跳到主要内容

寄宿:牛津纳米孔测序仪器的实时监测

抽象的

背景

牛津纳米孔技术(ONT)的主要优点之一是实时排序的可能性。这可以在实验期间访问信息,并允许在获得结果后控制测序或停止测序。但是,ONT测序界面不足以探索深度中排序数据的质量,并且现有的质量控制工具不充分利用实时数据流。

结果

在此,我们呈现寄借,交互式Web应用程序来分析ONT测序运行的效率。寄宿的交互式界面允许用户轻松探索测序度量并优化实验期间生成的数据的数量和质量。它还可以比较多个流电池来评估库准备协议或输入样本的质量。

结论

寄宿机致力于管理ONT测序仪器的人,并允许它们远程,实时监控其实验并比较多个测序运行。源代码,Docker Image和Demo版本可用http://www.genosope.cns.fr/boardion/

背景

自2014年以来,Oxford Nanopore Technologies (ONT)推出了一系列纳米孔测序设备,从便携式MinION设备到灵活、高通量PromethION测序器。ONT技术允许对长DNA或RNA分子进行测序,读取精度目前为96% [1]已经拥有广泛的应用程序[23.4.5.6.7.]。与传统的下一代测序平台不同,在排序实验结束时提供数据,实时生成ONT测序数据。用户可以访问时间关键信息[8.[因此,一旦获得结果,能够停止分析。这最终允许洗涤和重用流动电池[9.]。但是,ONT接口(MinkNow)不提供足够的交互性和报告以彻底探索测序数据的质量。此外,几乎所有质量控制工具,如MinionQC [10.], pycoQC [11.],纳米帕克[12.]和toulligqc [13.并没有充分利用ONT仪器在运行结束时分析测序数据的实时能力。在这里,我们介绍了boardon,一个交互式的web应用程序,用于实时评估ONT测序运行。BoardION提供了测序平台,可以远程同时监控所有ONT设备(MinION、Mk1C、GridION和PromethION)。它还允许对几个测序实验进行比较,以评估库的准备工作或输入样本的质量。此外,我们比较了BoardION和Minotour [14.这是目前唯一能够实时处理数据的软件。

执行

BoardION由两个组件组成,第一个专门用于预处理由ONT基调用者(guppy)生成的文件,第二个是一个动态的web应用程序,BoardION的中心部分,它允许可视化和排序指标的比较。BoardION可以直接从源代码安装和使用,也可以通过包含所有必要依赖项的docker映像安装和使用。文档、github和dockerhub存储库,以及一个交互式的BoardION演示版本可以在下面找到http://www.genosope.cns.fr/boardion/

数据预处理

通过使用由Guppy BaseCaller生成的排序摘要文件中包含的信息来执行正在进行的正在进行的运行,但是Web应用程序不会直接读取和加载此文件。实际上,测序摘要可能相当大(超过10 GB),随着吞吐量的增加,将来会变大。相反,预处理工具周期性地分析以生成仅包含感兴趣的度量的轻量级数据集。在每个启动时,软件在输入文件夹中搜索排序摘要文件,并使用Final_summary.txt文件来检测完成的实验。在C ++中开发的该预处理步骤使用IOStream库的Seepg函数直接访问和处理纽lines。通过这些优化,可以每分钟在Web应用程序中计算和更新统计信息。对于每个流单元,预处理脚本生成五个小文件(<3 MB):每10分钟计算的四个包含统计信息,其中一个包含读取长度分布。C ++软件还创建了列出所有流单元的文件,其状态(已完成或未完成)和最新指标。预处理脚本的CPU时间和内存使用与运行的读数数相关联。它平均需要一分钟和60莫,以处理单次运行,小于5分钟,100 mo在我们最大的接种运行(83米读取)。

寄宿网应用程序

我们开发了一个web应用程序,因为它的优势是无论用户的配置如何,都易于访问。因此,用户可以远程同时监控其ONT设备的所有测序运行。BoardION web应用程序是基于R闪亮包[15.允许我们描述接口的内容和应用程序元素之间的关系。它还使用ggplot2 [16.]和情节r库[17.]创建动态JavaScript图形。Web应用程序的内存用法取决于接口的使用,但通常需要小于400 Mo。寄存储件应用程序计算广泛使用的度量,例如产量,易位速度,读取长度和质量。所有图形,动态生成,都可以导出并保存为图像。该接口分为三个选项卡:«正在进行中运行»这会强调目前正在进行的测序实验,«运行档案»,允许用户准确评估所有存储的实验和«测序概述»的给定实验,从而比较了所有存储的指标测序实验(正在进行或完成)。

«正在进行的“运行”选项卡显示正常排序度量(读取长度,产量,质量,易位速度...)的概述,以实时进行排序的所有运行(图。1)。从实验开始累积地绘制度量,以评估整体效率或每十分钟以快速检测质量下降。此仪表板允许用户遵循正在进行的运行并使用“RUN归档»”选项卡更精确地调查给定的实验。

图。1
图1

boardon«running in progress»标签。第一个面板列出了所有正在进行的实验的排序指标。下面,每个面板都是这些实验中的一个。用户可以打开面板显示每个实验的吞吐量、读取长度分布和重要指标。吞吐量可以从运行开始或每10分钟绘制一次。所有图形都是交互式的,因为用户还可以缩放或显示鼠标上方的弹出框来突出显示特定的值。在本例中,第一个实验的面板被打开,而第二个实验的面板被最小化

«RUN归档»选项卡包含正在进行的结果和完成的运行(图。2)。通过动态和可自定义的图形显示指标,因为用户可以选择要绘制的指标。这些度量可以在时间上观察到根据实验时间或在流量电池的通道网上分析运行质量,以检测气泡或污染物的存在,这可以降低测序实验的效率。

图2
图2.

Labelion«Run Archive»标签。Channel View面板:在用户选择的度量标准的FlowCell通道网格上分发。可自定义的绘图面板:所选择的度量标准的变化表示为经过时间的函数,并根据质量彩色。在该示例中,产量和读取长度分配面板最小化

“测序概述”选项卡专用于来自多个流单元的测序度量的比较(图。3.)。此选项卡是灵活的,用户可以在存储的流单元和提出的指标之间交互选择,并将其添加到当前图。第一个面板概述了所有存储的排序所运行的测序指标,并允许用户根据新协议,毛孔,序列仪或BaseCallers的释放遵循ONT技术的演变。下一个面板专用于通过运行时间的排序度量(产量,读取大小,易位速度......)或描绘几个运行的读取大小分布来进行多次运行的比较。

图3.
图3.

boardon«测序概述»选项卡。运行概述面板,用户可以根据运行日期选择要进行比较的运行指标。在这里,面板显示了运行收益率的月度变化。在运行比较面板中,用户可以选择几个运行来比较读取长度分布和运行期间的所有其他度量

结果和讨论

实时监控

通常,«正在进行中运行»«Run归档»标签用于监视正在进行的排序实验。在测序期间,试剂的消耗导致可以影响读取质量或产量的易位速度的降低[1]。实际上,ONT建议将易位率保持在每秒300个基础上方[18.]。由于其实时能力,寄存能允许用户检测易位率的降低,然后在合适的时间添加试剂(加油)以避免有效的不可逆转下降。数字4.在观察易位速度的降低以及读取长度和基础质量之后,在20小时后,在20小时后加油后,展示了一例。加油后,测序实验恢复最佳的易位率,产生更长且更高质量的读数,最终实现了83 GB的产量。此外,寄存器允许测序平台定义下面的度量阈值(速度,质量或产量),流量必须加油或洗涤序列新样品。

图4.
图4.

一种CD.用于加油运行的可自定义图形的示例:在十分钟的切片中计算(屈服,速度和中位数)(和或平均),并以经过的时间的功能显示。B.在测序实验(X轴)期间产生的给定质量(Y轴)的读取(颜色刻度)的数量。手动添加了虚线的黑线,并突出了加油时间(1200,1650和2450 MN)。该地图显示了一滴中位读取尺寸(D.)和质量(B.)以260b / s后面的速度测序500 mn(C)。1200 MN的第一个加油恢复初始速度(C)及中等大小(D.)但也是每十分钟的几乎初始产量(400 MB,460 MB,情节一种)。根据ONT支持的推荐,在达到300 b / s左右的易位率时进行了最后两种摘要

流量的比较

我们比较四种流动细胞,其中使用不同的图书馆尺寸对两个相同物种的菌株进行测序。我们观察到两种菌株之间的产量不相同(图。5.一种)。相比之下,即使文库的尺寸不同,屈服对于给定的菌株也是相同的(图。5.C)。图书馆准备如FlowCell F2似乎是生成更长读取的更好选择。ONT技术的一个主要优点是能够序列非常长的DNA片段(> 30 kB)。作为插图,我们还通过测序植物的相同基因型来使用寄存器来比较ONT和循环系统的长读库制备方案。随着循环系统方案,几乎移除了读取尺寸为5kb的峰值(图。5.d).该协议在读大于10kb时产生更高比例的碱基。然而,ONT协议产生的碱基几乎是Circulomics协议的两倍。5.b)。运行比较面板的另一个使用是实时比较的可能性和被测序的同时运行的读取大小分布(图。5.e)。

图5.
图5.

排序概述选项卡的运行比较面板所描述的度量和图的示例。该面板允许我们根据产量和读取长度来比较运行。一种十分钟的四分之一的累积产量。B.累积产量来自两个跑的测序开始。C四个运行的特定长度读取的基数数量。D.两个运行的特定长度的读数中包含的基础百分比。E.从实验开始的累积产量开始进行三次测序

讨论和未来发展

像Loblion一样,ONT测序接口MinkNow2显示有关易位速度,产量,读取长度和质量的实时信息,但在温度,电压,孔隙状态,条形码分布和参考覆盖范围内添加图表。尽管如此,图表缺乏相互作用,以充分探索运行的质量。相比之下,寄存器提供交互性,以从运行的开始,每十分钟根据流电站的通道网格统计所有度量,或者使用可自定义面板将度量相关联。此外,寄存器增加了一些功能,例如存储所有测序运行的统计数据,这些运行的度量的比较以及远程和同时监视许多ONT设备的运行。MinkNow是监控单一运行的一个很好的应用程序,但寄存器专用于监控,并在给定设施中执行的所有运行的比较。

Minotour目前是唯一能够实时处理ONT排序数据的平台。该平台由数据库组成,用于存储排序度量和Web用户界面。该接口显示描述运行效率(产量,读取长度和质量,速率,孔隙活动)的度量和与参考基因组(覆盖范围)的对齐。用户还可以在达到阈值时设置警报。我们测试了Minotour以将其功能与董事会进行比较。在没有强大的计算机技能的情况下,在UNIX上安装MINOTOR在UNIX上很难。Minotour开发人员建议上传他们的服务器上的数据,但由于Web传输,此解决方案不允许实时分析数据,并且在机密性期间存在问题。相比之下,寄宿的Docker图像易于安装和平台独立。我们使用Minotour平台提供的数据测试了Minotour。与寄存器不同,MINOTOR提供了探索运行信号的可能性以及在测序的基因组上获得的覆盖范围。 However, BoardION has some additional features such as comparison of runs, overview of all runs and customizable plots that allow users to thoroughly explore their sequencing experiments. Furthermore, we did not succeed to upload our own sequencing data on the minoTour server. It seems that minoTour has not been updated since 2017, so, as ONT technology evolves quickly, minoTour seems to be currently unusable on recent ONT sequencing data.

若干应用可以采取所有ONT生成的数据(组装,结构变化),但其他应用只需要高质量的数据(识别,SNV,表观遗传学)。Guppy BaseCalling报告区分通过和失败读取(质量阈值为7)。报告传递读取的指标将是有用的,以帮助排序平台以优化通过产量。报告每个条形码的产量运行的产量也将是有用的,以评估条形码效率,并评估每个样品获得的产生数据。我们的目标是添加一个警报功能,当达到度量标准时向用户发送电子邮件。利用此特征,测序平台将能够配置自己的警报阈值,以便在测序问题的情况下更快地反应或者在获得产量后停止运行。我们还想添加报表生成器,以导出包含由寄存处计算的所有指标和图形的可读文档。

结论

boardon是一个交互式web应用程序,用于实时监测ONT测序运行。该应用程序可以通过Docker发行版进行安装。BoardION的动态交互界面允许用户轻松探索测序指标,并实时优化生成数据的数量和质量。它还提供了比较多个测序实验的可能性,这可以用于分析测序条件和跟踪ONT技术的发展。我们相信BoardION将帮助测序平台为不同类型的样本建立最佳的测序指南。

可用性和要求

项目名称:寄宿权。

项目主页:欧宝直播官网apphttps://github.com/institut-de-genomique/boardion.

操作系统:平台独立。

编程语言:C ++,R.

其他要求:R库闪亮1.4.0.2,绘图图4.9.2.1和GGPLOT2 3.3.1。

许可证:Cecill。

非学术界使用的任何限制:否。

可用性数据和材料

不适用。

缩写

ont:

牛津纳米波尔技术

脱氧核糖核酸:

Deoxyribo核酸

GB:

千兆字节

MB:

兆字节

SNV:

单核苷酸变异

参考

  1. 1。

    Tyler Ad等人。微生物全基因组测序应用的牛津纳米孔沟沟序列测序装置的评价。SCI批准。2018; 8:10931。

    文章谷歌学术

  2. 2。

    jain m等人。牛津纳米孔群:向基因组学区纳米孔测序的递送。基因组Biol。2016; 17:239。

    文章谷歌学术

  3. 3.

    jain m等人。用超长读取的人类基因组的纳米孔测序和组装。NAT BIOTECHNOL。2018; 36:338-45。

    中科院文章谷歌学术

  4. 4.

    kono n等人。纳米孔测序:审查功能基因组学中的潜在应用。开发增长不同。2019; 61:12608。

    文章谷歌学术

  5. 5。

    Rousseau-gueutin m,等。长读装瓶芸苔属植物显著参考基因组Darmor-BZH。傻瓜。2020; 9(12):137。

    文章谷歌学术

  6. 6。

    Sessegolo C等人。使用cDNA和RNA分子的纳米孔测序对小鼠样品的转录物分析。SCI REP。2019; 9:14908。

    文章谷歌学术

  7. 7。

    SIMPSON JT等人。使用纳米孔测序检测DNA胞嘧啶甲基化。NAT方法。2017; 14:407-10。

    中科院文章谷歌学术

  8. 8。

    Petersen Lm,等。临床实验室中的第三代测序:探讨纳米孔测序的优点和2个挑战。J Clar Microbiol。2019年。https://doi.org/10.1128/jcm.01315-19

    文章PubMed.pmed中央谷歌学术

  9. 9。

    Euskirchen P等人。使用实时纳米孔测序的同日子基因组和脑肿瘤的表观元素诊断。Acta神经疗法醇。2017; 134:691-703。

    中科院文章谷歌学术

  10. 10.

    Lanfear r等人。MinionQC:用于派对测序数据的快速和简单的质量控制。生物信息学。2019; 35(3):523-5。

    中科院文章谷歌学术

  11. 11.

    leger a等人。PYCOQC,牛津纳米孔测序的交互式质量控制。j开源软件。2019; 4(34):1236。

    文章谷歌学术

  12. 12.

    de coster w等人。Nanopack:可视化和处理长读取测序数据。生物信息学。2018; 34(15):2666-9。

    文章谷歌学术

  13. 13。

    Laffay B,等人。toulligqc:牛津纳米孔序列仪的柱塞QC工具。GitHub。https://github.com/genomicPariscentre/toulligqc.。访问10月10日10日。

  14. 14。

    minoTour: MinION测序平台的实时数据分析工具。Github;2015.https://github.com/minoTour/minoTour。10月1日10月1日。

  15. 15.

    chang w等人。闪亮:R. R包版本1.4.0的Web应用程序框架。2019年。https://cran.r-project.org/package=shiny.

  16. 16。

    Wickham H. ggplot2:用于数据分析的优雅图形。施普林格;2009.

    谷歌学术

  17. 17。

    Sievert C.绘制R. 2018。https://plotly-r.com.

  18. 18。

    牛津纳米孔技术。加油排序运行。2019年。https://community.nanoporetech.com/posts/refuelling-a- sequencing-ru.。访问了3月11日2020年。

下载参考

致谢

作者感谢牛津纳米多尔的工作人员进行技术帮助,并授予Genospors进入ProMethion早期访问计划(PEAP)。我们感谢法国Génomique基础设施(www.france-genomique.org.)支持它。我们还感谢FrédérickGavory,Paul Mielle和Thomas Mejean他们的洞察力和支持和Corinne Cruaud,用于在真实条件下测试该工具。

资金

这项工作得到了Genoscope、Commissariat à l'Energie Atomique et aux Energies Alternatives (CEA)和法国Génomique (ANR-10-INBS-09-08)的支持。

作者信息

从属关系

作者

贡献

AB设计并实施了该应用程序,并写了稿件。SE设计了应用程序,在数据集上测试它,写了稿件并监督该项目。JMA写了稿件并监督该项目。所有作者阅读并认可的终稿。

相应的作者

对应到Stefan Engelen

伦理宣言

伦理批准和同意参与

不适用。

同意出版物

不适用。

利益争夺

作者声明没有竞争利益。J.-M.A.收到在ONT会议上发言的旅行和住宿费用。

附加信息

出版商的注意事项

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

布鲁诺,A.,奥利,JM。Engelen, S. borardion: Oxford Nanopore测序仪器的实时监测。欧宝娱乐合法吗22,245(2021)。https://doi.org/10.1186/s12859-021-04161-0

下载引用

关键词

  • 纳米孔测序
  • 实时监控
  • Web应用程序