跳到主要内容

Bugseq:一种高度准确的云平台,用于长读的Metagenomic分析

抽象的

背景

由于使用纳米孔测序进行偏见分析,因此需要以快速和准确的方式执行能够执行长读分类分类分类的工具(即确定样品的组成)。现有工具是为短读数据(例如离心机)而设计的,需要数天才能分析现代定序器输出(例如元素)或遭受次优精度(例如CDKAM)。此外,所有工具都需要命令行专业知识,并不在云中缩放。

结果

我们呈现Bugseq,一种用于纳米孔读数的新型高度精确的偏心组件。我们在模拟数据,模拟微生物群落和真正的临床样本上评估Bugseq。在ZyMoomics偶数和日志社区中,Bugseq(F1 = 0.95在物种级别)在一小部分中提供比Metamaps(F1 = 0.89-0.94)更好的读分类。BUGSEQ显着提高了离心机的准确性(F1 = 0.79-0.93)和CDKAM(F1 = 0.91-0.94),同时提供竞争运行时间。当患有患者患者患者患者的41个样本时,BUGSEQ与微生物培养和QPCR产生更大的一致性,而QPCR与“我的锅中有什么”分析相比。

结论

Bugseq部署到云中,以便于易于缩放的长读元素分析。Bugseq自由地提供非商业用途https://bugseq.com/free

背景

纳米孔测序在过去几年中,读取质量和吞吐量的急剧增加,导致采用和新应用增加。最近,纳米孔测序已用于临床,环境和农业环境中的偏见组学[123.obb体育 ]。许多宏基因组阅读分类器,最初设计用于短(< 300 bp),高质量的阅读依赖于k-mers序列分类[obb体育 ]。由于纳米孔测序的高差错率和许多连续无误底座的低可能性,K-MEL方法不太可能对纳米孔读分类的最佳方法[obb体育 ]。此外,受欢迎的K-MER方法,如克兰克伦2在序列中丢弃有关K-MERS的顺序的信息,这是对分类长读取的有用数据[obb体育 ]。

替代性的方法已经被探索:EPI2ME,一个由Metrichor操作的平台,使用离心机作为其分类器[obb体育 ]。离心机可以以短k-mer匹配开始并延伸它们,直到第一核苷酸对齐的差异,实现可变长度匹配。默认情况下,离心机以22个BP种子启动此扩展,但该参数可以设置为16bp以增加灵敏度。元素依赖于与最小化器和概率模型的近似读对齐,以估算样品组合物[obb体育 ]。最后,最近发布的工具,CDKAM使用不精确的K-MER匹配来识别参考数据库中的匹配[obb体育 ]。

这些工具之前已经在基准中进行了评估,而他们可以提供分类分类分类,他们每个人都遭受限制[obb体育 ]。离心机和CDKAM无法提供准确的物种级别分类,并报告大量误报读分类[obb体育 obb体育 ]。MetaMaps可以提供更准确的分类,但遭受长处理时间(在最近的基准测试中只有10小时超过74,000读数)[obb体育 ]。所有这些工具都需要大型服务器,比高端消费级计算机更多的RAM [obb体育 ]。这些局限性是偏读技术广泛采用的偏移用于偏见技术的障碍。例如,甚至在食品,军事或临床样本中鉴定属于病原体的读数可能是显着的,并且这些结果必须迅速地提供动作。我们的目标是通过基于云的,快速,高度精确的偏心组件,用于长期读取的这些限制。

方法

执行

我们将快速准确的读取映射器、基于映射质量的贝叶斯重新分配读取器、新的最低共同祖先过程和先进的可视化工具结合起来,为纳米孔读取建立一个更好的宏基因组分类器。这个管道,我们称之为BugSeq,已经被打包到Nextflow (v20.07.1)中,并作为在线服务(https://bugseq.com/free),便于云分析。图中给出了管道的概述。obb体育 。简而言之,使用FASTP(V0.20.1)进行读取的质量,使用PHRED 7的最小平均读取质量,最小读取长度为100bp,默认低复杂度过滤器[obb体育 ]。然后将读数用MINIMAP2(v2.17)映射到含有REFSEQ,人类基因组和污染物数据库中的所有微生物的指数[obb体育 ]。具体地,该数据库包含所有完整的细菌基因组;除了完整状态,在Refseq中发现的所有真菌,病毒,原生动物和古代基因组。另外,包括人类基因组和污染物(UNIVEC)数据库。评估数据库于2020年2月23日生成,但自每月更新以来。与替代参考数据库一起使用,请与相应的作者联系。Minimap2以“Map-ont”模式执行,使用“-a”标志将读入SA​​M格式。为Minimap2评估了一系列参数,包括改变次要校准的数量。该参数的大多数变化,从5到25,最终结果产生的变化很小;根据精度和速度之间的良好权衡选择,用于所有后续分析(可提供的数据https://gitlab.com/bugseq/metagenomicclassifiersbenchmarking/-/tree/master/program_outputs/bugseq/param_search.)。接下来,基于使用Cathoscope(版本2.0.7)和默认参数的贝叶斯统计框架重新分配对参考序列的对齐[obb体育 ]。最后,计算重新分配读的最低公共祖先并输入到recentr离心机(v1.1.1)中,将最小需要的分类群设置为1,以及用于摘要和可视化的通用输入模式[obb体育 ]。质量控制结果总结了多议,使用自定义配置将报告标题和验证阈值更改为7 [obb体育 ]。所有依赖项都包装在Docker映像中,并且在安全的私有环境中,在Amazon Web服务批处理上执行作业。

图。1
图1

Bugseq工作流程概述

评估

我们使用模拟数据、来自模拟微生物群落和真实患者样本的测序数据评估BugSeq和其他长读宏基因组分类器。我们使用CAMISIM包及其包含的mini_config.ini配置生成模拟数据[obb体育 ]。该模拟器使用包含的24个基因组产生微生物社区,使用默认值以逻辑分布采样丰度(μ.= 1,σ. = 2). The read simulator was switched to NanoSim to generate nanopore sequencing reads, and one sample with 100 Mb of data was generated [obb体育 ]。这大肠杆菌包含在NanoSim中的模拟剖面用于读取模拟。所得到的模拟数据,以及地面真相分类,可在:https://doi.org/10.5281/zenodo.4382659

我们使用以下命令运行在评估中包含的映射分类器:

CDKAM版本1.1:'./cdkam.sh db input_file output_file --- fastq nthread 32'。

MetaMaps commit 98102e9e684efa6a9903d8abe93600132c101ad0: ' MetaMaps mapdirect -t 32——all -r databases/miniSeq+H/DB。fa -q INPUT_FILE -o TEMP_FILE——maxmemory 196 && metamaps classify -t 32——mappings TEMP_FILE——DB数据库/miniSeq+H’。按照MetaMaps作者的建议,最大内存被设置为真正最大内存的70%。

离心版1.0.4-beta:'离心机-T-k 1 -p 32-x db -u input_file -report-file output_report -s输出'。我们指定'-k 1'旗帜以折叠到最低的公共祖先。除非另有规定,否则默认数据库和参数用于所有工具。对于默认数据库,我们使用以下内容:

离心机:“H + P + V + C”数据库(https://doi.org/10.5281/zenodo.3732127

MetaMaps:原作者的miniSeq+H数据库(https://doi.org/10.17605/osf.io/xy4vn.)。

CDKAM:2020年12月15日生成的标准数据库。

使用32个线程和280 GB的RAM(我们的服务器容量)进行评估所有工具。所有分类器输出都可用https://gitlab.com/bugseq/metagenomicclassifiersbenchmarking.

我们使用精度并调用来评估每个工具的分类准确性。精度(阳性预测值)由正确称为读数的数量定义,除以指定等级的分类读数总数。召回被定义为正确称为读数的数量除以任何等级的读取(未分类和分类)的总数。F1分数计算为2×(精密×召回)/(精密+召回)。召回,ZyMoomics模拟群落评估的精确度和F1分数通过将分配给预期节点的读数视为正确的节点以及上述任何等级来计算,否则读被认为是不正确的。补充Gitlab repo(https://gitlab.com/bugseq/metagenomicclassifiersbenchmarking.)。使用Linux Time Utility计算处理时间和内存,具有“详细”选项。通过输入大小进行BugseQ运行时间的分析,使用AWS批处理工作者预热,以确保所有输入大小的可比时间。使用命令“seqkit sample -j 32-n-n nreads -o nreads_reads.fastq-s11 err3152364.fastq.gz”,读取由seqkit随机采样。使用命令“seqkit sample-j 32-n nreads -o nrads_reads.fastq -s 11.fastq.gz”[obb体育 ]。

为了评估丰富的估计,我们计算作为平均平均残差的平方根的根均平方误差(RMSE)。RMSE越低,预测越近代表实际数据。附加文件中提供了确切的计算obb体育 :Gitlab存储库。确定每个预期的生物体的丰度被计算为分配给该物种的读数的比例除以分配给样本中任何物种的读数总数。

我们将这些比例与ZyMoomics“基因组拷贝”进行比较,这调整了基因组长度的预期丰富[obb体育 ]。

为了评价分类器对下呼吸道感染的性能,我们下载了来自SRA登录PRJEB30781的数据[obb体育 ]。我们仅通过考虑呼吸道病原体(在其方法部分定义)中确保对数据的原始作者的可比性[obb体育 ]。以下病原体被认为是显着的并且包括在分析中:“E. AEROGALES.E. Cloacae.复杂的,大肠杆菌H.流感K.催津K.肺炎M. Catarrhalis.P. Mirabilis.P.铜绿假单胞菌S. Marcescens.S.金黄色葡萄球菌S.肺炎S. pyogenes“。计算敏感性作为检测到的呼吸道病原体的数量除以检测到的预期数量,概括所有样品。计算特异性,因为在每个样品(最大13)中不存在的呼吸病原体数量(最大13),除以所有样品的预期数量除以所有样本。Charalampous等人。特异性计算方法计算称为正常呼吸群(NRF)或没有生长(NG)的试样数,除以基于NRF / NG样本(n = 6)。

结果

我们评估了Bugseq的表现,并将其与三个竞争工具进行比较:离心机,MetaPaps和CDKAM [7.8.obb体育 ]。我们首先通过已知的地面真实分类评估Bugseq对模拟数据的性能。我们使用最近释放的Camisim工具产生了它的现实界和纳米孔组织测序[obb体育 ]。我们使用方法部分中指定的默认数据库评估每个宏基因组分类器。当检查物种级别的f1分数时,BugSeq在这个模拟数据上的性能优于所有工具。BugSeq得到的种级F1为0.964,准确率为100%,召回率为93.1%。相比之下,离心分离机的物种级F1为0.962(精密度:99.0%,召回率:93.5%),MetaMaps为0.952(精密度:99.8%,召回率:91.1%),CDKAM为0.938(精密度:96.8%,召回率:91.0%)。

我们下次使用具有已知组合物的两个微生物群落的真实纳米孔测序数据评估Bugseq和替代工具。ZyMoomics Mock社区含有8个细菌和2个酵母,甚至(以下简称为“偶数”)和对数(以下称为“log”)浓度[obb体育 ]。使用R9.4.1化学的网格上独立地生成两个样品的测序数据,并公开可用(https://github.com/lomanlab/mockcommunity#data-availability.)。有关数据生成和特征的完整细节可从原始出版物中获取[obb体育 ]。所有对ZymoBIOMICS数据集的评估都使用了RefSeq的参考数据库,因为之前的研究已经证明了参考数据库的选择对分类性能的影响(见“obb体育 "查阅资料库详情)[obb体育 ]。

在物种级别,BugseQ与偶数和日志数据集的Metamaps,CDKAM和离心机相比,获得了顶级精度和召回(F1分数甚至:0.95,F1分数日志:0.95)(表obb体育 )。平均而言,Bugseq比Metapaps更好地召回了6%,同时保持卓越的精度,比离心机更好的精度为2-5%,同时保持高级召回。此外,BugseQ平均比CDKAM更好2%。当分析每个工具(真数= 10)标识的唯一物种的数量时,BugSeq分别在Zymo偶数和日志数据集中发现了总共117和52种。相比之下,使用“MiniSeQ + H”数据库识别2144(log)和1386(甚至)唯一物种,并超出了Refseq数据库的RAM阈值(表obb体育 )。离心机识别5380和5513,以及CDKAM分别在偶数和日志数据集中识别3721和2956种。每个分类学级别的全部结果可以在附加文件中找到obb体育 :表S1。

表1在网格ZyMobioMics模拟日志甚至社区中,四个偏见分类器(Bugseq,Metamaps,离心机和CDKam)的性能表现

我们接下来评估每个工具估计分类程度的能力。我们从上面使用Zymo Log DataSet,因为它含有广泛范围的生物(10-2到10.8.丰富的细胞。对于样品中的每种生物,我们将分类学分类器计算的丰度与该生物体的预期丰富进行比较。每个物种和分类器组合的绝对百分比误差计算为预期和识别的丰度之间的差异,如图4所示。obb体育 。我们使用根均方误差来量化每个工具的整体性能。同样,Bugseq比替代工具更好,RMSE为0.0076,然后是MetaMaps(0.0082),离心机(0.011)和CDKAM(0.012)。值得注意的是,离心机在这里展示了长读数据的弱点;凭借其内置丰富的计算,它将样本中的所有分类卡分配为丰富的0,除外hungateiclostridium saccincola,总共分配了20个读数(总量的0.0006%),并获得了1的丰富。

图2
图2.

在Zymo日志数据集上评估时,每个生物体和工具的丰度估计的绝对百分比

我们下次测量所有工具的计算性能。Bugseq是比MetaMaps快的数量级,它使用32个核和其“MiniSeQ + H”数据库超过5天。Bugseq最多需要4小时,25分钟分析相同数量的数据。值得注意的是,Metamap的MiniSeQ + H(26 GB)明显小于Refseq(86 GB)。Bugseq比离心机更长的时间较长,这花了14至19分钟,并且CDKAM花了8至9分钟,适用于所有分析。所有工具都需要超过32 GB的RAM执行,禁止在现代笔记本电脑上使用。在附加文件中提供了通过输入大小进行Bugseq的运行时间的分析obb体育 :表S3。

为了评估真正的临床样本上的Bugseq,我们将其应用于来自细菌降低呼吸道感染的患者的41个低呼吸道样品的纳米孔组织测序。先前已经报道了样本特征和数据生成[obb体育 ]。我们使用原作者的1%丰富阈值来报告致病微生物,确保跨越方法的可比性。我们还使用相同的临床显着病原体列表,定义在其方法部分的定义分段中,当报告结果确保直接可比性时。在附加文件中可视化质量控制和偏见分类结果obb体育 obb体育 。与微生物培养和QPCR的复合相比,所有靶病病原体的Bugseq的整体敏感性和特异性分别为100%和99.6%。WIMP的敏感性为100%,特异性为98.7%。使用Charalampous等人的特异性计算。(描述obb体育 ),两种工具的特异性均为83.3%,与原稿一致。BugSeq在3/41(7.3%)个样本(附加文件obb体育 :表S2)。具体地,每个样品S8,S15和S21都有S.肺炎通过WIMP分析检测,但不通过BugSeq或微生物培养这些样品上的病原体特异性QPCR未能检测S.肺炎,确认这些发现[obb体育 ]。此外,Bugseq在1/41样品(样本S12)中,QPCR达到了更好的QPCR,但不是微生物培养,其中WIMP检测到假阳性H.流感未通过Bugseq或QPCR检测到。所有其他样品在Bugseq和Wimp之间都是一致的。我们注意到,Bugseq和WIMP的几个样本(例如S5和S28)由Bugseq和WIMP不正确:这些样品要么检测到密切相关的生物(例如。克雷伯氏菌oxytoca/Klebsiella肺炎在S5)或由偏见测序检测的假阳性(例如。S.肺炎在S28)。

讨论

在这里,我们呈现Bugseq,一种用于纳米Ob的准确和快速的Metagenomic分类器。在模拟数据和模拟微生物社区上,发现BugseQ以精确和召回方面越优越元,CDKAM和离心机,有时由大型利润率(高达21%)。在大型15 GB数据集上,Bugseq的数量也比Metapaps更快,同时患有4小时的折衷与离心机和CDKAM。Bugseq实现了更好的分类性能,依赖于潜在的表现工具。预处理依赖于FastP,通过依赖于引擎盖下的C ++来优化速度[obb体育 ]。执行BugseQ对齐步骤的Minimap2比大多数长读对方器更快的30倍超过30倍,并在其出版物时展示了最高的对准精度[obb体育 ]。Pathoscope的使用进一步提高了Minimap2的读取对准,通过使用从其他读取的信息重新分配到最可能的来源来重新分配读取[obb体育 ]。最后,通过拍摄读取作业的最低常见祖先,我们克服了前一步的分类不确定性,以产生与所有可用数据相配的分类学分类。

我们研究的结果与现有的长读成次数分类机的文献相应[obb体育 obb体育 obb体育 ]。我们发现离心机在ZymoBIOMICS数据集上的敏感性较低,这可能是由于离心机为单个读返回多个赋值,并通过最低的共同祖先将这些归为分类树[obb体育 ]。类似地,最初的MetaMaps论文指出,对三分之一的zimo数据集的随机样本,RAM使用了262 GB和209 CPU小时[obb体育 ]。在我们的经验中,MetaMaps映射相对快速地读取,按照基于Minhash的对齐器上的已发布数据,但在其“分类”步骤上停止了[obb体育 ]。

除了卓越的性能之外,Bugseq的创新的一部分除了从Raw读取到报告的自动读取分析的云的部署。Bugseq比例使用用户的数据,并使任何微生物学实验室能够进行长读的Metagenomic分类。Bugseq的用户界面只需要将FastQ文件的简单上传到其网站,并返回到用户直观的HTML文件,以便在其浏览器中可视化。我们通过从41个降低呼吸道样本上传代理数据来展示Bugseq的易用性。结果数据(包括质量控制和Metagenomic分类)包装成两个HTML文件(附加文件obb体育 obb体育 ),在相同的数据上,与原WIMP分析相比,具有更高的精度。然而,我们注意到,鉴于培养和qPCR的偏颇性质,该分析存在局限性,只能揭示感兴趣的病原体。

Bugseq的主要限制是其执行时间和处理要求,其大于离心机和CDKAM。更大处理要求的主要原因是BugseQ对所有Refseq执行完全读取对齐,而离心机和CDKam执行针对压缩数据库的子字符串或K-MER匹配。通过在云中进一步缩放Bugseq可以部分地克服这些限制。例如,该评估限于所有计算的32个线程;但是,Amazon EC2现在包含最多448 CPU的实例。在我们的经验中,Minimap2刻度良好,直到至少64个线程;将来的工作将检查较大的EC2实例的缩放计算,以便更快地分析。

结论

BugSeq是一个快速、可扩展和准确的元基因组分类器,在一系列性能指标上优于MetaMaps和离心机等替代品。BugSeq被部署到云上进行简单的宏基因组分析。

可用性和要求

可用性数据和材料

Bugseq分析可供选择https://bugseq.com/free。文档可用https://docs.bugseq.com.。Camisim模拟数据可用https://doi.org/10.5281/zenodo.4382659。ZymoBIOMICS模拟社区测序数据集可在SRA存储库中获得,登录地址为ERR3152364和ERR3152366。细菌下呼吸道测序数据集可在SRA储存库PRJEB30781获得。

缩写

HTML:

超文本标记语言

QPCR:

定量聚合酶链反应

WIMP:

我的锅里有什么

参考

  1. 1。

    Petersen LM,Martin IW,Moschetti我们,Kershaw Cm,Tsongalis GJ。临床实验室第三代测序:探讨纳米孔测序的优缺点。J Clar Microbiol。2019年。

  2. 2。

    爱德华兹A,Debbonaire AR,Nicholls Sm,Rassner Sme,Sattler B,Cook JM等。现场聚糖组和16S rRNA基因扩增子纳米孔测序鲁棒性地表征冰川微生物。生物XIV。2019; 073965。

  3. 3.

    Stewart Rd,Auffret Md,Wran A,Walker Aw,Roehe R,Watson M. 4,941张瘤胃组合的瘤胃微生物组和酶发现的组装Genomes。NAT BIOTECHNOL。2019; 37:953-61。

    CAS文章谷歌学术

  4. 4.

    Taxt Am,Avershina E,Frye Sa,Naseer U,Ahmad R.通过纳米孔测序快速鉴定血液培养的病原体,抗生素抗性基因和质粒。SCI代表2020; 10:7622。

    CAS文章谷歌学术

  5. 5。

    Breitwieser FP,Lu J,Salzberg SL。审查分类和组装的方法和数据库。简短生物形式。https://doi.org/10.1093/bib/bbx120

  6. 6。

    关键词:Kraken 2,宏基因组分析,生物信息学基因组医学杂志。2019;20:257。

    CAS文章谷歌学术

  7. 7。

    Kim D,Song L,Breitwieser FP,Salzberg SL。离心机:Metagenomic序列的快速和敏感分类。Genome Res。2016; 26:1721-9。

    CAS文章谷歌学术

  8. 8。

    Dilthey At,Jain C,Koren S,Phillippy Am。用元素的长度读取应变级均衡分配和组成估计。NAT Communce。2019; 10:1-12。

    CAS文章谷歌学术

  9. 9。

    Bui V-K,Wei C. CDKAM:使用鉴别k-mers和近似匹配策略的分类学分类工具。BMC生物素。2020; 21:468。

    文章谷歌学术

  10. 10.

    MarićJ,Križanovićk,Riondets,Nagarajan N,Šikićm.长读测序数据的基准测试组分类工具。生物XIV。2020; 2020.11.25.397729。

  11. 11.

    陈氏,周Y,陈Y,Gu J. Fastp:超快速的一体化FastQ预处理器。生物信息学。2018; 34:I884-890。

    文章谷歌学术

  12. 12.

    Li H. Minimap2:核苷酸序列的成对比对。生物信息学。2018; 34:3094-100。

    CAS文章谷歌学术

  13. 13。

    Francis Oe,Bendall M,Manimaran S,Hong C,Clement NL,Castro-Nallar E等。Cathoscope:使用未组装的测序数据物种识别和应变归因。Genome Res。2013; 23:1721-9。

    CAS文章谷歌学术

  14. 14。

    MartíJM。综艺杂志:对比较分析和污染去除术治疗。PLOS计算BIOL。2019; 15:E1006967。

    文章谷歌学术

  15. 15.

    Ewels P,Magnusson M,Lundin S,KällerM.MultiQC:在单个报告中总结多个工具和样本的分析结果。生物信息学。2016; 32:3047-8。

    CAS文章谷歌学术

  16. 16。

    Fritz A,Hofmann P,Majda S,Dahms E,DrögeJ,Fiedler J,等。Camisim:模拟梅毒和微生物社区。微生物组。2019; 7:17。

    文章谷歌学术

  17. 17。

    杨C,楚茹,沃伦RL,BIROL I. nanosim:纳米孔序列读取模拟器基于统计表征。GigaScience。2017; 6。https://doi.org/10.1093/gigascience/gix010

  18. 18。

    Shen W,Le S,Li Y,Hu F. Seqkit:Fasta / Q文件操作的跨平台和超快工具包。Plos一个。2016; 11:E0163962。

    文章谷歌学术

  19. 19。

    Zymo Research Corp. ZyMoomics微生物群落标准II(日志分布)。https://files.zymoresearch.com/protocols/_d6310_zymiomics_microbial_community_standard_ii_ (log_distribution).pdf.pdf.

  20. 20.

    Charalampous T,Kay GL,Richardson H,Aydin A,Baldan R,Jeanes C,等。纳米孔偏心组虫能够快速临床诊断细菌降低呼吸道感染。NAT BIOTECHNOL。2019; 37:783-92。

    CAS文章谷歌学术

  21. 21.

    李国强,李国强,李国强。模拟微生物群落标准的超深、长读纳米孔测序。GigaScience。2019年,8。https://doi.org/10.1093/gigascience/giz043

  22. 22.

    Ye Sh,Siddle Kj,Park DJ,Sabeti PC。基准分类分类的偏心神经工具。细胞。2019; 178:779-94。

    CAS文章谷歌学术

  23. 23。

    李克,刘湾,王玉夫:稀有近似匹配的术语快速准确地分类。生物XIV。2019; 736777。

  24. 24。

    jain c,Dilthey A,Koren S,Aluru S,Phillippy Am。一种快速近似算法,用于将长度读取到大参考数据库。j计算biol。2018; 25:766-79。

    CAS文章谷歌学术

下载参考

致谢

不适用。

资金

这项工作得到了公开慈善项目的支持。资金机构没有参与并在研究设计中没有作用;数据收集,分析或解释;或写作稿件。

作者信息

从属关系

作者

贡献

SD设计了软件。SD和JF评估软件并起草了稿件。SH构建了Web界面和后端基础架构以支持分析。所有作者阅读并认可的终稿。

相应的作者

对应于塞缪尔D. Chorlton.

伦理宣言

伦理批准和同意参与

通过Charalampous等人获得较低呼吸道细菌感染样品的伦理批准。在他们的原始出版物中。我们将读者推荐给他们的纸张了解详情。

同意出版物

不适用。

利益争夺

Bugseq Bioinformatics Inc.SD聘请JF和SH持有Bugseq Bioinformatics Inc.的股权。

附加信息

出版商的注意事项

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

补充信息

额外的文件1。

补充方法和补充表1-2。

附加文件2

。以对数生物丰度的ZymoBIOMICS模拟微生物群落的BugSeq宏基因组分类的克朗图。

附加文件3.

。Krona从Bugseq Matagenomic分类中的ZyMoomics Mock Microbial群落分类,甚至是生物丰富。

附加文件4.

。从Charalampous等人的纳米opore enagenomic测序数据上的Bugseq产生的聚合质量控制报告。分析中包括四十一呼吸道样品。

附加文件5.

。Krona Zrona Plots for Bugseq Metagenomic分类来自Charalampous等人的纳米孔组织测序数据。分析中包括四十一呼吸道样品。

附加文件6.

。Bugseq的图形用户界面的屏幕截图。用户可以通过单击“选择文件”或将文件拖入框中,然后单击“提交”按钮,用户可以在此屏幕上提交数据。

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

粉丝,J.,Huang,S.&Chorlton,S.D。Bugseq:用于长读元素分析的高度准确的云平台。欧宝娱乐合法吗22日,160(2021)。https://doi.org/10.1186/s12859-021-04089-5

下载引用

关键词

  • 宏基因组
  • 纳米奥运会
  • 微生物学
  • 测序
  • 第三代
  • 朗读
\