跳转到主要内容

Ped_draw:轻松绘制系谱

摘要

背景

谱系文件普遍存在于生物信息学和遗传学研究中,以传达有关相关性,性别和影响地位的关键信息。虽然基于文本的PED文件的格式是有效的计算方法,但它并不立即直观地直观地试图了解家庭结构的生物信息,其中许多人在多个代中编码受影响的个人状态。具有描述性形状和阴影的连接节点的键入的键入的可视化提供了更远的可解释格式,以识别视觉模式和Intuit家族结构。尽管Visual Fidee具有这些优点,但它仍然很难快速,准确地可视化媒体文本文件。

结果

我们在这里描述ped_draw命令行和Web工具作为谱系可视化的简单且简单的解决方案。ped_draw.能够绘制复杂的多世代章节,并符合可视化的标准,以便在视觉上描绘百分点。命令行工具可以用作简单的一个小程序命令,利用graphviz生成图像文件。Web工具,https://peddraw.github.io,允许用户粘贴一个谱系文件,在文本框中键入构建一个谱系文件,或者上传一个谱系文件。用户可以将生成的图像文件保存为各种格式。

结论

我们相信ped_draw是一种有用的谱系绘图工具,可提高电流方法,因为它的易用性和可平衡性。ped_draw.允许用户使用各种级别的专业知识快速轻松地可视化童群。

背景

谱系文件是传递遗传或生物信息学研究中关于样本的重要信息的文本文件[4.]。这至少包括每个样本:一个亲族/家庭标识符,一个样本标识符,一个父亲标识符,一个母亲标识符,一个性别标识符(1 =男性,2 =女性),和一个受影响的状态或表型标识符(1 =未受影响,2 =受影响)[3.]。该文本编码对于计算工具是有效的,但是人类用户难以在视觉上解析和理解家庭和继承关系。因此,生物信息管理员和遗传学家通常依赖于媒体的视觉描绘,其中每个个人是连接网络中的节点,其中:代表男性的正方形,表示女性的圆形,表示未被影响的样本的未脉冲节点和表示受影响的样本的阴影节点。同一家族中的个人在相同的垂直高度(即父亲和母亲)上绘制,而随后的一代(即父亲和母亲的孩子)的个人被绘制在下面并与他们各自的父母联系在一起。这种被接受的格式允许家庭结构的快速和直观可视化以及受影响的状态如何在家庭中进行隔离(即,德诺,主导,隐性,继承的X链接模式)。这种视觉格式在诸如犹他州中心D'Etude du多态性蜂窝(Ceph)数据集之类的大型多代百分点中特别有用,其包括34个不同大型多代家庭的603个个体[2]。

虽然少数套绘图工具以前发布,ped_draw解决目前工具中的许多缺陷,并提供了许多不同的优势。Pedigreejs.也许是目前最全面的特色和良好的Powered Pedigree绘图工具[1]。它是用JavaScript编写的,并使用D3库来输出谱系结构的可视化。它是一种能够集成到其他Web工具中的交互式和视觉工具,或用作App网站上的独立式。但是,用JavaScript D3编写为网络,pedigreejs对于许多不熟悉Javascript或特定的web编程可视化库(如d3)的用户来说,是无法接近的。Pedigreejs.在特定的部署和托管环境中需要Javascript包管理器npm(包括grunt-cli)。部署pedigreejs,需要广泛的Javascript知识,用户需要硬编码大量的定制和可视化决策。Kinship2为以R编程语言编写的包提供谱系可视化[5.]。类似于JavaScript,R有一个重要的学习曲线。作为Kinship2也仅仅是一个R包,它要求用户编写R代码(通常是在一个R集成开发环境中,如RStudio,需要单独安装),甚至在最简单的系谱图使用中。玛德琳2.0是另一个谱系绘图工具,并拥有跨多个操作系统的支持[6.]。然而,玛德琳2.0在所有安装方案中有许多依赖项,需要在Windows上进行Cygwin,CMake,Libssl-dev,libcurl-dev,libxml2-dev在Linux上。特别是在Linux上,这些依赖项需要在学术或共享计算资源上往往无法访问的sudo级别用户安装权限。

重要的是,所有这些发布的工具都具有显著的安装依赖关系,具有大量的编程学习曲线,并且缺乏简单的一个命令输入-输出方法。ped_draw.旨在占据这套可用软件中的特定利基。所有的ped_draw’s的依赖项默认安装在一个典型的Linux环境中,Docker映像提供了额外的可移植性。ped_draw.它的简化方法消除了定制的需要,允许用户从提供的ped文件中轻松快速地直接可视化系谱。

实现

ped_draw.仅用Python实现,需要Python 2.7.15或更高版本。的点输出转换ped_draw使用graphviz(未提供)实现图像。graphviz的图像输出可以在任何图形查看应用程序中可视化。

结果

输入ped_draw是一个ped文件,输出是一个图像文件(由graphviz生成)。ped_draw.生成一个点文件,可以直接作为标准输出传递给graphviz来生成图像文件。ped_draw.能够将复杂的ped文件包括多代(3或更多)父母对,多个受影响的个体,大量的孩子(每个父母对8或更多)和多个不同的家庭/亲属在同一输入ped文件到一个单一的图像输出。

ped_draw.可以作为简单的一行命令使用,如下所示。Ped是一个谱系文件的例子):

  • 生成点格式化文件(写入stdout):

    $python~ /箱子/ped_/ped__PY例子ped

  • 通过管道产生谱系的PNG图像ped_draw输出graphviz /点:

    $python~ /箱子/ped_/ped__PY例子ped|-T.PNG.-O.例子PNG.

我们展示了缓解和使用ped_draw在图1中的多个例子中。1。绘制了一个相对简单的两代谱系,具有单个父对和三个儿童(其中一个是受影响的)(图。1一种)。偶尔,PED文件可以包含多个不同的族/赖维,如文件的第一列所指定。这是解释的ped_draw绘制了两个不同的章节(图。1b).谱系文件也可以指定两个以上的代。图中绘制了一个三代家系,每一代有多个孩子,第2代有一个不相关的父亲(节点1006)。1C)。绘制跨越多个世代具有多个受影响儿童的扩展四代家庭(图。1d)。

图1
图1

输出的示例谱系图像ped_draw一种一个例子“Quintet”单一家族谱系。B.两个不同的丝绸/家庭的示例谱系。C一个有三代血统的例子。D.一个有四代血统的例子。用于生成这些图像的ped文件可以在GitHub的example /库中找到

在这些例子和其他的例子中,ped_draw在接受的“树”表示中绘制谱系,连接所有相关节点,基于性别分配节点,基于样本名称的标签节点和阴影所有受影响的节点灰色。这允许遗传学家和生物信息管理员随时可视化样本之间的相关性并通过多个代代识别继承模式。绘制的许多其他百分点的例子ped_draw(包括来自Ceph家族的章节)可以在示例/下面找到GitHub存储库。

结论

ped_draw.是一种简单的解决方案,对可视化队列的持续生物信息学和遗传挑战。ped_draw.是在简单的Python和GraphViz命令中绘制复杂的键盘的强大和功能的解决方案。Python和GraphViz都广泛使用,可访问,长期维护和便携式编程解决方案。我们期待ped_draw对两种经验丰富的生物信息管理员(使用命令行工具)和具有很少或没有计算专业知识的用户有用(使用Web工具)。

可用性和要求

  • 项目名称:PED_DRAW。

  • 项目主页:欧宝直播官网apphttps://github.com/mvelinder/ped_draw.http://peddraw.github.io

  • 操作系统:UNIX(命令行工具);独立于平台的(web工具)

  • 编程语言:Python,JavaScript,HTML

  • 其他要求:Python 2.7.15或更高(命令行工具),将PED_DRAW输出点文件转换为PNG或其他图像类型需要GraphViz,可以通过任何数量的图形查看应用完成图形输出的可视化;Chrome 80.0.3987.149或更高版本(Web工具)

  • 许可证:MIT许可证

  • 非学者使用的任何限制:麻省理工学院执照

数据和材料的可用性

https://github.com/mvelinder/ped_draw.http://peddraw.github.io

缩写

Ceph:

人类多形态练习曲中心

参考

  1. 1。

    Carver T,Cunningham AP,Babb C,De Villiers A,Lee Sh,Tischkowitz M,Walter FM,Easton DF,Antoniou AC。edigreejs:基于Web的图形谱系编辑器。生物信息学。2018; 34(6):1069-71。

    CAS文章谷歌学者

  2. 2。

    人类多态研究中心(Centre D 'etude Du Polymorphisme Humain, CEPH):人类基因组的协同遗传作图。基因组学,1990;6(3):575 - 7。

    CAS文章谷歌学者

  3. 3.

    Geraldine_vdauwera。“谱系/ PED文件。”Gatk-Forum。2016年。https://gatkforums.broadinstitute.org/gatk/discussion/7696/ppedigree-ped-files.。于2020年2月12日通过。

  4. 4.

    McKenna A,Hanna M,Banks E,Sivachenko A,Cibulskis K,Kernytsky A,Garimella K,等。基因组分析工具包:MapReduce框架,用于分析下一代DNA测序数据。Genome Res。2010; 20(9):1297-303。

    CAS文章谷歌学者

  5. 5。

    Sinnwell JP, Therneau TM, Schaid DJ。系谱资料的亲缘关系2r包。哼她。2014;78(2):91 - 3。

    文章谷歌学者

  6. 6.

    Trager eh,khanna r,marrs a,siden l,branham keh,施施施德拉斯,理查兹je。Madeline 2.0 PDE:一个新的本地和基于Web的谱系绘图程序。生物信息学。2007; 23(14):1854-6。

    CAS文章谷歌学者

下载参考

致谢

布伦特Pedersen。

资金

R01HG009000从NHGRI到G.T.M.,R01HG009712来自NHGRI到G.T.M.-资助机构在研究和收集,分析和数据的设计方面没有作用,并在撰写稿件中

作者信息

隶属关系

作者

贡献

MV构思了项目并实现了软件的初始版本。DL精制并重写了原始软件的重要部分。通用汽车提供反馈和资金支持。所有作者均阅读并批准最终手稿。

通讯作者

对应于马特Velinder

伦理宣言

伦理批准和同意参与

不适用

同意出版物

不适用

利益争夺

作者们宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

权利和权限

开放访问本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

再版和权限

关于这篇文章

通过十字标记验证货币和真实性

引用这篇文章

Velinder, M., Lee, D. & Marth, G. ped_draw:轻松绘制系谱。欧宝娱乐合法吗21,569(2020)。https://doi.org/10.1186/s12859-020-03917-4

下载引用

关键字

  • 血统
  • 遗传学
  • 孟德尔
  • 家庭
  • 家庭研究
  • 一代
  • 遗产
  • Ped
  • 可视化
\