跳到主要内容

LinkedImm:用于集成免疫数据的链接数据图数据库

抽象的

背景

许多系统生物学研究利用多个数据类型的集成(跨不同数据源)来提供正在研究的生物系统的更全面的视图。当SQL(结构化查询语言)数据库在生物医学领域流行时,NoSQL数据库技术已经被用作一种更基于关系、灵活和可扩展的数据集成方法。

结果

我们创建了一个图形数据库从多个源集成数据。除了使用进行数据检索基于图的查询语言(Cypher支架),我们开发了一个基于Web的仪表板,使用户可以方便地浏览和打印数据,而无需学习Cypher支架。我们还实施了可视化图形查询界面,供用户浏览图形数据。最后,我们已经建立了一个原型,允许用户查询自然语言的图形数据库。

结论

我们已经证明了使用图形数据库存储和查询具有复杂生物学关系的免疫数据的可行性和灵活性。通过这种关系查询图形数据库有可能发现异构生物数据和元数据之间的新关系。

背景

SQL或结构化查询语言(StructuredQueryLanguage,relational)数据库技术已广泛用于管理和查询包括生物医学领域在内的不同领域的数据。然而,代表“不仅仅是SQL”的NoSQL数据库最近作为一种替代数据库技术出现,以解决大数据问题,解决涉及大数据量、速度、多样性和准确性的挑战[1.].在NoSQL技术中,Neo4J图数据库越来越多地被用作基于关系的(或基于知识的),高效,灵活和可扩展的方法,用于查询和集成基于数据模型的数据模型。在查询生物数据中的速度性能方面,NEO4J已被与SQL数据库进行比较[2.].生物数据具有高度相关、半结构化和不可预测的特点,这些特点使得图数据模型比关系(SQL)数据模型更适合。此外,图遍历类型查询也适合于假设生成,因为它们可以揭示连接实体的关系,而这些关系可能是手工检查网络时没有预料到的。

使用图表示,生物网络数据可以自然地建模和有效地操作。Neo4J已被用于在分子和细胞级别表示和查询网络数据。例如,Reactome [3.被转换为Neo4J数据库[4.],其提供生物途径的图形表示。Recon2Neo4j [5.]是否是体现人类代谢网络的另一个NEO4J数据库。它还允许在NEO4J Graph格式和SBML / SIF格式之间转换(可扩展标记语言或XML格式基于图形表示)。cyneo4​​j [6.]延伸Cystoscape [7.通过使用Neo4J作为更有效的网络可视化和分析引擎来构建网络数据可视化工具。

而特定类型的网络数据可以帮助揭示生物系统的某些方面[8.],它们可以集成,以产生正在研究的生物系统的更全面的画面。如[8.],层次和非层次关系存在于基因组、蛋白质组和代谢组网络层的成分之间。Neo4J已被用于实现一种基于图的方法,用于为各种系统生物学用例关联和集成各种类型的数据。例如,Neo4J被用于整合基因疾病和蛋白质药物网络,以促进基于关系的查询,以确定哮喘治疗的药物靶点[9]. 阿尼玛[10]展示了如何使用的Neo4j创建来自多个数据类型,包括表达数据,临床数据和生物途径多尺度关联网络。在 [8., Neo4J被用作数据仓库来集成来自不同来源的各种类型的基因组学数据的大量集合。

几个项目已经表明Neo4j的是用于存储和查询大量生物网络数据(一种有效的图形数据库例如,[2.,11,12])。在 [11],Neo4j的用于存储超过700,000的单核苷酸多态性(SNP)。此Neo4j的系统需要不到一分钟的时间在212 GB的数据集执行一个任意次数的查询,而最知名的算法需要大约7分钟。在另一个例子中[12],将大型本体转换为Neo4J图,与关系数据库相比,可节省13%的存储空间,并将检索效率提高30倍。

生物域中存在越来越多的有价值的Neo4j数据库,但这些数据库是不连接的筒仓图,以便于综合查询。为了解决这个问题,我们建立了LinkedImm以将多种类型的数据集成为系统疫苗学用例。LinkedImm包括一个neo4j数据库,它将异构地格式化的数据集与其他neo4j数据库一起转换为公共图表模型,以提供数据的集成视图。

结果

LinkedImm图标目前有37,992个节点和72,229个关系。这种尺寸的图形(网络)从使用Neo4j作为图表数据库引擎的效率,以获得图表数据查询和操作的效率。Neo4j还配备了基于Web的界面,供用户编写Compher查询对图数据库。查询输出可以显示为图形或以其他格式(例如,表格格式)。数字1.显示一个Cypher查询,以返回登录为“SDY404”的特定研究的受试者,并以图的形式输出。Cypher查询语言的表达能力足以让用户提出更复杂的查询,如:“找到年龄大于65岁的受试者,H3N2病毒株28天的HAI效价值大于0天”(图1)。2.).该查询不仅需要连接和过滤多种类型的信息(例如,人口统计信息和不同时间点测量的HAI滴度值),而且还需要根据病毒毒株的分类层次进行推断。在这种情况下,H3N2是不同病毒株的一个更广泛的亚型,如a/ Victoria/3/1975和a/ Perth/16/2009。该系统超越了单纯的毒株名称匹配,自动检索H3N2亚型下的所有毒株。

图。1
图1

一个Cypher查询(顶部一行)用于识别指定研究(SDY404,橙色圈)中的所有受试者(红色圈)

图2
figure2

使用更具表现力的Cypher查询,利用基于层次关系的推理识别H3N2亚型病毒株

尽管Cypher支架查询语言表现力,它需要一个学习曲线可以是高的普通用户,比如实验免疫学家,谁可能不熟悉任何数据库查询语言。要消除这种障碍,我们开发了一个基于Web的仪表盘,供用户以更直观的方式与LinkedImm互动。此仪表板的设计是提供基本的对象级的信息,包括年龄分布(图3.)和抗体滴度(图4.)。用户可以执行数据过滤以识别特定的研究和/或人类受试者。抗体滴度界面显示了将免疫谱测量与外部病毒株的先验知识相联系的能力。流感疫苗中包含的病毒毒株每年都在变化,但这些毒株可以根据它们的类型(如甲型或乙型流感)和亚型(如H1N1或H3N2)相互关联。通过LinkedImm,用户不仅可以查询单个病毒株的数据,还可以查询不同类型和亚型病毒株的数据,包括H1N1病毒株(见图)。4.).

图3.
图3

不同流感疫苗接种研究受试者年龄分布图

图4.
装具

对于不同的H1N1病毒株的抗体效价的值的分布的箱线图(A /布里斯班/ 59/2007,A /加利福尼亚/ 7/2009,A /所罗门群岛/ 3/2006)

我们的原型web界面允许用户姿势即席数据库查询或者通过形式或通过语音/输入自然语言。数字3.演示如何使用基于表单的查询可视化研究集合中主题年龄的分布。“数据视图”页签以表格形式显示数据,可通过点击下载链接下载CSV文件。数字5.显示一个自然语言查询,结果是年龄大于65岁的女性受试者的年龄分布图。

图5.
figure5

一种自然语言查询示例,说明65岁以上的情节女性受试者

由于LinkedImm是一个图数据库,因此很自然地可以根据底层图结构查看和查询。为此,我们使用popoto.js实现了一个图形查询可视化界面[13],它是一种基于JavaScript的动态可视化和图形数据查询的方法。数字6.shows an example of a graph query including a path for a given study (SDY396), a subject’s HAI measurement value of the virus strain “A/Perth/16/2009” which is a subclass of the H3N2 subtype as defined in the NCBI TAXON. The left panel shows the graph structure in a hierarchical manner.

图6.
figure6

LinkedImm图的查询可视化

讨论

LinkedImm是一个基于图形的框架,用于构建一个web可访问的知识库,该知识库集成了来自多个资源的相关类型的免疫数据,包括其他未连接的Neo4J数据库。通过使用Cypher查询、仪表板界面和自然语言查询界面,可以通过多种方式访问该集成资源。

虽然数据和元数据可以直接表示为一个图,但可以根据现有的概念和关系在图中引入额外的组件,从而进一步丰富图。例如,我们添加了一个图表组件,以将年龄大于65岁的受试者定义为老年受试者。同样,如果基因在接种后的表达值符合我们事先规定的一些标准,例如与接种前样本相比至少高出两倍,我们可以添加新的基因节点将其归类为“上调基因”。可以使用Cypher查询生成这些充实的组件(子图),从而可以以更直接的方式进一步查询得到的充实图。

为了让科学家和研究人员(如实验免疫学家)广泛访问图形数据库,需要一个直观的用户界面。为此,我们实现了一个基于web的仪表板、可视化图形查询界面和一个自然语言查询界面,作为一种直观的方法来简化数据导航和查询。可以探索更高级的数据可视化方法来查询和查看图形/网络数据。

目前LinkedImm的大小不需要广泛的计算能力。大多数查询(包括图中所示的涉及病毒株推断的查询)。2.)可以在几秒钟内被执行。至于LinkedImm不断扩大,速度性能可能成为关键。为了提高硬件的速度,我们可以增加主内存大小,升级CPU的速度,并利用固态硬盘。此外,Neo4j的配备了一个企业版提供因果聚类[14具有容错、可伸缩性和数据一致性。

随着更多Neo4j数据库/知识库在各个域中公开可用,需要集成这些图数据库的需要增加。希望创建一个中央注册表或存储库,该存储库可以帮助用户找到这些图形数据库和公共查询接口,以便同时访问多个图形数据库。链接这些数据库中的实体可能是一个挑战。在当前的LinkedImm系统中,我们半自动匹配各个人工干预的实体之间的名称。然而,更智能和自动方法可以将研究数据进行语义地图到本体,从而统一术语和标准化关系,以便于数据集成。新生儿[15]是否开发了一个neo4j插件,用于将Neo4j数据库映射到RDF / OWL本体。这将允许NEO4j和RDF图之间的无缝集成,包括链接数据云中的图形[16].虽然LinkedImm的主要焦点是数据集成,但有可能将图形数据库与分析服务集成。例如,neo4j bi连接器[17]允许直接访问来自Tableau的分析工具的Neo4j图数据[18].我们可以整合机器学习工具来进行图数据挖掘(例如,[19])。

结论

我们使用Neo4J构建了LinkedImm,这是一个图形知识库系统,通过集成来自多个来源的不同类型的免疫数据来促进系统疫苗学研究。LinkedImm可在[20.].我们已经展示了如何图形数据库可用于基于有意义的关系不同类型的链接数据和进行推断。尽管SQL数据库是一个行业标准,并已得到广泛应用,NoSQL数据库像Neo4j的获得了在处理不同,半结构化数据的不断增加,因为他们的优势的关注,牵引力和动力。除了数据库技术,我们已经表明各种方式,用户可以与LinkedImm系统进行交互,包括一个基于Web的仪表板界面,图形查询可视化和自然语言查询接口。

方法

我们的方法主要包括两个部分:(i)通过将来自多个来源的各种不同格式的免疫数据转换和集成到一个通用的图形模型中,创建一个图形数据库;(ii)使用基于web和基于语音的技术,为用户建立一个直观的交互、查询、,并可视化图形数据库。

系统疫苗学用例

系统疫苗学研究利用高通量分析方法,提供对疫苗免疫反应的综合、动态观点[21].系统疫苗学研究通常包括在接种前和接种后的多个时间点从特征明确的队列中采集血液样本(图。7.). 系统级免疫分析技术,如全基因组转录分析或B/T细胞受体谱[21,以测量由此产生的免疫反应。然后对这些数据进行分析,以确定由于接种疫苗而改变的特征或与诱导免疫反应的质量相关的特征。

图7.
figure7

生成和时间序列流感疫苗接种队列研究,包括年轻人和年长者谁是由不同的画中人物为代表分析数据收集

系统疫苗学方法已被许多团体用于了解人类对流感疫苗接种的反应[21].流感由流感病毒引起的高传染性的呼吸道疾病,是一个全球性的健康问题。有30,000到40,000在美国[由流感每年死亡22].预防流感疫苗接种的主要方法。然而,尽管每年的流感疫苗接种在公共卫生方面取得了明显的成功,但仍有相当一部分人,特别是老年人,未能引起显著的抗体反应[23,24].

NIH/NIAID人类免疫项目联盟(HIPC)协调开展了几项流感疫苗接种分析研究[25].HIPC还进行了鉴定的荟萃分析,其鉴定了预疫苗接种的转录签名,其预测通过抗体滴度测量的响应的质量[25].与这些研究相关的数据存储在NIH/NIAID进口存储库[26]. ImmPort是一个MySQL关系数据库。还通过ImmuneSpace向公众提供重债穷国数据。ImmuneSpace从ImmPort提取数据,并提供一个接口,方便用户驱动的数据分析[25]. ImmPort和ImmuneSpace为二次分析提供了大量数据,可用于识别疫苗接种反应的特征,包括来自疫苗接种前后时间点的样本。

一个搜索ImmPort的标识五十接种流感疫苗的研究与前和接种后的转录分析数据。这些包括重债穷国和非重债穷国的研究。我们最初关注这组接种流感疫苗的研究,以构建LinkedImm。这些研究遵循了典型的系统设计疫苗学(图7.). 这些研究主要集中在年轻人群体,尽管有些也包括老年人。大多数受试者的人口统计数据(如年龄、种族和性别)以及测量的抗体滴度和转录谱数据均可用。在疫苗接种前的一个时间点(通常为第0天)和接种后的第二个时间点(通常为第28天),通常通过血凝抑制试验(HAI)测量疫苗中包括的每种流感毒株的抗体滴度。这有助于评估疫苗接种反应的质量。其中许多研究还利用基因表达微阵列在接种前和接种后的几个时间点(时间点0代表接种前,后续时间点对应于接种后)对PBMC进行转录谱分析。这些实验中的每一个都会产生每一个基因的表达水平测量值 ~ 20000个基因。其他类型的免疫分析数据也可用于许多此类研究,如高维细胞仪,但这些数据已被排除在Linkedim原型系统之外。ImmPort的其他研究使用不同的实验技术,如病毒中和试验(VNA)和RNA-seq,分别进行相似的抗体滴度和基因表达测量。

数字8.LinkedImm的构建首先将import的HAI和相关的基因表达数据转换成一个Neo4J图形数据库。转换步骤及得到的图模型如图所示。9.在我们的图模型中,Study表示为根节点,其子节点为Subject (Subject可以属于一个队列或一个分支)。受试者与生物样本(生物样本)相关联,生物样本具有与分析结果相关联的实验样本(示例样本)。目前,LinkedImm的实现采用了企业版(3.5版)的Neo4J,运行在Linux服务器上,具有32gb RAM和500tb固态硬盘(SSD)。此外,它使用Apache 2.0作为web服务器。我们使用import的API(应用程序接口)编程地从import提取了HAI数据,该API允许我们从所有疫苗研究中检索HAI结果(总共有58项研究获得HAI结果)。API以CSV格式返回查询输出。我们编写了一个Cypher脚本,将包含HAI结果的CSV文件转换为Neo4J图形格式。与HAI数据不同,import只存储关于微阵列实验的元数据。底层基因表达数据存储在NCBI基因表达综合库(GEO)中[27].在实验样本水平上建立了import和GEO之间的联系。为了获得基因表达数据,我们利用ImmuneSpace [28,它使用import发布的研究的元数据从GEO检索原始数据,然后对这些数据进行处理,生成标准化的基因表达值。可以对从ImmuneSpace获得的经过处理的基因表达数据进行进一步分析(例如,fold change)。在本工作中,图数据库仅存储基于从ImmuneSpace获得的处理数据计算出的fold change数据的上/下调节决策。这个过程的结果是一个连接受试者、生物样本和实验样本以及基因表达和HAI结果的图形数据库(见图)。9).

图8
figure8

LinkedImm系统的特点是集成来自多个数据源的不同类型的数据

图9.
figure9

单一研究的HAI测量图模型(SDY404)。研究对象(红圈)与他们的人口统计信息相关联,包括年龄队列(如年轻人、老年人等)。每个受试者都与采集的血液样本相连(蓝色圆圈)。对接种给该受试者的疫苗中的每个病毒株收集HAI测量值(棕色圆圈)

综合分析是系统疫苗学的关键促成因素。例如,识别疫苗接种后激活的途径需要结合基因表达水平的信息和与每条途径相关的一组基因的先验知识。许多通路数据库(例如,Reactome[29]收集先验知识)已经制定并通过网络为研究人员使用公开。虽然网络访问的数据库可以单独查询,查询结果可以以不同的格式下载,通常是用户的责任,在综合数据分析有意义的情境手动或编程方式将它们链接。这样的数据整合的努力能得到劳动密集和阻碍是缺乏标准的格式和标识,以及缺乏不同数据库之间的正式数据的关系。

为了便于整合分析,我们已经通过连接从所述ImmPort HAI和基因表达数据与其它类型的可通过不同来源的数据(图扩大LinkedImm图形数据库。8.). 具体而言,我们做了以下工作:(1)通过包括从CDC和NCBI获得的流感病毒株的附加信息,定义不同研究中HAI测量之间的关系;(2)结合Reactome的途径关联,通过[3.].季节性流感病毒应变信息由世卫组织生产,并通过CDC作为标签分隔文件提供。我们在此文件中阅读,并自动将病毒应变名称与EBI提供的NCBI分类法的NEO4J图中的病毒株的名称匹配[30.(图。10).为了提高效率,我们根据存储在LinkedImm中的WHO病毒株提取了NCBI分类学的子图。其次,我们将Reactome图数据库的子图导入到LinkedImm中。这个子图包括了每个包含至少一个基因的通路,这些基因是在import的基因表达数据中测量到的。总的来说,LinkedImm图表数据库包含了19种独特的流感病毒毒株和涵盖大约2万个基因的2000多条人类途径的信息。

图10.
图10.

与NCBI分类病毒分类有关的HAI结果图模型

基于Web的仪表板和自然语言查询接口

为了让用户探索LinkedImm不使用的Cypher查询语言,我们已经使用了PHP框架来开发直观的Web界面。这些接口为用户提供了指定要检索和显示信息Web表单。用户的规范被传递给随后查询LinkedImm知识图并返回查询结果以不同的格式(包括CSV文件和图形图表)的动态的Cypher代(DCG)函数。的CSV文件被转换成使用R和GGPLOT2库图形图表。

LinkedImm还提供了以自然语言发布查询的能力。通过我们的自然语言界面,用户可以在文本输入字段中输入自然语言查询。具体来说,我们使用了Google Chrome Web语音API来实现此语音到文本转换。在这种情况下,通过使用Chrome Web浏览器,用户可以通过他们的麦克风说出自然语言查询。

我们已经使用了Dialogflow [31](谷歌拥有的服务)作为自然语言处理(NLP)代理,将自然语言查询翻译成相应的Cypher查询。我们已经用几种可能的查询组合对Dialogflow代理进行了培训,用户可以通过这些查询组合来使用LinkedImm自然语言查询接口访问信息。Dialogflow的解析输出被反馈给DCG, DCG随后生成Cypher查询以从Neo4J数据库检索数据。查询结果以交互式图表和表格的形式显示。NLP代理具有一定的记忆当前查询上下文的能力。因此,可以对它进行进一步的培训,以实现对后续查询的支持。例如,“2014年怎么样?”他之前要求代理人出示2013年流感疫苗接种季节的结果。

可用性数据和材料

LinkedImm是在公开访问http://linkedimm.org.所有实施HAI分析,自然语言查询,可视化图形查询和人口统计仪表板上的数据和源代码可以在这里到位桶来获得:https://bitbucket.org/kleinstein/LinkedImm

缩写

anima:

协会网络整合的多尺度分析

API:

应用程序编程接口

疾病控制中心:

疾病控制和预防中心

中央处理器:

中央处理单元

CSV:

逗号分隔值

常规心电图:

动态密码生成

EBI:

欧洲生物信息研究所

地理:

基因表达综合

海:

血凝抑制试验

重债穷国:

人类免疫学项目协会

ImmPort:

免疫学数据库和分析门户

NCBI类群:

国家生物技术信息中心分类

国家卫生研究院:

美国国立卫生研究院

NLP:

自然语言处理

NIAID:

国家过敏和传染病研究所

NOSQL:

不仅SQL

猫头鹰:

Web本体语言

PBMC:

外周血单核细胞

PHP:

超文本预处理器

内存:

随机存取存储器

RDF:

资源描述框架

用:

系统生物学标记语言

SIF:

简单的交互文件

SQL:

结构化查询语言

世卫组织:

世界卫生组织

参考文献

  1. 1.

    Corbellini A, Mateos C, Zunino A, Godoy D, Schiaffino S.持久化大数据:NoSQL景观。正系统。2017;63:1-23。

    文章谷歌学术

  2. 2.

    尹BH,金SK,金SY。对异种生物数据的整合利用图形数据库中。基因组学通知。2017; 15(1):19-27。

    文章谷歌学术

  3. 3.

    Joshi Tope G等人,《反应组:生物途径知识库》。《核武器公约》第2005号决议;33(数据库问题):D428-32。

    CAS文章谷歌学术

  4. 4.

    Fabregat A等人。反应图数据库:高效访问复杂路径数据。PLOS计算BIOL。2018; 14(1):E1005968。

    文章谷歌学术

  5. 5。

    巴拉乌尔一世等。Recon2Neo4j:应用图形数据库技术管理全面的基因组规模网络。生物信息学。2017;33(7):1096 - 8。

    CASPubMed谷歌学术

  6. 6。

    夏季G,等人。cyNeo4j:连接的Neo4j和Cytoscape的。生物信息学。2015; 31(23):3868-9。

    CASPubMedpmed中央谷歌学术

  7. 7。

    陈建平,等。Cytoscape:一个整合生物分子相互作用网络模型的软件环境。基因组研究》2003;13(11):2498 - 504。

    CAS文章谷歌学术

  8. 8。

    等。大数据和网络背景下的系统生物学。Biomed Res Int. 2014;

    PubMedpmed中央谷歌学术

  9. 9。

    李森科A,等人。代表和查询使用图形数据库疾病网络。生物数据民。2016; 9:23。

    文章谷歌学术

  10. 10.

    等。用于多尺度分析的关联网络集成。威康公开赛2018;3:27。

    文章谷歌学术

  11. 11.

    陈磊,阿齐齐斯,蒋晓霞。大规模基因组数据的安全存储与查询。计算机应用程序学报。2018;165:129-37。

    文章谷歌学术

  12. 12.

    龚楼马Y,龚W,李X,李春,元X.的Neo4j图形数据库实现油田本体的高效存储性能。Plos一个。2018; 13(11):e0207595。

    文章谷歌学术

  13. 13.

    波波托-http://www.popotojs.com(10/2/2020访问)

  14. 14.

    Neo4J集群,https://neo4j.com/docs/operations-manual/current/clustering/introduction(10/2/2020访问)

  15. 15.

    Neosemantics -https://github.com/jbarrasa/neosemantics(10/2/2020访问)

  16. 16。

    LOD -https://lod-cloud.net(10/2/2020访问)

  17. 17。

    BI连接器 -https://neo4j.com/bi-connector/(10/2/2020访问)

  18. 18。

    表- - -https://www.tableau.com/(10/2/2020访问)

  19. 19。

    Folschette M、Chennen K、Gaignard A、Redon R、Skaf Molli H等。。INEX-MED:探索和链接异构生物医学数据的知识图。JOBIM 2019,法国南特。

  20. 20.

    LinkedImm -http://linkedimm.org(10/2/2020访问)

  21. 21.

    哈根T,等人。系统疫苗学:实现合理的疫苗设计与系统生物学方法。疫苗。2015; 33(40):5294-301。

    CAS文章谷歌学术

  22. 22.

    汤普森WW等。与美国流感和呼吸合胞病毒相关的死亡率。贾马。2003; 289(2):179-86。

    文章谷歌学术

  23. 23.

    老年人对流感疫苗的抗体应答:一项定量研究。疫苗。2006;24(8):1159 - 69。

    CAS文章谷歌学术

  24. 24.

    Osterholm mt,等。流感疫苗的疗效和有效性:系统评论和荟萃分析。柳叶赛犬感染了。2012; 12(1):36-44。

    文章谷歌学术

  25. 25.

    团队H-CSP和H-1联盟。Multicohort分析揭示的流感疫苗接种反应的基线预测转录。科学免疫。2017; 2(14):eaal4656。

    文章谷歌学术

  26. 26.

    Bhattacharya S等人。Immport,用于重新评估开放式免疫学测定数据进行翻译和临床研究。SCI数据。2018; 5:180015。

    CAS文章谷歌学术

  27. 27.

    克拉夫E,巴雷特T。基因表达综合数据库。方法采用分子生物学方法。2016;1418:93–110.

    文章谷歌学术

  28. 28。

    HIPC联盟 -https://www.immunespace.org/(10/2/2020访问)

  29. 29。

    克罗夫特d,等。该Reactome途径知识库。核酸研究。2014; 42(D1):D472-7。

    CAS文章谷歌学术

  30. 30.

    EBI OLS Neo4J-https://www.ebi.ac.uk/ols/docs/neo4j-schema(10/2/2020访问)

  31. 31.

    Dialogflow -https://dialogflow.com(10/2/2020访问)

下载参考

确认

我们从ImmPort为他的使用ImmPort API的从ImmPort数据库中提取数据HAI宝贵帮助承认帕特里克·邓恩。

关于这个补充

本文已作为《BMC生物信息学》第22卷《2021年补编9:2019年生物本体论和知识库欧宝娱乐合法吗研讨会精选文章:第二部分》的一部分出版。补编的全部内容可在以下网址查阅://www.christinemj.com/articles/supplements/volume22-supplement-9

资金

本研究得到了美国国家过敏症与传染病研究所UH2 AI132341和U19 AI089992的资助。SACB还得到了纽约圣约翰大学2021财年夏季研究项目的支持。资助机构在研究的设计、数据的收集、分析和解释以及手稿的撰写中没有发挥任何作用。该出版物由Grant U19 AI089992资助。

作者信息

从属关系

作者

贡献

研究构思与设计:SACB、KHC、SHK;接口代码实现:SACB、SP和JM;验证和解释结果:SACB, SHK,和KHC;手稿:SACB, SHK, KHC;关键修订:SHK和KHC;所有作者阅读并批准了最终的手稿。

相应的作者

对应于Kei-Hoi张

道德声明

道德认可和参与同意

不适用。

同意出版

不适用。

竞争利益

S.H.K.从诺斯罗普格鲁门公司收到咨询费。

额外的信息

出版商的注意事项

欧宝体育黑玩家Springer Nature在公布的地图和机构附属机构的管辖权主张方面保持中立。

权限

开放获取本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

布哈里,S.A.C.,帕瓦尔,S.,曼德尔,J.等等。LinkedImm:用于集成免疫数据的链接数据图数据库。欧宝娱乐合法吗22日,105 (2021). https://doi.org/10.1186/s12859-021-04031-9

下载引用

关键词

  • 本体论
  • 知识库
  • 图形数据库
  • 免疫学
  • 接种流感疫苗