跳过主要内容gydF4y2Ba

基于聚类方法的人群水平识别条件相关t细胞受体β链CDR3序列gydF4y2Ba

摘要gydF4y2Ba

背景gydF4y2Ba

Depe Immune受体测序,Repseq,提供了前所未有的机会,用于识别和研究由T细胞受体(TCR)CDR3序列表示的病症相关的T细胞间型。然而,由于免疫曲目的巨大多样性,条件相关的TCR CDR3S来自总曲目的相关TCR CDR3s主要限于“公共”CDR3序列或在单个个体中观察到的CDR3频率的比较。目前缺乏通过直接群体水平比较鉴定条件相关的TCR CDR3S的方法。gydF4y2Ba

结果gydF4y2Ba

我们提出了一种使用个体间共享的免疫库亚单元(或子库)对RepSeq样本进行直接群体水平比较的方法。该方法首先对每个样本中的cdr3进行无监督聚类。然后,它在样本之间找到匹配的聚类,称为免疫子库,并在确定的子库水平上执行统计差异丰度测试。最后,根据cdr3与病情的相关性,将其在差异丰富的子剧目中进行排序。我们将该方法应用于腹腔疾病患者的总TCR CDR3β RepSeq数据集以及黄热病疫苗公共数据集。该方法成功鉴定了与乳糜泻相关的CDR3β序列,检测到的CDR3β序列的trbv基因和位置氨基酸使用模式与之前已知的乳糜泻中麸质特异性CDR3β的相当一致。它还成功地恢复了与每个条件相关的大量已知CDR3β序列,这比随机预期的要多。gydF4y2Ba

结论gydF4y2Ba

我们的结论是,在不相关的个体中具有相似免疫基因组特征的免疫子库可以作为免疫库比较的可行单位,作为条件相关cdr3的鉴定代理。gydF4y2Ba

背景gydF4y2Ba

T细胞受体的靶向高通量测序repseq,已启用免疫曲目的深入分析[gydF4y2Ba1gydF4y2Ba]. RepSeq技术的一个关键应用是根据观察到的T细胞克隆频率变化来识别与疾病相关的T细胞克隆。这允许跟踪抗原暴露或治疗后扩张或收缩的免疫细胞。然而,由于T细胞受体(TCR)序列的高度多样性,这种分析变得复杂,估计有数以千万计的独特的TCR表达T细胞克隆在很大程度上是个体独有的[gydF4y2Ba2gydF4y2Ba那gydF4y2Ba3.gydF4y2Ba,直接比较多个样本组的t细胞克隆丰度具有挑战性。gydF4y2Ba

在样本组中鉴定条件特异性克隆型的一种常用方法是调查所谓的公共克隆型(通常由独特的TCR CDR3序列表示),这些克隆型通常在许多个体中观察到[gydF4y2Ba4.gydF4y2Ba那gydF4y2Ba5.gydF4y2Ba那gydF4y2Ba6.gydF4y2Ba那gydF4y2Ba7.gydF4y2Ba那gydF4y2Ba8.gydF4y2Ba那gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba10gydF4y2Ba那gydF4y2Ba11gydF4y2Ba].然而,这种共享的克隆型只占每个个体总免疫反应的一小部分。例如,我们发现乳糜泻患者对谷蛋白的反应中只有10%涉及公共CDR3序列[gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba12gydF4y2Ba].因此,我们应该通过研究自适应免疫反应来了解更多关于自适应免疫反应的知识。目前,允许检测私人和公共疾病相关克隆型的方法很少。德维特等gydF4y2Ba.gydF4y2Ba报道了一种比较来自同一个体中的reptoIres中的Clonotypes的频率的方法,以鉴定差异丰富的Clonotypes,从而鉴定每个人内的疾病相关的Clonotypes [gydF4y2Ba13gydF4y2Ba].DeWitt等人对该方法进行了改进gydF4y2Ba.gydF4y2Ba还报道了时间依赖性变异的原因[gydF4y2Ba14gydF4y2Ba]gydF4y2Ba.gydF4y2Ba最近有一种叫做ALICE的方法[gydF4y2Ba15gydF4y2Ba[允许通过比较来自使用统计TCR重组模型产生的数据估计的预期邻居的观察到的TCR邻居,从单个曲目中检测相关的Clonotypes。Pogorellyy等人gydF4y2Ba.gydF4y2Ba还报告了贝叶斯统计方法,用于比较和检测在不同时间点同一个体的曲目之间的扩展/相关克隆型[gydF4y2Ba16gydF4y2Ba].这些方法允许鉴定感兴趣的克隆,这些克隆对个体来说也是私有的,但不允许在群体水平上直接调查差异丰富的克隆型,尽管从多个样本的特别结合结果仍然是可能的。此外,除ALICE外,其他方法都需要从每个个体获取多个样本。因此,目前需要一种方法来进行克隆差异丰度的直接群体水平比较,以便在纵向或病例对照RepSeq数据集中鉴定条件特异性t细胞克隆型。gydF4y2Ba

最近,我们发现cd相关的TCR CDR3β序列中过量的氨基酸基元,最初是从四聚体结合抗原反应的t细胞中鉴定出来的[gydF4y2Ba17gydF4y2Ba那gydF4y2Ba18gydF4y2Ba]也可从塞氏疾病患者的未缺陷的总外周血免疫曲目中可检测到,尽管仍然是巨大的曲目多样性[gydF4y2Ba9.gydF4y2Ba].这一观察和对CD相关TCR CDR3β序列的进一步检查,强烈提示与CD相关的CDR3β序列在序列水平上具有相似性,可用于将它们分组,反映了参与免疫反应的类似免疫基因组特征,可能是患者共有的。这种高序列相似性在慢性淋巴细胞白血病相关的b细胞受体(BCR)中已经观察到,具有潜在的临床相关性[gydF4y2Ba19gydF4y2Ba那gydF4y2Ba20.gydF4y2Ba].最近,Dash等人gydF4y2Ba.gydF4y2Ba和Glanville等人gydF4y2Ba.gydF4y2Ba已经证明从不同患者收集的抗原特异性TCR序列可以聚类为具有序列相似性的抗原特异性组[gydF4y2Ba21gydF4y2Ba那gydF4y2Ba22gydF4y2Ba].总的来说,最近的RepSeq研究报告了与疾病相关的CDR3序列的相似性,这是免疫反应的一个特征,可以通过比较样本组,从总的未排序的序列中识别与疾病相关的CDR3序列。gydF4y2Ba

在这项工作中,我们在称为次曲线的T细胞受体CDR3β序列的共用簇水平上提出了差异丰度分析,以通过比较Repseq实验组来鉴定CDR3β序列的疾病相关簇。我们首先应用于样本内CDR3β聚类,以减少免疫曲目的多样性,以管理和可比的分析单位。我们表明,由具有高度相似的核苷酸或氨基酸子序列(K-MERS)的克隆型组成的这些受体簇,形成生物学上有意义的分析单位,因为它们通常存在于无关个体的曲目中。然后,我们在这些亚曲目的水平下进行统计差异丰度分析,用于鉴定特异性特异性CDR3β锁定型。我们还表明,该方法允许通过比较人口水平的样品组,成功地检测无关的HLA匹配的腹腔病患者和黄热病病毒疫苗接种志愿者的免疫力学和公共数据集。。gydF4y2Ba

结果gydF4y2Ba

我们假设,CDR3在全球库中的聚类不仅将免疫库的巨大多样性减少到可管理的单位,而且通过首先比较样本组之间CDR3聚类的丰度,还可能允许间接检测与条件相关的CDR3(图)。gydF4y2Ba1gydF4y2Ba).为了研究这种方法的有效性,我们首先评估一个样本中CDR3β序列的聚类是否在子序列组成方面与另一个样本中的另一个聚类相似。重要的是,集群必须接近其匹配的另一个示例比其他集群CDR3上β年代在国内示例中,理想情况下将信息不仅来自germline-encoded变量(V),多样性(D)和/或加入(J)地区,也无需模板核苷酸的N1和N2地区,欧宝直播官网app表明保守的免疫基因组以及抗原诱导的TCR选择特征。gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

基于聚类的CDR3剧目HTS数据集差分丰度检测方法原理图gydF4y2Ba

我们观察到,在不相关的个体中,这些CDR3βs的序列组成非常相似,在样本中存在。例如,对于两个cdpbmc库样本CD005和CD006(不相关的乳糜泻患者),我们首先从CDR3β总独特核苷酸序列中抽取5000个CDR3β,并在每个样本中对CDR3β进行无监督聚类。然后将两个样本的所有聚类的中心合并,并再次聚类以识别匹配的CDR3β聚类中心(图中步骤1和步骤2)。gydF4y2Ba1gydF4y2Ba). 在确定的32个质心簇(即子曲目)中,30个(~ 94%)具有代表两个样本CDR3β簇的质心(图。gydF4y2Ba2gydF4y2Baa).对CD PBMC数据集的所有8个样本进行相同的分析,结果相似,所有子库具有来自多个样本的具有代表性的质心(附加文件)gydF4y2Ba1gydF4y2Ba:图2 sa)。如果群集很大程度上由种系编码的V、D和J基因定义,这是可以预期的,我们进行了一些分析,以评估这种核苷酸4-mer定义的群集在多大程度上受种系序列的影响。我们首先比较了子库匹配聚类中V-gene、VJ-gene、VDJ-gene和J-gene的使用情况。在两个样本和所有8样本分析,生殖系基因并不能完全解释匹配的子序列组成相似集群,V-gene J-gene,占约50%和80% VJ -和VDJ基因,包含匹配的sub-repertoires集群基因使用谱(图明显不同。gydF4y2Ba2gydF4y2Bab和附加文件gydF4y2Ba1gydF4y2Ba:图2SB和C)。然后,我们看了从CDR3S(来自单个样品)的每个位置开始的核苷酸4-MERS的多样性,从保守的半胱氨酸到CDR3S的末端。这是针对CDR3S完成的,具有最普遍的CDR3长度为42(附加文件gydF4y2Ba1gydF4y2Ba:图2 sd)。正如我们所预料的,我们通常观察到只有种系基因的位置上可能的4-mer的多样性/变异较低,而在有N1和N2区域的位置上4-mer的多样性最高(图)。gydF4y2Ba2gydF4y2Bac),建议K-MER频率估计在这些高熵区域中出现的K-MERS中最不同。因此,我们从其中评估了CDR3的区域,其中4 MERS的频率最高(CDR3S)起源于最高变化。在前20个如此高的4-Mers中,我们观察到,虽然有些主要来自V或J基因区域,但许多来自包括具有最高方差(GGGG)的N1,D,N2区域,其中源于最高差异(GGGG)主要来自N1,D,N2区(图。gydF4y2Ba2gydF4y2BaD,E),暗示具有最多占CDR3之间的差异的K-MERS来自这种高多样性区域。要进一步确认这一点,我们建立了一种使用群集(在样本集群内)或子曲目(跨样品簇匹配)作为类别的随机林(核苷酸4-MERS,一个热编码V-Genes,J-Genes,VDJ和VJ为变量,并评估变量在将Clonotypes分类到集群或子reptoIres中的重要性。这表明,尽管J-基因具有更高的中值,但通常具有最重要的是定义类(在样品中的簇中,而不是gydF4y2Ba2gydF4y2Baf),具有高于最高值j基因的重要性值的k-mers多于所有可能的13个j基因的数量(在8个样本子库中,附加文件gydF4y2Ba1gydF4y2Ba:图2 se)。对前20个最具区别性变量的k-mers来源的分析显示,对于样本内的聚类,半数以上的k-mers主要来自N1、D、N2区域(图2)。gydF4y2Ba2gydF4y2Bag)甚至在8个样本中的子reptoires中更进一步(附加文件gydF4y2Ba1gydF4y2Ba:图2Sf),给出了与我们观察到的最可变k-mers相似的结果。对主要(最频繁)来自N1、D和N2区域的所有k-mers的类似分析表明,与所有变量相比,这些k-mers的子集在样本聚类或跨样本子库分类方面的重要性得分最高(附加文件)gydF4y2Ba1gydF4y2Ba:图2Sg和2Sh)。综上所述,这些结果表明,由k-mers定义的CDR3β簇和亚库捕获了非模板的连接插入/删除区域的歧视性信息,而不是简单地通过简单的种系基因使用再现克隆型分组。结果导致更好的克隆型群集与共享免疫学信息在样本内部和跨样本。gydF4y2Ba

图2gydF4y2Ba
figure2gydF4y2Ba

两个无关个体样本中的CDR3亚谱匹配。gydF4y2Ba一种gydF4y2Ba来自Samples CD005(Black)和CD006(绿色)的CDR3集群的分层群集来自我们的CD PBMC数据集的标识为32个分速,其中30(94%)有两个样本的集群代表。分支颜色表示子reptoIresire。只有32(6%)子曲目中的2个(在黑点中显示)是均匀的,仅含有一个样品的簇质心。gydF4y2BabgydF4y2Ba比较来自两个样本的聚类之间的V-、J-、VJ-和VDJ基因使用频率,显示基因使用差异显著且p值小于0.05(采用独立卡方检验)的子库的百分比。gydF4y2BacgydF4y2Ba对42nt长的CDR3s,利用Shannon熵估计了从每个位置开始的不同4-mers的数量,最高熵出现在具有N1和N2区域的CDR3s位置。所有样品均得到相似结果。不完全在N1或N2区域内,但在区域内结束或开始的4-mers也被计算在内。gydF4y2BadgydF4y2Ba显示了在单个样本(CD005)内的5000个分布的CDR3上的频率最高的前20名4 MERS。gydF4y2BaegydF4y2Ba其中(在V, N1, D, N2, J)在CDR3s中发现的前20个最可变的4-mers的频率被显示。gydF4y2BafgydF4y2Ba在单个样本(CD005)中,k-mers和基因在区分基于4-mer的簇时的分类重要性被显示出来。gydF4y2BaggydF4y2Ba显示了CD005基因库中最具鉴别性的前20个4-mers(从左到右排列)出现的频率(在V, N1, D,N2, J)gydF4y2Ba

然后,当在分析中有更多的样本时,我们调查了子曲目共享的程度。我们对腹菌疾病(CD)PBMC数据集的所有8个样本进行聚类和聚类匹配分析,从麸质挑战前(第0天)和谷粉后攻击(第6天)条件,在每个样品的不同测序深度(无花果。gydF4y2Ba3.gydF4y2Ba).在不同曲目深度进行的10次分析中,仅从一个样本中含有代表性质心的子曲目的比例低得可以忽略不计(图)。gydF4y2Ba3.gydF4y2Baa),而至少10-20%的子库包含来自所有8个样本的CDR3聚类中心。但累积起来,有超过40% (hc匹配)和60% (km匹配)的子库包含8个样本中至少6个样本的质心(图6)。gydF4y2Ba3.gydF4y2Bab),表明在多个样本中存在足够多的子库,从而可以在种群水平上比较子库的丰度,并能够间接检测条件相关的cdr3。gydF4y2Ba

图3gydF4y2Ba
图3gydF4y2Ba

跨多个样本的子剧目检测。利用CDR3聚类中心的层次聚类(hc)和k-means聚类(km)对8个CD PBMC样本进行子剧目检测。gydF4y2Ba一种gydF4y2Ba显示仅n个样本中含有CDR3聚类中心的子库的比例,点是每个样本测序深度为1到1万个独特的CDR3核苷酸的下采样库的10个分析中的每个分析的估计。gydF4y2BabgydF4y2Ba显示了n个或更多样本中含有代表性聚类的子库的累积比例;每个n点的累积值是根据10个重样分析中n个代表样本的平均比例计算的gydF4y2Ba

将该方法应用于我们的数据集,用于CD PBMC数据集(n = 4) ,该方法鉴定了2315和2467个CDR3β序列,当分别使用核苷酸4-聚体和氨基酸3-聚体特征载体时,它们在麸质暴露后显著富集。对于CD Gut数据集(n = 5) ,该方法分别使用核苷酸4-聚体和氨基酸3-聚体特征载体,在活动性乳糜泻期间鉴定出2291和2404富集的CDR3βs。图形gydF4y2Ba4.gydF4y2Ba显示了使用核苷酸4-mer和氨基酸3-mer特征向量时从两个数据集中检测到的前20个富集CDR3βs(有关所有检测到的CDR3的列表,请参阅附加文件gydF4y2Ba2gydF4y2Ba).考虑到免疫库数据集的高度多样性,用nt 4-mers和aa 3-mers进行的分析结果显示有很高的重叠(在CD PBMC中高达70%,在CD Gut中高达78%,附加文件gydF4y2Ba1gydF4y2Ba:图3Sa和b),表明任何一个特征向量都可以得到相似的相关性结果,尽管后者的计算代价更大。gydF4y2Ba

图4gydF4y2Ba
装具gydF4y2Ba

该方法鉴定的差异丰富的CDR3β序列。在麸质暴露过程中,前20个显着富集的CDR3β序列显示为gydF4y2Ba一种gydF4y2BaCD PBMC和gydF4y2BabgydF4y2Ba使用NT 4-MEL特征向量时CD GUT数据集。使用AA 3-MEL特征向量获得的结果是开启的gydF4y2BacgydF4y2Ba对于CD PBMC和gydF4y2BadgydF4y2BaCD Gut数据集。丰度以log10刻度显示,从低丰度(白色)到高丰度(红色)。经GFD处理的样品显示为浅蓝色,而面筋暴露的样品显示为顶部的橙色条状gydF4y2Ba

为了评估该方法检测CD相关克隆型的灵敏度,以及检测由于取样差异而导致的克隆型大小差异以外的富集能力,我们对由汇集和随机取样策略制备的相同条件的CD PBMC样本应用了核苷酸4-mer分析(见gydF4y2Ba分析相同条件的样品gydF4y2Ba节的附加文件gydF4y2Ba1gydF4y2Ba).对于预麸质暴露第0天和麸质后暴露的第6天,同一条件下的十个未配对比较,随机绘制的样品,鉴定较少的富含浓度的浓缩克隆型,其第0天中的平均值为1.5,以及第6天的2.4天相同的条件比较(附加文件gydF4y2Ba1gydF4y2Ba图5S),说明该方法在选取相关克隆型时对取样变异较为敏感。gydF4y2Ba

对于方法验证,我们将检测到的CD相关的CD相关的CDR3βs与文献中的已知乳糜泻相关的CDR3β序列进行比较。检测到的富集的CDR3βs显着增加了先前报告的与谷蛋白反应性CDR3β序列相关的TRBV基因的使用情况[gydF4y2Ba17gydF4y2Ba那gydF4y2Ba18gydF4y2Ba那gydF4y2Ba23gydF4y2Ba那gydF4y2Ba24gydF4y2Ba那gydF4y2Ba25gydF4y2Ba那gydF4y2Ba26gydF4y2Ba从CD PBMC数据集富集的cdr3 β显示trbv基因家族4、5、7和9的偏倚使用,特别是TRBV04-02、TRBV07-02和TRBV09-01(图)。gydF4y2Ba5.gydF4y2Baa,以及附加文件gydF4y2Ba1gydF4y2Ba:图4 sa)。从CD肠道数据集富集的cdr3 β也显示了先前报道的TRBV06-01的偏用,以及新的有趣基因,如TRBV10-03(图)。gydF4y2Ba5.gydF4y2Bab,和附加文件gydF4y2Ba1gydF4y2Ba:图4Sb)。此外,对含有一些过度使用的TRBV基因的富集CDR3的逐位氨基酸使用分析提供了有趣的见解。除了检测面筋中含有已知氨基酸基序的CDR3βs外,反应性CDR3βs在第6位主要使用精氨酸(R)[gydF4y2Ba17gydF4y2Ba那gydF4y2Ba18gydF4y2Ba(图。gydF4y2Ba5.gydF4y2Bac和附加文件gydF4y2Ba1gydF4y2Ba:图4Sc),该方法在检测到的富集cdr3中发现了其他以前未被报道过的过度使用的基因,如TRBV03-01、TRBV15-01和TRBV10-01,这些基因以前未被充分认识到每位置氨基酸使用模式,例如先前的报道(尽管在Humanized HLA-DQ8转基因小鼠中)在谷蛋白特异性TCR CDR3βs的第6位过量使用谷氨酸(E)和天冬氨酸(D) [gydF4y2Ba27gydF4y2Ba)(附加文件gydF4y2Ba1gydF4y2Ba:图4Sc和d)。此外,除了基于核苷酸子序列的CD-Gut分析外,来自CD-PBMC和CD-Gut的富集CDR3βs列表中包含大量之前由Joi等人报道的CD相关CDR3β序列gydF4y2Ba.gydF4y2Ba,Han等人gydF4y2Ba.gydF4y2Ba和Petersen等人gydF4y2Ba.gydF4y2Ba[gydF4y2Ba17gydF4y2Ba那gydF4y2Ba25gydF4y2Ba那gydF4y2Ba26gydF4y2Ba通过使用随机试验或直接比较所有样本组合数据集的全部曲目中先前已知的与cdr3相关的乳糜泻的比例来确定(表1和其他文件)gydF4y2Ba1gydF4y2Ba表4S,请参见附加文件gydF4y2Ba1gydF4y2Ba:表2S和3S列出了通过该方法识别的先前已知的与CDR3相关的腹腔疾病)。nt 4-mer和aa 3-mer方法检测到的已知CD克隆型之间也存在高度重叠(补充文件gydF4y2Ba1gydF4y2Ba该方法检测到的已知CD相关的cdr3主要来自CD PBMC中的CD4 + t细胞(根据之前报道中携带cdr3的t细胞类型确定)和CD内脏数据集中的CD8+ t细胞(表gydF4y2Ba1gydF4y2Ba).没有发现相关的任何已知的CD CDR3上β年代de-enriched序列从列表中氨基酸和核苷酸4-mer模基础分析CD PBMC,而对于CD肠道,两个已知的CD clonotypes de-enriched在氨基酸的核苷酸4-mer和一个模分析(附加文件gydF4y2Ba1gydF4y2Ba:表3S)。gydF4y2Ba

图5gydF4y2Ba
figure5gydF4y2Ba

CD PBMC和CD Gut中差异丰富的CDR3β序列的特征在之前的研究中,谷蛋白反应性CDR3β序列(如CD PBMC的TRBV07-02和TRBV09-01)中存在过多的TRBV基因,差异富集的CDR3β序列具有偏用性(gydF4y2Ba一种gydF4y2Ba)和TRBV06-01 from CD Gut (gydF4y2BabgydF4y2Ba)(观察到的频率用红色表示,随机生成的cdr3组的平均频率用蓝色表示)。从CD PBMC中检测到的TRBV基因富集的CDR3β序列在每个位置上都显示了显著的过度使用氨基酸(gydF4y2BacgydF4y2Ba)和CD肠(gydF4y2BadgydF4y2Ba),氨基酸根据它们的性质而上色。在y轴上,每个位置显著过量使用的氨基酸的信息含量以比特表示。通过比较差异富集CDR3组中观察到的频率与随机抽样的100个相同大小、TRBV基因和CDR3长度的CDR3中随机获得的频率,来评估TRBV和每个位置氨基酸的过度使用。以p < 0.05为显著性(基因名显示TRBVgene::CDR3长度::Vgene和CDR3长度富集列表中CDR3的数量)。给出了使用nt 4-mer特征向量的结果gydF4y2Ba

表1在通过该方法识别的DA富集CDR3列表中的先前已知的条件相关的CDR3S(使用随机化测试)gydF4y2Ba

我们还将该方法用于公开的黄热病疫苗t细胞CDR3β库数据集,YFV PBMC (n = 9) [gydF4y2Ba13gydF4y2Ba]和双胞胎YFV PBMC (n = 6) [gydF4y2Ba16gydF4y2Ba]鉴定与YF-17D疫苗应答的CDR3β序列。我们比较了接种前(第0天)和接种后(第14天或第15天)的总PBMC序列。该方法鉴定的富集cdr3 β含有大量的疫苗诱导的cdr3 β,这在原始出版物中有报道gydF4y2Ba1gydF4y2Ba和额外的文件gydF4y2Ba1gydF4y2Ba表4:s。有关所有检测到的YFV关联CDR3s的列表,请参阅附加文件gydF4y2Ba2gydF4y2Ba).对于YFV PBMC数据集,它识别了2620个丰富的克隆型,其中697个(~ 27%)属于YFV诱导的第14天效应T-Cell cdr3 β,这些克隆型在原始出版中被统计确定为扩展(与第0天的总库相比)。在最初的DeWitt等人的研究中,通过类似的分析,在所有样本中鉴定了848个这样富集的克隆型,这些克隆型也存在于扩大的yfv诱导的第14天效应t细胞CD8+ CDR3βs中,表明我们通过直接比较样本组获得了类似的结果。因为我们总第14天与天0体验相比,不仅丰富clonotypes识别包含CD8 +也扩大了t细胞CD4 +和CD8 + t细胞,没有准确的标记用于YFV-induced天14效应CD8 + t细胞数量,发现同样的原始出版物(gydF4y2Ba13gydF4y2Ba].对于YFV PBMC双克隆数据集,该方法鉴定了4152个富集克隆型,其中2058个(~ 50%)存在于Pogorelyy等人报道的扩展克隆型中gydF4y2Ba.gydF4y2Ba[gydF4y2Ba16gydF4y2Ba].有趣的是,在DeWitt等人的YFV PBMC数据集扩增的YFV诱导的第14天效应体CD8+ T-Cell CDR3βs中,发现了223个YFV PBMC双克隆型gydF4y2Ba.gydF4y2Ba其中,仅通过我们的方法检测到122个,并且不存在于由Pogorelyy等人的双割草PBMC研究报告的扩展Clonotypes中gydF4y2Ba.gydF4y2Ba[gydF4y2Ba16gydF4y2Ba].此外,我们检查了YFV的数量(A02-NS4BgydF4y2Ba214-222gydF4y2Ba与Pogorelyy等人在最初的研究中所做的一样,我们的富集克隆型列表中包含了与巨细胞病毒(cytomegalovirus)特异性TCRβ序列gydF4y2Ba.gydF4y2Ba我们的方法没有鉴定出cmv特异性克隆型,而且明显比原始研究中扩增的克隆型中发现了更多与之完全匹配的yfv特异性克隆型(附加文件)gydF4y2Ba1gydF4y2Ba:表5 s)。总的来说,YFV数据集的结果表明,该方法可以在需要显著扩增的t细胞克隆型检测的各种研究类型中找到效用。gydF4y2Ba

为了衡量该方法的性能,我们将该方法与最近发布的四种方法进行了比较,并将该方法在使用种系基因来分组克隆型而不是基于k-mer的聚类时所获得的结果进行了比较(在该方法的第1步和第2步)。使用我们的CD PBMC数据集,我们查看了56个已知的CD相关cdr3(存在于CD PBMC数据集)中,这些方法检测了多少个,并评估了这些方法的召回率和精确度。基于我们的方法(RepAn nt 4-mer)确定14 56 CD相关cdr3上被称为不同的丰富,其比例相比,总发现丰富clonotypes类似于所有其他方法除了爱丽丝和公众的唯一方法,这些都是高度保守的,因此更低的召回(附加文件gydF4y2Ba1gydF4y2Ba:表6)。该方法有第二高的召回率和精度,仅次于德威特的方法或第三高的精度,如果我们包括Yohannes等人的方法,只检测公共克隆型。在召回率和准确度方面,它优于所有基于种系基因使用的RepAn变体。因此,该方法提供了检测公共和私人克隆型相对较高的召回率和精度,同时是唯一允许直接种群水平分析的方法(附加文件gydF4y2Ba1gydF4y2Ba:表6s,请参阅附加文件gydF4y2Ba2gydF4y2Ba对于CDPBMC数据集中的56个CD相关的CDR3S列表以及由方法检测到的那些)。我们注意到这些方法中任一两个之间的共享检测相当低(附加文件gydF4y2Ba1gydF4y2Ba(图6S),因此至少使用了另一种用于评估精确度和召回率的方法的检测标准。gydF4y2Ba

讨论gydF4y2Ba

我们在这项工作中提出的计算管道允许比较样本组之间的总免疫库,以识别与条件相关的公共和私人CDR3克隆型。据我们所知,这是目前唯一可用于直接比较TCR CDR3基因库的人群水平的方法,结合了TCR克隆型与疾病相关性的全人群统计评估,从而提高了检查和监测免疫应答的能力。gydF4y2Ba

在我们提出的方法中,我们做了两个主要假设。首先,我们假设特定于抗原或表位的免疫系统将包含与它们的t细胞受体(TCRs)高度相似的t细胞克隆,形成与其他非特定于抗原的t细胞不同的簇(或一组簇)。这一假设最初来源于我们和其他之前的研究中对乳糜泻相关CDR3β序列的观察[gydF4y2Ba9.gydF4y2Ba那gydF4y2Ba17gydF4y2Ba那gydF4y2Ba28gydF4y2Ba].Dash等人的近期作品。,一个被出版社。[gydF4y2Ba21gydF4y2Ba那gydF4y2Ba22gydF4y2Ba]表明,来自不同个体的四聚体分选的抗原特异性TCR具有高序列相似性,并且可以与抗原具有常见特异性的簇分组,进一步证明我们假设的有效性。其次,我们假设特异于抗原特异的TCR簇在免疫应答中编码一个重要的免疫基因组信息,这些信息在不相关的个​​体中共享,并且可能从全球曲目和跨处治疗条件中检测到。我们表明K-MER频率向量捕获来自CDR3序列的所有部分的免疫信息,超出了基于种系基因使用的CDR3S简单分组,其中次曲之间的最多鉴别性K-MERS也主要由那些产生的那些来自CDR3S的非模板插入/删除区域。我们基于这种核苷酸的方法或氨基酸3-MERS将总免疫曲目的疏散分解为存在于各个中存在的单位(有意义的次曲线),并因此成功地鉴定出先前报告的和新的病症相关的CDR3β序列(私人来自我们的数据集,我们分析了更好的精确度,展示了我们假设的有效性。gydF4y2Ba

在最近的免疫重新对期研究中已经使用了代表CDR3序列的各种方式,以确定序列相似性。托马斯等人。使用的atchley因子代表CDR3的氨基酸子序列[gydF4y2Ba29gydF4y2Ba那gydF4y2Ba30.gydF4y2Ba,虽然适用于对全部曲目样本进行分类。直接比较受体序列也可以不使用数字向量表示CDR3。破折号等人定义一个度量称为TCRdist,直接使用氨基酸受体序列,用加权汉明距离不仅CDR3上的氨基酸序列,而且CDR1和CDR2α和β链之间的距离来确定两个t细胞受体(gydF4y2Ba21gydF4y2Ba],而Glanville等将氨基酸CDR3序列之间的汉明距离与抗原接触倾向高的结构确定位置的k-mer子序列的使用模式结合起来,测量CDR3对之间的距离[gydF4y2Ba22gydF4y2Ba].我们使用一个简单的高维子序列频率向量表示CDR3序列,然后使用该向量定义该特征空间中的距离,并将CDR3序列聚类到相似的组中。Greiff等人最近发现,CDR3的这种免疫基因组表征在允许对私有和公共CDR3序列进行高精度预测方面具有高度意义[gydF4y2Ba31gydF4y2Ba].我们表明,这种基于k-mer频率的表示允许检测公共和私人条件相关的克隆型。特别是对于私有克隆型,它们的重要性是通过代理来评估的,即通过检测它们的序列组成相似性,重要的是,在多次下采样分析中被认为差异丰富的次级基因库中,它们作为相关克隆型的重复检测,提供了重复的相关性证据。gydF4y2Ba

我们通过比较检测到的CDR3s与之前研究中已知的抗原结合条件相关的CDR3s来评估方法的性能。该方法检测到的已知条件相关的cdr3(乳糜泻和黄热病疫苗接种数据集)数量比随机获得的数量有统计学意义。检测到的CDR3s在已知条件相关CDR3s的v基因和每位置氨基酸用法上存在显著偏倚,验证了该方法的高可用性。该方法也优于最近发表的检测已知乳糜泻相关克隆型的方法,丰富了我们的数据集。在使用丰富克隆型的一致性检测方法来定义可能的真检测和假检测的评估中,它显示了相对较高的召回率和准确性。gydF4y2Ba

虽然我们没有直接评估hla类型差异对该方法性能的影响,但我们假设该方法可以选择hla相关的tcr,除非在比较组中hla类型是相当随机的。我们的CD数据集至少匹配了一个HLA- dq2副本,该副本与CD具有最强的遗传关联。公共数据集YFV PBMC没有HLA信息,而双YFV PBMC数据集HLA与HLA- a *02匹配,这限制了YFV抗原表位(NS4b)gydF4y2Ba214-222gydF4y2Ba),但并不是HLA与YFV的唯一关联[gydF4y2Ba32gydF4y2Ba那gydF4y2Ba33gydF4y2Ba,因此,YFV数据集的结果在很大程度上与hla无关。该方法可以扩展到包括TCR β -链(CDR1和CDR2)和α -链(CDR1, CDR2和CDR3)中其他互补决定区域的k-mer频率,从而获得克隆型对抗原特异性更全面的信息。对于CDR1 CDR2 (V基因编码的),这可能允许的方法对HLA的影响更敏感,CDR1和CDR2 CDR3上不同,只有接触主要组织相容性复合体(MHC),而不是直接的抗原肽pMHC网站,调制识别特异性间接(gydF4y2Ba34gydF4y2Ba].gydF4y2Ba

条件相关TCR cdr3在许多多因素自身免疫或癌症相关疾病中尚不完全为人所知。对于抗原已知的疾病,如乳糜泻(CD),其抗原(谷蛋白)的一些信息是已知的,特定的协议,如四聚体和/或分类将不得不设计,以详细描述抗原特异性t细胞、它们的cdr3和其他表型。尽管这种方法非常有用,但这种旨在选择抗原特异性基因的方法无法检测到t细胞克隆对除谷蛋白以外的其他重要免疫目标(无论是自身的还是外来的)做出反应,这可能会忽视免疫反应中可能解释病理的关键部分。如本研究中提出的方法,试图从全部序列中检测与疾病相关的t细胞克隆,而不必事先了解免疫靶点(或靶点),再加上分析与疾病相关的t细胞克隆的总体基因表达的技术,可能会为适应性免疫反应提供一个高度全面的图像。这使得我们对这类疾病有了更全面的了解,从而解开谜团的隐藏部分,并为预测未知的免疫靶点提供了方法。对于抗原完全未知的疾病,这种方法的应用可能导致相关CDR3序列的鉴定,这些序列可以作为免疫反应生物标志物,有可能在临床应用,并能与CDR3数据库中其他已知疾病相关的CDR3序列进行比较[gydF4y2Ba35gydF4y2Ba那gydF4y2Ba36gydF4y2Ba],从而可以通过特异性估计来预测它们可能的目标抗原,这种特异性估计可以通过最近报道的tcr -表位特异性预测方法获得[gydF4y2Ba37gydF4y2Ba].gydF4y2Ba

该方法的主要局限性包括限制性剧目代表性和计算强度,这两者都是由于免疫剧目的巨大多样性造成的。每个人身上都有数百万个独特的CDR3序列,每一个都代表一个t细胞克隆,而且大多数只存在于一个人身上。目前使用Repseq技术的每个样品中只有数万到数十万个独特的cdr3被取样。由于计算潜在数十万cdr3的成对距离是计算密集型的,如果不是不可行的,我们采用重复重采样,并应用该方法重复次数与随机选择的更小的曲目样本。选择重复重复样本的次数和每个重复样本的样本库大小决定了所需的计算资源和结果的穷尽性。此外,对于基于k-mer频率的CDR3编码,使用更大的k值是计算密集型的。当我们选择k = 4 nt和k = 3 aa是基于他们的成功应用在其他的研究(见方法),分析ks从2到8元k-mers没有实质性的区别,或获得检测能力,同时导致显著增加计算的需求随着k增加(附加文件gydF4y2Ba1gydF4y2Ba:图7 s)。由于Repseq数据集已经非常庞大,在多个样本中有数千个克隆类型,所以使用较小的k是一个更好的权衡。我们在一个拥有24核的单个节点的超级计算机集群上对所有数据集运行该方法。对CD PBMC和CD Gut数据集进行100次重样轮运行该方法,使用nt 4-mers大约需要1小时,使用aa 3-mers分别需要15和8小时。大约100 GB的合并内存用于基于nt和aa的分析。对于两个更大的YFV数据集,600次重样轮需要40到50小时进行nt 4-mer基础分析,最多使用322 GB内存(附加文件gydF4y2Ba1gydF4y2Ba:表7S)。由于使用nt 4-mers的结果与aa 3-mers获得的结果具有高度可比性,因此在克隆型核苷酸数据可用的情况下,对于较大的数据集,使用nt 4-mer选项的方法是更好的选择。gydF4y2Ba

结论gydF4y2Ba

综上所述,通过将CDR3序列聚类成具有相似免疫基因组特征的组,并在不同样本中找到它们的紧密匹配,我们表明,条件相关的CDR3序列是私人的或公共的,且丰度差异显著,可以通过直接比较样本组来检测。该方法为识别与疾病或其他重要表型(如hla型)相关的私人或公共cdr3(及其特征)铺平了道路,进一步实现t细胞克隆型的全面分类和归档。这在理解各种疾病条件和疾病发展阶段的适应性免疫反应、识别未知的自身或外来抗原、检测免疫库中编码的免疫历史以及可能的早期适应性免疫反应预测方面具有巨大的潜力。gydF4y2Ba

方法gydF4y2Ba

我们的方法缩小了高度多样化的免疫数据库数据,并通过比较两个治疗组的样本,帮助识别与疾病相关的差异丰富的CDR3序列。作为输入,它期望高通量基因组t细胞受体CDR3序列(CDR3α或CDR3β)在immunoseq格式[gydF4y2Ba38gydF4y2Ba它是一个以制表符分隔的文本文件,每一行包含关于CDR3及其特征的信息(其核苷酸和氨基酸序列、CDR3长度、频率、V-、D-和j -基因片段的使用情况等)。此外,它还需要关于每个样品的实验条件的信息。该方法也可以接受MiXCR [gydF4y2Ba39gydF4y2Ba在这种情况下,分析结果应解释为克隆型的差异表达,而不是克隆扩展(富集)或收缩(去富集)。将每个这样的曲目文件简单地作为一个样本,该方法通过四个主要步骤对样本进行处理,以识别差异丰富的CDR3序列(图。gydF4y2Ba1gydF4y2Ba):gydF4y2Ba

  1. 1.gydF4y2Ba

    CDR3聚类:首先使用高维k-mer频率矢量表示样本中的每个CDR3,通过计算CDR3中每个可能连续的核苷酸(nt)或氨基酸(aa)子序列的频率。我们通常使用k = 4表示nt k-mers,结果是特征向量大小为256,或者k = 3表示aa k-mers,结果是特征向量大小为8000。我们对这些k的选择是基于以前在类似的高多样性数据集中使用序列合成进行有意义的无监督聚类的成功应用。4-聚核苷酸(四核苷酸)频率已广泛用于宏基因组分类,用于将reads分配到分类组[gydF4y2Ba40gydF4y2Ba那gydF4y2Ba41gydF4y2Ba那gydF4y2Ba42gydF4y2Ba,我们推测,采用基于核苷酸组成的TCR分组是合理的,因为TCR序列可能反映了TCR参与的主要环境抗原组。对于氨基酸TCRs,聚类一个基于3聚体的氨基酸Atchley因子编码TCRs已被证明可以更好地分类整个系统的免疫状态[gydF4y2Ba29gydF4y2Ba].gydF4y2Ba

    接下来,利用高维k-mer频率矢量对每个样本内的CDR3序列进行无监督聚类(使用聚类分层聚类,采用完全连接的方法,聚类数量越多,聚类稳定性越好,或“放大”,附加文件)gydF4y2Ba1gydF4y2Ba:图1 s)。我们用欧几里得距离来确定一对CDR3 k-mer频率矢量之间的距离。分层聚类后,使用动态树切割算法定义每个样本中的CDR3聚类[gydF4y2Ba43gydF4y2Ba].gydF4y2Ba

  2. 2.gydF4y2Ba

    群集中匹配样本:对于每个样本中的每个群集,每个k-mer的平均频率从群集的成员计算以获取群集质心。这里,成员Clonotypes中的K-MER频率在底层数据中的CDR3丰度不加权,以便具有质心k-MER频率反映簇的基本后续组成特性,并且由于在匹配时避免由于测序深度差异而避免偏差样品。从所有样品中收集来自所有样品的簇的质心,并且使用分层聚类或K-Means基于K-MER频率分布的近距离对质心进行质心进行无监督的聚类。使用K-Means时,使用具有最佳最佳-k(OK)分数的k执行质心的聚类:gydF4y2Ba

    $${\text{oK}}=\left({\text{nS}}+{\text{avS}}}\right)/2$$gydF4y2Ba

    其中nS是剪影值大于平均剪影值的簇的比例(在所有簇中),avS是通过加1除以2移到0和1之间的平均剪影。oK值的范围是0到1。为了确定oK值最大的k,对所有样本(从步骤1的结果)中观察到的每个样本从最小到最大的CDR3集群数开始的所有k计算oK值。gydF4y2Ba

    接下来,检查每个质心簇,如果一个样本中的多个质心在同一个质心簇中,则将这些质心簇合并到原始样本中并更新质心。否则,将保留来自多个样本(不一定是所有样本)的所有表示匹配聚类的质心聚类。gydF4y2Ba

    给定N个样本,此步骤生成一个具有oK行和N列的聚类匹配表,其中行条目表示来自所有接近(或有匹配)心的样本的CDR3聚类标签,代表所有N个或部分样本中编码保守免疫特征的潜在特征(在所有样本中可能无法找到匹配的聚类)。我们将这个集群匹配表中的每一行称为子表。gydF4y2Ba

  3. 3.gydF4y2Ba

    微分丰度测试:sub-repertoires至少存在于x数量的样品每组第一选择(默认是至少3)。然后sub-repertoire丰度矩阵生成的选择sub-repertoires,其中包含大量的每个sub-repertoire在每个样本。这个子剧目丰度矩阵可以用不同的方法生成。通常,原始样品首先归一化到相同的CDR3总尺寸(丰度)。然后,将样本中某一子库的丰度计算为该子库中CDR3计数的总和;或者用这个总和的相对频率作为相对丰度的估计;或者避免偏见在前面两个丰度估计,可能出现由于差异的数量每sub-repertoire cdr3上一个示例中,相对克隆规模sub-repertoires作为代理的丰富(例如,平均克隆规模sub-repertoire /平均克隆在样本大小)。接下来,对于每个子曲目,使用各种测试在两组样本之间进行差异丰度测试。我们使用t检验,两类,无配对,RankProd [gydF4y2Ba44gydF4y2Ba这两种方法都很有效。然后从每个样本中提取CDR3序列,该序列属于显著差异丰富(DA)子库;这些是DA CDR3候选序列。gydF4y2Ba

  4. 4.gydF4y2Ba

    筛选候选DA cdr3: DA子剧目不是“纯的”,包含的cdr3不一定与条件相关,因此需要进一步筛选。为此,所有候选的DA CDR3序列(即DA子序列中的所有CDR3序列)的优先排序如下。每个候选CDR3gydF4y2Ba我gydF4y2Ba,一个秩和,CgydF4y2Ba我gydF4y2Ba,通过将候选人的排名从6个因素相加计算得出:gydF4y2Ba

    $ $ C_{我}= \ mathop \总和\ limits_ {k = 1} ^ {6} R_ {ki} $ $gydF4y2Ba

    在RgydF4y2Ba1gydF4y2Ba我gydF4y2Ba是候选人gydF4y2Ba我gydF4y2Ba对分类组的重要性(随机森林意味着准确性降低[gydF4y2Ba45gydF4y2Ba那gydF4y2Ba46gydF4y2Ba]),RgydF4y2Ba2gydF4y2Ba我gydF4y2Ba是它意味着fisher精确检验p值分别在每一个成对样品通过比较其丰度计算如果数据配对/匹配,或意思意思确切概率法p值计算通过比较丰富的一个样本,每个样本在另一组数据是未配对/无与伦比的,RgydF4y2Ba3.gydF4y2Ba我gydF4y2Ba它的费雪检验的平均比值比是为R计算的吗gydF4y2Ba2gydF4y2Ba配对和非配对的样本处理如RgydF4y2Ba2gydF4y2Ba,R.gydF4y2Ba4.gydF4y2Ba我gydF4y2Ba核苷酸是其均值估计增加氨基酸(nt-to-aa)比条件下组相对于对照组(nt-to-aa条件/ nt-to-aa控制)占收敛的水平选择,计算平均的值分别获得它从每一个成对样品如果数据配对/匹配,或作为其在每个样本中的nt-to-aa与另一组中的每个样本比较所得值的平均值的平均值,如果数据是不配对/不匹配的,RgydF4y2Ba5.gydF4y2Ba我gydF4y2Ba是每个群体中存在的样本数量的差异,以解释其条件诱导的“公共性”程度,以及RgydF4y2Ba6.gydF4y2Ba我gydF4y2Ba是在DA分析的重复重复运行中检测到的次数(repseq数据集是巨大的数据集并需要大量的计算资源,因此我们执行了原始数据集的重复子采样,并运行步骤的差分丰度分析1–3 for each resampled datasets, the candidate DA CDR3 sequences from each round are collected, CDR3 sequences that have been detected as candidate in multiple repeat resamples are given higher rank, i.e., rank of 1). The ranking in each factor is defined differently for assessing enrichment and de-enrichment. When assessing enrichment highest rank is given for highest mean decrease in accuracy for R1,gydF4y2BaR的最小p值gydF4y2Ba2gydF4y2Ba,r的最高赔率比gydF4y2Ba3.gydF4y2Ba, R的nt- aa比率最高gydF4y2Ba4.gydF4y2Ba在疾病/治疗组中,R的检出率最高gydF4y2Ba5.gydF4y2Ba,并且在R分析的多次运行中检测的数量最高gydF4y2Ba6.gydF4y2Ba.在反富集评价中,R的精度平均下降最高,给出最高等级gydF4y2Ba1,gydF4y2BaR的最小p值gydF4y2Ba2gydF4y2Ba, R的最低优势比gydF4y2Ba3.gydF4y2Ba, R的最小nt- aa比gydF4y2Ba4.gydF4y2Ba在疾病/治疗组中,RgydF4y2Ba5.gydF4y2Ba,并且在R分析的多次运行中检测的数量最高gydF4y2Ba6.gydF4y2Ba每个因子R中1的最小值表示rank高。由于每个等级类型的等级值的范围是不同的,所有的Rs都通过减去最小值并除以范围来缩小到0到1之间。然后计算C的p值gydF4y2Ba我gydF4y2Ba使用随机测试,作为n个等级和值的比例,从n个排列(从6个因素中随机变换所有Rs,我们通常使用n = 1000)计算,等于或小于CgydF4y2Ba我gydF4y2Ba.我们认为C p值小于0.05和q值(每个p值的最小FDR)小于0.05的候选DA cdr3是差异丰富的cdr3。在我们的分析中,在排序和C的计算中,所有6个排序因子都赋予了相同的权重,但根据应用情况,每个因子可以使用不同的权重。为了估计错误发现率,我们采用了一种基于诱饵的策略,在分析中从健康TCR CDR3 PBMC数据库中随机抽取CDR3序列到每个样本的库数据中。利用CDR3s的误检率估计所有候选CDR3s在每个p值水平上的FDR和q值,按C p值从小到高排序。gydF4y2Ba

用于测试方法的数据集gydF4y2Ba

我们使用了四个TCRCDR3β免疫曲目数据集来测试该方法(附加文件gydF4y2Ba1gydF4y2Ba:表1s)。乳糜泻(CD)PBMC(n = 4)和乳糜泻研究队列的肠(n = 5)数据集[gydF4y2Ba9.gydF4y2Ba,来自DeWitt等的黄热病疫苗接种(YFV) PBMC数据集gydF4y2Ba.gydF4y2Ba(n = 9)[gydF4y2Ba13gydF4y2Ba]从公共免疫力曲目数据库,免疫曲线,自适应生物技术(免疫感染术,自适应生物技术,西雅图,WA。可从:gydF4y2Bahttp://adaptivebiotech.com/pub/dewitt-2015-jvigydF4y2Ba)和来自Pogorelyy等人的双胞胎黄热病疫苗接种(twinYFV) PBMC数据集(n = 6)gydF4y2Ba.gydF4y2Ba[gydF4y2Ba16gydF4y2Ba]从他们的github (gydF4y2Bahttps://github.com/mptouzel/pogorelyy_et_al_2018gydF4y2Ba).gydF4y2Ba

方法在测试数据集上的应用gydF4y2Ba

我们应用乳糜泻的方法以下列方式TCR CDR3上β曲目数据集在这个工作:我们过滤掉clonotypes大小为1,然后,(1)100年运行的步骤1到3的管道使用随机选择次级样本5000个不同的CDR3上β为每个样本序列。(2)在CDR3β样本中使用核苷酸4-聚类或氨基酸3-聚类特征向量进行聚类,在步骤2中使用k-means进行跨样本聚类匹配。(3)将每个样本中属于每个子库的CDR3s的丰度相加,生成子库丰度矩阵。对每组至少存在3个样本的子库进行子库水平差异丰度检测,采用配对t检验,p值截断值为0.1。我们从多次运行的结果评估中发现,比较不同样本的子曲目丰度的不太严格的p值截点,通过提供正确的“放大”水平,有助于提高信噪比,而不影响管道下游步骤的检测能力。4)结合100次筛选得到的候选CDR3β序列,对p值和q值均小于0.05的CDR3β序列进行过滤,得到条件相关CDR3β序列。该方法同样适用于巨大的黄热病疫苗接种数据集(YFV和twinYFV),变化如下:a)执行步骤1至3的600次运行(而不是100次,以便全面评估所有样本中的所有克隆型),每个运行中每个样本有5000个CDR3β序列的子样本,b)只执行基于核苷酸4-mer的分析。使用下采样数据重复运行该方法的步骤1至3所选择的数字允许对每个数据集中几乎所有克隆类型的详尽评估(附加文件gydF4y2Ba1gydF4y2Ba:图8 s)。gydF4y2Ba

附加文件的补充信息部分给出了与CDR3相关的检测条件的数据集、基准测试和特征的详细说明gydF4y2Ba1gydF4y2Ba.gydF4y2Ba

数据和材料的可用性gydF4y2Ba

CD PBMC和CD Gut数据集在该方法的R实现中是可用的示例数据集gydF4y2Bahttps://github.com/Greco-Lab/RepAngydF4y2Ba.可以从免疫曲线访问YFV PBMC数据集(可提供:gydF4y2Bahttp://adaptivebiotech.com/pub/dewitt-2015-jvigydF4y2Ba).可以从Pogorellyy等人获得双YFV PBMC数据集gydF4y2Ba.gydF4y2Ba发布的GitHub存储库(gydF4y2Bahttps://github.com/mptouzel/pogorelyy_et_al_2018gydF4y2Ba).gydF4y2Ba

缩写gydF4y2Ba

CD:gydF4y2Ba

乳糜泻gydF4y2Ba

CD肠道:gydF4y2Ba

研究中使用的腹腔疾病肠道活检曲线数据集gydF4y2Ba

CD PBMC:gydF4y2Ba

研究中使用的乳糜泻PBMC数据库gydF4y2Ba

CDR1:gydF4y2Ba

互补确定区域1gydF4y2Ba

CDR2:gydF4y2Ba

互补确定区域2gydF4y2Ba

CDR3上:gydF4y2Ba

互补确定区域3gydF4y2Ba

CDR3上β:gydF4y2Ba

链上的互补决定区域3gydF4y2Ba

罗斯福:gydF4y2Ba

错误发现率gydF4y2Ba

HLA:gydF4y2Ba

人类白细胞抗原gydF4y2Ba

MHC:gydF4y2Ba

主要的组织相容性复合物gydF4y2Ba

pMHC:gydF4y2Ba

主要组织相容性复合体的肽结合gydF4y2Ba

RepAn:gydF4y2Ba

曲目差分丰度分析,报告的方法的名称gydF4y2Ba

RepSeq:gydF4y2Ba

深入的下一代曲目排序gydF4y2Ba

识别:gydF4y2Ba

T细胞受体gydF4y2Ba

TRBD:gydF4y2Ba

t细胞受体β链多样性基因gydF4y2Ba

TRBJ:gydF4y2Ba

t细胞受体-链连接基因gydF4y2Ba

TRBV:gydF4y2Ba

t细胞受体β链可变基因gydF4y2Ba

双胞胎YFV PBMC:gydF4y2Ba

研究中使用的双黄热病疫苗接种库数据集gydF4y2Ba

YFV PBMC:gydF4y2Ba

研究中使用的黄热病疫苗接种库数据集gydF4y2Ba

YFV:gydF4y2Ba

黄热病病毒gydF4y2Ba

β链:gydF4y2Ba

β链gydF4y2Ba

参考文献gydF4y2Ba

  1. 1.gydF4y2Ba

    Benichou J, Ben-Hamo R, Louzoun Y, Efroni S. Rep-Seq:通过下一代测序揭示免疫系统。免疫学,2012;135(3):183 - 91。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  2. 2.gydF4y2Ba

    Vanhanen R, Heikkilä N, Aggarwal K, Hamm D, Tarkkila H, Pätilä T,等。人类胸腺中T细胞受体的多样性。摩尔Immunol。2016;1(76):116 - 22所示。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  3. 3.gydF4y2Ba

    齐强,刘勇,程勇,张东,李建勇,等。人类t细胞库的多样性和克隆选择。中国科学院院刊。2014;111(36):13139-44。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  4. 4.gydF4y2Ba

    文丘里V,普莱斯,杜雷克DC,达文波特议员。公众t细胞反应的分子基础是什么?中国免疫学杂志。2008;8(3):231-8。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  5. 5.gydF4y2Ba

    李华,叶春,季光。公共T细胞应答的决定因素。细胞研究》2012;22(1):33-42。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  6. 6.gydF4y2Ba

    Benati D,Galperin M,Lambotte O,Gras S,Lim A,Mukhopadhyay M等。公共T细胞受体赋予HIV控制器的高硅酸CD4反应。J Clin Invest。2016; 126(6):2093-108。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  7. 7.gydF4y2Ba

    王志强,王志强,王志强,等。T细胞反应的全系统分析。细胞众议员2016;14(11):2733 - 44。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  8. 8。gydF4y2Ba

    Madi A,Shifrut E,Reich-Zeliger S,Gal H,Best K,Ndifon W等人。T细胞受体曲目分享与自相关免疫相关的限制公众和丰富的CDR3序列集。Genome Res。2014; 24(10):1603-12。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  9. 9。gydF4y2Ba

    Yohannes DA、Freitag TL、de Kauwe A、Kaukinen K、Kurppa K、Wacklin P等。血液和肠道T细胞受体β链的深度测序揭示了麸质诱导的腹腔疾病免疫特征。Sci代表2017;7(1):17977.gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  10. 10.gydF4y2Ba

    胡建平,王志强,王志强,等。免疫序列识别巨细胞病毒暴露史的特征和hla介导的T细胞库效应。49 Nat麝猫。2017;(5):659 - 65。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  11. 11.gydF4y2Ba

    Pogorelyy MV, Minervina AA, Chudakov DM, Mamedov IZ, Lebedev YB, Mora T,等。条件相关公共抗原受体序列的鉴定方法。Elife。2018;7:e33050。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  12. 12.gydF4y2Ba

    Risnes LF, Christophersen A, Dahal-Koirala S, Neumann RS, Sandve GK, Sarna VK,等。导致疾病的CD4+ T细胞克隆型在腹腔疾病中持续了数十年。[J] .中国临床医学杂志,2018;gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  13. 13.gydF4y2Ba

    等。细胞毒性T细胞对急性病毒感染模型的反应动力学。J微生物学报。2015;89(8):4517 - 26所示。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  14. 14.gydF4y2Ba

    李志强,李志强,李志强,等。以提高临床相关外周血扩增T细胞识别的特异性。PLoS ONE。2019; 14 (3): e0213684。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  15. 15.gydF4y2Ba

    Pogorelyy MV, Minervina AA, Shugay M, Chudakov DM, Lebedev YB, Mora T,等。从单个曲目快照中检测参与免疫反应的T细胞受体。公共科学图书馆杂志。2019;17 (6):e3000314。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  16. 16.gydF4y2Ba

    Pogorelyy MV、Minervina AA、Touzel MP、Sycheva等、Komech EA、Kovalenko EI等。精确追踪疫苗反应性T细胞克隆可揭示同卵双胞胎的聚合反应和个性化反应。自然科学进展。2018;115(50):12704–9.gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  17. 17.gydF4y2Ba

    乔S-W,Ráki M,Gunnarsen KS,Løset G-Å,Lundin KE,Sandlie I,等。麸质的翻译后修饰决定了TCR在乳糜泻中的使用。免疫杂志。2011;187(6):3064–71.gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  18. 18。gydF4y2Ba

    乔思伟,克里斯托夫森A, Lundin KEA, Sollid LM。腹腔疾病中免疫显性谷蛋白表位特异性tcr α-和β-链的偏用和首选配对Int Immunol。2013;26:13-9。gydF4y2Ba

    PubMedgydF4y2Ba文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  19. 19。gydF4y2Ba

    Agathangelidis A, Darzentas N, Hadzidimitriou A, Brochet X, Murray F, Yan X- j, et al.;三分之一慢性淋巴细胞白血病的刻板b细胞受体:一种具有靶向治疗意义的分子分类血。2012;119(19):4467 - 75。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  20. 20.gydF4y2Ba

    Darzentas n,Stamatopoulos K. b细胞白血病和淋巴瘤中的刻板B细胞受体。方法Mol Biol Clifton NJ。2013; 971:135-48。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  21. 21.gydF4y2Ba

    Dash P,Fiore-Gartland Aj,赫兹T,王GC,Sharma S,Souquette A等。可量化的预测特征定义表位特异性T细胞受体曲目。自然。2017; 547:89-93。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  22. 22.gydF4y2Ba

    黄海峰,黄海峰,黄海峰,等。识别T细胞受体库中的特异性组。大自然。2017;547(7661):94 - 8。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  23. 23.gydF4y2Ba

    Broughton Se,Petersen J,Theodossis A,Scally SW,LOH KL,Thompson A等。针对人白细胞抗原DQ8限制的胶质苷肽的偏置T细胞受体用途与乳糜泻有关。免疫。2012; 37(4):611-21。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  24. 24.gydF4y2Ba

    贾布里B,索利德LM。腹腔疾病中的T细胞。巴尔的姆免疫杂志1950.2017;198(8):3005–14.gydF4y2Ba

    中科院gydF4y2Ba谷歌学术gydF4y2Ba

  25. 25.gydF4y2Ba

    汉A,Newell EW,Glanville J,Fernandez-Becker N,Khosla C,Chien Y-H等人。膳食麸质触发CD4 +和CD8+αβT细胞和γδT细胞在腹菌疾病中伴随着激活。美国国家科学院学报。2013; 110(32):13073-8。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  26. 26.gydF4y2Ba

    等。关键词:生物力学,光子学报,蒙特serrat V, Mujico JR, Loh KL, Beringer DX, van Lummel, et al。与乳糜泻相关的hla - dq2 -麦胶蛋白复合物的t细胞受体识别中国生物医学工程学报。2014;21(5):480-8。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  27. 27.gydF4y2Ba

    Hovhannisyan Z,Weiss A,Martin A,Wiesner M,Tollefsen S,Yoshida K,等。HLA-DQ8β57多态性在乳糜泻抗麸质T细胞反应中的作用。自然。2008; 456(7221):534-8。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  28. 28.gydF4y2Ba

    Dahal-Koirala S, Risnes LF, Christophersen A, Sarna VK, Lundin KE, Sollid LM, et al.;对DQ2.5-glia-α2和DQ2.5-glia-ω2反应的单个细胞的TCR测序显示克隆扩增和表位特异性v基因的使用。粘膜Immunol。2016;9(3):587 - 96。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  29. 29.gydF4y2Ba

    Thomas N,最佳K,Cinelli M,Reich-Zeliger S,Gal H,Shifrut E等人。通过使用短延伸的CDR3蛋白质序列免疫,跟踪CD4 T细胞受体曲目中诱导的全局变化。Bioinforma Oxf Engl。2014; 30:3181-8。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  30. 30.gydF4y2Ba

    基于遗传算法的蛋白质序列度量问题。美国国家科学院学报。2005; 102(18): 6395 - 400。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  31. 31.gydF4y2Ba

    王志强,王志强,王志强,等。学习预测公共和私人抗体库的高维免疫基因组特征。J Immunol。2017;199(8):2985 - 97。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  32. 32.gydF4y2Ba

    吴海涛,刘志刚,刘志刚,等。黄热病病毒疫苗诱导广泛和多功能的人类记忆CD8+ T细胞应答。J Immunol。2009;183(12):7919 - 30。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  33. 33.gydF4y2Ba

    De Melo Ab,Nascimento Ejm,Braga-Neto U,Dhalia R,Silva Am,Oelke M,等。黄热疫苗引起的T细胞记忆响应靶向含有多个HLA-1和-II结合基序的重叠表位。Plos opprop top ten。2013; 7(1):1938。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  34. 34.gydF4y2Ba

    分子t细胞库分析作为检查点阻断免疫治疗的预后和预测性生物标志物的来源。中国生物医学工程学报。2020;21(7):2378。gydF4y2Ba

    中科院gydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2BaPubMedgydF4y2Ba谷歌学术gydF4y2Ba

  35. 35.gydF4y2Ba

    McPAS-TCR:病理相关T细胞受体序列的手工整理目录。生物信息学报。2017;33(18):2924-9。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  36. 36.gydF4y2Ba

    Shugay M,Bagaev Dv,Zvyagin IV,耐族人Rm,Crawford JC,Dolton G等人。VDJDB:具有已知抗原特异性的T细胞受体序列的策划数据库。核酸RES。2018; 46(D1):D419-27。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  37. 37.gydF4y2Ba

    Gielis S, Moris P, bittreieux W, De Neuter N, Ogunjimi B, Laukens K, et al.;检测全T细胞受体序列中富集的T细胞表位特异性。前面Immunol》2019。gydF4y2Bahttps://doi.org/10.3389/fimmu.2019.02820/fullgydF4y2Ba.gydF4y2Ba

    文章gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba谷歌学术gydF4y2Ba

  38. 38.gydF4y2Ba

    Robins HS、Campregher PV、Srivastava SK、Wacher A、Turtle CJ、Kahsai O等。α-βT细胞中T细胞受体β链多样性的综合评估。血。2009;114(19):4099–107.gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  39. 39.gydF4y2Ba

    马梅多夫·伊兹,普丁采娃·伊夫等。MiXCR:综合自适应免疫分析软件。Nat方法。2015;12(5):380 - 1。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  40. 40。gydF4y2Ba

    基于MetaBAT技术的复杂微生物群落单基因组精确重建。PeerJ。2015; 27 (3): e1165。gydF4y2Ba

    文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  41. 41。gydF4y2Ba

    Papudeshi B, Haggerty JM, Doane M, Morris MM, Walsh K, Beattie DT,等。优化和评价宏基因组组装的微生物基因组的重建。BMC基因组学。2017;18(1):915。gydF4y2Ba

    PubMedgydF4y2Ba公共医学中心gydF4y2Ba文章gydF4y2Ba中科院gydF4y2Ba谷歌学术gydF4y2Ba

  42. 42.gydF4y2Ba

    Metagenomic装箱。适用于:地球和环境科学中的基因组方法。奇切斯特:威利;2018.p . 89 - 99。gydF4y2Bahttps://doi.org/10.1002/9781118708231.ch7gydF4y2Ba.gydF4y2Ba

  43. 43.gydF4y2Ba

    张斌,张立军。基于层次聚类树的聚类定义:动态树切割包。生物信息学学报。2008;24(5):719-20。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  44. 44.gydF4y2Ba

    Breitling R, Armengaud P, Amtmann A, Herzyk P. Rank产品:一种在重复微阵列实验中检测差异调控基因的简单而强大的新方法。573年2月。2004;(1 - 3):83 - 92。gydF4y2Ba

    中科院gydF4y2BaPubMedgydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  45. 45.gydF4y2Ba

    TK。随机森林的决定。见:文件分析和确认,1995年,第三次国际会议记录。IEEE;1995.p . 278 - 82。gydF4y2Ba

  46. 46.gydF4y2Ba

    刘志强,刘志强。基于随机森林的分类与回归。R新闻。2002;2(3):在18到22岁的。gydF4y2Ba

    谷歌学术gydF4y2Ba

下载参考gydF4y2Ba

确认gydF4y2Ba

我们感谢Anne Heimonen,Marja-Terttu Oksanen,Hanne Ahera和Andrea de Kauwe为患者招聘,样品收集和处理以及实验室工作的帮助。我们还感谢Rigbe G. Weldatsadik进行有用的讨论和验证稿件。我们承认CSC-IT科学芬兰科学中心,以提供计算资源。gydF4y2Ba

资金gydF4y2Ba

这项工作得到了芬兰科学院、欧洲委员会(居里夫人卓越奖)、西格丽德·尤塞利乌斯基金会、芬兰国家科学院和欧洲委员会的支持。坦佩雷大学医院专家领域竞争状态研究融资以及由tekes——芬兰技术和创新资助机构资助的SalWe智能监测和GET IT DONE研究项目。资助人在研究设计、数据收集、分析、解释和手稿的最终准备中没有作用。gydF4y2Ba

作者信息gydF4y2Ba

从属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

学习理念与设计:DAY, DG, PS;研究样本的获取,技术和材料支持:KK, KK, PS;数据采集:PS、DAY;数据分析和解释:DAY, PS, DG;计算管道设计与统计分析:DAY, DG;管道实现:一天;稿件起草:DAY, DG, PS;手稿的关键修改:DG, PS, KK, KK;学习监督:PS & DG。所有作者阅读并批准了最终的手稿。gydF4y2Ba

相应的作者gydF4y2Ba

对应到gydF4y2Ba达里奥格雷科gydF4y2Ba.gydF4y2Ba

道德声明gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

对于乳糜泻数据库CD PBMC和CD Gut,研究设计和患者招募得到了芬兰Pirkanmaa医院区伦理委员会的批准。所有受试者均给予书面知情同意。黄热病疫苗接种库数据集是可公开获得的数据,可以像我们目前的方法那样进行重新分析。gydF4y2Ba

同意出版gydF4y2Ba

不适用。gydF4y2Ba

利益争夺gydF4y2Ba

两位作者宣称他们没有相互竞争的利益。gydF4y2Ba

附加信息gydF4y2Ba

出版商的注意gydF4y2Ba

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。gydF4y2Ba

补充信息gydF4y2Ba

额外的文件1gydF4y2Ba

.补充资料、表格和数字。gydF4y2Ba

额外的文件2gydF4y2Ba

. 所有四个数据集中与CDR3相关的所有检测条件的完整列表。gydF4y2Ba

权利和权限gydF4y2Ba

开放获取gydF4y2Ba本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.创作共用及公共领域专用豁免书(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本文提供的数据,除非在数据的信贷额度中另有说明。gydF4y2Ba

重印和许可gydF4y2Ba

关于这篇文章gydF4y2Ba

通过交叉标记验证货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

约翰内斯,K.考基宁库尔帕地检官。gydF4y2Baet al。gydF4y2Ba基于聚类的群体级鉴定条件相关的T细胞受体β-Clion CDR3序列的方法。gydF4y2Ba欧宝娱乐合法吗22,gydF4y2Ba159(2021)。https://doi.org/10.1186/s12859-021-04087-7.gydF4y2Ba

下载引文gydF4y2Ba

关键字gydF4y2Ba

  • TCR差异丰度分析gydF4y2Ba
  • 乳糜泻相关TCR ClonotypesgydF4y2Ba
  • 免疫能力分析gydF4y2Ba
  • TCR曲目分析gydF4y2Ba
  • 免疫信息学gydF4y2Ba
  • 抗原细胞识别gydF4y2Ba
  • 计算antigen-specificity识别gydF4y2Ba
  • 识别聚类gydF4y2Ba
\gydF4y2Ba