跳到主要内容gydF4y2Ba

DualmarkergydF4y2Ba:灵活的工具集,用于组合双生物标志物进行临床疗效的探索性分析gydF4y2Ba

摘要gydF4y2Ba

背景gydF4y2Ba

越来越多的临床试验需要生物标志物驱动的患者分层,特别是对于革命性的免疫检查点阻断治疗。由于肿瘤与其微环境之间的复杂相互作用,单一生物标志物,例如PDL1蛋白水平,肿瘤突变负担(TMB),单一基因突变和表达,远非令人满意的响应预测或患者分层。最近,据报道,组合生物标志物对于预测治疗响应和鉴定具有优异生存的潜在目标群体,更加精确和强大。然而,这种组合生物标志物分析缺乏专用工具。gydF4y2Ba

结果gydF4y2Ba

在这里,我们提出gydF4y2BadualmarkergydF4y2Ba,一个R包,旨在促进双生物标记物组合的数据探索。给定两个生物标记物,gydF4y2BadualmarkergydF4y2Ba全面可视化它们与通过14种情节,如盒形图,散点图,ROCS,和Kaplan-Meier曲线的药物反应和患者存活的关联。使用逻辑回归和Cox回归模型,gydF4y2BadualmarkergydF4y2Ba通过比较双标记与单标型号的数据适合度来评估单标记上的双标记的优越性,这些标记模型用于De Novo寻找新的生物标记对。我们通过使用来自一个膀胱癌患者队列(IMVigor210研究)的公共生物标志物数据来证明了这种直接的工作流程和综合能力;我们确认先前报道的生物标志物对TMB / TGF-β签名和CXCL13表达/ ARID1A突变分别用于响应和存活分析。此外,gydF4y2BadualmarkergydF4y2Ba从头确定了新的生物标记物伙伴,例如,在总体生存模型中,HMGB1表达和ARID1A突变相结合的模型在统计学上比HMGB1或ARID1A作为单一标记物的模型具有更好的拟合优度。gydF4y2Ba

结论gydF4y2Ba

的gydF4y2BadualmarkergydF4y2Ba包是用于组合双重生物标记物的可视化和鉴定的开放源码的工具。它简化了双重标记分析流入用户友好的功能,可用于数据探索和假设产生。它的代码是免费提供在GitHub上的gydF4y2Bahttps://github.com/maxiaopeng/dualmarker.gydF4y2Ba根据麻省理工学院执照。gydF4y2Ba

背景gydF4y2Ba

随着生物标志物检测技术的快速发展,在回顾性研究或透视试验中已经确定并验证了越来越多的单一预测性或诊断生物标志物。例如,在免疫检查点封闭(ICB)的革命领域[gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3.gydF4y2Ba此类生物标志物包括PDL1蛋白质水平,基因表达分析(GEP),基因突变和肿瘤突变负荷(TMB)。然而,癌症发育与涉及多种生物过程的复杂的肿瘤微环境(TME)和肿瘤/ TME相互作用有关[gydF4y2Ba1gydF4y2Ba],如肿瘤增殖,细胞凋亡和血管生成。实际上,每个单一生物标志物只能反映这些复杂的肿瘤和免疫特征的一个小方面。到目前为止,没有为ICB治疗的患者分层开发了单个完美的标记[gydF4y2Ba2gydF4y2Ba].gydF4y2Ba

通常,需要考虑不同TME影响组件的组合生物标志物策略[gydF4y2Ba3.gydF4y2Ba]. 近年来已鉴定出几种组合生物标志物。例如,在一项泛癌研究中,TMB和T细胞炎症基因表达谱(TIS)的组合能够预测对彭布罗利珠单抗的反应[gydF4y2Ba4gydF4y2Ba].在Imvigor210试验中,TMB加tgf - β基因标记预测尿路上皮癌(UC)对atezolizumab的应答[gydF4y2Ba5gydF4y2Ba].第三项使用相同数据集的研究发现,AIRD1A突变结合CXCL13基因表达预测总生存期(OS) [gydF4y2Ba6gydF4y2Ba].在所有这些研究中,组合双标记在预测反应和生存方面都优于单一标记。gydF4y2Ba

R语言及其强大的统计和数据可视化软件包被广泛应用于生物标志物数据分析,包括gydF4y2Ba生存gydF4y2Ba和gydF4y2BaSURVMINER.gydF4y2Ba[gydF4y2Ba7gydF4y2Ba为生存分析和gydF4y2BagClinBiomarkergydF4y2Ba[gydF4y2Ba8gydF4y2Ba]对于单变量的生物标志物分析。但是,我们的知识不可用双生物标志物分析的工具。gydF4y2Ba

在这里,我们描述gydF4y2BadualmarkergydF4y2Ba,一种用于组合双标记可视化和识别的灵活工具集。gydF4y2BadualmarkergydF4y2Ba通过两个不同的模块进行双重标记分析,一个用于深入评估一个特定的生物标志物对,另一个用于生物标志物对的从头鉴定。这两个模块都适用于使用逻辑回归和Cox生存模型的分类和连续生物标志物。我们在此使用来自IMvigor210临床研究的公共生物标志物数据来证明它的应用[gydF4y2Ba5gydF4y2Ba通过验证报告的生物标记对和新型对的鉴定。gydF4y2Ba

实现gydF4y2Ba

概述gydF4y2Ba

DualmarkergydF4y2Ba评估生物标志物与临床疗效之间的相关性,包括二元结果(例如药物反应)和存活数据。它可以通过全面的可视化和统计分析来评估特定的生物标志物对,并从所有双重标记组合搜索新型对;它还可以通过逻辑回归和Cox回归模型与所选择的Marker1(M1)组合搜索第二标记伙伴,即Marker2(M2)(图。gydF4y2Ba1gydF4y2Ba).响应状态应该是二分以适应逻辑回归模型,和MARKER1或MARKER2可以是一个连续的变量(例如,TMB,基因表达)或二分变量(例如,基因突变,突变的或野生型)。有超过2级有序变量在目前的版本不支持。连续变量直接用于逻辑/ Cox回归模型,并且它们被二分的高和低的水平,使用该群体中值作为截止或用户指定的值,以便于可视化。的两个标记的二分法和组合产生四个亚组,每个位于一个象限,标记为R1-R4具有专用颜色在所有曲线图(图gydF4y2Ba1gydF4y2Ba).gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba

框架gydF4y2Ba双马市场。DualmarkergydF4y2Ba包含两部分:一个特定标记对的可视化和生物标志物对的生物标记对(治疗反应,左上面板)和时间 - 事件结果(存活,左下面板)。为了促进可视化,两个标记都与具有四个象限的正/高和负/低群体分成正/高,负面/低群体,标有专用颜色的R1-R4。两个标记都显示在散点图或Kaplan-Meier Plot(kaplan-meier plot(kaplot)中,参见图4和图5中的详细图。gydF4y2Ba2gydF4y2Ba和gydF4y2Ba3.gydF4y2Ba),以及所有的图可以很容易地由单个函数产生:gydF4y2Badm_pairgydF4y2Ba.对于双标记对从头鉴定,四个逻辑回归模型或Cox回归模型取决于是否进行响应或存活分析建立的:两个单标记模式和两个双标记模型与相互作用(M1 * M2)或无interaction (M1 + M2). To control any covariates, ‘cov’ option can also be added in the model. Each candidate is evaluated by model comparison, which compares the dual-marker models with the single ones using the likelihood ratio test (LRT). The -log10pgydF4y2Badual-vs-marker1和dual-vs-marker2的模型比较值显示为散点图,每个点代表一对候选生物标记物(参见图中的详细图)。gydF4y2Ba4gydF4y2Ba);分析由gydF4y2Badm_searhM2_logit/coxgydF4y2Ba和gydF4y2Badm_combM_logit /考克斯gydF4y2Ba用于搜索Marker2以与特定的Marker1组合或在标记对的所有组合中进行搜索gydF4y2Ba

可视化gydF4y2Ba

DualmarkergydF4y2Ba提供双重标记的全面可视化,并揭示其与响应和生存的关联。对于响应分析,Boxpots说明响应和单个标记之间的相关性(图。gydF4y2Ba2gydF4y2Ba一个),和一个散点图示出了标记物间相关性(图gydF4y2Ba2gydF4y2Bab).反过来,ROC曲线、AUC和置信区间显示了单标志物反应预测和双标志物logistic回归模型的表现(图)。gydF4y2Ba2gydF4y2Bac) 。此外,一系列四象限图显示了组/象限大小和每个组/象限的响应率,包括面积比例图(图。gydF4y2Ba2gydF4y2Bad) ,象限统计矩阵(图。gydF4y2Ba2gydF4y2Bae)所示,环形曲线图(图gydF4y2Ba2gydF4y2Baf)和一个线路图(图gydF4y2Ba2gydF4y2BaG,详细描述见图例)。对于生存分析,Kaplan-Meier plot (KMplot)描述了四个组/象限中单个标记和双标记的生存情况gydF4y2BapgydF4y2Ba由日志秩测试确定的值(图。gydF4y2Ba3.gydF4y2BaA-C)。条件KMplots代表MARKER1对MARKER2水平(阳性/高或负/低)和MARKER2对MARKER1水平的条件(图1中的存活曲线的条件的存活曲线。gydF4y2Ba3.gydF4y2Bag),在Marker2水平的背景下揭示生存和Marker1之间的关联,反之亦然。另外,相似的四象限图显示了面积比例图表(图)群/象限尺寸,中值存活时间和95%置信区间(图。gydF4y2Ba3.gydF4y2Bad) ,象限统计矩阵(图。gydF4y2Ba3.gydF4y2Bae)和折线图(图。gydF4y2Ba3.gydF4y2Baf、 无花果。gydF4y2Ba3.gydF4y2Ba图例包含每个图表的详细描述)。响应和生存可视化都很容易执行gydF4y2Badm_pairgydF4y2Ba功能,它将同时生成超过14个绘图。此外,还有灵活的选项gydF4y2Badm_pairgydF4y2Ba调整标签,标题以及领先的科学期刊所要求的调色板的颜色方案(通过R包gydF4y2BaGGSCI.gydF4y2Ba[gydF4y2Ba9gydF4y2Ba])或根据客户规格。综上所述,这组图表以直观和全面的方式揭示了反应和生存这两个标记之间的潜在关联。gydF4y2Ba

图2gydF4y2Ba
图2.gydF4y2Ba

使用TMB(marker1)和TGF-β信号(marker2)演示用于反应分析的生物标记物对。箱线图显示了生物标记物的分布(左:TMB;右图:TGF-β(按反应组划分)(阳性与阴性);Wilcoxon试验用于比较每个生物标记物的反应组(gydF4y2Ba一个gydF4y2Ba).散点图显示了与代表响应类别的颜色之间的标记间相关性,红色表示为正(gydF4y2BabgydF4y2Ba).ROC曲线使用logistic回归模型描述单标记物和双标记物的表现,无论是否标记物相互作用。曲线上也显示了AUC及其置信区间(gydF4y2BacgydF4y2Ba).将样品分层成4组/象限,显示每个组的统计数据(gydF4y2BadgydF4y2Ba- - - - - -gydF4y2BaggydF4y2Ba).面积比例图显示了两个标记的群体大小和Fisher精确检验的独立性(gydF4y2BadgydF4y2Ba).象限统计矩阵呈现组大小,响应率和置信区间(gydF4y2BaegydF4y2Ba). 甜甜圈图显示了相对组大小(环的宽度)和响应率(红弧分数,gydF4y2BafgydF4y2Ba). 折线图显示了每个象限/组的应答率以及两个标记之间的潜在统计交互作用,即,如果两条线交叉(gydF4y2BaggydF4y2Ba).通过生成所有数据gydF4y2BadualmarkergydF4y2Ba(v0.1.0)gydF4y2Ba

图3gydF4y2Ba
图3.gydF4y2Ba

展示一对标记物的生存分析,ARID1A突变(marker1)和CXCL13基因表达(marker2)。mut_ARID1A单个标记的KM图(gydF4y2Ba一个gydF4y2Ba)和cxcl13表达(由中位数切割,gydF4y2BabgydF4y2Ba)还有双重标记(gydF4y2BacgydF4y2Ba).使用Fisher精确测试的四个组大小和独立测试(gydF4y2BadgydF4y2Ba),每个组/象限中的中位存活时间和置信区间以矩阵显示(gydF4y2BaegydF4y2Ba)和曲线图(gydF4y2BafgydF4y2Ba).条件KM图显示了按mark1水平分层的mark2存活曲线(gydF4y2BaggydF4y2Ba,上图)以及Marker2级别的上下文中的Marker1(gydF4y2BaggydF4y2Ba,下2板)与gydF4y2BapgydF4y2Ba日志排名测试的值和调整gydF4y2BapgydF4y2Ba由“邦费罗尼”方法的值。通过生成所有数据gydF4y2BadualmarkergydF4y2Ba(v0.1.0)gydF4y2Ba

Logistic回归模型gydF4y2Ba

应用逻辑回归方法来预测反应的二元结果。不同的建模策略被认为是一次包括一个生物标志物,同时两种生物标志物和两个生物标志物的建模相互作用使用以下四个逻辑回归模型:Model1,RESP〜M1;Model2,RESP〜M2;Model3,RESP〜M1 + M2;和Model4,RESP〜M1 + M2 + M1:M2(交互项)。协变量也可以添加到模型中(图。gydF4y2Ba1gydF4y2Ba).进行模型比较以利用r的似然比测试(LRT)评估双标记的优势与单标记模型gydF4y2BaAnova.gydF4y2Ba函数。使用R包ROC/AUC评估生物标志物的应答者/非应答者分类的表现gydF4y2Ba司gydF4y2Ba[gydF4y2Ba10.gydF4y2Ba].gydF4y2Ba

COX生存模型gydF4y2Ba

采用Cox回归方法预测生存率。产生了四个Cox回归模型,类似于logistic回归模型。Cox模型设计的参数化部分如下:Model1, Surv ~ M1;模型2,Surv ~ M2;模型3,Surv ~ M1 + M2;模型4,Surv ~ M1 + M2 + M1:M2(交互作用)。协变量也可以添加到模型中(图。gydF4y2Ba1gydF4y2Ba).如上所述,使用R中实现的似然比测试(LRT)进行模型比较。使用R包使用辅助概率来评估事件风险分类的性能gydF4y2BaCPEgydF4y2Ba[gydF4y2Ba11.gydF4y2Ba].gydF4y2Ba

搜索Biomarker对gydF4y2Ba

基于一对生物标志物的表征,我们将范围扩展到Biomarker Partner搜索。使用上面的模型,我们搜索了标记M2,将标记M1与标记M1相结合gydF4y2Badm_searchm2_logit.gydF4y2Ba和gydF4y2Badm_searchm2_cox.gydF4y2Ba在双标记模型中具有显着改善的MARKER2S与单标记模型的模型拟合显着改善的功能。具有重要LRT测试的候选Marker2sgydF4y2BapgydF4y2Ba值显示在点图表中,显示符号-log10gydF4y2BapgydF4y2Ba值,因此标志是作为一个单一标志的反应或生存的标志2效应的方向(图。gydF4y2Ba4gydF4y2Bab) 。模型也可以考虑协变量(图。gydF4y2Ba1gydF4y2Ba)并调整gydF4y2BapgydF4y2Ba多重比较值。此外,我们将范围扩展到搜索所有生物标志物对,使用gydF4y2Badm_combm_logit.gydF4y2Ba和gydF4y2Badm_combm_cox.gydF4y2Ba职能。用户可以使用大量统计和模型性能指标进行过滤并获得有趣的双标记对,例如,用于二进制响应分析(Logistic回归),辅助概率估计(CPE)的AUC,用于生存分析(COX回归),gydF4y2BapgydF4y2Ba双对单模型比较的价值和两种标志物的统计交互作用等。总之,gydF4y2BadualmarkergydF4y2Ba包可以搜索有或没有给定标记的双标记对。gydF4y2Ba

图4gydF4y2Ba
图4.gydF4y2Ba

从基因表达到与mark1结合(mut_ARID1A)的从头鉴定mark2。将双标记的Cox回归模型与单独使用mark1和mark2的单标记模型进行比较。该-log10gydF4y2BapgydF4y2Ba模型间的LRT测试值分别在x轴和y轴上显示,虚线表示gydF4y2BapgydF4y2Ba值= 0.01(gydF4y2Ba一个gydF4y2Ba).顶部显著marker2s与根据LRT的双标记模型相对于mut_ARID1A单标记模型的模型比较的意义mut_ARID1A结合;虚线显示gydF4y2BapgydF4y2Ba值= 0.01和0.05(gydF4y2BabgydF4y2Ba). 提供带符号的-log10-p值,该符号是marker2作为单个标记对OS的影响方向。箭头指向已知的生物标记物伙伴CXCL13、IFNG和新基因HMGB1,它们显示了与mut_ARID1A的统计交互作用(gydF4y2BaC-êgydF4y2Ba). 按mut_ARID1A和HMGB1表达水平划分的四个象限/组(高与低,按人群中位数切割)的OS值有显著差异(gydF4y2BacgydF4y2Ba,gydF4y2BapgydF4y2Ba值= 0.0019,组间比较采用log-rank检验)。arid1a突变的患者在HMGB1高而HMGB1低的情况下OS延长(gydF4y2BadgydF4y2Ba).各象限/组的中位生存时间和置信区间(gydF4y2BaegydF4y2Ba)gydF4y2Ba

结果gydF4y2Ba

我们应用gydF4y2BadualmarkergydF4y2Ba分析IMvigor210试验的生物标志物数据[gydF4y2Ba5gydF4y2Ba,包括348例晚期UC患者PDL1 IHC基线特征、基因表达谱(GEP)、肿瘤突变负荷(TMB)和基因突变。为了简化论证,对于GEP,我们聚焦于HTG精密免疫肿瘤小组中列出的肿瘤微环境相关基因(1392)[gydF4y2Ba12.gydF4y2Ba].gydF4y2Ba

一种生物标志物对的响应分析gydF4y2Ba

我们探讨了先前报告的生物标志物对,TMB和TGF-β基因表达签名[gydF4y2Ba5gydF4y2Ba].响应者的TMB显着高于非响应者(Wilcoxon测试,gydF4y2BapgydF4y2Ba值= 1.1e-7),而TGF-β基因签名分数表明相反的趋势(Wilcoxon测试,gydF4y2BapgydF4y2Bavalue = 0.016, Fig.2gydF4y2Ba一种)。TMB和TGF-Beta签名之间存在弱负相关(图。gydF4y2Ba2gydF4y2BaB,Spearman相关性R = - 0.16,gydF4y2BapgydF4y2Ba值= 0.007)。使用群体中位数作为截止点,患者分为4组/象限,4组大小的比较显示TMB和TGF-Beta签名之间的弱依赖性(gydF4y2BapgydF4y2Bavalue = 0.06, Fisher exact test, Fig.2gydF4y2Bad)。的TMB-高/ TGF-β-低组(象限R4)有最高的反应率(43%,95%CI 0.3-0.56);的TMB-低/ TGF-β-高组(象限R2)具有最低反应率(4%,95%CI 0.01-0.12,图gydF4y2Ba2gydF4y2Ba例如)。这表明R2组在四组中对PDL1疗法最难治度。此外,应用逻辑回归模型以预测响应,并且两个生物标志物组合比单型TMB标记物(AUC = 0.754,95%CI 0.686-0.821为TMB * TGF-Beta模型,产生了更高的AUC值。与生物标志物相互作用相反0.728,95%CI 0.652-0.804用于单TMB标记模型,图。gydF4y2Ba2gydF4y2BaC)。此外,双重标记模型(具有标记相互作用)的使用LRT测试具有比TMB单标记模型更好地均匀gydF4y2BapgydF4y2Ba值= 0.0098)。gydF4y2Ba

一种生物标志物对的存活分析gydF4y2Ba

使用该对Arid1A突变和CXCL13基因表达作为实例进行双标记存活分析。据报道,该生物标志物对与OS相关联[gydF4y2Ba6gydF4y2Ba].我们证实ARID1A突变(mark1)患者的OS更长(gydF4y2BapgydF4y2Bavalue = 0.045, log-rank test, Fig.3.gydF4y2Ba一个;CXCL13 (marker2,人群中位数作为截止值)表达较高的患者OS也较长(gydF4y2BapgydF4y2Bavalue = 0.0016, log-rank test, Fig.3.gydF4y2Bab)。然后我们将人口分为四个群体/象限,并观察到存活率有显着差异(gydF4y2BapgydF4y2Bavalue = 0.0085, log-rank test for comparison of all groups, Fig.3.gydF4y2Bac), R1组(ARID1A-mut/CXCL13-high)的OS最长(中位数17.7,CI 9.23-NA), R3组(ARID1A-wt/CXCL13-low)的OS最短(中位数7.89,CI 5.52-9.86,图。gydF4y2Ba3.gydF4y2Bae) 。条件KM图进一步显示,与ARID1A mut中的CXCL13低组相比,CXCL13高组的OS更长(gydF4y2BapgydF4y2Ba值= 0.012,调整gydF4y2BapgydF4y2Ba值(Bonferroni)= 0.048,对数级测试)(图。gydF4y2Ba3.gydF4y2Bag、 上部2个面板)。同时,在CXCL13高和CXCL13低亚组中,ARID1A mut组显示出比ARID1A野生型组更长的OS趋势(图。gydF4y2Ba3.gydF4y2Ba克,降低2个图)。两个标记之间没有显著统计相互作用(图gydF4y2Ba3.gydF4y2Baf、 p值 = 0.4,双标记Cox模型中相互作用项的Wald检验)。除了描述性统计、可视化和双生物标记物亚组之间的比较外,Cox模型比较显示CXCL13/ARID1A双标记物模型比ARID1A单标记物模型对生存数据的拟合度显著更好(gydF4y2BapgydF4y2Ba值= 0.00047,似然比测试)和CXCL13单标记模型(gydF4y2BapgydF4y2Bavalue = 0.1, likelihood ratio test). The combination of these two biomarkers achieved a higher power of risk discrimination as suggested by the bigger CPE value of the dual marker (CPE is 0.583, 0.535 and 0.576 for dual-marker, ARID1A and CXCL13 single marker, respectively). Therefore, the combination of these two biomarkers might suggest improved patient characterization and stratification. All plots, statistic result of LRT, CPEs were generated by running single functiondm_pair。gydF4y2Ba

标记对的从头鉴定gydF4y2Ba

在gydF4y2BadualmarkergydF4y2Ba在美国,给定一个特定的标记物(M1),另一个生物标记物(M2)可以通过logistic回归进行反应状态分析和Cox模型进行生存分析重新确定。理想的双标记模型应优于单独的M1或单独的M2。因此,我们将双标记模型与M1和M2单标记模型进行比较。考虑了具有交互项和不具有交互项的双标记模型,以及具有较小交互项的模型gydF4y2BapgydF4y2Ba采用基于LRT测试的价值。意义水平(-log10gydF4y2BapgydF4y2Ba对于双VS-M1和双VS-M2模型比较的值示于图2中的散点图中。gydF4y2Ba4gydF4y2Ba一种。goswami s等人。报道了ARID1A突变和CXCL13表达的组合在基于生物假设的三个独立队列中预测OS [gydF4y2Ba6gydF4y2Ba].我们搜寻了与数据驱动的方式的ARID1A突变(mut_ARID1A)组合所有的基因表达生物标记物之间。使用gydF4y2Badm_searchm2_cox.gydF4y2Ba功能,我们确定了97个基因(gydF4y2BapgydF4y2Ba价值<0.01,LRT试验)作为双生物标志物合作伙伴候选者与Mut_arid1a组合,包括CXCL13和其他重要的免疫调节剂,如IFNG和CXCL9 / 10(图。gydF4y2Ba4gydF4y2Bab) 。这些基因代表炎症免疫信号,有助于ARID1A与总体生存率之间的关联。我们还发现一些标记,如HMGB1,当与ARID1A突变结合时,表现优于ARID1A或HMGB1单标记模型(gydF4y2BapgydF4y2Bavalue = 0.0012,pgydF4y2Ba价值 = 0.0003,似然比检验,图。gydF4y2Ba4gydF4y2Ba一种);同时,HMGB1表达显示出与ARID1A突变的有趣统计相互作用。在HMGB1高条件下,ARID1A突变的患者具有明显更长的操作系统(象限R1 VS R2,gydF4y2BapgydF4y2Ba值= 0.0015,对数级测试);然而,这种关联在HMGB1低群体中消失(象限R3 VS R4,图。gydF4y2Ba4gydF4y2Bad,pvalue = 0.48, log-rank test). The interaction term in the Cox model was also significant (pgydF4y2Ba值= 0.001,Wald检验),提示HMGB1在预测ARID1A突变的OS中可能具有重要作用。HMGB1与ARID1A之间的关系有待进一步验证和探索。我们展示了名义上的gydF4y2BapgydF4y2Ba这里的值,没有双重标记对之后是显着的(FDR <0.05)gydF4y2BapgydF4y2Ba使用“BH”方法的价值调整,可能欠数据集或检测的功率。但是,这样gydF4y2BapgydF4y2Ba基于价值的优先级策略可能在密集的研究和验证之前识别有趣的生物标记对。gydF4y2Ba

讨论gydF4y2Ba

生物标志物的组合可以通过精确表征的患者进一步分层增加疗效预测的用于癌症治疗的精度。这种分析还可能揭示小说洞察复杂的癌症TME互动和帮助通知的治疗策略。因此,对于双标记组合的探索性分析工具是用于简化本工作流程有价值。gydF4y2Ba

据我们所知,gydF4y2BadualmarkergydF4y2Ba是第一个用于双重标记分析的全面R包。gydF4y2BadualmarkergydF4y2Ba涉及多种灵活和易于使用的功能,双标记特征与两个模块,生成超过14种类型的图,以评估和可视化一个生物标志物对。在这里,我们展示了它在Imvigor210数据集的应用,并对TMB/TGF-beta标记和ARID1A-mut/CXCL13表达的生物标志物对示例的原始试验论文的结果进行了基准测试。此外,强大的双标记对搜索功能可以优先选择新的生物标记伙伴,与预先选择的标记(M1)结合使用。我们利用Cox生存模型结合ARID1A突变搜索与tme相关的关键GEP标记,并验证CXCL13和IFNG为首选。我们还发现了HMGB1表达和ARID1A突变之间一种新的具有统计学意义的相互作用,这表明具有ARID1A突变的患者仅在HMGB1高亚组中OS较长,而在HMGB1低亚组中OS较长(图)。gydF4y2Ba4gydF4y2Ba).这种相互作用需要进一步的验证研究。gydF4y2Ba

DualmarkergydF4y2Ba是一种强大的生物标志物数据挖掘的探索性工具。它简化了潜在的双标记的可视化和识别;其优势在于:(1)对箱形图、散点图、roc曲线和Kaplan-Meier图等14种类型的标记对进行全面可视化;(2)双指标组合的综合绩效评价。建立了四个回归模型,同时总结了模型参数;同时提供了综合的模型绩效评价,包括二元反应变量的ROC/AUC,时间-事件变量的一致性概率,logistic回归和Cox回归中双标记与单标记的模型比较。(3)没有预先假设的新的生物标志物对识别功能;(4)既适用于生存分析,又适用于反应分析;(5)用户友好,只有5个核心功能。反应和生存的双重标记可视化和统计的界面是gydF4y2Badm_pair,gydF4y2Ba这与连续(例如,基因表达,TMB)和分类(例如,突变,PDL1水平)变量相容。德诺诺格勒2识别通过gydF4y2Badm_searchm2_logit.gydF4y2Ba和gydF4y2Badm_serach_m2_cox.gydF4y2Ba对于物流和Cox回归;所有双生物标志物组合都可以使用gydF4y2Badm_combm_logit.gydF4y2Ba和gydF4y2Badm_combm_cox.gydF4y2Ba函数。可以找到详细的和最新的教程gydF4y2Bahttps://github.com/maxiaopeng/dualmarker.gydF4y2Ba.因此,我们期望广泛使用gydF4y2BadualmarkergydF4y2Ba在为精确的患者分层新颖的生物标志物组合的兴趣和探索生物标志物对评价的生物标志物研究以及行动和抵抗的研究机​​制。gydF4y2Ba

DualmarkergydF4y2Ba是为数据可视化和探索目的而设计的,但有一些限制。首先,它不能处理四种回归模型的预测因子与结果之间的非线性关联,这需要诸如限制三次样条等方法,可能会被包含在未来版本的软件包中。其次,回归模型可以包含协变量,但目前的模型无法处理协变量与生物标志物之间的相互作用。第三,该软件包不能处理序数变量,这需要预先二分类,并不能进行多重(> 2)标记分析。最后,从基因表达谱等数千个生物标志物中评估所有标记组合耗时较长,可以引入并行计算或其他方法来提高计算效率。gydF4y2Ba

结论gydF4y2Ba

一个新的开源软件工具包,包括R包gydF4y2BadualmarkergydF4y2Ba并附有教程。该软件包实现了logistic回归和Cox生存分析模型,数据可视化命令可以方便地应用于生物标志物对评估和新型生物标志物组合识别。gydF4y2Ba

可用性和要求gydF4y2Ba

  • 项目名:gydF4y2BadualmarkergydF4y2Ba

  • 项目主页:欧宝直播官网appgydF4y2Bahttps://github.com/maxiaopeng/dualmarker.gydF4y2Ba

  • 操作系统:平台独立gydF4y2Ba

  • 编程语言,RgydF4y2Ba

  • 其他要求:ggplot2, dplyr, pROC, survival, survminer, CPE, ggpubrgydF4y2Ba

  • 许可证:麻省理工学院执照gydF4y2Ba

  • 任何限制,使用非学者:没有限制gydF4y2Ba

可用性数据和材料gydF4y2Ba

DualmarkergydF4y2Ba是在MIT许可下通过链接免费获得的吗gydF4y2Bahttps://github.com/gydF4y2BaMaxiaOpeng / Dualmarker。支持本研究结果的数据可从IMVigor210研究中获得(gydF4y2Bahttp://research-pub.gene.com/IMvigor210CoreBiologies/gydF4y2Ba)具有创造性的共享3.0许可证。gydF4y2Ba

缩写gydF4y2Ba

AUC:gydF4y2Ba

曲线下的区域gydF4y2Ba

CPE:gydF4y2Ba

协和概率估计gydF4y2Ba

通用电气:gydF4y2Ba

基因表达谱gydF4y2Ba

ICB:gydF4y2Ba

免疫检查点封锁gydF4y2Ba

os:gydF4y2Ba

总生存率gydF4y2Ba

大鹏:gydF4y2Ba

接收器操作特征gydF4y2Ba

三甲:gydF4y2Ba

肿瘤突变负担gydF4y2Ba

工具书类gydF4y2Ba

  1. 1。gydF4y2Ba

    哈纳山D,Weinberg Ra。癌症的标志:下一代。细胞。2011; 144:646-74。gydF4y2Bahttps://doi.org/10.1016/j.cell.2011.02.013gydF4y2Ba.gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2BaPubMed.gydF4y2Ba公共医学中心gydF4y2Ba谷歌学术gydF4y2Ba

  2. 2。gydF4y2Ba

    Havel JJ,Chowell D,Chan TA。检查点抑制剂免疫治疗生物标志物的发展前景。纳特·雷夫癌症。2019;19:133–50.gydF4y2Bahttps://doi.org/10.1038/s41568-019-0116-x.gydF4y2Ba.gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2BaPubMed.gydF4y2Ba公共医学中心gydF4y2Ba谷歌学术gydF4y2Ba

  3. 3。gydF4y2Ba

    卡米奇博士,多贝尔区,克尔公里。比较和对比非小细胞肺癌免疫治疗和靶向治疗的预测性生物标志物。Nat Rev Clin Oncol。2019;16:341–55.gydF4y2Bahttps://doi.org/10.1038/s41571-019-0173-9.gydF4y2Ba.gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2BaPubMed.gydF4y2Ba谷歌学术gydF4y2Ba

  4. 4。gydF4y2Ba

    Cristescu R,Mogg R,Ayers M,Albright A,Murphy E,Granley J等。泛肿瘤基因组生物标志物,用于PD-1检查点封闭性的免疫疗法。科学。2018; 362:eaar3593。gydF4y2Ba

    文章gydF4y2Ba谷歌学术gydF4y2Ba

  5. 5。gydF4y2Ba

    MariaThasan S,Turley SJ,Nickles D,Castiglioni A,Yuen K,Wang Y等。TGFβ通过有助于排除T细胞来衰减对PD-L1阻断的肿瘤反应。自然。2018; 554:544-8。gydF4y2Bahttps://doi.org/10.1038/nature25501gydF4y2Ba.gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2BaPubMed.gydF4y2Ba公共医学中心gydF4y2Ba谷歌学术gydF4y2Ba

  6. 6。gydF4y2Ba

    Goswami S,Chen Y,Anandhan S,Szabo PM,Basu S,Blando JM等。ARID1A突变加上CXCL13表达作为组合生物标志物,以预测对MUCC中免疫检查点治疗的反应。sci翻译med。2020; 12:EABC4220。gydF4y2Ba

    中科院gydF4y2Ba文章gydF4y2Ba谷歌学术gydF4y2Ba

  7. 7。gydF4y2Ba

    alboukdel Kassambara, Marcin Kosinski PB。使用“ggplot2”绘制生存曲线。2020。gydF4y2Bahttps://cran.r-project.org/package=survminer.gydF4y2Ba.gydF4y2Ba

  8. 8。gydF4y2Ba

    Ning Leng,Alexey Prinin,Jemma Fan,Doug Kelkhoff,Christina Rabe Ko。Gclinbiomarker。2020。gydF4y2Bahttps://github.com/lengning/gclinbiomarker.gydF4y2Ba.gydF4y2Ba

  9. 9.gydF4y2Ba

    肖N.GCS:“GGPLOT2”的科学期刊和科幻主题调色板。2018年。gydF4y2Bahttps://cran.r-project.org/package=ggsci.gydF4y2Ba.gydF4y2Ba

  10. 10。gydF4y2Ba

    Robin X,Turck N,Hainard A,Tiberti N,Lisacek F,Sanchez J-C等人。proc:用于R和S +的开源包,用于分析和比较ROC曲线。BMC生物素。2011; 12:77。gydF4y2Ba

    文章gydF4y2Ba谷歌学术gydF4y2Ba

  11. 11.gydF4y2Ba

    千兴莫,弥漫的Gonen GH。CPE:生存分析中的一致性概率估计。2018年。gydF4y2Bahttps://cran.r-project.org/package=cpe.gydF4y2Ba.gydF4y2Ba

  12. 12.gydF4y2Ba

    来自HTG Edgeseq精密免疫肿瘤面板的TME相关基因。gydF4y2Bahttps://www.htgmolecular.com/assays/pip.gydF4y2Ba.gydF4y2Ba

下载参考gydF4y2Ba

致谢gydF4y2Ba

不适用。gydF4y2Ba

资金gydF4y2Ba

这项研究是由BeiGene资助的。资助开放存取费用:BeiGene。gydF4y2Ba

作者信息gydF4y2Ba

隶属关系gydF4y2Ba

作者gydF4y2Ba

贡献gydF4y2Ba

XM和PZ构想了这个想法gydF4y2Ba双马市场。gydF4y2BaXM开发了方法和R包。XM写了这篇文章。所有作者都阅读并批准了最终手稿。gydF4y2Ba

通讯作者gydF4y2Ba

通信gydF4y2Ba发源地马并且gydF4y2Ba.gydF4y2Ba

伦理宣言gydF4y2Ba

伦理批准和同意参与gydF4y2Ba

此处使用的数据先前已发布(Creative Commons-By-3.0许可),并在原始出版物中具有道德批准(PMC6028240)。gydF4y2Ba

同意出版gydF4y2Ba

不适用。gydF4y2Ba

相互竞争的利益gydF4y2Ba

作者是BeiGene的现任员工和股东。没有其他需要披露的利益冲突。gydF4y2Ba

附加信息gydF4y2Ba

出版商的注意事项gydF4y2Ba

欧宝体育黑玩家施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。gydF4y2Ba

权利和权限gydF4y2Ba

开放访问gydF4y2Ba本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问gydF4y2Bahttp://creativecommons.org/licenses/by/4.0/gydF4y2Ba.Creative Commons公共领域奉献豁免(gydF4y2Bahttp://creativecommons.org/publicdomain/zero/1.0/gydF4y2Ba)适用于本条中提供的数据,除非数据信用额度中另有规定。gydF4y2Ba

再版和权限gydF4y2Ba

关于这篇文章gydF4y2Ba

通过CrossMark验证货币和真实性gydF4y2Ba

引用这篇文章gydF4y2Ba

马旭,黄锐,吴旭。gydF4y2Ba等等。gydF4y2BaDualmarkergydF4y2Ba:灵活的工具集,用于组合双生物标志物进行临床疗效的探索性分析。gydF4y2Ba欧宝娱乐合法吗22,gydF4y2Ba127(2021)。https://doi.org/10.1186/s12859-021-04050-6gydF4y2Ba

下载引文gydF4y2Ba

关键词gydF4y2Ba

  • 组合双重生物标志物gydF4y2Ba
  • 物流回归gydF4y2Ba
  • COX模型gydF4y2Ba
  • R包gydF4y2Ba
\gydF4y2Ba