跳过主要内容

Velo-Predictor:用于RNA速度预测的集成学习管道

摘要

背景

RNA速度是一个新颖而强大的概念,它可以从看似静态的单细胞RNA测序(scRNA-seq)数据推断细胞状态的动态变化。然而,RNA速度的准确估计仍然是一个具有挑战性的问题,转录和剪接调控的潜在动力学机制尚不完全清楚。此外,与可能的细胞状态相比,scRNA-seq数据往往是稀疏的,给定的估计RNA速度数据集需要对一些尚未覆盖的细胞状态进行估算。

结果

我们制定RNA速度预测作为分类的第一次,其中,小区状态空间由方向如类分成相等大小的段的监督学习的问题,和所估计的RNA速度矢量被认为是基础事实。我们建议腭预测,合奏的学习管道从scRNA-seq的数据来预测RNA的速度。我们在两个真实数据集,腭预测表现出良好的性能,尤其是当XGBoost作为基本预测测试不同的车型。参数分析和可视化也表明,该方法是稳健的,并能够使生物有意义的预测。

结论

准确的结果表明,Velo-Predictor可以有效地简化过程,通过学习基因表达数据的预测模型,可以帮助构建一个连续的景观,给生物学家一个关于细胞动力学趋势的直观图像。

背景

高通量RNA测序技术的最新进展[1]在单细胞层面上使转录的分析[2,这为揭示基因表达调控的潜在机制提供了巨大的机会。然而,在许多情况下,细胞状态转移的动态信息是有限的。当测序完成时,表达数据仅提供一个细胞的快照[3.].目前,轨迹推断(包括伪时间分析)是识别细胞处于不同分化状态的主要任务[4.].通常,轨迹推断方法需要构造图形。例如,轨迹重建有各种方法。潜水[5.]基于分叉分析,气味[6.]和权杖[7.使用细胞状态熵的测量。普兰德[8.]和Topslam [9.]项目单元格与优化参数的景观。

大多数轨迹推断方法的一个主要限制[10它们没有将数据与潜在的分子动力学联系起来。La Manno等人发现,在标准单细胞RNA-seq协议中可以区分剪接和未剪接的mrna [11,发育过程中分化的时间尺度可与mRNA的典型半衰期相媲美。因此,我们可以利用mrna的丰度来估计剪接率和降解率。他们提出了一个简单的动力学框架来估计单个细胞mRNA水平的变化。这个框架是基于分子生物学的中心教条。Gorini和Maas提出了一阶微分方程来模拟这一生物过程[12], Zeisel等加入了中间步骤[13].

La Manno等人提出的RNA速度的原始稳态模型假设转录阶段持续的时间足够长,达到稳态平衡,平衡mRNA水平可以用一个共同的剪接率通过简化近似线性回归。最近,为了放宽这一假设,Volker Bergen等人提出了一种名为“scVelo”的算法[14],它包括一个随机模型,并且除了稳态模型动力学模型。随机模型将转录,剪接和降解概率事件,这意味着稳态水平近似不仅mRNA水平,而且从内在的表达变化。动力学模型考虑非固定的人口和整个基因不同剪接速率和动力学使用期望值最大化(EM)算法的最大似然框架解决。动态模型是速度较慢,但​​可以提供更一致的速度估计,更好地识别转录状态。

RNA速度的概念及其相关算法和模型在单细胞生物学中已经变得非常流行。然而,这项技术需要RNA测序协议的支持。此外,为了获取拼接信息,我们需要运行一个复杂的预处理管道,涉及文件格式问题,非常耗时。更重要的是,与未发现的细胞状态空间的大小相比,估计的RNA速度数据仍然是稀疏的。在这里,我们提出了一个集成学习管道预测RNA速度,可以跳过复杂的程序剪接分析等。当我们有来自相同生物背景的新数据样本时,我们可以从训练数据中的未知状态预测RNA速度的方向。这与行人预测相似[15在无人驾驶的交通系统中,或对篮球运动员在球场上下一步动作的预测[16].可以将所有的瞬时运动进一步组合成细胞的长轨迹。受Waddington的表观遗传景观概念的启发,表观遗传景观是细胞分化的经典隐喻,我们可以把细胞看作是通过电位表面向下滚动的球。基于预测的RNA速度和细胞轨迹,我们可以重建景观,作为一个直观的平台,单细胞数据可视化。

方法

速度估计

Velocyto Cli或Loompy / Kallisto用于获得拼接/未换读注释。我们通过小于阈值的计数数(拼接和未换算)过滤基因,保持顶部的高变性基因。然后在单元格级中规范化并进行对数变换。在欧几里德距离COMA的距离矩阵的PCA空间中,计算最接近的邻居图,为每个小区获得第一和第二矩。根据基本反应动力学:

$ ${对齐}\ \开始压裂{dU (t)} {dt} = &{} \α_ {k} (t) -β\ \ cdot U (t) \{对齐}$ $
(1)
$ ${对齐}\ \开始压裂{dS (t)} {dt} = &{} \β\ cdot U (t) - \伽马\ cdot S (t) \{对齐}$ $
(2)

在哪里S (t)代表成熟mRNA丰富随着时间的推移,U (t)代表前体mRNA丰度随着时间的推移,\α(\ \)是转录的速率,\(\ beta \)是剪接率,和\γ(\ \)是退化率。K.T.是特定于细胞的潜变量,在哪里K.表示离散的转录状态,和T.代表了潜在的时间。

RNA速度被称为成熟剪接mRNA的时间导数\ (v (t) = \压裂{dS (t)} {dt} \).中提供了scVelo三种方法做速度估计:稳态模型,随机模型和动态模型。它们之间的基本区别是,关于参数的假设是不同的。预处理步骤的数据示于算法1为了完整性和读者方便起见,我们已改写其的方法用于RNA速度估计到的伪代码描述。速度估算后,我们可以得到一个多维RNA速度矢量V.对于单个细胞的每个转录状态。结合这些信息,我们可以进一步推断单个细胞的细胞未来状态。这些运动可以被UMAP投影到低维度的嵌入中D.可视化。

figurea

问题陈述

我们的目标是根据每个细胞的基因表达数据预测其RNA速度载体。如二维空间所示,我们将其表述为一个分类问题,通过将一个二维圆等分为d个大小相等的分段,如图所示。1.如果预测的和原始目标方向落在相同的段,我们指望它作为真阳性等问题的稍微更现实的制剂可能是从一个固定的方向上的RNA速度的角度的回归。但是,我们会留下,作为今后的工作。

输入预处理

数字2显示我们工作的整个管道。我们从基因表达矩阵开始监督学习任务。单细胞基因组数据可能是稀疏的并且遭受技术噪声和偏差。因此,为了改善我们需要做出去噪的行为,或称为特征工程步骤。SCVI有几种方法可以如此[17], scVAE [18]及DCA [19].他们基本上使用自动编码器找到隐藏层与最小的重建误差。经过比较,我们采用ScVelo进行基因排序的特征选择。ScVelo排名是基于聚类特异性t检验来寻找差异速度显著高/低的基因,我们选择最高的K.每个聚类中的基因作为模型特征。我们使用低维嵌入R \ (D \ \ mathbf {} ^ {2 n} \)从速度估计步骤获得,作为我们的真相。

图1
图1

圆分区。分配D.通过二维圆平面等分割的分类标签。这里\ (d = 4 \)

图2
图2.

Velo-Predictor的总管道。该流程包括特征选择、模型训练和预测三个阶段

图3
图3.

堆叠模型的结构。K-fold交叉验证叠加,第一层包括XGBoost、Random Forest等作为基础模型。第二层(作为元分类器)是逻辑回归分类器

划分后,标签的分布不均衡。因此,我们提出了几种补救方法:过采样、下采样和联合采样。我们首先在不同的基础模型上测试不同的抽样方法。对于过采样,我们测试自适应合成(ADASYN) [20.],合成少数类过采样算法(SMOTE)21]和一些粉碎的变种,如边界线擦拭(BLS)[22]和SVM-中杀它使用支持向量机(SVM)[23].对于下采样,聚类中心(CC) [24],随机取样器下(RUS),接近小姐[25],重复编辑的最近邻居(renn)[26],邻里清洁规则(NCR)[27]及单方选择(OSS) [28使用)。然后,我们进一步测试了SMOTETomek的组合采样方法[29]和SMOTEENN [30.].

模型培训

我们将样本数据分为训练集和测试集。训练集用于模型训练,测试集用于模型评估。对于训练,保存参数,可以直接用于测试部分的预测。采用叠加结构模型。数字3.算法2显示细节。我们使用mlxtend [31]和巩膜 - 学习[32包的实现。我们选择随机森林(RF)、GBDT、额外树分类器(ET)、adaboost (ADA)和XGBoost模型作为第一层,第二层为简单Logistic回归分类器。为了避免过度拟合,我们使用交叉验证的概念将训练集划分为K.子集,其中\(K-1 \)子集用于适合第一层分类器。然后,在每轮中,将由拟合分类器预测未使用的子集,并且堆叠所有得到的预测以进入第二层。

figureb

结果

数据集

我们训练和测试两个单细胞转录组测序数据集模型。一个是小鼠海马齿状回神经发生(DGN)数据集[33来自NCBI基因表达综合(GEO),登录号为GSE95753。它由来自多个谱系的13913个基因和2930个细胞的RNA-seq数据组成。另一个数据集是胰腺内分泌发生(PE) [34]还可以从登录ID GSE132188下获得NCBI Geo,其包括从小鼠胚胎第15.5天取样的3,696个胰腺上皮和NGN3-Venus融合细胞的27,998个基因的转录水平。细胞数量和基因的数量(具有不同的值K.,从每个簇中选择的顶部基因的数量如表中所示1

表1数据统计

为了测试我们的模型的泛化能力,我们随机划分的细胞样本分成两个不相交的集合为7:3的比例,7培训和3进行测试。数字4.a表示DG数据集中标签的比例。

类不平衡问题

为了说明如何解决类别的不平衡问题,我们将DG数据集作为示例。数字4.A显示DG数据集的标记比例。数字4.b-d为不同抽样策略的ROC曲线及对应的AUC得分。AUC分数对于不平衡的数据是不够的,因此我们也考虑每一个类的精度和平衡分数作为度量。度量值可根据以下公式计算:

$$ \ begined {对齐}&pre(precision)= \ frac {tp} {tp + fp} \\&balancd \,score = \ frac {tpr + tnr} {2} \\ \ neg {aligned} $$
(3)

桌子2显示的每个方法最具代表性的表现。我们可以看到下降采样方法表现不佳,因为信息丢失的。过采样方法更好,但可能会产生一些偏差。最好的办法是把它们结合起来。因此,我们选择SMOTETomek作为我们DG数据集的最终选择。

表2不同采样方法下随机森林在DG数据集上的性能

功能分析

通过网格搜索进行参数微调后,见图。5.可视化的基础模型和堆叠模型的性能。数字6.A显示第一折叠的损耗曲线,其他折叠的行为是相似的。XGBoost模型还可以提供日志损耗曲线和从数据学习的最重要的基因(图。6.b)。超参数的影响K.顶级基因的数量D.数字类如图1所示。7.湾范围K.控制特征选择部分。曲线首先和之后升起K.达到20,开始振荡。在之前的实验中我们设定了K.到3,虽然我们可以增加K.以获得更好的性能。范围D.控制了预测的粒度,结果表明,划分的次数为8次。当我们继续增加D.,任务变得更加困难,分数会下降。数字7.A显示DG数据集中堆叠模型的最佳性能\(d = 8 \)\ (k = 20 \).桌子3.显示基础模型和最终堆叠模型的比较。堆叠模型的性能甚至比XGBoost略差。我们认为这可能是由于以下原因。首先,数据集太小,因为当数据集不够大时,堆叠不是那么强。其次,我们可以增加第一层的模型多样性,并添加更多型号来提高性能。第三,我们在随机森林模型中没有使用交叉验证技术。总之,我们认为分数差异很小,用户可以根据其数据集的大小选择不同提供的模型。

表3基础模型和叠加模型性能
图4
装具

方法比较。一种DG数据集的方向标记比例。B.-D.不同的方法性能,解决在DG数据集类不平衡问题

图5
figure5

不同模型的混淆矩阵。这里展示了当类的数量D.在DG数据集上等于4。一种XGBoost模型的性能,其中每个方块对应RNA速度方向的一个预测标签和一个真实标签,每个方块中的值是满足条件的细胞数量(随着数量的增加颜色变深)。我们可以看到,这些对角线颜色较深,说明有些样品分类正确。B.随机森林模型的性能。C堆叠模型的性能

可视化

我们使用scVelo的UMAP工具包[14将单元格和速度向量映射到二维空间,并且我们假设传入的新数据与我们的训练数据具有相同的分布。我们以与之前嵌入相同的方式投影新数据,并给它们一个小的红色箭头,表示我们对速度方向信息的预测。图中的每个点代表一个单元格,箭头代表单元格的速度信息。它给了我们一个直观的指示,告诉我们一个特定细胞的去向。在生物学中,它会告诉我们细胞的不同路径,我们可以看到它表现得很好。数字8.在数据集PE上显示结果,不同的颜色表示不同的聚类,上图为ground truth。下图中,红色箭头是我们预测的结果。对比地面真值图中的相同位置,可以看出结果与地面真值是一致的。橙色圆点代表内分泌前细胞,圆点代表细胞。通过放大窗口,对比清楚地显示二维空间的单元格移动被很好地捕捉到了。

图6
figure6

XGBoost的损失曲线和最重要的基因。一种DG DataSet上XGBoost时代的训练和验证日志损耗曲线。B.基因重要性XGBoost的排名

图7
figure7

HyperParameters对DG数据集的影响。一种平衡分数曲线,具有不同的近似数目。上部显示平衡分数随着增加的顶部基因数k增加而增加。在k达到20之后,平衡分数开始振荡,这意味着20足以实现良好的性能。底部显示在类别的数量超过8时显示性能下降。B.当基因数k = 20,类数d = 8时,叠加模型的混淆矩阵。每个正方形对应于预测标签和真实标签,每个正方形中的值是满足条件的单元格数量(随着数量的增加,颜色变深)。沿对角线的数字表明了堆垛模型在DG数据集上的性能

图8
figure8

在PE的数据集的运动预测的示意图。所述莱夫特赛德图可见PE的数据集,其中,不同的颜色表示不同的簇的速度分布。在放大的右侧的图中,上面的一个显示单元,并用原始标签(训练集)速度的方向,并且在底部图中,无晕圈红色箭头表示细胞和速度方向与预测的标签(测试组)

讨论

Velo-Predictor的一个局限性是它的性能可能依赖于数据。虽然我们已经使用集成学习框架来平衡不同基线模型对不同样本特征比率的结果,但它仍然是一种经验方法。当数据分布不那么完整和平衡时,预测可能不那么准确。最低输入数据大小取决于数据的属性(例如样本和特征)和生物场景(例如数据类型)。我们已对案件进行了测试(\ (k = 5 \)\ (d = 4 \)),当它超过40%时,错误数将增加到数百个。一般来说,更完整的数据,包括动力学过程的研究中的生物情景将是更可取的。此外,模型的可解释性仍然是一个挑战。

我们的工作提供了一种基于预测的细胞分化机制的方法。这种预测还可以帮助施加尚未被SCRNA-SEQ数据覆盖的状态空间,并且插值可以帮助构造连续的景观表面。在未来,我们可以使用单细胞多OMIC数据来更精确地学习细胞分化的分解点。利用估算的方向信息,我们可以进一步进行轨迹推断。结合能量函数,例如我们上一项工作中使用的Hopfield网络模型中[8.,预测的RNA速度可以用来模拟Waddington的表观遗传景观。因此,RNA速度的预测可以让生物学家直观地了解细胞动力学的趋势,为他们的研究提供信息。

结论

在本文中,我们描述了腭预测器,一个集成学习管道用于RNA速度预测。虽然RNA速度估计并不简单,我们的管道可以通过学习从基因表达数据的预测模型简化程序。结果表明,我们的管道能够准确预测细胞状态转换的方向。

可用性数据和材料

单细胞RNAseq数据在Gene Expression Omnibus中公开,登录号为GSE95753和GSE132188。该代码可在https://github.com/clay001/Velo-Predictor

缩写

Scrna-SEQ:

单细胞RNA测序

嗯:

期望最大化

ADASYN:

自适应合成

笑:

合成少数过采样技术

BLS:

边界线击杀

支持向量机:

支持矢量机器变体的笑容

答:

集群重心

罗斯:

下随机取样器

RENN:

重复编辑的最近邻

NCR:

邻里清洗规则

操作系统:

一方选择

rf:

随机森林

GBDT:

梯度增强决策树

等:

额外的树分类器

艾达:

adaboost.

DGN:

齿状回神经发生

地理:

基因表达综合

pe:

胰腺endocrinogenesis

参考文献

  1. 1.

    郑GX,Terry JM,Belgrader P,Ryvkin P,Bent Zw,Wilson R,Ziraldo SB,Whileer TD,McDerMott GP,Zhu J等。单细胞的大规模平行数字转录分析。NAT Communce。2017; 8(1):1-12。

    谷歌学者

  2. 2.

    Svensson的V,文托-TORMO R,跳Teichmann SA。在过去十年中的单细胞转录组测序的指数缩放。NAT PROTOC。2018; 13(4):599-604。

    中科院PubMed谷歌学者

  3. 3.

    Weinreb C, Wolock S, Tusi BK, Socolovsky M, Klein AM。从单单元快照进行动态推断的基本限制。中国科学院院刊。2018;115(10):2467-76。

    谷歌学者

  4. 4.

    Saelens W,Cannoodt R,托多罗夫H,的单细胞轨迹推理方法Saeys Y.比较。NAT BIOTECHNOL。2019; 37(5):547-54。

    中科院PubMed谷歌学者

  5. 5.

    马科,卡普RL,郭根,罗布森P,哈特AH,特里帕L,袁国昌。单细胞基因表达数据的分岔分析揭示了表观遗传景观。中国科学(d辑:地球科学)2014;

    谷歌学者

  6. 6.

    Teschendorff AE,ENVER T.单细胞熵,用于精确估计细胞转录组的分化效力。NAT Communce。2017; 8(1):1-15。

    谷歌学者

  7. 7.

    Jin S,Maclean Al,Peng T,NIE Q. ScePath:基于能量景观的过渡概率和来自单细胞转录组数据的蜂窝轨迹的推断。生物信息学。2018; 34(12):2077-86。

    中科院PubMed公共医学中心谷歌学者

  8. 8.

    郭军,郑建军。基于连续hopfield网络的Waddington表观遗传景观的单细胞伪时间恢复。生物信息学。2017;33(14):102 - 9。

    谷歌学者

  9. 9.

    Zwiessele M, Lawrence ND。大满贯:单细胞实验的沃丁顿景观恢复。BioRxiv。2016年,057778年。

  10. 10。

    Trapnell C,Cacchiarelli D,Grimsby J,Pokharel P,Li S,Morse M,Lennon NJ,Livak KJ,Mikkelsen Ts,Rinn JL。单细胞的假型催效性排序揭示了细胞命运决策的动态和调节器。NAT BIOTECHNOL。2014; 32(4):381。

    中科院PubMed公共医学中心谷歌学者

  11. 11.

    拉Manno的G,索尔达托夫R,的Zeisel A,布劳恩E,Hochgerner H,佩图霍夫V,Lidschreiber K,Kastriti ME,LönnerbergP,弗尔兰A,等人。单个细胞的RNA速度。自然。2018; 560(7719):494-8。

    PubMed公共医学中心谷歌学者

  12. 12.

    Gorini L, Maas WK。在…中形成生物合成酶的潜力大肠杆菌.Acta botanica sinica . 1957;25(1):208。

    中科院PubMed谷歌学者

  13. 13.

    蔡泽泽尔,Köstler WJ, Molotski N, Tsai JM, Krauthgamer R, Jacob-Hirsch J, Rechavi G, Soen Y, Jung S, Yarden Y,等。耦合的pre-mRNA和mRNA动态揭示了对刺激的转录反应的操作策略。中国生物医学工程学报。2011;7(1):529。

    PubMed公共医学中心谷歌学者

  14. 14.

    卑尔根v,lange m,peidli s,wolf fa,theis fj。通过动力学建模将RNA速度推广到瞬态细胞状态。NAT BIOTECHNOL。2020; 38:1408-14。

    中科院PubMed谷歌学者

  15. 15.

    Alahi A, Goel K, Ramanathan V, Robicquet A, Fei-Fei L, Savarese S. Social lstm:拥挤空间中的人类轨迹预测。IEEE计算机视觉与模式识别会议论文集;2016.p . 961 - 71。

  16. 16.

    Felsen P, Lucey P, Ganguly s,他们会去哪里?使用条件变分自编码器预测细粒度对抗多智能体运动。见:欧洲计算机视觉会议论文集;2018.732 - 47页。

  17. 17.

    关键词:转录组学,深度生成模型,转录组学Nat方法。2018;15(12):1053 - 8。

    中科院PubMed公共医学中心谷歌学者

  18. 18.

    Grønbech CH, Vording MF, Timshel PN, Sønderby CK, Pers TH, Winther O. scVAE:用于单细胞基因表达数据的可变自动编码器。BioRxiv;2018:318295。

  19. 19.

    Eraslan G, Simon LM, Mircea M, Mueller NS, Theis FJ。使用深度计数自动编码器的单细胞rna序列去噪。Nat Commun。2019;10(1):1 - 14。

    谷歌学者

  20. 20。

    他H,Bai Y,Garcia Ea,Li S.Adasyn:适应性合成采样方法,用于吸入学习。在:2008 IEEE国际神经网络联席会议(IEEE世界大会上的计算智能)。IEEE;2008. p。1322-28。

  21. 21。

    Chawla NV,Bowyer Kw,Hall Lo,Kegelmeyer WP。SMOTE:合成少数群体过度采样技术。J Artif Intel Res。2002; 16:321-57。

    谷歌学者

  22. 22。

    韩华,王文义,毛炳华。边缘打击:非平衡数据集学习中的一种新的过采样方法。见:智能计算国际会议。施普林格;2005.p . 878 - 887。

  23. 23。

    Nguyen HM,Cooper Ew,Kamei K.边界过度采样,用于不平衡数据分类。INT J Knowl Eng软数据范例。2011; 3(1):4-21。

    谷歌学者

  24. 24.

    王志强,王志强,王志强。基于无监督学习的聚类质心快速估计方法。见:2012年IEEE进化计算大会。IEEE;2012.1 - 8页。

  25. 25.

    基于kNN方法的不平衡数据分布研究。见:非平衡数据集学习研讨会论文集。第126卷;2003.

  26. 26.

    Tomek I等人。一个关于被编辑的最近Nieghbor规则的实验;1976年。

  27. 27.

    通过平衡职业分布来提高难度小职业的识别。见:欧洲人工智能医学会议。施普林格;2001年,p . 63 - 6。

  28. 28.

    库巴特男,Matwin S,等人。解决的不平衡训练集诅咒:片面选择。在:ICML,第一卷。X97;1997年第179-86。Citeseer

  29. 29.

    研究了几种平衡机器学习训练数据的方法。中国科学(d辑:地球科学)2004;6(1):20-9。

    谷歌学者

  30. 30.

    Batista GE, Bazzan AL, Monard MC.基于平衡训练数据的关键词自动标注:案例研究。:钻压;2003.10 - 18页。

  31. 31.

    Mltxend Raschka S.为Python的科学计算堆栈提供机器学习和数据科学公用事业和延伸。j开源软件。2018; 3(24):638(https://doi.org/10.21105/joss.00638).

    谷歌学者

  32. 32。

    Pedregosa f,Varoquaux g,gramfort a,michel v,ripion b,grisel o,blondel m,prettenhofer p,weiss r,dubourg v,vanderplas j,passos a,cournavea d,brucher m,perrot m,duchesnay e。scikit-学习:Python的机器学习。J Mach Learn Res。2011; 12:2825-30。

    谷歌学者

  33. 33。

    单细胞RNA测序揭示了出生后齿状回神经发生的保守特性。自然>。2018;21(2):290 - 9。

    中科院PubMed谷歌学者

  34. 34。

    Bastidas-Ponce A, Tritschler S, Dony L, Scheibner K, Tarquis-Medina M, Salinno C, Schirge S, Burtscher I, Böttcher A, Theis FJ,等。全面的单细胞mRNA图谱揭示了胰腺内分泌发生的详细路线图。发展。2019;146 (12):dev173849。

    中科院PubMed谷歌学者

下载参考

确认

不适用。

关于这个补充剂

本文已作为BMC Bioinformatics Volume 22 Supplemen欧宝娱乐合法吗t 10 2021: Selected articles from the 19th Asia Pacific Bioinformatics Conference (APBC 2021): Bioinformatics的一部分发表。该补充剂的全部内容可在//www.christinemj.com/articles/supplements/volume-22-supplement-10

资金

这项研究得到了上海科技大学的启动资金支持。出版费用由相同的启动资金资助。资助机构在研究的设计、数据的收集、分析和解释以及手稿的撰写中没有作用。

作者信息

隶属关系

作者

贡献

XW和JZ构思了这个项目。XW开发了这种方法并进行了实验。XW和JZ撰写了手稿。两位作者都阅读并批准了最终的手稿。

通讯作者

对应到杰正

道德声明

伦理批准和同意参与

不适用。

同意发布

不适用。

利益争夺

两位作者宣称他们没有相互竞争的利益。

额外的信息

出版商的注意

欧宝体育黑玩家Springer Nature在发表地图和机构附属机构中的司法管辖权索赔方面仍然是中立的。

权利和权限

开放获取本文根据创意公约归因于4.0国际许可证,这允许在任何中或格式中使用,共享,适应,分发和复制,只要您向原始作者和来源提供适当的信贷,提供了一个链接到Creative Commons许可证,并指出是否进行了更改。除非信用额度另有说明,否则本文中的图像或其他第三方材料包含在文章的创造性公共许可证中,除非信用额度另有说明。如果物品不包含在物品的创造性的公共许可证中,法定规定不允许您的预期用途或超过允许使用,您需要直接从版权所有者获得许可。要查看本许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用及公共领域专用豁免书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信贷额度中另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

王,X.,郑,J.Velo-Predictor:用于RNA速度预测的集合学习管道。欧宝娱乐合法吗22,419(2021)。https://doi.org/10.1186/s12859-021-04330-1

下载引用

关键词

  • RNA速度
  • 单个细胞
  • 合奏学习
  • 景观