跳到主要内容

Matisse:基于MATLAB的原位测序表达图分析工具箱

抽象的

背景

最近出现了一系列空间分解的转录组方法作为在纸巾的分子和细胞多样性的空间表征的一种方法。结果,开发了越来越多的计算技术来促进数据分析。还需要多功能用户友好的工具,可用于DE Novo探索数据集。

结果

在这里,我们介绍了基于MATLAB的分析工具箱,用于原位排序(ISS)表达映射(马蒂斯)。我们展示马蒂斯通过在小鼠冠状截面中表征119基因的二维空间表达,探索不同水平的复杂性。另外,在综合分析中,我们进一步分析了来自第二种技术的表达映射,靶向类似的鼠标脑区域。

结论

马蒂斯被证明是初步探索的宝贵工具测序数据集集成的广泛工具集允许使用单个读取的位置进行简单分析,以及更复杂的聚类和降维方法,并考虑细胞内容。工具箱可以用于一次分析一个或几个样本,甚至来自不同的空间技术,它包括不同的分割方法,可以用于分析空间解析的转录组数据集。

背景

过去十年中单细胞RNA测序(SCRNA-SEQ)技术的出现为组织内单个细胞的高通量基因表达提供了科学群落。这是揭示组织的分子和细胞复杂性的基础。利用这些技术,已经描述了新的细胞类型和发育途径,并迅速成为分子生物学中的标准方法[1]. 然而,scRNA序列数据中空间信息的缺乏促使越来越多的空间分辨转录组学技术迅速发展,这些技术旨在原位表征细胞。到目前为止,这些方法旨在补充单细胞测序,但现在开始用于回答数据驱动的生物学问题。近年来,利用多重靶向方法和无偏转录组方法发展了多种基于空间分辨RNA的技术[23.4567].由于这种多样性,每个技术都集中在开发自己的分析工具[8910.11.12.13.14.[尽管在对某些数据集进行深度分析时,尽管在执行深度分析时,仍然不足以执行宽数据驱动分析。

在基于图像的方法中,原位测序(ISS)[7已被证明是一种强大的有针对性的方法,用于捕获大型组织的表达谱,亚细胞分辨率,并已应用于研究一系列生物学问题[15.16.17.18.].ISS的第二次迭代,基于杂交的ISS(Hybiss)[19.]允许更多的多功能性和多路复用能力进一步增加了对用户友好的工具的需求,以适应更广泛的受众。ISS的高吞吐量使得能够分析许多样品,在交叉样本变异分析和比较方面增加了另一级复杂性。由于可以通过ISS解决的各种生物学问题,所以需要不同的分析工具来提取相关结论。虽然已经开发出不同的特定分析功能来探索和可视化ISS数据集[20.21.22.23.24.],需要一种标准化的分析工具,可用于分析任何类型的ISS数据集。为了解决这种需求,我们在这里描述了基于实验室的ASS表达式映射的分析工具箱(马蒂斯)。马蒂斯是一个用户友好的工具箱,旨在促进ISS数据集的分析和解释。它包括各种工具,可以进行调整和修改,以便创建个性化和多功能分析管道,能够对更精细的方法进行简单的分析。

执行

与基于大多数基于图像的技术一样,预处理的解码数据以分配给特定基因的每个解码点的二维坐标的斑点表的形式。输入马蒂斯需要这些位置,另外,如果需要,可以提供核染色以引导蜂窝分割。此输入将格式化为自定义MatisseMOD对象中开发的所有功能都将使用该对象作为输入马蒂斯(无花果。1)。在分析数据的同时使用相同的对象可确保分析之间的一致性并增加工具箱的多功能性。可以使用各种不同的分析马蒂斯,包括分层分析,内核密度估计(KDE),以及未分段数据集的梯度的探索,以及例如de Novo聚类,尺寸减少,低维RGB表示,概率细胞键入(PCISEQ)[20.[分段数据集的基因共同表达。还实施了几种简单的分段方法以适应每个数据集的特殊性。此工具箱中实现的一些工具需要从先前可用的存储库中的函数[https://github.com/moldia/iss-analysis.已被纳入其中马蒂斯“主要存储库”以方便安装。

图。1
图1

在Matisse中描述的主要分析工作流程的示意图。分析的部分中发现的所有读取的笛卡尔坐标用于创建初始Matisse对象。可以使用该对象作为输入,应用包括KDE图,分层分析,基因定量和梯度识别和分析的若干功能。数据也可以基于小区边界,各个斑点的位置或使用沿着该部分等等分布的网格的数据分段。它的输出存储在第二个Matisse对象中,可用于小区键入和聚类数据等

斑点量化

为了方便地研究在分析的特定组织中发现的读取量,函数PlotTotalCounts实施。通过计算样品中发现的特定基因的读数来研究的所有样本/区域(ROI)计算总计数和相对计数。计数和频率矩阵用条形图和热图表示,促进在一次分析多个样本时的结果的解释。此函数是基于来自先前可用的存储库的代码来实现的[https://github.com/moldia/iss-analysis.].

基因密度表示

可以使用该功能估计特定基因的表达密度基因密度。核密度估计(KDE)是利用检测到的基因reads的位置,通过分析的组织来估计特定基因的表达密度。结果图被表示为热图,以区分在样品中发现的不同表达水平。这个功能可以用来一次分析几个基因。最重要的是函数覆盖层密度可用于覆盖不同基因的密度分布。这些功能是来自先前可用的实用程序的修改[https://github.com/moldia/iss-analysis.].

分开化

功能分开化用于使用邻域富集试验研究样品中基因的分致化,类似于用于识别Dries等人使用的近似或交互细胞类型的算法。[25.].为此,创建将每个基因链接到其最近邻居的网,并计算基因之间的连接数。根据数据集的特征,可以指定不同数量的邻居。为了定义分层化的富集或耗尽,将实验数据集中发现的连接与一组随机数据集进行比较,其中包含与真实数据相同数量的读取和位置,而是用Shububled读取标识。将为每对基因计算Z分数,如下计算:

$$ z_ {i} = \ frac {{x_ {i} - \ mu}} {\ sigma} $$

因此,对于给定基因,它将通过减去模拟数据集中发现的平均连接数到实际数据集中找到的连接数,并将产生的值除以随机数据集中的连接数的标准偏差来计算其Z分数。使用此方法,富有实时数据集中的连接具有正Z分数,而我们数据集中耗尽的连接具有负Z分数。

渐变发现者

功能find_gradients.用于识别在2d表达式图中发现的主要表达式梯度。为此,我们计算核密度估计(KDE) [26.]对于面板中的每个基因,假设高斯内核并给出特定带宽。之后,均匀分布的参考点通过2D-DATASET定位。为了找到不同参考点之间的较高变化,我们使用以下方式计算数据的2个维度中的每个位置的变化

$ $ G_ {x} = \ mathop \总和\ limits_ {i = 1} ^ {n} \左| {d_ {x - b} - d_ {x + b}} \ | $ $

在这种情况下,其中一个轴中的表达式(G)在特定的位置(x)是局部变异的总和n在该特定轴上分析的基因。这种变化是通过计算密度差异而获得的绝对值(d)某种基因在相对位于指定距离的两个斑点中(b)从现场分析。这将针对x轴和y轴进行计算,为每个分析点获得两个值。这两个值将用于生成箭图或矢量图,显示样本内梯度的方向和强度。

梯度分析

使用该功能分析一种尺寸基因表达梯度渐变。可以使用此功能研究可定制的渐变。调用该功能后,我们定义梯度的原点坐标以在图像中考虑,以及所研究的区域的大小。该功能计算每个点到原点坐标的最小距离,将所有读取的所有读取到1维轴,如下所示:

$$ D_ {I} = {\文本{分钟}}(\ SQRT {(X_ {I} - X_ {R})^ {2} +(Y_ {I} - Y_ {R})^ {2}})$$

因此,每次读取的距离()将是分析的读取和任何参考点之间的最小欧几里德距离(r)。KDE [26.基于每个基因读取的位置进行,以获得沿梯度研究的基因的表达密度。显示每个光点到原点坐标的距离和用于表达密度的单个基因的1D密度图的热图也作为输出返回。

数据分段

使用不同的二维分割策略来探索分析的数据集。dapi_segmentation,改编自以前可用的存储库[https://github.com/moldia/iss-analysis.[可用于在背景DAPI图像或类似的核染色图像上使用基于流域的算法对单个小区分段。将顶部帽子过滤器应用于图像以去除背景并增强核,然后识别核的强度阈值。最后,应用流域分割,通过识别和扩展检测到的核信号来定义单个细胞。作为输出,返回包含组织中所有细胞的位置和身份的新掩模。此掩模将考虑电池之间的部件作为未分配的空间,并且在内部的读取不会被分配给小区。功能OverlappingBins用于通过通过分析的二维空间定义同等分布的垃圾箱来进行段,并将所有读数分配给它们所在的垃圾箱。最后,功能SpotEnvBin可以使用以探索通过在数据集中的每个特定读取的每个特定读数围绕概述某个区域内发现每个基因的读数的数量来分析的每个读取的环境。

主成分分析和特征选择

使用该功能研究数据集中的主组件校长_代表性,它在所需的分段数据集中执行主成分分析。创建了代表前20个主成分得分的不同细胞图,以及代表基因加载到这些主成分的热图。主要主成分中捕获的变化用于通过选择发现相关的主成分来执行降维。

低维RGB表示

低维RGB表示是通过调用定制函数来实现的LowdimensionalRGB。在函数中实现了不同的降维方法,包括主成分分析(PCA)、t分布随机邻居嵌入(t-SNE)和一致流形逼近与投影(UMAP)。PCA和t-SNE都是在MATLAB中实现的函数,而UMAP的实现则借鉴了Meehan等人的方法[27.].所有维数减少实施例需要细胞/基因表达矩阵作为输入,包括在所有样品中发现的细胞,并返回关于每个基因的新尺寸的载荷,以及所发现的每个细胞的分数。调整三个最重要的尺寸的每个单元的分数被调整为适合RGB刻度。单个细胞/箱根据其RGB值在空间图中表示。

de novo集群

从头聚类需要对数据集分割后得到的表达式矩阵进行初始归一化。该矩阵包含了每个特定细胞中每个基因的reads数,并根据每个基因的总丰度进行归一化,消除了聚类中高表达者的影响。集群是使用该函数执行的群集并且需要所需的簇数的规范。实现了三种不同的聚类算法,包括k均值,分层聚类和dbscan [27.],在所有情况下返回集群已分配数据集中的每个单元格。通过代表每个簇的平均表达,可以通过代表每个群体的平均表达来进一步分析heatmap_cluster.或使用分配给某个群集的所有细胞的表达式使用表达式。

概率细胞打字

执行概率细胞键入需要参考SCRNA-SEQ数据的格式化,以获得分析分析中包括的基因的每种细胞类型的平均表达。该数据包含在一个matissemod.对象使用该功能加载顺序。概率细胞通过原位测序(PCISEQ)打字,在该功能中实现pciseq,需要作为输入matissemod.对象总结单个单元格数据和matissemod.包含分段数据集到单元格类型的对象。该实现是从Qian等人描述的算法调整16.] [https://github.com/kdharris101/iss.[作为输出返回作为分析的样本的小区类型地图,每个细胞属于所有细胞类型的概率以及每个细胞的基因计数。

结果

空间表达分析

为了证明…的能力马蒂斯,我们重新分析了鼠标冠状部分的已发布的Hybiss数据集[15.].在原始数据中存在的119中,选择了17个基因的子集进行了全面读取的分析,其在主要视觉皮层(VISP)中的空间表达。通过分析这些基因的KDE表达谱分析在一起的KDE表达谱来找到主要的外内梯度[见附加文件1],与整个鼠标皮质的众所周知的基于层的结构一致[28.特别是在VISP中。梯度的这种一维研究揭示了通过不同的皮质层的基因表达改变,具有不同的曲线,例如rorbor.跨越跨越所有层的一般兴奋标记Slc17a7(无花果。2一种)。也可以探索基因分层化,显示例如抑制标记之间的相关性,例如Gad1LHX6.,以及兴奋性和抑制性标记物相互排斥的表达模式,比如SLC17A7和GAD1分别(无花果。2B, C)。

图2
图2.

小鼠皮质中17个基因表达的分析。一个皮质背腹轴17基因表达的一维kde估计。基因是随机分为两种线条,以促进他们的理解。B代表所分析基因之间共定位的热图。正Z分数(红色)表示基因的共定位,负Z分数(蓝色)表示相互排斥的表达。Ckde表达几种不同基因,代表成对。表示不同的共表达模式,包括相互排他性基因(顶部,左),分层化基因(下左),部分分层化基因(顶部,右)和具有无关表达模式的基因(下,右)。D分割鼠标冠状部分时产生的箱的二维映射。颜色代码对应于在减少维度减少分析时发现的前三个UMAP组件上的每个垃圾箱的RGB加载量。在大脑的不同区域中发现了不同颜色,表明每个组分的不同负载,突出显示面板中包括的基因的表达差异。E先前生成的箱的二维映射,其中每个颜色代表通过在分段数据集上执行分层聚类来定义的15个簇中的一个。FE中定义的所有基因的每个聚类的平均表达量。在Y轴上,每个集群的颜色对应于E对于每个群集

分段数据集

马蒂斯包括可以根据所解决的问题和数据质量的问题应用于ISS表达映射的不同分段策略。已经使用Hybiss DataSet中所有119个基因的基因表达映射评估了这些策略。为了在组织部分内找到特定于区域的表达式模式,可调节箱可用于分割。这里,创建了具有半径为250像素和它们之间的50像素的同等分布的箱。在分析中排除了一系列表达范围之外的垃圾箱,以及可能偏见结果的低表达基因[查看附加文件23.]. 数据集的3个第一个UMAP维度的RGB表示揭示了皮质和海马与丘脑之间的主要表达差异(图。2c),以及皮质外内轴中表达的逐渐变化。为了进一步研究组织的不同区域中所示的主要表达差异,在此进行PCA,在此识别额外的表达 - 独特的区域[请参阅附加文件23.].分层聚类可以对被分类的数据进行空间上定义novo表达式的特定区域。以119基因数据集为例,这导致了15个不同的表达区域(图。2e)。大脑的主要解剖区域可以通过它们的表达来分化,包括丘脑内的不同特异性区域;在海马的CA1-3和皮质内的不同层。大多数区域定义了面板内的呈现特定标记(图。2F)。在大多数情况下,在该部分的两个半球之间发现了定义的区域,这表明了所定义的区域的相关性。

单细胞RNA测序数据的集成

通过DAPI核染色进行单个细胞的分割,以探索细胞多样性。利用SCRNA-SEQ数据,PCISEQ [20.[基于Zeisel等人中描述的类的表达式模式,应用于数据集以便在空间地映射样本中存在的主小区类。[29.在分析的截面中发现了14种不同的类(图。3.A).在图中描述的空间域中发现了定义的细胞类型的不同相对丰度。2E、 不同于接近结构域特定的类别,如血管细胞和软脑膜细胞,仅在结构域29中出现高频率;广泛分布的类,如端脑和中脑兴奋性神经元。包括这些功能,并将它们耦合到马蒂斯允许用户不仅将ScrNA-SEQ识别的小区类型放置在空间上下文中,而且还识别具有特定蜂窝组合物的Supra-蜂窝空间域。

图3.
图3.

小鼠冠状切片中单个细胞的概率细胞分型。一个对鼠标冠状截面中的每个单元预测的最可能细胞类型的地图分析。细胞已被分类为14个不同的主要类别Zeisel.29.[基于在ISS实验中分析的所有基因的表达水平。B热图代表了通过概率细胞分型(pciSeq)分配到每个特定类别的细胞中每个基因的平均表达,将每个基因的总表达归一化。在每一个被鉴定的细胞中都发现了不同富集的基因。C分配的类的相对分布一个对于图1中定义的每个域。2E.域颜色对应于图1中使用的颜色。2E来可视化每个类上的域,并且单元格类的颜色与使用的颜色相对应一个表示分配给每个单元的最可能的小区类

其他空间技术的数据集集成

为了证明,Matisse能够将样本集成在不同的基于图像的空间解决的转录组技术中我们使用了使用Osmfish创建的单元格图,以Codeluppi等6我们在OSMFIFT数据集上执行了维度减少,表示从转换其3维UMAP得分的复合颜色到RGB的每个光点(图。4然后我们进行分层聚类,确定一组20个聚类(图1)。4b)。发现每个群集呈现特定表达签名,与Codeluppi等人识别的特定小区类型相对应。[6] (无花果。4C, D)马蒂斯来表示沿皮层背侧-腹侧轴的一些簇的位置,并识别沿该轴的不同簇的不同空间模式(图。4E、F)。

图4.
图4.

使用不同空间技术与卧底生物模式的整合马蒂斯一个OSMFISH数据集的空间映射,其中每个单元格都是由UMAP表示的3个第一维度的RGB表示。BOSMFISH数据集的空间映射,其中每个单元格已分配给由分层群集找到的群集。C在osmFISH数据集中发现的20个簇中每个基因的平均表达。D预测的de novo集群与分配给Codeluppi等人的每个单元的细胞类型之间的对应。[6].E在osmFISH数据集中定义的渐变,其中白线表示渐变的原点,单元格的颜色取决于从其自身到原点的最小距离。蓝色代表较小的距离,而黄色代表较大的距离。F沿着定义的一维轴线的4个特定簇(4,8,11和13)的次核密度估计E

讨论

我们在这里描述马蒂斯,Matlab Toolbox专门设计用于ISS数据集的综合初始分析。作为一个例子,我们使用其主要分析工具从Gyllborg等人的整个鼠标冠状部分中更好地描述了119个基因的二维表达模式30.].此外,我们已经证明了能力马蒂斯通过分析来自Osmfish的数据集来集成其他空间转录组数据集。

马蒂斯在工具箱中总结到到目前为止应用于二维ISS数据集的最重要的分析方法,并为这些新功能增加了,例如分层化,共同表达,尺寸减少,特征选择和质量控制工具,可以帮助解释空间数据集。与其他可用包装相比,马蒂斯可以用于分析分割和未分割的数据集。这对于无法实现细胞分割的组织,或者在稀疏数据集中,读取/获得的细胞数量很低,并且单个细胞的研究可以由随机效应驱动的情况下,是非常有用的。在不能分割单个细胞的情况下,例如在细胞密集丰富的区域,它们可以用来识别分析数据集中的空间域和分子特征。

该工具箱还包括用于分析单个单元数据集的一些最常见的聚类方法,尽管它缺乏其他广泛使用的算法,例如leiden或louvain [31.]因为他们缺乏Matlab的实施。然而,包括的不同算法适用于数据的初始探索。此外,我们加入pciSeq作为监督细胞打字算法,它使用的细胞类型通过scRNA-SEQ其特征在于到区段内的细胞进行分类的表达。

一个有趣的能力包括在马蒂斯是否可能同时处理多个样本。由于ISS可以与低放大率目标一起使用,因此可以以成本和时效的方式在同一实验中询问多个样本。因此,设计用于处理ISS数据集的工具应该能够在同一分析中集成多个样本。与其他 - 其他方法一样,由于样品的起源,它们的RNA质量或其加工的差异,样本之间存在技术变异。在这种情况下,需要协调来消除技术可变性以解决交叉样本相似性和差异。由于缺乏专门为空间分辨的转录组数据集设计的统计工具,该领域采用了最初设计用于其他 - 域技术的方法,尤其是对基于空间和ScrNA-SEQ Datset进行比较[32.].之内马蒂斯,我们已实施战斗33.[这是一种专为RNA测序数据集的批量效应校正而设计的已知方法,因此,应该足以校正通过相同技术产生的数据集之间的批量效应,其具有与每个基因的类似检测效率相同但不同的RNA质量。然而,在空间解决方法中使用专为其他-OMIC技术设计的算法未命中,这是一个关键方面,这是个体成绩单的空间分布。因此,它对开发特定于基于图像的空间技术的新分析工具至关重要,以比较多个示例数据集。

尽管为用于勘探空间已解决的转录组数据集的分析工具越来越多,但大多数都是创建的,目的是以精确的方式进行特定分析[10.],通常会损害它的时间和多功能性。由于使用空间解决方法的实验室数量正在迅速增加,我们相信除特定工具外,还需要快速,多功能,全面且易于使用的工具。因此,呈现的工具箱中实现的工具可以通过快速和初步或更精确地进行调整,以帮助用户有效地获得生物学相关信息。

马蒂斯旨在考虑ISS分析的具体要求,例如处理大型样本区域,处理多个数据集并处理含有50至200个基因的基因面板,其在其他类型的数据集中的应用也是可能的,其中包括只有作为输入读取的位置的条件,或单个细胞/箱的位置和表达。尽管产生了不同的化学品,但所有基于图像的空间分解的转录组织方法的性质,在空间背景下解决单个斑点,促进了它们对分析侧的收敛性。从这个意义上讲,社区正在朝着能够将数据集集成到不同来源的工具的开发,这两者都在预处理中[34.]下游分析侧[25.].这对于最大化可用于分析这些数据集的各种分析工具并最大限度地减少已存在工具的开发,这是必不可少的。

结论

马蒂斯提供用户友好且多功能的工具箱,可以探索ISS数据集,可以帮助新用户理解ISS实验中捕获的主要生物信息。此工具允许分析未分段和分段数据集,以一致的方式探讨数据集中的不同程度的复杂性此外,若干数据集可以以综合方式整合到同一分析中,由于协调策略,将空间解决的转录组技术与相同分析结合起来,打开可能性。

可用性和需求

  • 项目名:马蒂斯。

  • 项目主页:欧宝直播官网apphttps://github.com/moldia/matisse.

  • 操作系统):Windows,Linux,Mac OS。

  • 编程语言:Matlab。在Matlab 2019b实施。

  • 其他要求:马蒂斯要求不同MATLAB插件,包括生物信息学和图像处理工具箱。

  • 执照:GNU。

  • 非学术界使用的任何限制:不。

可用性数据和材料

的稳定版本马蒂斯,本文所述的分析工具箱,可从以下网址下载https://www.mathworks.com/matlabcentral/fileexchange/91195-matisse_rev,还可以找到文档的地方。工具箱最新版本也可以从中下载https://github.com/moldia/matisse..在目前研究期间分析的数据集可在ClogShare(https://doi.org/10.17045/sthlmuni.12821840),在Hybiss [19.数据集。在Osmfish的情况下[6数据集,在当前研究期间分析的数据集可以在线找到http://linnarssonlab.org/osmFISH/

缩写

Hybiss:

基于杂交的原位测序

空间站:

在原位测序

KDE:

内核密度估计

马蒂斯:

MATLAB分析工具箱用于原位排序表达式地图

scRNA-seq:

单细胞RNA测序

Osmfish:

Ouroboros单分子鱼

PCA:

主要成分分析

PCISEQ:

原位测序的概率细胞分型

tSNE:

t分布随机邻居嵌入

UMAP:

均匀的歧管近似和投影

参考

  1. 1。

    陶器ss。用于研究发展,生理学和疾病的单细胞RNA测序。NAT Rev Nephrol。2018; 14(8):479-92。https://doi.org/10.1038/s41581-018-0021-7

    文章PubMed.pmed中央CAS谷歌学者

  2. 2。

    Rodriques sg,Stickels Rr,Goeva A等人。SLIDE-SEQ:一种可扩展技术,用于测量高空间分辨率的基因组表达。科学(80-)。2019; 363(6434):1463-7。https://doi.org/10.1126/science.aaw1219

    文章CAS谷歌学者

  3. 3.

    陈X,Sun YC,Church Gm,Lee Jh,Zador Am。使用基于挂锁探针的Baristaseq高效的原位条形码测序。核酸RES。2018年。https://doi.org/10.1093/nar/gkx1206

    文章PubMed.pmed中央谷歌学者

  4. 4。

    李志强,李志强,李志强,等。RNA荧光原位测序(FISSEQ)用于完整细胞和组织中的基因表达谱分析。Nat Protoc。2015;10(3):442 - 58。https://doi.org/10.1038/nprot.2014.191

    文章PubMed.pmed中央CAS谷歌学者

  5. 5。

    陈国华,陈国华,陈国华,庄欣。基于荧光原位杂交的高通量单细胞基因表达谱分析。中国科学(d辑:地球科学)2016;https://doi.org/10.1073/pnas.1612826113

    文章PubMed.pmed中央CAS谷歌学者

  6. 6.

    Codeluppi S,Borm Le,Zeisel A等人。Osmfish透露的躯体感觉皮质的空间组织。NAT方法。2018; 15(11):932-5。https://doi.org/10.1038/s41592-018-0175-z.

    文章PubMed.CAS谷歌学者

  7. 7.

    王志强,王志强,王志强,等。在保存的组织和细胞中进行RNA分析的原位测序。Nat方法。2013;10(9):857 - 60。https://doi.org/10.1038/nmeth.2563

    文章PubMed.CAS谷歌学者

  8. 8.

    Sun S,朱家,周X.空间解决转录组研究空间表达模式的统计分析。NAT方法。2020.https://doi.org/10.1038/s41592-019-0701-7

    文章PubMed.pmed中央谷歌学者

  9. 9

    BergenstråhleJ,BergenstråhleLL,Lundeberg J. Spatialcpie:用于空间转录组群集评估的R / Biocuconductor封装。欧宝娱乐合法吗BMC生物信息学。2020; 21:1。https://doi.org/10.1186/s12859-020-3489-7

    文章谷歌学者

  10. 10。

    FernándezNavarroJ,Lundeberg J,StåhlPl。ST Viewer:用于分析和可视化空间转录组数据集的工具。生物信息学。2019; 35(6):1058-60。https://doi.org/10.1093/bioinformatics/bty714

    文章PubMed.CAS谷歌学者

  11. 11.

    空间解析转录组——组织探索的下一代工具。BioEssays。2020.https://doi.org/10.1002/bies.201900221

    文章PubMed.谷歌学者

  12. 12.

    安德森A,Bergenstråhlej,asp m等。单细胞和空间转录组织能够实现细胞类型形貌的概率推理。Communic Biol。2020.https://doi.org/10.1038/s42003-020-01247-y

    文章PubMed.pmed中央谷歌学者

  13. 13。

    他是,王j,guo h等。InsitUnet:集合模拟参数空间探索的深度图像合成。IEEE Trans VIS计算图。2020; 26(1):23-33。https://doi.org/10.1109/TVCG.2019.2934312

    文章PubMed.谷歌学者

  14. 14。

    Biancalani T,Scalia G,Buffoni L等。小鼠脑袋中单细胞的深层学习和对齐整体细胞的对齐。生物奇.在线发布2020。

  15. 15。

    Asp M,Giacomello S,Larsson L等人。一种时尚的器官宽基因表达和培养人体的细胞阿特拉斯。细胞。2019; 179(7):1647-1660.E19。https://doi.org/10.1016/j.cell.2019.11.025

    文章PubMed.CAS谷歌学者

  16. 16。

    Lundin E,Wu C,Widmark A等人。使用原位测序在培养的小鼠脑中RNA编辑的时尚映射显示区域和细胞类型特异性调节。BMC BIOL。2020.https://doi.org/10.1186/s12915-019-0736-3

    文章PubMed.pmed中央谷歌学者

  17. 17

    原位测序:一种高通量、多靶点基因表达谱技术,用于组织切片中的细胞分型。方法:中华医学杂志。2020;2148:313-29。https://doi.org/10.1007/978-1-0716-0623-0_20

    文章PubMed.CAS谷歌学者

  18. 18

    Chen Wt,Lu A,Craessaerts K,等人。空间转录组织及其原位测序研究阿尔茨海默病。细胞。2020; 182(4):976-991.E19。https://doi.org/10.1016/j.cell.2020.06.038

    文章PubMed.CAS谷歌学者

  19. 19

    Gyllborg D,Langseth CM,Qian X,等。人和小鼠脑组织空间分辨转录组学的基于杂交的原位测序(HybISS)。核酸研究,2020年。https://doi.org/10.1093/nar/gkaa792

    文章PubMed.pmed中央谷歌学者

  20. 20。

    钱X,Harris KD,Hauling T等人。概率细胞键入能够原位映射密切相关的细胞类型。NAT方法。2020; 17(1):101-6。https://doi.org/10.1038/s41592-019-0631-4

    文章CAS谷歌学者

  21. 21。

    Salamon J, Qian X, Nilsson M, Lynn DJ。利用InsituNet对空间感知基因表达数据进行网络可视化和分析。细胞系统。2018;6 (5):626 - 630. - e3。https://doi.org/10.1016/j.cels.2018.03.010

    文章PubMed.CAS谷歌学者

  22. 22。

    TissUUmaps:大规模空间基因表达和组织形态数据的交互可视化。生物信息学。2020;36(15):4363 - 5。https://doi.org/10.1093/bioinformatics/btaa541

    文章PubMed.pmed中央CAS谷歌学者

  23. 23。

    Partel G, Wählby C. Spage2vec:本地化空间基因表达签名的无监督表示。2020年2月j。https://doi.org/10.1111/febs.15572

    文章PubMed.pmed中央谷歌学者

  24. 24。

    Partel G,Hilscher MM,Milli G等。从原位测序数据自动识别小鼠大脑的空间隔室。BMC生物。2020https://doi.org/10.1186/s12915-020-00874-5

    文章PubMed.pmed中央谷歌学者

  25. 25。

    Dries R,Zhu Q,Eng CHL,et al.Giotto,单细胞空间转录组数据的整合分析和可视化管道。生物奇.发表于2019年在线。https://doi.org/10.1101/701680

  26. 26。

    Węlarczyks.内核密度估计及其应用。ITM Web Conf。2018; 23:00037。https://doi.org/10.1051/itmconf/20182300037

    文章谷歌学者

  27. 27。

    Connor Meehan,Stephen Meehan和WM。均匀的歧管近似和投影(UMAP)。公布了2020年。https://www.mathwands.com/matlabcentral/fileexchange/71902

  28. 28。

    王志强,王志强,王志强,等。单细胞转录组学揭示的成年小鼠皮层细胞分类。Nat > 2016; 19(2): 335 - 46。https://doi.org/10.1038/nn.4216

    文章PubMed.pmed中央CAS谷歌学者

  29. 29

    蔡泽泽尔,王志强,王志强,等。小鼠神经系统的分子结构。细胞。2018;174 (4):999 - 1014. - e22。https://doi.org/10.1016/j.cell.2018.06.021

    文章PubMed.pmed中央CAS谷歌学者

  30. 30.

    钱学军,张志强,张志强,等。基于杂交的原位测序(HybISS)用于人类和小鼠脑组织的空间分辨转录组学。核酸学报2020;48(19):e112。https://doi.org/10.1093/nar/gkaa792

    文章PubMed.pmed中央CAS谷歌学者

  31. 31。

    Traag Va,Waltman L,Van Eeck NJ。从Louvain到Leiden:保证连接良好的社区。SCI REP。2019。https://doi.org/10.1038/s41598-019-41695-z.

    文章PubMed.pmed中央谷歌学者

  32. 32。

    Abdelaal T,Mourragui S,Mahfouz A,Reinders MJT。Spagage:使用ScrNA-SEQ的空间基因增强。核酸RES。2020; 48(18):E107-E107。https://doi.org/10.1093/nar/gkaa740

    文章PubMed.pmed中央CAS谷歌学者

  33. 33。

    Johnson We,Li C,Rabinovic A.使用经验贝叶斯方法调整微阵列表达数据中的批量效应。生物统计学。2007; 8(1):118-27。https://doi.org/10.1093/biostatistics/kxj037

    文章PubMed.pmed中央谷歌学者

  34. 34。

    佩图霍夫五世,索尔达托夫拉,霍多塞维奇K,哈尔琴科光伏。空间分辨转录断层数据的贝叶斯分割。生物奇.在线发布2020:2020.10.05.326777。https://doi.org/10.1101/2020.10.05.326777

下载参考

致谢

我们感谢钱晓燕为开发分析工具所做的贡献,并感谢她对手稿的评论。我们感谢马茨·尼尔森实验室所有成员的见解和意见。

资金

斯德哥尔摩大学提供的开放获取资金。Chan Zuckerberg倡议,硅谷社区基金会资助的StETETX联盟和人类细胞阿特拉斯和合作项目的概况和定义帕金森病的建议基金;从Erle Pelss'家庭基金会和Knut和爱丽丝华伦伯格基金会获得人类发育细胞阿特拉斯奖;瑞典研究委员会[2019-01238];EASI基因组学欧盟地平线2020研究与创新[824110];瑞典脑基金会(HJ SurrnFoundon)[PS201-012]。开放获取费用的资助:瑞典研究委员会[2019-01238]。资助机构没有影响或参与设计研究、分析或解释数据以及撰写手稿。

作者信息

隶属关系

作者

贡献

SMS设计了软件并写了稿件。SMS,DG和CML执行分析并策划软件。SMS,CML和MN构思了该软件。MN监督该研究。所有作者都致力于通过提供反馈来改进稿件。所有作者阅读并认可的终稿。

通讯作者

对应于垫子尼尔森

伦理宣言

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

MN是公司10X基因组学的科学顾问,该顾问在原位测序套件中商业化。

附加信息

出版说明

欧宝体育黑玩家施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

补充信息

附加文件1:

冠状脑区选择用于分析和KDE图。A.在图2A(蓝色)和图2.B-C /附加文件中分析的兴趣区域(ROI)和图2.B-C /附加文件1.D(黄色)显示在Gyllborg等人中探索的鼠标冠状部分的DAPI染色中30..B.小鼠脑冠间区域的区域定位,指示图2A(蓝色)和图2B-C /附加文件1.D(黄色)中分析的兴趣区域(ROI)的近似位置。图像信用:艾伦大脑研究所。C.在小鼠冠状皮层ROI(附加文件1A中的蓝色正方形)中找到了De Novo,表明小鼠皮质的不同层之间发现的不同基因表达。D.在附加文件1中定义的黄色ROI中详细研究了14个基因的KDE图。用于表示不同基因的表达水平,其中白色代表高表达,而黑色表示缺乏表达。

附加文件2:

鼠类标本箱的质量控制和主成分分析。在每个容器上发现的读取数量的分布。红色虚线表示所需读/单元格的最小数量,绿色虚线表示接受读的最大数量。B.分析样本中每个基因的读音分布。虚线表示需要进一步分析的基因的最小读取数。C.当对附加文件2A和附加文件2B中满足QC要求的容器执行PCA时,发现由每个主成分解释的变量百分比。D.在binned数据集中发现的前10个主要成分的每个箱子的得分。红色表示在特定的bin中得分高,蓝色表示得分低。当探索10个主要成分时,可以发现差异表达区域。

附加文件3:

基因表达与主成分的相关性。A.表示每个基因表达与图2D-E中描述的每种基因表达和前10个主成分的表达之间的相关性的热图。低相关以蓝色标记,而在白色的右侧中的彩色棒中示出了高相关性的较高相关性。

权利和权限

开放访问本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料都包含在本文的知识共享许可中,除非在该材料的信用额度中另有说明。如果资料不包括在文章的知识共享许可协议中,并且你的预期用途没有被法律规定允许或超过允许用途,你将需要直接从版权所有者获得许可。如欲查阅本许可证副本,请浏览http://creativecommons.org/licenses/by/4.0/.Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。

重印和权限

关于这篇文章

通过Crossmark验证货币和真实性

引用这篇文章

Marco Salas,S.,Gyllborg,D。,Mattsson Langseth,C。et al。Matisse:基于MATLAB的分析工具箱,用于原位排序表达映射。欧宝娱乐合法吗22,391(2021)。https://doi.org/10.1186/s12859-021-04302-5

下载引用

关键字

  • 在原位测序
  • 空间分辨转录组学
  • 分析工具箱
  • 概率细胞打字