申请认证 退出

您的申请提交成功

确定 取消

时空及单细胞组学数据分析 | 时空简讯48期

2023-06-01 17:35   华大时空

将Harmony应用于各种案例,包括细胞系、使用不同技术检测的PBMC、来自多个供体和研究的胰岛细胞的meta分析、来自小鼠胚胎发生的纵向样本,以及与空间分辨表达数据集的交叉模态集成,可以有效地识别稀有细胞群。

时空简讯第48期。

为了展示当前生命科学和生物医学数据的上、下游分析方法的前沿进展,在此,遴选了10篇有关时空及单细胞组学数据分析方法的优质文章,供了解参考。

上游分析

Upstream Analysis

去噪

Sprod:基于位置和图像信息的空间转录组数据去噪方法

Nature Methods [IF:47.990]

①开发了一种名为Sprod的方法,用于去除多种空间转录组(spatially resolved transcriptomics,SRT)数据中大量存在的噪音,将表达水平被夸大的基因还原到其真实表达水平。

②Sprod利用微珠/点(beads/spots)的空间位置来确定微珠/点的邻域以借用相同类型和/或相似表达谱的细胞的信息,然后通过捕获学习的相似度图在流形(manifold)上的局部信息来生成去噪基因表达结果。

③Sprod可以在多种参数组合中很好地去除SRT数据中的噪声,并通过Visium卵巢癌数据集和人类淋巴结数据集,以及Slide-Seq小鼠大脑数据集验证了Sprod在多个STR平台、不同组织类型上的去噪能力。

④与SAVER相比,Sprod能够更准确地识别Slide-Seq小鼠海马体数据集中空间变异基因;通过分析Visium卵巢癌数据集,证明Sprod能够提升空间细胞通讯推断的效果。

⑤Sprod已经被封装为python模块,存放到https://github.com/yunguan-wang/SPROD。(大禹)

69001685577613802

Sprod去噪方法示意图

Sprod for de-noising spatially resolved transcriptomics data based on position and image information.

2022.08.04; DOI: 10.1038/s41592-022-01560-w

研究文章;小鼠,人,脑,卵巢,Sprod,空间转录组,去噪;Yunguan Wang, Bing Song, Li Wang, Tao Wang ; University of Texas Southwestern Medical Center, University of Texas at Arlington; USA.

其他算法

Metacell-2:基于并行分治算法的大数据集分解重构工具

Genome Biology [IF:17.906]

①Metacell-2(Metacell algorithm,MC2)用递归分治算法,将任意大小的scRNA-seq数据集有效分解为小而有凝聚力的一组元细胞(metacell),它可以用于缩放单细胞数据集和构建高分辨率单细胞图谱等。

②MC2使用递归两阶段推导出解决方案:首先将数据分成随机堆,并从中生成低质量的元单元和离群值;然后,递归地将低质量的元细胞分组为邻接的堆,再重新划分这些堆以生成高质量的元细胞。

③通过量化每个基因的归一化方差来评估Metacell的质量,在人外周血数据集的测试中展示的MC2的精确度和敏感性不差于基于重采样算法的MC1。

④百万级单细胞大数据集处理上,相较于PCA和Seurat的louvain,MC2的运行速度更快,同时可以有效地将其转换成可用于分析潜在转录多样性的工作模型,有助于高分辨率深入表征细胞类型内的组合和定量转录梯度。

⑤在特殊和罕见的细胞类型捕获方面,MC2通过预处理和分治法的方式,充分保留了大数据集中的稀有细胞类型,确保了检测罕见转录状态的高灵敏度。(Cole)

13551685577614076

MC2算法的原理示意图

Metacell‑2: a divide‑and‑conquer metacell algorithm for scalable scRNA‑seq analysis.

2022.04.19; DOI: 10.1186/s13059-022-02667-1

研究文章;人,小鼠,外周血细胞,骨髓细胞,胚胎细胞,scRNA-seq,流形学习,大规模转录集;Oren Ben-Kiki, Amos Tanay; Weizmann Institute of Science; Israel.

独立于基因注释的单细胞分析流程揭示物种未知的转录组

Nature Communication [IF:14.919]

①基于已有的人类、小鼠、鸡、倭狐猴、裸鼹鼠和海胆的scRNA-seq数据,创建了scRNA-seq分析程序,将所有转录活性区域(transcriptionally active regions,TAR)生成单细胞表达矩阵,涵盖了基因组已知功能的基因aTARs(annotated TARs)和未注释的活性转录区uTARs(unannotated TARs),执行单细胞TAR表达分析以识别具有生物学意义的TAR,最后使用基因同源性分析注释TAR,从而将基因组注释工作引导到具有生物学意义的转录本中,以更好地解释生物学问题。

②应用不依赖于基因注释的scRNA-seq分析流程,对来自6个物种的数据进行单细胞聚类和降维分析,比较基于aTARs和uTARs的聚类效果,发现基因注释之外的uTAR同样包含重要的生物学信息,可以准确区分细胞类型。

③对基于TAR聚类所获得的细胞簇进行差异分析,得到细胞类型之间差异表达的uTAR,再将其作为对象,用BLAST的方式确定uTAR物种间的同源物,从而对具有重要差异的uTAR进行注释,如在小鼠NK细胞差异表达的uTAR可能是GTH1基因的高度同源物。

④对鸡胚不同发育阶段的空间组数据可视化,发现心肌细胞、红细胞等多种细胞类型的uTAR表达与这些细胞的典型标记物具有一致的空间分布,从而揭示了uTARs和典型基因标记的空间共表达性质。(Cole)

52351685577614415

生成TAR和识别具有生物学意义的uTAR的工作流程

Uncovering transcriptional dark matter via gene annotation independent single-cell RNA sequencing analysis.

2021.04.12; DOI: 10.1038/s41467-021-22496-3

研究文章;人,小鼠,鸡,倭狐猴,裸鼹鼠,海胆,基因组注释,scRNA-seq,空间转录组;Michael F. Z. Wang, Iwijn De Vlaminck; Cornell University; USA.

Gruffi:从类器官转录组数据集中计算并去除应激细胞

The EMBO Journal [IF:14.012]

①开发一种使用粒度功能过滤的算法Gruffi,可以无偏倚地从任何类器官的scRNA-seq数据集中识别并去除应激细胞,从而更加有助于类器官的谱系分析和技术评价。

②相较于已有的通过基因数目或线粒体比例的过滤方法,Gruffi对应激细胞的特异性更强,不受细胞聚类边界的影响,同时,粒度单元的评估方式也克服了单细胞数据固有的噪声。

③结合5个已发表的和新获得的脑类器官scRNA-seq数据集,共保留了约160,000个细胞,发现在所有分析的类器官中都存在不同的内质网应激细胞和糖酵解细胞群(应激细胞)。

④通过Gruffi识别类器官和胎儿的细胞数据,发现应激细胞仅存在于类器官模型中,而不存在于体内的细胞群中,且实际上应激细胞的线粒体UMI比例反而偏低。

⑤通过Gruffi去除类器官中的应激细胞后,发现可以获得更清晰的类器官细胞发育轨迹,应激细胞的存在并不影响类器官中非应激神经元的数目和成熟。(Cole)

7551685577614705

Gruffi程序设计流程示意图

Gruffi: an algorithm for computational removal of stressed cells from brain organoid transcriptomic datasets.

2022.08.02; DOI: 10.15252/embj.2022111118

研究文章;人,大脑,类器官,应激细胞,scRNA-seq;Ábel Vértesy,Oliver L Eichmüller, Juergen A Knoblich; Institute of Molecular Biotechnology (IMBA), Austrian Academy of Sciences; Austria.

下游分析

Downstream Analysis 

细胞聚类

DestVI:通过反卷积识别空间转录组数据中细胞类型的连续体

Nature Biotechnology [IF: 68.164]

①开发了一种名为DestVI(Deconvolution of Spatial Transcriptomics profiles using Variational Inference)的方法,通过空间转录组数据反卷积,识别同一类型细胞转录组的连续变异。

②DestVI使用单细胞潜变量模型(single-cell latent variable model,scLVM)和空间转录组潜变量模型(spatial transcriptomic latent variable model,stLVM),以scRNA-seq数据的细胞注释结果作参考,推断各细胞类型比例以及细胞类型特异性的连续子状态。

③利用scRNA-seq数据生成的空间转录组模拟数据,比较了DestVI与其他7种同类型方法(RCTD、SPOTLight、Stereoscope等),发现在不同聚类水平条件下,DestVI都优于其他所有方法;利用sci-Space产生的小鼠胚胎皮层的空间转录组数据,证明DestVI在真实数据集中预测CTP和推断细胞类型特异性基因表达方面均优于其他方法。

④分析了Visium平台产生的小鼠淋巴结和小鼠肿瘤模型(MCA205)空间转录组数据及匹配的scRNA-seq数据,证明DestVI能够清楚地识别特定细胞类型所处的生态位,可作为探索复杂细胞类型特异性表型变化的可靠工具。

⑤DestVI作为python模块scVI-tools的一部分,存放在https://scvi-tools.org/。(大禹)

75821685577614964

DestVI工作流程示意图

DestVI identifies continuums of cell types in spatial transcriptomics data.

2022.04.21; DOI: 10.1038/s41587-022-01272-8

研究文章;小鼠,胚胎,肿瘤,空间转录组,DestVI,反卷积;Romain Lopez , Baoguo Li, Hadas Keren-Shaul, Ido Amit , Nir Yosef ; University of California, Weizmann Institute of Science; USA, Israel.

STdeconvolve: 无参考无监督的空间转录组细胞类型反卷积

Nature Communications [IF: 14.919]

①开发了一种无参考无监督的空间转录组细胞类型反卷积方法——STdeconvolve,该方法基于LDA(latent Dirichlet allocation)来推断空间转录组数据含多个细胞的像素(pixel,相当于spot)的细胞成分。

②用单细胞分辨率的MERFISH和scRNA-seq数据模拟空间转录组数据,证明STdeconvolve可以准确识别主要细胞类型的比例,发现细胞类型特异性基因表达变化,并改善聚类效果;通过分析小鼠嗅球和人类乳腺癌样本的空间转录组数据,说明STdeconvolve能够表征不同细胞类型的空间组织状况、识别肿瘤的免疫浸润。

③STdeconvolve可实现与基于参考的、有监督的反卷积方法相当的性能,并且在无理想的单细胞转录组学参考时可能具有更好的性能。

④分析包括Visium的小鼠大脑冠状切片样本、DBiT-seq的E11小鼠胚胎样本和Slide-seq的小鼠小脑样本的空间转录组数据集,证明STdeconvolve适用于不同分辨率的空间转录组数据集和技术。

⑤STdeconvolve已经被封装为R包,存放到https://github.com/JEFworks-Lab/STdeconvolve。(大禹)

66811685577615478

STdeconvolve工作流程图

Reference-free cell type deconvolution of multi-cellular pixel-resolution spatially resolved transcriptomics data.

2022.04.29; DOI: 10.1038/s41467-022-30033-z

研究文章;人,小鼠,胚胎,脑,乳腺,STdeconvolve,空间转录组,反卷积,scRNA-seq,R包;Brendan F. Miller, Jean Fan; Johns Hopkins University;USA.

SpatialDWLS:精确反卷积空间转录组数据

Genome Biology [IF:13.583]

①提出了一种准确且计算效率高的方法spatialDWLS,根据空间转录组数据,通过应用阻尼最小二乘法来推断每个选定细胞类型的分数,进而确定每个空间位置的细胞类型组成。

②与其他现有反卷积方法相比,spatialDWLS包含一个额外的过滤步骤,以去除不相关的细胞类型,在精度和速度方面更优。

③将空间SpatialDWLS应用于人类发育心脏数据集,观察到发育过程中细胞类型组成的显着时空变化。

④spatialDWLS方法可以在Giotto(http://www.spatialgiotto.com)中获取。(Imm F)

57341685577616063

spatialDWLS方法的概述

SpatialDWLS: accurate deconvolution of spatial transcriptomic data.

2021.05.10; DOI: 10.1186/s13059-021-02362-7

研究文章;人,心脏,细胞类型,空间位置,阻尼加权最小二乘法,反卷积,SpatialDWLS,空间转录组;Rui Dong, Guo-Cheng Yuan; Harvard Medical School, Charles Bronfman Institute for Personalized Medicine; USA.

拟时序分析

利用单细胞转录组进行时间建模

Nature Reviews. Genetics [IF: 59.581]

①综述了利用scRNA-seq数据进行时序分析的实验技术和数据分析方法,强调了每种方法的步骤、关键假设及它们最适合的数据类型和生物学问题,并讨论了如何通过组合不同的方法对动态的生物学过程进行建模。

②细胞动态推断的实验技术提供了单细胞水平分子事件顺序的信息,为相应的计算方法提供准确的“锚点”,主要包括RNA代谢标记、细胞类型特异性的报告基因和遗传条码等技术。

③拟时序轨迹推断可以将多个时间点的细胞连接在一起。其中基于降维和基因空间的方法使用细胞中基因的表达随着时间的推移将它们连接起来,而RNA速度则使用剪接和未剪接转录本的信息推断细胞的下一个状态。

④动态建模强烈依赖时间点内或时间点之间基因表达逐渐变化的假设,可能不适合低频采样的研究,通过整合多种数据可能克服这一问题,包括整合带有时间序列的单细胞基因表达数据和遗传信息、整合多种类型的时序数据和单细胞数据、整合带有时序的单细胞数据和相互作用数据等。(大禹)

74161685577616479

含有时间序列的单细胞研究试验设计示意图

Temporal modelling using single-cell transcriptomics.

2022.01.31; DOI: 10.1038/s41576-021-00444-7

综述;scRNA-seq,数据集成,细胞动态,拟时序分析,动态建模;Jun Ding,Ziv Bar-Joseph;McGill University Health Centre, Carnegie Mellon University; Canada, USA.

数据集成

在线学习算法iNMF实现单细胞多组学数据迭代整合

Nature Biotechnology [IF: 54.908]

①开发了一种在线新算法iNMF(integrative nonnegative matrix factorization),可对大型单细胞基因表达、染色质可及性和DNA甲基化等组学技术生成的多样化单细胞数据集进行缩放和迭代整合。

②iNMF使用固定内存扩展到任意数量的细胞,迭代并生成新数据集,并允许多个用户同时通过网络流分析一个大型数据集的单个副本,迭代数据添加还可用于将新数据映射到引用数据集。

③应用iNMF高效地整合了大型scRNA-seq数据(超过100万个细胞)和空间转录组数据集,并迭代构建了小鼠运动皮层的单细胞多组学图谱。

④与其他算法相比,随着数据集规模的增加,在线iNMF具有收敛速度快、所需内存少、运行速度快、整合效果好、稳健性强等特点。(张银)

1471685577616646

在线算法iNMF的概述

Iterative single-cell multi-omic integration using online learning.

2021.04.19; DOI: 10.1038/s41587-021-00867-x

研究文章;小鼠,运动皮层,迭代,高性能,单细胞多组学图谱,iNMF;Chao Gao, Joshua D. Welch; University of Michigan; USA.

Harmony:快速、灵敏、准确地集成单细胞数据

Nature Methods [IF: 28.547]

①介绍了一种节约成本、通量高、计算快的算法Harmony,可集成、整合分析来自不同技术来源的单细胞数据,根据细胞类型和基因表达特征,将多数据集中的细胞进行聚类、分类和分析。

②Harmony解决了单细胞整合分析的四个关键挑战:扩展到大型数据集、识别广泛的类群和精细的亚群、适应复杂实验设计的灵活性,以及跨模式整合。

③相较于BBKNN、Scanorama、MNN Correct和MultiCCa等算法,Harmony能够分析更多的细胞数据,分析时间快于其他算法30~200倍;Harmony所需的运算空间较其他算法少30-50倍,是目前唯一能够在个人计算机上集成大型数据集的算法。

④将Harmony应用于各种案例,包括细胞系、使用不同技术检测的PBMC、来自多个供体和研究的胰岛细胞的meta分析、来自小鼠胚胎发生的纵向样本,以及与空间分辨表达数据集的交叉模态集成,可以有效地识别稀有细胞群。

⑤Harmony作为R包可在github(https://github.com/immunogenomics/harmony)获取,具有独立和Seurat分析的功能。(赵超越/Lina)

15071685577616927

Harmony算法概述

Fast, sensitive and accurate integration of single-cell data with Harmony.

2019.11.18; DOI: 10.1038/s41592-019-0619-0

研究文章;Harmony,单细胞数据,多组数据集成,数据分析,细胞聚类;Ilya Korsunsky, Soumya Raychaudhuri; Brigham and Women’s Hospital, Harvard Medical School, Broad Institute of MIT and Harvard; USA.

题图设计|彭卫

排版|小飞鱼

审核|Lina、晓黎

不感兴趣

看过了

取消

简讯,数据,分析,研究

不感兴趣

看过了

取消

相关阅读

赞+1

您的申请提交成功

您的申请提交成功

确定 取消
海报

已收到您的咨询诉求 我们会尽快联系您

添加微信客服 快速领取解决方案 您还可以去留言您想解决的问题
去留言
立即提交