这些数据为探索人体不同组织和细胞类型中的基因表达提供了丰富资源。
编译:Y.too,编辑:悄咪咪、江舜尧。
原创微文,欢迎转发转载。
人类细胞类型背后的基因表达程序具有根本意义。本文构建了胎儿组织的基因表达和染色质可及性的人类细胞图谱。对于基因表达,作者对代表15个器官的>110个样本应用了三级组合索引(three-level combinatorial indexing),最终分析了约400万个单细胞。作者利用文献和其它图谱集来识别和注释组织内和组织间的数百种细胞类型和亚型。作者的分析侧重于广泛分布的细胞类型(如血液,内皮细胞和上皮细胞),胎儿红细胞生成部位(特别包括肾上腺)的器官特异性以及与小鼠发育图谱的整合(如血细胞的保守特性)。这些数据为探索人体不同组织和细胞类型中的基因表达提供了丰富资源。
论文ID
原名:A human cell atlas of fetal gene expression
译名:人类胎儿基因表达细胞图谱
期刊:Science
IF:41.845
发表时间:2020年11月
通讯作者:Jay Shendure
通讯作者单位:华盛顿大学医学院基因组学系
DOI号:10.1126/science.aba7721
实验设计
结果
1 77种主要细胞类型的鉴定和注释
作者对每个器官72241个细胞或细胞核的中位数进行了描述[图1A;最大,2005512(大脑);最小,12611(胸腺)]。尽管相对于其他大规模单细胞RNA测序(scRNA-seq)图谱的测序较浅(每个细胞约14000个原始读数),但作者在每个细胞或细胞核中恢复了相当数量的UMI(中位数863个UMI和524个基因,不包括培养细胞;图S1E)。正如预期的那样,细胞核的UMIs定位到内含子的比例高于细胞(细胞核为56%;细胞为45%;P<2.2E-16,双侧Wilcoxon秩和检验)。此后,除非另有说明,作者将用“细胞”一词来指细胞和细胞核。
通过性别特异性基因表达(图S1F),很容易确定组织来源于男性(n=14)或女性(n=14)。15个器官中的每一个都由多个样本(中位数8)表示,每个样本至少包括两个性别(图S1G)和一系列估计的后孕周数(图1B)。Pseudo-bulk转录组按器官而不是个体或实验聚集[图S1H;GEO的文件S4和S5(GSE156793)]。大约一半的表达的蛋白质编码转录本在pseudo-bulk转录组中差异表达[20033的11766;错误发现率(FDR)为5%;表S2]。
作者应用Scrublet检测到6.4%的可能性双重细胞,对应于12.6%的双重估计,包括簇内和簇间双重细胞(图S1I)。然后应用作者先前开发的可扩展策略去除低质量细胞、双重富集簇以及HEK293T和NIH/3T3细胞中的峰值。下面的所有分析都集中于从112个胎儿组织样本中提取的4062980个人类单细胞基因表达谱,这些样本在过滤后仍然存在。
图1 数据生成和识别15个人体器官的细胞类型。(A)项目工作流程(左)和条形图(右)显示每个器官以log10标度分布的细胞数量。(B)条形图显示对应于每个器官的组织样品的估计孕后周数的分布。(C)在对低质量细胞和富含双峰的簇进行过滤后,400万个单细胞基因表达谱在每个器官的基础上进行UMAP可视化,并用Monocle 3进行Louvain聚类。
利用monocle3,作者对单细胞基因表达谱进行UMAP可视化和Louvain聚类分析。总之,作者根据细胞类型特异性标记基因表达初步确定并注释了172种细胞类型[图1C和表S3;GEO的文件S6和S7(GSE156793)]。在折叠了跨组织的共同注释后,这些细胞减少到77种主要细胞类型,其中54种仅在单个器官中观察到(例如,小脑中的浦肯野神经元),23种在多个器官中观察到(例如,每个器官中的血管内皮细胞)。有15种细胞类型,作者未能注释(图1C中由一对标记命名的子集);这些将在下面进一步讨论。这77种主要细胞类型中的每一种都由中位数4829个细胞表示,从1258818个细胞(大脑中的兴奋性神经元)到68个细胞(肾上腺中的SLC26A4-和PAEP阳性细胞)(图S2A)。在多个个体中观察到每种主要细胞类型(中位数9;图S2B)。尽管在物种、发育阶段和技术方面存在差异,但作者几乎恢复了以前针对相同器官的图谱工作所确定的所有主要细胞类型。作者确定了每个器官中位数12种主要细胞类型,范围从5(胸腺)到16(眼睛、心脏和胃)。作者没有观察到异型细胞的数量和确定的细胞类型的数量之间的相关性(Spearman=-0.10,P=0.74)。
平均而言,作者确定了每个主要细胞类型的11个标记基因(最小值为0;最大值为294;定义为差异表达基因,第一和第二位细胞类型之间的表达差异至少为5倍;FDR为5%;图S2C和表S4)。由于其他器官中高度相关的细胞类型(如肠胶质细胞和施旺细胞),有几种细胞类型在这个阈值缺乏标记基因。基于这个原因,作者通过相同的程序确定了一组组织内标记基因,,但是以器官为基础的(平均每种细胞类型147个标记;最小值12个;最大值778个;图S2D和表S5)。一个交互式网站有助于按组织、细胞类型或基因探索这些数据(descartes.brotmanbaty.org)。
尽管典型标记通常被观察到,并且对作者的注释过程有着至关重要的作用,但据作者所知,大多数观察到的标记在之前的研究中没有被识别。例如,OLR1, SIGLEC10和非编码RNA RP11-480C22.1是最强的小胶质标记,以及更成熟的小胶质标记,如CLEC7A, TLR7和CCL3。正如预期的那样,考虑到这些组织正在发育,77种主要细胞类型中有许多都包括从前体到一种或几种终末分化细胞类型的过程。例如,大脑兴奋性神经元表现出一个连续的轨迹,从PAX6+神经元祖细胞到NEUROD6+分化神经元,再到SLC17A7+成熟神经元。在肝脏中,肝祖细胞(DLK1+、KRT8+和KRT18+)表现出通往功能性肝细胞(SLC22A25+、ACSS2+和ASS1+)的连续轨迹(图S2、G和H)。与小鼠器官发生相比,在这些数据中,转录程序的成熟与发育时间紧密耦合,细胞状态轨迹与估计的后孕周数不一致(图S2、I和J)。一个可能的解释是,基因表达在胚胎期明显比在胎儿发育期更具动态性。然而,估计的后孕周数的不准确也有可能混淆作者的解决方案。
除了这些细胞类型的人工注释外,作者还使用Garnett为每个器官生成了半自动分类器。Garnett分类器的产生与以前的聚类无关,标记基因是从文献中单独汇编的。Garnett的分类与手工分类一致(图S3A)。利用这些数据训练的Garnett模型,作者能够从其他单细胞数据集中准确地分类细胞类型,包括用不同方法产生的数据以及来自成人器官的数据。当作者将胰腺分类器应用于inDrop-scRNA-seq数据时,Garnett正确地注释了82%的细胞(聚类扩展;11%不正确,8%未分类)(图S3B)。这些模型可广泛用于来自不同器官的单细胞数据的自动细胞类型分类(图S3C;descartes.brotmanbaty.org)。
接下来,作者通过使用支持向量机(SVM)分类器的数据集内交叉验证来评估作者的主要细胞类型的特异性。在这个框架中,高交叉验证精度和召回率值表明来自给定簇的细胞可以稳定地重新分配到该簇;因此,作者使用高F1分数作为将细胞簇识别为有效类型的标记,至少在识别的组织的设置中是如此。作者首先在肾脏上应用了这种方法。正如预期的那样,注释的肾细胞类型具有比对照细胞类型高得多的特异性评分(中值0.99),其中细胞标记在交叉验证之前排列(中值0.17)[图2A(仅最左图),图2B(左图仅),图S4A和表S3]。
然后,作者将这种方法应用于每个器官的细胞。再次,注释的主要细胞类型显示出比置换细胞类型高得多的特异性评分(图2C和图S4B;中值0.99对0.10;P<2.2×10-16,双侧Wilcoxon秩和检验)。尽管细胞数量较少,但15种最初未注释的细胞类型中的大多数也表现出高特异性评分(中位数0.98)。例外情况可能更好地描述为其他细胞类型的亚型。作者还将这种方法应用于77种主要细胞类型(即不是逐个器官)的合集中,结果相似(图S4C)。
2 细胞亚型的自动初步注释
为了鉴定细胞亚型,作者对任何给定组织中具有>1000个细胞的主要细胞类型进行无监督聚类。对于每个组织中的每种主要细胞类型,作者首先应用批量校正,然后进行降维和Louvain聚类(图2A)。在通过上述的内部交叉验证程序不容易区分的簇之后,在15个组织中共鉴定了657个细胞亚型,每个组织中有824个细胞的中值。所有亚型由至少两个个体贡献的细胞组成(中位数7)。不出所料,考虑到用于形成簇的程序,这些亚型具有比置换对照更高的特异性评分(中值0.77对0.13;P<2.2×10E-16,双侧Wilcoxon秩和检验;图2C)。
作者接下来试图利用现有的小鼠细胞图谱来自动注释这些人类亚型时尚作者之前开发的细胞类型交叉匹配方法,作者可以将606个(99%)人类细胞亚型中的605个与来自小鼠细胞图谱(mouse cell atlas,MCA)的相应胎儿和/或成人组织中的至少一种细胞类型相匹配(特异性评分β>0.01,与作者相同的阈值用于以前与MCA对齐;51个肾上腺亚型被排除,因为相应的MCA组织不可用)(表S6和图S5至S8)。此外,148个(52%)脑或小脑亚型中有77个(52%)与小鼠脑细胞图谱(MBCA)中至少一种成年细胞类型匹配(图S9)。
尽管存在物种差异,但许多人类细胞亚型与小鼠细胞类型1:1匹配。例如,人肾中不同的上皮亚型与注释的MCA细胞类型1:1匹配(图2A),并且人脑中不同的神经元亚型与注释的MBCA细胞类型1:1匹配(图S9)。值得注意的是,尽管有许多匹配单一MCA或MBCA细胞类型的人类亚型(例如图S5中的成肝细胞和图S9中的少突胶质细胞),但这些可能反映了真正的异质性,如其特异性评分所证明的(图2C)。需要额外的工作来注释更大粒度的子类型。
图2 细胞亚型的鉴定。(A)细胞亚型鉴定流程。(B)用于肾内主要细胞类型(左)和后肾亚型(右)的SVM分类器的数据集内细胞类型交叉验证混淆矩阵。(C)箱形图显示来自数据集内交叉验证的置换对照,主要细胞类型和亚型的细胞特异性评分(F1评分)分布。
3 组织间整合和最初未注释细胞类型的研究
4 器官间血液谱系发育特征
这一数据集的性质为系统研究广泛分布的细胞类型(例如血细胞)中的器官特异性基因表达差异创造了机会。作者对来自所有15个器官的103766个与造血细胞类型相对应的细胞进行了重新分类(图4A)。Wethen进行了Louvain聚类并进一步注释了细粒度血细胞类型,在某些情况下识别了非常罕见的细胞类型(图4B)。例如,髓样细胞分为小胶质细胞、巨噬细胞和多种树突状细胞亚型[CD1C+、S100A9+、CLEC9A+和浆细胞样树突状细胞(pDCs)]。小胶质细胞团主要来源于脑组织,与巨噬细胞有很好的分离,这与它们不同的发育背景是一致的。淋巴细胞聚集成若干组,包括B细胞、自然杀伤(NK)细胞、ILC3细胞和T细胞,后者包括胸腺。作者还回收了非常罕见的细胞类型,如浆细胞(139个细胞,主要在胎盘中,占所有血细胞的0.1%或完整数据集的0.003%)和TRAF1+抗原呈递细胞(APCs)(189个细胞,主要在胸腺和心脏中,占所有血细胞的0.2%或完整数据集的0.005%)。
为了验证这些注释,作者将来自所有器官的胎儿血细胞与来自胎儿肝脏的血细胞的scRNAseq图谱整合(图4C,左图和图S14A)。尽管方法不同,但两个数据集的相应细胞类型高度重叠;与1231个人类胚胎血细胞的另一个scRNA-seq数据集进行整合分析时也是如此(图S14B)。值得注意的是,通过CD45+荧光活化细胞分选(FACS)富集鉴定的一些极为罕见的细胞类型(例如VCAM1+EI巨噬细胞、单核细胞前体细胞和中性粒细胞-髓系祖细胞)在作者的数据中没有注释。另一方面,作者捕获了来自肝脏以外组织的胎儿血细胞,例如脑中的小胶质细胞,以及胸腺和脾脏中的T细胞和B细胞。此外,由于它们跨越多个器官,作者能够更好地捕捉从造血干细胞和祖细胞(HSPC)到淋巴细胞的细胞状态转换路径,而不是单个器官研究(图4C,右图)。
尽管针对不同免疫细胞类型的基因表达标记物已被广泛研究,但这些标记物可能通过一组受限的器官或细胞类型受到其定义的限制。在这里,作者发现许多传统的免疫细胞标记物在多种细胞类型中表达。例如,T细胞的常规标记物也在巨噬细胞和树突状细胞(CD4)或NK细胞(CD8A)中表达,与其他研究一致(图S14C)。作者计算了14种血细胞类型的泛器官细胞类型特异性标记物(图4D和表S7)。由此作者观察到T细胞如预期的那样特异性表达CD8B和CD5,但也表达TENM1(图4D和图S14C)。ILC3细胞,其注释是根据其RORC和KIT的表达来确定的,通过SORCS1和JMY进行更特异的标记(图4D和图S14C)。通过panorgan分析确定这些和其他标记物可能有助于标记和纯化特定的血细胞类型。
正如预期的那样,不同的器官显示出不同比例的血细胞(图4E)。例如,肝脏中的成红细胞比例最高,这与其作为胎儿红细胞生成的主要部位的作用一致,而胸腺中的T细胞和脾脏中的B细胞则较丰富。几乎所有从小脑和大脑中恢复的血细胞都是小胶质细胞。同时还获得了ILC3细胞和树突状细胞亚型的组织分布(图4E和图S14D)。泛器官分析还可以鉴定特定器官中的稀有细胞群。作者在肝脏中发现了罕见的热休克细胞,但也发现了在转录上与肺、脾、胸腺、心脏、肠、肾上腺和其他器官中的热休克细胞相似的罕见细胞(图S15)。亚聚类分析显示,肝外的HSPC以及肝HSPC的一个子集表达分化标记物,如LYZ、ACTG1和ANK1,而大多数肝HSPC表达MECOM和NRIP1,这两种标记物都是正常静态HSPC维持和功能所必需的(图S15)。
以红细胞生成为重点,作者观察到从HSPC到中间细胞类型、红系嗜碱性巨核细胞偏向祖细胞(EBMP)的连续轨迹,然后分裂为红系、嗜碱性巨核细胞和巨核细胞轨迹(图5A和表S8),与最近对小鼠胎肝的研究一致。尽管物种(人类与小鼠)、技术(sci-RNA-seq3与10x基因组学)和组织(仅泛器官与肝脏)存在差异,但这种一致性仍然存在。通过无监督聚类和采用该研究中的术语,作者进一步将红系状态的连续体划分为三个阶段:早期红系祖细胞(EEPs)(以SLC16A9和FAM178B为标志)、红系祖细胞(CEPs)(以KIF18B和KIF15为标志)和红系终末分化状态的细胞(ETDs)(由TMCC2和HBB标记)(图5B)。巨核细胞的早期和晚期也很容易识别(图5A和B)。
正如所料,鉴于它们在胎儿红细胞生成中的既定作用,肝脏和脾脏中的一部分血细胞对应于EEPs、CEPs和巨核祖细胞。值得注意的是,作者在每个研究样本的肾上腺中也观察到EEP、CEP和巨核祖细胞(图5C和图S16A)。因为作者没有观察到在肝脏和脾脏中更常见的细胞类型,肾上腺恢复期间的轻微污染是一个不太可能的解释。尽管在人类胚胎的肾上腺中偶尔观察到髓外造血岛,但个体间的一致性使作者进一步研究肾上腺是否可以作为哺乳动物红细胞生成的正常部位。人胎儿肾上腺组织的免疫组化分析显示CD34+血管外有核GYPA+细胞(图5D和图S16B)。作者进一步利用影像流式细胞术观察和计数小鼠围产期成熟的红细胞前体和去核红细胞。肾上腺中约8%的活游离细胞由成熟的红细胞组成,而肾脏中的活游离细胞为0.2%(图5E)。肾上腺也是一个正在进行的红细胞生成的部位,其未成熟到成熟的红细胞的分布与成年小鼠骨髓的分布非常相似(图5E和F)。
巨噬细胞分布更广。作者将所有巨噬细胞与脑中的小胶质细胞进行比较,并对它们进行UMAP可视化和Louvain聚类,与其他细胞类型无关(图5G和H;图S16C;和表S9)。值得注意的是,小胶质细胞被分为三个亚群,其中一个亚群以IL1B和TNFRSF10D为标志,很可能代表激活的小胶质细胞表达参与神经系统正常发育的促炎细胞因子。其他小胶质细胞簇的标志是TMEM119和CX3CR1(更常见于大脑)或PTPRG和CDC14B(更常见于小脑)的表达。
脑外的巨噬细胞分为三大类(图5G和H;图S16C;和表S9):(i)抗原呈递巨噬细胞,主要存在于胃肠道器官(肠和胃),以抗原呈递(如HLA-DPB1和HLA-DQA1)和炎症激活基因的高表达为特征[如AHR];(ii)在大多数器官中发现的血管周围巨噬细胞,具有特异性表达的标记物,如F13A1和COLEC12,以及标记物,如RNASE1和LYVE1;(iii)吞噬性巨噬细胞,富集于肝、脾和肾上腺(图5I),具有特异性表达的标记物,如CD5L、TIMD4和VCAM1。吞噬性巨噬细胞在晚期红细胞摘除形成网织红细胞后,对于清除核蛋白原细胞(所谓的挤出核)至关重要;它们在肾上腺中的观察与其作为正常胎儿红细胞生成的附加部位的上述潜在作用相一致。下面,作者利用与小鼠器官发生图谱的整合来研究小胶质细胞和巨噬细胞的血细胞特性和发育起源的保守程序。
图4 血细胞亚型和发育轨迹的鉴定和表征。(A和B)由器官类型(A)和细胞类型(B)着色的血细胞类型的UMAP可视化和基于标记的注释。(C)UMAP血细胞可视化,整合到本研究的所有器官和人胎肝血细胞的scRNA-seq图谱。(D)点图显示每种细胞类型的两种选择的标记基因的表达。(E)条形图显示来自17种注释血细胞类型中的每一种的每个器官的估计细胞分数。
5 跨器官内皮和上皮细胞的特征
作为对跨多个器官的单一细胞类别的第二次分析,作者重新分类了89291个内皮细胞(ECs),它们对应于血管内皮(VECs)、淋巴内皮(LECs)或心内膜。这三个组很容易分离,并且血管内皮细胞至少在某种程度上通过器官进一步聚集(图S17A-C)。与动脉、毛细血管和静脉之间的差异相比,器官特异性差异更容易检测到,这与成年小鼠以前的细胞图谱一致。作者对来自人类胎儿组织(本研究)和小鼠成体组织(图S17,Dand E)的内皮细胞进行了综合分析。人和小鼠内皮细胞首先通过血管、淋巴管和心内膜进行分离,然后通过器官进行分离。来自同一组织的血管内皮细胞通常聚集在一起,尽管在物种、发育阶段和技术上存在差异。器官特异性内皮细胞的保守标记易于鉴定(图S17F)。
差异基因表达分析鉴定了700个在ECs亚群中特异性表达的标记物(FDR为0.05,第一和第二排列簇之间的表达差异超过两倍)(图S17G和表S10)。大约三分之一的这些编码膜蛋白,其中许多似乎对应于潜在的专门功能。与小鼠的观察结果一致,脑内皮细胞特异性表达氨基酸转运(q=5.6E-10)和羧酸转运(q=4.2E-8)的基因集;肺内皮细胞特异性表达3,5单磷酸腺苷(cAMP)和环核苷酸(q=1.4E-3)分解代谢的基因集,以及血管内皮细胞来自胃肠道、心脏和肌肉的特异性表达的与干细胞分化有关的基因集(q=3.7E-2)。在这些差异的潜在基础上,人胎儿内皮细胞表达不同的转录因子(transcription factors,TFs)(图S17H)。例如,LECs特异性表达TBX1,脑VECs特异性表达FOXQ1和FOXF2,肝VECs特异性表达DAB2,所有这些都与在小鼠中的观察结果一致。
作为对广泛分布的细胞类型的第三次分析,作者重新分类了28262个上皮细胞,这些上皮细胞来源于所有器官,并对其进行UMAP显示(图S18A和B)。尽管某些上皮细胞类型具有高度的器官特异性,例如腺泡(胰腺)和肺泡细胞(肺),但功能相似的上皮细胞通常聚集在一起(图S18C)。
在上皮细胞内,鉴定出两个神经内分泌细胞簇(图S18C)。其中较简单的一种与肾上腺嗜铬细胞相对应,并以HMX1(NKX-5-3)的特异性表达为标志,HMX1是一种参与交感神经元分化的TF。另一簇由来自多个器官(胃、肠、胰腺和肺)的神经内分泌细胞组成,以NKX2-2的特异性表达为特征,NKX2-2是一种在胰岛和肠内分泌分化中起关键作用的TF。作者对后一组进行了进一步分析,确定了五个亚群(图S18,D至F):(i)胰岛β细胞,以胰岛素表达为标志;(ii)胰岛α和γ细胞,以胰多肽和胰高血糖素表达为标志;(iii)胰岛δ细胞,以生长抑素表达为标志;(iv)肺神经内分泌细胞(PNECs),以ASCL1和NKX2-1的表达为标志,这两种TFs在肺中指定该谱系中起关键作用;和(v)肠内分泌细胞。肠内分泌细胞进一步包括几个亚群,包括表达NEUROG的胰岛epsilon祖细胞、在胃和肠中表达TPH1的肠嗜铬细胞以及表达胃泌素或胆囊收缩素的G、L、K和I细胞。最后,作者在胃和肠中观察到表达ghrelin的肠内分泌祖细胞,在发育中的肺中也观察到表达ghrelin的内分泌细胞(图S18F)。神经内分泌细胞的多种功能与其分泌蛋白密切相关;作者鉴定了1086个分泌蛋白编码基因在神经内分泌细胞中差异表达(FDR为0.05)(图S18G和表S11)。例如,PNEC表现出三叶肽因子的特异性表达,三叶肽因子参与粘膜保护和肺纤毛细胞分化;胃泌素释放肽,刺激胃G细胞释放胃泌素;SCGB3A2,一种与肺发育相关的表面活性剂。
作者利用这些数据来探索细胞轨迹,进一步研究了上皮细胞多样化导致肾小管细胞的途径。结合并重新分类输尿管芽和后肾细胞,作者确定了前体和终末肾上皮细胞类型,其分化途径与最近对人类胎儿肾的研究高度一致(图S19A)。通过差异基因表达分析,作者进一步确定了TFs可能调节其规格(图S19B和表S12)。例如,后肾轨迹中的肾单位祖细胞特异性表达高水平的间充质和meis同源框基因(MEOX1、MEIS1和MEIS2),而肾小囊脏层细胞特异性表达MAFB和TCF21/POD1。另一个例子是,HNF4A在近端小管细胞中特异性表达。该基因的突变导致范科尼肾小管综合征,一种特异性影响近端小管的疾病,HNF4A最近被证明是小鼠近端小管形成所必需的。
6 整合人类和老鼠的发育图谱
从胚胎发育到胎儿发育的转变是相当重要的,但是获得人类胚胎组织比获得胎儿组织更为有限。为了再次利用小鼠,作者试图将这些人类胎儿数据与小鼠器官发生细胞图谱(MOCA)整合,作者之前已经分析了200万个来自E9.5到E13.5之间未分离胚胎的细胞。在上下文中,这个窗口对应于人类发育的第22天到第44天,而这里研究的组织估计来自第72天到第129天。
首先,作者通过细胞类型交叉匹配的方法,将这里定义的77种主要细胞类型与MOCA定义的器官发生发展轨迹进行了比较。大多数人类细胞类型与一个主要的小鼠轨迹和亚轨迹强烈匹配(图S20和表S13和S14)。这些通常与预期相符,尽管一些差异有助于修正MOCA(参见图S20和S21)。许多缺乏强1:1匹配的人类细胞类型和小鼠细胞类型[求和的非负最小二乘(NNLS)回归系数<0.6]对应于其他数据集中排除的组织(例如,小鼠胎盘和人类皮肤和性腺)。其他模棱两可之处可能来自研究的发育窗(如肾上腺细胞类型)、稀有性(如双极细胞)和/或复杂发育关系(如源自多个胚胎轨迹的胎儿细胞类型)之间的差距。
第二,作者试图将人和小鼠细胞直接共植入到一起。简言之,作者从MOCA(随机)中抽取100000个小鼠胚胎细胞和约65000个人类胚胎细胞(77种细胞类型中每种最多1000个细胞),并对其进行综合分析。所得到的UMAP可视化中小鼠细胞的分布与作者对MOCA的整体分析相似(图6A-C和图6S21至S23)。此外,尽管存在物种差异,人类胚胎细胞的分布以一种尊重细胞类型间发育关系的方式占绝对优势。例如,人类胎儿内皮细胞、造血细胞、肝细胞、上皮细胞和间充质细胞都映射到相应的小鼠胚胎轨迹(图6B和图S21)。在每个主要轨迹中,小鼠细胞按连续时间点排列,而人类胚胎细胞似乎从最后一个(E13.5)小鼠胚胎时间点开始投射(图6C)。在前肠下段水平,seniscal映射包括来自小鼠中肠后肠下段的人胎儿肠上皮细胞;来自小鼠前肠上皮下段的人胎儿壁细胞和主细胞(胃)以及腺泡细胞和导管细胞(胰腺);来自小鼠肺上皮轨迹的人胎儿细支气管和肺泡上皮细胞;分别来自小鼠胚胎肾上皮轨迹的人胎儿输尿管芽和后肾细胞;以及许多其他细胞(图S21=S23)。
不过,也有一些惊喜。例如,尽管中枢神经系统(CNS)神经元映射到神经管轨迹,肠神经系统(ENS)胶质细胞和施旺细胞映射到周围神经系统(PNS)胶质细胞轨迹,但一些神经嵴衍生物包括ENS神经元、内脏神经元、交感神经母细胞,嗜铬细胞与相应的小鼠胚胎轨迹分开聚集(图S21至S23),可能是由于发育阶段或物种之间的过度差异。人类胚胎星形胶质细胞聚集在小鼠胚胎神经上皮轨迹上[小鼠星形胶质细胞直到E18.5才发育]。人类胎儿少突胶质细胞与一种罕见的小鼠胚胎下节(Pdgfra+胶质细胞)重叠,回顾起来,这种细胞更可能与少突胶质细胞前体(Olig1+、Olig2+和Brinp3+)相对应,这使作者以前对不同Olig1+下节作为少突胶质细胞前体的注释产生疑问。这些和其他意想不到的关系值得进一步调查。
为了更详细地评估小鼠胚胎细胞和人类胚胎细胞之间的关系,作者应用相同的策略从造血(图6D和图S24)、内皮(图S25)和上皮(图S26)提取细胞。在这些可视化中,作者观察到器官解析的人类数据将整个胚胎小鼠数据反褶积成更细粒度的子集。例如,小鼠白细胞胚胎亚区的亚群映射到特定的人类血细胞类型,例如HSPC、小胶质细胞、巨噬细胞(肝和脾)、巨噬细胞(其他器官)和树突状细胞(DC)(图6D)。通过相关血细胞标记物的表达(图S24C)进一步验证了这些亚群,并根据其人类k近邻(k=3)在共植入中进行注释(图S24D)。
在1087个人类胎儿血细胞类型特异性基因标记中,有337个基因在同一细胞类型中差异表达(FDR为0.05)(图6E和表S15;比较而言,只有12个基因在标签排列后交叉)。在这337个保守标记中,共有28个是TFs,其中24个以前曾被报道参与早期血细胞分化或维持靶细胞类型,例如HLF作为HSPC静止的关键调节因子,MITF作为驱动肥大细胞分化的因子,PAX5作为B细胞发育的主要调节因子,SOX6促进红系祖细胞分化。然而,28个保守标记物TFs中有4个在相关背景中尚未被描述:IL3细胞中的NR1D2,巨噬细胞中的TCF7L2,巨核细胞中的FHL2,小胶质细胞中的NUAK1。
在同样的分析中,人胎儿巨噬细胞和小胶质细胞形成不同的簇,但它们是由来自白细胞轨迹的小鼠细胞子集连接起来的(图6D),这与先前的研究表明这两种细胞类型都与卵黄囊祖细胞分化相一致。为了进一步探索这一点,作者采用无监督轨迹分析法提取并重新分析了4327个小鼠胚胎小胶质细胞和巨噬细胞。作者观察到三种平滑的细胞分化轨迹,从脑中的一个共同祖细胞到小胶质细胞,吞噬巨噬细胞(TIMD4+和CD5L+;主要在肝、脾和肾上腺)和血管周围巨噬细胞(F13A1+和LYVE1+;广泛分布)(图S27A和图5)。沿着每个巨噬细胞轨迹通过假时间的进展方向与实际发育时间一致(图S27B)。总共有1412个基因,包括111个TF,在三个巨噬细胞分支中差异表达(表S16)。例如,小胶质细胞轨迹显示BACH2和RUNX3以及已知的小胶质细胞调节因子SALL1和MEF2A、血管周围巨噬细胞DAB2和TCF7L2以及吞噬巨噬细胞MAFB和NR1H3的表达升高(图S27C)。总的来说,这些分析说明了胎儿注释如何用于识别和描述特定谱系的祖细胞在发育时间点上的特征,在这些时间点上,它们可能很难单独解决,甚至跨物种。
讨论
所有生物都是由细胞组成的,细胞是生命最基本的单位,这一细胞理论提出两个世纪后,研究人员正在对构成人体的所有细胞类型进行分类和表征,包括健康和疾病。为此,单细胞生物学领域正以惊人的速度发展,这是由新技术和新计算方法之间的协同作用推动的。仅在过去几年中,这种协同作用就使得许多人体器官以及整个模式生物的单细胞图谱具有吸引力和信息量。
人类的发育是一个非凡的过程,从受精卵开始,经过一个生发阶段,然后是胚胎发生。到第10周结束时,胚胎已获得其基本形态,称为胎儿。在接下来的30周里,所有器官都继续生长和成熟,不同的终末分化细胞类型从它们的祖细胞中产生。虽然用单细胞方法对人和小鼠的生发期和胚胎发生期进行了深入的研究,但对胎儿期的研究却更具挑战性。虽然最近出现了一些关于人类胎儿发育的单细胞研究,但这些研究仅限于单个器官或细胞谱系,不能获得全面的观点。
在这项研究中,作者着手利用人类胚胎发育过程中获得的不同组织,生成基因表达和染色质可及性的单细胞图谱。从15个不同的器官中,作者成功地分析了约400万个单细胞的基因表达和约80万个单细胞的染色质可及性。这些数据集的局限性包括采样不均匀(即某些器官中的细胞比其他器官中的细胞多)、组织缺失(最显著的是骨髓、皮肤、骨和性腺)、相对较低的测序深度以及单细胞分子图谱的稀疏性。尽管如此,作者确定了数百种细胞类型和亚型,这些类型和亚型得到了一个用于量化特异性的框架的支持,并且通过将几乎所有的细胞类型和亚型与已发表的小鼠图谱中的细胞类型或亚型相匹配。
与器官特异性研究相反,这里描述的组织的多样性使得广泛分布的细胞类型的跨组织比较成为可能。作者注释细胞类型的过程从迄今为止产生的大量特定人体器官或其他哺乳动物的单细胞图谱中受益匪浅。当然,注释过程中的决策可能是主观的(例如,过度聚类和欠聚类),这里所做的细胞类型和子类型注释都应该被认为是初步的,并且需要修改。
作者在胎儿肾上腺中观察到的明显造血与肾上腺以及许多其他器官(如脾脏、肝脏和淋巴结)可以作为成人骨髓外造血的场所这一事实是一致的,这些病理因素导致对血细胞生产的需求增加,尤其是血红蛋白病。虽然在人类胚胎的肾上腺中偶尔可以看到髓外造血岛,但作者在人类和小鼠身上的发现提供了定量证据,证明肾上腺是正常的,尽管很小,在发育期内,与从肝脏到骨髓的造血转变重叠的红细胞生成部位。
作者整合了小鼠器官发生和人类胚胎发育的单细胞特征,特别是考虑到这些代表哺乳动物发育的不同阶段,更不用说人类与小鼠的分离超过1亿年的进化。数据集的相对直接的排列突出了对单个细胞类型的分子程序的进化限制的程度,并且它进一步支持了老鼠作为研究人类发育的强大模型系统的长期使用。
展望未来,作者设想在这里研究的妊娠中期人类发育的狭窄窗口将得到早期和晚期时间点(如胚胎和成人)的额外图谱的补充,以及来自模式生物的数据的类似的综合分析和整合。持续发展和应用与空间、表观遗传学、蛋白质组学、谱系史和其他信息相一致的确定基因表达和染色质可及性的方法对于获得从单细胞合子开始的人类细胞类型多样性的时间展开的全面视图是必要的。
迄今为止,对人类发育的研究大多是间接的,关键的分子因素由人类遗传学提名,然后在模式生物和/或体外系统中进行研究。对基因表达和调控的体内研究还很有限。在填补这一空白的过程中,作者希望这一图谱能够更好地了解人类罕见和常见发育障碍的分子和细胞基础,同时也为成功治疗提供信息。
人点赞
人收藏
打赏
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!