本期《精准前沿》栏目分享斯坦福大学Sevahn K Vorperian发表于Nature Biotechnology(IF =54.908)上的一篇研究。
本期《精准前沿》栏目分享斯坦福大学Sevahn K Vorperian发表于Nature Biotechnology(IF =54.908)上的一篇研究[1],该研究通过整合最近公布的Tabula Sapiens单细胞转录组图谱数据库、公开的组织单细胞转录组图谱数据和人类蛋白图谱数据库,证实了cfRNA可追溯细胞类型来源,并提出一种细胞类型相关的signature计算方法,成功利用cfRNA表征疾病发生的细胞病理变化。
研究背景
在疾病筛查和诊断领域,细胞游离DNA(cfDNA)已经成为一种具有巨大临床应用价值的液体活检生物标志物。相比cfDNA,细胞游离RNA(Cell-free RNA,cfRNA)的研究则相对较少。然而,基于cfRNA的液体活检技术也具有一些优点,例如可追溯疾病发生的组织来源、为低肿瘤DNA脱落的患者提供早筛可能和检测基因融合。
cfRNA是一种转录本混合物,来源于身体的各个器官和细胞。目前,cfRNA在肿瘤、骨髓移植、肥胖、神经退行性疾病和肝相关疾病已有相关的研究和应用。然而,cfRNA的细胞起源仍然未知。众所周知,细胞病理学变化是疾病发生的重要基础,而利用基于cfRNA的液体活检来探究细胞的起源,将为疾病的病理机制研究提供一种无创检测手段。
研究结果
1. 利用单细胞表达谱数据识别cfRNA的细胞类型
本研究首先绘制了正常人血浆的细胞游离外显子转录组特征图谱(图 1a)。在对一些低质量的样本进行过滤后,共纳入75份正常人样本。接着,在cfRNA中对PanglaoDB数据库每种细胞类型特征基因的表达量进行检查和基因数统计。与组织水平的表达数据类似,来自血液、大脑和肝脏细胞的标记基因都能检测到,同时也发现了来自肾脏、胃肠道和膀胱细胞的基因(图 1b)。
图1. 正常人血浆的细胞游离外显子转录组特征图谱
为了明确cfRNA存在的细胞类型,研究者使用支持向量回归(support vector regression,SVR)对细胞类型特异的RNA组分进行反卷积。这里的反卷积是指利用算法和单个细胞的表达谱特征,从组织的表达谱数据中推断细胞的占比情况。著名的反卷积算法应用案例是CIBERSORT工具,它可以从肿瘤组织表达谱中预测肿瘤浸润免疫细胞类型和比例。为了更好地进行反卷积,作者利用TSP(Tabula Sapiens version 1.0)单细胞转录组图谱数据库,建立一个基因集基矩阵,作为参考信号矩阵。TSP是迄今为止最为庞大的人类泛器官单细胞转录组图谱数据库。这个基矩阵包含明确细致的细胞类型和用于注释细胞的最小判别基因集。斯皮尔曼相关性分析显示,在基矩阵中,来自相同组织成分的细胞类型会形成聚类(图 2)。同时,利用该矩阵,对多个组织的bulk转录组数据进行反卷积,能够精确地区分细胞类型并表现出很好的性能(图2)。均方根误差(Root Mean Square Error,RMSE)用于评估该算法预测值与真实值之间的偏差。预测值和真实值的相关性利用皮尔森相关性分析。结果表明,血液的RMSE值最小和相关性最强,而大脑组织的RMSE最大和相关性最弱。
图2. 反卷积方法优化和性能评估
基于该矩阵,研究者定义了血浆cfRNA表达谱中的细胞亚型。结果表明,在所有的细胞亚型中,血小板,红细胞/红系祖细胞和白细胞占大多数,各自的比例与先前报道的血清cfRNA和血浆cfDNA研究基本一致(图3)。有趣的是,研究者发现占比最大的细胞类型是血小板,而不是巨核细胞,这与已有的研究存在差异,可能与使用参考数据的细胞注释方式有关。在非造血细胞中,来源于肠道、肝脏、肺部、膀胱、心脏和肾的细胞之间具有明显的转录特征差别。受限于TSP数据库,一些组织的细胞类型并未在血浆cfRNA表达谱反卷积结果中发现。为了找到未被鉴定的细胞类型,研究者利用人类蛋白数据库(Human Protein Altas,HPA)也建立一个基因集矩阵,并与之前的矩阵作交集,结果表明,未发现细胞类型来源于大脑和睾丸,原矩阵也存在一些血液、骨骼肌和淋巴器官特异的基因未纳入的情况(图 3)。
图3. cfRNA的细胞类型分布情况
为进一步分析在反卷积过程中未鉴定的细胞类型,研究者联合使用大脑的单细胞转录组图谱数据和HPA数据库数据,并提出signature score的方法,用于量化cfRNA细胞类型的表达。signature score计算的是所有细胞特异基因经CPM-TMM归一化且log10转化后的count值之和(图 4)。细胞的signature score值越大,说明该细胞类型在外周血中的转录信号越强。
图4. signature score的计算过程
反卷积后共鉴定到五种细胞类型,分别是星形胶质细胞(Astrocyte,Ast),兴奋性神经元(Excitatory neurons,Ex),抑制性神经元(Inhibitory neuron,In),少突神经胶质细胞(Oligodendrocyte,Oli),少突神经胶质细胞祖细胞(oligodendrocyte precursor cell,Opc)。计算这些细胞signature score后发现,兴奋型神经元得分最高,紧接其后的依次是Oli、Ast、Opc和In(图 5)。胶质细胞可维持大脑内部稳态、形成髓磷脂、参与神经元的结构形成和起到支撑作用。血浆中胶质细胞cfRNA的发现可能与RNA跨膜转运、血脑屏障的通透性改变和一些脑部区域与血液直接的原因有关。之后,研究者利用胎盘、肾脏和肝脏的细胞图谱去进行cfRNA的细胞类型鉴定和signature score量化。这些发现表明,cfRNA不仅可以反映特定组织的表达谱特征,而且还可以深入到细胞类型层面。另外,cfRNA可用于描绘疾病发生前细胞转录状态的基线特征。
图5.健康人血浆cfRNA(n=18)的不同脑细胞signature scores
2. cfRNA反映疾病发生的细胞病理特征
疾病的病理性改变往往是特定细胞引起,那么利用cfRNAs识别的细胞类型能否反映疾病发生或进展的细胞特征呢?研究者利用已建立的反卷积模型,分别对先兆子痫的滋养层、慢性肾脏病(chronic kidney disease,CKD)的近端小管、酒精性脂肪性肝炎(NASH)或非酒精性脂肪肝病(NAFLD)的肝细胞和阿尔茨海默病多个脑细胞的cfRNA特征谱进行研究。在先兆子痫的研究中,主要关注的是绒毛外滋养层细胞(Extravillous trophoblast,EVT)和合胞体滋养层(Syncytiotrophoblast,SCT),然而,由这两种细胞定义的signature score无法区分先兆子痫组和正常血压组患者,以及早发型和晚发型先兆子痫(图 6)。主要原因可能与研究者的模型与原文定义这两种细胞的基因不同有关。不过,在其他的三种疾病中,cfRNA的表达谱特征都能用于区分疾病不同的病理状态。
图6. cfRNA揭示先兆子痫细胞病理学特征
CKD研究共纳入9名CKD患者和3名正常对照患者。与健康对照组相比,CKD患者组(年龄在67-91岁,CKD分期在3-5期,需要腹膜透析)位于近端小管细胞signature score显著降低(图 7)。近端小管细胞是肾脏的主要组成细胞,代谢活跃,而近端小管细胞的损伤是CKD发生的主要原因之一。肝脂肪变性是指肝脏的肝细胞胞浆内出现脂肪滴,往往会导致肝细胞死亡。在NAFLD的血清cfRNA中,可检测到编码细胞色素P450基因(CYP1A2、CYP2E1和CYP3A4)、脂质分泌相关基因(MTTP)和肝因子基因(AHSG和LECT2)的表达差异显著。进一步比较健康组(n=16)、NAFLD(n=46)和NASH组(n=163)的肝细胞signature score,发现NAFLD和NASH组的score显著高于健康组,但NAFLD和NASH组之间并没有差异(图 7)。神经元死亡和突触丢失是导致AD发生的原因之一。在AD的研究中,研究者选择两个脑的单细胞转录组数据对血浆cfRNA图谱进行脑部细胞定义,其中,由于抑制型神经元检测到细胞特异基因数较少,选择不纳入组间差异分析。结果表明,与正常对照组(n=18)相比,在AD(n=40)的血浆中,存在大量差异显著的细胞特异基因,包括星形胶质细胞特异基因(GFAP和GRIN2C)、兴奋型神经元特异基因(SLC17A7、SLC8A2、CDH8、CDH22和GRM1)、少突胶质细胞特异基因(MOBP和CNTN2)和少突胶质细胞祖细胞(OLIG2、MYT1、CSPG5和BCAN)。进一步比较AD患者和无认知障碍健康对照(NCIs)以上四种细胞的signature score,发现这些细胞的score在AD组都显著降低,这一现象与AD患者中神经元死亡和增殖抑制的病理机制是一致的。这些结果表明,cfRNA表达谱可以作为一种无创的手段,用于检测疾病相关细胞特异的病理变化。
图7. cfRNA提供一种无创手段反映疾病的细胞病理变化
结语
本研究阐明了cfRNA用于疾病细胞病理变化进行无创检测的可能性,并在已有的研究基础上进一步证实了免疫细胞和造血组织是cfRNA主要贡献者,以及发现了cfRNA可以检测到来自大脑、肺组织、肠、肝脏和肾的细胞信号。该研究也是对近期Ronen Sadeh 等研究者发表的利用血液核小体信息识别细胞身份和病理变化一种补充。未来,cfRNA包含的细胞转录特征信号有望成为一种无创检测生物标志物,用于监测疾病发生进程和体内药物反应。
END
参考文献:
[1] Vorperian SK, etal. Cell types of originof the cell-free transcriptome. Nat Biotechnol. 2022 Feb 7. doi:10.1038/s41587-021-01188-9.
撰写丨xiaosine 编辑、排版丨SX
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您