单细胞RNA-seq和大体RNA-seq的综合分析揭示了三阴性乳腺癌中与T细胞相关的预后风险模型和肿瘤免疫微环境调控机制
各位小伙伴大家好!今天给大家分享一篇北京中医药大学中药学院吴嘉瑞教授团队今年7月发表在Computers in Biology and Medicine(IF=7.7)上的文章。文章联合公共数据集的bulk和scRNA-seq数据,利用轨迹分析、富集分析、细胞间通讯分析等多重策略探究了三阴性乳腺癌(Triple negative breast cancer,TNBC)中T细胞的异质性,进而根据T细胞的marker基因在bulk RNA-seq队列中构建预后模型,并分析TNBC免疫浸润的程度。
研究背景
三阴性乳腺癌是一种缺乏孕酮受体(Progesterone receptor,PR)、雌激素受体(Estragen receiver,ER)和人类表皮生长因子受体2的侵袭性乳腺癌。TNBC患者的肿瘤内部异质性大,侵袭能力强,临床预后较其他亚型更差,生存率更低。但是目前针对已发生转移的TNBC患者的新辅助化疗方案的中位总生存期较短。作者通过对T细胞、bulk RNA-seq和临床数据的综合分析,描述了TNBC的肿瘤免疫微环境以及T细胞与临床预后之间的关系()。
图 1 研究流程
研究结果
结果一、TNBC的细胞组成
10个TNBC样本的25932个细胞分为14个簇并根据CellMarker数据库和文献收集的marker基因注释为7种细胞()。
根据文献的marker基因,将T细胞分为:高表达IL7R、FOXP3和CCR7的CD4+ T细胞;高表达GZMH、CD8B和CD8A的CD8+ T细胞()。
图 2 TNBC的scRNA-seq的整合和聚类
图 3 T细胞亚群图谱
结果二、T细胞的细胞间互作分析
为了探究T细胞与其他类型细胞的细胞间互作特点,作者使用Cellchat分析细胞亚群间互作的潜在配体-受体对()。作者发现细胞间相互作用主要存在于MIF信号通路中(MIF-CD74+CXCR4和MIF-CD74+CD44)(D),其中配体-受体对MIF-CD74+CXCR4对该通路的贡献最大(E)。基因ACKR3和CXCR2的表达也与这一信号通路有关(F)。
图 4 T细胞的细胞间通讯分析
结果三、T细胞发育轨迹
Monocle2将T细胞分为7种分化状态,不同状态下CD4+ T细胞和CD8+ T细胞的含量不同(A)。随伪时间变化,基因表达变化分为4组,分别与淋巴细胞介导的免疫、蛋白折叠、免疫球蛋白和细胞质翻译有关(B)。T细胞的marker基因的表达在不同分化时期发生动态改变(C)。
图 5 TNBC中T细胞的发育轨迹分析
结果四、T细胞的富集分析
作者进行了GO、KEGG和GSEA富集分析来阐明T细胞marker基因的生物学功能()。GO富集分析生物过程(BP)主要与细胞质翻译、抗原处理和呈递、T细胞活化调控、肽酶活性调控和白细胞-细胞粘附有关;细胞成分(CC)主要与病灶粘附、基底细胞连接、细胞质核糖体、核糖体和核糖体亚基有关;分子功能(MF)与核糖体的结构成分、钙调素结合、MHC II类蛋白复合物结合、MHC蛋白复合物结合和未折叠蛋白结合有关。KEGG中marker基因主要富集在T细胞被激活发挥作用的通路中,包括Th1和Th2细胞分化、Th17细胞分化、细胞粘附分子、T细胞受体信号通路、肌动蛋白细胞骨架和PD-L1表达调控以及癌症中的PD-1检查点信号通路。GSEA结果则涉及T细胞受体信号通路。
图 6 T细胞marker基因的富集分析
结果五、预后模型构建和验证
将选定的1299个T细胞的marker基因插入到METABRIC数据集的TNBC矩阵中。然后对METABRIC队列中106个潜在预后基因进行单变量COX回归分析,再进行Lasso和多变量Cox回归分析(多变量Cox回归对Lasso分析的可靠性因素进行分析),OPTN、TMEM176A、PKM和HES1四个基因被鉴定为独立预后基因。独立预后基因将TNBC患者分为低风险和高风险两组,在训练队列(METABRIC)和验证队列(GSE58812)中,高危组中的患者预后较差。ROC曲线发现训练队列的AUC大于0.7,验证队列的AUC也大于0.65,表明四个预后基因能较好地预测TNBC患者的总体生存率(Overall survival,OS)()。
图 7 T细胞预后风险模型构建和验证
结果六、TNBC与免疫细胞浸润和免疫检查点的相关性
由于bulk RNA-seq具有样本量大,临床信息多的优势,作者利用bulk数据进一步分析TNBC浸润免疫细胞的临床意义。作者使用CIBERSORT算法分析了METABRIC队列中肿瘤浸润免疫细胞亚群的比例,并建立了TNBC中22种免疫细胞图谱(A)。Estimate R包分别评估高风险组和低风险组患者的肿瘤微环境(Tumor microenvironment,TME)。ImmuneScore、StromalScore或ESTIMATEScore得分越高,表明TME中免疫或基质成分越多。结果发现低风险组ImmuneScore、StromalScore和ESTIMATEScore较高,肿瘤纯度得分(TumorPurity)较低,表明低风险组TNBC患者的肿瘤比例较低(B)。T细胞CD8、幼稚T细胞、T细胞CD4记忆激活和T细胞γδ在低风险组中表达更高,而T细胞滤泡辅助细胞和调节性T细胞(Tregs)在高危组中表达更高。而且低风险组的静息树突状细胞和静息NK细胞与TNBC患者的不良生存预后有关(C)。高危组和低风险组免疫检查点差异分析表明,B2M、CD8A、CD40、CD40LG、ICOS、IFNG、IL23A和PTPRC在低风险组的表达量更高,且与TNBC患者的不良生存预后相关(D)。
图 8 T 细胞预后模型与CIBERSORT队列中免疫细胞浸润和免疫检查点的相关性
结论
总之,本研究基于scRNA-seq和bulk RNA-seq,重点探究了TNBC的T细胞表达谱和TME,并揭示了关键的潜在预后基因。本研究首先从功能富集、细胞分化轨迹和细胞间通讯等方面阐明了TNBC中T细胞的异质性。此外,构建的T细胞相关预后风险模型也被证明具有一定的独立预后价值。作者的工作不仅扩展了对TNBC相关T细胞的认识,还描述了TNBC的TME特征。scRNA-seq和大样本RNA-seq的联合分析将有助于推动TNBC精准免疫疗法的发展。不过,本研究的结果还需要进一步的实验和临床实践来验证。
总结
思路总结:
本研究首先利用公共数据集GSE176078的scRNA-seq分析TNBC的异质性。将TNBC样本的2万多个细胞注释为7中常见的细胞类型,并且提取T细胞并根据T细胞亚群的标记基因将T细胞分为CD8+和CD4+ T细胞。然后,通过细胞间通讯分析发现T细胞与其他细胞进行细胞间互作的潜在配体-受体对;轨迹分析揭示T细胞的发育状态并识别随状态改变而发生表达改变的基因及富集的功能;GO、KEGG、GSEA富集分析揭示T细胞marker基因主要参与的生物学过程。随后,用T细胞的marker基因对METABRIC队列构建预后风险模型,并利用GEO队列进行验证,从而解析TNBC患者中T细胞与临床预后的关系。最后,利用CIBERSORT根据RNA-seq的counts数据预测METABRIC队列中22种免疫细胞类型的比例。Estimate R包分别评估低分险组和高风险组中TME中基质细胞、免疫细胞的比例和肿瘤纯度。对低风险组和高风险组的免疫检查点基因进行差异分析,进而发现TNBC的新免疫治疗靶点。
看到最后,我们发现作者的思路以及生物信息学分析手段都比较常规,有一定单细胞分析和bulk转录组分析的小伙伴都可以轻松复现这篇文章。当然,作者的设计也是环环相扣、层层递进,逻辑十分严谨。所以,这篇文章很值得大家收藏。小伙伴们,抓紧行动起来吧,下一个7+就是你的了!