易复制的公共数据深挖肿瘤免疫微环境思路

admin 12 2025-02-02 编辑

免疫治疗的疗效在消化系统癌症中差异性很大,癌细胞扩增期间跟周边环境存在着密切联系,因此如果能将消化系统癌症按照癌细胞周边微环境组成进行分类的话,这对于癌症患者的免疫治疗方案设计有巨大帮助。今天就分享一篇这方面研究的文章《re-clustering and profiling of digestive system tumors according to microenvironment components》,于今年2月发表在Frontiers in Oncology(IF:6.244,2区)。

文章总体思路是利用公共数据库里的基因表达数据进行癌细胞微环境成分组成分析,而后利用得到的各组成成分占比数据对病人进行聚类,而后结合临床数据和突变数据探索得到的类别之间是否有显著差异。

数据

UCSC上下载的1526个病人的(已经normalized的)RNA-Seq和临床数据六种消化系统癌症的突变数据两个免疫治疗组数据

研究分析方向

计算癌细胞微环境组成

使用MCP counter基于基因表达数据计算8种免疫细胞和2种基质细胞占比,得到如下分布情况:

发现在6种消化系统癌症中,fibroblasts占比最高,而NK细胞占比最低。同样,通过下面的热图也可发现,基质细胞成分(fibroblast和endothelial)在微环境中富集程度较高:

而后,分析了微环境各个组成成分对生存预后的影响。首先,使用univariate Cox regression着重看了下各个微环境成分跟预后相关性:

而后用log-rank test画生存曲线,来找出不同癌症中与预后相关的微环境成分。

从上图可以看出,LIHC, PAAD, READ三种癌症中的微环境成分预后效果较差,而STAD中,neutrophils, endothelial, fibroblasts的预后效果显著。

利用癌细胞微环境组成进行聚类

以前面MCP计算得到的微环境成分组成作为输入,使用K means进行聚类,发现聚为6类时区分度最高:

而后分析了6个组别在6种癌症中的占比:

通过上图可以看出,cluster 4在ESCA中最为富集,而cluster 6在LIHC中最为富集,cluster 3在STAD中占比最高。而后通过Sankey图进一步查看6个组别与6种癌症之间的对应关系:

然后,文章通过热图探究了cluster和微环境组成成分之间的关系:

可以看出,cluster 3拥有最高的免疫细胞和基质细胞含量,而cluster 6则含量较低。

并且分析了6种cluster的生存预后效果:

发现cluster 1和3的预后效果较差,而cluster 6则有较好的预后效果。

cluster相关的基因突变

这里是在从基因组层面探索不同cluster之间的差异,使用的是SNP突变数据。鉴于上文发现cluster 3包含了大量非肿瘤微环境组成成分,并且大量分布于STAD,所以作者对比了STAD癌症的cluster 3和其它cluster的driver基因突变。结果显示STAD病人的cluster 3组别具有低TP53突变率和高LRP1B突变率,如下图:

同理,由于LIHC具有大量cluster 6,作者分析了LIHC病人的cluster 6和其它cluster之间的基因突变差异。结果显示cluster 6的病人具有更高的CTNNB1和TTN突变,如下图:

仍旧同理,PAAD具有大量cluster 1,所以作者对比了PAAD病人的cluster 1和其它cluster之间的基因突变差异。结果显示cluster 1具有更高的KRAS和SMAD4突变率,如下图:

cluster之间的功能富集差异

文章挑选了70多个跟癌症相关的通路并计算相应的ssGSEA得分。通过用热图来展示结果,可以看出跟肿瘤细胞行为调控和免疫相关的通路大量富集于cluster 3:

而后进行了一系列其它癌症特质的对比分析。比如发现葡萄糖和脂肪代谢通路富集于cluster 6(见下图),这可能是由于cluster 6主要由癌细胞组成。

而cluster 2的DNA复制和错配序列修复则显著高于其它cluster:

而cluster 3则集中于细胞活素类和受体互相作用,趋化激素,TGFB通路,VEGF通路,和粘着斑通路,这进一步说明了微环境因素可能会形成cluster 3病人的独特临床表征。

cluster 3与免疫抑制微环境的密切联系

为了进一步探究cluster 3的病人的微环境特征,作者又进行了X-cell分析并通过热图展示结果:

结果显示,免疫细胞和基质细胞在cluster 3富集。并且,cluster 3的微环境、免疫、基质分数均显著高于其它cluster:

对于经典的免疫检查点抑制剂,作者发现PD1, PDL1, CTLA4分子富集于cluster 3和5:

基质分数可以用于预测Anti-PD1/PDL1疗效

鉴于前面发现的,cluster 3的微环境组成和免疫抑制状况,作者认为cluster 3的病人对免疫治疗不敏感。作者重新以微环境、免疫、基质分数表示cluster 3的病人特征,用以评估它们对免疫治疗效果的影响。在Imvigor210群组中,文章发现当以微环境分数和免疫分数作为区分条件时,并没有显著差异:

而当以基质分数作为区分条件时,低分组的反馈效果要更高,而且ROC曲线也显示了基质分数具有较好预测效果:

并且,对免疫治疗有反馈的组比没反馈的组的基质分数也要显著高一些:

在GSE78220群组中,得到了类似的结果:

总结

整体来说,这篇文章的思路非常清晰、简洁,适合作为范本。数据均来自公共数据库,属于可以“空手套白狼”,无需耗费经费做实验,直接收集现成数据,而后做一个聚类,然后从各个角度去探究聚出来的类别之间的差异。至于有哪些“角度”,本文提供了几个思路:临床预后效果、基因突变、通路富集、免疫治疗反馈等。相信大家很容易在此基础上,发挥自己的聪明才智,写出更精彩的文章。

易复制的公共数据深挖肿瘤免疫微环境思路

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 肿瘤相关巨噬细胞顶流思路推荐,拒绝塌房
相关文章