研究背景
缺氧基因:缺氧相关基因被定义为在低氧水平反应中被上调的基因。肿瘤微环境与缺氧一直是许多关注的话题,大到CNS系列小到一些水刊,而在生信方面的研究目前仍然还是有很大潜力。
热门的原因:肿瘤内部营养供给和需求的不平衡往往会导致缺氧、葡萄糖缺乏,从而形成酸性肿瘤微环境。在缺氧环境下,肿瘤细胞可以利用免疫逃逸机制来驱动转移和侵袭,缺氧可降低肿瘤微环境中各种免疫细胞的活性,减少相应免疫刺激因子的产生,增加抑制因子的释放和免疫检查点抑制剂的表达。因此这方面的研究也往往与免疫相互结合起来。
缺氧基因前景:小王就以在Pubmed以“hypoxia[Title/Abstract] AND tcga[Title/Abstract]”进行搜索,先看看缺氧相关研究,结果显示:
缺氧基因相关的研究仍然在增长,这方向潜力依然很大。今天小王讲的今年五月份发表的缺氧基因预后模型的相关生信研究,并对文章的难度进行打分,满分难度是5颗星。
Identifcation and validation of a hypoxia-related prognostic and immune microenvironment signature in bladder cancer(IF:5.72,Journal: Cancer Cell International)
论文难度:※ ※ ※
首先对该文的整体框架简单说一下:
这篇文章都是通过TCGA数据库构建如下的模型:
然后验证模型的准确性,再对免疫抑制微环境以及免疫浸润情况进行分析,最后是外部实验验证。
展开来讲:
背景知识:(1)膀胱癌预后差(2)缺氧在膀胱癌发展和免疫逃逸中发挥了作用
研究方法与结果
作者的整体思路见下图
STEP 1 (构建模型)
1. 获取基因
作者获取缺氧相关基因集取自GSEA ——TCGA下载患者相关的临床信息以及转录组数据。获取基因集是根据相关的基因缩小了方位。
2. 筛选基因
(1)构建PPI网络,可以根据节点数确定膀胱肿瘤中比较重要的缺氧基因( a-b),作者确定了排名节点数为前50 的基因。
(2)单因素Cox分析,确定了这些基因的预后价值( c),最终确定了14个基因与免疫有关。这样,构建模型的原材料就有了。
(3)利用多因素Cox分析,作者以这14个基因为模板构建模型,模型的计算公式就是文章开头说的公式,模型基因在多因素Cox的结果也在 d中。
STEP 2(模型验证)
1. GEO数据库验证
作者得到模型后,利用GEO数据库进行了验证。患者根据风险值Risk的中位值分为高低风险组,首先是对模型基因的展示,在高低风险组的基因表达情况——模型基因热图(a),接下来是患者们预后情况的展示风险曲线图(b)、风险散点图(c)、风险死亡比例图(d),最后是高低风险组患者们的生存有无统计学差异通过K-M生存分析展示(e)。从这些图,不难看出,高风险组患者们的预后明显要比低风险组的差。
2. 对模型的可靠性验证
首先作者通过ROC曲线在两个数据库进行验证,a-b 是通过ROC曲线对模型验证,其实两个数据的模型的ROC值不是很高,甚至GEO数据库的还没有到0.7(但是丝毫没有影响发表);c-d 单因素Cox分析了预后价值,两个数据库中都证实了模型预后价值;e-f: 多因素Cox分析RiskScore与临床特征,也证实了其独立预后价值,两个图中的P均<0.05,证实了模型的独立预后价值。
3.不同临床特征之间中高低风险组的预后
作者根据患者的不同特征,对高低风险的情况进行验证,这个方面的验证确实比较少见一些。
中患者根据年龄、性别,Stage分期、T分期、N分期划分成不同的组,再探讨了高低风险组的生存是否有差异,结果也都显示出,高低风险组的生存均有差异也再次证实了这个模型对预后的预测是有价值的。
STEP 3 免疫浸润
作者为了了解模型与免疫微环境之间的关系,使用CIBERSORT分析了高低风险组22种免疫细胞的浸润情况,患者免疫细胞群如a,高风险组患者中静息肥大细胞(P=0.023),中性粒细胞(P=0.0061),未活化的CD4记忆T细胞(P=0.0023)(b-d)明显富集,低风险组中低缺氧危险患者滤泡辅助性T细胞(p=0.011)、CD8 T细胞(p=0.0032)和浆细胞(p=0.0077)的比例更高(e-g)。
STEP 4 功能分析
作者在TCGA和GEO数据库中对模型基因进行GSEA分析结果显示:缺氧、上皮间质转化、炎症反应和补体等信号通路在高危组显著富集 。
STEP5 免疫抑制微环境(本期的重点)
为什么研究这个?
免疫抑制微环境指的是在肿瘤微环境中起着抑制免疫功能的部分,包括抑制性细胞与细胞因子。在本研究中,作者研究的是癌症-免疫周期:肿瘤抗原释放——树突状细胞识别——淋巴结——T细胞活化——消除肿瘤细胞。任何一个环节出现问题都会打破整个肿瘤免疫循环过程。
作者是怎么做的?
负调节肿瘤免疫周期这些基因从追踪肿瘤免疫表型网站获得。分析了它们在高低风险组中的表达情况,结果也显示在高风险组中,周期负调控富集的基因大多升高(a),说明高风险患者与免疫治疗效果差相关。接下来又是高低风险组中,免疫检查点抑制剂与RiskScore 之间的线性关系,高低风险组中这些检查点是否有表达差异(图b-e,分别对应PD-1, PD-L1, CTLA-4, LAG-3),最后是高低风险组中免疫抑制有关细胞因子的表达水平的差异f。
STEP6 实验验证
1. Qrt-PCR 验证
SLC2A3 、ALDOB、 FOXO3、 SDC4 、VEGFA 、EGFR 、GPC1是作者得到的模型基因。作者进一步做了外部实验验证,首先搜集了膀胱癌患者们的癌症标本与癌旁标本,其次利用qRT-PCR分析是否存在差异,如 a-g,SLC2A3,FOXO3, EGFR and GPC1存在差异。
2.GEPIA 数据库验证
h -k, 作者利用GEPIA 数据库分析FOXO3、EGFR、GPC1的高表达以及VEGFA的低表达与膀胱癌患者预后不良相关。
3. 3.免疫组化验证
作者从Human Protein Atlas(人类蛋白质图谱)获取免疫基因相关免疫组化的数据,而且他们也自己进行了免疫组化,最后发现只有EGFR和SLC2A3这两个基因在正常组织与癌症组织中有差异。