今天跟大家分享的是一月份发表在frontiers in Oncology(IF:4.137)杂志上的一篇文章 Screening and Identifying Immune-Related Cells and Genes in the Tumor Microenvironment of Bladder Urothelial Carcinoma: Based on TCGA Database and Bioinformatics在膀胱尿路上皮癌
肿瘤微环境中筛选识别
免疫相关细胞和基因:基于TCGA数据库和生物信息学方法背景:膀胱癌是世界第九大最常见的恶性肿瘤,以膀胱尿路上皮癌(BUC)为主,占膀胱癌的90%。膀胱癌的传统治疗方法主要有手术切除和化疗,但有高复发率。Calmette-Guerin是最早应用于膀胱癌的
免疫治疗药物,但由于其效率低、毒性大,临床应用受到限制。TCGA的研究显示膀胱癌是一种具有大量不同基因突变的疾病,由于可识别的
抗原数量较多,可能对
免疫治疗敏感。目前许多膀胱癌免疫治疗的临床试验正在进行中,但尚未见疗效,特别是与传统的顺铂为主的化疗相比。免疫治疗的受益者仍然局限于小规模人群,肿瘤诱导的免疫逃逸是普遍存在的现象。在BUC免疫治疗中,特别是在预测免疫治疗生物标志物和识别新的有效治疗靶点方面,仍有许多问题有待解决。肿瘤微环境是肿瘤细胞赖以生存的周围环境,包括免疫细胞、间充质细胞、内皮细胞、炎症介质、细胞外分子等。它是肿瘤细胞在与免疫系统的斗争中形成的强有力的保护网,是肿瘤免疫逃逸的前提和保障。肿瘤微环境中的免疫成分对肿瘤组织的基因表达及临床疗效有重要影响。 结论:本工作首先识别BUC中与生存相关的免疫细胞,然后识别与免疫细胞浸润水平相关的重要的基因。利用从TCGA数据库下载408例BUC患者的RNA-测序(RNA-Seq)基因表达谱和临床资料,共识别出4个与生存相关的免疫细胞和24个关键基因,其中4个基因与生存相关。使用TIMER方法验证了免疫相关性。本工作研究为BUC免疫治疗提供了新思路,发现的细胞和基因可作为预后的生物标志物或BUC治疗的靶点。 结果:一、 数据获取和处理从TCGA获取408个BUC样本的RNA-Seq(包括FPKM和counts值)数据和临床数据。流程图展示数据获取与后续分析流程。 .数据获取与分析流程 二、 识别生存相关的免疫细胞通过使用CIBERSORT(一个使用基因表达数据评估样本中22个免疫细胞丰度的分析工具),分析408个BUC样本中免疫细胞的丰度,其中218个样本P<0.05(A),然后计算了各免疫细胞丰度之间的相关性(B)。将样本根据每种免疫细胞占比的中值进行分类(丰度高组、丰度低组),进行生存分析,识别4个与生存相关的免疫细胞类型(C-F),有T 细胞CD4 记忆激活, T细胞CD8, T 细胞CD4 记忆静息和自然杀伤(NK)细胞静息。 .样本中免疫细胞丰度分析及生存分析 三、 生存相关的免疫细胞的临床相关性根据临床特征将218个样本分组,通过使用T检验和方差分析(ANOVA)的方法分析四种生存相关免疫细胞的丰度与临床特征(包括T期、N期、临床分期、肿瘤分级)的关系,以确定免疫细胞丰度比对BUC的临床特征影响()。发现T细胞CD8、NK细胞静息、T细胞CD4记忆静息的丰度比值随着T/ N/临床期的增加而降低,而T细胞CD4记忆激活的丰度比值则相反地增加。而因为只有3例低级的BUC,所以BUC分级与免疫细胞的丰度尚不清楚。 .免疫细胞的丰度与临床特征关联分析 四、 识别免疫相关的基因对样本根据四种生存相关的免疫细胞的丰度中值分组(丰度高组、丰度低组),通过使用edgeR的方法并且控制|logFC| > 1.5和P < 0.05,识别差异基因。在T细胞CD8中有514个差异基因,NK细胞静息中有510个,T细胞CD4记忆静息有560个,T细胞CD4记忆激活有534个差异基因(A-D)。E中不同颜色块中的数字表示与免疫细胞浸润相关的基因数量,共有911个基因与这四个免疫细胞的浸润有关。 .识别免疫浸润相关基因 五、 免疫相关基因的富集分析通过使用DAVID工具对免疫浸润相关基因进行GO/KEGG富集分析,限制Counts ≥ 4 和 P < 0.05 ,展示GO 的细胞组分、分子功能和生物学通路和KEGG的top 12个富集结果。GO分析结果显示,免疫相关基因的生物学过程主要富集在角化、肽交联、离子跨膜转运调控、离子跨膜转运、细胞-细胞信号转导等方面。分子功能主要富集于角蛋白丝、胞外区、中间丝、膜锚定成分、高尔基腔、乙酰胆碱化的通道复合体等。细胞组分主要富集于序列特异性DNA结合,丝氨酸型内肽酶抑制剂活性,神经肽Y受体活性,花生四烯酸环氧酶活性,5 -羟色胺激活的阳离子选择性通道活性。KEGG 通路分析表明免疫相关基因主要富集在细胞色素P450代谢、化学致癌、酪氨酸代谢、PPAR信号通路等。933个免疫相关基因主要参与各种信号通路的传递,以及营养物质的转运和代谢。 .免疫相关基因进行GO和KEGG富集分析 六、 构建蛋白质互作网络,识别Hub基因,模块分析将 933个免疫相关基因导入到STRING数据库,控制combined-score≥ 0.4,获得由829个节点4850条边构成的蛋白质互作网络,然后使用Cytoscape的MCODE功能对网络重构和分析,识别到29个模块,有24个hub基因(表1)。其中有两个模块(模块1、模块2)中包含的基因数大于50(A-B)。通过使用cBioPortal工具识别到与50个基因与24个hub基因有共表达关系(C),构建共表达网络。对2个模块和共表达网络进行富集分析(表2),模块1基因主要与蛋白质运输和代谢相关,模块2基因主要与角蛋白的组成和中间丝相关,共表达网络中基因涉及癌症与免疫相关通路,如G蛋白偶联受体信号通路、Wnt信号通路、调节磷脂酰肌醇3-激酶信号通路、PI3K-Akt信号通路和ErbB信号通路等。 表1.蛋白质互作网络模块中的24个hub基因 .基因数目top 2的模块以及共表达网络 表2.2个模块和共表达网络功能分析 七、 临床特征与Hub基因的关联使用加权共表达网络分析(WGCNA)对24个hub基因和临床特征进行相关分析和可视化(A),CDH7与N期呈正相关,CST4与T期呈负相关。对218个样本根据24个基因表达进行分组(高表达组、低表达组),进行生存分析(B-E),CDH7、LUZP1、PSD2和UGT2B15在四个基因表达与生存相关。 .24个hub基因临床特征分析和生存分析 八、 验证免疫相关性为了验证24个免疫相关的基因,以及是潜在的免疫治疗靶点,使用Pearson相关分析了24个hub基因的表达与22个免疫细胞丰度的相关性(A)。使用TIMER方法(一个人可以系统地分析各种癌症类型的免疫浸润情况的工具)验证了4个生存相关免疫基因(CDH7、LUZP1、PSD2和UGT2B15)与免疫的相关性(B),部分hub基因(包括4个生存相关基因)与某些免疫细胞浸润存在显著相关。 .免疫相关的基因与免疫细胞丰度和免疫浸润的相关性 欢迎关注TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史