小编今天跟大家分享的是8月27号发表在frontiers in Genetics(IF=4.15)上的一篇文章
识别预测胶质细胞瘤患者预后的特定基因模块
Abstract
本文使用加权基因共表达分析(WGCNA)构建了TCGA 524个胶质细胞瘤(GBM)患者的共表达基因网络。识别得到了一个预后相关的基因模块。用模块中的hub基因进行多变量cox回归构建了一个GBM风险预测模型,并且用GEO和REMBRANDT 数据集进行预测模型的验证。结果表面构建的风险预测模型对GBM有很好对预测效能。
流程图:
Result
1、数据的获取和整理:
训练集:TCGA 528个sample筛选得到有整体生存信息的数据524个sample
测试集:GSE16011 159个sample 和REMBRANDT 219 个sample 筛选得到有整体生存信息的数据 336个sample
2、WGCNA构建基因共表达网络识别与胶质细胞瘤预后相关基因模块识别:
图A:TCGA训练集样本分层聚类树,共表达网络中有15个模块
图B:模块和临床特征相关性
图C:共表达网络中与survival status 相关的绿色模块可视化,包含436个基因
3、对GBM survival status相关绿色模块功能富集分析
图A-D:依次为生物学过程,cell成分,cell 功能,KEGG通路富集
4、cox比例风险回归模型的构建和验证:
单变量cox回归分析得到绿色模块中14个与生存显著相关的基因(图E)
多变量cox回归风险得分公式:
risk score = 0.00889 × EXP(CLEC5A) + 0.0681 × EXP(FMOD) + 0.1724 × EXP(FKBP9) + 0.1557 × EXP(LGALS8)
构建风险得分公式中四个基因的K-M生存曲线(图I)
风险预测模型能作为GBM预后很好的指标:一年和三年ROC曲线下面积
TCGA训练集:0.62和0.71(见下图A)
GSE16011 测试集:0.67和0.88(见下图B)
REMBRANDT 测试集:0.61和0.76(见下图B)
结果显示有更高的风险得分代表了预后更差
单变量cox回归分析评估不同临床特征的预后效果:结果显示风险评分和年龄是与GBM整体生存相关的独立预后因素。
GSEA富集分析:GBM高风险组高度富集与碱基切除修复,细胞周期,DNA复制和核糖体功能密切相关的基因。(见下图A)
列线图预测患者1和3年整体生存率(见下图B),图C和D为TCGA和GSE16011列线图校准曲线(REMBRANDT测试集没有IDH1突变信息所以未展示)
大家好,首先感谢关注。目前拥有超级预后,超级可变剪切,突变+表达,表达+突变,DNA甲基化,自噬,ceRNA、经典预后、m6A、可变剪切、肿瘤微环境,免疫浸润,多组学,驱动基因,突变,耐药,CNV肿瘤干细胞等多种经典和新潮分析思路和方案。
在此开工季,欢迎大家预定分析服务。
开工季,套路上新
(8.29-9.30)期间签订项目
赠送网课一套