叮~,您的文献分享小助手又上线了,今天看的是一篇使用基因特征组合预测膀胱癌总生存期的文章。
膀胱癌是男性人群中的第七大癌症,而且在初诊时,大约有5%到15%的膀胱癌患者伴有转移性疾病。因此,有必要挖掘能够识别肿瘤特征并预测临床表现的生物标志物,作者正是做了这样一项工作。
数据
![预后+突变文章思路解读](https://www.yanyin.tech/cms/manage/file/b444e160b1d649a1a2446cb540d38e81)
所用膀胱癌数据包括GEO数据库中GSE31684的98个和TCGA中的408个患者数据 (筛选具有临床信息的患者);GSE31684中的46个样本被随机分为一个训练集,47个样本分为一个内部验证集,TCGA样本作为外部验证集。
方法
首先,用单变量Cox回归分析结合置换检验(permutation test)筛选与总生存期(OS)相关的基因(p.value<0.001);然后,对训练集进行多变量Cox回归分析,筛选p.value<0.05的基因;接下来,通过对每个选定基因的多变量回归系数进行加权来建立风险评分公式,以中位数为阈值将样本分为高风险组和低风险组;再在两个验证集中验证风险评分的预测能力。此外,还对TCGA数据使用软件GSEA富集分析,来分析基因集是否与膀胱癌相关(随机1000次,FDR<0.01为显著);最后,Kaplan-Meier生存分析用来比较高/低风险组的生存差异。
结果
1、多变量Cox回归分析后,只有4个基因被筛选出来()。
风险评分公式如下:risk score = (1.414*expression level of TMPRSS11E) + (2.471*expression level of SCEL) + (5.305*expression level of KRT78) + (-2.988* expression level of TMEM185A)。
2、根据以上公式,训练集中(n=46)各有23个样本被分到高/低风险组,且高风险组的OS显著比低风险组短;在内部和外部两个验证集中,高风险得分的患者同样具有较短的OS。
3、同其他临床因素相比,4-gene特征风险得分的预测精度比大部分要高(),多变量Cox回归相对危险回归分析表明4-gene风险评分可以作为一个独立的生存预测指标。
4、ROC分析用来评估在整个GSE31684数据集中,分别通过4-gene风险评分、RC(根治性膀胱切除术)阶段和淋巴结状态预测十年随访中患者的OS状态的特异性和敏感性。结果表明,虽然p值不显著,但4-gene的AUC值最高()。此外,数据分层分析表明,4-gene风险评分是可以独立于RC分期与化疗将样本区分的。
5、高/低风险组的突变图谱如所示,高风险组中,有8个基因在多于19% 的样本中发生突变:TTN (51%), MUC16 (32%), TP53 (27%), KMT2D (24%), HMCN1(21%), MACF1 (20%), FAT4 (19%) ,XIRP2 (19%);低风险组中,有10个基因在多于19% 的样本中发生突变:TTN (50%), TP53 (50%), KMT2D (28%),MUC16 (27%), KDM6A (25%), FRG1B (23%), ARID1A (21%), SYNE1 (21%), RYR2(20%),HMCN1 (20%)。GSEA分析结果显示,高风险评分往往伴随着上调的网络,包括癌症的进展和复发相关的通路(.a),膀胱癌复发/进展患者的风险评分往往高于无继发性进展患者(.b)。
本文作者识别出了一个four-gene(TMPRSS11E, SCEL, KRT78, TMEM185A)特征来预测膀胱癌患者的总生存期,并证实了它的有效性以及与膀胱癌的相关性,有望成为该病的治疗靶点和诊断标志物。
今天的一句话是:You can't make things happen if you don't move forward in the face of adversity!
更多生信分析套路,请加微信13621202201
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史