今天看的这篇文章是:识别整合的mRNA-lncRNA特征来预测喉癌的复发。
喉癌分原发性和继发性两种。原发性喉癌指原发部位在喉部的肿瘤,以鳞状细胞癌最为常见。继发性喉癌指来自其他部位的恶性肿瘤转移至喉部,较为少见。喉癌症状主要为声嘶、呼吸困难、咳嗽、吞咽困难、颈部淋巴结转移等。喉癌占头颈癌的25%,复发率达到25%‐50%,本文结合mRNAs和lncRNAs的表达谱识别出了一个用于预测喉癌复发的多
基因特征。数据方法:(1)、表达谱数据GSE27020(n=109,训练集)下载自GEO,RNA-seq数据来自TCGA(测试集,n=85)。微阵列数据使用R包“affy”进行预处理,然后根据Pearson相关矩阵中不同样本之间的距离对微阵列质量进行聚类评估。(2)、下载微阵列探针序列和人类
基因组注释文件,用层次化索引方法识别探针匹配的mRNA和lncRNA序列。(3)、LASSO Cox
回归模型用于筛选与复发显著相关的
基因,然后构建一个多mRNA/lncRNA的
分类器在训练集中预测喉癌复发情况。然后基于一个风险得分公式将样本分成两组,分别做生存分析。结果:(1)、109名训练集中的患者平均随访时间为35.7个月,复发率为31.2%,85名测试集中的患者平均随访时间为30.9个月,复发率为24.7。(2)、探针重注释后,获得253个lncRNAs和4093个mRNAs,在LASSO相关系数表达谱中,有8个mRNA与1个lncRNA被挑选出来(最小λ法和10倍交叉验证),基于它们的回归系数,每个样本的风险得分Risk score=C5 or f15*0.285 + CENPI*1.799 + CKAP4*0.371 + GALNT2*0.605+MIR600HG*(−1.311)+PARVA*(−0.102)+PCSK5*(−0.794)+SHCBP1*(−0.305)+TMEM2*0.470。(3)、以风险得分的中位数为阈值,训练集样本被分为高风险组(n=55)和低风险组(n=54),高风险组的无复发生存率要低于低风险组,时间相关的ROC曲线(1,3,5年),其AUC值均超过0.8;在验证集中,高风险组同样表现出较差的预后()。此外,多因素Cox回归分析也证实了风险得分在训练集和验证集中的有效性、独立性。
(4)、为了进一步评估该mRNA-lncRNA风险得分的预测能力,作者将其与其他特征因子进行了对比,包括27-gene signature, 2-lncRNA signature和肿瘤淋巴结转移(TNM)分期。在训练集中,本文提出的特征预测能力高于TNM,与27-gene之间无显著差异;在验证集中,该特征预测效能最佳()。
本文挖掘出了一个喉癌复发预测的mRNA-lncRNA特征,包括8个mRNAs(C5orf15,CENPI, CKAP4, GALNT2, PARVA, PCSK5, SHCBP1和TMEM2)和1个lncRNA (MIR600HG),经文献证实它们多数与癌症有关。这篇文章的创新之处在于首次将探针重注释与微阵列和测序数据相结合来识别预测喉癌复发的特征,其有效性也得到了多重验证。老规矩,一句话送给大家:May the sun always shine upon you, may the wind always be at your back.
欢迎关注
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史