今天跟大家分享的是发表在journal of cellular physiology(IF: 5.546)上的一篇文章,主要是通过机器学习方法构建核仁小分子RNA(snoRNA)的表达特征,对头颈部癌症进行预后分型,是一篇比较有代表性的snoRNA文章,适合生物信息初学者学习模仿,也适合平移到其他癌症类型中,进行相似的生物信息学分析。
提供新颖、正规、可复现的
生信分析服务
感兴趣可扫码联系
Expression scoring of a small nucleolar RNA signature identified by machine learning serves as a prognostic predictor for head and neck cancer基于snoRNA表达特征对头颈部癌症进行预后分型由于缺乏有效预测标志物,头颈部鳞状细胞癌死亡率极高,预后极差。越来越多的证据表明snoRNAs在
肿瘤发生发展中发挥重要作用。因此本研究的目的是确定HNSCC的预后snoRNAs特征,分析流程如所示。
.流程.数据和方法(1)从USCS-xena中下载HNSCC的蛋白质编码基因表达数据(fpkm格式),将表达数据进行log2(FPKM + 1)转化。(2)从UCSC和GENECODE中下载snoRNAs的注释数据,共得到1,524个snoRNAs。下载TCGA中HNSCC的miRNAseq BAM文件,经过质量控制筛选后匹配到相应的snoRNAs上,并得到snoRNAs表达的fpkm数据,并进行log2(FPKM + 1)转化。不会自己处理也没关系,SNORic数据库已经提供了处理好的TCGA的snoRNAs表达数据,需要的同学可以自行下载。(3)筛选TCGA中生存时间大于30天的510个HNSCC样本做进一步分析,以7:3的比例将样本划分为训练数据和生存数据。2. 构建HNSCC的预后snoRNAs特征基于单因素cox分析识别出113个表达与预后相关的snoRNAs(最显著的20个,A),并基于这113个snoRNAs表达数据,通过LASSO回归模型对snoRNAs做进一步筛选,得到19个回归系数非0的snoRNAs(B-C)。最终通过多因素cox分析构建出由5个snoRNAs组成的预后特征模型(D)。. 预后snoRNA特征的构建基于预后特征模型得分分别将训练数据划分为高低风险组,在预后,特征基因表达和危险评分等方面,两组患者存在显著区别()。.预后特征模型在训练数据中的
分类能力在验证数据和整体数据中,预后特征模型同样有较好的
分类效能(AB)。另外,预后特征模型是一个独立的预后风险因子,与性别,年龄,级别等因素无关(C)。.预后特征模型的性能评估3.在不同亚型中预后特征模型的预测性能基于年龄,性别,等级等因素对患者进行分组后,预后特征模型得分同样有较好的
分类能力(),说明预后特征模型是一个独立的预后风险因子。.在不同亚型中预后特征模型的预测性能4. 诺模图分析基于临床病理特征(年龄、解剖亚群、性别、临床分期和组织学分级)与5个snoRNAs特征得分相结合,构建一个多变量Cox比例风险回归模型,预测患者1、3和5年生存概率的预后,并基于诺模图对模型进行可视化()。在预测患者生存方面,5个snoRNAs构成的特征得分独立于其他临床病理特征。.诺莫图分析5.预测snoRNAs的功能分析基于皮尔斯相关分析识别与5个特征snoRNAs发生共表达的蛋白质编码基因,由相关性最强的10个构建共表达
网络(A),比较有代表性的共表达关系如B所示。.特征snoRNAs的共表达分析与特征snoRNAs表达相关性最强的300个基因作为snoRNAs的功能相关基因,分别对这些基因进行GO富集分析和KEGG富集分析()。. snoRNAs相关蛋白质编码基因的功能分析今天的内容就是这些,数据获取简单方便,分析过程轻松易懂,是一篇很经典的snoRNAs特征预后模型构建的文章。不想处理snoRNAs数据也没关系,联系我们,小伙伴们还在等啥,赶紧学起来吧~
提供新颖、正规、可复现的
生信分析服务
感兴趣可扫码联系