5+分析思路:miRNA预后模型

本文介绍一篇HNSCC预后分析:A robust six-miRNA prognostic signature for head and neck squamous cell carcinoma,2020年4月份发表在Journal of cellular physiology(IF=5.546)上,作者从TCGA下载HNSCC的miR-seq表达数据,在TCGA训练集中构建生存相关的miRNA 风险signature,在TCGA验证集和独立的验证集中检验预后效能。后续再通过体外实验验证关键miRNA的功能,接下来详细介绍科研思路。
1.在训练集中计算差异表达miRNA
作者将TCGA的521个HNSCC样本分为训练集和验证集,在261个训练集中计算癌症样本与正常样本的显著差异表达miRNAs,共计305个,如中火山图和热图所示。
2.在训练集中构建预后signature
基于差异表达的miRNAs,通过单变量Cox比例风险回归分析筛选出与患者生存相关的miRNAs,通过LASSO回归方法进一步选择9个miRNAs,多变量Cox回归分析显示有6个miRNAs具有独立预后因素:hsa-miR-99a-5p,hsa-miR-758-5p,hsa-miR-329-3p,hsa-miR-137-3p,hsa-miR-1229-3p,hsa-miR-3187-3p,c展示了这6个miRNAs的表达水平。在每个样本中基于以上6个miRNAs的表达值和计算出的回归系数的乘积和,即可得到风险得分(a-b),依据中值将261个样本的训练集分为高风险组、低风险组,d生存分析观察到高风险组具有较差的生存时间(p<0.001, HR=1.316),并且年龄、性别、分期的不同分组方式的趋势是一致的(e)。
3. 在验证集中验证signature的效能
将signature应用到验证集中观察预后效能,展示的是TCGA中另外的260个样本作为验证集的结果,d生存分析显示构建的signature仍然是具有统计学显著性的(p=0.029, HR=1.125)。在中作者采用独立的SMUSH验证集(p=0.021, HR=1.178),包含南方医科大学口腔医院的106个样本。整体上,该signature是独立的预后因素。
4.构建nomogram模型预测患者生存
作者通过nomogram方法构建了更为敏感的预测模型,将风险得分与年龄、性别、肿瘤分级分期等临床病例特征整合到nomogram模型中预测患者预后(d),该模型对于患者的三年生存率和五年生存率具有很好的预测效能(e-f)。
5.富集分析
在TargetScan、miRTarBase、miRDB数据库中搜索这6个miRNAs靶基因并进行基因功能富集,探索到底影响了哪些生物学功能,在GO、KEGG的富集分析结果中显示(),富集的top通路是Hippo、Wnt、mTOR、MAPK以及癌症相关的通路。
6.实验验证
作者选择miR-1229-3p在体外进行实验验证,下调miR-1229-3p、上调miR-1229-3p,结果发现miR-1229-3p的表达与HNSCC细胞的增殖、侵袭能力相关,表达上调时细胞增殖、侵袭能力增强,表达下调是细胞增殖、侵袭能力减弱。
综上所述,本篇文章从公共数据集TCGA挖掘miRNA预后signature,分别用TCGA和作者自己的验证集进行验证,从干(富集分析)、湿(体外实验)两个角度研究miRNA的功能。作者肯定是位左右互搏的高手,你学会了吗?