今天跟大家分享的是今年七月发表在Frontiers in Genetics(IF: 3.258)上的一篇文章, 主要是基于弹性网络和robust rank aggregation (RRA)分析构建肝癌早期诊断特征和预后特征。是一篇比较基础的生物信息学分析文章,简单套路,非常适合初学者阅读和模仿哦。之前也推送过类似分享:
肿瘤诊断+预后强强联合
扫码关注不迷路哦
早期肝癌患者诊断特征和预后特征的建立
本文实验流程如所示,首先基于弹性网络挖掘疾病相关基因,利用RRA分析筛选出在早期肝癌患者和正常肝脏组织中发生差异表达基因(DEGs),并基于二者识别到的交叠基因构建早期诊断预测模型。接着采用单因素cox回归和lasso cox回归分析筛选出预后相关基因,构建早期HCC生存风险预测模型。并结合加权相关网络分析(WGCNA)、基因集富集分析(GSEA)和基因组网络(GeNets)分析转录组变异与早期HCC致癌风险评分之间的关系。
.实验流程
1.数据
本文所需数据主要包括六套早期肝癌患者及正常组织中基因表达数据集:GSE76427、GSE36376、GSE84005、GSE101685、TCGA_GTEx、ICGC。
2.早期诊断预测模型的构建
为消除批次效应,研究者首先利用ComBat对来自不同平台的四套训练数据集进行整合。接着,基于弹性网络识别到15个疾病相关基因构建早期肝癌患者分类器(AB),其模型回归系数如C所示,如在基因在某样本中系数大于0,则表明其高表达增加该样本属于其组织类型的可能性。热图展示出这15个基因在肝癌和非肝癌组织中的差异表达水平(D)。进一步在两个独立的测试数据集上评估该模型分类效能,总体准确率达到98.6% (E)。
.弹性网络分析中15个基因的分类效能
接着,研究者基于RRA分析识别到99个在肝癌和非肝癌患者中发生差异表达的基因(A),取RRA分析和弹性网络分析识别出基因的交集(B),并最终通过logistic回归分析构建早期诊断预测模型,模型的AUC值可以达到0.956(C)。
.早期肝癌患者诊断模型的构建
3.早期肝癌患者预后特征模型的构建
研究者基于单因素cox回归分析识别出预后相关基因,并通过lasso的cox回归模型对这些基因进行优化,最终识别出由9个基因组成的预后特征模型(A-B)。总体生存风险评分与9个基因表达之间的关联如C所示。与基于年龄和性别的分类标准相比,预后基因模型有更好的分类效能(D-F)。
.预后特征模型的构建
另外,研究者还基于多因素cox回归分析识别出由性别和预后基因特征共同组成的分类模型,并通过nomogram验证该特征的预后分类效能(A-B)。
. 基于nomogram模型验证模型分类效能
4.早期肝癌发生的分子机制
为探讨早期肝癌的发生发展机制,研究者对275例具有年龄、性别等临床特征的早期肝癌患者进行加权相关网络分析,并构建出共表达网络。在软阈值为3的前提下,研究者最终识别出22个模块。各模块特征值与临床特征之间的关系如A所示,研究者进一步确定出两个与临床性状显著高度相关的模块 ( B),并分别对两个模块中与诊断模型和预后模型相关的基因进行GSEA富集分析(C-F)。
. 诊断模型和预后模型相关功能模块的识别
为进一步识别在与模型显著相关的通路中发挥关键作用的hub基因,研究者分别从两个模块中选择发生共表达的基因构建基因组网络(A-B),并对网络进行一些机制上的分析。
.模型相关通路中共表达网络的构建
今天的内容大致就是这些,不知道小伙伴们掌握的怎么样呢?研究者主要是构建出早期肝癌诊断模型和预后模型,比较新颖的是诊断模型采用了弹性网络筛选特征基因,预后模型则是普通的构建方式。文章进一步结合WGCNA、GSEA和GeNets分析对肝癌的发生发展机制进行分析。思路明朗,内容也不复杂,诊断和预后模型的工作量对于3+的文章是戳戳有余的,可以添加的分析还有很多,感兴趣的同学们可以扫码关注哦。
推出诊断+预后双模型
3+生信分析思路
感兴趣联系客服小姐姐