大家好呀!今天给大家介绍一篇2021年11月刚刚发表在frontiers in Cell and Developmental Biology(IF:6.684)上的文章。本研究结合转录组和单细胞转录组数据构建了肝癌预后模型。
Development of an Autophagy-Based and Stemness-Correlated Prognostic Model for Hepatocellular Carcinoma Using Bulk and Single-Cell RNA-Sequencing
利用转录组和单细胞转录组数据构建自噬和肝细胞相关的肝癌预后模型
摘要:
越来越多的证据表明,自噬在恶性肿瘤形成过程中起到重要作用,自噬相关预后特征可用于预测高死亡率癌症的预后。自噬相关基因参与肝癌的发生和转移,但目前还不是十分了解自噬对肝癌的预后价值。本研究对ICGC和TCGA数据库进行差异分析和差异分析,共鉴定到10个自噬相关基因,包括PC1、CDKN2A、RPTOR、SPHK1、HGS、BIRC5、SPNS1、BAK1、ATIC和MAPK3。随后进行GO,KEGG功能富集分析,相关性分析,一致性聚类和PCA分析揭示自噬相关基因在治疗HCC中的潜在作用。肿瘤干细胞的单细胞转录组分析表明这些基因与干细胞特性正相关。同时,作者使用单因素Cox,LASSO和多因素Cox回归分析研究自噬相关基因,最终鉴定到ATIC和BIRC5是肝癌的预后标志物。总的来说,作者鉴定到的10个自噬相关基因是肝癌的潜在治疗靶点,ATIC和BIRC5可以准确预测肝癌的预后。
流程图:
材料和方法:
1.数据集预处理:从ICGC和TCGA数据库获取肝癌的转录组数据和临床病理特征,ICGC数据集包括正常样本202例,肿瘤样本243例,TCGA数据集包括正常样本50例,肿瘤样本374例。从GEO数据库获取HCC肿瘤的干细胞的scRNA-seq数据(GSE103866)。人类自噬数据库是第一个人类自噬专用数据库,从HADb获取232个自噬相关基因。
2.肝癌自噬相关基因的差异分析:使用limma对ICGC和TCGA数据集的肿瘤样本和正常样本进行差异分析,分别鉴定到25和54个自噬相关DEGs。
3.鉴定与预后有关的自噬相关差异表达基因和功能分析:使用ICGC和TCGA数据集的自噬相关差异表达基因进行生存分析,获得10个与预后有关的自噬相关基因。随后进行GO和KEGG富集分析。
4.单细胞转录组数据分析:对HCC干细胞的单细胞转录组数据进行分析,包括55个HuH-1细胞,63个HuH-7细胞和12个HCC细胞。
5.一致性聚类和PCA分析:使用一致性聚类将HCC样本分为不同亚群。
6.构建预后模型:使用单因素Cox,LASSO和多因素Cox回归分析构建预后模型。
结果:
1.鉴定肝癌中差异表达的自噬相关基因
对ICGC和TCGA数据集的正常样本和肿瘤样本进行差异分析,分别鉴定到25和54个差异表达的自噬相关基因()。
2.自噬相关DEGs的生存分析
为研究自噬相关DEGs的相关性和预后价值,作者对ICGC中的25个和TCGA中的54个自噬相关DEGs进行生存分析。ICGC中的14个DEGs和TCGA中的23个DEGs与生存期显著相关。两个数据集取交集则得到10个自噬相关基因(A)。A和2B是这10个自噬相关基因的生存分析。此外,作者发现这10个自噬相关基因的高表达与预后较差有关。
3.自噬相关基因的相关性分析和功能分析
相关性分析表明,这10个自噬相关基因相关性较强(B),其在肿瘤组织中的表达水平高于正常组织(C),说明这10个基因可能具有潜在的致癌作用。GO分析表明,这10个基因富集于自噬的特异性活性和过程(D)。KEGG分析表明,这10个基因富集于非小细胞肺癌,黑色素瘤,凋亡和病毒性癌变等通路(E)。
4.自噬和预后相关基因与EPCAM,CD24和PROM1正相关
CSCs是一种特异性细胞簇,与癌症复发,转移和化疗耐药性有关,并且CSC的维持和分化也与自噬有关。因此,作者对两种HCC细胞系的肝CSCs和肝癌患者的CSCs的单细胞转录组数据集进行分析。归一化后,包括130个single细胞和20个pool细胞,HuH7细胞与患者细胞的分布较为近似(A和4B)。此外,pool细胞的测序深度高于single细胞(A)。CSCs的标记物分别在HuH-1,HuH-7和患者细胞中表达(B-4D)。此外,EPCM,CD24和PROM1的表达水平与荧光激活细胞分选结果一致(E)。使用UMAP对细胞进行降维得到2个细胞亚群。随后,作者研究自噬相关基因在CSCs中的表达水平,大多数自噬相关基因在三阳性CSCs中高表达,表明自噬相关基因高表达可能会增强癌细胞的干性从而导致预后较差(F)。为验证scRNA-seq的结果,作者进一步研究这10个自噬相关基因与CSC标记的相关性,这10个自噬相关基因与EPCAM,CD24和PROM1正相关。随后,作者分析干性打分与10个自噬相关基因的相关性, ATIC,BIRC5和CDKN2A与HCC患者的干性打分正相关(G),结果表明自噬相关基因与HCC干性有关。
5.一致性聚类分析和PCA分析表明10个自噬相关基因可以用于HCC患者分层
基于这10个自噬相关基因的表达水平对HCC患者进行一致性聚类分析,HCC患者分为两个亚群(A和5E)。此外,PCA分析表明HCC患者分为两个亚群(B和5F)。ICGC-1和ICGC-2的预后具有显著差异(C),TCGA-1和TCGA-2的预后同样具有显著差异(G)。随后,作者比较了两个亚群的临床病理特征差异,ICGC-2的10个自噬相关基因表达水平更高,分期更高并且生存情况较差(D)。然而,TCGA-1的10个自噬相关基因表达水平更高,分期更高,生存情况较差并且肿瘤分期较高和等级更高。
6.构建预后模型
由于这10个 自噬相关基因与HCC的预后具有较强的相关性,作者接下来研究这10个自噬相关基因的预后价值。首先,作者进行单因素Cox回归分析,筛选到6个基因(A)。随后,作者进行LASSO分析和多因素Cox回归分析,筛选到2个基因(B)。使用这两个基因构建预后模型,风险打分=0.04*ATIC+0.03*BIRC5(C)。根据风险打分中位数将HCC患者分为高风险组和低风险组。高风险组的预后较差(D),ROC曲线的AUC分别为0.737和0.717(E)。HCC患者的生存状态和风险打分如F所示。
7.构建列线图
作者使用单因素和多因素Cox回归分析研究临床病理特征和HCC患者的相关性,结果表明性别,分期,复发和风险打分是HCC患者的主要风险因素(A和7B)。DCA图为风险打分模型与临床病例特征的比较(C和7D)。基于风险打分和临床病理特征构建列线图,列线图可以评估1年,2年和3年的生存情况(E)。
结论:
总的来说,作者对ICGC和TCGA数据集的自噬相关基因进行分析。基于自噬相关基因构建预后模型和列线图可以准确预测HCC患者的生存情况。这10个自噬相关基因可以作为HCC治疗的潜在靶点,ATIC和BIRC5基因是HCC患者的预后相关因子。然而,还需要进一步的临床试验和实验研究,进一步验证预后模型的临床应用和潜在价值。