近年来,利用各种基因构建预后模型的报道层出不穷,其中很多分析思路和内容都值得借鉴。本篇推文选取2022年7月11日发表在Journal of Oncology(IF:4.5,2021-2022)上的报道,基于8类RNA修饰基因构建模型,预测肺腺癌(LUAD)亚群的免疫微环境、hallmark以及预后的差异。
一 研究背景
肺癌是世界上发病率和死亡率最高的癌种。肺癌可分为两种病理学亚型:占比85%的非小细胞肺癌(NSCLC)和15%小细胞肺癌(SCLC),而NSCLC亚型中,又以LUAD最为常见。如今,肿瘤微环境的解析为LUAD患者的治疗方案带来了变革,更多病人由传统的放/化疗变为靶向治疗和免疫治疗,显著改善了患者的预后。然而,临床上只有少量LUAD患者对新型治疗手段有响应,且肿瘤耐药性不可避免,导致预后不佳。因此,进一步解析LUAD耐药机制和挖掘潜在靶点有助于提升病人的治疗效果。
RNA修饰是一种重要的转录后调控机制,已证实与肿瘤的发生发展密切相关。如今在真核生物中已经发现超过170种RNA修饰类型,其中以m6A和m5C最为常见,研究证实这些RNA修饰基因的异常与LUAD发生发展之间存在联系。然而,绝大多数研究聚焦一种RNA修饰及相关基因,不能解析多种RNA修饰之间的联系,因此系统地分析多种RNA修饰基因在LUAD中的变化情况有助于挖掘新的LUAD潜在分子机制,并针对性地设计治疗靶点。
本研究系统地分析了LUAD中100个RNA修饰基因(8种修饰类型)在基因组和转录组层面的异常,并勾画了不同修饰类型之间的互作情况。研究发现基于8种RNA修饰类型可以将LUAD病人分为两种分子亚型,不同亚型之间在肿瘤hallmark、免疫细胞浸润和预后等指标上有显著差异。此外,作者还基于RNA修饰相关基因建立了预后模型RMScore,其可作为LUAD病人的独立预后因子。
二 结果
1. LUAD中8类RNA修饰相关基因的突变和表达变化
作者收集了8类(m6A、m5C、Nm、Ψ、m1A、m7G、A-to-I和mcm5s2U)共100个RNA修饰相关基因进行后续分析。突变分析结果显示,从RNA修饰类型来看,m6A相关基因的突变率最高(33.16%),其次是m5C(20.63%)、Nm(12.17%)、Ψ(6.53%)、m1A(5.64%)、A-to-I(5.47%)和m7G(3.53%);而从基因角度,Nm writer CMTR2的突变率最高(5%),随后是m6A writer ZC3H13(4%)和m5C writer DNMT3A(4%)。此外,作者还发现IGF2BP2和FMR1之间存在共突变现象。为了探究100个基因的表达情况,作者利用TCGA和GEO数据进行了差异分析,鉴定出约10%的基因发生了表达失调,且部分基因的异常表达与其拷贝数变异相关。
2. LUAD中8类RNA修饰相关基因的预后价值和互作
为了评估100个RNA修饰基因的预后价值,作者利用uniCox回归分析来挖掘与病人生存时间相关的基因,鉴定得到18个显著相关的基因,且multiCox回归分析显示其中5个基因可以作为独立预后因子。此外,Kaplan–Meier分析也证实了uniCox分析的结果。作为外部验证,作者选取了GEO数据库种的相应队列进行类似分析,结果和前文保持一致。随后,作者分析了100个基因之间的表达相关性,结果发现很多基因之间存在较高水平的表达相关性(r>0.5),进一步分析发现m6A和m5C修饰基因之间显著共表达。这些结果表明不同修饰相关基因之间可能通过互作来发挥共同调控功能。
3. 不同RNA修饰模式之间的肿瘤标志特征和微环境差异
为了探究LUAD中RNA修饰的总体类型,作者基于100个修饰基因的表达水平,利用无监督聚类将TCGA-LUAD样本分为两类:Cluster A和Cluster B。两组样本中,100个基因的突变频率和表达水平均有显著差异,且Cluster A组病人的生存时间也显著长于Cluster B组。为了解释两组样本潜在的生物学差异,作者利用GSVA和ssGSEA方法比较了两组样本在cancer hallmark和免疫浸润细胞两组指标上的差别。结果发现绝大多数cancer hallmarks如hypoxia、epithelial–mesenchymal transition、angiogenesis、TNFα pathway、PI3K-AKT-mTOR pathway、E2F targets、G2M checkpoint、MYC pathway以及glycolysis pathway都在Cluster B中富集,而activated B cells、memory CD4 T cells、effector memory CD8 T cells、 eosinophil cells、immatureB cells、dendritic cells和natural killer cells却在Cluster A中浸润程度更高。此外,ESTIMATE分析显示Cluster A中的样本有更高的immune score和stromal score。以上结果说明Cluster A组病人较好的预后可能与肿瘤微环境中的免疫浸润有关,而Cluster B的不良预后则可能与众多cancer hallmarks富集相关。很多研究以及证实RNA修饰基因可以影响肿瘤免疫细胞的浸润,为了鉴定与之相关的RNA修饰基因,作者分析了100个基因表达水平与28种免疫细胞丰度之间的相关性。结果发现,7类RNA修饰相关基因都与免疫细胞浸润之间呈现显著联系,除了mcm5s2U。而对于多种免疫浸润细胞,除了WTAP、CBLL1、IGF2BP3、G3BP1和G3BP2等基因,大多数m6A、m5C、m1A、m7G和Nm调节基因均与之显著负相关。综上,RNA修饰相关基因通过影响cancer hallmarks和肿瘤微环境来塑造不同的修饰亚型。
4. RNA修饰score的建立
为了便于评估病人的RNA修饰亚型和预测病人的预后,作者基于100个RNA修饰基因建立了RMScore。首先,作者对Cluster A和Cluster B两组样本进行差异基因分析,鉴定得到1348个差异表达基因(DEG),随后发现其中229个DEGs与病人预后显著相关。为了证实RNA修饰基因和DEG之间的联系,作者利用公共CLIP-seq数据,发现超过半数的DEG可以被RNA修饰基因结合,表明两者之间的直接调控关系。随后,作者利用multiCox回归分析从229个DEGs提取5个基因建立RMScore模型。根据RMScore中位值将病人分为高低组,发现Cluster A组病人主要为RMScore-low,而Cluster B主要为RMScore-high。生存分析表明RMScore-low的病人生存时间显著长于RMScore-high组,表明基于8类RNA修饰基因建立的RNA修饰亚型客观存在。GSVA分析显示绝大多数cancer hallmarks如G2M checkpoint、E2F targets、DNA repair、MYC pathway、glycolysis pathway、PI3K-AKTmTOR pathway、EMT、hypoxia和angiogenesis在RMScore-high组病人中显著富集,与Cluster B结果类似,且免疫细胞浸润结果也与之前结果吻合。为了更好地探究RNA修饰基因和RMScore之间的互作,作者分析了两者以及RMScore模型基因之间的联系,结果发现m6A、Nm和m7G基因与RMScore显著正相关,而m5C和m1A相关基因则与RMScore显著负相关。
5. RNA修饰score可作为独立预后因子
前文主要是针对TCGA-LUAD数据集分析得到的结果,为了进一步验证RMScore的临床价值,作者又选取了两个相关数据集作为外部验证。结果发现在两组数据中,RMScore-low均和病人的较长生存时间相关,与前文结果一致。且ROC分析显示RMScore模型的预测结果具有较高准确度。
三 小结
本篇研究中,作者选取当下的研究热点之一-RNA修饰相关基因作为研究对象,参考已有研究报道的流程(公众号前期亦有总结:“三人行必有我师:m6A regulators整合生信分析又又又来了!”),最终建立了具有预后价值的RMScore这样一个模型,并从cancer hallmarks和免疫细胞浸润等角度解析了不同RNA修饰亚型之间差异的潜在分子机制,还基于表达相关性推测了不同类型RNA修饰之间的互作。整个内容容易上手,对初学者友好,然而创新性较低,被认可的程度也就不高了。