无敌的多组学分析:揭示免疫抑制表型与预后的关系
高级别浆液性卵巢癌以复杂的基因组景观为特征,其发病机制、病程和治疗反应具有遗传和表观遗传多样性。在本篇文章中,为了更好地了解370名新诊断的HGSOC患者的基因组特征和治疗反应之间的关系,作者采用了结合多组学的一种新型工作流程进行探讨,该流程可用于发现临床结果的新驱动因素。
![SXR202308033C+无敌的多组学分析:揭示免疫抑制表型与预后的关系](https://www.yanyin.tech/cms/manage/file/a1b427b01c5448faab87d5f8ad48c896)
背景
卵巢癌仍然是女性癌症死亡的主要原因之一,总死亡率为1/78。高级别浆液性卵巢癌是最常见的亚型,其5年生存率约为47.4%。HGSOC的一线治疗是以铂类为基础的联合化疗,约85%的患者对治疗有完全或部分反应。机器学习和多组学数据整合的进步使得更复杂的肿瘤分型方法成为可能。这些较新的分型方法可以通过每一层数据捕捉更多的疾病背景,但仍未经过临床实用性的测试。在这里,作者提出了一个新的工作流程,使用来自TCGA数据库整合的甲基组学和转录组学数据,基于疾病复发相关性选择的“组学”特征,对HGSOC进行肿瘤聚类。随后,作者通过下游差异分析来阐述这些新定义的聚类的基因组特征,并使用机器学习法来揭示具有不同表型和临床相关特征的新亚型。
结果
整合的DNA甲基化和RNA测序数据的随机聚类分析
作者首先将数据按照的工作流程进行分析和处理。通过所描述的算法总共筛选出了1467个特征基因并用于聚类。与复发最显著相关的特征基因是NFRKB、DPT以及TREML1基因。由于该方法没有得到明显不同的聚类,随后,作者将相似性网络融合与共识聚类相结合,产生了最佳的k = 4聚类,这些聚类在疾病复发倾向方面具有明显的差异()。
:分析工作流程。
:聚类结果。
已识别集群的特征
紧接着,作者对这4个聚类群体中的3个群体进行了特征性分析。这三个群体特征可分别表示为“反应迅速”、“无反应-免疫抑制”以及“无反应-甲基化不足”。
聚类集群1:“反应迅速”
作者发现将该亚型的差异基因表达与所有其他亚型进行比较,可发现有助于化学反应的特征。总共发现407个基因(DEGs)差异表达,26个基因上调,381个基因下调。其中,261个是蛋白质编码基因。差异表达基因的通路分析确定了几个富集的信号通路:Notch信号、脂肪形成、硫酸化生物转化以及维生素A和类胡萝卜素代谢。在Notch信号通路中发现的几个差异基因在发育以及分化和增殖中具有内源性作用——dl k1、CNTN6、DLL1和HEY1。正如在网络分析中观察到的,差异表达基因的几个亚组形成了面向网络信号的小簇。将簇1与所有其他簇进行比较的甲基化分析揭示了1292个差异甲基化探针(DMP ),全部局限于启动子区域,如27k Illumina平台中所包含的()。
:聚类1中差异分析的结果。
聚类集群3:“无反应-免疫抑制”
直接与反应性簇1相比,簇3的差异表达揭示了826个DEGs-711被上调,115个被下调。其中,551个是蛋白质编码基因。在前20个DEGs中,按照调整后的p值排序,鉴定了许多免疫球蛋白重链基因(IgHV)和免疫球蛋白κ可变链(IgKV )。在顶级蛋白质编码DEGs中,鉴定了几个趋化因子受体(例如CXCR2、CCR2)。这些DEGs的途径富集在与免疫和炎症信号相关的多种途径:炎症反应途径、趋化因子信号途径和T细胞极化期间趋化因子受体的选择性表达。白细胞介素组和共刺激编码基因定义了表型,预设了多种富集途径。在网络分析中没有观察到明显的差异基因亚聚类。由于在该簇中观察到免疫/炎症信号的变化,作者使用Immunedeconv进行细胞类型组成分析。分析评估,簇3富含免疫细胞,包括免疫反应细胞,如CD4+效应记忆T细胞和CD8+中枢记忆T细胞,以及免疫抑制细胞,如巨噬细胞、M1巨噬细胞、M2巨噬细胞、单核细胞、骨髓树突细胞、癌症相关成纤维细胞和造血干细胞。聚类3的差异甲基化分析揭示了596个DMP,。其中,354个CpG位点高度甲基化(-5)。
:聚类3中差异分析的结果。
:每个已识别聚类内细胞类型组成的分数评估。
聚类集群4:“无反应-甲基化不足”
与最短复发时间相关的聚类4包含显示225 DEGs的肿瘤,当直接与响应聚类1比较时。其中,161个基因上调。与聚类3相反,在聚类4的DEGs中发现的IgHV和IGLV基因大多下调。簇4 DEGs的途径富集揭示了该簇特有的途径:GABA受体信号传导(GABRA3和DLL1基因)、卵巢不孕(CNTN6和COL9A3)和核受体,表明激素信号传导失调的表型。该簇相对于簇1的差异甲基化分析揭示了700个DMPs,它们都是低甲基化的。因此,我们称这个簇为“低甲基化”簇,包括在DMP位点发生潜在较少基因沉默的肿瘤。该簇中DMPs的通路分析揭示了PI3K-Akt-MTOR信号的富集()。
:聚类4中差异分析的结果。
预偏置MLP神经网络
为了验证特征选择和聚类方法,作者将该方法应用于外部ICGC临床数据集,发现疾病复发时间可用。在基于Cox的特征选择之后,来自RNA测序和甲基化阵列数据的6884个基因特征被用于SNF和一致性聚类,结果显示与疾病复发有统计学显著相关性,其中,6505个特征是甲基化探针。为了验证之前使用SNF和CC识别的聚类,作者使用由单变量Cox回归模型选择的1467个特征作为节点输入,构建了多层感知(MLP)神经网络(-8)。
多层感知器(MLP)神经网络被构造成使用由Cox回归选择的特征来预测聚类。
:从MLP构建模型中权重和偏差最高的节点进行基因本体分析。
特征基因
在每个簇的差异表达和甲基化特征中,产生了两个列表中出现的重叠特征列表。这些特征的分层聚类,通过聚类可视化,在每组之间产生不同的模式()。
为每个聚类找到的特征基因集合。
总结
本篇文章在人类基因组图谱的背景下,作者通过整合转录组和甲基组数据进行semi-biased聚类,这种聚类方式优于传统的系统聚类。随后对聚类簇进行了特征性分析。最后,作者使用MLP神经网络进行准确的亚型预测。总之,该篇文章的整体思路还是比较简单的,利用了综合组学数据的工作流程,揭示了免疫抑制表型与预后的关系。