一致性or保守性分子分型如何实现?

admin 76 2025-01-09 09:17:43 编辑

在当前的癌症研究领域里,我们看到的关于肿瘤分型的研究,绝大部分是基于单个肿瘤类型、单个数据中心的,如果有额外数据集,也只是作为独立验证集。而单癌分型的研究,通常用于一些常规分析。今天给大家介绍基于大样本量识别一致性或保守性亚型的研究。研究策略主要分为两种类型:1). 同癌型,多中心。2). 泛癌分型的保守性。下面我们以几个案例进行详细说明。

一、同癌型,多中心

【案例1】结直肠癌的一致性分子亚型

Ref: The consensus molecular subtypes of colorectal cancer. Nature Medicine. 2016

这篇文章为结直肠癌(CRC)提供了迄今为止最稳健的分类体系。CRC是一种致死性很高的癌症类型,并且表现出临床结局和药物应答的异质性。该研究的主要目的是解决已报道的基于基因表达谱的CRC分型系统的不一致性,并促进临床转化。

在这篇研究中,作者首先通过已知关于CRC分型的研究文章中,搜集到了18套CRC数据:包括1套TCGA、10套GEO数据以及一些未公开的数据(共4,151个样本)。其中涉及到有分类标签的3,962个(共涉及到6种聚类方式:方式A-方式F,形成27个类标签)。然后作者通过数据标准化以及主成分分析等步骤去除掉离群样本。对剩下的3,104个样本,作者借助Jaccard系数,构建27x27的一致性矩阵,值越大表明两个cluster越相似,进而构建27个类标签的一致性网络()。网络中线段粗细表示Jaccard系数大小,颜色表示显著性水平,点的大小表示该cluster所包含的样本量()。

 

接下来作者借助马尔科夫聚类算法检测中一致性网路的鲁棒性。根据膨胀因子(即类别数目k=2-10)比较分类性能。发现当大类数目为4类的时候, “weighted silhouette width”最大,分类性能最佳。因此,作者将这27个亚型归结为4类一致性分子亚型(Consensus Molecular Subtypes, CMS):CMS1-CMS4()。通过与已知亚型进行对比,发现CMS1-CMS4与已知亚型很强的一致性(超几何检验,b)。这个方法很好地规避了基于不同方式的聚类方法产生类标签的差异性,而是以一种统一的方式总结了已知多中心来源的亚型。作者通过全局性患者网络,刻画CMS亚型的聚集性(c),图中点的颜色表示患者所属的CMS,连线表示两个患者在6种聚类方式中有5种以上是一致的,表明高度一致性(c)。

 

接下来,作者刻画了4个CMS患者的基因组特征,包括突变数量(a),拷贝数变异数目(b),超突变数目、MSI信息、已知甲基化表型(c)以及特定的基因组突变比较,包括KRAS, BRAF, APC, TP53(d)。此外,作者展示了4个CMS患者的拷贝数变异数据热图(e)、DNA甲基化热图(f)、蛋白质表达水平热图(g)、以及miRNA表达热图。

 

此外,作者分别在mRNA水平以及蛋白质水平下刻画了CMS亚型间特定signature的活性。mRNA水平包括CRC相关的signature、标准癌症相关通路、基质评分和免疫评分、免疫相关signature、代谢相关通路(i)。蛋白质水平包括免疫相关signature和促癌反应(j)。

 

接下来,作者分别刻画了CMS亚型与临床特征以及临床结局的相关性。值得注意的是,生存分析处,除了刻画CMS亚型间的OS和RFS,作者还刻画了一个生存指标,即复发后生存时间(survival after relapse)。这个复发后生存时间指的是只挑选复发的样本,做OS()。

 

最后,作者根据以上基因组特征、基于mRNA/蛋白质水平signature活性、临床特征与临床结局,总结了4个CMS亚型()。

 

泛癌分型的保守性

【案例1】保守性泛癌微环境亚型预测免疫治疗

Ref: Conserved pan-cancer microenvironment subtypes predict response to immunotherapy. Cancer Cell. 2021

与上面一篇研究类似,这篇文章也是通过大量样本,来对患者进行聚类分析。不一样的是,这篇文章在泛癌中基于一些生物学特征刻画亚型的保守性。

首先,作者手动搜集了29个肿瘤微环境相关的特征signature,称为29Fges(包括20个免疫细胞特征和9个促癌特征)。通过ssGSEA计算了29Fges在泛癌水平(20种癌症类型,8,024个样本)的活性值。为了避免亚型特异性带来的影响,作者基于中值对活性值进行标化。

接下来,作者使用无监督层次聚类方式,将8,024个样本聚为4类(称为保守性的TME subtype):其中一类亚型免疫相关特征和癌症相关成纤维细胞活性水平都比较高,故命名为“Immune-Enriched, Fibrotic”;另一个亚型免疫相关特征活性水平较高,但并未富集到癌症相关成纤维细胞,故命名为“Immune-Enriched, Non-Fibrotic”;第三个亚型免疫相关特征活性水平较低,癌症相关成纤维细胞活性较高,故命名为“Fibrotic”;最后一个亚型,这些特征活性水平均比较低,故命名为“Depleted”()。并且发现,这些亚型所占比例,在各个癌症类型中比较相似,特别是在黑色素瘤中(C)。

 

接下来,作者连同本研究的4个保守性的TME亚型、免疫表型score组别(特定免疫基因集合的Z-score中值分组)、TCGA已知免疫Cluster(C1-C6),在泛癌水平比较了不同亚型间对患者生存的风险比(E)。并且在一些特定的癌症类型中展示了4个TME亚型、免疫表型score组别、TCGA已知免疫Cluster的生存分析(F),用于说明TME亚型的分型方式要优于免疫表型score分组和TCGA已知免疫Cluster。

 

结合一些基因组特征和免疫特征,总结4个保守性TME亚型()。

 

最后,作者在不同的经免疫治疗的验证集数据中,表明保守性TME亚型与免疫治疗效益有关(0)。

 

【案例2】基于基因组变异协同事件揭示泛癌的分子分型

Ref: Cooperative genomic alteration network reveals molecular classification across 12 major cancer types. Nucleic Acids Res. 2017

这篇文章也是在泛癌层面做的,只不过用的特征是基因组变异的协同事件。所谓协同事件,就是两个基因的基因组变异(包括拷贝数变异和体突变)同时在样本中出现。当然,作者通过二项分布检验识别出了泛癌中显著出现的协同事件。

通过所有的协同事件,作者利用K-均值聚类,将泛癌患者(共2,303个样本)分为17类(1左),并展示了top10协同事件。研究发现,这些协同事件相关的分子分型具有显著的预后差异(1右)。

 

此外,作者刻画了特定协同事件在泛癌中的预后效能(2)。

 

接下来,作者以Case study的形式刻画了这些协同事件在特定癌症类型中(GBM)所确定的亚型(3)。

(3)

将GBM中协同事件亚型的预后效能与其他亚型进行比较,包括与GBM之前已定义好的亚型进行对比、以及去除甲基化表型后的对比(4)。以此表明协同事件揭示的分子亚型不受甲基化表现的影响,且优于GBM之前定义的亚型。

 

结语:

分子分型的目的是分层管理患者,进而促进患者的个性化治疗和临床转化。大样本量分子分型的一致性/保守性识别,可验证分型的鲁棒性和准确性,主要包括来自多中心样本的亚型一致性刻画和泛癌亚型保守性刻画。分子分型的一致性/保守性刻画能够进一步帮助我们在复杂疾病中寻找相似的分子特征,进而在临床治疗上提供有价值的指导。

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 卵巢癌scRNA-seq和bulk RNA-seq结合分析
相关文章