来自西班牙巴塞罗那科学技术的研究团队于2020年8月发表了迄今为止最全的癌症驱动(driver)基因集合——他们通过对来自66种癌症的28076个肿瘤样本的基因组进行分析,一共识别了568个癌症driver基因。该研究发表在Nature Reviews Cancer(IF: 53.030)上,题目为:A compendium of mutational cancer driver genes.
癌症driver基因的识别,对于临床和基础研究领域具有重要意义。虽然大多数了解癌症基因组学的小伙伴对于癌症driver基因应该不陌生,但是说到其真正的含义和常用识别方法时,肯定很多人都回答不上来。今天小编就在这里和大家仔细说一下,到底什么是driver突变、为什么要识别driver以及目前主要的driver识别方法有哪些。
一、什么是癌症driver?
癌症被认为是由基因突变引起的非正常的、不受控制的细胞生长所导致的。这些能够驱动癌症发生和发展的突变被称为“驱动因子”(driver),它们能够使其所在的细胞相对于其它邻近细胞具有更好的适应性优势和更强的增殖能力。
二、为什么要识别癌症driver?
掌握癌细胞转化的机制,是开发更有效的癌症检测方法和治疗方案的基础,也是癌症研究的基本目标。而实现该目标的关键,就是要识别出所有能够驱动癌症发生和进展的突变基因。自遗传学诞生以来,癌症研究的主要目标之一就是在不同类型的肿瘤中识别对应的癌症driver基因。如果我们能够知道肿瘤的致癌能力依赖于一种特定的蛋白质,那么研究人员就能够采用对应的靶向治疗,例如抗体或其他阻碍其功能的抑制剂来治疗癌症。
三、癌症driver相关的定义:
driver突变:能够赋予癌细胞生长优势的突变;
passenger突变:对于癌细胞生长没有任何影响的突变;
driver 基因:当一个基因上具有driver突变时,就称其为driver gene,它会受到肿瘤进化中的正选择作用;
passenger基因:当一个基因上全是passenger突变时,就称其为passenger gene,它不会受到肿瘤进化的选择作用;
tumor essential基因:某些基因既不属于driver也不属于passenger,但它们对于癌细胞的生长是必不可少的,这种基因上的有害突变会受到肿瘤进化中的负选择作用;
癌基因(oncogene):当一个driver基因上的driver突变导致了新功能的激活,就称其为癌基因;【该过程通常通过局部扩增或错义突变导致】
抑癌基因(tumor suppressor): 当一个driver基因上的driver突变导致了某种功能的失活,就称其为抑癌基因;【该过程通常通过局部缺失、无义突变、移码突变或剪切位点突变导致】
四、识别driver的主要方法:
目前的识别不同类型的癌症driver的方法涉及到不同的数据类型,包括突变、基因表达、通路等。将这些方法简单分类如下图所示,可以按照方法是识别单个基因还是一组基因(模块)来分类。
小编在这里只简单介绍一下针对单个driver基因的识别方法,除此以外还能基于基因模块(一组基因)去识别,如果大家感兴趣的话小编我之后会继续展开介绍。
单个driver基因的识别方法可以分为以下四类:
基于频率的方法:也可以理解成是基于大规模癌症样本队列的方法。由于driver基因会受到正选择作用,其频率会随着肿瘤的生长而变大,因此其突变事件应该在癌症样本队列中被显著频繁地检测到(mutation significance)。
【方法举例:MutSigCV】
基于功能的方法:其基本原理是driver突变对于蛋白质功能的影响比passenger突变更大。这种方法的关键在于,它不是评估一个基因有多少突变,而是评估突变的功能性影响是否显著更大。OncodriveFM方法就是以突变所造成基因功能出现显著偏差为指标,来识别候选driver基因。它可以检测出低频出现、但对癌症的发展中起着重要作用的突变驱动基因。OncodriveFM方法仅应用于编码基因,与它类似的方法——OncodriveFML方法也通过突变的功能影响来识别癌症driver,该方法可以应用于分析编码和非编码基因。另外一种DriverML方法与OncodriveFM和OncodriveFML稍有不同,它是基于突变类型变化的功能影响评分来检测癌症driver。DriverML方法使用各种不同的属性来对突变类型的功能影响进行加权,并使用机器学习监督方法结合泛癌训练数据获得最优权重参数。
【方法举例:OncodriveFM, OncodriveFML, DriverML】
基于结构的方法:基于基因突变的结构影响来识别癌症driver。ActiveDriver方法通过检测翻译后修饰位点上体细胞突变的富集来发现癌症驱动基因,包括磷酸化、乙酰化和泛素化位点; SGDriver方法使用贝叶斯推断统计框架将体细胞错义突变合并到蛋白配体结合位点残基中,来弄清突变的功能作用; AlloDriver方法将突变映射到源自三维蛋白结构的变构/位构位点,以检测癌症患者中潜在的功能基因/蛋白。
【方法举例:ActiveDriver, SGDriver, AlloDriver】
结合基因表达、通路等信息的方法:IntOGen平台是基于OncodriveFM和OncodriveCLUST开发的,该平台使用体细胞突变、基因表达和肿瘤通路作为输入参数来检测driver突变高度集中蛋白质区域;PathScan方法结合了已知通路的基因信息,来识别通路中能够驱动肿瘤发展的突变。
【方法举例:IntOGen, PathScan】
参考文章:
A compendium of mutational cancer driver genes. Nature Reviews Cancer. 2020.
Computational methods for cancer driver discovery: A survey. Theranostics. 2021.