今天介绍的论文来自Nature Medicine,标题为“通过整合 100,000 基因组癌症计划中 13,880 例肿瘤的基因组和临床数据,为精准肿瘤学提供启示“,该研究分析了13800名癌症患者那里收集到的涵盖30多种实体瘤的数据。通过将基因组数据与5年来从参与者那里收集到的常规临床数据(如医院就诊情况和接受的治疗类型)一起研究,科学家们发现了癌症中与生存率高低和患者预后改善相关的特定基因突变。该研究指出”将全基因组序列和临床数据大规模地结合在一起有助于提供精准癌症治疗“,例如,根据患者的癌症情况帮助确定哪种治疗方法对他们最有效。
论文地址:https://www.nature.com/articles/s41591-023-02682-0
1)背景
全基因组测序使我们只需一次检测就能读取一个人的完整基因组--组成我们 DNA 的 32 亿个碱基。对于癌症患者来说,这项技术可以用来比较肿瘤中的 DNA 和健康组织中的 DNA的差异,从而找出肿瘤中特有的体细胞突变。该实验中针对正常血液样本的平均测序深度为30x,针对肿瘤样本的平均测序深度为100层
:研究方案示意图,患者入组后,采用标准化方案从肿瘤和正常(血液)样本中提取 DNA,然后将样本进行全基因组测序,WGS 在 Illumina 测序仪上进行。之后对序列质量控制、比对、变异检测和注释,并利用电子健康记录(所有住院病例、癌症登记条目、系统抗癌疗法和死亡原因)对参与者进行终生跟踪。
:病患来源,癌症类型及诊断年龄
2)发现
相比全外显子测序,WGS 可以通过一次检测发现各种基因变化,包括染色体畸变CNA、结构变异等外显子测序无法检测的变异类型,从而更全面地了解肿瘤的基因状况。这项研究发现对于不同癌症类型,体细胞突变发生率因癌症类型而异,例如90%以上的脑肿瘤和 50%以上的结肠癌和肺癌显示出基因突变,而这些突变可能会影响患者的治疗方法,从而指导患者做出手术或接受特定治疗的决定。在 13%的肉瘤中,发现了较大的 DNA 改变,即所谓的结构变异,在多形性胶质母细胞瘤中,94%的病例存在小变异,58%的病例至少有一个基因存在拷贝数畸变。这些改变都只能通过全基因组测序才能发现。这些改变可能会影响临床护理和治疗。在超过10%的卵巢癌中,研究可确定对应的遗传风险,为临床治疗提供了重要启示。
:使用 WGS,针对不同癌症检出NGTDC 中指明要检测的基因中不同类型突变的发生率。左侧的子图显示了携带 NGTDC 中列出的一种或多种具有临床意义的基因组变异的病例总百分比。右侧子图,显示了由小变异(SNVs、indels)、CNAs、SVs、同源重组修复缺陷HRD、错配修复MMR和 肿瘤突变负荷TMB各类体细胞变异的数码(从左到右),以及与遗传性癌症风险(易患基因)和药物基因组学(PGx)发现(毒性相关的 DPYD 变异)有关的生殖细胞变异。图中显示了每种突变类型中突变率最高的前五个基因。
肿瘤突变负荷TMB被认为是一种潜在的生物标记物 ,从本数据集中察到不同癌症类型之间以及癌症类型内部存在显著差异。皮肤黑色素瘤和肺腺癌的平均 TMB 最高(图 4a)。结肠腺癌和子宫内膜癌在是否存在微卫星不稳定性或由 POLE 突变引起的高突变方面表现出差异。同源重组缺陷可由CHORD和HRDetect来定义。在该队列中,这两种算法的一致性达到 99.2%,其中卵巢高级别浆液性癌的 HRD 发生率最高(40%),具有HRD的乳腺癌可通过PARP抑制剂精准治疗。
:全基因测序得到的TMB分布情况及临床价值
分析还揭示了几种癌症的模式,并发现了不同类型的基因变异,这些变异可能解释对治疗的反应或预测患者可能出现的结果。例如b,c中展示的生存曲线差异,说明了不同同源重组修复缺陷HRD、错配修复MMR和 肿瘤突变负荷TMB的患者的生存时间差异。这些发现共同表明了大规模结合基因组数据和临床数据的价值,有助于医疗保健专业人员为患者做出最佳治疗决策。
SNVs、indels (小变异)和 CNAs 的共存已有详细记载。通过 WGS能够探索影响 NGTDC 给出的癌症基因对应 CNA 和体细胞小变异的共存情况。通过将病例分为每个基因都有小变异和没有小变异的两组,然后比较了这两组中每个基因的 CNA 频率(图 5a )。经过多重检验校正后,研究发现有 12 个基因的拷贝改变频率存在显著差异。这证实了之前的发现,即在特定癌症类型中,当存在特定激活 SNV 时,表皮生长因子受体 26 和 KIT27 往往会被扩增。拷贝增殖对某些致癌基因的作用一直存在争议,而该分析发现,在影响 BRAF、KRAS、NRAS、CTNNB1 和 FGFR2 的小变异存在时,增殖显著并发。研究发现,在存在体细胞小变异的情况下,五个肿瘤抑制基因或双重作用基因的拷贝丢失频率明显较高,其中包括 TP53、RB1、CDKN2A30 和 APC25 等成熟的例子,且存在显著的生存率差异(b)这进一步强调了同时解读不同类型变异的价值。
:全基因组测序得到的小变异和CNA共同分析及其临床预后影响
3)总结
该研究是目前最大的癌症全基因组研究,研究凸显了全基因组测序在癌症研究及精准治疗中的价值。该研究指出了癌症研究中,除了关注更多的转录组,蛋白组,影像组或游离DNA,以体细胞突变为代表的WGS测序可提供额外的信息增量。研究得到的开源数据库,例如不同癌症的突变频率,TMB等具有临床价值的标志物可作为之后类似研究的基础。其中介绍的全基因组分析流程及用到的工具参数,也已开放,可作为类似的全基因组研究的分析参考,考虑到大部分基于全基因组的生信流程,都可用于全外显子的分析,该研究的方法部分更值得细细学习。