多组学机器学习建模,预测下咽癌的预后反应

admin 93 2025-01-16 编辑

下咽癌是一种以男性为主的晚期癌症,一线治疗的疗效仅为50% 左右,缺少可靠的分子预后指标。近日Nature communication的研究,对男性下咽癌的肿瘤微环境进行了研究,以预测治疗反应。该研究分析了 HPC 肿瘤微环境在单细胞水平上对治疗反应的变化,确定了与晚期 HPC 预后相关的三个基因模块,从而指出了下咽癌的异质性。研究人员还建立了一个基于肿瘤微环境中非恶性细胞亚型丰度的二元分类器模型,该模型能够准确识别耐药的晚期 HPC 患者。

论文地址:https://www.nature.com/articles/s41467-023-37159-8

论文标题:Integrated transcriptome study of the tumor microenvironment for treatment response prediction in male predominant hypopharyngeal carcinoma

1)实验流程

该研究将受试者分为4组,根据HPC患者接受 TPF 诱导化疗加西妥昔单抗治疗后是否有效,判别方法基于CT影像中显示的肿瘤大小,值得借鉴。具体来说,将患者分为治疗前应答者(RBT) ,治疗后应答者(RAT) ,治疗前无应答者(NBT)和治疗后无应答者(NAT)组(a)。包括来自44名个体患者的44个样本。通过bulk RNA测序。生存分析显示 RBT 组患者的生存率明显高于 NBT 组(b0通过从12个晚期 HPC 肿瘤样品,1个淋巴结转移样品和2个非恶性组织(NT)样品中采集的单细胞转录组数据。具体分析流程见c,通过标志基因进行细胞类型鉴定(d,e),发现上皮细胞、内皮细胞和成纤维细胞中检测到的表达基因多于免疫细胞中的表达基因(补充c)。此外,淋巴组和 NT 组的大多数细胞是 T 细胞和 B 细胞,而各种细胞亚型在肿瘤样本中富集。该结果经过多重免疫组织化学(mIHC)得到证实(f)

不同组的HPC样本的临床与转录本差异

2)找出效应组与非响应组的功能差异

推断每个肿瘤和淋巴样品中上皮细胞内的大规模染色体拷贝数变异(CNV),可区分恶性肿瘤细胞(a)。适用该方法从13例标本中共鉴定出19,207个恶性肿瘤细胞。恶性细胞聚集显示样本特异性聚集,表明肿瘤间具有高度异性(b)。将恶性肿瘤细胞从 RBT,NBT 和 NAT 组中拿掉,这些组表现出了更好的聚类特性(c)。

之后发现免疫相关基因如 HLA-A,BCL6,S100P 在 RBT 组中表达较高,而在 NBT 和 NAT 组中与干性和耐药性相关的基因表达水平增加。在 NBT 中肿瘤抑制基因的最低表达水平,代表性基因 CDKN2A 与 NPC 队列中的不良预后相关。通路分析进一步揭示了这三组恶性细胞之间的差异。RBT 组的细胞在表皮细胞分化途径中高度活化,而 nBT 组的细胞在 Ribosome 和 DNA 复制途径中富集(d)至于 NAT 中的恶性细胞,几种免疫途径在药物治疗后被重新激活(补充d)。这些结果表明,功能基因模块,而不是个别基因,更适合描述肿瘤转录变异性。

不同HPC组的功能基因模块差异

通过非负矩阵分解,将四组患者的恶行肿瘤细胞进行分层聚类,提取出5个功能基因模块,包括 表皮发育,EMT 扩展,细胞周期,免疫和核糖体模块(e)。与 RBT 组相比,NBT 组核糖体模块表达评分相对增加,NAT 组表达评分相对降低(图c)。而免疫模块的转录模式则相反。NBT 组的样本得分明显较低(图e) ,表明免疫细胞和肿瘤细胞之间更强的相互作用可以作为对联合治疗有效反应的潜在指标。经过bulk RNA测序得到的结果,与单细胞数据呈现相同的趋势(见f-k)。生存分析显示三个基因模块可用于 HPC的预后预测,其中 EMT 延伸和细胞周期模块表达较高的患者,Epi 发育模块的表达较低与预后不良有关(I-N)。上述结果表明,这三个功能基因模块具有作为临床预测性生物标志物的潜力。

3)肿瘤微环境中的细胞互作

除了浸润的免疫细胞之外,TME 还由复杂的细胞类型环境组成,包括构成肿瘤基质的 CAF 和排列血管和淋巴管腔的内皮细胞(EC)。最近的进展表明,血管内皮细胞是异质性的,可以以不同的方式发挥作用。有些细胞优先从血管(所谓的尖状细胞)发芽和迁移,而另一些则相对较为静止(所谓的茎状细胞)。对于内皮细胞,作者鉴定了一种具有高表达 PDPN,PROX1,LYVE1的亚型和两种血管内皮亚型(Endo _ C2 _ EndBlood 1,Endo _ C3 _ EndBlood 2)的淋巴内皮亚型(Endo _ C1 _ EndLym) FLT1,CD34,PLVAP高表达的亚型(a,b)。

肿瘤微环境中免疫细胞的互作与亚型

具体来看,EndoBlood 2细胞高度表达尖端样标志物如 RGCC,COL4A1和 NOTCH4,而与茎样特征和免疫激活相关的基因的表达水平如 ICAM1,HLA-DQB1和 CCL2在 endoBlood 1中明显增加(c)。此外,当通过介导淋巴细胞进入肿瘤来测试对抗肿瘤免疫至关重要的 TA-HECs 的标志物时,作者观察到 EndBlood 1具有其类型特异性基因如 LGALS3和 CTSC 的相对较高的表达,以及类似于 TA-HECs 的其他表达模式(c )。进一步的调节和信号通路富集分析(d) 表明 endoblood 1参与促炎症和抗原呈现过程,并且 endoblood 2通过细胞迁移和血管生成以促肿瘤方式起作用。当将 RBT 与 RAT 和 NBT 与 NAT 成对比较时,作者发现在两种条件下,具有低 StalkEC 评分但 高 TipEC 评分的细胞的比例均随着治疗下降,对于治疗敏感的样品,从RBT中的55.84%降至15.79% (RAT) ,对于治疗存在抗性的样品,NBT相比NAT,从55.25%下降至42.48% (NAT)(d)。这些结果表明,联合治疗可以通过减少细胞数量来重塑 TME 中的血管内皮细胞,从而有可能使细胞迁移并形成新的血管。

4)预测预后反应的模型

基于转录本数据,该研究构建二元分类器模型使对来自未接受治疗的 HPC 患者的临床样本进行训练,适用非线性支持向量机(SVM)模型(c)。该模型使用bulk RNA数据来预测联合治疗对晚期 HPC 患者的反应。通过分析肿瘤微环境(TME)中非恶性细胞亚型的组成及其与患者对联合治疗反应的关系,该模型可识别耐药的晚期 HPC 患者,模型的准确性指标AUC达到了0.86(4)。考虑到肿瘤的异质性,作者的数据证实了基因模块而不是单个基因作为描述肿瘤转录变异性的基本单位更加稳健和适当该模型建立了非恶性亚型组成与患者对联合治疗反应之间的定量关系,提供了重要的临床意义,可能有助于避免未来医学实践中的治疗延误。

构建预后模型的方法与效果

4)总结

该研究结合CT影像,单细胞RNA-seq ,和队列与bulk RNA-seq,使用了来自多个组学的多种特征,从异源肿瘤细胞中鉴定了五个特征性功能基因模块,通过找到与存活率及预后有关的模块,定位了三个用以构建分类模型的基因模块,是一个值得学习并模仿的多组学分析套路。更具有临床价值的是,作者最终建立的一个二元分类器模型,可只基于bulk RNA数据, 为患者提供方便和经济的诊断和治疗建议。该研究中对RNA数据结合的方法论,也值得类似的研究借鉴。

多组学机器学习建模,预测下咽癌的预后反应

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 这样找已知致病基因,你会吗?
相关文章