SXR202401028C_jing_公共数据+机器学习的5+预后模型思路分享

admin 63 2024-12-22 编辑

卵巢癌(OV)是导致女性恶性肿瘤死亡的主要原因,临床上评估OV患者的预后和治疗应答主要依赖于病理分类,但这具有很多局限性。因此,迫切需要开发更理想的生物标志物来促进OV的精准治疗。小编今天就和大家分享一篇今年1月发表在J CELL MOL MED (IF:5.3)杂志上使用多个OV队列基于机器学习识别OV预后及药物治疗应答相关特征的文章。

Machine learning-derived identification of prognostic signature for improving prognosis and drug response in patients with ovarian cancer

基于机器学习识别改善卵巢癌患者预后和药物应答的预后特征

 

一.文章摘要

研究纳入12个OV队列和3个免疫治疗队列,并基于这12个OV队列识别出预后风险基因,接着利用一致性聚类基于这些风险基因对患者进行分型,最后使用10种机器学习算法基于亚型间的差异基因开发预后特征(MLDPS)。研究发现MLDPS在多个内部及外部队列中都具有良好的预后预测性能。此外,MLDPS相比于21个已发表的特征都表现出显著的鲁棒性和优越性。研究也观察到不同MLDPS组间患者的免疫细胞浸润水平不同,且低MLDPS患者对免疫治疗更敏感,也更倾向于化疗获益。最后研究也识别了19种低MLDPS患者的潜在药物。

 

二.文章的主要内容及结果

1. 识别OV的预后风险基因

研究首先整合多个OV队列识别出预后风险基因。研究整体流程如所示,首先研究通过单因素Cox回归分析分别在GSE73614、GSE26193、GSE53963、GSE13876、GSE140082、GSE32062、GSE17260、GSE51088、GSE63885、GSE9891、GSE49997及TCGA-OV队列中识别出2463、2043、2121、4136、2372、1859、932、2237、1726、2856、1049及3933个预后基因。研究接着整合这12个数据集的预后基因,结果识别出13个鲁棒的OV预后基因(A-L),其中基因CETN2、HNT2高表达与较好预后有关,因此研究将剩余的11个基因定义为OV的强预后风险基因。

 

2. 基于11个预后风险基因的一致性聚类

研究接着基于11个强预后风险基因利用一致性聚类对OV进行分型。研究将12个OV队列整合为一个meta队列。接下来研究在meta队列中使用11个强预后风险基因基于一致性聚类进行样本分型,结果识别出两个亚型(亚型A和B,A)。研究观察到A组患者的预后更好(B)。此外,研究也观察到两个亚型间存在显著差异(C),接着研究在两个亚型间识别了1028个差异表达基因(DEGs,D)。研究也观察到两组间免疫细胞浸润、肿瘤纯度具有显著差异(E)。进一步研究发现B组患者的免疫检查点表达水平明显高于A (F)。研究进一步识别了506个差异预后基因,并对这些基因进行GO和KEGG富集分析,结果发现这些基因富集与伤口愈合、白细胞迁移和TNF信号等免疫相关功能及通路有关(G)。

 

3. 基于机器学习开发MLDPS特征

研究这一部分利用机器学习基于506个预后相关基因开发了预后特征MLDPS。作者应用多种机器学习方法观察到GBM模型衍生的MLDPS特征在所有队列中都展示了优越的性能(A)。进一步研究在训练队列(TCGA-OV)、其他验证队列和meta队列中都观察到高MLDPS患者的总生存率(OS)明显较差(B-P)。研究接着通过ROC曲线评估了MLDPS在meta队列中的效能(P),结果观察到MLDPS具有优越的稳定性和跨多个独立队列推断的能力。

 

4. 比较MLDPS和21个已发表的OV特征

研究在这一部分将MLDPS与其他已发表的OV特征进行比较。研究检索首先检索了21个已发表的OV特征,并观察到相较于这些特征,MLDPS的c-index最高(A-L)。这些结果证明了MLDPS模型的预测性能远远优于其他OV特征。

 

5. MLDPS与临床特征的比较及相关基因的富集分析

研究接着将MLDPS与临床特征进行比较并对相关基因进行了富集分析。研究观察到在校正年龄、临床分期、分级、静脉侵犯、淋巴侵犯、肿瘤残留等其他临床特征后,MLDPS对OV患者预后的预测仍有效(A-B)。接着研究通过富集分析进一步探索了高、低MLDPS的潜在分子和功能机制。结果发现高MLDPS主要富集在参与免疫应答、白细胞增殖、T细胞增殖和T细胞分化的T细胞活化等功能(C-D)。

 

6. MLDPS的免疫景观

研究接着分析了MLDPS对OV微环境中免疫细胞浸润水平的影响。研究分析了MLDPS与免疫细胞浸润的相关性,结果发现MLDPS与浸润水平呈正相关(A)。研究还评估了高、低MLDPS组的免疫评分、基质评分及ESTIMATE评分,观察到与低MLDPS组相比,高MLDPS组表现出较高的ESTIMATE得分,且两组之间存在显著差异(B)。此外,研究还发现高MLDPS组免疫检查点的表达水平显著高于低MLDPS组(C)。作者也观察到肿瘤抗原呈递的释放、T细胞对癌细胞的识别以及对癌细胞的杀伤与MLDPS呈负相关(D)。为了促进MLDPS的临床应用,研究也分析了MLDPS与几种免疫治疗预测因子之间的关系。结果发现高MLDIS组的CYT、GEP、immunophenoScore和IFN-γ水平均显著升高(E-H)。

 

7. 靶向MLDPS的免疫治疗反应和药物反应

文章接着对靶向MLDPS的免疫治疗反应和药物反应进行了分析。研究首先分析了高及低MLDPS组OV患者对免疫治疗的敏感性差异,结果在IMvigor队列中观察到MLDPS低组的生存时间更长,且SD/PD组的MLDPS高于CR/PR组(A-C)。为了进一步验证MLDPS在黑色素瘤免疫治疗中的稳健性,研究在Van Allen和Nathanson黑色素瘤队列中构建了MLDPS模型,并观察到MLDPS低组在两个队列中均表现出显著更好的生存。此外,两个队列中应答组相比无应答组MLDPS都显著升高(D-G)。这些结果表明免疫治疗更有可能使低MLDPS组受益。接下来,研究识别了19种对低MLDPS组患者敏感的GDSC衍生药物,MLDPS与这些药物的IC50值呈显著负相关。

 

8. MLDPS内部队列的验证

文章最后在内部队列中对MLDPS基因进行了验证。研究通过qRT-PCR分析在包含40例OV患者的临床队列中评估了MLDPS RNA的表达。研究首先在内部队列中确定MLDPS低组的生存显著更好(A,C)。研究接着分析了MLDPS与CD8、PD-1之间的相关性,结果发现MLDPS与CD8、PD-1、PD-L1呈正相关(B)。此外,CD8、PD-1和PD-L1在高MLDPS组中高表达(D-E)。

 

到这里文章的主要内容就介绍完了,总结一下,文章纳入多个OV队列,识别出一致的强预后风险基因,并基于这些基因对患者进行分型。研究进一步利用多种机器学习方法,基于不同亚型间的差异基因构建了OV预后特征MLDPS。文章最后从多个角度在不同队列中对MLDPS进行了分析、比较、评估及验证。文章内容丰富,逻辑严谨,有理有据,整个多个公共数据集,利用多种机器学习方法开发鲁棒预后特征的思路清晰易懂,非常适合小伙伴们参考学习。 

SXR202401028C_jing_公共数据+机器学习的5+预后模型思路分享

上一篇: SXR202309021C +公共数据库挖掘换个思路,影响因子比原文高一倍
下一篇: 不得不关注的事件
相关文章