值得参考的6+SCI诊断模型

admin 26 2025-01-17 编辑

大家好!今天给大家介绍一篇2021年发表在frontiers in Cell and Developmental(IF:6.684)上的文章。作者使用免疫细胞浸润水平和随机森林构建了可以准确鉴别骨相关恶性肿瘤的诊断模型。

Application of Immune Infiltration Signature and Machine Learning Model in the Differential Diagnosis and Prognosis of Bone-Related Malignancies

使用免疫浸润特征和机器学习鉴定骨相关恶性肿瘤的诊断和预后特征

摘要:

        骨相关恶性肿瘤,如骨肉瘤(OS),尤文氏肉瘤(EW),多发性骨髓瘤(MM)和骨转移癌症(MM)具有类似的组织学特征,但他们的起源和生物学行为不同。作者认为四种最常见的骨转移相关恶性肿瘤具有相似的免疫浸润微环境,可以用于肿瘤诊断和预后。作者对22个公开数据集进行ssGSEA分析研究肿瘤免疫微环境,使用随机森林构建诊断模型,准确率高于97%。对骨肉瘤和尤文氏肉瘤患者的免疫微环境进行统计学分析发现骨相关肿瘤的免疫微环境存在显著差异。尤文氏肉瘤中多种免疫细胞的高浸润水平与患者预后较差有关。骨肉瘤中巨噬细胞和B细胞高浸润水平与患者预后较好有关,而效应记忆CD8 T细胞和2型T辅助细胞与患者化疗反应和肿瘤转移有关。作者的研究表明,基于免疫浸润微环境的随机森林诊断模型可以准确诊断骨相关恶性肿瘤。骨肉瘤和尤文氏肉瘤的免疫浸润微环境与患者预后有关。

材料与方法:

1.基因表达数据预处理:本研究共包括从GEO数据库和TARGET数据库下载的22个基因表达和临床数据集。从数据集中过滤掉细胞系样本,重复样本和正常样本,仅保留原发骨肿瘤和骨转移样本。随后,对表达数据进行归一化和批处理。

2.免疫浸润微环境:对基因表达数据进行ssGSEA分析,研究28种免疫细胞的浸润水平。

3.构建诊断模型:将本研究数据集分为训练集,测试集和验证集,训练集包括998例样本,测试集包括386例样本,验证集包括74个样本。使用R包RandomForest对训练集建模,ntree参数取值为10-500,mtry参数取值为0-15,并为参数进行优化。使用测试集和验证集验证模型性能并绘制ROC曲线。

4.统计和生存分析:使用R包stats进行t-test和ANOVA 检验。使用单因素Cox分析和KM分析对TARGET OS,GSE21257,GSE16091,GSE29055,GSE17618和GSE63157数据集进行预后分析。

结果:

1.免疫细胞浸润水平

        1459个样本的28种免疫细胞富集打分如A所示,结果表明这四种肿瘤中均存在28种免疫细胞并且相同肿瘤内和不同肿瘤中存在相同的富集趋势。为研究不同肿瘤中各个免疫细胞浸润水平的差异,作者进行ANOVA分析(B)。MM样本中B细胞的ES打分显著升高,CD56 dim NK细胞,巨噬细胞和Treg细胞富集于OS样本中,BM样本中T细胞,B细胞和浆细胞样树突细胞的浸润比例较高。不同肿瘤中免疫细胞的相关性分析如C所示。OS和EW样本中大部分免疫细胞正相关,而MM样本中免疫细胞相关性较差,BM样本的免疫细胞相关性较为复杂。此外,根据各个样本的ES打分绘制配对图,根据激活B细胞和未成熟B细胞的富集打分可以区分MM样本和其他样本()。以上结果表明,这四种肿瘤的免疫浸润微环境存在显著差异,可以根据免疫微环境进行差异诊断。

2.开发诊断模型

        作者使用随机森林和998例训练集样本构建多类别的诊断模型。为检验分类模型的性能绘制MDS图,结果表明基于免疫浸润水平可以区分大部分样本(A)。随后,对模型参数进行优化,当ntree=150,mtry=5时,诊断模型的性能较好,OOB错误率为2.3%(B和3C)。当继续增加ntree时对模型性能没有显著影响,而增加mtry会降低模型精度。为进一步确定模型中起到关键作用的因素,绘制变量重要性直方图(D)。在28种免疫细胞的富集打分中,单核细胞,CD56dim NK细胞和活化B细胞对模型准确性的贡献最大。

4.诊断模型验证

        作者使用测试数据集中的387例样本进行内部验证,准确度为97.42%,对BM,EW,MM和OS的敏感性为0.828,0.954,1和0.992,灵敏度为1,0.997,0.996和0.970。RF模型和5个免疫细胞ES打分的ROC曲线如A-4D所示,其中RF模型的性能较好。此外,使用74个样本的验证集对RF模型进行验证(E-4H),精确度为98.65%,BM,EW,MM和OS的灵敏度为1,1,0.941和1,特异性为1,0.984,1和1。表1为训练集,测试集和验证集的F1值,精确度和召回率。

5.OS和EW的免疫浸润打分的预后价值

        作者对包含生存数据的6个数据集进行Cox回归分析,OS和EW样本的免疫细胞打分的单因素Cox值如A所示。将ES打分中位数作为阈值,对6个数据集进行KM分析。4个OS数据集中,巨噬细胞与患者生存期有关(B1-B4),而对于活化B细胞来说,仅GSE39055数据集的KM具有显著差异(B1-B4),CD56dim NK细胞与生存期的关系如D1和D2所示。对OS全部数据集进行KM分析,巨噬细胞和活化B细胞的ES打分与OS患者生存期正相关(E和5F),而对EW患者来说有17种免疫细胞与EW患者生存期负相关(G)。

        为进一步研究免疫浸润打分与患者临床特征的相关性,作者对不同亚组进行t检验。结果表明,在男性患者和女性患者中CD4 T细胞浸润水平存在差异而其他免疫细胞浸润水平没有显著差异。根据患者年龄将患者分为青年组和老年组,青年组中有26种免疫细胞浸润水平较低。此外,根据肿瘤坏死率90%将患者分为Huvos Ⅰ/Ⅱ组和Ⅲ/Ⅳ组,Ⅲ/Ⅳ组中CD8 T细胞,肥大细胞和2型Treg细胞浸润水平较高()。

结论:

        本研究表明基于免疫细胞浸润水平的随机森林诊断模型可以准确诊断骨相关恶性肿瘤。骨肉瘤和尤文氏肉瘤的免疫浸润微环境对患者预后具有重要影响。抑制尤文氏肉瘤的高炎性环境和促进骨肉瘤巨噬细胞和B细胞浸润水平有可能成为一种新的辅助治疗手段。本文以免疫细胞浸润水平为切入点并使用随机森林构建诊断模型,此外还鉴定到了与患者预后相关的免疫细胞,本研究的分析方法和分析内容都十分简单,值得小伙伴借鉴~

值得参考的6+SCI诊断模型

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 15年最牛叉的医学文章
相关文章