(SXR2023030035C )scATOMIC——最新微环境中单细胞的泛癌分类

admin 1 2025-02-05 编辑

今天小编来介绍一篇今年3月刚发表在nature communications(IF: 17.694)杂志上的文章。该文基于单细胞测序数据,主要提出了一个全面的泛癌 TME 细胞类型分类器——scATOMIC。

Pan-cancer classification of single cells in the tumour microenvironment

 

scTOMIC能够降低TME多细胞系统的转录组复杂性,以改善细胞分类。还能够以高分辨率准确识别TME驻留细胞,分离癌症和正常组织细胞并确定肿瘤的来源。

通过scRNA-seq分析各种免疫细胞和基质细胞在癌症中的功能,目前有很多成熟稳定的科学见解。然而,能够标准化单个恶性细胞识别的自动化方法依旧空缺,细分肿瘤亚型的方法也并非一站式。因此,有了本文所提出的scTOMIC的诞生。

本文采用的数据为19种常见癌症类型的癌细胞系的scRNA-seq以及不同外周血细胞的CITE-seq数据集(蛋白质组学和转录组学)。另外还有从几个肿瘤和正常组织来源收集的基质细胞scRNA-seq。总体而言,scTOMIC的训练参考数据集中包含301662个细胞。

相关代码的链接已放置在了文末。

 

一、模型的设计与开发

首先需要了解的是RHC-REP,它是作者提出的一种为了反向分层分类(reversed hierarchical classification)和重复消除亲属节点(parental nodes)方法。

它的具体作用是在分类任务的集合中减少了细胞类型的广度。RHC-REP将优先选择对被询问细胞类型具有最高特异性的特征。

那么接下来,我们正式进入scATOMIC模型的构建:

1.作者基于泛癌的TME层次结构(每个父节点代表一组相关细胞,每个终端节点代表一个感兴趣的单细胞类别)训练了24个随机森林模型,对应于父节点的总数。模型提供与父节点内每个终端类投票的树的比例相对应的预测分数。然后输出一个按细胞预测得分(PS)矩阵。

2. 细胞在其父节点的相应模型中迭代询问,直到获得终端分类。并且在每个分类任务期间,每个单元都会收到一个预测分数 (PS) 向量,对应于父节点中为每个终端类投票的树的百分比。然后通过PS矩阵计算该单元来计算中间组分数(IGS),随后将单元格链接到层次结构中的下一个父节点。如果单元格的 IGS 低于置信临界值,则每个单元由其下一个关联模型进行询问,并且由一组更具辨别性的特征来进行潜在的终端类定义。未通过 IGS 阈值的细胞将被赋予其先前的父分类,并保留进一步的子分类。

作者还提出:scTOMIC中嵌入了癌症签名评分和细胞分化模块。例如下图的f模块(f),通过对批量scRNA-seq衍生的分化基因表达程序进行评分来区分癌症和组织特异性非恶性细胞。scATOMIC 自动将群体 2 注释为癌细胞,将群体 1 注释为非恶性细胞。

 

二、模型验证

采用一个内部验证集和两个外部验证集共同验证,结果分别如下图显示。这些结果证明了scATOMIC的核心算法在检测癌细胞及其类型方面具有高度的准确性。

 

三、模型优势与模型作用

1.由于现有的细胞类型分类工具(例如SingleR、Seurat、SingleCellNet、scmap-cell、CHETAH和scType)并非旨在注释恶性细胞,因此该比较突出了scATOMIC克服泛癌症环境中的复杂性以准确识别癌细胞的能力,同时在注释基质和血液方面也具有相当或显着更好的性能(c)。

2.scATOMIC能够区分非恶性、组织特异性细胞和癌细胞,这里是基于inferCNV算法,预测的恶性细胞被推断为非整倍体细胞,而正常组织细胞被推断为二倍体。与CopyKAT的比较如b所示。

 

3.scATOMIC比肿瘤数据集中的原始注释具有更高的细胞分辨率,例如可以识别重叠的基因表达,并将其分到合适的细胞类型中;还可以进一步细分为亚型。另外scATOMIC 在胶质母细胞瘤中鉴定出造血干细胞/祖细胞 ,这些已被证明可以促进肿瘤细胞增殖的群体。

 

4.scATOMIC 被证明检测转移性癌症的起源组织是可行的(准确度为83.9%),并且可以帮助识别各种实体人肿瘤中的癌症原发部位。

总而言之,scTOMIC的核心分层算法能够以高分辨率解析细胞身份,标记更细的T细胞状态,识别稀有细胞类型,避免错误分类未知细胞并确定癌症类型。

 

 

四、讨论

总之,scTONATIC被提出有效地注释泛癌症环境中的TME。其通过使用稳定表达的转录本作为特征、结构化分类和使用可靠和大型数据集训练的模型,已被证明可以准确识别癌细胞类型及其来源,并且可以进行更细的亚型分类。此外,scANTIC与其他现有的自动细胞类型注释器相当或优于其他现有的自动细胞类型注释器。而且,在具有基因组不稳定性和正常细胞适当参考的样本中,scANTIC和CNV推断与scRNA-seq数据中的恶性细胞之间具有高度一致性,因此作者因此建议将scANTIC与CNV推理结合使用来注释癌细胞及其类型。

  

代码详见:https://github.com/abelson-lab/scATOMIC

(SXR2023030035C )scATOMIC——最新微环境中单细胞的泛癌分类器

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 生信人迎春课程-多转录组
相关文章