小编最近在Nature genetics上发现一个新工具Signature Multivariate Analysis(SigMA)。SigMA是一种特征分析工具,可优化检测与HR缺陷相关的突变特征。

SigMA利用来自ICGC和TCGA的WGS数据,识别共同出现的特征及其对给定肿瘤类型及其亚型的相对贡献,通过分级聚类的特征部分聚类,定义了肿瘤的亚型。在针对每种肿瘤类型鉴定具有相似突变谱的样本簇之后,然后通过使用基于似然的相似性度量来比较新样本的突变谱与每个簇平均值。这允许将新肿瘤与共享相似签名组合的肿瘤一起分类。当突变计数较低时,这是一种更稳定的方法,用于推断样本中存在的签名组合。采用多元分析允许SigMA自动处理不同的测序平台。SigMA第二个组成部分是用于将给定样本的突变模式与聚类的概况匹配的相似性度量,计算新样本中突变的可能性是由每个肿瘤群的突变谱定义的概率分布产生的。
以乳腺癌为例
a.将乳腺癌WGS数据按其分数特征组成进行聚类,得到的集群分为四类(Sig3、APOBEC、Clock、MSI)。
b.对其他肿瘤类型的相同聚类分析。
c.利用WGS数据进行签名分析,确定每个样本的签名暴露量。通过对WGS数据进行子采样,生成模拟的exomes和panels。
d.WGS样品和模拟panels的SNVs的个数分别是780和560。与WGS相比,模拟panels的snv数量减少了三个数量级。
e.例子表明与同一样本的WGS频谱相比,模拟panels的观测频谱更为稀疏。
f.用WGS分析(y轴)和SigMA(x轴)在对模拟panels进行分类比较。
SigMA性能评估
a.在Sig3+(紫色)和Sig3-(灰色)肿瘤以及三个平台(panel、exome和WGS)上显示四种测量方法(cosine similarity, NNLS exposure, likelihood and SigMA score)的密度分布。相比之下,SigMA表现出更好的分离,尤其是对于模拟panels数据。
b.ROC曲线,在相同的FPR下,SigMA比其他方法具有更高的灵敏度。
c.在10%的FPR下,SigMA对面板的敏感度为74%,明显高于其他方法的37-47%。
d.当Sig3在突变谱中占较大比例时,对检测的敏感性往往会显著提高。
SigMA的获取
SigMA的代码可以在GitHub上作为R包提供。
具体使用文档的可以参考:https://github.com/parklab/SigMA/blob/master/manual_sigma.pdf
参考文献:Detecting the mutational signature of homologous recombination deficiency in clinical samples
argin-right: 8px;margin-left: 8px;max-width: 100%;min-height: 1em;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;line-height: 2em;box-sizing: border-box !important;overflow-wrap: break-word !important;">