CrIMMix R package--无监督聚类方法汇总

admin 7 2025-02-11 12:54:08 编辑

无监督聚类方法多种多样,分析时不知从何入手?今天小编给大家带来一个无监督聚类分析方法对比的文章,其中包含了13种无监督聚类的方法及相关的R包,并且将其汇总构建R包CrIMMix。

Clustering and variable selection evaluation of 13 unsupervised methods for multi-omics data integration

无监督聚类分析方法有(相关R包信息见表格1):RGCCA (Regularized generalized canonical correlation analysis)SGCCA (Sparse generalized canonical correlation analysis)MCIA (Multiple co-inertia analysis)intNMF (integrative- non-negative matrix factorization)iCluster and iClusterPlusMoClusterMOFASNFMixKernelCIMLRPINS and PINSPLUSConsensus clusteringLRAcluster

采用多种组学数据集,包括蛋白质组学,代谢组学,转录组学,表观基因组学基因组学(体细胞突变和拷贝数变异),评估各方法聚类及变量选择的能力。

运行时间

所有方法每次运行的计算时间都在几秒钟到几分钟之间。最快的方法是SNF,三种最慢的方法是iClusterPlus,CIMLR和intNMF。此外,对于SGCCA,PINSPlus和ConsensusClustering方法,当人数增加时,计算时间会略有增加。

参数调整的影响MoCluster,SGCCA,RGCCA,intNMF和MCIA都需要调整潜在配置文件的数量;SGCCA,MoCluster和iClusterPlus需要调整稀疏性参数;RGCCA涉及调整收缩参数τ。通过调整ARI和ROC曲线研究了潜在变量数d,收缩参数τ和稀疏性参数的影响。d的值太小或太高都会降低恢复相关变量和真实聚类的能力; 如果稀疏度太高,则会遗漏大量相关变量,而如果稀疏度太低,则FPR会增加;τ不会影响结果。

聚簇选择LRACluster,MoCluster和SGCCA是选择中位数等于4的聚簇的最佳方法;PINSPLUS在2至4个集群之间进行恢复,而RGCCA在3至5个聚簇之间进行选择,而iClusterPlus在2至5之间进行聚簇;SNF,RGCCA,intNMF和mixKernel在3个聚簇中仅恢复2个;最后,恢复聚簇的三种最差方法是ConsensusClustering,CIMLR和MCIA。

聚类评估比较所有方法对样本进行正确子组分类的能力。ARI是一个分数,用于衡量两个聚类之间的相似性。在此,在模拟聚类和方法给出的聚类之间计算ARI。在噪声水平的影响:使用B1,B2,B3和B4基准来评估数据集噪声水平的影响,最一致的方法是SNF,MoCluster,intNMF PINSPLUS,ConsensusClustering,LRAcluster,RGCCA和mixKernel,四个基准的平均ARI均大于0.80;CIMLR和iClusterPlus难以达到ARI的最大值;MCIA和SGCCA是变异性更大的方法。subgroup数量的影响:使用B6,B7和B8基准了评估整个数据集中的subgroup数量的影响,SNF, RGCCA, PINSPLUS, Consensus- Clustering, LRAcluster, MoCluster, intNMF and SGCCA 是变化不敏感的方法;mixKernel, iClusterPlus and MCIA仅由两个子组组成,存在稳定性问题。

变量选择的稳定性

只有四种方法执行变量选择:MoCluster,SGCCA,CIMLR和iClusterPlus。MoCluster具有更好的处理二进制分布的能力,可以选择频率高于90%的大多数变量,总体上优于其他方法。

总之,在聚类方面,SNF、MoCluster、CIMLR、LRAcluster、ConsensusClustering和intNMF的效果最好;在变量选择方面,MoCluster优于其他。详细情况总结如下表所示:

并且,在GitHub上提供一个名为CrIMMix的R包,汇总上述方法,通过简单的命令行和统一的输出运行所有方法,这样便捷的方式,大家可以尝试起来呀~

CrIMMix R package--无监督聚类方法汇总

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 序列组装的算法k-mer
相关文章