GSEA软件使用入门

admin 43 2025-02-12 11:37:08 编辑

官网 http://software.broadinstitute.org/gsea/index.jsp

官网下载 http://software.broadinstitute.org/gsea/downloads.jsp

安装前需要安装好java环境

官网说明书 http://software.broadinstitute.org/gsea/doc/desktop_tutorial.jsp 

首先我们先了解一下什么叫做基因富集分析 

基因富集分析是分析基因表达信息的一种方法,富集是指将基因按照先验知识,也就是基因组注释信息进行分类

2005年提出了基于基因集(gene set)定义的基因富集分析方法。  首先要定义基因集,也就是基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,每个基因可能同时参与好几种功能。

这样,得到这两组数据后,我们所分析的不是单个基因表达的差异,而是箱子与箱子之间的差异。由此,我们得到的数据更容易解释。 

 

GSEA基本思想  

使用预定义的基因集,将基因按照在两类样本中的差异表达程序排序,检验预先设定的基因集合是否在这个排序表的顶端或者底端富集。

 

GASEA原理

PNAS文章Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. Epub 2005 Sep 30. 

 

GSEA如何使用

我们只需要一个表达矩阵,并做出分组说明的cls文件

说明书的测试数据http://software.broadinstitute.org/gsea/datasets.jsp

数据要求格式:http://www.broadinstitute.org/cancer/software/gsea/wiki/index.php/Data_formats

我直接下载p53的测试数据

12625:基因数量  50 :样本数量

说明文件:50个样本分两组,一组为Death(D),一组为Alive(A)

50 2 1#Death AliveD D D D D D D D D D D D D D D D D D D D D D D D D A A A A A A A A A A A A A A A A A A A A A A A A A

(一共50个 各25个)

 然后用Method 1将两个文件导入GSEA 

 

确定无误后开始运行,运行需要设置参数

输出的数据非常多,对你选择的gene set数据集里面的每个set都会分析看看是否符合富集的标准,富集就出来一个报告。

点击success就能进入报告主页,里面的链接可以进入任意一个分报告。

其实除了GSEA之外,还有很多富集分析的工具。之前上也推送过。

 富集分析工具汇总

当然了,如果你能掌握富集分析的原理,那么你完全可以不借助工具,去得到你想要的结果。

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: R语言中的颜色问题
相关文章