GEO数据库储存了芯片、二代测序以及其他高通量测序数据等丰富的数据。学会获取、分析GEO数据会让我们的科研工作更加顺畅,而今天小编介绍的开发的在线分析工具easyGEO则会让我们如虎添翼。
![easyGEO — 让GEO数据处理so easy](https://www.yanyin.tech/cms/manage/file/16ecc0f28ae94341ae24a26881a30e51)
主界面:
进入网址主页我们会清晰的新增的GEO数据集及相关数据信息,并且我们可以根据自己感兴趣的方向在搜索框中输入数据集编号或者疾病等相关信息来查询数据。
(主页)
例如:搜索关键词breast cancer
同时我们还可以对样本数进行限制,满足数量要求
(关键词搜索结果)
例如:搜索数据集编号GSE93798
(数据集编号搜索结果)
数据集详情信息:
点击具体数据集内容即可进入到数据集的介绍页面。主体包括下列信息:
1.数据集标题、概要、样本信息等;
2.点击数据ID可以链接到原GEO数据库相关数据集界面;
3.点击样本ID可以链接到原GEO数据库相关样本界面;
4.点击下载数据可以获得数据集样本信息;
5.点击数据预处理可将探针的表达转换为基因的表达。
(数据集信息)
其中,数据预处理部分需要注意:
若数据集不需要重注释,则只需要确定“基因名称所在列”和“探针合并方法”(包括:均值、中位数、最大值、最小值)即可。
(数据预处理信息界面)
若数据集需要重注释(即注释数据并没有给出探针与基因的对应关系),则需要确定“探针合并方法”(包括:均值、中位数、最大值、最小值)以及序列和基因组信息“探针所在序列”和“参考基因组”。
(数据预处理信息界面)
预处理完成后,我们可以通过点击查看结果获得数据预处理报告,并进一步获得表达谱和临床信息。随后就可以在数据分析处选择具体分析内容“差异表达分析”和“核心基因流程”进行分析。
(注:必须先数据预处理完成才可以进行后续的分析呦~)
(数据预处理结果界面)
差异表达分析:
1.选择数据集,下拉选择已预处理后的GEO数据集进行差异表达分析;
(差异表达分析-选择数据集)
2.选择分组,对样本划分组别;
选择分组时,若在辅助分组中有符合的明确分组可以采用“快速新建”确定样本划分;若在辅助分组中无符合的分组要求则采用新建分组,先确定分组名称再将样本勾选并加入到定义好的分组信息中。其中,若有数据不符合要求可在分组完成后选择“删除缺失数据”即可。
(差异表达分析-选择分组)
3.选择参数,包括设置log2(FC),P值和矫正后P值等参数;
(差异表达分析-选择参数)
4.差异表达分析报告,获得详细信息。
点击查看结果即可获得差异表达分析报告,进一步了解差异分析结果信息(如上下调基因数等)、火山图、差异基因等。
(差异表达分析-结果界面)
(差异表达分析-分析报告部分内容)
核心基因流程:
1.选择数据集,下拉选择已预处理后的GEO数据集进行差异表达分析;
2.选择分组,对样本划分组别;
3.选择参数,包括设置log2(FC),P值和矫正后P值等参数,并且需要生存信息;
(核心基因分析-选择参数)
4.核心基因分析报告,获得详细信息。
点击查看结果即可获得核心基因分析报告,除了包含差异分析结果信息,还包括了基于STRING数据库构建PPI⽹络,并⽤Cytoscape的MCODE插件进⾏⼦⽹挖掘获取核心基因。并且,对核心基因采用生存分析进一步展示生存曲线。
(核心基因分析-结果界面)
(核心基因分析-报告内容-PPI网络)
(核心基因分析-报告内容-子网挖掘)
(核心基因分析-报告内容-生存分析)
这么简单易操作的在线分析工具easyGEO,生信分析小白还不赶快用起来~~~
也会陆续推出更多分析工具,大家敬请期待!