一站式GEO数据分析平台easyGEO
目前对于GEO等生物数据的挖掘会产生十分有价值的信息或成果,GEO2R等在线分析工具对于缺少编程经验的人来说显得尤为重要。目前针对于GEO数据挖掘的生信在线分析工具以检索、数据可视化、差异表达分析为主,难以满足日益增长的生信分析需求,比如生物网络分析、模块挖掘、生存预后分析等。

为了助力GEO数据分析、服务于广大客户,全力打造了一站式GEO数据分析平台easyGEO,集数据预处理及标准化、差异表达分析及火山图可视化、蛋白质互作网络构建及可视化、Hub基因识别及子网络挖掘、生存分析(Kaplan-Meier⽣存曲线图)等分析模块于一体。用户可以在超过25000套GEO数据集中进行自由探索,用别人的数据、别人的代码、别人的服务器,建自己的idea、发自己的paper。接下来我们依次介绍每个模块的功能:模块一数据检索,模块二数据预处理,模块三差异表达分析,模块四核心基因挖掘,模块五网站导航,模块六工具宝典。
模块一:数据检索
easyGEO网站主页展示了最新收录的数据条目,方便用户浏览和查询数据,用户也可以点击查看更多进行高级检索筛选。
高级检索页面可以依据疾病名称、样本数、发布时间、是否有生存数据进行检索,选择合适的数据进行探索。
模块二:数据预处理
用户选择合适的数据之后,网站提供了全面的信息展示,并且可以链接到原GEO库中,点击数据预处理进行初步处理。
这里将相同基因的不用探针按照中位数进行整合。
点击开始预处理进行操作,自动跳转到任务界面并记录运行信息。如果重复运行了相同一套数据,网站也会自动编号从而保证不同参数的结果存在。结束之后点击查看结果进行下一步操作。
预处理的分析报告如下,可以下载整个表达谱及样本信息。
模块三:差异表达分析
进行差异表达分析有两个入口,个是在任务中心页面,选择合适的数据集之后确定分析方法。
选择差异表达分析,点击下一步。
第二种进行差异表达分析的入口在网站的菜单导航栏数据分析入口。
点击快速新建,从而选择样本的分组信息
在弹出的窗口中选择样本分组类型,这里以器官为例。
选中所有样本,点击下一步。
这里是差异表达的默认参数,可以修改,或直接生成报告。
差异表达分析的结果如下,在任务中心页面也可以找到,提供了基因、log2FC、p值和校正p值,并且提供了火山图。
模块四:核心基因挖掘
类似于差异表达基因分析,进行核心基因分析。
选择分组,同上。
点击设置生存时间参数及事件。
实例设置如下,点击生成报告。
核心基因分析的结果相当丰富,首先是差异表达分析的结果,这里不再赘述。
第二个结果,从差异表达基因中构建了蛋白质互作网络,并且提供了网络图。
第三个结果是在蛋白质互作网络中基于网络测度识别hub基因,这样再也不愁找不到靶点了。
第四部分结果是在hub基因的基础之上,进行生存分析,KM曲线说明了hub基因表达水平对样本生存预后情况的影响。
KM曲线如下图。
模块五:网站导航
模块六:工具宝典
该网站有一系列兄弟网站,蕴含着丰富的工具与信息,值得大家去探索,包括文献检索下载、期刊查询、科研绘图等。