最近在努力憋文章,各种得到小伙伴们吹捧的流程图和配色却被老板很是吐槽,老板语重心长地讲到:“图片一定要高大上,要很酷炫。”
然后我就开始认真定义和领悟酷炫这个词,然后发现各个老板对于酷炫的定义也很不相似。某只甚至很开心地讲他老板觉得酷炫的图片应该是:“字体要大,颜色要炫!”好吧,这些其实是很玄幻的事,如果大家对于酷炫有什么样深刻的领悟,请一定告诉我……
今天教学的是(或许挺酷炫的)画通路中蛋白相互作用的图。对于此大部分同学可能会先做一个通路富集,然后把富集到的基因扔到STRING数据库中,调取相互作用的关系,然后放到cytoscape中进行可视化。
但是设想下如果你富集到了10条通路,都需要做可视化,是不是感受到了一丝丝台风……
所以今天给大家介绍一个cytoscape插件stringApp,可以轻松完成富集和互作关系可视化的要求。
首先打开cytoscape,请注意一定使用新版本(我使用的是3.6.1)。点击App,选择App Manage,选择stringApp进行安装。
安装完成后,开始导入蛋白互作网络。选择从公共数据库导入网络。
选择Data Source为STRING protein query,然后输入你需要富集的蛋白名称。输入多个蛋白表示导入这些蛋白之间的相互作用,输入一个蛋白表示导入这个蛋白相关的相互作用。另外,这里我选择分数至少为0.7的互作关系,比较高的可靠关系。如果只想要从实验中得到结果,可以在后续对边进行进一步筛选。
导入后就是这样一个非常迷茫的网络。
然后开始使用stringApp来进行富集分析。选择App下的STRING Enrichment,选择第一项。
默认p value 为0.05。富集的结果在STRING Enrichment中显示。
选择panel上黑色的小漏斗,我们可以看到它进行了五种的富集,这里我们只选择KEGG pathway,只看通路富集结果。
你可以选择下边底端的edge,保留你需要的来自实验的结果(这里不作具体展示啦)。为了展示方便,我将所有的蛋白都涂成了绿色。我们选中一条通路,可以看见有一部分小点变成了黄色,这些蛋白即是这条通路中的成员。
将这些成员及其连接边创建成一个新网络,进行进一步查看。
得到的新网络大家可以进行一些调节,让其看上去不至于很小很诡异。
如果你不想用默认巨长的编号来注释蛋白,可以把node的label改成display name这一列,用gene name来注释node。Edge上的pp注释如果不想要,可以自己创建一个空列,然后将edge的label改成这个空列。
最后调解下布局、颜色。如果不想要没有连通到大网络中的蛋白,可以删掉。
然后就是导出图片,可以调节图片大小等等。
最后查看图片。
富集到的通路通路都可以直接从大网络分离出来,需要一个个从string数据库中导出然后再导入之类。
存在一个问题就是STRING的富集结果和传统David的富集结果其实是有一定差异的。同样是文中的蛋白,David的结果是(挑选了前边的一部分):
STRING的结果是:
大致结果是一致的,但是未校正的p value和基因count数会有一点差异,我觉得主要可能是基因名转换机制和富集的方法差异导致的。但是stringApp作为一个通路蛋白相互作用的工具,确实非常方便,如果大家不放心,可以现在David中做富集,然后用它来做可视化。
图可以不酷炫,但是酷炫的姿态还是要有的,祝大家沉迷科研、无法自拔~
欢迎关注
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史