最近,被总理两次提名的“地摊经济”热度很高,于是小编想着要不要积极响应国家号召,晚上去广场摆个摊?但思来想去,才发现自己贴膜不如专业小哥,吹拉弹唱样样不精通,搞搞吃的喝的又不现实,害!
心不灵手不巧的我最后幡然醒悟,我可以
回归我的老本行呀!身为一名底层的科研狗,最怕老师突然有想法!“XX,你去找一下这个病的用药数据以及……”,“XX,你再找找数据验证一下这几个基因的预后效能”…… 每次老板口气中的那一抹“这些都是小case,很简单的啦”都会让我开始怀疑人生,我是不是入错行了?现在转行是不是有点晚?最后东翻翻西翻翻,东西好不容易找好了却忘了记录,so下次用到的时候又把弯路走一遍(欲哭无泪)。
俗话说,好记性不如烂笔头,小编痛定思痛,决定先整理一份mi
RNA相关数据库的保姆级教程分享给大家,说不定哪天就用上了呢。好,上正餐!
1. TargetScan:http://www.targetscan.org/vert_72/这是小编记住的第一个预测哺乳动物mi
RNA靶基因的数据库,该数据库利用3P-seq测序技术,确定转录本对应的3’UTR区。我们常用的是TargetScanHuman子库,进入数据库主界面之后,我们可以根据已知基因(输入基因symbol或Ensembl ID或转录本ID)预测靶向它的mi
RNA,也可以根据miRNA预测其靶基因。
.1. TargetScanHuman主页面 以基因PARP1为例,在.2的搜索结果中,我们能看到它有3个转录本,最下面是这三个转录本的结构示意图,没啥意外的话直接选第一个最具代表性的就ok了。
.2. PARP1查询示例 点击之后可以查看上面的miRNA结合位点,如.3所示,黑色框表示该miRNA和目的基因有多个结合位点,查询页面有一个可下载的保守位点的列表,给出了最有可能的miRNA与PARP1结合位点的序列信息。
.3. PARP1查询示例 接下来,小编又输入miR-9-5p检索了它的靶基因(.4),共得到1388个包含保守位点的转录本,表格列出了它们对应的基因symbol和名称,靶基因按照背景得分由小到大进行排序,分值越小可能性越大。此外,表格还列出了靶基因上结合位点的数量以及结合方式,最后一列是相关的文献。其中,表格的第一、二列和Link to sites in UTRs列可以点击查看详细信息。
.4 miR-9-5p的预测结果 2.miRBase: http://www.mirbase.org/index.shtmlmiRBase是最权威的miRNA公共数据库之一,储存了所有miRNA的序列和注释信息,这些数据都可以在Download页面进行下载,并且还可以预测靶基因。我们可以通过miRNA的名字、miRBase ID或其他关键字来检索miRNA,也可以根据基因组位置、物种组织或已知序列进行查询。
.1 miRBase查询界面 小编以has-miR-100为例,如.2所示,我们可以查看它对应的基因、序列、茎环结构、在基因组中的位置等信息。还可以看到这个miRNA前体产生的的两条成熟的miRNA序列has-miR-100-5p和has-miR-100-3p,以及TargetMiner、miRDB等不同数据库预测的靶标。
.2 检索示例 万能的b站有一个相关视频,链接在此https://www.bilibili.com/video/BV16x411e7NG?p=2,up主将所有检索方式都演示了一遍,并对结果进行了解读,想了解更多的朋友可以看一下哈,也就十多分钟。
3. ENCORI: http://starbase.sysu.edu.cn/这是starBase的3.0版,小编搜的时候差点就错过它了,咋就还改名字了呢?这个数据库中的miRNA-ncRNA, miRNA-mRNA, ncRNA-RNA, RNA-RNA, RBP-ncRNA和RBP-mRNA 的互作都是基于CLIP-seq和降解组测序(针对植物)数据挖掘的。利用32种癌症的基因表达数据,我们还可以对RNA-RNA和RBP-RNA互作进行泛癌分析。此外,starBase v3.0还允许平台对miRNA、lncRNA、mRNA、假基因等进行生存和差异表达分析,功能非常强大(你可以不用,但我必须得提供,哈哈)。主页面也是做的简洁明了,可以说是很友好了。
.1 starBase主页 咱们主要还是看一下miRNA-mRNA间的互作关系,以has-miR-22-3p为例,最左边是查询选项,包括参考基因组、物种(人或小鼠)以及其他支持数据。
.2 miRNA-mRNA查询界面
点击基因name之后(.3),可以查看靶基因的详细信息,如转录本ID、结合区域。在.2的结果列表中,还包含了PITA、miRanDa、TargetScan等七个软件的预测结果,以及相应的支持数据。
.3
最后一列是互作对在32种癌型中的泛癌分析结果,包括它们在每种癌症中的相关系数、显著性p值等信息,还可以将表达数据以散点图或箱式图的形式进行可视化,这一块做的还是有些简单随意的。
.4 泛癌分析 Besides,小编发现starBase还根据miRNA-target的互作,提供了miRNA的富集分析,包括GO、KEGG、Reactome等,真的是相当全面了。
.5 通路富集
4. miRCancer: http://mircancer.ecu.edu/index.jsp搞生物信息,肯定是绕不开癌症的,所以小编还要给大家简单介绍一下这个
肿瘤相关的miRNA数据库。miRCancer针对每种
肿瘤,列出了相关的miRNA及其表达趋势,并给出了对应的文献,使用起来也是很简单的,没有什么难度。
.1 miRCancer Browse界面 点击Search miRCancer之后,我们可以输入自己感兴趣的miRNA 或癌症名称进行检索。这些数据都是开源的,可以点击Download下载txt格式,目前最新版本是2020年6月份的。
.2 下载页面 然而,有这么一个新的数据库觉得现有的miRNA工具还不够全面,并自称是第一个集miRNA–gene关联的注释信息、表达谱数据、预后图谱以及多种癌症和正常组织中的潜在作用机制于一身的综合性数据库,这好像是算法、数据库类型的文章惯用的写作套路吧。
好了,不卖关子了(毕竟,能看到这里的都是真爱呀),它就是miRactDB。小编越看越觉得,这文章一发完,后期维护就全看心情了,不造能坚持多久!
当然,miRNA数据库还有很多,像miRcode、miRDB、miRWalk等等,但一般来说,在平时的科研中,我们掌握其中的两三个就足够了,也没必要非得搞个自行车哈。
好了,小可爱们下次见了,( ^_^ )/~~拜拜! 欢迎关注转录组 | 甲基化 | 重测序 | 单细胞 | m6A|多组学 cytoscape | limma | WGCNA |水熊虫传奇|linux电泳 | PCR | 测序简史 | 核型 | NIPT | 基础实验 基因| 2019-nCoV | 富集分析 | 联合分析 |微环境 瘟疫追凶| 思路汇总| 学者| 科研 | 撤稿 | 读博|基因