文章题目:
Beginner’s guide to comparative bacterial genome analysis using next-generation sequence data(2013)
![细菌基因组分析综述](https://www.yanyin.tech/cms/manage/file/2179693d8248403887d95433d2069a80)
摘要
现在测序技术足够快和便宜,以至于细菌研究变得简单,另外也有上千的细菌基因组可以在公共数据库下载的到。
细菌基因组分析在研究机构,诊所,公共实验室非常广泛,他们大多关注细菌的遗传进化,治病基因和抗药性研究。对于初学者,我们旨在帮助他们能够利用自己的生物信息学知识完成对基因组的分析,并且能够得到他们想要的答案。一般分析内容包括如下几个部分:组装、排序、注释、比较进化、分型等。
Introduction and aims
目前测序较为便宜,对细菌分析成为可能,另外公开数据也是蛮多的(>6500个细菌基因组组装结果(2013))其中2/3是草图。
考虑到有很多的人会对细菌进行分析,并且是新手,我们不会告诉大家如何一次性的批量处理多套数据,但是我们会告诉大家如何利用个人pc实现对细菌基因组的分析。
其中人们关注细菌基因组关注的重点往往是:
(1)比较基因组学,和其他细菌的比对情况
(2)这个细菌基因组是否含有质体,噬菌体或者抗药基因等。
方法
(1)基因组组装
细菌基因组组装就是将有overlap的read 在不借助基因组的情况下链接成contig的过程。通常利用 Bruijn Graph 进行组装。主要软件:
Velvet、MIRA(Ion Torrent reads)
(2)contig 排序
组装完成之后,要对组装得到的contig 进行排序,以期得到完成的细菌基因组(环)
主要的方法:跟参考的细菌基因组进行比对,然后按照参考对自己的contig进行排序。主要的软件:MUMmer、ABACAS、Mauve(新手推荐)、另外的方法就是借助可视化软件,进行排序。推荐软件:Mauve、ACT等
(3)基因组注释
如何对细菌基因组进行结构和成分的注释,是非常重要的一步分析。推荐一个在线的自动注释工具:RAST。当然也有一些命令行工具:Prokka、DIYA。还有一些其他的工具:RATT、BG-7等。最终注释的结果的质量取决与你所使用的数据库,因此我们推荐你使用RAST。
(4)比较基因组学分析
这一部分大家更多的关注基因组序列中那一部分是和其他细菌共有的,那一部分是自己特有的。当然也有会关注一些特有的基因(有特殊功能的,比如抗药等)
这里推荐使用软件ACT,BRIG,Mauve。这些软件都可以可视化,这样更有利于比较这种差异。当然对于有经验的人来说,我们更多的推荐你使用blast和MUMmer。
分型和健康领域的应用分析:
识别抗药基因,噬菌体、质体和其他特异区域。
i、对于抗药基因的识别,我们推荐使用ResFinder 工具,这个可以在线使用。这个工具牛叉在于:
(1)你可以上传基因,如果你有预测的话
(2)你可以直接上传基因组
(3)你可以直接上传fastq数据,他照样可以支持。
多位点分型(MLST)是非常火的技术,通常用来对细菌序列分型,也可以用来前辈质体。
对于噬菌体预测,我们推荐使用PHAST软件。对于序列定位,比如定位一段序列是属于质体还是基因组,推荐使用ACT软件或者使用PATRIC。
其他的分析
1、研究近源种之间snp 的问题,通过read比对来实现。推荐自动化实现的流程:NesoniGalaxy等。
2、更为详细的基因内容的比较,我们推荐使用PATRIC和PGAT等,这个对于没有计算机编程经验的非常适用。
更为深入的分析建议
对于有进一步分析的人说,我们建议做好一下两点。
(1)学习使用linux命令行。这样你就有可能可以使用一大批软件去做复杂的分析。
(2)试着去书写脚本语言,比如python(Biopython)。这样你就自己来书写自己想要的流程。
欢迎关注
也欢迎大家能认真的帮助我们填写如下调查问卷,以便是我们能够更好的服务好
培训需求调研
感谢关注,下载原汁原味的英文文献