背景
系统进化树(Phylogenetic tree)又称为演化树,是表明被认为具有共同祖先的各种物种间演化关系的树。是一种亲缘关系分支类方法。在树中,每个节点代表其各分支的最近的共同祖先,而各个节点间的线段长度对应演化距离。

系统进化树常用工具主要有以下几类:
1. MEGA:Masatoshi Nei和他的同事们开发和维护的分子进化遗传学分析包的网站。
2. Phylip:Joe Felsenstein在华盛顿大学创建和维护的一个软件包——系统推理软件包(Phylip)的网站。
3. Tree-Puzzle:该系统的网页使用最大似然法来模拟核苷酸和氨基酸序列以及其他两种状态数据。
4. PAML:伦敦大学的Ziheng Yang开发和维持的通过最大似然包计算的系统发生分析网站。
5. DAMBE:加拿大渥太华大学Xuehua Xia开发的软件包——数据分析、分子生物和进化学网站。
6. iTOL:由欧洲分子生物学实验室(EMBL)开发和维护的生命树的系统发生树的网站,用于展示和操纵生命互作树。
这里,我们重点研究MEGA 7[1]对氨基酸序列进行多重比较并构建系统发育树。
1.准备序列文件
这里我们去NCBI的Protein子库里面搜索蛋白质
Hemoglobin
选取两个物种的氨基酸序列并进行下载(Fasta格式)
图一:NCBI Protein数据库中血红蛋白氨基酸序列
Send -File -Format:FASTA
2.打开MEGA软件构建蛋白质的序列比对
Align--Edit/Build Alignment---Create a new alignmentàProtein
图二:MEGA读取文件并进行序列比对
Edit---Insert Sequence From File
导出数据,得到mega格式的文件
Data--Export Alignment---MEGA Format
3.构建系统发生树
(这里有很多种方法最大似然树、近邻树、最小进化树、UPGMA树……我们选择最大似然树)
Phylogeny
图三:使用MEGA软件构建系统发生树
文献里的进化树是如何绘制的呢?
图四:文献中的系统发生树[2]
进化树的展示方式:Circle
图五:系统发生树的圆圈展示方式
Tree Option:
图六:为系统树增加图标
备注:
构建系统进化树的一般原则:可靠的的待分析数据;准确的多序列比对;合适的建树方法(一般采用两种及以上方法构建进化树,无显著区别可接受)
1.Kumar, S., G. Stecher, and K. Tamura, MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Mol Biol Evol, 2016. 33(7): p. 1870-4.
2.Dou, L., et al., Genome-wide analysis of the WRKY gene family in cotton. Mol Genet Genomics, 2014. 289(6): p. 1103-21.
如果看完文章之后还是一脸懵,不知道怎么去构建进化树。
可以参加我们的实操课(树构建、circos入门、在线工具使用)。
元旦期间1折哦。速速抢购吧。
先尝后买,24学时仅20元