下载地址:
http://www.clustal.org/
Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即先将多个序列两两比较构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树;然后从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在引导树上的位置,由近及远的逐步引入其它序列重新构建比对,直到所有序列都被加入形成最终的比对结果为止(Figure 1)。
![基础工具-Clustalx用法](https://www.yanyin.tech/cms/manage/file/bab643e72fbd4d2faf0f1e96abf940cf)
Figure 1 clustal 算法
Clustal软件有两个版本,其中clustalw采用命令行的形式在DOS/Linux下运行的, Clustalx是可视化界面的程序,可在window电脑运行,我们今天学习Clustalx的使用。
1 安装clustalx
下载clustalx软件,按照默认安装到自己的电脑上。
2 准备要比对的序列
将上节课搜索到的同源核酸fasta文件,全部粘贴到一个文本文件中,所有的蛋白质序列存入另一个文本文件。
TIP:可以在fasta序列“>”之后加上物种名称,加空位,方便看树时了解进化关系。
3 载入序列
点击开始-程序-clustalX2-clustalX2。
点主菜单File,选择Load Sequence-选择刚保存的序列文件,点打开。
注意:ClustalX程序无法识别汉字、带空位的文件夹名,如my document。不要将序列文件保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。
载入序列后在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。(Figure 2)
TIP:如果每条序列单独保存为一个文件,可以使用File-Append sequence选项将序列一条条添加进来。
Figure 2 载入序列
4 比对参数的设置
比对前先要设置两条序列比对的参数和多条序列比对的参数。
a.两条序列比对的参数
点击Alilgnment菜单,选择Alignment Parameters,再选择Pairwise Alignment Parameters,如Figure 3,首先可以选择比对的效果,是slow/accurate 还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。
Figure 3 Pairwise Alignment Parameters
b.多条序列比对参数
点击Alilgnment菜单,选择Alignment Parameters,再选择Multiple Alignment Parameters,如Figure4.
Figure 4 Multiple Alignment Parameters
Delay divergent sequence是指当两条序列的差异大于某个值(百分比)时,这两条序列的比对将推迟进行,程序先比对相似序列,对于相似度不够高的序列,晚些时候进行比对,加入到最终的多条序列比对结果时也要迟些。DNA transition Weight等于0的时候,程序将转换当作错配(mismatch)看待,等于1的时候,将转换和匹配同等看待。当参与比对的序列差异较大时,DNA transition Weight应该选择的小些(接近0),如果参与比对的序列差异较小时,DNA transition Weight可选择的大些(接近1)。
5 设置输出格式
点击Alignment菜单,选择Output Format Options,页面如Figure 5。
默认的是输出clustal format,如果需要其它格式,可在复选框里打勾。如PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式(这里两种格式都选上,以备下节课构建系统发育树使用)。
Figure 5输出格式选项
6 进行比对
点击Alignment菜单,选择Do Complete Alignment.此时出现一个对话框,提示比对结果保存的位置,上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。选择好了点OK即可。
要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结果进行分析,选择哪个是最合理的结果(result making biological sense)。
比对结束后生成的aln文件是多条序列比对的结果,可以用写字板打开浏览(Figure 6)。在某一列比对结果下方如果出现“*”,说明这列是完全匹配。生成的dnd文件是比对过程中利用NJ方法生成的树,可以用treeview程序浏览。
Figure 6生成的aln文件
7 迭代比对
可以采用迭代选项,多次迭代来寻找最佳比对结果。
点击Alignment菜单,选择iteration,选择iterate each alignment step或iterate final alignment.
然后再点击Aliglnment菜单,选择Do Complete Alignment进行比对,即可达到迭代的效果,将没有利用迭代比对得到的结果与迭代后的结果进行比较,看是否存在差异。
其它不详之处请参考clustalx.pdf文件。
8 Treeview
下载地址:http://taxonomy.zoology.gla.ac.uk/rod/treeview.html
Treeview是一个专门绘制和浏览进化树的软件。Clustalx产生的进化树(即后缀为dnd文件),可以通过treeview软件浏览。
双击treeview_setup.exe文件按照默认将程序安装到电脑上。
双击后缀为dnd的文件,选择treeview程序打开即可。也可以打开treeview软件,将dnd文件拖放到treeview软件窗口里打开。
欢迎关注