基础工具-Clustalx用法

admin 9 2025-02-03 编辑

下载地址:

http://www.clustal.org/

Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即先将多个序列两两比较构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树;然后从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在引导树上的位置,由近及远的逐步引入其它序列重新构建比对,直到所有序列都被加入形成最终的比对结果为止(Figure 1)。

Figure 1 clustal 算法

Clustal软件有两个版本,其中clustalw采用命令行的形式在DOS/Linux下运行的, Clustalx是可视化界面的程序,可在window电脑运行,我们今天学习Clustalx的使用。

1 安装clustalx

下载clustalx软件,按照默认安装到自己的电脑上。

2 准备要比对的序列

将上节课搜索到的同源核酸fasta文件,全部粘贴到一个文本文件中,所有的蛋白质序列存入另一个文本文件。

TIP:可以在fasta序列“>”之后加上物种名称,加空位,方便看树时了解进化关系。

3 载入序列

点击开始-程序-clustalX2-clustalX2。

点主菜单File,选择Load Sequence-选择刚保存的序列文件,点打开。

注意:ClustalX程序无法识别汉字、带空位的文件夹名,如my document。不要将序列文件保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。

载入序列后在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。(Figure 2)

TIP:如果每条序列单独保存为一个文件,可以使用File-Append sequence选项将序列一条条添加进来。

Figure 2 载入序列

4 比对参数的设置

比对前先要设置两条序列比对的参数和多条序列比对的参数。

a.两条序列比对的参数

点击Alilgnment菜单,选择Alignment Parameters,再选择Pairwise Alignment Parameters,如Figure 3,首先可以选择比对的效果,是slow/accurate 还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。

Figure 3 Pairwise Alignment Parameters

b.多条序列比对参数

点击Alilgnment菜单,选择Alignment Parameters,再选择Multiple Alignment Parameters,如Figure4.

Figure 4 Multiple Alignment Parameters

Delay divergent sequence是指当两条序列的差异大于某个值(百分比)时,这两条序列的比对将推迟进行,程序先比对相似序列,对于相似度不够高的序列,晚些时候进行比对,加入到最终的多条序列比对结果时也要迟些。DNA transition Weight等于0的时候,程序将转换当作错配(mismatch)看待,等于1的时候,将转换和匹配同等看待。当参与比对的序列差异较大时,DNA transition Weight应该选择的小些(接近0),如果参与比对的序列差异较小时,DNA transition Weight可选择的大些(接近1)。

5 设置输出格式

点击Alignment菜单,选择Output Format Options,页面如Figure 5。

默认的是输出clustal format,如果需要其它格式,可在复选框里打勾。如PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式(这里两种格式都选上,以备下节课构建系统发育树使用)。

Figure 5输出格式选项

6 进行比对

点击Alignment菜单,选择Do Complete Alignment.此时出现一个对话框,提示比对结果保存的位置,上一步选择了多少种输出格式,这里就需要给出多少个文件的路径。选择好了点OK即可。

要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结果进行分析,选择哪个是最合理的结果(result making biological sense)。

比对结束后生成的aln文件是多条序列比对的结果,可以用写字板打开浏览(Figure 6)。在某一列比对结果下方如果出现“*”,说明这列是完全匹配。生成的dnd文件是比对过程中利用NJ方法生成的树,可以用treeview程序浏览。

Figure 6生成的aln文件

7 迭代比对

可以采用迭代选项,多次迭代来寻找最佳比对结果。

点击Alignment菜单,选择iteration,选择iterate each alignment step或iterate final alignment.

然后再点击Aliglnment菜单,选择Do Complete Alignment进行比对,即可达到迭代的效果,将没有利用迭代比对得到的结果与迭代后的结果进行比较,看是否存在差异。

其它不详之处请参考clustalx.pdf文件。

8 Treeview

下载地址:http://taxonomy.zoology.gla.ac.uk/rod/treeview.html

Treeview是一个专门绘制和浏览进化树的软件。Clustalx产生的进化树(即后缀为dnd文件),可以通过treeview软件浏览。

双击treeview_setup.exe文件按照默认将程序安装到电脑上。

双击后缀为dnd的文件,选择treeview程序打开即可。也可以打开treeview软件,将dnd文件拖放到treeview软件窗口里打开。

欢迎关注

基础工具-Clustalx用法

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: Venn图绘制的两种方式
相关文章