新一代建树工具IQ-TREE之快问快答

admin 62 2024-12-23 编辑

日前,介绍了新一代最大似然法建树软件IQTREE。由于篇幅所限,有部分内容没有写全。今天我们结合网友的一些问题,以Q&A(questions & answers)的方式再补充介绍一下IQTREE

1. 能否再简要说一下IQTREE的主要特点?

快速、易上手、自动模型选择、超快自展,对于大数据尤为适合。且作者热情,有问题随时在google group上询问即可。

2. IQTREE自2014年11月正式发表以来被引用800余次,那么其在高级别刊物中被引情况如何?

虽然引用数明显小于RAXML(800次 VS 6000次),IQTREE已经成为高级别综合类和专业类期刊的常客。目前来看仍以细菌和古菌为主,不过趋势上,真核生物也开始越来越多。

   

3. IQTREE和其他同类软件相比准确性如何?

17年,来自华南农业大学的周筱帆老师同来自美国的合作者一道发表文章对IQTREE、raxml、phyml和fasttree这四个最大似然法构树软件进行了比较。

 

结果表明,For concatenation-based species tree inference, IQ-TREE consistently achieved the best-observed likelihoods for all data sets, and RAxML/ExaML was a close second.

更多细节请大家参看原文。

 

4. IQTREE有没有在线版?

请访问http://iqtree.cibiv.univie.ac.at/

 

5. 能否关闭向屏幕的输出?

-quiet

日志文件:.log

6. 如何估计IQTREE运行时间?

IQTREE可以帮你估算建树还需要花多久

 

注意,有的时候在Modelfinder选择的时候如果也会进行时间估算,其时间仅代表模型选择所估算的剩余时间。

7. IQTREE如何处理比对中的空缺(gap)?

同RAXML等软件一样,如果一列中有一个gap,则舍弃该列。

8. 怎样生成consensus tree?

iqtree -con -t alltrees

如果选择做ultrafast bootstrap的话,IQTREE会自动生成consensus tree

9. 可选的模型太多了,常用的替换模型是哪些,以节约模型选择的时间?

IQTREE提供了琳琅满目的核苷酸和氨基酸替代模型,特别是前者远超raxml和mega等软件。一般说来,如果不是特殊序列(比如线粒体基因、膜蛋白基因等),核苷酸模型大致为GTR,而氨基酸基本跑不出lg、jtt、dayhoff、wag。可以通过设置-mset model进行先至以节约模型搜索的时间。

10. 如果只想进行模型选择,不希望建树,如何操作?

-m TESTONLY

11. 能否在建树时对树的拓扑结构进行限制?

-g topology_constraint_file

12. –nt AUTO是如何自动选择最适合线程数的?

 

从单线程开始逐一递增,当efficiency小于50%的时候,停止增加,选择前一线程作为最最适合线程。如上图里的例子,最佳线程数为3。

13. 能否处理binary(0,1)或形态学数据?

可以,细节请看说明,这里举一个形态学比对的例子:

 

iqtree -s morphology.phy -st MORPH

14. IQTREE有哪些粉丝?

增长中,这里挑三个:

加拿大Dalhousie university教授Andrew Roger: 

 

著名的MESQUITE软件:

 

中国农业大学的李虎和彩万志老师也在文章中多次用到IQTREE构建昆虫进化树。

 

  

15. 在哪里可以找到详细使用说明?

官网:http://www.iqtree.org/

Documentation:http://www.iqtree.org/doc/

Beginner Tutorial:http://www.iqtree.org/doc/Tutorial

Command reference:http://www.iqtree.org/doc/Command-Reference

 

16. 最后有没有提醒大家注意的?

我想最重要的莫过于对于超快自展(ultrafast bootstrap approximation)所得到的support value的解读了,注意不要和传统的bootstrap(如MEGA、raxml以及phyml所使用的)搞混。

其一,假设一个IQTREE得到的树里的一个clade的ultrafast bootstrap value为95,则表示该clade正确的概率为95%。a probability of 95% that a clade is true

其二,作者推荐使用ultrafast bootstrap(UFboot)的同时,也是用SH-Alrt进行检测支持度(尤其是对于大数据集)。评价标准也不同于传统bootstrap:One would typically start to rely on the clade if its SH-aLRT >= 80% and UFboot >= 95%.

 

17. 勘误

在上周的新一代最大似然法建树软件IQTREE的推送中,LG和JTT应为氨基酸替代模型(原文误写作核苷酸)

更多精彩内容,欢迎关注

一个物种一个家

TCGA | 小工具 | 数据库 |组装| 注释 |   基因家族  |  Pvalue

基因预测  |bestorf |  sci | NAR | 在线工具 | 生存分析 | 热图

 生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos

 舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 |  进化 | 测序简史

新一代建树工具IQ-TREE之快问快答

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 公共数据+简单实验,20分离你并不遥远
相关文章