进化树构建的基本过程(下)

2020
12/25

+
分享
评论
医学数据库百科
A-
A+

最优模型选择。



昨天我们讲解了进化树构建的数据下载以及利用mega进行数据的比对:进化树构建的基本过程(上)。今天我们就来讲解一下如何利用利用mega构建简单的进化树。




PART3

最优模型选择


      点击Data中的Phylogenetic Analysis,然后返回主页面。


      

点击 MODELS 中的 Find Best DNA/Protein Models(ML)  ,软件会根据你的数据帮你计算寻找最适合的模型, 提高建树的精确度。

    

  参数默认即可


      运行界面如下,序列较多时,分析时间较长,闲的话可以去跑个PCR......


 

运行后结果如下。最重要的是 BIC BayesianInformation Criterion ),越低代表模型越好。 在这里就可以看到, BIC 分数最低的模型是 JTT+G ,但 软件不支持组合模型,所以我们选择单个模型中BIC分数最小的,此处为JTT。






PART4

建树

    

好,下面开始建树~


      点击Phylogeny构建进化树,有多种建树方法,适用情况自行摸索哈,此处选择NJ邻接法建树。



弹出设置窗口,没有什么要求时默认即可。

Test of Phylogeny(建树的检验方法),是用来检验建树的质量的。默认的检验方法是Bootstrp method (步长检验)。步长检验需要设定检验次数,通常为100的倍数,默认设置为500,通常1000次以上较为可靠,这里设置1000。

Model处选择上文计算好的JTT。

Gap/Missing Date Treatment,大多数建树方法会要求删除多序列比对中含有空位较多的列。但是根据遗传距离度量方法的不同,删除原则不同。如果是以序列间不同残基的个数来度量遗传距离的话,选择Complete deletion;如果其他方法例如NJ,可以选择Partial deletion,程度约50%。



噔噔噔~~进化树就出来啦!

首先出来的是Original Tree(原始树),是步长检验构建的 1000 株树中的一株,未经过多棵树合并,所以树枝的长短可以精确代表遗传距离,即进化的距离远近。



Bootstrap consensus tree(步长检验合并出来的树),只反映进化关系,树枝的长短与遗传距离无关。

节点处的数字表示,经步长检验有百分之几的树具有这根树枝,即,反应了该树枝的可信度。当前构建的这株系统发生树中,绝大多数节点处的数值都是≥70 的话,这株树整体上就是可信的。

如果觉得树太中规中矩,可对树的形状进行调整。



可以看出基因名字过长,是因为基因序列导出后,未对基因名做简化处理,大家可以将导出的fasta格式以文本文件打开,将多余字符删除,只保留想要信息即可;当然,忘了处理的,在序列导入MEGA后也可对基因名进行编辑,双击下图所示位置就可以啦!



View:可以更改枝的线条,字体样式等。

Image:输出图片。

Caption:单击后生成文献中该图的标题、备注说明,使用到的文献等,这个功能很好用,写文章会需要的。

最后记得将建树结果保存为.nwk格式,这个结果保存很重要哦,下次直接双击就可进入MEGA对其操作。



以上是对于进化树的简单构建,如果我们要做出好看的进化树的话,还是推荐使用TBtools或者如果有R语言基础的可以尝试ggtree。



本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
构建,序列,建树,模型,检验

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!