进化树构建的基本过程(上)

2020
12/25

+
分享
评论
医学数据库百科
A-
A+

今天我们就来简单介绍一下进化树构建的基本过程。这次我们以YTHDF家族和YTHDC家族作为例子来进行演示。



通过进化树,我们可以得到一些非常有价值的信息,比如说某几个物种在同一分支上,说明他们有着较近的亲缘关系,更有可能他们之间存在着祖先与进化的关系。比如最近来势汹汹的新冠肺炎,下图为从网上找的冠状病毒遗传进化分析,其中图中2019-nCoV即为本次新型冠状病毒。



今天我们就来简单介绍一下进化树构建的基本过程。这次我们以YTHDF家族和YTHDC家族作为例子来进行演示。




PART1

准备

1. 基因蛋白序列

打开NCBI gene数据库(https://www.ncbi.nlm.nih.gov/gene/),将所要查询的基因名称输进去即可,例如分析人YTH家族,将该家族的5个基因(YTHDF1/2/3、YTHDC1/2)依次输进基因栏。



选择对应物种,例如此处分析人,选择Homo sapiens,

选择要分析的序列,本文分析蛋白序列,点击NP链接,若要分析mRNA序列,点NM即可。



转进来后点击FASTA后即可看到该基因的蛋白序列,通过右上方send to发送至本地保存为fasta格式。


 

然后将5个基因蛋白序列合在一个fasta格式文件。具体合并就是把文件用文本打开,然后粘贴到一起就行。注意:所有序列的方向都要保持一致 ( 5’-3’)。序列工作就做好啦

另:Uniprot数据库(http://www.uniprot.org/)也可获取蛋白序列哦,步骤与此类似,自行探索即可


2.下载MEGA软件

      官网(https://www.megasoftware.net/)下载即可,有多种版本可供下载,由于本人电脑上为MEGA-X版本,下面就此版本介绍具体用法。





PART2

序列比对


做系统进化树之前要做多序列比对,将比对结果提交给MEGA建树。打开MEGA,点击File→Open A File/Session…→找到自己要比对的序列,打开


      弹出对话框,选Align



      然后5条要比对的序列就进来啦!



接下来我们进行序列比对,在Alignment里面有Alignment by ClustalW和Muscle两个选项。其中ClustalWClustalW是现在用的最广和最经典的多序列比对软件,基本原理是首先做序列的两两比对,根据该两两比对计算两两距离矩阵,然后用NJ或者UPGMA方法构建Binary进化树作为guide tree,最后用progressive的方法根据guide tree逐步添加序列进行比对,一直到所有序列都比对好。

Muscle 速度快,用于序列多的时候进行的比对。

      这里我们选择ClustalW:



弹出对话框选OK,之后弹出多序列比对参数设置窗口。由于MEGA的参数都是经过考量的,所以当看不懂时默认就好。运行后下面就是比对完的结果啦!

 


因为不同序列的碱基、长度不同,所以为了最大的寻找相似碱基而插入空位,其中-------表示序列内插入的空位。

可以将比对结果保存下来。



保存文件格式选择.meg


双击刚才建好的.meg文件,文件就直接导入MEGA啦,点击,会出现“Sequence Data Explorer”窗口,最上面一行是consensus sequence,也就是一列里出现次数最多的字母。

 


到这里基本比对就做完了,但是要怎么进行进化分析,下一篇文再继续介绍哦!


本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
MEGA,过程,基本,序列,基因,格式

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!