首页
快讯
关注
资讯
- 健康
- 科技
- 热点
- 视频
- 产业
- 政策
- 护理
- 投资
- 医改
- 养老
- 疫情
- 人物
- 医保
- 疾病
- 管理
- English
- 临床
- 心血管
- 肿瘤
- 内分泌
- 妇儿
- 感染
专题
活动
知识

首页
快讯
关注
资讯
- 健康
- 科技
- 热点
- 视频
- 产业
- 政策
- 护理
- 投资
- 医改
- 养老
- 海外
- 人物
- 保险
- 疾病
- 管理
- English
- 临床
- 心血管
专题
活动
智库
知识
- 北斗学苑
评选
会议
排行
全球医疗
健康界APP

欢迎登录体验更多功能

搜索

进化树构建的基本过程（上）

2020

12/25

医学数据库百科

A-

A+

今天我们就来简单介绍一下进化树构建的基本过程。这次我们以YTHDF家族和YTHDC家族作为例子来进行演示。

通过进化树，我们可以得到一些非常有价值的信息，比如说某几个物种在同一分支上，说明他们有着较近的亲缘关系，更有可能他们之间存在着祖先与进化的关系。比如最近来势汹汹的新冠肺炎，下图为从网上找的冠状病毒遗传进化分析，其中图中2019-nCoV即为本次新型冠状病毒。

今天我们就来简单介绍一下进化树构建的基本过程。这次我们以YTHDF家族和YTHDC家族作为例子来进行演示。

PART1

准备

1. 基因蛋白序列

打开NCBI gene数据库（https://www.ncbi.nlm.nih.gov/gene/），将所要查询的基因名称输进去即可，例如分析人YTH家族，将该家族的5个基因（YTHDF1/2/3、YTHDC1/2）依次输进基因栏。

选择对应物种，例如此处分析人，选择Homo sapiens，

选择要分析的序列，本文分析蛋白序列，点击NP链接，若要分析mRNA序列，点NM即可。

转进来后点击FASTA后即可看到该基因的蛋白序列，通过右上方send to发送至本地保存为fasta格式。

然后将5个基因蛋白序列合在一个fasta格式文件。具体合并就是把文件用文本打开，然后粘贴到一起就行。注意：所有序列的方向都要保持一致 ( 5’-3’)。序列工作就做好啦

另：Uniprot数据库（http://www.uniprot.org/）也可获取蛋白序列哦，步骤与此类似，自行探索即可

2.下载MEGA软件

官网（https://www.megasoftware.net/）下载即可，有多种版本可供下载，由于本人电脑上为MEGA-X版本，下面就此版本介绍具体用法。

PART2

序列比对

做系统进化树之前要做多序列比对，将比对结果提交给MEGA建树。打开MEGA，点击File→Open A File/Session…→找到自己要比对的序列，打开

弹出对话框，选Align

然后5条要比对的序列就进来啦！

接下来我们进行序列比对，在Alignment里面有Alignment by ClustalW和Muscle两个选项。其中ClustalWClustalW是现在用的最广和最经典的多序列比对软件，基本原理是首先做序列的两两比对,根据该两两比对计算两两距离矩阵,然后用NJ或者UPGMA方法构建Binary进化树作为guide tree,最后用progressive的方法根据guide tree逐步添加序列进行比对,一直到所有序列都比对好。

Muscle 速度快，用于序列多的时候进行的比对。

这里我们选择ClustalW：