构建分子进化树课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《构建分子进化树课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 构建 分子 进化 课件
- 资源描述:
-
1、第五章第五章多序列对位排列和进化分析多序列对位排列和进化分析(I)生物信息学chicken PLVSS-PLRGEAGVLPFQQEEYEKVKRGIVEQCCHNTCSLYQLENYCNxenopus ALVSG-PQDNELDGMQLQPQEYQKMKRGIVEQCCHSTCSLFQLESYCNhuman LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCNmonkey PQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCNdog LQVRDVELAGAPGEGGLQPLALEGALQKRGIVE
2、QCCTSICSLYQLENYCNhamster PQVAQLELGGGPGADDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCNbovine PQVGALELAGGPGAGG-LEGPPQKRGIVEQCCASVCSLYQLENYCNguinea pig PQVEQTELGMGLGAGGLQPLALEMALQKRGIVDQCCTGTCTRHQLQSYCNBring the greatest number of similar characters into the same column of the alignmentMultiple Sequence Alignmen
3、t(MSA)多序列对位排列多序列对位排列Find out which parts“do the same thing”为什么要做为什么要做MSA?用于描述一组序列之间的相似性关系,以便了解一个基因家族用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找的基本特征,寻找motif,保守区域等。用于预测新序列的二,保守区域等。用于预测新序列的二级和三级结构,进而推测其生物学功能。级和三级结构,进而推测其生物学功能。用于描述同源序列之间的亲缘关系的远近,应用到分子进化用于描述同源序列之间的亲缘关系的远近,应用到分子进化分析中。是构建分子进化树的基础。分析中。是构建分子进化树的基础。
4、为什么要做为什么要做MSA?abcGene treeABCSpecies treeWe often assume that gene trees give us species trees为什么要做为什么要做MSA?Contig assembly怎么做怎么做MSA?动态规划算法(dynamic programming):MSA改进算法(heuristic algorithm):1.渐进法(progressive methods):Clustal,T-Coffee,MUSCLE 2.迭代法(iterative methods):PRRP,DIALIGN 3.其它算法:Partial Order
5、Algorithm、profile HMM、meta-methods(MAFFT)http:/www.ebi.ac.uk/Tools/msa/Current Opinion in Structural Biology 2006,16:368373u Clustal:目前目前应用最广泛的应用最广泛的 MSA 方法方法u 可可在线分析在线分析u 可可在本地计算机运行在本地计算机运行Clustal使用方法使用方法u 序列输入序列输入、输出、输出格式格式FASTANBRF/PIR EMBL/SWISSPROTALNGCG/MSFGCG9/RSFGDEALNNBRF/PIRGCG/MSFPHYLIPNE
6、XUSGDE/FASTAInputOutputsequence 1ATTGCAGTTCGCA sequence 2ATAGCACATCGCAsequence 3ATGCCACTCCGCChttp:/www.clustal.org/两两比对两两比对构建距离矩阵构建距离矩阵构建指导树构建指导树(guide tree)将距离最近的两条将距离最近的两条序列用动态规划的序列用动态规划的算法进行比对;算法进行比对;“渐进渐进”的加上其的加上其他的序列他的序列Clustal W/X算法基础算法基础u Clustal在线分析方法(在线分析方法(ClustalW)多序列对位排列结果多序列对位排列结果粘贴或上载序
7、列粘贴或上载序列EBI的的ClustalW分析网页分析网页 http:/www.ebi.ac.uk/Tools/msa/clustalw2/调整参数调整参数http:/www.ebi.ac.uk/Tools/msa/clustalw/help/AlignmentsResult Summary自带自带Help文件文件Using ClustalX for multiple sequence alignment by Jarno Tuimala 两种工作模式两种工作模式:Multiple Alignment Profile Alignmentu Clustal离线分析方法(离线分析方法(Clusta
8、lX)下载安装下载安装第一步:输入序列第一步:输入序列FileLoad sequences1、序列为多重、序列为多重fasta格式(可进行编格式(可进行编辑,保存为辑,保存为txt文件)文件)2、序列文件所在路径不能有空格和、序列文件所在路径不能有空格和中文字符(如放在系统桌面),否则中文字符(如放在系统桌面),否则ClustalX无法载入无法载入3、为便于识别、为便于识别每条序列,可在每条序列,可在后输入物种名后输入物种名称,并用空格和称,并用空格和其它描述内容分其它描述内容分开,如:开,如:Human gi|301129180|ref|NP_001180303.1|resistin Hom
9、o sapiens第二步:设定比对参数第二步:设定比对参数第三步:进行序列比对,得到结果第三步:进行序列比对,得到结果第四步:评价比对质量第四步:评价比对质量打开比对结果打开比对结果:1、可在、可在ClustalX中直接输出打印中直接输出打印2、可用写字板打开、可用写字板打开aln文件文件3、可将、可将aln文件以图形展示,更直观文件以图形展示,更直观更改参数、手动编辑,使之具有生物学意义更改参数、手动编辑,使之具有生物学意义u 可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰(1)Boxshade 突出相同或相似位点突出相同或相似位点(http:/www.ch.embnet.or
10、g/software/BOX_form.html)在在EBI ClustalW结果网页结果网页复制复制序列比对结果序列比对结果在在“Boxshade”网页网页粘贴序列,在粘贴序列,在“Input sequence format”栏目栏目选择选择“ALN”,在,在“Output format”栏目栏目选择选择“RTF_new”修饰过的排列结果修饰过的排列结果在结果网页点击在结果网页点击“here is your output number 1”u 可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰(2)ESPript 多种修饰多种修饰 功能功能,突出相同或相似位点,突出相同或相似位点在
11、在ESPript分析网页分析网页“Aligned Sequences”栏上载栏上载Alignments文文件件在在“Output layout”和和“Output file or device”栏选择栏选择修饰后的比对结果修饰后的比对结果http:/espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi在在EBI ClustalW结果网页结果网页下载下载“Alignments”(CLUSTALW format)GeneDochttp:/www.nrbsc.org/gfx/genedocFile Import 修饰排列结果修饰排列结果选择输入文件的选择输入文件的格
12、式(如格式(如ALN)u 可进一步可进一步对对排列好的序列进行修饰排列好的序列进行修饰(3)第五章第五章多序列对位排列和进化分析多序列对位排列和进化分析(II)生物信息学 2.系统发生分析(系统发生分析(Phylogenetic analysis)u 分析基因或蛋白质的进化关系分析基因或蛋白质的进化关系u 系统发生(进化)树(系统发生(进化)树(phylogenetic tree)A tree showing the evolutionary relationships among various biological species or other entities that are be
13、lieved to have a common ancestor.经典进化生物学:经典进化生物学:比较:比较:形态形态、生理结构生理结构、化石化石分子进化生物学:分子进化生物学:比较比较DNA和和蛋白质蛋白质序列序列研究系统发生的方法研究系统发生的方法Residues that are lined up in different sequences are considered to share a common ancestry(i.e.,they are derived from a common ancestral residue).An Alignment is an hypothes
14、is of positional homology between bases/Amino AcidsEasyonly with substitutionsDifficultalso with indels=(A,(B,C),(D,E)Newick format节点节点Node分支分支BranchABCDE末端节点末端节点 可以是物种可以是物种,群体,或,群体,或者蛋白质、者蛋白质、DNA、RNA分子等分子等OTU祖先节点祖先节点/树根树根Root系统发生树术语系统发生树术语内部节点内部节点/分歧点分歧点该分支可能的祖先该分支可能的祖先HTUA clade(进化支进化支)is a group
15、of organisms that includes an ancestor and all descendents of that ancestor.genetic changeno meaningPhylogramCladogramtimeTaxon ATaxon BTaxon CTaxon D111635Taxon ATaxon BTaxon CTaxon DTaxon ATaxon BTaxon CTaxon DUltrametric tree超度量树超度量树进化树进化树分支树分支树系统发生树术语系统发生树术语Rooted tree vs.Unrooted treetwo major
16、ways to root trees:A BCD102352d(A,D)=10+3+5=18Midpoint=18/2=9By midpoint or distance有有根根树树ACBD无无根根树树系统发生树术语系统发生树术语outgroup外群、外围支外群、外围支plantplantplantfungusanimalanimalanimalUnrooted treerootRooted treebacteriumanimalanimalanimalfungusplantplantplantMonophyletic groupMonophyleticgroupRooted tree vs.U
17、nrooted tree选择外群(Outgroup)选择一个或多个已知与分析序列关系较远的序列作为外类群外类群可以辅助定位树根外类群序列必须与进化树上其它序列同 源,但外类群序列与这些序列间的差异必须比这些序列之间的差异更显著。eukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaeabacteria outgroup外群外群How to root a tree?系统发育树构建步骤系统发育树构建步骤多序列比对(自动比对、手工校正)多序列比对(自动比对、手工校正)选择建树方法(选择建树方法(替代模型替代模型)建立进化树建立进化树进化树评估进
18、化树评估最大简约法最大简约法(maximum parsimony,MP)距离法距离法(distance)最大似然法最大似然法(maximum likelihood,ML)贝叶斯法贝叶斯法(Bayesian inference)统计分析统计分析BootstrapLikelihood Ratio Test UPGMA邻近法邻近法(Neighbor-joining,NJ)最小进化法最小进化法(minimum evolution)距离法距离法距离法又称距离矩阵法,首先通过各个序列之间的比较,根据一定的假设(进化根据一定的假设(进化距离模型)推导得出分类群之间的进化距距离模型)推导得出分类群之间的进化距
19、离,构建一个进化距离矩阵。离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。CatDogRatDog3Rat45Cow676CatDogRat11224Cow计算序计算序列的距列的距离,建离,建立距离立距离矩阵矩阵通过通过距离距离矩阵矩阵建进建进化树化树Step1.计算序列的距离,建立距离矩阵计算序列的距离,建立距离矩阵Uncorrected“p”distance(=observed percentsequence difference)Kimura 2-parameter distance(estimate of the true number of substitut
展开阅读全文