LECTURE-5-种下数据分析方法资料课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《LECTURE-5-种下数据分析方法资料课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- LECTURE 数据 分析 方法 资料 课件
- 资源描述:
-
1、种下数据分析方法种下数据分析方法Data Analysis at Intraspecies Level黄原2010-3主要内容主要内容1. 大进化与小进化的联系与区别大进化与小进化的联系与区别2. 用于种下研究的分子标记和数据类型用于种下研究的分子标记和数据类型3. 种下遗传多样性和分化参数及应用种下遗传多样性和分化参数及应用4. 种下系统发育分析及应用种下系统发育分析及应用5. 种界确定种界确定1. 大进化与小进化的联系大进化与小进化的联系与区别与区别进化模式不同进化模式不同大进化大进化=种上分类单元进化:树状分歧进化为主。种上分类单元进化:树状分歧进化为主。 种间由于生殖隔离和突变以及分歧
2、导致有完全不同种间由于生殖隔离和突变以及分歧导致有完全不同的基因型的固定,从而形成非重叠的基因库的基因型的固定,从而形成非重叠的基因库( non- overlapping gene pools)和相互的单系)和相互的单系性性 (reciprocally monophyletic lineages)。 小进化小进化=种下进化:网状形式的进化种下进化:网状形式的进化 种内群体内种内群体内/间的个体因随机交配有发生重组的机间的个体因随机交配有发生重组的机会,从而使个体的基因谱系呈现网状关系会,从而使个体的基因谱系呈现网状关系( reticulating relationships =tokogeny
3、)。种间树状进化种间树状进化遗传分歧遗传分歧种内网状进化种内网状进化遗传多态性遗传多态性研究内容的区别研究内容的区别种下研究种下研究 (1) 群体遗传结构(群体遗传结构(population genetic structure) (2) 群体分化(群体分化(population subdivision) (3) 谱系生物地理学(谱系生物地理学(phylogeography) (4) 分子进化动力分子进化动力(the forces of molecular evolution) (5) 个体个体/群体群体/亚种系统发育关系亚种系统发育关系(individuals/populations/subs
4、pecies phylogenetic analysis)种上研究种上研究 (1) 种界确定(种界确定(species boundary delimitation) (2) 分类单元单系性检验(分类单元单系性检验(testing taxa monophyly) (3) 系统发育关系重建(系统发育关系重建(phylogenetic relationship among taxa) (4) 性状进化(性状进化(character evolution)研究方法的区别研究方法的区别采用分子标记不同采用分子标记不同 抽样策略不同(抽样策略不同(Sampling strategy)数据分析方法不同数据分析
5、方法不同Molecules and their useful rangesin phylogenetic relationships Species Genera FamilyOrderClassDivisions Spacersitsmt DNANu rDNATaylor, et al., 1991; more sufficient statistically significant results; sufficient statistically significant results2. 用于种下研究的分子标记和用于种下研究的分子标记和数据类型数据类型分子标记分子标记SNPSSRRAP
6、DAFLP单核苷酸多态性单核苷酸多态性SNP:single nucleotide polymorphisms SNP是指由于单个核苷酸的变异所引起的是指由于单个核苷酸的变异所引起的DNA序列多态性。序列多态性。 A single base change, occurring in a population at a frequency of 1% is termed a single nucleotide polymorphism (SNP). When a single base change occurs at 1% it is considered to be a mutation. 微
7、卫星微卫星MicrosatellitesDesign primers to “flanking regions”微卫星基因分型原理微卫星基因分型原理 Li (1998). 随机扩增多态性随机扩增多态性DNA RAPD: randomly amplified polymorphic DNARAPD profile of DNA from 23 samples AFLP: amplified fragment length polymorphismDigestion of DNA with two enzymesLigation of adaptersPrimers complementary t
8、o adapters and to 3 region of some of the fragmentsAFLP Gel分子标记的性质分子标记的性质显示方式:显示方式: 共显性共显性(codominant)标记可以识别所有的等位基标记可以识别所有的等位基因,包括杂合子和隐性等位基因。因,包括杂合子和隐性等位基因。 显性显性(dominant)标记只能识别显性等位基因,无标记只能识别显性等位基因,无法区分杂合子和隐性等位基因的纯合子法区分杂合子和隐性等位基因的纯合子 。座位数目:座位数目: 单座位单座位(single locus)标记可以识别等位基因。标记可以识别等位基因。 多座位多座位(mult
9、iple loci)标记一般无法识别等位基因。标记一般无法识别等位基因。遗传方式遗传方式父系遗传标记父系遗传标记Y ChromosomeHaploid, none or little recombination1.91095.410 9 per site per year 母系遗传标记母系遗传标记Mitochondrial DNAHaploid, none or little recombination3.5108 per site per year 双亲遗传标记双亲遗传标记nDNADiploid, undergoes recombination基因型与基因分型基因型与基因分型(genotyp
10、e and genotyping)一个个体在某一座位上所拥有的一对等位基因类一个个体在某一座位上所拥有的一对等位基因类型被称作基因型型被称作基因型( genotype ) 。检定个体在特定座位上的基因型的方法被称作基检定个体在特定座位上的基因型的方法被称作基因分型因分型( genotyping) 。 单倍型与单倍型分型单倍型与单倍型分型haplotype and haplotyping单倍型是指在一条单倍型是指在一条DNA上多态性的分上多态性的分子标记的不同等位基因之间的组合。子标记的不同等位基因之间的组合。单倍型分型:单倍型分型:单倍型分型方法单倍型分型方法对于位于对于位于Y染色体或染色体或
11、mtDNA以及男性以及男性X染色染色体上的任何标记,每种基因型均为单倍型。体上的任何标记,每种基因型均为单倍型。对于位于常染色体及女性对于位于常染色体及女性X染色体上的标记,染色体上的标记,如果研究的座位为纯合子,则可以直接得到如果研究的座位为纯合子,则可以直接得到单倍型;如果研究的座位为杂合子,则得到单倍型;如果研究的座位为杂合子,则得到2个联合的单倍型。可以通过个联合的单倍型。可以通过3种方法获得单倍种方法获得单倍型。型。二倍体标记的单倍型分型方法二倍体标记的单倍型分型方法从二倍体的基因型推导单倍型的方法:从二倍体的基因型推导单倍型的方法:等位基因分离法:等位基因分离法: 等位基因特异性等
12、位基因特异性PCR;克隆法;体细胞杂;克隆法;体细胞杂交法。交法。统计推论法:统计推论法: Clarck算法;最大似然法;贝叶斯法。算法;最大似然法;贝叶斯法。家系分析法:家系分析法:单倍型块单倍型块Haplotype Blocks染色体在一代代的传递中同源片段发生重组染色体在一代代的传递中同源片段发生重组,多代之后祖先染色体片段的原有排布已被打多代之后祖先染色体片段的原有排布已被打乱。那些没有被重组打破的区域相互间被重乱。那些没有被重组打破的区域相互间被重组区域隔开组区域隔开,这些区域就是单倍型块。这些区域就是单倍型块。 单倍型单倍型块的长度一般为块的长度一般为3 92 kb 。 人类基因组
13、的人类基因组的65% -85% 是以单倍型块方式是以单倍型块方式组织起来的组织起来的. 识别单倍型的意义识别单倍型的意义构建基因树的基础构建基因树的基础识别致病基因识别致病基因理解重组和理解重组和LD模式模式单倍型的起源与进化单倍型的起源与进化位于位于Y染色体和染色体和mtDNA上的单倍体分子标记无重组,上的单倍体分子标记无重组,因而单倍型多样性仅仅是由于突变产生。因而单倍型多样性仅仅是由于突变产生。二倍体分子标记的单倍型的起源有突变和重组二种二倍体分子标记的单倍型的起源有突变和重组二种原因。如果重组是随机发生的,则原因。如果重组是随机发生的,则n个等位基因可个等位基因可以有以有2n种单倍型。
14、种单倍型。任何任何2个标记之间发生重组的可能性取决于它们的个标记之间发生重组的可能性取决于它们的相互距离和位置。不同座位的等位基因之间由于重相互距离和位置。不同座位的等位基因之间由于重组降低而导致的组降低而导致的association称为连锁不平衡称为连锁不平衡(linkage disequilibrium,LD)。)。3. 种下遗传多样性和分化参种下遗传多样性和分化参数及应用数及应用物种遗传变异程度的度量物种遗传变异程度的度量 测量遗传变异参数的方法随所研究标记的类型和测量遗传变异参数的方法随所研究标记的类型和遗传方式而异。一般地,物种的遗传变异可以从遗传方式而异。一般地,物种的遗传变异可以
15、从三个方面来描述:三个方面来描述:遗传多样性:遗传变异的量遗传多样性:遗传变异的量遗传分化:遗传变异在群体之间的分布遗传分化:遗传变异在群体之间的分布遗传距离:遗传变异在成对群体之间的数量。遗传距离:遗传变异在成对群体之间的数量。遗传多样性遗传多样性 遗传多样性通常用于描述生物学实体(个体,遗传多样性通常用于描述生物学实体(个体,群体和物种)内存在的遗传变异。杂合度和群体和物种)内存在的遗传变异。杂合度和多态性水平是多态性水平是2个在个体、群体和物种个在个体、群体和物种3个水个水平上定量描述多样性的参数。平上定量描述多样性的参数。 广义的多样性包括广义的多样性包括2个组分:丰富度个组分:丰富度
16、(richness)和均匀度()和均匀度(evenness)。前)。前者测量变异的数量,后者指示变异的分布。者测量变异的数量,后者指示变异的分布。 等位基因丰富度的测量等位基因丰富度的测量1 等位基因多样性(等位基因多样性(allelic diversity)或丰富度()或丰富度(allelic richness):每个座位上):每个座位上出现的等位基因数量的平均值。计算时也包括单态座位。可以以群体或物种为出现的等位基因数量的平均值。计算时也包括单态座位。可以以群体或物种为单位计算。单位计算。 2 多态座位百分数多态座位百分数 :当一个座位上最常见的等位基因的频率:当一个座位上最常见的等位基因
17、的频率0.95时该座位称多态时该座位称多态座位。多态座位的定义是人为的,在当代文献中,只要表现出任何水平的变异座位。多态座位的定义是人为的,在当代文献中,只要表现出任何水平的变异就认为是多态座位,而并不特别强调就认为是多态座位,而并不特别强调0.95或或0.99的标准。的标准。 3 多态座位的平均等位基因数(多态座位的平均等位基因数(mean number of alleles per polymorphic locus):计算方法同上但不包括单态座位。):计算方法同上但不包括单态座位。 4 平均观测杂合度(平均观测杂合度(mean observed heterozygosity,Ho):在所
18、观测的座位上):在所观测的座位上杂合子的数量占所有检测座位的比例。该参数广泛用于二倍体生物的共显性标杂合子的数量占所有检测座位的比例。该参数广泛用于二倍体生物的共显性标记中,显然,单倍体生物是无杂合性可言的。当用于多倍体生物时对数据的解记中,显然,单倍体生物是无杂合性可言的。当用于多倍体生物时对数据的解释须十分谨慎。该参数对显性标记不适合,因为无法识别出杂合性的个体。释须十分谨慎。该参数对显性标记不适合,因为无法识别出杂合性的个体。5 平均期望杂合度平均期望杂合度(Expected heterozygosity He),是根据哈温定律所估算的期望,是根据哈温定律所估算的期望值:值:He=1/m
19、Pij(1-Pij)M:基因座总数:基因座总数N:各基因位上的等位基因数:各基因位上的等位基因数Pij:第:第i个基因座的第个基因座的第j个等位基因的频率。个等位基因的频率。 Neis基因多样性参数(基因多样性参数(gene diversity statistics)基因多样性首先由Nei(1973)提出,通常被看作是期望杂合度(expected heterozygosity)。 Nei(1973)提出的基因多样性的计算:HT为总的期望杂合度,p为k个等位基因中的第i个在所有群体中的平均频率。基因多样性被广泛使用,但该参数也存在缺陷。如其值在0-1之间变化,随着一个座位上的等位基因频率接近相等
20、时,它变得不灵敏,此外,该参数严重依赖于2个最常见等位基因的频率。 211i kTiiHp 单倍体基因组的考虑单倍体基因组的考虑 单倍体基因组的标记在计算基因多样性参数时也用同样的方法,如计数单倍型的数目。对于单倍体标记独特的参数是计算单倍型多样性(haplotype diversity)。 群体遗传分化的度量群体遗传分化的度量1 Neis GST 2 Wrights F-statisticsNeis GST总遗传多样性(HT)是以期望的总杂合度来度量的。HT可以分解成存在于群体内部的基因多样性部分HS和存在于群体间的基因多样性的部分DST(Nei, 1973)。即 HTHSDST HS为每一
21、群体内的期望杂合度的平均值,即 其中p为每个群体中第k个座位上的第i个等位基因的平均频率(在所有群体中的均值)。多样性指数HT、HS、DST可以用于计算遗传分化参数GST,GST定义为群体之间相对于群体混合后(即总群体)的基因多样性,Nei(1973)称为基因分化系数(coefficient of gene differentiation): GSTDST/ HT GST值在01之间变化,当HTHS时 GST0,表示等位基因频率在所有群体中相同,群体之间没有遗传分化;当HS0时 GST1,亦即群体内部无变异,而每个群体都固定了不同的等位基因,因而群体达到了最大的分化,所有检测的变异都分布在不同
22、的群体中。在动物中,活动哪里强的鸟类的GST值是脊椎动物中最低的;同样能够飞行的昆虫是无脊椎动物中最低的。 211i kSiHp Wrights F-statistics多样性指数HT、HS也可以用于计算每个个体的平均观测杂合度HI,也可以用于F-统计值来分析群体的遗传结构。Wright描述的HT和HS分别是在假定处于哈代-温伯格平衡时的全部群体的总的期望杂合度和群体内的平均期望杂合度,因而Wright和Nei对HT和HS的定义是不同的,尽管他们二人所使用的符号和计算公式相同。Wright基于在个体、群体和总群体(total population)3个水平上的变异情况提出3种分析方法。 Wri
23、ghts F-statisticsWrights F-statisticsWrights F-statisticsWrights F-statistics遗传距离的计算遗传距离的计算Neis遗传距离遗传距离Chord distanceJaccard相似系数相似系数核苷酸多样度1. Average number of pairwise nucleotide differences between seqs.jiijnn2/ ) 1(12. Normalize to the length of the sequences (L)L核苷酸多样度 nucleotide diversity1. ACAG
24、CATTAGCA2. ATAGCAATAGCT3. ATAGCAATACCT(1/3)*(3+1+4) = 8/3(8/3)/12 = 0.222A pair of sequences are on average 22.2% differentExample:# of pairs# of differences between sequences遗传数据的分析方法遗传数据的分析方法多元分析方法多元分析方法 Multidimensional Scaling,MS Principal Components Analysis,PCA谱系生物地理学(谱系生物地理学(phylogeography)分析
25、)分析 Genetic boundary analysis Spatial autocorrelation Nested cladistic analysis系统发育分析方法系统发育分析方法遗传多样性的应用遗传多样性的应用遗传变异参数可以应用于估计基因流、遗传遗传变异参数可以应用于估计基因流、遗传结构、分类学、识别遗传瓶颈、群体演化历结构、分类学、识别遗传瓶颈、群体演化历史、群体大小历史过程及保育生物学等方面。史、群体大小历史过程及保育生物学等方面。哈迪哈迪-温伯格平衡是遗传变异应用的基础,已温伯格平衡是遗传变异应用的基础,已经发展了多种成熟的方法了分析偏离哈代经发展了多种成熟的方法了分析偏离
展开阅读全文