第17章-基因组学与后基因组学-遗传学课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第17章-基因组学与后基因组学-遗传学课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 17 基因组 遗传学 课件
- 资源描述:
-
1、第第17章章 基因组学与后基因组学基因组学与后基因组学要点:要点:1 1)人人类基因组计划与遗传标记类基因组计划与遗传标记 2 2)基基因组测序与序列组装因组测序与序列组装 3 3)比比较基因组学和功能基因组学较基因组学和功能基因组学 History of the Human Genome Project1990 Official start of HGP with 3 billion$and a 15 year horizon.1999 Sanger Centre publishes chromosome 222001 Draft Genome published:Celera&Public
2、2003 Completion(almost)of Human GenomeCelera:Craig VenterIntl.Cons:Francis Collins 17.1 人类基因组计划与遗传标记人类基因组计划与遗传标记人类基因组计划人类基因组计划 美国美国RenatoRenato Dulbecco Dulbecco于于19861986年提出人类基因组计划年提出人类基因组计划(HGPHGP),旨在确定人类旨在确定人类DNADNA的总体结构,搞清其中各种基因的的总体结构,搞清其中各种基因的结构、功能和相互关系,从整体上认识遗传信息的组成及其结构、功能和相互关系,从整体上认识遗传信息的组成及其
3、调控方式,预防和早期诊断几千种遗传疾病的新方法,并为调控方式,预防和早期诊断几千种遗传疾病的新方法,并为最终揭开生命的奥秘奠定基础。最终揭开生命的奥秘奠定基础。19871987年美国国会批准年美国国会批准HGPHGP计划,并委托计划,并委托NIHNIH和和DOEDOE协调此计协调此计划实施。划实施。19901990年美国政府拨款年美国政府拨款1.621.62亿美元组织启动,从亿美元组织启动,从19911991年起平均每年拨款年起平均每年拨款2 2亿美元,计划用亿美元,计划用1515年时间测出人类基因年时间测出人类基因组全部核苷酸序列,花费组全部核苷酸序列,花费3030亿美元。美国国会认为,亿美
4、元。美国国会认为,HGPHGP计计划可与阿波罗登月计划媲美,但花费仅为登月计划的不到划可与阿波罗登月计划媲美,但花费仅为登月计划的不到1/31/3。HGPHGP计划提出后,美国科学基金会、农业部和一些私人机计划提出后,美国科学基金会、农业部和一些私人机构纷纷参与资助。随后英、法、德、意、丹麦也出巨资支持。构纷纷参与资助。随后英、法、德、意、丹麦也出巨资支持。不久,日本、前苏联、印度陆续成立相应机构,相互沟通和不久,日本、前苏联、印度陆续成立相应机构,相互沟通和协作。协作。形成有十多个国家正式参与国际协作组,包括二十多个国形成有十多个国家正式参与国际协作组,包括二十多个国家级实验室参与,从此家级
5、实验室参与,从此HGPHGP计划发展成为国际合作的巨大工计划发展成为国际合作的巨大工程。程。染色体分离染色体分离逐级克隆逐级克隆 YAC载体载体 BAC载体载体Cosmid载体载体Plasmid载体载体测序、组装测序、组装 绘制图谱绘制图谱HGPHGP计划实施总体进展计划实施总体进展19901990年以后,年以后,HGPHGP计划已完成和正在测序共计计划已完成和正在测序共计330Mb(3.3330Mb(3.3亿亿bpbp),约占人类约占人类基因组的基因组的11%11%;鉴定与人类疾病相关的基因;鉴定与人类疾病相关的基因200200个左右。个左右。模式生物中模式生物中已完成已完成古细菌、细菌、支
6、原体、酵母、线虫等近古细菌、细菌、支原体、酵母、线虫等近2525种生物的基因组全序列测定。种生物的基因组全序列测定。SeienceSeience在在19961996、19971997、19981998和和20002000年分别发表了酿酒酵母、大肠杆菌、线年分别发表了酿酒酵母、大肠杆菌、线虫虫(9700(9700万万bpbp,约约1909919099个基因个基因)和果蝇基因组全序列。和果蝇基因组全序列。19981998年完成全基因组年完成全基因组测序的还有梅毒、结核菌、斑疹伤寒菌、支原体等多种病原体,并发现一测序的还有梅毒、结核菌、斑疹伤寒菌、支原体等多种病原体,并发现一些蛋白质是这些病原体所特
7、有的,可用于药物和疫苗研制。些蛋白质是这些病原体所特有的,可用于药物和疫苗研制。由于许多私营公司参与竞争,使由于许多私营公司参与竞争,使HGPHGP计划加快进程,突出测定蛋白质编码计划加快进程,突出测定蛋白质编码序列为重点,加速进行基因功能的研究和开发。序列为重点,加速进行基因功能的研究和开发。19981998年美国年美国IGRIGR宣布将与宣布将与PE(PerkinPE(Perkin-Elmer)-Elmer)公司建立新公司,三年投资公司建立新公司,三年投资2 2亿美元,于亿美元,于20022002年完成年完成HGPHGP全序列测定。全序列测定。美国美国IncyteIncyte公司也宣布公司
8、也宣布2 2年内投资年内投资2 2亿美元,用亿美元,用SNPSNP绘制出人类绘制出人类1010万个基因万个基因的图谱,并宣称寻找人类基因的竞赛已经结束,当今研究重点应转向建立的图谱,并宣称寻找人类基因的竞赛已经结束,当今研究重点应转向建立疾病模型和基因的功能。这种情况下,国家资助的疾病模型和基因的功能。这种情况下,国家资助的HGPHGP负责人不得不也宣布负责人不得不也宣布20012001年完成大部分蛋白质编码区的测序,年完成大部分蛋白质编码区的测序,20032003年完成整个年完成整个HGPHGP测序。现将有测序。现将有关成果简要介绍。关成果简要介绍。国际上一批大型制药公司和化学公司大规模地向
9、基因组研究领域进军,标国际上一批大型制药公司和化学公司大规模地向基因组研究领域进军,标志着基因组研究可转化为巨大生产力。由于基因组研究与制药、生物技术、志着基因组研究可转化为巨大生产力。由于基因组研究与制药、生物技术、农业、食品、化学、环境、能源和计算机等部门密切相关,因此形成了一农业、食品、化学、环境、能源和计算机等部门密切相关,因此形成了一个新兴产业即生命科学工业。目前进入个新兴产业即生命科学工业。目前进入“后基因组后基因组”时代。时代。人类基因组含人类基因组含有有3-4万个基因,万个基因,其中其中80%进行可进行可变剪接改变蛋白变剪接改变蛋白质序列,因此,质序列,因此,其蛋白质组可能其蛋
10、白质组可能含有含有5-6万的成员。万的成员。人类基因组的构成人类基因组的构成Public effort-strategy:Celera-strategy:Sequencing StrategiesCeleras view of International ConsortiumInternational Consortiums view of Celera由长到短策略由长到短策略由短到长策略由短到长策略基因组基因组DNA大片段文库的构建大片段文库的构建 YAC(yeast artificial chromosome)酵母人工染色体)酵母人工染色体)含有三种必需成分:着丝粒、含有三种必需成分:着丝
11、粒、端粒和复制起点。是迄今容量端粒和复制起点。是迄今容量最大的克隆载体,插入片段平最大的克隆载体,插入片段平均长度为均长度为200-1000 Kbp,最大,最大的可以达到的可以达到2 Mbp。BAC(Bacterial artificial chromosome),用细菌的,用细菌的F质质粒及其调控基因构建了细菌染粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在色体克隆载体,其克隆能力在125150 Kbp左右。左右。以以BAC为基础的克隆载体形为基础的克隆载体形成嵌合体的频率较低,转化效成嵌合体的频率较低,转化效率高,而且以环状结构存在于率高,而且以环状结构存在于细菌体内,易于分辨和分离
12、纯细菌体内,易于分辨和分离纯化,已被科学界广泛接受。化,已被科学界广泛接受。100-150 Kbp insertionBACBAC的构建。的构建。pBAC108L来自细菌的一个小型来自细菌的一个小型F质粒,其中质粒,其中oriS和和repE控制了质粒的复制起始,控制了质粒的复制起始,parB和和parA控制了拷贝数。控制了拷贝数。鸟枪法序列测定技术鸟枪法序列测定技术全基因组鸟枪法测序全基因组鸟枪法测序(shotgun sequencing)技术:随技术:随机挑选带有基因组机挑选带有基因组DNA的质粒进行末端的质粒进行末端序列测定,然后用计算序列测定,然后用计算机程序进行序列拼接机程序进行序列拼
13、接。鸟枪法测序的鸟枪法测序的主要缺主要缺点是点是,随着所测基因组,随着所测基因组总量增大,所需测序的总量增大,所需测序的片段大量增加;其次,片段大量增加;其次,高等真核生物(如人类)高等真核生物(如人类)基因组中有大量重复序基因组中有大量重复序列,导致判断失误。列,导致判断失误。鸟枪法测序技术不能鉴别高等真鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列。核生物基因组中的重复序列。改进后的鸟枪法改进后的鸟枪法(adopted by both IC and Celera)。基因组学基础基因组学基础_遗传标记遗传标记遗传图谱遗传图谱又称为连锁图(又称为连锁图(Linkage Map),是),是
14、指基因或指基因或DNA标记在染色体上的标记在染色体上的相对位置相对位置(或(或距距离离),通常以基因或),通常以基因或DNA片段在染色体交换过程片段在染色体交换过程中的分离频率(中的分离频率(cM)来表示。)来表示。cM值越大,两者值越大,两者之间遗传距离越远。之间遗传距离越远。物理图谱物理图谱是指以已知序列的是指以已知序列的DNA片段(序列标片段(序列标签位点,签位点,sequence-tagged site,STS)在染色)在染色体上的体上的实际位置实际位置,位点之间的距离(图距)以碱,位点之间的距离(图距)以碱基对(基对(bp,kb,Mb)作为测量单位的基因组图。)作为测量单位的基因组图
15、。遗传图VS物理图遗传图和物理图所表示遗传图和物理图所表示的基因(和分子标记位的基因(和分子标记位点)在序列上基本相同,点)在序列上基本相同,但在但在距离上是不相同的距离上是不相同的。遗遗传图确定的是基因或传图确定的是基因或DNA DNA 标记在染色体上的标记在染色体上的相对位置与遗传距离。相对位置与遗传距离。物理图是指以物理距离物理图是指以物理距离来表示其在来表示其在DNA DNA 分子上分子上的位置而构成的位的位置而构成的位置图置图。理想的分子遗传标记应具备的理想的分子遗传标记应具备的特点特点:遗传多态遗传多态性高性高;检测手段简单快捷,易于实现自检测手段简单快捷,易于实现自动化动化;遗传
16、共显性,即在分离群体中能够分辨等位基因的遗传共显性,即在分离群体中能够分辨等位基因的3 3种基种基因型因型;标记遍布整个基标记遍布整个基因组因组;准确性,能正确反映动物的真实遗传,即标记是与准确性,能正确反映动物的真实遗传,即标记是与经济性状基因,还是与影响重要性的性状基因经济性状基因,还是与影响重要性的性状基因连锁连锁;实验重复性好(便于数据交实验重复性好(便于数据交换)换);开发成本和使用成本尽量开发成本和使用成本尽量低廉低廉。DNA遗传标记遗传标记(DNA marker)DNA遗传标记代表遗传标记代表 第一代第一代DNA遗传标记遗传标记是是RFLP(Restriction Fragmen
17、t Length Polymorphism)。DNA序列上的微小变化,甚至序列上的微小变化,甚至1个核苷酸的变化,也能引起个核苷酸的变化,也能引起限制性内切酶切点限制性内切酶切点的丢失或的丢失或产生,导致酶切片段长度的变化。产生,导致酶切片段长度的变化。第二代第二代DNA遗传标记遗传标记SSLP(Simple Seqeuce Length Polymorphism)利用了存在于人类基因组中的大量利用了存在于人类基因组中的大量重复序重复序列列,包括重复单位长度在,包括重复单位长度在15-65个核苷酸左右的小卫星个核苷酸左右的小卫星DNA(minisatellite DNA),重复单位长度在),重
18、复单位长度在2-6个核苷个核苷酸之间的微卫酸之间的微卫星星DNA(microsatellite DNA)。第三代第三代DNA遗传标记遗传标记SNP(single nucleotide polymorphism),是同一物种不同个体基因组,是同一物种不同个体基因组DNA序列序列在同一位置上的在同一位置上的单个碱基单个碱基的差异。单核苷酸的多态性。的差异。单核苷酸的多态性。到目前为止已经在人类基因组发现了超过到目前为止已经在人类基因组发现了超过1000万个万个SNP位点,位点,平均每平均每300bp中就有一个中就有一个SNP!对对RFLP的检测主要的检测主要是用是用Southern杂交的杂交的方法
19、进行基本流程:方法进行基本流程:组织或细胞组织或细胞基因组基因组DNA限制性内切酶限制性内切酶消化消化琼脂糖凝胶电琼脂糖凝胶电泳泳印迹转移至滤膜印迹转移至滤膜预杂交预杂交加入探针加入探针杂交杂交洗膜洗膜放射放射自显影。自显影。RFLP markersSSLP markers人人VNTRs(可变数目串联重复位点可变数目串联重复位点)的系谱分析(引自的系谱分析(引自Hartl等,等,2001)人)人类系谱分析表明类系谱分析表明VNTR等位基因的分离。在系谱中出现等位基因的分离。在系谱中出现6个等位基因个等位基因(A1 A6),但是任何一个个体仅可能有一个等位基因),但是任何一个个体仅可能有一个等位
20、基因(纯合子纯合子)或两个或两个等位基因等位基因(杂合子杂合子)。一般将。一般将16-100bp重复称为重复称为小卫星小卫星,2-6bp称为称为微卫星微卫星,多态性来源于其组成和重复次数,符合孟德尔遗传规律,可分析作图。多态性来源于其组成和重复次数,符合孟德尔遗传规律,可分析作图。SNP marker平均每平均每300300600bp600bp存在存在一个一个SNPSNP。这些这些SNPSNP位点可能正是位点可能正是生物多样性(包括群体水生物多样性(包括群体水平与个体水平)的物质基平与个体水平)的物质基础,也是多基因复杂疾病础,也是多基因复杂疾病及个体间患病风险与药物及个体间患病风险与药物不同
21、反应的物质基础。不同反应的物质基础。但是具体而言,应该如但是具体而言,应该如何利用这些何利用这些SNPSNP信息呢?信息呢?HaplotypeHaplotype:又称又称“单体型单体型”,“单元型单元型”。一条同。一条同源染色体上的等位基因或遗传标记所构成的组合。源染色体上的等位基因或遗传标记所构成的组合。假设存在假设存在N N个个SNPSNP位点,则理论上单倍体应有位点,则理论上单倍体应有2 2N N个个SNPSNP基因型。基因型。但实际上,人们发现人类基因组中相邻近的SNP等位位点倾向于以一个整体整体遗传给后代,即大多数染色体区域只有少数几种SNP基因型。单体型:一个haplotypes由
22、临近的一系列SNP等位位点组成,图中显示从一个6000bp DNA片段上检定出的20个SNPs的排布类型,包括A中的3个位点(第二排箭头)。标签SNPs:只要检定分型20个SNPs中的3个,就足以确定这一段序列的单体型,例如,如果测出一个染色体的标签SNPs是A-T-C,则这一序列是单体型1。单体型的应用:根据染色体上相关连锁基因的组成,追踪遗传来源和传递路线。根据单倍型与疾病的连锁关系,分析基因样本,推测疾病的风险。根据单倍型的群体分布,研究种群的形成和隔离。由于重组热点等原因,基因组内的连锁不平衡的基因通由于重组热点等原因,基因组内的连锁不平衡的基因通常是像积木一样块状分布的,并且每个积木
23、内部的单倍型常是像积木一样块状分布的,并且每个积木内部的单倍型差异远低于理论值。差异远低于理论值。单倍型的块状结构提示我们将遗传疾病和这些单倍型关单倍型的块状结构提示我们将遗传疾病和这些单倍型关联起来更加容易。联起来更加容易。HapMap计划在一定程度上解决了连锁计划在一定程度上解决了连锁分析中的遗传标记数量和代表性的问题,对复杂疾病的遗分析中的遗传标记数量和代表性的问题,对复杂疾病的遗传分析和数量性状的遗传分析具有重要的意义。传分析和数量性状的遗传分析具有重要的意义。17.2 基因组测序与序列组装基因组测序与序列组装人类基因组计划的成功很大程度上得益人类基因组计划的成功很大程度上得益于有效减
24、少于有效减少DNA测序成本的技术更测序成本的技术更新。新。通通过改良测序方法,不断提升其自动化过改良测序方法,不断提升其自动化程度,程度,DNA测序的成本降低了测序的成本降低了100倍,从倍,从20世纪世纪70-80年代年代$10/bp降低到本世纪初降低到本世纪初$0.1/bp!Illumina/Solexa Genetic Analyzer2000 Mb/runApplied Biosystems ABI 3730XL1 Mb/day Roche/454 Genome Sequencer FLX100 Mb/runApplied BiosystemsSOLiD3000 Mb/run测序技术测
25、序技术Sanger sequencing(双脱氧核苷酸链终止法双脱氧核苷酸链终止法)13maybe 800 bp long42Sanger方法的特点为方法的特点为读序能力较强读序能力较强,每次反应约可得到,每次反应约可得到1,000个核苷酸序列,因此可提供较多的个核苷酸序列,因此可提供较多的DNA讯息;但相对讯息;但相对的,其的,其缺点缺点为操作较复杂,以及不易于一定时间内分析大为操作较复杂,以及不易于一定时间内分析大量检体。量检体。虽然在很多情况中,我们对虽然在很多情况中,我们对DNA序列分析的要求是读序序列分析的要求是读序越长越好,但在相当多的越长越好,但在相当多的分子诊断分子诊断工作中,
展开阅读全文