基因和基因组ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《基因和基因组ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 基因组 ppt 课件
- 资源描述:
-
1、 第三章第三章 基因和基因组基因和基因组1基因?基因?2 顺反子通过顺反试验确定,如两个位点可以互补,则不属于一个顺反子;如两个位点不可以互补,则属于同一个顺反子。 上图为突变发生在相同基因无互补,下图为突变发生在不同基因,图中蓝条表示基因,红点表示突变位点。 3中心法则中心法则修改后的修改后的中心法则中心法则41961年Jacob和Monod提出操纵子学说操纵子学说,和结构基因、调节基因、操纵基因等概念。 结构基因结构基因(Structure gene)是指为蛋白质或RNA编码的基因,结构基因的突变可导致蛋白质或RNA一级结构的改变。结构基因的5-端非编码区(5-untranslated r
2、egion, 5-UTR)包括RNA聚合酶的识别和结合位点,被称作启动子(Promoter),结构基因的3-非编码区(3-UTR)包括促使转录终止的终止子(terminator)序列,和真核生物的加尾信号等。调节基因调节基因(regulator gene)的功能是产生调控蛋白质,调控结构基因的表达。操纵基因操纵基因(operator gene)的功能是与调控蛋白质结合,控制结构基因的表达。调节基因和操纵基因的突变会影响一个或多个基因的表达活性。55 5、AGCCGACTATGTCGAAGCTTAGCCGACTATGTCGAAGCTT、GCTTGACTATAAGACAGCTTGACTATAAGA
3、CA、3 33 3、TCGGCTGATACAGCTTCTAATCGGCTGATACAGCTTCTAA、CGAACTGATATTCTGTCGAACTGATATTCTGT、5 5转录调控区转录调控区 贮存贮存RNARNA或蛋白质结构信息区或蛋白质结构信息区 转录终止区转录终止区63.1基因(gene)的概念 狭义:基因是核酸中贮存遗传信息的遗传单位,是编码多肽链或RNA所必需的全部核苷酸序列,以及为保证转录所必需的调控序列,和编码区上游5-端和下游3 -端的非编码序列。 广义:DNA或RNA分子中有特定遗传功能的一段序列。 从生化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序可以产生或影响某
4、种表型,可以由于突变生成等位基因变异体。 从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单位或1个突变单位。 73.23.2基因的类型基因的类型3.2.1 3.2.1 基因家族和基因簇基因家族和基因簇 基因家族基因家族(gene family)是真核生物基因组中来源相同、结构相似、功能相关的一组基因。基因家族各成员序列上具有相关性,但相似的程度以及组织方式不同。基因家族可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生。8按照基因家族的成员在染色体上的分布,可以将基因家族分成两类。串联重复基因串联重复基因(tandemly repeated
5、 genes),成簇的基因家族(clustered gene family),或基因簇基因簇(gene cluster),是基因家族的各成员紧密成簇排列而成的串联重复单位,定位于染色体的特殊区域。在染色体上的分布相对集中。 分散的基因家族分散的基因家族(interspersed gene family),其家族成员在DNA上无明显的物理联系,甚至分散在多条染色体上,各成员在序列上有明显的差别。9按照家族中各成员的序列相似程度分为:简单得多基因家族:序列高度同源,同一转录单元重复排列成基因簇 如rRNA基因复杂的多基因家族:几个功能相关基因,串联重复排列,不同转录单元,如组蛋白基因家族受发育调控
6、的多基因家族:复杂多基因家族,在染色体上排列顺序与其发育过程中的表达顺序相关。10基因超家族(gene superfamily)基因超家族是指一组由多基因家族及单基因家族组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。113.2.1.1 简单的多基因家族简单的多基因家族 家族中各基因的全序列或至少编码序列具有高度的同源性,如rRNA基因家族。真核生物的rRNA基因串联重复排列在一段很长的DNA区域内。重复单位内rRNA基因转录区
7、的序列几近相同,而非转录的间隔序列则有所不同。在低等真核生物如酵母的rRNA基因家族中,28S, 18S, 5.8S和5S rRNA基因构成一个转录单元,而高等真核生物的5S rRNA基因则单独作为一个基因家族排列在其它部位。每个转录单元重复排列成基因簇,基因之间由可转录的间隔区(TS)分开,各转录单元之间由不可转录的间隔区(NTS)分开(图3-1)。 123.2.1.2 3.2.1.2 复杂的多基因家族复杂的多基因家族 复杂的多基因家族由几个相关基因构成独立的转录单元,家族间由间隔序列分开。例如,组蛋白基因的5个成员(H1, H2A, H2B, H3, H4)就属于这一类型。人类组蛋白基因分
8、布在第7号染色体,拷贝数为3040个。 133.2.1.3 3.2.1.3 受发育调控的复杂多基因家族:受发育调控的复杂多基因家族:人类珠蛋白基因家族基因排列的次序与它们在个体发育阶段基因表达的先后次序一致。在家族中, (Xi)基因在胚胎早期(前8周)表达,胎儿期(8周后)关闭,2和1在胎儿(8周后)和成人期都表达。在家族中,基因排在最前面,在胚胎早期(8周内)表达,之后关闭。G和A基因在胎儿期表达,出生前表达量逐渐衰减,而出生后并不完全关闭,仍然少量表达。基因在胚胎期和成年期都有少量表达。基因在胚胎期开始表达,表达量逐渐增加,是成人阶段表达的主要基因(表3-1)。1416号染色体11号染色体
9、153.2.1.4 超基因家族超基因家族 超家族基因超家族基因(gene superfamily)是指一组由多个基因家族组成的更大的基因家族。在高等真核细胞内,有些基因簇内含有数百个功能相关的基因,它们是由基因扩增后结构上的轻微变化而形成的,在结构上有着不同程序的同源性。这些基因或保持了原始基因的基本功能,或进化产生了某些新功能。目前已发现了很多的超基因家族,典型的例子有免疫球蛋白超基因家族、核受体超基因家族、细胞因子超基因家族等。 免疫球蛋白(immunoglobin, Ig)超基因家族包括2微球蛋白、MHC I类链、II类和链、T细胞受体(TCR)的 链和链、CD4和CD8等与免疫有关的大
10、分子。还有许多与免疫反应无关的蛋白质分子,如IgE受体亚基,神经黏附分子L-1,白细胞介素IL-1和IL-6的受体等。16 Superfamily is a set of genes all related by presumed descent from a common ancestor, but now showing considerable variation. Immunoglobulin type and function is determined by the heavy chain. J is a joining protein in IgM and IgA; all ot
11、her Ig types exist as tetramers.173.2.2 3.2.2 假基因(假基因(pseudogenepseudogene) ) 假基因常用符号表示,如1 表示与1 相似的假基因. 假基因与有功能的基因同源,原来也可以是有功能的基因,由于发生缺失(deletion)、例位(inversion)或点突变(point mutaion)等,成为无功能的基因,即形成了假基因,哺乳动物基因组中的1/4基因为假基因,可能为进化的痕迹。18 传统的基因概念把基因看作彼此独立的、非重叠的实体。但是,随着DNA测序技术的发展,在一些噬菌体和动物病毒中发现,不同基因的核苷酸序列有时是可以
12、共用的。也就是说,它们的核苷酸序列是彼此重叠的。这种具有独立性但部分序列彼此重叠的基因称重叠基因重叠基因(overlapping genes)或嵌套基嵌套基因因(nested genes)。 近年来的研究发现,重叠基因在真核生物中是广泛存在的。值得注意的是,高等真核生物中既存在大量的非编码序列,又普遍存在重叠基因,其生物学意义目前所知甚少,有待于进一步深入研究。 3.2.3 重叠基因重叠基因193.2.4 移动基因移动基因 移动基因移动基因(movable genes)又称转座因子转座因子(transposable elements)。由于它可以从染色体的一个位置转移到另一个位置,甚至在不同染
13、色体之间转移,因此也称跳跃基因跳跃基因(jumping genes)。 关于移动基因的详细介绍见第6章。 203.2.5 断裂基因断裂基因3.2.5.1 断裂基因的概念断裂基因的概念 过去人们一直认为,基因是连续不断地排列在一起一段DNA序列。但是对真核生物编码基因的研究发现,在编码序列中间插有非编码的DNA间隔区,这些间隔区称为内含子内含子(intron);而编码区则称为外外显子显子(exon)。含有内含子的基因称为不连续基因或断断裂基因裂基因(split genes)。21mRNA的前体是核内不均一RNA,实验证据P47(如何发现的,杂交、限制性酶切图谱)不连续基因是普遍现象(原核极为少见
14、,古细菌和噬菌体中发现了断裂基因)断裂基因共性:外显子排列顺序与产物相同,在不同组织中其内含子成分相同,内含子突变不影响蛋白产物22 断裂基因是Roberts和Sharp于1997年在研究腺病毒六邻体外壳蛋白质的mRNA时首先发现的,病毒DNA与它的mRNA进行分子杂交时,在电镜下观察到未与mRNA配对的DNA形成多个突环,称R环。R环的形成说明腺病毒外壳蛋白质的基因具有mRNA中不存在的序列,这些序列就是内含子。 图3-5中的(a)为电子显微镜照片,(b)为对电子显微镜照片进行解释的示意图,(c)为腺病毒六邻体外壳蛋白质基因结构的示意图。后来发现,鸡卵清蛋白质的基因与其mRNA杂交也会出现与
15、其内含子数对应的7个R环。 23 研究断裂基因的另一个方法是比较基因组DNA和cDNA的限制性核酸内切酶图谱。cDNA是由成熟的mRNA通过逆转录生成的,因而不含内含子。若用相同的限制性核酸内切酶水解基因组DNA和cDNA,在同样的条件下进行凝胶电泳,如果内含子中有限制性核酸内切酶的水解位点,基因组DNA的电泳图谱中就会有相应的条带,而cDNA电泳图谱中的相应条带则会缺失。 研究发现,断裂基因在表达时首先转录成初级转录产物,即前体mRNA,然后经过后加工,除去内含子序列的转录物,成为成熟的mRNA分子。这种删除内含子、连接外显子的过程,称为RNA拼接或剪接。 24Comparison of t
16、he restriction maps of cDNA and genomic DNA for mouse -globin shows that the gene has two introns that are not present in the cDNA. The exons can be aligned exactly between cDNA and gene. 通过比较cDNA与基因组DNA的限制性核酸内切酶图谱,也可以分析内含子的数量。25 The ovalbumin gene, shown here, has introns A to G and exons 1 to 7 an
17、d L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol II extends the primary transcript well beyond the cleavage and polyadenylation site (“extra RNA”) before terminating transcription. Terminati
18、on signals for Pol II have not yet been defined.Overview of the processing of a eukaryotic mRNA263.2.5.2 断裂基因的分子进化断裂基因的分子进化 在真核生物的进化过程中,断裂基因的比例在逐渐增加。低等真核生物酿酒酵母中的大多数基因是连续的。在高等真核生物中,开始出现长基因,蝇类和哺乳动物基因很少小于2kb,大多数长度在5100kb,含有几个到几十个内含子。但当基因的长度大到一定程度后,DNA的复杂性与生物的复杂性之间开始失去对应关系。例如,虽然属于同一个门,家蝇细胞的DNA总量却是果蝇的6倍。
19、在较高等的真核生物中,基因大小主要取决于内含子的长度,与外显子的大小和数目关系不大。动物细胞的内含子一般为80100kb,平均1127bp,有保守的分支点序列及多聚嘧啶区段。植物细胞的内含子较短,一般为802000bp,平均183bp。 27 DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外显子组成,相对应mRNA长度为2000bp,但是它的DNA序列却十分长,这是由于它的内含子非常长的缘故,在三种哺乳动物中,外显子基本保持一样,内含子的相对位置也不改变,但长度变化却非常大,这就导致了基因长度范围为2531kp。Mammalian genes for DHFR have the same
20、relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns.28 在基因的进化中,可能发生外显子的复制,结果在结构基因内出现了重复序列。在鸡的胶原蛋白质基因中,一个54bp的外显子多次重复,某些外显子累积突变,失去编码功能,就可能转化为内含子。 外显子作一种功能模块,可以组装到不同的基因内。因此,在基因进化中,经常发生着外显子在不同基因之间的复制、迁移和吸纳。例如,在多种脱氢酶的基因内,均有几乎相同的
21、与辅酶结合或脱氢酶催化区域功能有关的外显子结构。另一个典型的例子是人类低密度脂蛋白质(low density lipoprotein, LDL)受体与其他蛋白质之间的关系。LDL受体基因由18个外显子构成,中间的几个外显子也出现在生长因子前体的基因内,其N端的几个外显子也为血蛋白质互补因子C9编码。 29The LDL receptor gene consists of 18 exons, some of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the
22、 positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the EGF gene.LDL(低密度脂蛋白)受体基因的中心部分的一系列外显子和EGF(表皮生长因子)前体基因同源,在其N端的外显子序列和血蛋白补充因子C9的基因同源,这说明LDL基因中一系列不同功能的组份组合而具备了新的功能,而这些组份也存在于别的蛋白中。30 产生新基因的另一种方式是某些内含子插入到外显子内,使外显子变得更小,或将内含子切除,
23、使外显子变得更大。例如,珠蛋白超家族包括血红蛋白(hematoglobin)、肌红蛋白(myoglobin)和豆血红蛋白(leghemoglobin),以及其它血红素结合蛋白。血红蛋白分子是由2个-珠蛋白和2个-珠蛋白分子构成的四聚体。肌红蛋白为单体,结构类似于珠蛋白。豆血红蛋白类似于肌红蛋白,可能是珠蛋白相关基因的共同祖先。肌红蛋白和珠蛋白基因内第2外显子负责与血红素结合,而豆血红蛋白不同于珠蛋白和肌红蛋白,它的基因有3个内含子,其中第2内含子把血红素结合域的外显子又分隔成2个外显子。可能的进化途径是,豆血红蛋白丢失内含子,使珠蛋白或肌红蛋白的两个外显子融合成了一个。 31The rat i
24、nsulin gene with one intron evolved by losing an intron from an ancestor with two interruptions. 哺乳动物(除了啮齿类)和鸟类编码胰岛素的基因是由同一基因演化分离而来的。鸡的胰岛素基因有2个内含子,大鼠的其中一个基因与之有相同的结构。这个共同性说明胰岛素最初有2个内含子,而大鼠的另一个基因只含有1个内含子,说明它在演化过程中首先进行复制,然后从一个拷贝中精确地移去了一个内含子。32 原始的鱼类只有一种珠蛋白链,硬骨鱼和两栖类有连锁的基因和基因,说明在大约5亿年前, 硬骨鱼进化期间,珠蛋白祖先基因倍增
25、,并变异形成了基因和基因。哺乳类和鸟类是在约3.5亿年前同两栖类分开的,基因和基因的分开应在此之前,也许发生在2.7亿年前(图3-7)。随后,突变引起的趋异进化形成了基因簇和基因簇的各个成员。 和珠蛋白基因间置换位点的差别是3.7%,单位进化时间,即产生1%差异所需的百万年数为10.4,估算趋异的时间为10.43.7百万年,大约在4000万年前。和基因间置换位点的趋异度为9.6%,估算趋异的时间大约在1亿年前(图3-8)。 33Actin (肌动蛋白) genes vary widely in their organization. The sites of introns are indic
展开阅读全文