第二章-生物信息学数据库资源课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第二章-生物信息学数据库资源课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 生物 信息学 数据库 资源 课件
- 资源描述:
-
1、12提纲提纲:n模式生物测序模式生物测序n3大核酸数据库大核酸数据库n蛋白质数据库蛋白质数据库3提纲提纲:n模式生物测序模式生物测序n3大核酸数据库大核酸数据库n蛋白质数据库蛋白质数据库4humanArabidopsisThermotoga maritimaEscherichia coliBuchnerasp.APSRickettsia prowazekiiUreaplasma urealyticumBacillus subtilisDrosophila melanogasterThermoplasma acidophilumPlasmodium falciparumHelicobacter
2、pylori mouseCaenorhabitis elegansratBorrelia burgorferiBorrelia burgorferiAquifex aeolicusNeisseria meningitidis Z2491Mycobacterium tuberculosis 5模式生物基因组计划模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥等共约酵母、线虫、果蝇、细菌、拟南芥等共约已完成,已完成,正在进行。目前总量已达正在进行。目前总量已达碱基对碱基对!6virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptile
3、sbirdsmammalsmammalsGenome sizes in nucleotide pairs(base-pairs)Genome sizes in nucleotide pairs(base-pairs)10410810510610710111010109bony fishamphibians7 不具有细胞形态结构,仅由核酸和蛋白质构成;不具有细胞形态结构,仅由核酸和蛋白质构成;如:人艾滋病毒如:人艾滋病毒HIVHIV、SARSSARS冠状病毒冠状病毒 体积小,体积小,1010300300nmnm;严格的专性细胞内寄生;严格的专性细胞内寄生;对抗生素不敏感。对抗生素不敏感。电电子子
4、显显微微镜镜下的下的SARS冠冠状状病毒病毒100nm8Escherichia coli大肠杆菌大肠杆菌是研究得最为详尽的一个模式生物。这种大肠杆菌是研究得最为详尽的一个模式生物。这种只有只有1.61.6微米长的、可以迅速繁殖的单细胞原核生物,微米长的、可以迅速繁殖的单细胞原核生物,已经成为实验室和基因工程的重要工具。已经成为实验室和基因工程的重要工具。Escherichia coli O157:H7Escherichia coli K129Saccharomyces cerevisiae酿酒酵母真菌界的单细胞真核生物,它的全基因组真菌界的单细胞真核生物,它的全基因组已在已在19961996年
5、测定。年测定。10秀丽线虫秀丽线虫Caenorhabditis elegans一种透明的、生活在海滩泥沙中的小虫。一种透明的、生活在海滩泥沙中的小虫。细胞数目一定:成虫细胞数目只有细胞数目一定:成虫细胞数目只有959959个,其中包括个,其中包括302302个神经元;个神经元;有有6 6条染色体,全基因组于条染色体,全基因组于19981998年测定,长年测定,长9.7Mb9.7Mb11Drosophila melanogaster果蝇果蝇繁殖很快、容易诱发变异的小昆虫。繁殖很快、容易诱发变异的小昆虫。总长达总长达1.81.8亿核苷酸。亿核苷酸。12Arabidopsis thaliana拟南芥
6、个体生活周期只有个体生活周期只有6 6周的十字花科周的十字花科小草,是一种理想的模式植物。小草,是一种理想的模式植物。13Oryza sativa水稻单子叶植物模式植物,单子叶植物模式植物,390-430MB390-430MB14 1个受精卵在个受精卵在24小时内分裂到各种器官初具雏形的程度;小时内分裂到各种器官初具雏形的程度;15 身体透明的小鱼,生活周期约身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育个月,是研究脊椎动物发育过程的良好对象。过程的良好对象。16 基因组大小与人类相近,约基因组大小与人类相近,约30亿个核苷酸对;亿个核苷酸对;171819提纲提纲:n模式生物测序模式生物
7、测序n3大核酸数据库大核酸数据库n蛋白质数据库蛋白质数据库20主要的数据库资源主要的数据库资源 核酸序列数据库核酸序列数据库主要有主要有GenBank,EMBL,DDBJ等等.蛋白质序列数据库蛋白质序列数据库主要有主要有SWISS-PROT,PIR,TrEMBL等,等,蛋白结构数据库蛋白结构数据库有有PDB,MMDB等,等,与基因组有关的数据库还有与基因组有关的数据库还有dbEST,OMIM等,等,213 3大核酸数据库大核酸数据库基因组数据库的相关背景基因组数据库的相关背景 主要的基因组数据库资源主要的基因组数据库资源 重点介绍重点介绍GenBankGenBank22ATTGACTAATTG
8、ACTAPrimary vs.Derivative DatabasesACGTGCACGTGCTTGACATTGACACGTGACGTGAATTGACTAATTGACTATATAGCCGTATAGCCGACGTGCACGTGCACGTGCACGTGCACGTGCACGTGCTTGACATTGACATTGACATTGACATTGACATTGACACGTGACGTGACGTGACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGT
9、ATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGTATAGCCGTATAGCCGTATAGCCGTATAGCCGATATGAGAC CATTATTGAGAGAGAATTATTATTATTC CC CGAGAGAGAATTATTC CC CGAGAGAGAATTATTATTATTC CC CGAGAGAGAATTATTC CC CSequencingCentersGAGAGAGAATTATTC CC CGAGAGAGAATTATTC CC CUniGeneRefSeqGenomeAssemblyLabsC
10、uratorsAlgorithmsTATAGCCGTATAGCCGAGCTCCGATAAGCTCCGATACCGATGACAACCGATGACAA23 DNADNA序列数据库最早于序列数据库最早于19821982年在欧洲分子生物学实年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代验室诞生,随即就开始了一个数据库爆炸的时代。此后不久因一项美国国家健康研究中心与洛斯阿此后不久因一项美国国家健康研究中心与洛斯阿拉莫斯国家实验室的合同而诞生了拉莫斯国家实验室的合同而诞生了GenBankGenBank。日本的日本的DNADNA数据库(数据库(DDBJDDBJ),在几年后加入了数据),在几年
11、后加入了数据收集的合作。收集的合作。基因组数据库的发展历史基因组数据库的发展历史24基因组数据库的发展历史基因组数据库的发展历史 19881988年一次三方会议之后(现在称之为年一次三方会议之后(现在称之为“国际国际DNADNA序列数据库合作计划序列数据库合作计划”)达成协议,对数据库的)达成协议,对数据库的记录采用共同的格式记录采用共同的格式 现在三个中心都收集直接提交的数据,并在三者现在三个中心都收集直接提交的数据,并在三者之间发布。之间发布。25三大基因数据库三大基因数据库GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与库包含了所有已知的核酸序列和蛋白质序列,以
12、及与它们相关的文献著作和生物学注释。它是由美国国立生物技术它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心信息中心(The National Center for Biotechnology Information,NCBI)建立和维护的。建立和维护的。NCBI的网址是:的网址是:http:/www.ncbi.nlm.nih.gov。EMBL(The European Molecular Biology Laboratory)核酸序核酸序列数据库列数据库由欧洲生物信息学研究所由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询维护的核酸序列数据构成,查询检索可以通过通过因
13、特网上的序列提取系统检索可以通过通过因特网上的序列提取系统(SRS)服务完成。服务完成。数据库网址是:数据库网址是:http:/www.ebi.ac.uk/embl/。DDBJ(DNA Data Bank of Japan)数据库数据库日本日本DNA数据仓库数据仓库(DDBJ)也是一个全面的核酸序列数据库,与也是一个全面的核酸序列数据库,与Genbank和和EMBL核酸库合作交换数据。使用其主页上提供的核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。工具进行数据检索和序列分析。DDBJ的网址是:的网址是:http:/www.ddbj.nig.ac.jp/。26GenBa
14、nkPublicfreeAvailableviaInternetEMBL Data LibraryDDBJ (DNA Data Bank of Japan)三大基因数据库之间的关系三大基因数据库之间的关系27http:/www.ncbi.nlm.nih.gov/http:/www.ddbj.nig.ac.jp/searches-e.htmlhttp:/www.ebi.ac.uk/embl/28美国的核酸数据库美国的核酸数据库GenBankBanson,D.A.et al.(1998)Nucleic Acids Res.26,1-7从从1979年开始建设,年开始建设,1982年正式运行。年正式运
展开阅读全文