基因组注释详解讲解课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《基因组注释详解讲解课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 注释 详解 讲解 课件
- 资源描述:
-
1、基基 因因 组组 注注 释释基因组测序相关技术发展基因组测序相关技术发展198119861989199119941998200020022003200620072008In the coming future200920102005Affy launches Gene Expression microarraysRise of Genbank databases from DNA sequencingABI commercializes first automated DNA sequencerLow hanging fruit:cystic fibrosis mutationidentifi
2、ed3700 DNA Analyzer in Human Genome Project;DNA sequencing goes industrialFirst microarray publication-on ArabidopsisILMN launches gene expression arraysHuman Genome Project&Celera Genomics completes first draft genomeHapmap project launchedHapmap 1st phase data releaseAffy&ILMN both launched 100K g
3、enotyping arraysRise of Genome Wide Association Studies(GWAS)Roche GS FLX launchedILMN bought Solexa;launches GAABI SOLiD 1.0Launched!The SequencingShake up!SOLiD 3.0:100GB out of the box!The 3rd Generation Sequencing will be launchedILMN HiSeq 2000 launched30X的覆盖率(Solexa or SOLiD)序列预处理(质量控制)基因组分型技术
4、 SNP、Indel、CNV、染色体结构变异及注释 与表型相关的全基因组关联分析和功能连锁性分析实实 验验数据分析数据分析 30X以上的覆盖率(Solexa or SOLiD)序列预处理(质量控制)甲基化位点检测及注释 转录组测序(RNA-seq sequencing)microRNA测序(microRNA sequencing)实实 验验数据分析数据分析 mRNA打断、反转录、加接头 De novo 454 构建转录图谱 Reference barcode建库 Solexa,SOLiD 序列预处理(质量控制)表达丰度统计 注释(功能、代谢通路、表达差异比较)未知转录本的分析实实 验验数据分析
5、数据分析 microRNA提取、两头加接头、反转录、建库 (Solexa or SOLiD)序列预处理(质量控制)已知microRNA丰度统计 未知microRNA预测及丰度统计 元基因组测序(meta-genome sequencing)未知病毒检测(Unknown virus detecting)实实 验验数据分析数据分析 DNA提取、建库 序列预处理(质量控制)拼接、注释(功能、代谢通路)丰度统计、比较元基因组实实 验验数据分析数据分析 低量RNA、DNA处理、建库 与宿主、微生物、病毒数据库比较 未知病毒的发现及预测v基于BAC的方法:先把基因组打碎成200300kb的片段并制成BAC
6、文库,再选择一些BAC进一步打碎成3kb左右的小片段,测序并拼接。v全基因组鸟枪法:把基因组直接打碎成3kb左右的小片段,测序并拼接。v 全基因组DNAv 随机打成大片段 选择并克隆v 大片段排序,选择v 再打碎,克隆,测序,拼接基因组DNA随机打碎测序并拼接v 能充分利用正反向测序的配对信息,避免重复序列造成的错误拼接v 能处理数以百万甚至千万计的数据 程序并行化 高效率比对 能逐步拼接SequenceGENESCANORF FinderGENEMARKGene PredictionBlastnFastaHomology Search编码区启动子转录起始位点非翻译区被转录区 起始密码子 终止
7、密码子53 上游 转录终止位点下游SequenceGENESCANORF FinderGENEMARKGene PredictionBlastnFastaHomology Searchv一段序列 从起始密码子(start codon)开始,到终止密码子(stop codon)结束,而且其中不包含其它终止密码子。微生物基因组中 80%-90%的序列参与编码 主要问题:如果有两个或更多重叠的阅读框,哪一个是基因(假定只可能有一个)最可靠的方法 同源搜索(使用 BLAST 或 FASTA等)主要困难:在无已知同源性信息的情况下寻找基因vWebAccesshttp:/bioweb.pasteur.fr
8、/seqanal/interfaces/getorf.htmlvApplication(Download Emboss)i.Code to use:选择不同的codon usage table,包含有:(1)Standard (2)Standard(with alternative initiation codons)(3)Vertebrate Mitochondrial (4)Yeast Mitochondrial (5)Mold,Protozoan,Coelenterate Mitochondrial and Mycoplasma/Spiroplasma (6)Invertebrate M
9、itochondrial (7)Ciliate Macronuclear and Dasycladacean (8)Echinoderm Mitochondrial (9)Euplotid Nuclear (10)Bacterial (11)Alternative Yeast Nuclear (12)Ascidian Mitochondrial (13)Flatworm Mitochondrial (14)Blepharisma Macronuclear (15)Chlorophycean Mitochondrial (16)Trematode Mitochondrial (17)Scened
10、esmus obliquus (18)Thraustochytrium Mitochondrialii.最小的开放阅读框由多少个核甘酸组成,预设值为30,也就是10个氨基酸。iii.Type of output:可选择不同的输入结果,包含有:(1)Translation of regions between STOP codons (2)Translation of regions between START and STOP codons (3)Nucleic sequences between STOP codons (4)Nucleic sequences between START a
11、nd STOP codons (5)Nucleotides flanking START codons (6)Nucleotides flanking initial STOP codons (7)Nucleotides flanking ending STOP codonsfastagcgphylipemblswissncbinbrfgenbankigcodatastrideracedbstadentextfitchmsfclustalphylipphylip3asn1Metagenomics Metagenomics Community GenomicsCommunity Genomics
12、 Environmental GenomicsEnvironmental Genomicsv Who is there?diversity&abundancev What they are doing?Metabolic&interactionv Why they are there?Ecological relationsSpecies complexityAcid mine drainage1 100 1000 10000Sea waterHuman gutSoilAABCDAIsolated genome single source of DNAMetagenome multiple s
展开阅读全文