五基因结构预测与基因表达分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《五基因结构预测与基因表达分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 结构 预测 表达 分析 课件
- 资源描述:
-
1、Chapter 5 基因结构预测基因结构预测与基因表达分析与基因表达分析蛋白质序列蛋白质序列翻翻译译调控元件分析调控元件分析编码区预测编码区预测基因结构分析基因结构分析选择性剪切选择性剪切SNP序列比对序列比对功能注释功能注释KEGGGO系统发育树系统发育树蛋白质理化性质蛋白质理化性质二级结构预测二级结构预测结构域分析结构域分析重要信号位点分析重要信号位点分析三级结构预测三级结构预测基因预测和基因结构分析基因预测和基因结构分析u生物信息学中的重要内容之一生物信息学中的重要内容之一u预测编码蛋白质的基因预测编码蛋白质的基因u排除重复序列排除重复序列u确定开放阅读框(确定开放阅读框(open re
2、ading frame, ORF)内含子内含子/外显子外显子剪切位点识别;选择性剪切分析剪切位点识别;选择性剪切分析 (一)(一) 基因预测的基本分析内容基因预测的基本分析内容u确定基因的调控区确定基因的调控区核心启动子核心启动子/转录因子结合位点转录因子结合位点/转录启始位转录启始位点的识别;转录终止信号的预测;点的识别;转录终止信号的预测; CpG 岛的识别等岛的识别等 ATG TGA5-UTR3-UTRExon 1Exon 2Promoter (二)(二) 基因预测的基本方法基因预测的基本方法 1. 序列相似性搜索序列相似性搜索基因组基因组DNA序列序列A. 在在6个阅读框中进行翻译并与
3、蛋白质数据库中的序个阅读框中进行翻译并与蛋白质数据库中的序列进行比较分析(如列进行比较分析(如Blastx)B. 对对EST数据库中同一生物的数据库中同一生物的cDNA序列进行比较序列进行比较分析(如分析(如Blastn)确定基因数目和对应的确定基因数目和对应的ORFu 分析举例:水稻分析举例:水稻Xa21基因区段基因区段DNA序列(序列(U37133)v CDS:1-2677 bp处和处和3521-3921 bp处处v Blastx分析结果分析结果(检索蛋白质数据库):与(检索蛋白质数据库):与水稻蛋白质序列比较水稻蛋白质序列比较v Blastn分析结果分析结果(检索(检索est other
4、数据库):数据库):与水稻与水稻cDNA序列比较序列比较 取决于数据库中取决于数据库中EST数据的数量和长度数据的数量和长度 通过通过“Tree view”查看与查看与U37133序列序列同源的其它同源的其它EST序列序列 有些蛋白质序列是推测获得的有些蛋白质序列是推测获得的Blastx结果结果与与cDNA的比对结果的比对结果 2. 根据模式序列预测基因根据模式序列预测基因u 各种基因预测软件各种基因预测软件u 取决于人们取决于人们对已知基因结构特征的认识对已知基因结构特征的认识u 采用统计学方法采用统计学方法v 基于一个或多个已知序列模式对未知序基于一个或多个已知序列模式对未知序列进行分类列
5、进行分类v 密码子偏爱性密码子偏爱性v 对发现的模式进行统计检验对发现的模式进行统计检验 启动子结构启动子结构 外显子、内含子外显子、内含子u 原核微生物(大肠杆菌原核微生物(大肠杆菌lexA基因的基因的DNA模式)模式)v LexA repressor的结合位点(启动子区段)的结合位点(启动子区段) CTGNNNNNNNNNNCAGv 与与RNA聚合酶相互作用位点(聚合酶相互作用位点(-10至至-35的启动的启动子区)子区) TTGACA和和TATAATv 核糖体结合位点(转录起始位点后)核糖体结合位点(转录起始位点后) GGAGGu 真核生物真核生物v 基因结构复杂基因结构复杂v 已知外显
6、子、内含子外显子边界、启动子序已知外显子、内含子外显子边界、启动子序列特征列特征基因预测方法基因预测方法 不同方法预测不同方法预测 核酸序列出现频率统计法 同源比较法 隐马尔可夫模型法 决策树方法 语言学方法 神经网络分析法 训练数据集有针对性训练数据集有针对性 原核生物vs.真核生物 动物vs.植物基因预测软件基因预测软件基因结构分析工具基因结构分析工具GENSCANhttp:/genes.mit.edu/GENSCAN.htmlWeb/LinuxGeneMarkhttp:/www.ebi.ac.uk/genemark/ http:/opal.biology.gatech.edu/GeneM
7、ark/WebGene Finderhttp:/rulai.cshl.org/tools/genefinder/(Dr. Michael Zhang )WebFGENESHhttp:/ LinuxFgeneSB/ FgeneSVhttp:/ http:/compbio.ornl.gov/generation/WebGeneBuilder http:/r.it/webgene/genebuilder.html WebFGENESH+ /+http:/ Web/LinuxGenomeScan http:/genes.mit.edu/genomescan.html WebGeneWise http:
8、/www.sanger.ac.uk/Software/Wise2/ WebGRAILhttp:/grail.lsd.ornl.gov/grailexp/Web/Linux/WindowsBCM Gene Finderhttp:/searchlauncher.bcm.tmc.edu/seq-search/gene-search.htmlWebu 目前还没有一个基因预测工具可以完全正确地预测一个目前还没有一个基因预测工具可以完全正确地预测一个基因组中的所有基因基因组中的所有基因(Mathe C, Sagot MF, Schiex T, Rouze P. Current methods of gen
9、e prediction, their strengths and weaknesses. Nucleic Acids Res. 30 (19):4103-4117, 2002)u 目前最好的基因预测工具预测一个基因组中的所有外显目前最好的基因预测工具预测一个基因组中的所有外显子的准确率最多达到子的准确率最多达到75%,预测基因结构的准确率,预测基因结构的准确率100相似度相似度95%S.Gupta et al., Genome wide identification and classification of alternative splicing based on EST data, 2
10、004, 20(16): 2579-2585基因周围调控序列分析基因周围调控序列分析CpG岛位于真核生物基因转录起始位点上游,GC含50% ,长度200bp转录起始位点(Transcription start site, TSS)PY2CAPY5核心启动子(Core promoter element)TATA box,Pribnow box 上游启动子元件(Upstream promoter element)CAAT box,GC box,SP1,Otc转录终止信号AAUAAA,UUUUUU操纵子、终止子、增强子、沉默子启动子数据库启动子数据库TransFac http:/www.gene-
11、EPD http:/www.epd.isb-sib.ch/ TRRD http:/wwwmgs.bionet.nsc.ru/mgs/gnw/trrd Jasparhttp:/jaspar.cgb.ki.se/cgi-bin/jaspar_db.plZhang Labhttp:/rulai.cshl.org/software/index1.htm DBTSShttp:/dbtss.hgc.jp/index.htmlMIRAGEhttp:/www.ifti.org/ Bacillus subtilis http:/dbtbs.hgc.jp/ Drosophila melanogaster http
展开阅读全文