书签 分享 收藏 举报 版权申诉 / 95
上传文档赚钱

类型五基因结构预测与基因表达分析课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2461242
  • 上传时间:2022-04-20
  • 格式:PPT
  • 页数:95
  • 大小:15.31MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《五基因结构预测与基因表达分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基因 结构 预测 表达 分析 课件
    资源描述:

    1、Chapter 5 基因结构预测基因结构预测与基因表达分析与基因表达分析蛋白质序列蛋白质序列翻翻译译调控元件分析调控元件分析编码区预测编码区预测基因结构分析基因结构分析选择性剪切选择性剪切SNP序列比对序列比对功能注释功能注释KEGGGO系统发育树系统发育树蛋白质理化性质蛋白质理化性质二级结构预测二级结构预测结构域分析结构域分析重要信号位点分析重要信号位点分析三级结构预测三级结构预测基因预测和基因结构分析基因预测和基因结构分析u生物信息学中的重要内容之一生物信息学中的重要内容之一u预测编码蛋白质的基因预测编码蛋白质的基因u排除重复序列排除重复序列u确定开放阅读框(确定开放阅读框(open re

    2、ading frame, ORF)内含子内含子/外显子外显子剪切位点识别;选择性剪切分析剪切位点识别;选择性剪切分析 (一)(一) 基因预测的基本分析内容基因预测的基本分析内容u确定基因的调控区确定基因的调控区核心启动子核心启动子/转录因子结合位点转录因子结合位点/转录启始位转录启始位点的识别;转录终止信号的预测;点的识别;转录终止信号的预测; CpG 岛的识别等岛的识别等 ATG TGA5-UTR3-UTRExon 1Exon 2Promoter (二)(二) 基因预测的基本方法基因预测的基本方法 1. 序列相似性搜索序列相似性搜索基因组基因组DNA序列序列A. 在在6个阅读框中进行翻译并与

    3、蛋白质数据库中的序个阅读框中进行翻译并与蛋白质数据库中的序列进行比较分析(如列进行比较分析(如Blastx)B. 对对EST数据库中同一生物的数据库中同一生物的cDNA序列进行比较序列进行比较分析(如分析(如Blastn)确定基因数目和对应的确定基因数目和对应的ORFu 分析举例:水稻分析举例:水稻Xa21基因区段基因区段DNA序列(序列(U37133)v CDS:1-2677 bp处和处和3521-3921 bp处处v Blastx分析结果分析结果(检索蛋白质数据库):与(检索蛋白质数据库):与水稻蛋白质序列比较水稻蛋白质序列比较v Blastn分析结果分析结果(检索(检索est other

    4、数据库):数据库):与水稻与水稻cDNA序列比较序列比较 取决于数据库中取决于数据库中EST数据的数量和长度数据的数量和长度 通过通过“Tree view”查看与查看与U37133序列序列同源的其它同源的其它EST序列序列 有些蛋白质序列是推测获得的有些蛋白质序列是推测获得的Blastx结果结果与与cDNA的比对结果的比对结果 2. 根据模式序列预测基因根据模式序列预测基因u 各种基因预测软件各种基因预测软件u 取决于人们取决于人们对已知基因结构特征的认识对已知基因结构特征的认识u 采用统计学方法采用统计学方法v 基于一个或多个已知序列模式对未知序基于一个或多个已知序列模式对未知序列进行分类列

    5、进行分类v 密码子偏爱性密码子偏爱性v 对发现的模式进行统计检验对发现的模式进行统计检验 启动子结构启动子结构 外显子、内含子外显子、内含子u 原核微生物(大肠杆菌原核微生物(大肠杆菌lexA基因的基因的DNA模式)模式)v LexA repressor的结合位点(启动子区段)的结合位点(启动子区段) CTGNNNNNNNNNNCAGv 与与RNA聚合酶相互作用位点(聚合酶相互作用位点(-10至至-35的启动的启动子区)子区) TTGACA和和TATAATv 核糖体结合位点(转录起始位点后)核糖体结合位点(转录起始位点后) GGAGGu 真核生物真核生物v 基因结构复杂基因结构复杂v 已知外显

    6、子、内含子外显子边界、启动子序已知外显子、内含子外显子边界、启动子序列特征列特征基因预测方法基因预测方法 不同方法预测不同方法预测 核酸序列出现频率统计法 同源比较法 隐马尔可夫模型法 决策树方法 语言学方法 神经网络分析法 训练数据集有针对性训练数据集有针对性 原核生物vs.真核生物 动物vs.植物基因预测软件基因预测软件基因结构分析工具基因结构分析工具GENSCANhttp:/genes.mit.edu/GENSCAN.htmlWeb/LinuxGeneMarkhttp:/www.ebi.ac.uk/genemark/ http:/opal.biology.gatech.edu/GeneM

    7、ark/WebGene Finderhttp:/rulai.cshl.org/tools/genefinder/(Dr. Michael Zhang )WebFGENESHhttp:/ LinuxFgeneSB/ FgeneSVhttp:/ http:/compbio.ornl.gov/generation/WebGeneBuilder http:/r.it/webgene/genebuilder.html WebFGENESH+ /+http:/ Web/LinuxGenomeScan http:/genes.mit.edu/genomescan.html WebGeneWise http:

    8、/www.sanger.ac.uk/Software/Wise2/ WebGRAILhttp:/grail.lsd.ornl.gov/grailexp/Web/Linux/WindowsBCM Gene Finderhttp:/searchlauncher.bcm.tmc.edu/seq-search/gene-search.htmlWebu 目前还没有一个基因预测工具可以完全正确地预测一个目前还没有一个基因预测工具可以完全正确地预测一个基因组中的所有基因基因组中的所有基因(Mathe C, Sagot MF, Schiex T, Rouze P. Current methods of gen

    9、e prediction, their strengths and weaknesses. Nucleic Acids Res. 30 (19):4103-4117, 2002)u 目前最好的基因预测工具预测一个基因组中的所有外显目前最好的基因预测工具预测一个基因组中的所有外显子的准确率最多达到子的准确率最多达到75%,预测基因结构的准确率,预测基因结构的准确率100相似度相似度95%S.Gupta et al., Genome wide identification and classification of alternative splicing based on EST data, 2

    10、004, 20(16): 2579-2585基因周围调控序列分析基因周围调控序列分析CpG岛位于真核生物基因转录起始位点上游,GC含50% ,长度200bp转录起始位点(Transcription start site, TSS)PY2CAPY5核心启动子(Core promoter element)TATA box,Pribnow box 上游启动子元件(Upstream promoter element)CAAT box,GC box,SP1,Otc转录终止信号AAUAAA,UUUUUU操纵子、终止子、增强子、沉默子启动子数据库启动子数据库TransFac http:/www.gene-

    11、EPD http:/www.epd.isb-sib.ch/ TRRD http:/wwwmgs.bionet.nsc.ru/mgs/gnw/trrd Jasparhttp:/jaspar.cgb.ki.se/cgi-bin/jaspar_db.plZhang Labhttp:/rulai.cshl.org/software/index1.htm DBTSShttp:/dbtss.hgc.jp/index.htmlMIRAGEhttp:/www.ifti.org/ Bacillus subtilis http:/dbtbs.hgc.jp/ Drosophila melanogaster http

    12、:/www-biology.ucsd.edu/labs/Kadonaga/DCPD.html E. coli http:/arep.med.harvard.edu/ecoli_matrices/ Human http:/zlab.bu.edu/mfrith/HPD.html PlantProm http:/ Planthttp:/www.dna.affrc.go.jp/PLACE http:/oberon.fvms.ugent.be:8080/PlantCARE/index.html Saccharomyces cerevisiae http:/cgsigma.cshl.org/jian/ C

    13、pG Island 分析分析CpG Island http:/ finderhttp:/ Network Promoter Predictionhttp:/www.fruitfly.org/seq_tools/promoter.htmlWebSoftberry: BPROM, TSSP, TSSG, TSSWhttp:/ ftp:/ariane.gsf.de/pub/win95_NT/ConsInspector.exeWindows/LinuxCisterhttp:/zlab.bu.edu/mfrith/cister.shtmlWeb Promoter预测Cis-regulatory elem

    14、ents analysisPlantCARE转录终止信号预测转录终止信号预测Hcpolyahttp:/r.it/webgene/wwwHC_polya.htm1Web POLYAHhttp:/ http:/rulai.cshl.org/tools/polyadq/polyadq_form.htmlWeb编码区综合分析举例编码区综合分析举例CpG岛分析No调控序列所在位置Cister结果:881- 896 CCAAT908- 923 CCAAT转录终止信号GetOrfGenScan735 - 773 964 - 1020 1054 - 1146 1112 - 1156 1341 - 1625 1

    15、054-1490(1054-1145, 1268-1490 )CCTAGTCCAGACGCCATGGGT比对分析(Blastx,Blastn,Blastp)Blastx结果: gamma globin:1054-11461266-1493 http:/zlab.bu.edu/mfrith/HPD.htmlHuman gene 5HSA004013: -10001000基因表达分析基因表达分析利用已发表基因芯片数据分析目标基因的表达情况 GEO serves as a public repository for a wide range of high-throughput experiment

    16、al data. These data include single and dual channel microarray-based experiments measuring mRNA, miRNA, genomic DNA (arrayCGH, ChIP-chip, and SNP), and protein abundance, as well as non-array techniques such as serial analysis of gene expression (SAGE), mass spectrometry peptide profiling, and vario

    17、us types of quantitative sequence data.GEO数据库查询数据库查询根据关键词查询或或根据GEO accession查询可下载这两种格式作进一步分析探针探针不同处理条件下的基因表达量不同处理条件下的基因表达量TXT格式如何判断目标基因所对应的芯片探针?根据soft格式文件中探针的注释信息利用PlantGDB数据库中的PLEXdb Probe Match工具查询选择数据库选择数据库粘贴目标基因粘贴目标基因CDS序列序列其它资源其它资源GenevestigatorGenevestigator is a reference expression database

    18、and meta-analysis system. It allows biologists to study the expression and regulation of genes in a broad variety of contexts by summarizing information from hundreds of microarray experiments into easily interpretable results. A user-friendly interface allows you to visualize gene expression in man

    19、y different tissues, at multiple developmental stages, or in response to large sets of stimuli, diseases, drug treatments, or genetic modifications. This type of meta-analysis is core to understanding the spatio-temporal-response regulation of genes, to identify or validate biomarkers, and to find o

    20、ut which subnetworks are commonly affected in different diseases and conditions.注册后可以免费试用以软件以软件Genevestigator tool的形式在的形式在PC机上打开进行操作。目机上打开进行操作。目前整合了拟南芥、水稻、人、老鼠等物种的基因芯片表达数据前整合了拟南芥、水稻、人、老鼠等物种的基因芯片表达数据Plant Expression DatebaseArrayexpresshttp:/www.ebi.ac.uk/microarray-as/ae/芯片表达数据分析GEPS (Gene Expressio

    21、n Pattern Scanner)需要输入的文件格式GEPS分析所用数据格式,以分析所用数据格式,以txt为扩展名保存为扩展名保存根据芯片文件中数据根据芯片文件中数据类型进行选择类型进行选择 查找共表达的基因;具有相查找共表达的基因;具有相似表达的基因等。似表达的基因等。 共表达的基因表示在相同组共表达的基因表示在相同组织或处理条件下表达量相当,织或处理条件下表达量相当,彼此间可能存在互作;彼此间可能存在互作; 相似表达的基因相似表达的基因,不考虑其,不考虑其表达水平高低,表达水平高低,只是看其表达只是看其表达变化趋势是否一致,这些基因变化趋势是否一致,这些基因可能行使相同或相似的功能可能行

    22、使相同或相似的功能探察不同基因在不同组织探察不同基因在不同组织中的特异表达情况中的特异表达情况基因间表达变化的比较芯片表达数据分析Cell Montagehttp:/cellmontage.cbrc.jp/cgi-bin/index.cgi芯片表达数据分析dChip(生物软件网上很多此类软件)读入分析数据建立filter文件(必须的)参数设定聚类分析,包括基因聚类和sample聚类颜色深浅表示在不同组织中表达量的高低图片缩放和放大可利用“上下左右箭头”或结合ctrl键上机操作上机操作1. 熟悉和掌握基因结构及调控元件预测工具FgeneSH与PlantCARE等的使用;2. 掌握microarray data的查询与下载,学会芯片数据分析工具GEPS及dChip的使用。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:五基因结构预测与基因表达分析课件.ppt
    链接地址:https://www.163wenku.com/p-2461242.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库