生物信息学的应用-ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物信息学的应用-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 应用 ppt 课件
- 资源描述:
-
1、生物分子生物分子数数 据据 计算机计算机计计 算算 + 生物体系和过程中信息生物体系和过程中信息的存贮、传递的存贮、传递和表达和表达细胞、组织、器官的生理、病理细胞、组织、器官的生理、病理药理过程的中各种生物信息药理过程的中各种生物信息信息科学信息科学生生命命科科学学中中的的信信息息科科 学学 生物生物分子数据分子数据深层次深层次生物学知识生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics挖掘挖掘获取获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据
2、库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR基因芯片基因芯片蛋白质折叠蛋白质折叠是否未知蛋白序列与已知功能的蛋白质相似是否未知蛋白序列与已知功能的蛋白质相似确定跨膜螺旋、卷曲螺旋和前导序列确定跨膜螺旋、卷曲螺旋和前导序列未知序列是否包含保守序列模体未知序列是否包含保守序列模体查对查对PROSITE数据库库数据库库查对查对BLOCKS和和PRINTS数据库数据库整理所有肯定的结果并核对一致性整理所有肯定的结果并核对一致性预测蛋白质功能预测蛋白质功能蛋白质功能预测流程图蛋白质功能预测流程图(引自引自HPDB蛋白质数据库(蛋白质数据库(http:/ 生物信息学数据库相互
3、关系生物信息学数据库相互关系 n 生物信息学数据库相互关系生物信息学数据库相互关系n常用数据库常用数据库类类 型型名名 称称网网 址址 核核酸酸序序 列列一次数据库一次数据库Genebankhttp:/www.ncbi.nlm.nih.gov/Genbank/EMBLhttp:/www.ebi.ac.uk/embl/DDBJhttp:/www.ddbj.nig.ac.jp/Welcome.html.ja/基因组基因组一次数据库一次数据库GDBhttp:/www.gdb.org/蛋蛋白白质质序序 列列一次数据库一次数据库SWISS-PROThttp:/www.expasy.org/sprot/P
4、IRhttp:/pir.georgetown.edu/TrEMBLhttp:/www.ebi.ac.uk/trembl/UniProthttp:/www.ebi.uniprot.org/index.shtml/MIPShttp:/mips.gsf.de/GenPeptftp:/ftp.ncifcrf.gov/pub/genpept/NRL-3Dhttp:/www.psc.edu/general/software/packages/nrl_3d/nrl_3d.html/复合数据库复合数据库NRDBhttp:/www.nrdb.co.uk/OWLhttp:/www.bioinf.mancheste
5、r.ac.uk/dbbrowser/OWL/SWISS-PROTTrEMBLhttp:/www.ebi.ac.uk/clustr/ 二次数据库二次数据库PROSITEhttp:/www.expasy.org/prosite/PRINTShttp:/www.bioinf.man.ac.uk/dbbrowser/PRINTS/BLOCKShttp:/blocks.fhcrc.org/Pfamhttp:/pfam.sanger.ac.uk/IDENTIFYhttp:/dna.stanford.edu/identify/COGshttp:/www.ncbi.nlm.nih.gov/COG/ProDom
6、http:/www.toulouse.inra.fr/prodom.html/结结 构构一次数据库一次数据库PDBhttp:/www.rcsb.org/pdb/home/home.doMMDBhttp:/www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml/ 二次数据库二次数据库DSSPhttp:/www.sander.embl-heidelberg.de/dssp/HSSPhttp:/www.sander.embl-heidelberg.de/hssp/FSSPhttp:/www.ebi.ac.uk/dali/fssp/PSdbhttp:/www.ps
7、c.edu/geigel/PSdb/PSdb.html/ 结构分类结构分类SCOPhttp:/scop.mrc-lmb.cam.ac.uk/scop/CATHhttp:/www.cathdb.info/latest/index.html/PDBsumhttp:/www.ebi.ac.uk/thornton-srv/databases/pdbsum/ 分类分类二次数据库二次数据库ProtoMaphttp:/protomap.cornell.edu蛋白质组蛋白质组 蛋白质组蛋白质组 氨基酸索引氨基酸索引AAindexhttp:/www.genome.ad.jp/dbget/蛋白质间功能关蛋白质间功
8、能关系系Predictomehttp:/visant.bu.edu/蛋白质组分析蛋白质组分析Proteome Analysishttp:/www.ebi.ac.uk/integr8/EBI-Integr8-HomePage.do/二维凝胶电泳二维凝胶电泳GELBANKhttp:/gelbank.anl.gov/SWISS-2DPAGE http:/www.expasy.org/ch2d/酵母蛋白质定位酵母蛋白质定位YPL.dbhttp:/ypl.tugraz.at/模式生物蛋白质模式生物蛋白质组组Bioknowledge Librnaryhttp:/www.biobase- 测序工作者提交的序
9、列、测序中心提交的测序工作者提交的序列、测序中心提交的大量大量EST序列、其它测序数据以及与其它数据机序列、其它测序数据以及与其它数据机构协作交换的数据。构协作交换的数据。uGenbank内容内容 所有已知的核酸序列和蛋白质序列,还包所有已知的核酸序列和蛋白质序列,还包括对序列的简要描述、科学命名、物种分类名称、括对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表等辅助信息。参考文献、序列特征表等辅助信息。uGenbank对数据记录的处理对数据记录的处理 划分为划分为 细菌类、病毒类、灵长类、啮齿类,细菌类、病毒类、灵长类、啮齿类, EST数据、基因组测序数据、大规模基因组序列数据
10、、基因组测序数据、大规模基因组序列数据等数据等16类。类。图图6-4 NCBI-Entrz gene检索界面检索界面图图6-5 NCBI-Entrez cross-database检索界面检索界面Entrez Entrez ,The Life Sciences Search Engine BLAST ( Basic Local Alignment search Tool) 是是 DNA DNA 或氨基酸序列比对分析的重要软件或氨基酸序列比对分析的重要软件 TaxBrowser:Taxonomy browser 分类浏览器Structure:该目录下最重要的资源是分子模型数据库 MMDB 及 C
11、n3D 生物大分子三维模型查看软件 uEMBL和和GenBank数据库识别标志数据库识别标志EMBL识别标志识别标志GenBank识别标志识别标志含义含义IDLOCUS标识字符串及短描述字标识字符串及短描述字XX为阅读清晰而加的空行为阅读清晰而加的空行ACACCESSION唯一的提取号唯一的提取号SVVERSION序列版本号序列版本号DTDATE建立日期建立日期DEDEFINITION简单的描述简单的描述KWKEYWORDS关键字关键字OSSOURCE来源生物体来源生物体OCORGANISM生物体分类谱系生物体分类谱系RNREFERENCE引文编号引文编号RCREMARK引文注释引文注释RP其
12、他注释其他注释RX MEDLINEMEDLINE引文代码引文代码RAAUTHORS引文作者引文作者RTTITLE引文题目引文题目RLJOURNAL引文出处引文出处CCCOMMENT评注评注DR相关数据库交叉引用相关数据库交叉引用号号FHFEATURES特性表头特性表头FT特征表特征表SQEMBL序列开始,后序列开始,后跟长度、字母数跟长度、字母数BASE COUNTGeneBank碱基数碱基数ORIGINGeneBank序列开始序列开始标志,为空行标志,为空行/序列结束标志序列结束标志uGenBank核酸数据库实例核酸数据库实例 以人畜共患的病源菌鼠伤寒沙门氏菌(以人畜共患的病源菌鼠伤寒沙门氏
13、菌(Salmonella typhimurium )H1相抗原基因相抗原基因H-1-i为例,简要说明为例,简要说明GenBank核核酸数据库的数据格式。酸数据库的数据格式。LOCUS STYFLGH1I 1485 bp DNA linear BCT 26-APR-1993DEFINITION Salmonella typhimurium H-1-i gene encoding phase 1 flagellar filament protein (flagellin), complete cds. ACCESSION M11332VERSION M11332.1 GI:153978KEYWOR
14、DS flagellin.SOURCE Salmonella typhimurium ORGANISM Salmonella typhimurium Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella.REFERENCE 1 (bases 1 to 1485) AUTHORS Joys,T.M. TITLE The covalent structure of the phase-1 flagellar filament protein of Salmon
15、ella typhimurium and its comparison with other flagellins JOURNAL J. Biol. Chem. 260 (29), 15758-15761 (1985) PUBMED 2999134序列标识序列标识简单描述简单描述序列编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处COMMENT Original source text: S.typhimurium SL877 DNA. Draft entry and clean copy sequence f
16、or 1 kindly provided by T.M.Joyce, 18-FEB-1986. Individual Salmonella serotypes usually alternate between the production of two antigenic forms of flagella, termed phase-1 and phase-2, each specified by separate structural genes. Both ends of the flagellin gene act in the regulation of flagellin syn
17、thesis.FEATURES Location/Qualifiers source 1.1485 /organism=Salmonella typhimurium /mol_type=genomic DNA /db_xref=taxon:602 CDS 13.1485 /note=phase-1 flagellar filament protein /codon_start=1 /transl_table=11 /protein_id=AAA27072.1 /db_xref=GI:153979评注评注特征表特征表编码区编码区 /translation=MAQVINTNSLSLLTQNNLNK
18、SQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVNGQTQFSGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDEKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAAVTPATVTTATALSGKMYSANPDSDIAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLA
19、VKVGDDYYSATQDKDGSISIDTTKYTADNGTSKTALNKLGGADGKTEVVTIDGKTYNASKAAGHDFKAEPELAEQAAKTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLSSARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLRORIGIN 98 bp upstream of TaqI site. 1 aaggaaaaga tcatggcaca agtcattaat acaaacagcc tgtcgctgtt gacccagaat 61 aacctgaaca aatcccagtc c
20、gctctgggc accgctatcg agcgtctgtc ttccggtctg 121 cgtatcaaca gcgcgaaaga cgatgcggca ggtcaggcga ttgctaaccg ttttaccgcg 181 aacatcaaag gtctgactca ggcttcccgt aacgctaacg acggtatctc cattgcgcag 241 accactgaag gcgcgctgaa cgaaatcaac aacaacctgc agcgtgtgcg tgaactggcg 301 gttcagtctg ctaacagcac caactcccag tctgacctcg
21、 actccatcca ggctgaaatc蛋白序列蛋白序列基因序列基因序列361 acccagcgtc tgaacgaaat cgaccgtgta aatggccaga ctcagttcag cggcgtgaaa421 gtcctggcgc aggacaacac cctgaccatc caggttggtg ccaacgacgg tgaaactatc481 gatatcgatc tgaagcagat caactctcag accctgggtc tggatacgct gaatgtgcaa541 caaaaatata aggtcagcga tacggctgca actgttacag gatatgc
22、cga tactacgatt601 gctttagaca atagtacttt taaagcctcg gctactggtc ttggtggtac tgacgagaaa661 attgatggcg atttaaaatt tgatgatacg actggaaaat attacgccaa agttaccgtt721 acggggggaa ctggtaaaga tggctattat gaagtttccg ttgataagac gaacggtgag781 gtgactcttg ctgcggtcac tcccgctaca gtgactactg cgacagcact gagtggaaaa841 atgtac
23、agtg caaatcctga ttctgacata gctaaagccg cattgacagc agcaggtgtt901 accggcacag catctgttgt taagatgtct tatactgata ataacggtaa aactattgat961 ggtggtttag cagttaaggt aggcgatgat tactattctg caactcaaga taaagatggt1021 tccataagta ttgatactac gaaatacact gcagataacg gtacatccaa aactgcacta1081 aacaaactgg gtggcgcaga cggcaa
24、aacc gaagtcgtta ctatcgacgg taaaacctac1141 aatgccagca aagccgctgg tcatgatttc aaagcagaac cagagctggc ggaacaagcc1201 gctaaaacca ccgaaaaccc gctgcagaaa attgatgctg ctttggcaca ggttgacacg1261 ttacgttctg acctgggtgc ggtacagaac cgtttcaact ccgctattac caacctgggc1321 aacaccgtaa acaacctgtc ttctgcccgt agccgtatcg aaga
25、ttccga ctacgcgacc1381 gaagtctcca acatgtctcg cgcgcagatt ctgcagcagg ccggtacctc cgttctggcg1441 caggcgaacc aggttccgca aaacgtcctc tctttactgc gttaa/ 记录结束记录结束图图6-6 Swiss-Prot数据库网站主页数据库网站主页表表6-3 SWISS-PORT 数据库的行识别标志及含义数据库的行识别标志及含义中止符号中止符号Termination line/序列标头序列标头Sequence headerSQ特征表特征表Feature table dataFT关键
展开阅读全文