书签 分享 收藏 举报 版权申诉 / 140
上传文档赚钱

类型生物信息学的应用-ppt课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2204510
  • 上传时间:2022-03-21
  • 格式:PPT
  • 页数:140
  • 大小:14.36MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《生物信息学的应用-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    生物 信息学 应用 ppt 课件
    资源描述:

    1、生物分子生物分子数数 据据 计算机计算机计计 算算 + 生物体系和过程中信息生物体系和过程中信息的存贮、传递的存贮、传递和表达和表达细胞、组织、器官的生理、病理细胞、组织、器官的生理、病理药理过程的中各种生物信息药理过程的中各种生物信息信息科学信息科学生生命命科科学学中中的的信信息息科科 学学 生物生物分子数据分子数据深层次深层次生物学知识生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics挖掘挖掘获取获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据

    2、库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR基因芯片基因芯片蛋白质折叠蛋白质折叠是否未知蛋白序列与已知功能的蛋白质相似是否未知蛋白序列与已知功能的蛋白质相似确定跨膜螺旋、卷曲螺旋和前导序列确定跨膜螺旋、卷曲螺旋和前导序列未知序列是否包含保守序列模体未知序列是否包含保守序列模体查对查对PROSITE数据库库数据库库查对查对BLOCKS和和PRINTS数据库数据库整理所有肯定的结果并核对一致性整理所有肯定的结果并核对一致性预测蛋白质功能预测蛋白质功能蛋白质功能预测流程图蛋白质功能预测流程图(引自引自HPDB蛋白质数据库(蛋白质数据库(http:/ 生物信息学数据库相互

    3、关系生物信息学数据库相互关系 n 生物信息学数据库相互关系生物信息学数据库相互关系n常用数据库常用数据库类类 型型名名 称称网网 址址 核核酸酸序序 列列一次数据库一次数据库Genebankhttp:/www.ncbi.nlm.nih.gov/Genbank/EMBLhttp:/www.ebi.ac.uk/embl/DDBJhttp:/www.ddbj.nig.ac.jp/Welcome.html.ja/基因组基因组一次数据库一次数据库GDBhttp:/www.gdb.org/蛋蛋白白质质序序 列列一次数据库一次数据库SWISS-PROThttp:/www.expasy.org/sprot/P

    4、IRhttp:/pir.georgetown.edu/TrEMBLhttp:/www.ebi.ac.uk/trembl/UniProthttp:/www.ebi.uniprot.org/index.shtml/MIPShttp:/mips.gsf.de/GenPeptftp:/ftp.ncifcrf.gov/pub/genpept/NRL-3Dhttp:/www.psc.edu/general/software/packages/nrl_3d/nrl_3d.html/复合数据库复合数据库NRDBhttp:/www.nrdb.co.uk/OWLhttp:/www.bioinf.mancheste

    5、r.ac.uk/dbbrowser/OWL/SWISS-PROTTrEMBLhttp:/www.ebi.ac.uk/clustr/ 二次数据库二次数据库PROSITEhttp:/www.expasy.org/prosite/PRINTShttp:/www.bioinf.man.ac.uk/dbbrowser/PRINTS/BLOCKShttp:/blocks.fhcrc.org/Pfamhttp:/pfam.sanger.ac.uk/IDENTIFYhttp:/dna.stanford.edu/identify/COGshttp:/www.ncbi.nlm.nih.gov/COG/ProDom

    6、http:/www.toulouse.inra.fr/prodom.html/结结 构构一次数据库一次数据库PDBhttp:/www.rcsb.org/pdb/home/home.doMMDBhttp:/www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml/ 二次数据库二次数据库DSSPhttp:/www.sander.embl-heidelberg.de/dssp/HSSPhttp:/www.sander.embl-heidelberg.de/hssp/FSSPhttp:/www.ebi.ac.uk/dali/fssp/PSdbhttp:/www.ps

    7、c.edu/geigel/PSdb/PSdb.html/ 结构分类结构分类SCOPhttp:/scop.mrc-lmb.cam.ac.uk/scop/CATHhttp:/www.cathdb.info/latest/index.html/PDBsumhttp:/www.ebi.ac.uk/thornton-srv/databases/pdbsum/ 分类分类二次数据库二次数据库ProtoMaphttp:/protomap.cornell.edu蛋白质组蛋白质组 蛋白质组蛋白质组 氨基酸索引氨基酸索引AAindexhttp:/www.genome.ad.jp/dbget/蛋白质间功能关蛋白质间功

    8、能关系系Predictomehttp:/visant.bu.edu/蛋白质组分析蛋白质组分析Proteome Analysishttp:/www.ebi.ac.uk/integr8/EBI-Integr8-HomePage.do/二维凝胶电泳二维凝胶电泳GELBANKhttp:/gelbank.anl.gov/SWISS-2DPAGE http:/www.expasy.org/ch2d/酵母蛋白质定位酵母蛋白质定位YPL.dbhttp:/ypl.tugraz.at/模式生物蛋白质模式生物蛋白质组组Bioknowledge Librnaryhttp:/www.biobase- 测序工作者提交的序

    9、列、测序中心提交的测序工作者提交的序列、测序中心提交的大量大量EST序列、其它测序数据以及与其它数据机序列、其它测序数据以及与其它数据机构协作交换的数据。构协作交换的数据。uGenbank内容内容 所有已知的核酸序列和蛋白质序列,还包所有已知的核酸序列和蛋白质序列,还包括对序列的简要描述、科学命名、物种分类名称、括对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表等辅助信息。参考文献、序列特征表等辅助信息。uGenbank对数据记录的处理对数据记录的处理 划分为划分为 细菌类、病毒类、灵长类、啮齿类,细菌类、病毒类、灵长类、啮齿类, EST数据、基因组测序数据、大规模基因组序列数据

    10、、基因组测序数据、大规模基因组序列数据等数据等16类。类。图图6-4 NCBI-Entrz gene检索界面检索界面图图6-5 NCBI-Entrez cross-database检索界面检索界面Entrez Entrez ,The Life Sciences Search Engine BLAST ( Basic Local Alignment search Tool) 是是 DNA DNA 或氨基酸序列比对分析的重要软件或氨基酸序列比对分析的重要软件 TaxBrowser:Taxonomy browser 分类浏览器Structure:该目录下最重要的资源是分子模型数据库 MMDB 及 C

    11、n3D 生物大分子三维模型查看软件 uEMBL和和GenBank数据库识别标志数据库识别标志EMBL识别标志识别标志GenBank识别标志识别标志含义含义IDLOCUS标识字符串及短描述字标识字符串及短描述字XX为阅读清晰而加的空行为阅读清晰而加的空行ACACCESSION唯一的提取号唯一的提取号SVVERSION序列版本号序列版本号DTDATE建立日期建立日期DEDEFINITION简单的描述简单的描述KWKEYWORDS关键字关键字OSSOURCE来源生物体来源生物体OCORGANISM生物体分类谱系生物体分类谱系RNREFERENCE引文编号引文编号RCREMARK引文注释引文注释RP其

    12、他注释其他注释RX MEDLINEMEDLINE引文代码引文代码RAAUTHORS引文作者引文作者RTTITLE引文题目引文题目RLJOURNAL引文出处引文出处CCCOMMENT评注评注DR相关数据库交叉引用相关数据库交叉引用号号FHFEATURES特性表头特性表头FT特征表特征表SQEMBL序列开始,后序列开始,后跟长度、字母数跟长度、字母数BASE COUNTGeneBank碱基数碱基数ORIGINGeneBank序列开始序列开始标志,为空行标志,为空行/序列结束标志序列结束标志uGenBank核酸数据库实例核酸数据库实例 以人畜共患的病源菌鼠伤寒沙门氏菌(以人畜共患的病源菌鼠伤寒沙门氏

    13、菌(Salmonella typhimurium )H1相抗原基因相抗原基因H-1-i为例,简要说明为例,简要说明GenBank核核酸数据库的数据格式。酸数据库的数据格式。LOCUS STYFLGH1I 1485 bp DNA linear BCT 26-APR-1993DEFINITION Salmonella typhimurium H-1-i gene encoding phase 1 flagellar filament protein (flagellin), complete cds. ACCESSION M11332VERSION M11332.1 GI:153978KEYWOR

    14、DS flagellin.SOURCE Salmonella typhimurium ORGANISM Salmonella typhimurium Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella.REFERENCE 1 (bases 1 to 1485) AUTHORS Joys,T.M. TITLE The covalent structure of the phase-1 flagellar filament protein of Salmon

    15、ella typhimurium and its comparison with other flagellins JOURNAL J. Biol. Chem. 260 (29), 15758-15761 (1985) PUBMED 2999134序列标识序列标识简单描述简单描述序列编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处COMMENT Original source text: S.typhimurium SL877 DNA. Draft entry and clean copy sequence f

    16、or 1 kindly provided by T.M.Joyce, 18-FEB-1986. Individual Salmonella serotypes usually alternate between the production of two antigenic forms of flagella, termed phase-1 and phase-2, each specified by separate structural genes. Both ends of the flagellin gene act in the regulation of flagellin syn

    17、thesis.FEATURES Location/Qualifiers source 1.1485 /organism=Salmonella typhimurium /mol_type=genomic DNA /db_xref=taxon:602 CDS 13.1485 /note=phase-1 flagellar filament protein /codon_start=1 /transl_table=11 /protein_id=AAA27072.1 /db_xref=GI:153979评注评注特征表特征表编码区编码区 /translation=MAQVINTNSLSLLTQNNLNK

    18、SQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVNGQTQFSGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLGLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDEKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAAVTPATVTTATALSGKMYSANPDSDIAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLA

    19、VKVGDDYYSATQDKDGSISIDTTKYTADNGTSKTALNKLGGADGKTEVVTIDGKTYNASKAAGHDFKAEPELAEQAAKTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLSSARSRIEDSDYATEVSNMSRAQILQQAGTSVLAQANQVPQNVLSLLRORIGIN 98 bp upstream of TaqI site. 1 aaggaaaaga tcatggcaca agtcattaat acaaacagcc tgtcgctgtt gacccagaat 61 aacctgaaca aatcccagtc c

    20、gctctgggc accgctatcg agcgtctgtc ttccggtctg 121 cgtatcaaca gcgcgaaaga cgatgcggca ggtcaggcga ttgctaaccg ttttaccgcg 181 aacatcaaag gtctgactca ggcttcccgt aacgctaacg acggtatctc cattgcgcag 241 accactgaag gcgcgctgaa cgaaatcaac aacaacctgc agcgtgtgcg tgaactggcg 301 gttcagtctg ctaacagcac caactcccag tctgacctcg

    21、 actccatcca ggctgaaatc蛋白序列蛋白序列基因序列基因序列361 acccagcgtc tgaacgaaat cgaccgtgta aatggccaga ctcagttcag cggcgtgaaa421 gtcctggcgc aggacaacac cctgaccatc caggttggtg ccaacgacgg tgaaactatc481 gatatcgatc tgaagcagat caactctcag accctgggtc tggatacgct gaatgtgcaa541 caaaaatata aggtcagcga tacggctgca actgttacag gatatgc

    22、cga tactacgatt601 gctttagaca atagtacttt taaagcctcg gctactggtc ttggtggtac tgacgagaaa661 attgatggcg atttaaaatt tgatgatacg actggaaaat attacgccaa agttaccgtt721 acggggggaa ctggtaaaga tggctattat gaagtttccg ttgataagac gaacggtgag781 gtgactcttg ctgcggtcac tcccgctaca gtgactactg cgacagcact gagtggaaaa841 atgtac

    23、agtg caaatcctga ttctgacata gctaaagccg cattgacagc agcaggtgtt901 accggcacag catctgttgt taagatgtct tatactgata ataacggtaa aactattgat961 ggtggtttag cagttaaggt aggcgatgat tactattctg caactcaaga taaagatggt1021 tccataagta ttgatactac gaaatacact gcagataacg gtacatccaa aactgcacta1081 aacaaactgg gtggcgcaga cggcaa

    24、aacc gaagtcgtta ctatcgacgg taaaacctac1141 aatgccagca aagccgctgg tcatgatttc aaagcagaac cagagctggc ggaacaagcc1201 gctaaaacca ccgaaaaccc gctgcagaaa attgatgctg ctttggcaca ggttgacacg1261 ttacgttctg acctgggtgc ggtacagaac cgtttcaact ccgctattac caacctgggc1321 aacaccgtaa acaacctgtc ttctgcccgt agccgtatcg aaga

    25、ttccga ctacgcgacc1381 gaagtctcca acatgtctcg cgcgcagatt ctgcagcagg ccggtacctc cgttctggcg1441 caggcgaacc aggttccgca aaacgtcctc tctttactgc gttaa/ 记录结束记录结束图图6-6 Swiss-Prot数据库网站主页数据库网站主页表表6-3 SWISS-PORT 数据库的行识别标志及含义数据库的行识别标志及含义中止符号中止符号Termination line/序列标头序列标头Sequence headerSQ特征表特征表Feature table dataFT关键

    26、词关键词KeywordsKW交叉引用数据库交叉引用数据库Database cross-referenceDR评注或注释评注或注释Comments or notesCC引文出处引文出处Reference locationRL引文标题引文标题Reference tileRT引文作者引文作者Reference authorsRA交叉引用交叉引用Cross-referenceRX相关内容相关内容Reference commentsRC引文位置引文位置Reference positionRP引文序号引文序号Reference numberRN物种分类物种分类Organism classification

    27、OC来源细胞器来源细胞器OrganelleOG来源物种来源物种Organism speciesOS基因名称基因名称Gene name(s)GN描述描述DescriptionDE登录日期或最后更新日期登录日期或最后更新日期DateDT序列编号序列编号Accession NumberAC标识号标识号IdentificationID含含 义义全全 称称缩写缩写 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌Salmonella typhimurium H1-i基因编码的鞭毛蛋白基因编码的鞭毛蛋白FLIC_SALTY为例介绍为例介绍SWISS-PORT数数据库的数据格式。据库的数据格式。ID FLIC_SALTY

    28、Reviewed; 495 AA.AC P06179; P97160; Q02871; Q56088; DT 01-JAN-1988, integrated into UniProtKB/Swiss-Prot.DT 23-JAN-2007, sequence version 4.DT 24-JUL-2007, entry version 69.DE Flagellin (Phase 1-I flagellin).GN Name=fliC; Synonyms=flaF, hag; OrderedLocusNames=STM1959;OS Salmonella typhimurium.OC Bac

    29、teria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella.OX NCBI_TaxID=602;RN 1RP NUCLEOTIDE SEQUENCE GENOMIC DNA.RX MEDLINE=86059460; PubMed=2999134;RA Joys T.M.;RT The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and it

    30、s comparison with other flagellins.;RL J. Biol. Chem. 260:15758-15761(1985). 序列标识序列标识 序列序列编号编号登录日期登录日期描述描述基因名称基因名称来源物种来源物种物种分类物种分类物种分类号物种分类号引文序号引文序号引文位置引文位置交叉引用交叉引用引文作者引文作者引文标题引文标题引文出处引文出处 SWISS-PROT 数据库条目实例数据库条目实例RN 9RP NUCLEOTIDE SEQUENCE GENOMIC DNA OF 476-495.RC STRAIN=LT2 / ATCC 23564;CC -!- FU

    31、NCTION: Flagellin is the subunit protein which polymerizes to form the filaments of bacterial flagella.CC -!- MISCELLANEOUS: Individual Salmonella serotypes usually alternate between the production of 2 antigenic forms of flagella, termed phase 1 and phase 2, each specified by separate structural ge

    32、nes, fliC and fljB.CC -!- SIMILARITY: Belongs to the bacterial flagellin family.CC -DR EMBL; M11332; AAA27072.1; -; Genomic_DNA.DR EMBL; D13689; BAA02846.1; -; Genomic_DNA.DR EMBL; AE008787; AAL20871.1; -; Genomic_DNA.DR EMBL; X51740; CAA36029.1; -; Genomic_DNA.DR EMBL; J01801; AAA27074.1; -; Genomi

    33、c_DNA.DR PIR; A24262; A24262.DR PIR; S16121; S16121.DR PDB; 1IO1; X-ray; A=54-451.DR PDB; 1P95; Model; A=57-451.DR PDB; 1UCU; EM; A=1-495.相关内容相关内容评注功能评注功能 其他特性其他特性 相似性相似性交叉引用数据库交叉引用数据库 EMBL核酸序列核酸序列数据库数据库 PIR蛋白序列蛋白序列数据库数据库 PDB蛋白结构蛋白结构数据库数据库PE 1: Evidence at protein level;KW 3D-structure; Complete pro

    34、teome; Flagellum.FT INIT_MET 1 1 Removed (By similarity).FT CHAIN 2 495 Flagellin.FT /FTId=PRO_0000182578.FT CONFLICT 127 127 S - N (in Ref. 1).FT CONFLICT 133 133 N - S (in Ref. 1).FT HELIX 3 32FT TURN 37 39FT HELIX 44 98关键词关键词特征表特征表不同来源不同来源数据库的数据库的冲突位点冲突位点二级结构二级结构信息信息SQ SEQUENCE 495 AA; 51612 MW;

    35、4BD7849FA3B936BA CRC64; MAQVINTNSL SLLTQNNLNK SQSALGTAIE RLSSGLRINS AKDDAAGQAIANRFTANIKG LTQASRNAND GISIAQTTEG ALNEINNNLQ RVRELAVQSA NSTNSQSDLD SIQAEITQRL NEIDRVSGQT QFNGVKVLAQ DNTLTIQVGA NDGETIDIDL KQINSQTLGLDTLNVQQKYK VSDTAATVTG YADTTIALDN STFKASATGL GGTDQKIDGDLKFDDTTGKYYAKVTVTGGT GKDGYYEVSV DKTNG

    36、EVTLA GGATSPLTGGLPATATEDVKNVQVANADLTEAKAALTAAG VTGTASVVKM SYTDNNGKTI DGGLAVKVGD DYYSATQNKD GSISINTTKYTADDGTSKTA LNKLGGADGK TEVVSIGGKT YAASKAEGHN FKAQPDLAEA AATTTENPLQKIDAALAQVD TLRSDLGAVQ NRFNSAITNL GNTVNNLTSA RSRIEDSDYA TEVSNMSRAQ ILQQAGTSVL AQANQVPQNV LSLLR/ 序列标头序列标头蛋白质序列蛋白质序列记录结束记录结束 2. PIR PIR的子

    37、数据库:的子数据库: 蛋白质序列数据库(蛋白质序列数据库(PIR-PSD) 蛋白质分类数据库(蛋白质分类数据库(iProClass) 非冗余的蛋白质参考资料数据库(非冗余的蛋白质参考资料数据库(PIR-NREF)PIR数据库按照数据性质和注释层次分四个部分:数据库按照数据性质和注释层次分四个部分: PIR1序列已经验证,注释最为详尽序列已经验证,注释最为详尽; PIR2为尚未确定的冗余序列;为尚未确定的冗余序列; PIR3序列既未检验,也未注释;序列既未检验,也未注释; PIR4序列来自其它渠道,既未验证,也无注释。序列来自其它渠道,既未验证,也无注释。美国国家生物医学研究基金会与国际蛋白质信

    38、息中心美国国家生物医学研究基金会与国际蛋白质信息中心(PIR-InternationalPIR-International)共同维护。)共同维护。PIRPIR是第一个蛋白质分类和功能注释数据库是第一个蛋白质分类和功能注释数据库 PIR作用:作用:n 提供基于文本的交互式检索、序列相提供基于文本的交互式检索、序列相似性似性 搜索以及结合序列相似性、注释信息搜索以及结合序列相似性、注释信息和蛋白质家族信息的高级检索。和蛋白质家族信息的高级检索。nPIR网址:网址:http:/pir.georgetown.edu/ 3.TrEMBL是一个经计算机注释的蛋白质数据库,采用是一个经计算机注释的蛋白质数据

    39、库,采用SWISS-PROT数据库格式。数据库格式。主要包含从主要包含从EMBL/ Genbank/DDBJ三大核三大核酸数据库中根据编码序列翻译的、尚未集成酸数据库中根据编码序列翻译的、尚未集成到到SWISS-PROT数据库中的蛋白质序列。数据库中的蛋白质序列。TrEMBL为为SWISS-PROT数据库及时提供补数据库及时提供补充。充。 TrEMBL网址:网址:http:/www.ebi.ac.uk/trembl/4. UniProt UniProt将将SWISS-PROT、PIR、TrEMBL三个数据库合并。通过文本三个数据库合并。通过文本检索、序列相似检索以及检索、序列相似检索以及Uni

    40、Prot Ftp网站可获得蛋白质序列。网站可获得蛋白质序列。如图如图6-7所示所示 图图6-7 UniProt网站主页网站主页UniProt包含包含UniProtKB、UniRef 和和UniParc 3个部个部分:分:(1)UniProtKB数据库数据库(UniProt Knowledgebase):):蛋白质序列、功能、分类、交叉引用等信息存取中心;蛋白质序列、功能、分类、交叉引用等信息存取中心;(2)UniRef数据库数据库(UniProt Reference Clusters):):为提高检索的速度,将紧密相关的蛋白质序列合并到为提高检索的速度,将紧密相关的蛋白质序列合并到同一条记录中

    41、。目前,根据序列相似程度可将同一条记录中。目前,根据序列相似程度可将UniRef数据库分为数据库分为UniRef100、UniRef90和和UniRef50 3个子库个子库(3)UniParc(UniProt Archive):储存大量蛋白质):储存大量蛋白质研究的历史信息。研究的历史信息。 利用利用UniProt 可方便的进行蛋白质序列可方便的进行蛋白质序列的交互检索,的交互检索,Salmonella typhimurium H-1项鞭毛蛋白项鞭毛蛋白P06176的的UniProt检索截图如下。检索截图如下。 UniProt网址:网址:http:/www.ebi.uniprot.org/in

    42、dex.shtml图图 6-8 核心数据核心数据图图 6-9 核心数据(续)、引用文献与评注核心数据(续)、引用文献与评注图图 6-10 交互检索与关键词交互检索与关键词图图 6-11 特征表与序列信息特征表与序列信息5. GenPept数据库数据库GenPept数据库特点数据库特点 由由Genebank数据库的核酸序列经翻译后产生。数据库的核酸序列经翻译后产生。GenPept数据量大,随核酸数据库的更新而更新,数据量大,随核酸数据库的更新而更新,但未经实验证实,也未有详细注释。但未经实验证实,也未有详细注释。 GenPept蛋白质数据库实例蛋白质数据库实例 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌S

    43、. typhimurium H-1-i基因编基因编码的鞭毛蛋白为例进行码的鞭毛蛋白为例进行GenPept数据库检索数据库检索 。GenPept蛋白质数据库实例蛋白质数据库实例LOCUS AAA27072 490 aa linear BCT 26-APR-1993DEFINITION phase-1 flagellar filament protein.ACCESSION AAA27072VERSION AAA27072.1 GI:153979DBSOURCE locus STYFLGH1I accession M11332.1KEYWORDS .SOURCE Salmonella typhim

    44、urium ORGANISM Salmonella typhimurium Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella.REFERENCE 1 (residues 1 to 490) AUTHORS Joys,T.M. TITLE The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison

    45、 with other flagellins JOURNAL J. Biol. Chem. 260 (29), 15758-15761 (1985) PUBMED 2999134COMMENT Draft entry and clean copy sequence for 1 kindly provided by T.M.Joyce, 18-FEB-1986. Individual Salmonella serotypes usually alternate between the production of two antigenic forms of flagella, termed ph

    46、ase-1 and phase-2, each specified by separate structural genes. 序列标识序列标识简单描述简单描述序列编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处评注评注FEATURES Location/Qualifiers source 1.490 /organism=Salmonella typhimurium /db_xref=taxon:602 Protein 1.490 /name=phase-1 flagellar filament protein

    47、 Region 1.490 /region_name=PRK08026 /note=flagellin; PRK08026 /db_xref=CDD:76379 Region 29.163 /region_name=Flagellin_N /note=Bacterial flagellin N-terminus. Flagellins polymerise to form bacterial flagella. This family includes flagellins and hook associated protein 3; pfam00669 /db_xref=CDD:64529

    48、Region 191.256 /region_name=Flagellin_D3 /note=Flagellin D3 domain. This domain is found in the central portion bacterial flagellin FliC. The domain contains a structural motif called a beta-folium fold; pfam08884 /db_xref=CDD:72304特征表特征表 Region 397.468 /region_name=Flagellin_C /db_xref=CDD:64558 CD

    49、S 1.490 /coded_by=M11332.1:13.1485 /transl_table=11ORIGIN 1 maqvintnsl slltqnnlnk sqsalgtaie rlssglrins akddaagqai anrftanikg 61 ltqasrnand gisiaqtteg alneinnnlq rvrelavqsa nstnsqsdld siqaeitqrl 121 neidrvngqt qfsgvkvlaq dntltiqvga ndgetididl kqinsqtlgl dtlnvqqkyk 181 vsdtaatvtg yadttialdn stfkasatg

    50、l ggtdekidgd lkfddttgky yakvtvtggt 241 gkdgyyevsv dktngevtla avtpatvtta talsgkmysa npdsdiakaa ltaagvtgta 301svvkmsytdn ngktidggla vkvgddyysa tqdkdgsisi dttkytadng tsktalnklg 361 gadgktevvt idgktynask aaghdfkaep elaeqaaktt enplqkidaa laqvdtlrsd 421 lgavqnrfns aitnlgntvn nlssarsrie dsdyatevsn msraqilq

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:生物信息学的应用-ppt课件.ppt
    链接地址:https://www.163wenku.com/p-2204510.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库