生物信息学的应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物信息学的应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 应用 课件
- 资源描述:
-
1、生物分子生物分子数数 据据 计算机计算机计计 算算+生物体系和过程中信息生物体系和过程中信息的存贮、传递和表达的存贮、传递和表达细胞、组织、器官的生理、病理细胞、组织、器官的生理、病理药理过程的中各种生物信息药理过程的中各种生物信息信息科学信息科学生生命命科科学学中中的的信信息息科科 学学 生物生物分子数据分子数据深层次深层次生物学知识生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics挖掘挖掘获取获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数
2、据库 DDBJEMBLGenBankSWISS-PROT PDBPIR基因芯片基因芯片蛋白质折叠蛋白质折叠是否未知蛋白序列与已知功能的蛋白质相似是否未知蛋白序列与已知功能的蛋白质相似确定跨膜螺旋、卷曲螺旋和前导序列确定跨膜螺旋、卷曲螺旋和前导序列未知序列是否包含保守序列模体未知序列是否包含保守序列模体查对查对PROSITE数据库库数据库库查对查对BLOCKS和和PRINTS数据库数据库整理所有肯定的结果并核对一致性整理所有肯定的结果并核对一致性预测蛋白质功能预测蛋白质功能蛋白质功能预测流程图蛋白质功能预测流程图(引自引自HPDB蛋白质数据库()蛋白质数据库()图图6-2 生物信息学数据库相互关
3、系生物信息学数据库相互关系 n 生物信息学数据库相互关系生物信息学数据库相互关系n常用数据库常用数据库uGenbank数据直接来源数据直接来源 测序工作者提交的序列、测序中心提交的测序工作者提交的序列、测序中心提交的大量大量EST序列、其它测序数据以及与其它数据机序列、其它测序数据以及与其它数据机构协作交换的数据。构协作交换的数据。uGenbank内容内容 所有已知的核酸序列和蛋白质序列,还包所有已知的核酸序列和蛋白质序列,还包括对序列的简要描述、科学命名、物种分类名称、括对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表等辅助信息。参考文献、序列特征表等辅助信息。uGenbank
4、对数据记录的处理对数据记录的处理 划分为划分为 细菌类、病毒类、灵长类、啮齿类,细菌类、病毒类、灵长类、啮齿类,EST数据、基因组测序数据、大规模基因组序列数据、基因组测序数据、大规模基因组序列数据等数据等16类。类。图图6-4 NCBI-Entrz gene检索界面检索界面图图6-5 NCBI-Entrez cross-database检索界面检索界面Entrez Entrez,The Life Sciences Search Engine BLAST(Basic Local Alignment search Tool)是是 DNA DNA 或氨基酸序列比对分析的重要软件或氨基酸序列比对分析
5、的重要软件 TaxBrowser:Taxonomy browser 分类浏览器Structure:该目录下最重要的资源是分子模型数据库 MMDB 及 Cn3D 生物大分子三维模型查看软件 uEMBL和和GenBank数据库识别标志数据库识别标志uGenBank核酸数据库实例核酸数据库实例 以人畜共患的病源菌鼠伤寒沙门氏菌(以人畜共患的病源菌鼠伤寒沙门氏菌(Salmonella typhimurium)H1相抗原基因相抗原基因H-1-i为例,简要说明为例,简要说明GenBank核核酸数据库的数据格式。酸数据库的数据格式。LOCUS STYFLGH1I 1485 bp DNA linear BCT
6、 26-APR-1993DEFINITION Salmonella typhimurium H-1-i gene encoding phase 1 flagellar filament protein(flagellin),complete cds.ACCESSION M11332VERSION M11332.1 GI:153978KEYWORDS flagellin.SOURCE Salmonella typhimurium ORGANISM Salmonella typhimurium Bacteria;Proteobacteria;Gammaproteobacteria;Enteroba
7、cteriales;Enterobacteriaceae;Salmonella.REFERENCE 1 (bases 1 to 1485)AUTHORS Joys,T.M.TITLE The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison with other flagellins JOURNAL J.Biol.Chem.260(29),15758-15761(1985)PUBMED 2999134序列标识序列标识简单描述简单描述序
8、列编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处COMMENT Original source text:S.typhimurium SL877 DNA.Draft entry and clean copy sequence for 1 kindly provided by T.M.Joyce,18-FEB-1986.Individual Salmonella serotypes usually alternate between the production of two antigenic forms o
9、f flagella,termed phase-1 and phase-2,each specified by separate structural genes.Both ends of the flagellin gene act in the regulation of flagellin synthesis.FEATURES Location/Qualifiers source 1.1485 /organism=Salmonella typhimurium /mol_type=genomic DNA /db_xref=taxon:602 CDS 13.1485 /note=phase-
10、1 flagellar filament protein /codon_start=1 /transl_table=11 /protein_id=AAA27072.1 /db_xref=GI:153979评注评注特征表特征表编码区编码区 /translation=MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVNGQTQFSGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTL
11、GLDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDEKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAAVTPATVTTATALSGKMYSANPDSDIAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLAVKVGDDYYSATQDKDGSISIDTTKYTADNGTSKTALNKLGGADGKTEVVTIDGKTYNASKAAGHDFKAEPELAEQAAKTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLSSARSRIEDSDYATEVSNMSRAQILQ
12、QAGTSVLAQANQVPQNVLSLLRORIGIN 98 bp upstream of TaqI site.1 aaggaaaaga tcatggcaca agtcattaat acaaacagcc tgtcgctgtt gacccagaat 61 aacctgaaca aatcccagtc cgctctgggc accgctatcg agcgtctgtc ttccggtctg 121 cgtatcaaca gcgcgaaaga cgatgcggca ggtcaggcga ttgctaaccg ttttaccgcg 181 aacatcaaag gtctgactca ggcttcccgt
13、 aacgctaacg acggtatctc cattgcgcag 241 accactgaag gcgcgctgaa cgaaatcaac aacaacctgc agcgtgtgcg tgaactggcg 301 gttcagtctg ctaacagcac caactcccag tctgacctcg actccatcca ggctgaaatc蛋白序列蛋白序列基因序列基因序列361 acccagcgtc tgaacgaaat cgaccgtgta aatggccaga ctcagttcag cggcgtgaaa421 gtcctggcgc aggacaacac cctgaccatc caggt
14、tggtg ccaacgacgg tgaaactatc481 gatatcgatc tgaagcagat caactctcag accctgggtc tggatacgct gaatgtgcaa541 caaaaatata aggtcagcga tacggctgca actgttacag gatatgccga tactacgatt601 gctttagaca atagtacttt taaagcctcg gctactggtc ttggtggtac tgacgagaaa661 attgatggcg atttaaaatt tgatgatacg actggaaaat attacgccaa agttacc
15、gtt721 acggggggaa ctggtaaaga tggctattat gaagtttccg ttgataagac gaacggtgag781 gtgactcttg ctgcggtcac tcccgctaca gtgactactg cgacagcact gagtggaaaa841 atgtacagtg caaatcctga ttctgacata gctaaagccg cattgacagc agcaggtgtt901 accggcacag catctgttgt taagatgtct tatactgata ataacggtaa aactattgat961 ggtggtttag cagtta
16、aggt aggcgatgat tactattctg caactcaaga taaagatggt1021 tccataagta ttgatactac gaaatacact gcagataacg gtacatccaa aactgcacta1081 aacaaactgg gtggcgcaga cggcaaaacc gaagtcgtta ctatcgacgg taaaacctac1141 aatgccagca aagccgctgg tcatgatttc aaagcagaac cagagctggc ggaacaagcc1201 gctaaaacca ccgaaaaccc gctgcagaaa attg
17、atgctg ctttggcaca ggttgacacg1261 ttacgttctg acctgggtgc ggtacagaac cgtttcaact ccgctattac caacctgggc1321 aacaccgtaa acaacctgtc ttctgcccgt agccgtatcg aagattccga ctacgcgacc1381 gaagtctcca acatgtctcg cgcgcagatt ctgcagcagg ccggtacctc cgttctggcg1441 caggcgaacc aggttccgca aaacgtcctc tctttactgc gttaa/记录结束记录结
18、束图图6-6 Swiss-Prot数据库网站主页数据库网站主页表表6-3 SWISS-PORT 数据库的行识别标志及含义数据库的行识别标志及含义 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌Salmonella typhimurium H1-i基因编码的鞭毛蛋白基因编码的鞭毛蛋白FLIC_SALTY为例介绍为例介绍SWISS-PORT数数据库的数据格式。据库的数据格式。ID FLIC_SALTY Reviewed;495 AA.AC P06179;P97160;Q02871;Q56088;DT 01-JAN-1988,integrated into UniProtKB/Swiss-Prot.DT 23-J
19、AN-2007,sequence version 4.DT 24-JUL-2007,entry version 69.DE Flagellin(Phase 1-I flagellin).GN Name=fliC;Synonyms=flaF,hag;OrderedLocusNames=STM1959;OS Salmonella typhimurium.OC Bacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.OX NCBI_TaxID=602;RN 1RP NUCL
20、EOTIDE SEQUENCE GENOMIC DNA.RX MEDLINE=86059460;PubMed=2999134;RA Joys T.M.;RT The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison with other flagellins.;RL J.Biol.Chem.260:15758-15761(1985).序列标识序列标识 序列序列编号编号登录日期登录日期描述描述基因名称基因名称来源物种来源物种物种分类物种
21、分类物种分类号物种分类号引文序号引文序号引文位置引文位置交叉引用交叉引用引文作者引文作者引文标题引文标题引文出处引文出处 SWISS-PROT 数据库条目实例数据库条目实例RN 9RP NUCLEOTIDE SEQUENCE GENOMIC DNA OF 476-495.RC STRAIN=LT2/ATCC 23564;CC -!-FUNCTION:Flagellin is the subunit protein which polymerizes to form the filaments of bacterial flagella.CC -!-MISCELLANEOUS:Individua
22、l Salmonella serotypes usually alternate between the production of 2 antigenic forms of flagella,termed phase 1 and phase 2,each specified by separate structural genes,fliC and fljB.CC -!-SIMILARITY:Belongs to the bacterial flagellin family.CC -DR EMBL;M11332;AAA27072.1;-;Genomic_DNA.DR EMBL;D13689;
23、BAA02846.1;-;Genomic_DNA.DR EMBL;AE008787;AAL20871.1;-;Genomic_DNA.DR EMBL;X51740;CAA36029.1;-;Genomic_DNA.DR EMBL;J01801;AAA27074.1;-;Genomic_DNA.DR PIR;A24262;A24262.DR PIR;S16121;S16121.DR PDB;1IO1;X-ray;A=54-451.DR PDB;1P95;Model;A=57-451.DR PDB;1UCU;EM;A=1-495.相关内容相关内容评注功能评注功能 其他特性其他特性 相似性相似性交叉
24、引用数据库交叉引用数据库 EMBL核酸序列核酸序列数据库数据库 PIR蛋白序列蛋白序列数据库数据库 PDB蛋白结构蛋白结构数据库数据库PE 1:Evidence at protein level;KW 3D-structure;Complete proteome;Flagellum.FT INIT_MET 1 1 Removed(By similarity).FT CHAIN 2 495 Flagellin.FT /FTId=PRO_0000182578.FT CONFLICT 127 127 S-N(in Ref.1).FT CONFLICT 133 133 N-S(in Ref.1).FT
25、 HELIX 3 32FT TURN 37 39FT HELIX 44 98关键词关键词特征表特征表不同来源不同来源数据库的数据库的冲突位点冲突位点二级结构二级结构信息信息SQ SEQUENCE 495 AA;51612 MW;4BD7849FA3B936BA CRC64;MAQVINTNSL SLLTQNNLNK SQSALGTAIE RLSSGLRINS AKDDAAGQAIANRFTANIKG LTQASRNAND GISIAQTTEG ALNEINNNLQ RVRELAVQSA NSTNSQSDLD SIQAEITQRL NEIDRVSGQT QFNGVKVLAQ DNTLTIQVGA
展开阅读全文