实习4蛋白质结构与功能预测共74张课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《实习4蛋白质结构与功能预测共74张课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实习 蛋白质 结构 功能 预测 74 课件
- 资源描述:
-
1、 浙江加州国际纳米技术研究院(浙江加州国际纳米技术研究院(ZCNI)陈晓龙陈晓龙 何何 源源 蒋蒋 琰琰实习一实习一基因组数据注释和功能分析基因组数据注释和功能分析实习二实习二核苷酸序列分析核苷酸序列分析实习三实习三芯片的基本数据处理和分析芯片的基本数据处理和分析实习四实习四蛋白质结构与功能分析蛋白质结构与功能分析实习五实习五蛋白质组学数据分析蛋白质组学数据分析实习六实习六系统生物学软件实习系统生物学软件实习实习课程内容实习课程内容基因组学基因组学转录组学转录组学蛋白质组学蛋白质组学系统生物学系统生物学DNA sequenceProtein sequenceProtein structureP
2、rotein function蛋白质序列分析蛋白质序列分析蛋白质一级序列蛋白质一级序列蛋白质基本理化性质分析蛋白质基本理化性质分析蛋白质亲疏水性分析蛋白质亲疏水性分析跨膜区结构预测跨膜区结构预测翻译后修饰位点预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构蛋白质二级结构预测蛋白质二级结构预测蛋白质序列信号位点分析蛋白质序列信号位点分析蛋白质超二级结构蛋白质超二级结构蛋白质结构域分析蛋白质结构域分析蛋白质三级结构蛋白质三级结构蛋白质三维结构模拟蛋白质三维结构模拟蛋白质序列分析主要内容蛋白质序列分析主要内容ORF翻译蛋白质理化性质和一级结构数据库搜索结构域匹配已知结构的同源蛋白?三维结构模型可用
3、的折叠模型?同源建模有二级结构预测无串线法有从头预测无ExPASy(Expert Protein Analysis System)Tools(expasy.org/tools/)一、蛋白质理化性质分析 使用工具:Protparam 二、跨膜区分析 使用工具:TMpred 三、二级结构分析 使用工具:PredictProtein 四、结构域分析 使用工具:InterProScan 五、蛋白质三级结构分析 使用工具:SWISS-MODEL/SWISS-PdbViewer数据:C:ZCNIshixi4protein.txt 课程安排课程安排一、蛋白质基本理化性质分析一、蛋白质基本理化性质分析 蛋白质
4、理化性质是蛋白质研究的基础蛋白质的基本性质:相对分子质量 氨基酸组成等电点(pI)消光系数半衰期 不稳定系数总平均亲水性 实验方法:相对分子质量的测定、等电点实验、沉降实验 缺点:费时、耗资基于实验经验值的计算机分析方法工具工具网站网站备注备注AACompldentexpasy.org/tools/aacomp/利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白Compute pI/Mwexpasy.org/tools/pi_tool.html计算蛋白质序列的等电点和分子量ProtParamexpasy.org/tools/protparam.html对氨基酸序列多个物理和化学参数(分子量、
5、等电点、吸光系数等)进行计算PeptideMassexpasy.org/tools/peptide-mass.html计算相应肽段的pI和分子量SAPSisrec.isb-sib.ch/software/SAPS_form.html利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白质理化性质分析工具蛋白质理化性质分析工具ProtParam工具工具基于蛋白质序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析:Protparam 工具 expasy.org/tools/protparam.html计算以下物理化学性质:计算以下物理化学性
6、质:相对分子质量 氨基酸组成等电点(PI)消光系数半衰期 不稳定系数总平均亲水性 主要选项主要选项/参数参数 如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot/TrEMBL AC号号打开打开protein.txt,将蛋白质序列将蛋白质序列粘贴在搜索框中粘贴在搜索框中返回结果返回结果氨基酸数目氨基酸数目相对分子质量相对分子质量理论理论 pI 值值氨基酸组成氨基酸组成正正/负电荷残基数负电荷残基数消光系数消光系数半衰期半衰期原子组成原
7、子组成分子式分子式总原子数总原子数proteins in water measured at 280 nm:Ext(Tyr)=1490,Ext(Trp)=5500,Ext(Cystine)=125不稳定系数不稳定系数脂肪系数脂肪系数总平均亲水性总平均亲水性40 unstable练习一:练习一:ProtParamexpasy.org/tools/protparam.html数据:C:ZCNIshixi4protein.txt(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane prot
8、eins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins二、蛋白质跨膜区分析二、蛋白质跨膜区分析 典型的跨膜螺旋区主要是由2030个氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成;亲水残基往往出现在疏水残基之间,对功能有重要的作用;基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。蛋白质跨膜区特性蛋白质跨膜区特性跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 胞外末端胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外胞外-内分界区内分界区:Trp(色氨
9、酸)跨膜区跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞内胞内-外分界区外分界区:Tyr(络氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端胞内末端:Lys(赖氨酸)和Arg(精氨酸)常用蛋白质跨膜区域分析工具常用蛋白质跨膜区域分析工具工具工具网站网站备注备注DASsbc.su.se/miklos/DAS/用Dense Alignment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPenzim.hu/hmmtop/由E
10、nzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUIbp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPbioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMcbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具TMpredch.embnet.org/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredbioweb.pasteur.fr/seqanal/
11、interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序TMpred TMpred工具工具:ch.embnet.org/software/TMPRED_form.html 依靠跨膜蛋白数据库TMbase 预测跨膜区和跨膜方向主要参数主要参数/选项选项 序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列输出结果输出结果 包含四个部分
12、 可能的跨膜螺旋区 相关性列表可能的跨膜螺旋区可能的跨膜螺旋区位置位置分值分值 片段中点位置片段中点位置相关性列表相关性列表 跨膜拓扑模型及图示跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型最优拓最优拓扑结构扑结构每一位置计算分值每一位置计算分值cbs.dtu.dk/services/TMHMM-2.0/TMHMM练习二:练习二:TMpredch.embnet.org/software/TMPRED_form.html数据:C:ZCNIshixi4protein.txt三、蛋白质二级结构预测三、蛋白质二级结构预测 基本的二级结构 螺旋,折叠,转角,无规则卷曲(coils)以及模序(mo
13、tif)等蛋白质局部结构组件 分析方法:基于统计和机器学习方法进行预测Chou-Fasman算法多序列列线预测基于神经网络的序列预测基于已有知识的预测方法(knowledge based method)混合方法(hybrid system method)工具工具网站网站备注备注BCM SearchLauncher searchlauncher.bcm.tmc.edu/包括了常见的蛋白质结构分析程序入口,一般分析可以以此服务器作为起点HNNn p s a-p b i l.i b c p.f r/c g i-bin/npsa_automat.pl?page=npsa_nn.html基于神经网络的分
14、析工具,含序列到结构过程和结构到结构处理Jpredc o m p b i o.d u n d e e.a c.u k/w w w-jpred/submit.html基于Jnet神经网络的分析程序,并采用PSI-BLAST来构建序列Profile进行预测,对于序列较短、结构单一的蛋白预测较好nnPredictalexanderpbio.ucsf.edu/nomi/nnpredict.html预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋NNSSPbioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于双层前反馈神经网络为算法,还考虑到蛋白质
15、结构分类信息PREDATORbioweb.pasteur.fr/seqanal/interfaces/predator-simple.html预测时考虑了氨基酸残基间的氢键蛋白质二级结构分析工具蛋白质二级结构分析工具工具工具网站网站备注备注PredictProteinpredictprotein.org/提供多项蛋白质性质分析,并有较好准确性Profaber.ac.uk/phiwww/prof/基于多重序列比对预测工具PSIpredbioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓扑结构预测和蛋白profile折叠结构识别工具SOPMAn p s a
16、-p b i l.i b c p.f r/c g i-bin/npsa_automat.pl?page=npsa_sopma.html可以比较各种分析方法得到的结果,也可输出“一致性结果”SSPREDcoot.embl.de/fmilpetz/SSPRED/sspred.html基于数据库搜索相似蛋白并构建多重序列比对蛋白质二级结构分析工具(续)蛋白质二级结构分析工具(续)PredictProtein工具工具 PredictProtein predictprotein.org/可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息。该方法的平均准确率超过72%,最佳残基
17、预测准确率达90%以上。因此,被视为。PredictProtein提交界面提交界面可展开可展开选项选项32PredictProtein提交界面详解提交界面详解跨膜螺旋预测(跨膜螺旋预测(PHDhtm)高级选项)高级选项分析方法分析方法可变序列识别(可变序列识别(ASP)高级选项)高级选项CHOP结构域分析工具高级选项结构域分析工具高级选项1D序列预测PROFsec(默认)基于轮廓(profile)的神经网络算法预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDhtm(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构
18、型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性来预测蛋白质结构域CHOP预测蛋白质结构域结构表面识别ConSeq预测蛋白质表面结构功能关键区域分析方法程序详解分析方法程序详解服务器运行程序信息服务器运行程序信息
19、ProSite模体搜索结果模体搜索结果低复杂区域过滤程序低复杂区域过滤程序ProDom结构域搜索结果结构域搜索结果二硫键识别结果二硫键识别结果PHD程序信息程序信息PHD预测结果预测结果PROF预测结果预测结果球状蛋白预测结果球状蛋白预测结果Ambivalent序列识别结果序列识别结果PredictProtein分析结果分析结果ProSite模体搜索结果模体搜索结果PROSITE中的中的ID号号简单描述简单描述Motif模式模式提交序列中出现该提交序列中出现该Motif的位置的位置PredictProtein分析结果分析结果SEG低复杂区域过滤二硫键识别程序PredictProtein分析结果
20、分析结果跨膜区跨膜区非跨膜区非跨膜区跨膜区预测LoopHelixSheet二级结构四、结构域分析四、结构域分析 结构域是蛋白序列的功能、结构和进化单元 分析方法 序列比对 单条蛋白质序列可以包含一个或多个结构域基本类型:折叠折叠/折叠+折叠工具工具网站网站备注备注CDDncbi.nlm.nih.gov/sites/entrez?db=cdd通过比较目标序列和一组位置特异性打分矩阵进行RPS-BLAST来确定目标序列中的保守结构域HAMAPexpasy.org/sprot/hamap/families.html通过专家预测系统产生的微生物家族同源蛋白数据InterProPfampfam.sang
21、er.ac.uk/每个蛋白家族包含了多序列比对、profile-HMMs和注释文件ProDomprodom.prabi.fr/从SWISS-PROT/TrEMBL数据库中的非片段蛋白序列数据构成,每条记录包含一个同源结构域多重比对和家族保守一致性序列SMARTsmart.embl-heidelberg.de/由EMBL建立,集成了大部分已知蛋白功能域数据,注释包括了功能类型、三维结构、分类信息蛋白质结构域数据库蛋白质结构域数据库工具工具网站网站备注备注TIGRFAMstigr.org/TIGRFAMs/由TIGR实验室维护的蛋白质家族和结构域数据库PRINTSumber.sbs.man.ac.
展开阅读全文