蛋白质序列分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《蛋白质序列分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 序列 分析 课件
- 资源描述:
-
1、蛋白质序列分析胡松年胡松年 2005 基因表达序列标签基因表达序列标签(EST)数据分析手册)数据分析手册第八第八章章吴祖建等吴祖建等 2011 生物信息学分析实践生物信息学分析实践第五章第五章1最新课件 蛋白质序列结构信息蛋白质序列结构信息 蛋白质序列的基本性质分析 结构域分析及motif搜索 蛋白质二级结构 蛋白质三级结构蛋白质序列分析2最新课件一一、蛋白质序列的基本性质分析、蛋白质序列的基本性质分析 理化性质分析 疏水性分析 跨膜区分析 信号肽预测 Coil区分析 亚细胞定位蛋白质序列分析3最新课件 蛋白质理化性质分析蛋白质理化性质分析 Protparam 工具 http:/www.ex
2、pasy.org/tools/protparam.html计算以下物理化学性质:计算以下物理化学性质:相对分子质量 理论 pI 值 氨基酸组成 原子组成 消光系数 半衰期 不稳定系数 脂肪系数 总平均亲水性蛋白质序列分析4最新课件主要选项主要选项/参数参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列蛋白质序列分析输入输入Swiss-Prot/TrEMBL AC号号打开打开protein.txt,将一条蛋白质序列将一条蛋白质序列粘贴在搜索
3、框中粘贴在搜索框中5最新课件 输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果输出结果 功能域功能域用户自定义区段用户自定义区段蛋白质序列分析6最新课件点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果蛋白质序列分析氨基酸数目氨基酸数目相对分子质量相对分子质量理论理论 pI 值值氨基酸组成氨基酸组成原子组成原子组成分子式分子式总原子数总原子数7最新课件消光系数消光系数半衰期半衰期不稳定系数不稳定系数脂肪系数脂肪系数总平均亲水性总平均亲水性蛋白质序列分析8最新课件 ProtScale工具 http:/ca.ex
4、pasy.org/tools/protscale.html 氨基酸标度 表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异,如疏水性、亲水性等 收集50多个文献中提供的氨基酸标度 默认值为Hphob.Kyte&Doolittle,做疏水性分析蛋白质疏水性分析蛋白质疏水性分析蛋白质序列分析9最新课件20种氨基酸的疏水K-D标度氨基酸K-D标度氨基酸K-D标度Ile (I)4.5Trp(W)-0.9Val(V)4.2Tyr(Y)-1.3Leu(L)3.8Pro(P)-1.6Phe(F)2.8His(H)-3.2Cys(C)2.5Asn(N)-3.5Met(M)1.9Asp(D)-3.5Ala
5、(A)1.8Gln(Q)-3.5Gly(G)-0.4Glu(E)-3.5Thr(T)-0.7Lys(K)-3.9Ser(S)-0.8Arg(R)-4.510最新课件主要选项主要选项/参数参数序列在线提交形式:如果分析SWISS-PORT和TrEMBL数据库中序列 直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列蛋白质序列分析输入输入Swiss-Prot/TrEMBL AC号号氨基酸标度氨基酸标度打开打开protein.txt,将一条蛋白质序列将一条蛋白质序列粘贴在搜索框中粘贴在搜索框中11最新课件计算窗口(计算窗
6、口(7-11)相对权重值相对权重值 权重值变化趋势权重值变化趋势 12最新课件输出结果输出结果 输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段蛋白质序列分析功能域功能域用户自定义区段用户自定义区段13最新课件 点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果 蛋白质序列疏水区域分布预测图蛋白质序列分析图形结果图形结果 文本结果文本结果 序列序列 参数参数 每个位置的得分每个位置的得分14最新课件 跨膜区分析跨膜区分析 膜蛋白不溶于水,分离纯化困难,不容易生长晶体,很难确定其结构 膜蛋白跨膜区可能作为膜受体,也可能是定位在膜上的锚定蛋白或离子通道蛋白 预测跨膜螺旋主要基于已
7、知的跨膜螺旋信息,应用统计模型或神经网络方法 使用单一的预测软件准确性不太高,综合不同的软件预测结果并结合疏水性图,可以获得较好的预测,对于跨膜螺旋和膜向性预测准确率达80%95%蛋白质序列分析15最新课件跨膜区在线分析工具跨膜区在线分析工具蛋白质序列分析名称名称网址网址说明说明TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM/判定是否是膜蛋白Tmpredhttp:/ch.embnet.org/software/TMPRED_form.html预测跨膜片断TMPhttp:/www.mbb.ki.se/tmap/用多序列比对方法预测跨膜区跨膜蛋白数据库跨膜蛋白数据
8、库Tmbase1.来源于来源于Swiss-Prot数据库数据库,提供如跨膜结构区的提供如跨膜结构区的数量、位置及其侧翼序列等信息。数量、位置及其侧翼序列等信息。2.数据库下载地址:数据库下载地址:http:/www.isrec.isb-sib.ch/ftp-server/tmbase16最新课件跨膜区实例分析跨膜区实例分析蛋白质序列分析 使用使用TMHMM server 2.0对水稻瘤矮病毒对水稻瘤矮病毒(RGDV)外层衣壳)外层衣壳 P8蛋白进行跨膜区分析蛋白进行跨膜区分析。TMHMM基于隐马尔可夫模型预测,综合了跨膜基于隐马尔可夫模型预测,综合了跨膜区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑
9、学区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学限制等性质,可对跨膜区及膜内外区进行整体预限制等性质,可对跨膜区及膜内外区进行整体预测。测。TMHMM在区分可溶性蛋白和膜蛋白方面尤为见在区分可溶性蛋白和膜蛋白方面尤为见长,常用于判定一个蛋白是否为膜蛋白。长,常用于判定一个蛋白是否为膜蛋白。17最新课件贴入贴入RGDVp8.txt蛋蛋白质序列白质序列18最新课件1.P8蛋白的蛋白的1405位氨基酸位于细胞膜表面位氨基酸位于细胞膜表面2.406425位氨基酸形成一个典型的跨膜螺旋区位氨基酸形成一个典型的跨膜螺旋区19最新课件信号肽预测信号肽预测 蛋白质合成后要运送到细胞中不同的部位,有的蛋白质要通过内
10、质网膜进入内质网腔内,最终成为分泌蛋白分泌蛋白。分泌蛋白的N端都有一段约1535个氨基酸的疏水性肽段,其功能是引导蛋白质多肽链穿过内质网膜进入腔内,称为信号肽信号肽(signal peptide)。按照氨基酸组成及其位置特征,可将信号肽分为4大类:1.分泌信号肽 2.脂蛋白信号肽3.Pilin-like信号肽4.细菌素和细菌素信号肽蛋白质序列分析20最新课件 信号肽主要由三个domain组成:N-region、H-regin和C-region.N-region为正电荷区域,至少含有一个精氨酸(R)或赖氨酸(K).H-region为疏水核,一般长为1214个氨基酸.C-region包含信号肽酶(
11、SPase)的剪切位点,在剪切位点的-1位和-3位上多为中性的丙氨酸,该区域也称为富含丙氨酸区域.N H C N端 C端蛋白质序列分析21最新课件信号肽预测在线分析工具信号肽预测在线分析工具蛋白质序列分析名称名称网址网址说明说明ChloroPhttp:/www.cbs.dtu.dk/services/ChloroP/预测植物中叶绿体转运肽LipoPhttp:/www.cbs.dtu.dk/services/LipoP/预测革兰氏菌中的信号肽酶I、II的剪切位点NetNEShttp:/www.cbs.dtu.dk/services/NetNES/预测富含亮氨酸的核输出信号SecretomePht
12、tp:/www.cbs.dtu.dk/services/SecretomeP预测真核生物中非经典类型的和无导肽的分泌蛋白SignalPhttp:/www.cbs.dtu.dk/services/SignalP/预测革兰氏阳性菌(G+)、预测革兰氏阴性菌(G-)、真核生物信号肽MITOPROThttp:/ihg.gsf.de/ihg/mitoprot.html预测线粒体、叶绿体信号肽PlasMithttp:/gecco.org.chemie.uni-frankfurt.de/plasmit/线粒体转运肽22最新课件水稻条文病毒水稻条文病毒NSVc2蛋白信号肽预测蛋白信号肽预测蛋白质序列分析 Si
13、gnalP 3.0 Server主页主页 NSVc2序列序列 输出结果输出结果:C score:剪切位点分值剪切位点分值 S score:信号肽分值信号肽分值 Y score:综合剪切位点分值综合剪切位点分值 综合两种算法,综合两种算法,NSVc2含有信号肽序列,为含有信号肽序列,为MHFKSYFIYTTIFNMAWG,说明,说明NSVc2蛋白可蛋白可能在跨膜运输中起信号识别作用能在跨膜运输中起信号识别作用 剪切位点位于第剪切位点位于第1819位氨基酸,表明成熟肽始于位氨基酸,表明成熟肽始于第第18位氨基酸位氨基酸23最新课件Coil区分析区分析 卷曲螺旋卷曲螺旋(coiled coil)是蛋
14、白质中由27条螺旋链缠绕成麻花状结构的总称。卷曲螺旋是控制蛋白质寡聚化的元件,含有卷曲螺旋结构的蛋白质主要是一些转录因子、骨架蛋白、动力蛋白、膜蛋白、酶等,在机体内执行着分子识别、代谢调控、细胞分化、肌肉收缩、膜通道等生物学功能。七肽重复区七肽重复区(heptad repeat,HR)是典型的卷曲螺旋结构类型之一,由多个七肽单元连接而成的重复序列,每个重复序列中的7个氨基酸残基依次用a-b-c-d-e-f-g表示。蛋白质序列分析24最新课件 a、d位多为非极性疏水氨基酸,位于卷曲螺旋结构的内侧;e、g多为极性带电氨基酸,与a、d位残基相互作用形成疏水核心的外侧。a、d、e、g位置上的氨基酸对于
15、整个卷曲螺旋结构的稳定性及特异性具有重要作用。COILS Server:http:/www.ch.embnet.org/software/COILS_form.html 根据卷曲螺旋蛋白结构数据库和包含球状蛋白序列的PDB次级数据库,可计算出目的序列形成卷曲螺旋的概率。使用COILS Server对RGDV P2蛋白卷曲螺旋预测分析。蛋白质序列分析25最新课件 已有文献研究表明,RDV的P2蛋白含有一个 N 端的疏水肽、两个七肽重复区和一个跨膜区。RGDV P2蛋白与RDV P2蛋白在病毒粒体中位置相同、大小相似,具有高度保守的氨基酸序列和相似的一级结构,表明两者可能具有相似的结构。使用COI
16、LS Server分析RGDV P2是否由七肽重复区。COILS Server网页 MTK:根据肌球蛋白、原肌球蛋白和角蛋白得到的打分矩阵 MTIDK:由肌球蛋白、原肌球蛋白、中间纤维类蛋白、桥立蛋白和角蛋白得到的打分矩阵蛋白质序列分析26最新课件COILS_20424_6595.txt27最新课件亚细胞定位亚细胞定位亚细胞定位与蛋白质的功能存在着密切的联系通过氨基酸组成进行亚细胞定位主要基于如下原理:1.不同的细胞器多具不同的理化环境,根据蛋白质的结构及表面理化特征选择性容纳蛋白2.蛋白质表面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于氨基酸组成蛋白质序列分析28最新课件亚细胞
17、定位预测步骤:抽取一个高质量的亚细胞定位数据集并分为训练集和测试集从选取的蛋白质数据中抽取出特征信息选择合适的算法预测用测试数据集对预测结果进行评价蛋白质序列分析29最新课件常用的亚细胞定位在线工具常用的亚细胞定位在线工具蛋白质序列分析名称名称网址网址TargetPhttp:/www.cbs.dtu.dk/services/TargetP/PSORT IIhttp:/psort.nibb.ac.jpSubLochttp:/ NSVc2蛋白进行亚细胞定位TargetP是预测真核蛋白亚细胞定位软件,主要基于叶绿体转运肽(chloroplast transit peptide,cTP)、线粒体导肽(
18、mitochondrial targeting peptide,mTP)及分泌通路信号肽(secretory pathway signal peptide,SP)的N端序列进行预测预测结果:蛋白NSvc2的分泌途径为“-”型,即定位到其他细胞器。蛋白质序列分析31最新课件二、蛋白质结构域及二、蛋白质结构域及motif搜索搜索 结构域分析 Motif搜索蛋白质序列分析32最新课件结构域分析结构域分析 结构域结构域(structure domain)是在蛋白质三级结构中介于二级和三级结构之间的可以明显区分但又相对独立的折叠单元,每个结构域自身形成紧实的三维结构,可以独立存在或折叠,但结构域与结构域
19、之间关系较为松散。结构域通常由25300个氨基酸组成,不同蛋白质结构域数目或同一蛋白质结构域相似度差异较大蛋白质序列分析33最新课件 常见的结构域主要有5种:全平行结构域 反平行结构域+结构域/结构域其他折叠类型 结构域是蛋白质的功能、结构和进化单元,结构域分析对于蛋白质结构的分类和预测有着重要作用。蛋白质序列分析34最新课件结构域分析工具及数据库结构域分析工具及数据库蛋白质序列分析工具工具网址网址说明说明InterProScan http:/www.ebi.ac.uk/InterProScan/蛋白质结构域和功能位点分析SMARThttp:/smart.embl-heidelberg.de/
展开阅读全文