(精编)生物信息学经典教程课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(精编)生物信息学经典教程课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精编 生物 信息学 经典 教程 课件
- 资源描述:
-
1、实习一实习一基因组数据注释和功能分基因组数据注释和功能分析析越努力越幸运课程内容课程内容基因组学基因组学转录物组学转录物组学蛋白质组学蛋白质组学系统生物学系统生物学越努力越幸运1.通过序列比对工具通过序列比对工具BLAST学习,了解学习,了解蛋白编码基因的功能注释原理蛋白编码基因的功能注释原理2.介绍多序列联配工具介绍多序列联配工具ClustalX3.分子进化分析软件分子进化分析软件MEGA4的基本知的基本知识,掌握系统发生树绘制的基本方法识,掌握系统发生树绘制的基本方法越努力越幸运序列比对的进化基础序列比对的进化基础什么是序列比对:什么是序列比对:将两个或多个序列按照最佳匹配方式排列在一起。
2、对应的相同或相似的符号排列在同一列上。错配与突变相应,空位与插入或缺失对应。序列比对的目的:序列比对的目的:从核酸以及氨基酸的层次去分析序列的相同点和不同点,以推测他们的结构、功能以及进化上的联系通过判断两个序列之间的相似性来判定两者是否具有同源性 相似性:可以被数量化,如:序列之间相似部分的百分比 同源性:质的判断,两个基因在进化上是否曾有共同祖先的推断越努力越幸运BLAST 基本局部比对搜索工具基本局部比对搜索工具(Basic Local Alignment Search Tool)NCBI上上BLAST服务的网址服务的网址:http:/www.ncbi.nlm.nih.gov/blast
3、/NCBI上上blast程序的下载:程序的下载:ftp.ncbi.nlm.nih.gov/blast/executables/release/NCBI的的BLAST数据库下载网址:数据库下载网址:ftp:/ftp.ncbi.nlm.nih.gov/blast/越努力越幸运选择物种选择物种选择选择blast程序程序越努力越幸运QuerySequenceAminoacidSequenceDNASequencetBLASTxBLASTxBLASTntBLASTnBLASTpNucleotideDatabaseProteinDatabaseNucleotideDatabaseNucleotideDat
4、abaseProteinDatabaseTranslatedTranslatedTranslated越努力越幸运越努力越幸运以以Blastx为例:为例:目标序列为目标序列为ATG AGT ACC GCT AAA TTA GTT AAA TCA AAA GCG ACC AAT CTG CTT TAT ACC CGC6个读码框翻译5端到端到3端端第一位起始:第一位起始:ATG AGT ACC GCT AAA TTA GTT AAA TCA AAA GCG ACC AAT CTG CTT TAT ACC CGC第二位起始:第二位起始:TGA GTA CCG CTA AAT TAG TTA AAT C
5、AA AAG CGA CCA ATC TGC TTT ATA CCC GC第三位起始:第三位起始:GAG TAC CGC TAA ATT AGT TAA ATC AAA AGC GAC CAA TCT GCT TTA TAC CCG C3端到端到5端端第一位起始:第一位起始:GCG GGT ATA AAG CAG ATT GGT CGC TTT TGA TTT AAC TAA TTT AGC GGT ACT CAT第二位起始:第二位起始:CGG GTA TAA AGC AGA TTG GTC GCT TTT GAT TTA ACT AAT TTA GCG GTA CTC AT第三位起始:第三位
6、起始:GGG TAT AAA GCA GAT TGG TCG CTT TTG ATT TAA CTA ATT TAG CGG TAC TCA T越努力越幸运越努力越幸运与核酸相关的数据库与核酸相关的数据库与蛋白质相关的数据库与蛋白质相关的数据库越努力越幸运选择数据库选择数据库序列或目标序列的序列或目标序列的GI号号以文件格式上传以文件格式上传BlastN越努力越幸运配对与错配配对与错配空位罚分空位罚分越努力越幸运BlastP越努力越幸运打分矩阵:打分矩阵:PAM30PAM30PAM70PAM70BLOSUM80BLOSUM80BLOSUM62BLOSUM62BLOSUM45BLOSUM45PA
7、M模型可用于寻找蛋白质的进化起模型可用于寻找蛋白质的进化起源,而源,而BLOSUM模型则用于发现蛋模型则用于发现蛋白质的保守域。白质的保守域。越努力越幸运选择打分矩阵(选择打分矩阵(scoring matrix)The PAM familyBased on global alignmentsThe PAM1 is the matrix calculated from comparisons of sequences with no more than 1%divergence.Other PAM matrices are extrapolated from PAM1.The BLOSUM fa
8、milyBased on local alignments.BLOSUM62 is a matrix calculated from comparison s of sequences with no less than 62%divergence.All BLOSUM matrices are based on observed alignments;they are not extrapolated from comparisons of closely related proteins.越努力越幸运进行比对的数据库进行比对的数据库图形化结果图形化结果越努力越幸运E值(值(E-value)
9、表示仅仅因为随机性造成获得这一)表示仅仅因为随机性造成获得这一 比对结果的可能性。这一数值越比对结果的可能性。这一数值越接近零,发生这一事件的可能性越小。接近零,发生这一事件的可能性越小。越努力越幸运越努力越幸运上机实习上机实习1:网上运行:网上运行blastx和和blastn(NCBIblastNCBIblast网址:网址:http:/www.ncbi.nlm.nih.gov/BLAST/)lesson.seq.screen.Contig34lesson.seq.screen.Contig34 TTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTC
10、TGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGTTTTTTTTTTTTTTTTTAGTGCCAGTTTTTTTTTTTATTTGTAAAGCTCTGCCATAAACTTCTAGCGTGTGCCAATGGTCACCTGCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTCCACACTCGCACCAGGTTGTCCGTGTAGCCAGCAAACAGAGTCTGGCCATCAGCAGACCAGGCCAGGGAGGTGCACTGGGGTGGTTCTGCCTTG
11、CTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGTCTGCCTTGCTGCTGGTACTGATAACTTCTTGCTTCAGTTCATCTACAATGATCTTTCCCTCTAAATCCCAGATCTTGATGCTGGGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGATGATGTCCCCACCATCTAGCGTGTAAAGGTGTGGCCTGTGGAGCACACAGCCAGTAGCGGTTAGGGCTGAAGCACAGGGCGTTGAT
12、GATGTCCCCACCATCTAGCGTGTAAAGGTGTTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTTGCCTTCGTTGAGATCCCATAACATGGCCTGGCCATCCTTGCCTCCAGAAGCACAGAGGGATCCATCTGGAGAGACAGTCACCGTGTTCAGATAGCCTGTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCTGTTCAGATAGCCT
13、GTGTGGCCAATGTGGTTGGTCTTCAGCTTGCAGTTAGCCAGGTTCCATACCTTGACCAGCTTGTCCCAGCCACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGACAGGAGACGATGATAGGGTTGCTGCTGTTGGGCGAGAAGCGGACACAAGACACCCACTCTGAGTGGCTCTCATCCTGGACAGTGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGAC
14、AATCTGCCGGTTGTCAGAGGAGAAGGTATTTGCACACACCCAGGGTATTCCATAGCTTGATGGTTTTATCTCGAGATCCAGAGACAATCTGCCGGTTGTCAGAGGAGAAGGCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCACACTCAGCACATCCTTGGTATGGCCCACAAATCGCCTCGTGGTGGTGCCCGTTGTGAGATCCCAGAAGGCGCAGGGTTCCATCCCAGGAGCCTGAGAGGGC
15、AAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGCCCAGGAGCCTGAGAGGGCAAACTGGCCATCTGAGGAGATAACCACATCACTAACAAAGTGGGAGTGACCCCGCAGAGCACGCTGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAGGCGGAGAGGATCATGTCCGGGTGGAATTCCATAGTTGGTCTCATCCCTGGTCAGTTTCCACATGATGATGGTCTTATCTCGAGAG
16、GCGGAGAGGATCATGTCCGGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGAACTGCGGGGTAGTAGCGATCTGGGTTACCCAGCCGTTGTGGCCCTTGAGGGTGCCACGAAGGGTCATCTGCTCAGTCATGGCGGCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGCACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACCCGGCGAGAGCGTGTTCGCTGCAGCGACGAGGATGGC
17、ACTGGATGGCTTAGAGAAACTAGCACCACAGTCGACC1.1.对对contig34contig34进行网上进行网上blastnblastn(演示),(演示),2.2.blastxblastx(自行操作)比对(自行操作)比对*由于时间关系,请参见预存结果。由于时间关系,请参见预存结果。越努力越幸运本地运行本地运行BLASTBLAST 下载下载NCBI上上blast程序:程序:ftp.ncbi.nlm.nih.gov/blast/executables/release/安装(安装到安装(安装到C:C:)数据库的格式化(数据库的格式化(formatdbformatdb)程序运行(
展开阅读全文