生物信息学概论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物信息学概论课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 概论 课件
- 资源描述:
-
1、2023-2-71生物信息学生物信息学Bioinformatics2023-2-72理论课讲授内容理论课讲授内容第一讲第一讲 生物信息学概论生物信息学概论第二讲第二讲 医学信息学基础及信息学基本技术医学信息学基础及信息学基本技术第三讲第三讲 生物信息中心、核酸和蛋白质序列生物信息中心、核酸和蛋白质序列 资源资源第四讲第四讲 生物信息重要数据库生物信息重要数据库2023-2-73第五讲第五讲 序列比对序列比对第六讲第六讲 生物医学文献及生物医学文献及PCR第七讲第七讲 序列特征分析序列特征分析第八讲第八讲 生物信息学与基因芯片生物信息学与基因芯片2023-2-74生物生物信息信息学概论学概论20
2、23-2-75内容内容生物信息学概况生物信息学概况生物信息学简介生物信息学简介 生物信息学、生物学基础生物信息学、生物学基础 历史、内容、任务、技术和方法历史、内容、任务、技术和方法 发展趋势及研究热点发展趋势及研究热点 生物信息学简介生物信息学简介2023-2-77三大自然科学之谜三大自然科学之谜 宇宙的起源宇宙的起源 生命的诞生生命的诞生 思维的奥秘思维的奥秘2023-2-782023-2-79What is bioinformatics?from http:/en.wikipedia.org/wiki/Bioinformatics Bioinformatics and computati
3、onal biology involve the use of techniques including applied mathematics,informatics,statistics,computer science,artificial intelligence,chemistry,and biochemistry to solve biological problems usually on the molecular level.Research in computational biology often overlaps with systems biology.Major
4、research efforts in the field include sequence alignment,gene finding,genome assembly,protein structure alignment,protein structure prediction,prediction of gene expression and protein-protein interactions,and the modeling of evolution.2023-2-710生物生物信息信息学学 说文解字:生物说文解字:生物+信息信息+学学(bioinformatics)biolo
5、gy +information+theory 广义广义 应用信息科学的方法和技术,研究生物体系应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也理、病理、药理过程中的各种生物信息,或者也可以说成是可以说成是生命科学生命科学中的中的信息科学信息科学。狭义狭义 应用应用信息科学信息科学的理论、方法和技术,管理、的理论、方法和技术,管理、分析和利用分析和利用生物分子生物分子数据。数据。2023-2-711
6、生物学家生物学家(生物学问题生物学问题)数学物理学家数学物理学家计算机科学家计算机科学家(基础理论问题基础理论问题)工程师工程师(技术应用)(技术应用)计算生物学计算生物学/生物信息学:生物信息学:三种科学文化的融合三种科学文化的融合2023-2-712A marriage of BiologyInformationtechnology2023-2-713数据数据算法算法应用应用(Bioinformatics)美国人类基因组计划实施五年后的总结美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息学是一门交
7、叉科学,它包含了生物信息的获取、处理、存储、分发、分析生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,综合运用数学、和解释等在内的所有方面,综合运用数学、计算机科学和生物学的各种工具,来阐明和计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。理解大量数据所包含的生物学意义。2023-2-7152023-2-716曼哈顿原子弹计划曼哈顿原子弹计划阿波罗登月计划阿波罗登月计划人类基因组计划人类基因组计划(Manhattan Project)美国陆军部于美国陆军部于1942年年6月开始实施的利月开始实施的利用核裂变反应来研用核裂变反应来研制原子弹的计划制原子弹的计划
8、 阿波罗计划(阿波罗计划(Projec Apollo),是美国从),是美国从1961年到年到1972年从事的年从事的一系列载人登月飞行任一系列载人登月飞行任务务 2023-2-71760年代初,美国总统年代初,美国总统Kennedy提出两个科学计划:提出两个科学计划:登月计划登月计划攻克肿瘤计划攻克肿瘤计划 人类遗传信息的复杂性人类遗传信息的复杂性人类基因组计划人类基因组计划(HGP,Human Genome Project)2023-2-718生命活动三要素:物质、能量、信息生命活动三要素:物质、能量、信息 DNA:遗传物质遗传物质(遗传信息的载体遗传信息的载体)双螺旋结构双螺旋结构 A,C
9、,G,T四种基本字符的复杂文本四种基本字符的复杂文本 基因基因(Gene):具有遗传效应的:具有遗传效应的DNA分子片段分子片段2023-2-719 基因组基因组(Genome)(Genome):包含包含细胞或生物体细胞或生物体全套的遗传信息的全部全套的遗传信息的全部 遗传物质。遗传物质。原核生物原核生物(细菌、病毒等细菌、病毒等)真核生物真核生物(真菌、植物、动物等真菌、植物、动物等)人类基因组:人类基因组:3.2109 bp 2023-2-720尽管比之于人类登月,尽管比之于人类登月,HGP的投入资金的投入资金要少得多,但要少得多,但HGP对人类生活的影响要对人类生活的影响要更为深远更为深
10、远。因为随着这个计划的完成,。因为随着这个计划的完成,DNA分子中编码的分子中编码的遗传信息将对人类存遗传信息将对人类存在的化学基础作出最终的回答在的化学基础作出最终的回答。这将不。这将不仅帮助我们理解我们是如何作为健康的仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危早老痴呆症、精神分裂症等一些严重危害人类健康的疾病中的作用。毕竟害人类健康的疾病中的作用。毕竟对人对人类自身更深入的了解是人类活动中最重类自身更深入的了解是人类活动中最重
11、要的一个部分。要的一个部分。Watson,1990,Science2023-2-7211984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组因组DNA序列的意义序列的意义1985 Dulbecco在在Science撰文撰文“肿瘤研究的转折点肿瘤研究的转折点:人人 类基因组的测序类基因组的测序”美国能源部美国能源部(DOE)提出提出“人类基因组计划人类基因组计划”草案草案1987 美国能源部和国家卫生研究院(美国能源部和国家卫生研究院(NIH)联合为)联合为“人类人类 基因组计划基因组计划”下拨启动经费约下拨启动经费约550万美元万美元19
12、89 美国成立美国成立“国家人类基因组研究中心国家人类基因组研究中心Watson担任担任 第一任主任第一任主任1990.10 经美国国会批准,人类基因组计划正式启动经美国国会批准,人类基因组计划正式启动2023-2-7221995 第一个自由生物体流感嗜血菌第一个自由生物体流感嗜血菌(H.inf)的全的全基因组测序完成基因组测序完成1996 完成人类基因组计划的遗传作图完成人类基因组计划的遗传作图 启动模式生物基因组计划启动模式生物基因组计划H.inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫20
13、23-2-7231997 大肠杆菌大肠杆菌(E.coli)全基因组测序完成全基因组测序完成1998 完成人类基因组计划的物理作图完成人类基因组计划的物理作图 开始人类基因组的大规模测序开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争公司加入,与公共领域竞争 启动水稻基因组计划启动水稻基因组计划1999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划2023-2-7242000 Celera公司宣布完成果蝇基因组测序公司宣布完成果蝇基因组测序 国际公共领域宣
14、布完成第一个植物基因组国际公共领域宣布完成第一个植物基因组拟南芥全基拟南芥全基 因组的测序工作因组的测序工作Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥2023-2-7252001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共领域和公共领域和Celera公司同时宣布完成人类基因组工作草图公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果刊文发表国际公共领域结果2001.2.16 Science刊文发表刊文发表Celera公司及其合
15、作者结果公司及其合作者结果2023-2-726 1999年年12月月1日日,22号染色体测序完成号染色体测序完成 2006年年5月月18日日,美国和英国科学家在英国美国和英国科学家在英国自然自然杂志网络版上发表了人类最后一个杂志网络版上发表了人类最后一个染色体染色体1号染色体的基因测序号染色体的基因测序 全部人类基因组约有全部人类基因组约有2.91Gbp,约有,约有39000多个基因;多个基因;1号染色体包含基因数量最多,号染色体包含基因数量最多,达达3141个,是平均水平的两倍,共有超过个,是平均水平的两倍,共有超过2.23亿个碱基对;亿个碱基对;19号染色体是含基因最丰号染色体是含基因最丰
16、富的染色体,而富的染色体,而13号染色体含基因量最少号染色体含基因量最少2023-2-727 随着实验数据和可利用信息急剧增加,信息的管理和随着实验数据和可利用信息急剧增加,信息的管理和分析成为分析成为HGP的一项重要的工作的一项重要的工作 发现生物学发现生物学规律规律解读生物解读生物遗传密码遗传密码认识生命的本质认识生命的本质研究基因组数据研究基因组数据之间的关系之间的关系分析现有的分析现有的基因组数据基因组数据利用数学模型利用数学模型和计算技术和计算技术2023-2-728 各学科参与、协作:生命科学、数学、物理学、化学、计算机各学科参与、协作:生命科学、数学、物理学、化学、计算机 科学、
17、材料科学以及伦理、法律等社会科学科学、材料科学以及伦理、法律等社会科学 首要科学问题首要科学问题 如何找到记载在基因组如何找到记载在基因组DNA一维结构上控制生命时间、空间一维结构上控制生命时间、空间 的调控信息的编码方式和调节规律。的调控信息的编码方式和调节规律。应用数学、复杂系统理论、信息论、非线性科学应用数学、复杂系统理论、信息论、非线性科学 催生催生生物信息学、计算生物学生物信息学、计算生物学 芯片技术芯片技术 交叉性技术领域:物理学、微电子信息技术、生化技术、信交叉性技术领域:物理学、微电子信息技术、生化技术、信 息技术、自动化、材料科学息技术、自动化、材料科学 结构生物学结构生物学
18、 前沿领域之一:生物物理学、生物化学、晶体学、波谱学、前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及光谱学以及X射线晶体衍射技术、核磁共振技术射线晶体衍射技术、核磁共振技术2023-2-729 生物学数据的收集、存储、管理与提供生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析基因组序列信息的提取和分析 功能基因组相关信息分析功能基因组相关信息分析 生物大分子结构模拟和药物设计生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究生物信息分析的技术与方法研究 应用与发展研究应用与发展研究生物信息学的主要研究内容生物信息学的主要研究内容2023-2-730基因组基
19、因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR2023-2-731数据库搜索及序列比较数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相搜索同源序列在一定程度上就是通过序列比较寻找相似序列似序列 序列比较序列比较的一个基本操作就是的一个基本操作就是比对比对(Alignment),即),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是按照对应等同或者置换关系进行对比排列,其结果是两
20、个序列共有的排列顺序,这是序列相似程度的一种两个序列共有的排列顺序,这是序列相似程度的一种定性描述定性描述 多重序列比对多重序列比对研究的是多个序列的共性。序列的多重研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。究一组蛋白质之间的进化关系。2023-2-732基因组序列分析基因组序列分析 遗传语言分析遗传语言分析天书天书 基因组结构分析基因组结构分析 基因识别基因识别 基因功能注释基因功能注释 基因调控信息分析基因调控信息分析 基因组比较基因组比较CTCAGATTGAACGCTGGcGG
21、CAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTCGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCACCCACACTGGAACTGAGACGACGGTCCAGACTC
22、CTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGTGTTGAGGTTAATAACCTCATCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAA
23、ACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCcGCACAAGCG
展开阅读全文