第一章—生物信息学绪论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第一章—生物信息学绪论课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 生物 信息学 绪论 课件
- 资源描述:
-
1、第一章第一章 生物生物信息信息学学绪论绪论金萍金萍南京师范大学南京师范大学比较基因组学与生物信息学实验室比较基因组学与生物信息学实验室内内 容容3一、生物信息学定义一、生物信息学定义4生物信息学(生物信息学(Bioinformatics)名词的由来)名词的由来 八十年代末期,八十年代末期,林华安林华安博士认识到博士认识到将计算机科学与生物学将计算机科学与生物学结合起来的重要意义结合起来的重要意义,开始留意要为这一领域构思一个合适,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算
2、机计算研究所的关系,他会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是使用的是“CompBio”;之后,又将其更改为兼具法国风情的;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便,看起来似乎有些古怪。因此不久,他便进一步把它更改为进一步把它更改为“bio-informatics(bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的但由于当时的电子邮件系统与今日不同,该名称中的-或或/符号符号经常会引起许多系统问题,于是林博士将其去除,今天我们经常会引起许多系统问题,于是林博士将其去除,今天我们所看
3、到的所看到的“bioinformatics”就正式诞生了,林博士也因此赢得就正式诞生了,林博士也因此赢得了了“生物信息学之父生物信息学之父”的美誉。的美誉。5生物信息学之父生物信息学之父 林华安林华安 Dr.Hwa A.Lim(林华安)(林华安)1987年提出年提出“Bio-informatique”“Bioinformatics”1955年出生于马来西亚。联合国年出生于马来西亚。联合国Bioinformatics专家,专家,University of Texas at Dallas分子与细胞生物学分子与细胞生物学Adjunct Professor、中国科学院基因遗传研究所客座教授。中国科学院
4、基因遗传研究所客座教授。1981年英国伦敦大学帝国学院年英国伦敦大学帝国学院(Imperial College,London University)毕业,毕业,1986年获得美国年获得美国Rochester University生化物理学博士学位,生化物理学博士学位,30岁取得佛罗里达州立大学终生教授。岁取得佛罗里达州立大学终生教授。1992年受聘担任美国国家癌症中心及美国国家科年受聘担任美国国家癌症中心及美国国家科学基金会审核委员。学基金会审核委员。1995年后,历任多家生年后,历任多家生物科技公司生化信息执行长、副总裁等高层物科技公司生化信息执行长、副总裁等高层管理职位。管理职位。1997
5、年,创立结合软件与数据分年,创立结合软件与数据分析的专业顾问公司析的专业顾问公司D Trends,服务生物技术、,服务生物技术、制药及卫生保健等机构。制药及卫生保健等机构。什什么么是是生生物物信信息息学学?7 人类基因组计划人类基因组计划(Human Genome Project,HGP):1990年正式启动,旨在完成人类基因组约年正式启动,旨在完成人类基因组约30亿个亿个碱基的全序列测定。碱基的全序列测定。海量生物数据的迅速膨胀:海量生物数据的迅速膨胀:DNA、RNA和蛋白质和蛋白质序列,蛋白质二级结构和三维结构数据,蛋白质序列,蛋白质二级结构和三维结构数据,蛋白质相互作用数据等。相互作用数
6、据等。对大量生物数据的管理、分析和信息化需求促进对大量生物数据的管理、分析和信息化需求促进了生物信息学的迅速发展。了生物信息学的迅速发展。8生命信息的组织、生命信息的组织、传递、表达传递、表达物理物理化学化学分子分子生物学生物学遗传学遗传学信息技术信息技术各学科参与、协作:生命科学、数学、物理学、化学、计算机各学科参与、协作:生命科学、数学、物理学、化学、计算机 科学、材料科学以及伦理、法律等社会科学科学、材料科学以及伦理、法律等社会科学生物信息学生物信息学诞生诞生9 定义一:生物信息学是一门收集、分析遗传数据以及分发给定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科研究机
7、构的新学科(Bioinformatics is a new subject of genetic data collection,analysis and dissemination to the research community)。)。(Dr.Hwa A.Lim,1987)定义二:生物信息学特指数据库类的工作,包括持久稳固的定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持在一个稳定的地方提供对数据的支持(Bioinformatics refers to database-like activities,involving persistent sets
8、 of data that are maintained in a consistent state over essentially indefinite periods of time)。)。(Dr.Hwa A.Lim,1994)定义三:生物信息学是在大分子方面的概念型的生物学,并定义三:生物信息学是在大分子方面的概念型的生物学,并且使用了信息学的技术,这包括了从应用数学、计算机科学且使用了信息学的技术,这包括了从应用数学、计算机科学以及统计学等学科衍生而来各种方法,并以此在大尺度上来以及统计学等学科衍生而来各种方法,并以此在大尺度上来理解和组织与生物大分子相关的信息。理解和组织与生物大分
9、子相关的信息。(Luscombe,2001)生物生物信息信息学学 说文解字:说文解字:生物生物+信息信息+学学(bioinformatics)biology +information+theory 广义:广义:应用信息科学的方法和技术,研究生物体应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者生理、病理、药理过程中的各种生物信息,或者也可以说成是也可以说成是生命科学生命科学中的中的信息科学信息科学。
10、狭义:狭义:应用应用信息科学信息科学的理论、方法和技术,管理、的理论、方法和技术,管理、分析和利用分析和利用生物分子生物分子数据。数据。11 NIH于于2003年形成了一个通向生命科学未来的年形成了一个通向生命科学未来的“中长期发展规划中长期发展规划”-国立卫生研究院路线图国立卫生研究院路线图(NIH Roadmap)。)。NIH路线图中启动了一个路线图中启动了一个“生物信息学和计算生物学生物信息学和计算生物学”计划,希望通过这个计划,希望通过这个项目的实施而铺设一条通向生命科学未来的项目的实施而铺设一条通向生命科学未来的“信息信息高速公路高速公路”。该项目计划从该项目计划从2004年开始,建
11、立数个年开始,建立数个“国立生物医学计算中心国立生物医学计算中心”,以便开发相关软件,以便开发相关软件和数据管理工具。和数据管理工具。12计算生物学计算生物学 计算生物学(计算生物学(Computational Biology)是生物学)是生物学的一个分支。根据的一个分支。根据美国美国国家卫生研究所国家卫生研究所(NIH)的定义,它是指开发和应用数据分析及理论的方的定义,它是指开发和应用数据分析及理论的方法、法、数学建模数学建模、计算机仿真计算机仿真技术等,用于生物学、技术等,用于生物学、行为学和社会群体系统的研究的一门学科行为学和社会群体系统的研究的一门学科。13生物信息学与计算生物学生物信
12、息学与计算生物学区别与联系区别与联系 有些人将计算生物学作为生物信息学的有些人将计算生物学作为生物信息学的同义同义词词处理;但是另外一些人认为计算生物学和生物处理;但是另外一些人认为计算生物学和生物信息学应当被作为不同的信息学应当被作为不同的条目条目处理。处理。生物信息学主要侧重于对生物信息学主要侧重于对生物学生物学中所得信息中所得信息的采集、存贮、分析处理与可视化方面,而计算的采集、存贮、分析处理与可视化方面,而计算生物学主要侧重于使用生物学主要侧重于使用计算技术计算技术对生物学问题进对生物学问题进行研究方面。行研究方面。14生物信息学生物信息学基本思想的产生基本思想的产生 生物信息学生物信
13、息学 的迅速发展的迅速发展二十世纪二十世纪50年代年代二十世纪二十世纪80-90年代年代生物科学和生物科学和技术的技术的发展发展人类基因组人类基因组计划的计划的推动推动 二、生物信息学的发展历史二、生物信息学的发展历史15(一)前基因组时代的生物信息学(一)前基因组时代的生物信息学u属于生物物理学范畴的传统生物信息学可以追溯到很久以前,属于生物物理学范畴的传统生物信息学可以追溯到很久以前,如研究生物发光、生物电、生物磁和激素等信息物质的传递如研究生物发光、生物电、生物磁和激素等信息物质的传递现象及其相应测定技术。以研究序列比对为标志的现代生物现象及其相应测定技术。以研究序列比对为标志的现代生物
14、信息学则起源于信息学则起源于20世纪世纪7080年代。年代。u这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生物学数据库的建立以及检索工具的开发。例如物学数据库的建立以及检索工具的开发。例如Dayhoff的替的替换矩阵、换矩阵、Neelleman和和Wunsch的序列比对(的序列比对(sequence alignment)及)及GenBank(由美国国立生物技术信息中心建(由美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,形成了生物信息学的雏形。形成了生
15、物信息学的雏形。16 20世纪世纪50年代,生物信息学开始孕育年代,生物信息学开始孕育 20世纪世纪60年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算 生物学和计算机科学联系起来生物学和计算机科学联系起来 20世纪世纪70年代,生物信息学的真正开端年代,生物信息学的真正开端(序列比对算法序列比对算法)20世纪世纪80年代初期,生物信息分析方法的发展年代初期,生物信息分析方法的发展 20世纪世纪80年代以后,生物信息服务机构和数据库年代以后,生物信息服务机构和数据库 20世纪世纪90年代后年代后,HGP促进生物信息学的迅速发展促进生物信息学的迅速发展生物信息学的孕育和初步形成生
16、物信息学的孕育和初步形成171956:美国田纳西州首次召开了美国田纳西州首次召开了“生物学中的理论研讨生物学中的理论研讨会会”;1962:Zucherkandl和和Pauling研究了序列变化与进化的关研究了序列变化与进化的关系,开创了一个新的领域系,开创了一个新的领域分子进化;分子进化;1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白研制出蛋白质序列图集,即后来著名的蛋白质信息源质信息源PIR;1970:Needleman和和Wunsch提出了著名的序列比对算法,提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;是生物信息学发展中最重要的贡献;1970:Gibbs和和M
17、cIntyre发表著名的矩阵打点做图法;发表著名的矩阵打点做图法;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;等人研制了核酸序列中酶切位点识别程序;1981:Smith和和Waterman提出了著名的公共子序列识别算提出了著名的公共子序列识别算法,同年法,同年Doolittle提出了关于序列模式的概念;提出了关于序列模式的概念;181982:GenBank第第3版本正式发行;版本正式发行;1983:Wilbur和和Lipman发表了数据库相似序列搜索算法;发表了数据库相似序列搜索算法;1986:日本核酸序列数据库日本核酸序列数据库DDBJ诞生;诞生;1986:蛋白质数据库蛋
18、白质数据库SWISS-PROT诞生;诞生;1988:美国国家生物技术信息中心美国国家生物技术信息中心NCBI诞生;诞生;1988:成立欧洲分子生物学网络成立欧洲分子生物学网络(EMBNet),EMBL数据库数据库诞生;诞生;1988:Person和和Lipman发表了著名的序列比较算法发表了著名的序列比较算法FASTA;1990:快速相似性序列搜索算法快速相似性序列搜索算法BLAST问世,问世,1987年年BLAST的改进版本的改进版本PSI-BLAST投入使用投入使用19(二)基因组时代的生物信息学(二)基因组时代的生物信息学u以基因组计划的实施为标志的基因组时代(以基因组计划的实施为标志的
19、基因组时代(1990年至年至2001年)是生物信息学成为一个较完整的新兴学科并得年)是生物信息学成为一个较完整的新兴学科并得到高速发展的时期。到高速发展的时期。这一时期生物信息学确立了自身的这一时期生物信息学确立了自身的研究领域和学科特征,成为生命科学的热点学科和重要研究领域和学科特征,成为生命科学的热点学科和重要前沿领域之一。前沿领域之一。u 这一阶段的主要成就包括大分子序列以及表达序列标签这一阶段的主要成就包括大分子序列以及表达序列标签(expressed sequence tag,EST)数据库的高速发展、)数据库的高速发展、BLAST(basic local alignment sea
20、rch tool)和)和FASTA(fast alignment)等工具软件的研制和相应新算法的提)等工具软件的研制和相应新算法的提出、基因的寻找与识别、电子克隆(出、基因的寻找与识别、电子克隆(in silico cloning)技)技术等,大大提高了管理和利用海量数据的能力。术等,大大提高了管理和利用海量数据的能力。人类基因组计划人类基因组计划(HGP,Human Genome Project)由美国由美国NIH和能源部提出和带头,美、英、德、法、和能源部提出和带头,美、英、德、法、日、中共同参与的国际合作项目。日、中共同参与的国际合作项目。重大国际研究项目:测定人类基因组全部重大国际研究
21、项目:测定人类基因组全部DNA序序列,构建人类基因组遗传图谱和物理图谱。列,构建人类基因组遗传图谱和物理图谱。1990年:年:正式启动,正式启动,30亿美元。亿美元。2001年:人类基因组草图公开发表。年:人类基因组草图公开发表。2003年:美国宣布该项目完成。年:美国宣布该项目完成。1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组因组DNA序列的意义序列的意义1985 Dulbecco在在Science撰文撰文“肿瘤研究的转折点肿瘤研究的转折点:人人 类基因组的测序类基因组的测序”美国能源部美国能源部(DOE)提出提出“人类基因组
22、计划人类基因组计划”草案草案1987 美国能源部和国家卫生研究院(美国能源部和国家卫生研究院(NIH)联合为)联合为“人人类类 基因组计划基因组计划”下拨启动经费约下拨启动经费约550万美元万美元1989 美国成立美国成立“国家人类基因组研究中心国家人类基因组研究中心”,Watson担担任任 第一任主任第一任主任1990.10 经美国国会批准,人类基因组计划正式启动经美国国会批准,人类基因组计划正式启动1995 第一个自由生物体流感嗜血菌第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成的全基因组测序完成1996 完成人类基因组计划的遗传作图完成人类基因组计划的遗传作图 启动模式生物基
23、因组计划启动模式生物基因组计划H.inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫1997 大肠杆菌大肠杆菌(E.coli)全基因组测序完成全基因组测序完成1998 完成人类基因组计划的物理作图完成人类基因组计划的物理作图 开始人类基因组的大规模测序开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争公司加入,与公共领域竞争 启动水稻基因组计划启动水稻基因组计划1999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全
24、基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划1999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度2000 Celera公司宣布完成果蝇基因组测序公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组国际公共领域宣布完成第一个植物基因组拟南芥全基拟南芥全基 因组的测序工作因组的测序工作Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥2001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共领域和公共领
25、域和Celera公司同时宣布完成人类基因组工作草图公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果刊文发表国际公共领域结果2001.2.16 Science刊文发表刊文发表Celera公司及其合作者结果公司及其合作者结果26我国对人类基因组计划的贡献我国对人类基因组计划的贡献6/1-8/31/99NoCenterRegionSize(Mb)Actual KGenbank KrProjected Kr4/1-11/30/99Proj Accum.Mr.4/99-3/001 Sanger Centre1,6,9,10,13,20,22,X850130094
展开阅读全文