书签 分享 收藏 举报 版权申诉 / 86
上传文档赚钱

类型医学生物信息学课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:5156952
  • 上传时间:2023-02-15
  • 格式:PPTX
  • 页数:86
  • 大小:27.52MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《医学生物信息学课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    医学 生物 信息学 课件
    资源描述:

    1、生物信息学生物信息学赵雨杰赵雨杰 生物信息学教研室生物信息学教研室生物芯片中心生物芯片中心二十世纪二十世纪-物理世纪物理世纪胡克霍金推动人类文明的重要发明推动人类文明的重要发明:蒸汽机蒸汽机:推动了整个工业革命的:推动了整个工业革命的发展发展汽车汽车:载着时代向前奔驶:载着时代向前奔驶原子弹原子弹:毁灭地球的潘朵拉:毁灭地球的潘朵拉盒子盒子登月登月:人类航天史上迈出一大步:人类航天史上迈出一大步推动人类文明的重要发明推动人类文明的重要发明:电话电话:掀开人类通讯史的新篇章:掀开人类通讯史的新篇章 电视电视:人类自己创造的:人类自己创造的“千里眼千里眼”电脑电脑:人类未来的希望:人类未来的希望

    2、因特网因特网:使世界变成:使世界变成“地球村地球村”二十一世纪二十一世纪-生物世纪生物世纪世纪是生命科学的时代世纪是生命科学的时代利用基因技术培育的转基因食品已经摆上了普通百姓的餐桌;利用基因技术培育的转基因食品已经摆上了普通百姓的餐桌;基因疗法已经开始挽救患者的生命;基因疗法已经开始挽救患者的生命;克隆技术的重大突破,已使动物的复制成为可能。克隆技术的重大突破,已使动物的复制成为可能。人类数千年来的梦想正随着生命科学的发展逐一实现,人类数千年来的梦想正随着生命科学的发展逐一实现,随着物理学世纪让位于生命科学世纪,世界还将会有更多的随着物理学世纪让位于生命科学世纪,世界还将会有更多的奇迹出现。

    3、奇迹出现。转基因转基因技术技术:克隆技术克隆技术黄禹锡克隆狗黄禹锡克隆狗“斯纳皮斯纳皮 Snuppy”,a Seoul National University puppy(一只汉城大学的(一只汉城大学的小狗)小狗)。生命奥秘生命奥秘What is the total number of human genes?28,0004,000 Only 1.1%of the genome is spanned by exons,whereas 24%is in introns,with 75%of the genome being intergenic DNA.One of the largest ch

    4、allenges is identifying the unknown functions that almost certainly exist in much of the“junk”DNA.重复序列在基因组中的比例重复序列在基因组中的比例Human45%Arabidopsis11%C.elegans7%D.melanogaster3%生物学与信息科学是当今世界上发展最迅速、影响最大的两生物学与信息科学是当今世界上发展最迅速、影响最大的两门科学。门科学。而这两门科学的交叉融合形成了广义的生物信息学而这两门科学的交叉融合形成了广义的生物信息学(bioinformatics)。)。生命现象生命

    5、现象是在信息控制下不同层次上的是在信息控制下不同层次上的物质、能量与信息的交换与传递过程,不同层次是指核酸、物质、能量与信息的交换与传递过程,不同层次是指核酸、蛋白质、细胞、组织、器官、系统、整体等。蛋白质、细胞、组织、器官、系统、整体等。什么是生物信息学?什么是生物信息学?生物信息学是一门新兴的生物学与信息科学交叉学生物信息学是一门新兴的生物学与信息科学交叉学科,它是一个包含着基因组信息的获取、处理、存科,它是一个包含着基因组信息的获取、处理、存储、分配储、分配、分析和解释的所有方面学科领域。、分析和解释的所有方面学科领域。广义生物信息学广义生物信息学:一、生物的遗传信息一、生物的遗传信息D

    6、NARNA蛋白质,遗传信息蛋白质,遗传信息转录转录翻译,遗传翻译,遗传信息生物信息学。信息生物信息学。广义生物信息学广义生物信息学:二、生命活动的调控二、生命活动的调控基因的表达和调控、蛋白的结构、功能和调控细胞活动基因的表达和调控、蛋白的结构、功能和调控细胞活动(分化、发育、衰老、死亡),组织、器官、系统、整(分化、发育、衰老、死亡),组织、器官、系统、整体活动的调控节律、生物钟、分蘖、生长、开花、结果体活动的调控节律、生物钟、分蘖、生长、开花、结果、营养的吸收、传输、转化、对外界信号的反应:含羞、营养的吸收、传输、转化、对外界信号的反应:含羞草、抗逆性。草、抗逆性。广义生物信息学广义生物信

    7、息学:三、生物电磁学与电磁生物学三、生物电磁学与电磁生物学生物电磁学:生命活体在不同层次(电子、离子、原子、基因、细胞、生物电磁学:生命活体在不同层次(电子、离子、原子、基因、细胞、组织、整体等)的活动和不同属性(包括思维、精神)活动时以及和外组织、整体等)的活动和不同属性(包括思维、精神)活动时以及和外界环境(生命体周围直至宇宙)相互作用时反映出来的各种电磁信息。界环境(生命体周围直至宇宙)相互作用时反映出来的各种电磁信息。人体的电磁辐射(包括发光):频率、强度、频谱。人体信号的调制方人体的电磁辐射(包括发光):频率、强度、频谱。人体信号的调制方式:调幅、调频、编码。式:调幅、调频、编码。电

    8、磁生物学:电磁辐射对生物体的影响,电磁场导致电磁生物学:电磁辐射对生物体的影响,电磁场导致DNA突变,体内突变,体内细胞电离、极化状态变化导致疾病。细胞电离、极化状态变化导致疾病。广义生物信息学广义生物信息学:四、视觉系统与光信息处理 视网膜神经元回路与信息处理、彩色视觉及彩色图像的编码、变换机制、眼动成象机制及宽视场、消色差动态成象系统、视觉认知机制及其图像信息的智能模式识别、不同状态立体视觉机制和静态、动态立体视锐度。广义生物信息学广义生物信息学:五、脑和神经系统与信息五、脑和神经系统与信息脑的感知觉信息处理原理及其应用,学习、记忆、思脑的感知觉信息处理原理及其应用,学习、记忆、思维,逻辑

    9、思维和形象思维,思维模型与信息处理系统维,逻辑思维和形象思维,思维模型与信息处理系统新原理的研究,新的计算模型、新型计算机、新原理的研究,新的计算模型、新型计算机、如:神如:神经计算机。经计算机。广义生物信息学广义生物信息学:六、生物体结构与微光机电系统六、生物体结构与微光机电系统 DNADNA驱动的微细机器人,生物大分子到细胞基本结构体系的驱动的微细机器人,生物大分子到细胞基本结构体系的自组装、自组织,创造新物质的分子工程学研究,分子聚集自组装、自组织,创造新物质的分子工程学研究,分子聚集体的化学。体的化学。广义生物信息学广义生物信息学:七、生物信息技术七、生物信息技术生物信息技术包含生物序

    10、列信息、基因表达信息、基因调控信息、细生物信息技术包含生物序列信息、基因表达信息、基因调控信息、细胞间调控信息等检测技术。如纳米胞间调控信息等检测技术。如纳米生物技术将纳米技术和生物技术相生物技术将纳米技术和生物技术相集成,在生物医学、电子学、材料学、环境科学等诸多集成,在生物医学、电子学、材料学、环境科学等诸多领域的应用。领域的应用。在生物芯片、分子马达、生物探针、纳米生物材料在生物芯片、分子马达、生物探针、纳米生物材料等方面迅速发展等方面迅速发展 。目前一般意义的生物信息学是基因层次的生物信息学目前一般意义的生物信息学是基因层次的生物信息学基因层次的生物信息学基因层次的生物信息学 是近年来

    11、发展并完善起来的交叉学科。是近年来发展并完善起来的交叉学科。这门学科是综合运用生物学、数学、物理学、信息这门学科是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。交叉学科。近年来随着快速序列测定、基因重组、多维核磁共振、同步近年来随着快速序列测定、基因重组、多维核磁共振、同步辐射、机器人等技术的应用,生物学实验数据呈爆炸趋势增辐射、机器人等技术的应用,生物学实验数据呈爆炸趋势增长长,进入了大数据时代。同时,进入了大数据时代。同时计算机和国际互联网络的发展计算机和国际互联网络的发展使对大规模数据的贮存、处理和传输

    12、成为可能使对大规模数据的贮存、处理和传输成为可能 。现在某一实验室的基因研究成果一旦进入生物信息网络便为现在某一实验室的基因研究成果一旦进入生物信息网络便为全球科学家所共享。全球科学家所共享。生物信息学是内涵非常丰富的学科,生物信息学是把基因组生物信息学是内涵非常丰富的学科,生物信息学是把基因组DNADNA序列信息分析作为源头,在获得了蛋白质编码区的信息序列信息分析作为源头,在获得了蛋白质编码区的信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行分析处理。的功能进行分析处理。生物信息学现状和重要研究方向生物信息学现状和重要研究

    13、方向 从美国的三个国家计划说起:从美国的三个国家计划说起:曼哈顿计划;阿婆罗计划;人类基因组计划。破译人类遗传密码就要读懂由破译人类遗传密码就要读懂由3131亿符号组成的亿符号组成的100100万页的万页的“天书天书”Howmanycharactersareinthe“HeavenBook”?3*10910,000books1book100pages1page3,000characters CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAACCGGTCTCCCCGCCCGCGCGCG

    14、AAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGA

    15、GTCAACTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGCGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAA

    16、GGGCGTCAATAGCGCTGTGGACGAGACAGATAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGAGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTT

    17、TTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCCATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGC

    18、CATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTG

    19、GGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAACTATTAA

    20、AACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAACTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTT

    21、CTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAACCCCACACGCGG

    22、TGTAGAAATATATTTTAAGGGCGCG ACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG (1250 characters)(1250 characters)FROMSEQUENCEDATAOFDNATO3D-STRUCTUREOFPROTEIN gene(coding regions,exons)primary sequence of protein 3D-structure of protein biological function “Junk DNA”(uncoding regions,98%of human genome)One of the

    23、largest challenges is identifying the unknown functions that almost certainly exist in much of the“junk”DNA.?生物信息学是把基因组生物信息学是把基因组DNADNA序列信息分析作为源头,序列信息分析作为源头,破译隐藏在破译隐藏在DNADNA序列中的遗传语言,特别是非编码区序列中的遗传语言,特别是非编码区的实质;同时在发现了新编码基因信息之后进行蛋的实质;同时在发现了新编码基因信息之后进行蛋白质空间结构模拟和预测。白质空间结构模拟和预测。核核 心心 基因组信息学,包括基因组信息的获取、基因组

    24、信息学,包括基因组信息的获取、处理、存储、分配、分析和解释。处理、存储、分配、分析和解释。基因组信息学的关键基因组信息学的关键“读懂读懂”基因组的核苷酸顺序,即全部基因在染色体基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各上的确切位置以及各DNA片段的功能;同时在发现了片段的功能;同时在发现了新基因信息之后进行功能分析。如果是编码基因,针新基因信息之后进行功能分析。如果是编码基因,针对蛋白质空间结构模拟和预测,然后依据特定蛋白质对蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行药物设计。的功能进行药物设计。了解基因表达的调控机理了解基因表达的调控机理生物信息学的重要内容,根据生

    25、物分子在基因调控中生物信息学的重要内容,根据生物分子在基因调控中的作用,描述人类疾病诊断、治疗的内在规律。的作用,描述人类疾病诊断、治疗的内在规律。生物信息学的研究目标生物信息学的研究目标揭示揭示“基因组信息结构的复杂性及遗传语言的根基因组信息结构的复杂性及遗传语言的根本规律本规律”。它是当今自然科学和技术科学领域中。它是当今自然科学和技术科学领域中“基因组基因组”、“信息结构信息结构”和和“复杂性复杂性”这三个这三个重大科学问题的有机结合。重大科学问题的有机结合。近来的研究表明近来的研究表明基因组不仅是基因的简单排列,它有其特有的组织结基因组不仅是基因的简单排列,它有其特有的组织结构和信息结

    26、构,这种结构是在长期的演化过程中产生构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。弄清楚生物体基的,也是基因发挥其功能所必须的。弄清楚生物体基因组特有的组织结构和信息结构,是了解生命遗传规因组特有的组织结构和信息结构,是了解生命遗传规律的关键。律的关键。The distribution of mouse homology genes in the human chromosome(Data from GenBank,Coordinate by R.S.Chen)*genes in this No.chromosome of distribution of mou

    27、se homology genes mouse in human chromosome 1 1、2、5、6、8、13、18 2 2、7、9、10、11、15、20 3 1、3、4、8 4 1、6、8、9 5 1、4、7、12、13、18、22 6 2、3、7、10、12 7 6、10、11、15、16、19 8 1、4、8、13、16、19 9 3、6、11、15、19 10 6、10、12、19、21、22 11 2、5、7、16、17、22 12 2、7、14 13 1、5、6、7、9、15、17 14 3、8、10、13、14、X 15 5、8、12、22 16 3、8、16、21、22

    28、 17 6、16、19、21 18 5、10、18 19 9、10、11、X X X*白血病染色体交换白血病染色体交换-费城染色体费城染色体一、一、大规模基因组测序中的信息分析大规模基因组测序中的信息分析 大规模大规模测序是基因组研究的最基本任务,它的每一个环节都测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。从测序仪的光密度采样与分析、碱基与信息分析紧密相关。从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙、到重读出、载体标识与去除、拼接与组装、填补序列间隙、到重复序列标识、阅读框预测和基因标注的每一步都是紧密依赖复序列标识、阅读框预测和基因标

    29、注的每一步都是紧密依赖基因组信息学的软件和数据库的。基因组信息学的软件和数据库的。二、生物信息的收集、存储、管理与提供二、生物信息的收集、存储、管理与提供 建立国际基本生物信息库和生物信息传输的国际联网系统;建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息的在线服务;生物信息可视化和专家系统。生物信息可视化和专家系统。建立数据库是生物信息学的重要内容,当前在建立数据库是生物信息学的重要内容,当前在InternetInternet上可找上可找到的各种数据库几乎覆盖了生命科学的各个到的各种数

    30、据库几乎覆盖了生命科学的各个领域。核酸领域。核酸序列数序列数据库有据库有GenBankGenBank、EMBLEMBL、DDBJDDBJ等。蛋白质等。蛋白质序列数据库有序列数据库有SWISS-SWISS-PROTPROT、PIRPIR、OWLOWL、NRL3DNRL3D、TrEMBLTrEMBL等,三维结构数据库有等,三维结构数据库有PDBPDB、NDBNDB、BioMagResBankBioMagResBank、CCSDCCSD等,与蛋白质结构相关的数据库等,与蛋白质结构相关的数据库还有还有SCOPSCOP、CATHCATH、FSSPFSSP、3D-ALI3D-ALI、DSSPDSSP等,与

    31、基因组有关的数等,与基因组有关的数据库有据库有ESTdbESTdb、OMIMOMIM、GDBGDB、GSDBGSDB等等文献数据库有文献数据库有MedlineMedline、UncoverUncover等,此外还有其他数据库数等,此外还有其他数据库数百种。另外一些公司还开发了商业数据库如百种。另外一些公司还开发了商业数据库如MDLMDL等。数据库等。数据库内容呈爆炸性增长,除了在数量上的增长,数据库的复杂程内容呈爆炸性增长,除了在数量上的增长,数据库的复杂程度也在不断增加,它包括了大量注释、参考文献及软件,并度也在不断增加,它包括了大量注释、参考文献及软件,并通过交互联接将相关内容连接到其它数

    32、据库。通过交互联接将相关内容连接到其它数据库。三、三、基因组序列信息的提取和分析基因组序列信息的提取和分析 l基因组信息学的根本任务是破译人类的遗传密码。迄今为基因组信息学的根本任务是破译人类的遗传密码。迄今为止在人类基因组中真正掌握信息存储与表达规律的,只有止在人类基因组中真正掌握信息存储与表达规律的,只有DNADNA上编码蛋白质的区域,也就是结构基因。这部分只占人上编码蛋白质的区域,也就是结构基因。这部分只占人类基因组的类基因组的1%3%1%3%,其余,其余97%97%的基因组序列人们尚不知其功的基因组序列人们尚不知其功能(所谓的能(所谓的“Junk”DNAJunk”DNA)。)。“Jun

    33、k”DNAJunk”DNA是许多对生命过程富有活力的不同类型的是许多对生命过程富有活力的不同类型的DNADNA的复合体,的复合体,它们至少包含如下类型的它们至少包含如下类型的DNADNA成份或由其表达的成份或由其表达的RNARNA成份:内含子、卫成份:内含子、卫星星DNADNA、小卫星、小卫星DNADNA、微卫星、微卫星DNADNA、非均一核、非均一核RNARNA、SINEsSINEs(short short interspersed nuclear elementsinterspersed nuclear elements)元件、)元件、LINEsLINEs(long long inters

    34、persed nuclear elementsinterspersed nuclear elements)元件、假基因等。除此之外顺式)元件、假基因等。除此之外顺式调控元件,如启动子、增强子等也属于非编码序列。目前普遍认为非调控元件,如启动子、增强子等也属于非编码序列。目前普遍认为非编码区与基因在四维时空的表达调控有关。因此寻找这些区域的编码编码区与基因在四维时空的表达调控有关。因此寻找这些区域的编码特征,信息调节与表达规律是未来相当长时间内的热点课题。特征,信息调节与表达规律是未来相当长时间内的热点课题。四、新基因和新四、新基因和新SNPsSNPs的发现与鉴定的发现与鉴定a)a)、利用、利用

    35、 EST EST 数据库数据库 (dbESTdbEST)发现新基因和新发现新基因和新SNPsSNPs 国际上现已出现了几个基于国际上现已出现了几个基于ESTEST的基因索引如的基因索引如UniGeneUniGene (ftp:/ncbi.nlm.nih.gov/pub/schuler/unigene),Merck-Gene ftp:/ncbi.nlm.nih.gov/pub/schuler/unigene),Merck-Gene index(httpindex(http:/genome.wustl.edu/est/esthmpg.html),:/genome.wustl.edu/est/est

    36、hmpg.html),GenExpressGenExpress-index-index (http:/www.cshl.org)(http:/www.cshl.org),这些基因索引数据库,这些基因索引数据库(即二次数据库即二次数据库)构建了基因构建了基因框架,极大地方便了相关研究者。框架,极大地方便了相关研究者。b)b)、从基因组、从基因组DNADNA序列中预测新序列中预测新ORFORFl可以利用可以利用ESTEST数据库(数据库(dbESTdbEST)发现新基因,)发现新基因,ESTEST表达序列标表达序列标签(签(Expressed Sequence TagsExpressed Sequ

    37、ence Tags)是从基因表达的短)是从基因表达的短cDNAcDNA序序列,它们携带着完整基因某些片段的信息。由于列,它们携带着完整基因某些片段的信息。由于ESTEST中包括中包括了大量未发现的人类基因的信息,如何利用这些信息发现了大量未发现的人类基因的信息,如何利用这些信息发现新基因成了近几年的重要研究课题。新基因成了近几年的重要研究课题。lJacobJacob和和MonodMonod的乳糖操纵子模型给出了基因表达调控的最的乳糖操纵子模型给出了基因表达调控的最基本模式,但很多实验证据表明编码区和非编码区中信息基本模式,但很多实验证据表明编码区和非编码区中信息调节规律更为复杂。调节规律更为复

    38、杂。l人类基因组及相关的模式生物基因组提供的大量信息,对人类基因组及相关的模式生物基因组提供的大量信息,对于遗传密码起源的研究、基因组结构的形式与演化、生物于遗传密码起源的研究、基因组结构的形式与演化、生物进化等提供了有力的帮助。使生物信息学的研究拓展到更进化等提供了有力的帮助。使生物信息学的研究拓展到更广泛的领域。广泛的领域。五、功能基因组相关信息分析五、功能基因组相关信息分析 l包括与大规模基因表达谱分析相关的算法、软件研究,基包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预

    39、测和模拟,以及蛋白质功能预测的研究。质空间结构的预测和模拟,以及蛋白质功能预测的研究。l在具有生命的细胞中基因表达的数量和种类是随着时间、在具有生命的细胞中基因表达的数量和种类是随着时间、环境的不同而变化的,所表达的基因相互之间有着必然的环境的不同而变化的,所表达的基因相互之间有着必然的联系,基因之间的控制和被控制的关系构成复杂的网络关联系,基因之间的控制和被控制的关系构成复杂的网络关系。在分子水平对基因表达调控进行研究,研究调节蛋白系。在分子水平对基因表达调控进行研究,研究调节蛋白是如何作用于它的顺式调控元件,象启动子、增强子等的;是如何作用于它的顺式调控元件,象启动子、增强子等的;调节蛋白

    40、又是被什么调整的?调节蛋白又是被什么调整的?功能基因组研究开展后,将功能基因组研究开展后,将使我们的认识上升到一个新阶段。使我们的认识上升到一个新阶段。六、比较基因组六、比较基因组学学研究研究研究生命是从哪里起源的?生命是如何进化的?遗传密码是如何研究生命是从哪里起源的?生命是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物至少需要多少基因,这些基因起源的?估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们活起来的?比如,鼠和人的基因组大小相似,都含是如何使它们活起来的?比如,鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似。可是鼠和人差异确如此有约三十亿碱基对

    41、,基因的数目也类似。可是鼠和人差异确如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为差别仅为 0.1%0.1%;人猿间差别约为;人猿间差别约为1%1%。但他们表型间的差异十分显。但他们表型间的差异十分显著。著。这又这又为什么?为什么?完整基因组序列的比较研究是解决这些问题的重要途径完整基因组序列的比较研究是解决这些问题的重要途径。比比较较基基因因组组学学告告诉诉你你细细菌菌怎怎样样利利用用硒硒七、基于完整基因组数据的生物进化七、基于完整基因组数据的生物进化研究研究自自18591859年年 Darwin Darwin 的

    42、物种起源的物种起源 (Origin of Species)(Origin of Species)发表以来,发表以来,进化论成为对人类自然科学和自然哲学发展的最重大贡献之一。进化论成为对人类自然科学和自然哲学发展的最重大贡献之一。进化论研究的核心是描述生物进化的历史进化论研究的核心是描述生物进化的历史(系统进化树系统进化树)和探索进和探索进化过程的机制。自上世纪中叶以来,随着分子生物学的不断发展化过程的机制。自上世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分子水平。当前分子进化的研究已是进,进化论的研究也进入了分子水平。当前分子进化的研究已是进化论研究的重要手段,并建立了一套依赖

    43、于核酸、蛋白质序列信化论研究的重要手段,并建立了一套依赖于核酸、蛋白质序列信息的理论方法。息的理论方法。生物进化完整的理论分析过程必须包含以下步骤:生物进化完整的理论分析过程必须包含以下步骤:1 1、序列相似性比较。常用的程序包有序列相似性比较。常用的程序包有BLASTBLAST、FASTAFASTA等;等;2 2、序列同源性分析。常用的程序包有、序列同源性分析。常用的程序包有CLUSTALCLUSTAL等;等;3 3、构建系统进化树。这一工作已发展了多种软件包,象、构建系统进化树。这一工作已发展了多种软件包,象PYLIPPYLIP、MEGAMEGA等;等;4 4、稳定性检验。通用的方法使用、

    44、稳定性检验。通用的方法使用 BootstrapBootstrap算法,相应的软件已包括算法,相应的软件已包括在构建系统进化树所用的软件包当中。在构建系统进化树所用的软件包当中。八、八、大规模基因功能表达谱的分析大规模基因功能表达谱的分析 人类基因组测序已完成,人们自然会提出如下的问题:即使我人类基因组测序已完成,人们自然会提出如下的问题:即使我们已经获得了人的完整基因图谱,那我们对人的生命活动能说明到什们已经获得了人的完整基因图谱,那我们对人的生命活动能说明到什么程度呢?人们进一步提出了一系列由上述数据所不能说明的问题,么程度呢?人们进一步提出了一系列由上述数据所不能说明的问题,例如:基因表达

    45、的产物是否出现与何时出现;基因表达产物的定量程例如:基因表达的产物是否出现与何时出现;基因表达产物的定量程度是多少;是否存在翻译后的修饰过程,若存在是如何修饰的;基因度是多少;是否存在翻译后的修饰过程,若存在是如何修饰的;基因敲除(敲除(knock-outknock-out)或基因过度表达的影响是什么;多基因差异表达)或基因过度表达的影响是什么;多基因差异表达与表现型关系如何等等。概括这些问题,其实质应该是:知道了核酸与表现型关系如何等等。概括这些问题,其实质应该是:知道了核酸序列和基因,我们依然不知道它们是如何发挥功能的,或者说它们是序列和基因,我们依然不知道它们是如何发挥功能的,或者说它们

    46、是如何按照特定的时间、空间进行基因表达的,表达量有多少。如何按照特定的时间、空间进行基因表达的,表达量有多少。在不同的组织中表达基因的数目差别是很大的,脑中基因表达的在不同的组织中表达基因的数目差别是很大的,脑中基因表达的数目最多,约有数目最多,约有3 34 4万个转录子。有的组织中只有几十或几百个基因万个转录子。有的组织中只有几十或几百个基因表达。不确切知道每种组织中表达基因的数目,以及每个基因的表达表达。不确切知道每种组织中表达基因的数目,以及每个基因的表达量,就无法从分子水平上了解这一组织在生命活动中的功能。同一组量,就无法从分子水平上了解这一组织在生命活动中的功能。同一组织在不同的个体

    47、生长发育阶段表达基因的种类、数量也是不同的,有织在不同的个体生长发育阶段表达基因的种类、数量也是不同的,有些基因是在幼年时期表达的,有些是中年阶段表达的,有些要到老年些基因是在幼年时期表达的,有些是中年阶段表达的,有些要到老年时期才表达;不考虑伴随着生物的生长发育,基因表达状况的变更,时期才表达;不考虑伴随着生物的生长发育,基因表达状况的变更,也无法确切地说明生命的过程。因此不少科学家认为基因组研究应当也无法确切地说明生命的过程。因此不少科学家认为基因组研究应当进入一个内函更丰富、更深刻的阶段。这一阶段的核心是获得基因的进入一个内函更丰富、更深刻的阶段。这一阶段的核心是获得基因的功能表达谱。功

    48、能表达谱。蛋白质分子是由蛋白质分子是由2020种不同的氨基酸通过共价键连接而成种不同的氨基酸通过共价键连接而成的线性多肽链,每一种蛋白质在天然条件下都有自己特定的的线性多肽链,每一种蛋白质在天然条件下都有自己特定的空间结构。但以一定氨基酸顺序排列的多肽链是如何形成有空间结构。但以一定氨基酸顺序排列的多肽链是如何形成有一定空间结构的蛋白质分子的,也就是蛋白质结构的预测,一定空间结构的蛋白质分子的,也就是蛋白质结构的预测,仍是没有完全解决的问题。仍是没有完全解决的问题。九、蛋白分子结构预测九、蛋白分子结构预测 分子模拟技术是利用计算机建立原子水平的分子模型来分子模拟技术是利用计算机建立原子水平的分

    49、子模型来模拟分子的结构与行为,进而模拟分子体系的各种物理与化模拟分子的结构与行为,进而模拟分子体系的各种物理与化学性质。利用分子模拟技术结合计算机图形技术可以更形象、学性质。利用分子模拟技术结合计算机图形技术可以更形象、更直观地研究蛋白质等生物大分子的结构。蛋白质空间结构更直观地研究蛋白质等生物大分子的结构。蛋白质空间结构更清晰的表述和研究对揭示蛋白质的结构和功能的关系、总更清晰的表述和研究对揭示蛋白质的结构和功能的关系、总结蛋白质结构的规律、预测蛋白质肽链折叠和蛋白质结构是结蛋白质结构的规律、预测蛋白质肽链折叠和蛋白质结构是非常重要的。非常重要的。l蛋白质结构预测的目的是利用已知的一级序列来

    50、构建出蛋蛋白质结构预测的目的是利用已知的一级序列来构建出蛋白质的立体结构模型,对蛋白质进行结构预测需要具体问白质的立体结构模型,对蛋白质进行结构预测需要具体问题具体分析,在不同的已知条件下对于不同的蛋白质采取题具体分析,在不同的已知条件下对于不同的蛋白质采取不同的策略,目前预测蛋白质空间结构的方法可以分为两不同的策略,目前预测蛋白质空间结构的方法可以分为两大类:大类:l1 1)分子动力学方法)分子动力学方法 l2 2)基于知识的预测方法)基于知识的预测方法 1 1)分子动力学方法)分子动力学方法 l采用分子力学、分子动力学的方法,根据物理化学的基本原理,从采用分子力学、分子动力学的方法,根据物

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:医学生物信息学课件.pptx
    链接地址:https://www.163wenku.com/p-5156952.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库