药物发现的虚拟筛选方法-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《药物发现的虚拟筛选方法-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 药物 发现 虚拟 筛选 方法 课件
- 资源描述:
-
1、v 计算机模拟与化学合成、生物测试的结合构成了后基因组时计算机模拟与化学合成、生物测试的结合构成了后基因组时代新药研究的新策略。从已有的化合物,包括合成化合物和代新药研究的新策略。从已有的化合物,包括合成化合物和天然产物中寻找药物或先导化合物,是药物发现的一个重要天然产物中寻找药物或先导化合物,是药物发现的一个重要途径。到目前为止,人们只是针对大约途径。到目前为止,人们只是针对大约500 种疾种疾病的治病的治疗靶疗靶点,筛选了现已发现的点,筛选了现已发现的2 000 多万种有机化合物中大约多万种有机化合物中大约10%的化合物,但仍然有大量的潜在活性化合物未被发现。的化合物,但仍然有大量的潜在活
2、性化合物未被发现。v 随着科学技术的发展,各种先进技术应运而生(随着科学技术的发展,各种先进技术应运而生(X 射线晶射线晶体衍射法、多维核磁共振法、扫描隧道显微技术等),使体衍射法、多维核磁共振法、扫描隧道显微技术等),使得越来越多生物靶标(蛋白质、核酸、多糖等)的空间结得越来越多生物靶标(蛋白质、核酸、多糖等)的空间结构被解构被解析。析。v 同同时计算机科学的发展又极大地提高了计算和分析的速度时计算机科学的发展又极大地提高了计算和分析的速度和和精度。精度。v 因因此,自上世纪此,自上世纪90 年代起,年代起,合理药物设计合理药物设计就逐渐成就逐渐成为一种实用技术接融入到药物研发的各个环节。为
3、一种实用技术接融入到药物研发的各个环节。一、合理药物设计一、合理药物设计结构生物学兴起结构生物学兴起(2020世纪世纪8080年代中后期)年代中后期)生物大分子的三维结构测定生物大分子的三维结构测定结构确定的生物大分子数目大增结构确定的生物大分子数目大增基于生物大分子三维结构的基于生物大分子三维结构的药物分子设计方法药物分子设计方法药物的化学特性药物的化学特性生物学特性生物学特性合理药物设计合理药物设计成功例子成功例子奈非那韦(奈非那韦(nelfinavirnelfinavir)抗艾滋病药物抗艾滋病药物 HIV-1蛋白酶抑制剂蛋白酶抑制剂依马依马替尼(替尼(imatinibimatinib)治
4、疗慢性骨髓型白血病药物治疗慢性骨髓型白血病药物二、数据库空间二、数据库空间化学空间生物空间大量疾病靶点大量疾病靶点(生物大分子)(生物大分子)大量小分子化合物大量小分子化合物化合物数据库合成化合物库天然化合物库组合化合物库药物分子库类药化合物库生物大分子数据库核酸分子库蛋白质分子库v 研究对象 化学信息学:小分子 生物信息学:小分子结构单元构成的基因和蛋白质等大分子,本质上都是 化学物质。v 计算方法 基于回归的聚类分析;支持向量机;神经网络;遗传算法等。v 发挥作用方面 核酸和蛋白质功能和结构;小分子配体和蛋白质受体的相互作用;酶催化 等方面。化学信息学和生物信息学的共同点化学信息学和生物信
5、息学的共同点是相互依存,相互影响,需结合在一起,才能解决大多数的实际问题!v 虚拟筛选的时间:虚拟筛选的时间:在化合物组合库合成和/或筛选之前。v 虚拟筛选的空间:虚拟筛选的空间:在计算机上进行模拟设计和筛选。v 虚拟筛选的方法:虚拟筛选的方法:直接方法:基于分子对接(molecular docking)的虚拟筛选 间接方法:基于药效基团(pharmacophore)的虚拟筛选虚拟筛选(虚拟筛选(virtual screening,VS)v虚拟筛选技术是药物设计方法的延伸和推广,广义地讲只要是基于某种提问形式,从虚拟筛选技术是药物设计方法的延伸和推广,广义地讲只要是基于某种提问形式,从现有的小
6、分子数据库中,搜寻符合条件的化合物都可以称之为虚拟筛选。这其中包括现有的小分子数据库中,搜寻符合条件的化合物都可以称之为虚拟筛选。这其中包括基于某些分子特性的数据库搜索、基于分子对接的数据库搜索、基于药效团的数据库基于某些分子特性的数据库搜索、基于分子对接的数据库搜索、基于药效团的数据库搜索等,其目的是从几十乃至上百万个分子中筛选出新的先导化合物。由于实体的药搜索等,其目的是从几十乃至上百万个分子中筛选出新的先导化合物。由于实体的药物筛选需要构建大规模的化合物库,提取或培养大量实验必须的靶酶或者靶细胞,并物筛选需要构建大规模的化合物库,提取或培养大量实验必须的靶酶或者靶细胞,并且需要复杂的设备
7、支持,因而进行实体的药物筛选要投入巨额资金。而虚拟药物筛选且需要复杂的设备支持,因而进行实体的药物筛选要投入巨额资金。而虚拟药物筛选是将药物筛选的过程在计算机上模拟,对化合物可能的活性作出预测,这样就能够集是将药物筛选的过程在计算机上模拟,对化合物可能的活性作出预测,这样就能够集中目标,大大降低实验筛选化合物的数量,从而缩短研发周期、节约经费开支。中目标,大大降低实验筛选化合物的数量,从而缩短研发周期、节约经费开支。v虽然早在虽然早在20 世纪世纪70 年代虚拟筛选技术已经得到应用,但由于技术本身的不成熟,使年代虚拟筛选技术已经得到应用,但由于技术本身的不成熟,使得在新药开发上仍然主要依靠传统
8、的实验筛选。近年来,随着虚拟药物筛选成功地发得在新药开发上仍然主要依靠传统的实验筛选。近年来,随着虚拟药物筛选成功地发现了一些有开发价值的先导化合物,这项技术又重新引起大家的重视现了一些有开发价值的先导化合物,这项技术又重新引起大家的重视。化学信息学化学信息学v 产生的背景 组合化学和高通量筛选,出现了巨大的信息,需要快速收集、存储、分析和处理,随着信息技术向化学领域的渗透,形成了新的交叉学科化学信息学。v 研究内容 化合物信息在计算机中的表示 化合物数据库的建立、使用和管理 化合物相似性、多样性及分子类药性分析 化合物定量构效关系化学信息学 Chemoinformatics,chemical
9、 informatics,Cheminformatics,chemi-informaticsv 利用计算机信息处理技术对化学分子结构和相关信息进行管利用计算机信息处理技术对化学分子结构和相关信息进行管理的一种综合性技术和学科理的一种综合性技术和学科v 应用化学信息学可促进化学信息的获取、转化与共享应用化学信息学可促进化学信息的获取、转化与共享一、化学信息的表示方法化学化学分子分子一维结构:一维结构:化合物名称(俗名);线性符号表示法。化合物名称(俗名);线性符号表示法。二维结构:二维结构:原子用元素符号,键用短线,即化合物结构式。为平面结构。原子用元素符号,键用短线,即化合物结构式。为平面结构
10、。三维结构:三维结构:原子的空间位置、相互间距离、键角和二面角等。原子的空间位置、相互间距离、键角和二面角等。分子表面:分子表面:建立在三维结构基础上,能与分子的三维结构一一对应。建立在三维结构基础上,能与分子的三维结构一一对应。一维结构NC(Cc1ccccc1)C(O)=O(SMILES编码)三维结构二维结构分子表面苯丙氨酸分子结构表征层次苯丙氨酸分子结构表征层次OHOH2N(一)一维结构表示(一)一维结构表示IUPACROSDAL不十分适合计算机的处理不十分适合计算机的处理主要用于主要用于Beilstein 系统系统是是SMILES的改进,除有机的改进,除有机小分子,还表示大分子,小分子,
11、还表示大分子,聚合物和组合库。聚合物和组合库。1986年提出的简化的年提出的简化的分子线性输入系统分子线性输入系统SMILES(简化分子线性输入系统)(简化分子线性输入系统)编码的基本原则编码的基本原则原子通常以大写元素符号表示(省略氢原子),芳香结构原子则以小写表示。相邻原子依次排放在一起,单键通常省略,双键和三键分别以“=”和“#”表示,芳香键以“:”表示,也可省略。分支部分放在括号内,环则打开,并赋予断开键两端的原子以相同的数值。双键“/”表示顺式,“”表示反式。原子顺时针排列用表示,逆时针排列用表示。甲烷 CH4 C乙醇 C2H5OH CCO氰化氢 HCN C#N环已烷 C6H12 C
12、1CCCCC1吡啶 C5H5N n1ccccc1异丁酸 (CH3)2CHCO2H CC(C)C(=O)O反式二溴甲烷 Br/C=C/Br 或BrC=CBr顺式二溴甲烷 BrC=C/Br 或Br/C=CBrL-丙氨酸 NCH(C)C(=O)OD-丙氨酸 NCH(C)C(=O)O举例说明举例说明v 苯丙氨酸OHOH2NNC(Cc1ccccc1)C(O)=OOHCNC/C=CC=CH(O)C#NSMILESSMILES编码的立体化学信息表示编码的立体化学信息表示SLN编码(编码(Sybyl线性标记法)的规则线性标记法)的规则原子以其元素符号表示,原子以其元素符号表示,氢原子也要显示氢原子也要显示;单
13、键省略,双键、三键单键省略,双键、三键和芳香键和芳香键分别以分别以“=”“#”和和“:”表示;表示;分支也采用括号表示;环也打开,依靠环上一个预先定义好的分支也采用括号表示;环也打开,依靠环上一个预先定义好的具有唯一编号的原具有唯一编号的原子及子及符号来识别符号来识别,如环己烷表示为,如环己烷表示为C15H2CH2CH2CH2CH2CH215;原子和键的属性(如电荷、立体化学性质等)可通过方括号原子和键的属性(如电荷、立体化学性质等)可通过方括号 或尖括号或尖括号在该在该原子后标记出;原子后标记出;对大分子的原子,可使用缩写,如氨基酸可以用其三个字母缩写形式表示。对大分子的原子,可使用缩写,如
14、氨基酸可以用其三个字母缩写形式表示。(二)二维结构表示(二)二维结构表示1 1、图论基础和图的矩阵表示、图论基础和图的矩阵表示 一个简单的图由顶点(V)和边(E)组成,因此图被定义为一个三元组,为映射函数。在下面一个简单的无向图中,V=1,2,3,4,E=e1,e2,e3,e4,e5,e6。1423e1e2e4e3e5e6 图也可用矩阵表示:设G=为无向图,令mij等于顶点vi与边ej的关联次数,则称(mij)n*m为G的关联矩阵,记为M(G)。M(G)=1 1 1 0 0 00 1 1 1 1 00 0 0 0 1 11 0 0 1 0 11423e1e2e4e3e5e6CCCHCCCCNH
15、CCOOHOHOH2N用图表示苯丙氨酸的结构用图表示苯丙氨酸的结构 2 2、化合物结构的矩阵表示、化合物结构的矩阵表示(1)邻接矩阵(以乙醛为例)邻接矩阵(以乙醛为例)(2)距离)距离矩阵:表示了相应原子之间的距离:几何距离(用矩阵:表示了相应原子之间的距离:几何距离(用表示),表示),拓扑距离(两原子之间连接的键的个数)拓扑距离(两原子之间连接的键的个数)(3)键)键矩阵:矩阵元素为相连接的两个原子之间的键级。矩阵:矩阵元素为相连接的两个原子之间的键级。双键:双键:2,三键:,三键:3。(4)关联)关联矩阵:是一个矩阵:是一个nm的矩阵。的矩阵。顶点(原子)作为列(顶点(原子)作为列(n),
16、边(化学键)作为行(),边(化学键)作为行(m),),如果边在顶点内,则相应的元素置为如果边在顶点内,则相应的元素置为1。3 3、连接表、连接表20世纪80年代开始,成为化合物在计算机中表示的最主要方法。首先对每个原子进行编号并列表然后在另一表格中列出键的信息,键级用整数表示,1表示单键,2表示双键。(三)三维结构表示(三)三维结构表示1 1、直接坐标法、直接坐标法 用迪卡尔坐标直接存储每用迪卡尔坐标直接存储每个原子的三维坐标(个原子的三维坐标(x,y,z)2、内坐标法v 每个原子位置以与其他原子间的每个原子位置以与其他原子间的3 3个相对位置关系表示个相对位置关系表示相对相对距离、键角、二面
17、角距离、键角、二面角(四)分子存储格式及其相互转换(四)分子存储格式及其相互转换文件格式扩展名特点Molfile*.molMDL公司提出的分子文件格式,应用最广泛的连接表格式Mol2file*.2molTripos公司推出,包含一个或多个化合物。目前药物设计领域最流行的格式Maestro*.maeSchodinger公司推出的一种文件格式,包含一个或多个化合物。SDfile*.sdf结构数据文件,MDLMolfile的扩展,包含一个或多个化合物。RDfile*.rdf反应数据文件,MDLMolfile的扩展,包含一个或多个反应。SMILES*.smi应用最广泛的线性编码和文件格式PDB*.pd
18、b蛋白质数据文件,蛋白质和多聚核苷酸的3D结构信息文件CIF*.cif晶体信息文件格式,用于表示有机分子的3D结构JCAMP*.jdx,*.dx,*.cs原子和分子物理数据,结构和光谱文件格式CML*.cml化学标注语言;XML在化学上的扩展 基本存储基本存储分子的元素组成、原子坐标、原子连接关系分子的元素组成、原子坐标、原子连接关系 其他存储其他存储分子子结构信息,适用于生物大分子分子子结构信息,适用于生物大分子原子电荷信息,调用时不必再计算原子电荷信息,调用时不必再计算确定特定原子化学环境的原子类型信息确定特定原子化学环境的原子类型信息二、化合物数据库的生产和管理 目前有很多商业化合物数据
19、库可以利用目前有很多商业化合物数据库可以利用 MDL药物数据报告(药物数据报告(MDDR)含有)含有115000个类药性个类药性 化合物。化合物。美国国家癌症研究所(美国国家癌症研究所(NCI)数据库含有)数据库含有250000个个 化合物。化合物。MDL ISIS化学数据库管理系统u ISIS系统提供了基于系统提供了基于Oracle 数据库系统的各类化学信息系统的管理和开发工数据库系统的各类化学信息系统的管理和开发工具,可以同时管理化学结构、化学反应、生物活性及谱图等多种化学信息。具,可以同时管理化学结构、化学反应、生物活性及谱图等多种化学信息。u ISIS已应用于全球超过已应用于全球超过8
20、0%的化学与制药企业,已成为事实上的化学信息管的化学与制药企业,已成为事实上的化学信息管理系统的工业标准。理系统的工业标准。ISIS(Integrated Scientific Information Management System)MDL的综合性结构和反应管理软件由三个主要由三个主要模块模块组成组成:(1)化学化学信息管理系统:信息管理系统:ISIS/HOST主服务器应用程序,进行通讯连接,集主服务器应用程序,进行通讯连接,集中数据库数据并作处理中数据库数据并作处理(2)化学化学信息生成和管理软件:信息生成和管理软件:ISIS/BASE用于生成局部数据库及处理信息用于生成局部数据库及处理
21、信息(3)化学化学画图软件:画图软件:ISIS/DRAW用于输入结构式和搜寻询问条件用于输入结构式和搜寻询问条件2D结构输入计算机绘制化学结构式计算机绘制化学结构式 首先输入原子和键的骨架结构,原子数、电荷会自动变为上下标首先输入原子和键的骨架结构,原子数、电荷会自动变为上下标 软件的模板中收集大量分子片段软件的模板中收集大量分子片段 可智能分析结构式,处理结构式的编码和变换可智能分析结构式,处理结构式的编码和变换 还可有附加功能,如自动命名、化学计算、光谱分析等还可有附加功能,如自动命名、化学计算、光谱分析等三维结构的转化 3D结晶结构参数转入3D数据库 软件将2D化学结构迅速地转为3D模型
22、三、分子相似性和多样性分析n分子相似性和多样性分析方法的分子相似性和多样性分析方法的原则原则:结构相似的分子有着相似的性质或活性。:结构相似的分子有着相似的性质或活性。n作用作用:在识别新的具有与已知化合物相同性质或活性的化合物时具有十分重要的作用。:在识别新的具有与已知化合物相同性质或活性的化合物时具有十分重要的作用。数据库的化学多样性(数据库的化学多样性(chemical diversity):数量巨大的、结构不同的贮藏和检索系统数量巨大的、结构不同的贮藏和检索系统适用于先导化合物发现适用于先导化合物发现 数据库的化学相似性(数据库的化学相似性(chemical similarity)适用
23、于先导化合物优化适用于先导化合物优化n评价方法评价方法:通过计算分子的:通过计算分子的描述符描述符,并比较化合物描述符的近似程度。,并比较化合物描述符的近似程度。分子描述符u 概念:概念:在相似性和多样性分析中,需要建立化合物结构和它们生在相似性和多样性分析中,需要建立化合物结构和它们生 物活性或者理化性质的映射,分子描述符就是其中的一种映射。物活性或者理化性质的映射,分子描述符就是其中的一种映射。u 作用:作用:通常一个或多个描述符可以用来描述分子的结构、性质等,通常一个或多个描述符可以用来描述分子的结构、性质等,如如lgP在一定程度上反映了分子穿透细胞膜的能力;拓扑指数描述在一定程度上反映
24、了分子穿透细胞膜的能力;拓扑指数描述 了结构的复杂性。了结构的复杂性。u 描述符的描述符的内容是由两方面决定的内容是由两方面决定的,一是化合物的分子表示,二是计,一是化合物的分子表示,二是计 算描述符的算法。算描述符的算法。分子表示方法描述符示 例0D原子数目氢原子数目,杂原子数目,重原子数目键数目双键数目,三键数目,可旋转键数目相对分子质量相对分子质量,平均相对分子质量分子性质脂水分配系数1D碎片数目伯碳原子数目,叔碳原子数目;手性碳原子数目,羟基数目,羧基数目;氢键供体数目,氢键受体数目2D拓扑描述符Zagreb指数,Wiener指数,Balaban J指数,连接指数,kappa形状指数,
25、2D自关联向量3D几何描述符分子偏心率,回转半径,3D Wiener指数,3D Balaban 指数,WHIM 描述符,GETAWAY 描述符,3D 自关联向量3D表面性质平均分子静电势,疏水势,氢键势3D网络性质比较分子场分析4D3D坐标+构象取样分子描述的分类分子描述的分类分子相似性分析方法分子相似性分析方法v基于定性特征的和基于定量特征的。v对于两个化合物A和B,a是A所具有而B不具有的特征数目 b是B所具有而A不具有的特征数目 c是两者共同的特征数目 d为两者都不具有的特征数目 c和d表示了化合物A和B之间的相似性 a和b表示了化合物A和B之间的多样性 所有的特征数目为n=a+b+c+
展开阅读全文