化学信息学course-11课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《化学信息学course-11课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 化学 信息学 course 11 课件
- 资源描述:
-
1、1课程内容安排w 第十一讲:Chemoinformaticsn分子结构信息的计算机存储和表达分子结构信息的计算机存储和表达n分子二维数据库和数据库检索技术分子二维数据库和数据库检索技术w 第十二讲:Cheminformaticsn分子多样性和化合物筛选分子多样性和化合物筛选n三维结构的实验数据资源三维结构的实验数据资源n基于三维结构的计算方法基于三维结构的计算方法n化合物组合库化合物组合库n高通量虚拟筛选高通量虚拟筛选2化学信息学第十一讲Chemoinformatics3内 容w 相关名词辨析及化学信息学由来w 分子结构信息的计算机存储和表达w 分子二维数据库和数据库检索技术4名词解释 Com
2、putational Chemistry 计算化学:使用数学方法计算分子性质和模拟分子行为的方法。并且包括合成设计、数据库搜索、组合库操作等(Hopfinger,1981;Ugi et al.,1990).IUPAC Computational 5相关名词辨析http:/ Molecular Modeling 分子建模方法:使用计算化学和图形显示技术研究分子结构和性质,从而获得在给定环境下的分子三维结构的近似表达 IUPAC Medicinal Chemistry,IUPAC Computational7名词解释 Chemometrics 化学统计学:使用数理统计学的方法对化学信息(如有机,分
3、析和药物化学)进行分析,或进行化学实验的设计和模拟IUPAC Computational8名词解释 Bio-informatics 生物信息学:使用数理统计学的方法对化学信息(如有机,分析和药物化学)进行分析,或进行化学实验的设计和模拟IUPAC Computational9名词解释 Chemoinformatics?:Chemoinformatics 是是知识管理知识管理(knowledge management)的有机组成部分的有机组成部分Nicholas J.Hrib,Norton P.PeetChemoinformatics:are we exploiting these new sc
4、ience?“Drug Discovery Today 5(11):483-485,Nov.200010名词解释 Cheminformatics 化学信息学:结合化学合成、生物筛选及数据挖掘技术指导药物发现和开发,用于合理的设计具有类药性质的化合物,构建用于虚拟高通量筛选的智能化合物库,研究以往的数据知道先导化合物的优化Cheminformatics:Intelligent Drug Discovery May 28-30,2003 Philadelphia PA 1112Human Alcohol Dehydrogenase(Adh1A)w 分类:Oxidoreductasew 简介:Mol
5、ecule:Class I Alcohol Dehydrogenase 1,Subunit;Chain:A,B;Engineered:Yesw 实验方法:X-ray Diffraction13Human Alcohol Dehydrogenase(Adh1A)14分子结构信息的计算机存储和表达w 如何使用计算机存储化学结构?w 如何处理存储的结构信息?w 计算机在Chemoinfomatics中的应用?15分子结构信息表达的内容n原子n原子间的连接l键型n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO16分子结构信息表达的内容n原子n原
6、子间的连接l键型n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO17分子结构信息表达的内容n原子n原子间的连接l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO18分子结构信息表达的内容n原子n原子间的连接l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH3+OO19分子结构信息表达的内容n原子n原子间的连接l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atoms
7、OHCH2C14HNH2OHO2021分子结构一维表示法(Line Notation)w 简介:n使用字符串表示分子结构w 现有的几种表示法nWiswesser Line Notation(WLN)(Dialog)nSimplified Molecular Input Line System(SMILES/SMARTS)(Daylight)nRepresentation of Structure Diagram Arranged Linearly(ROSDAL)-(Beilstein)nSybyl Line Notation(SLN)-(Tripos)OHCH2CHNH2OHO13456891
8、11213wROSDAL1O-2=3O,2-4-5N,4-6-7=-12-7,10-13OwSLNOHC(=O)CH(NH2)CH2C1=CHCH=C(OH)CH=CH1wWLN QVYZ1R DQwSMILESOC(=O)C(N)CC1=CC=C(O)C=C122分子结构一维表示法(Line Notation)Simplified Molecular Input Line Entry System(SMILES)基于价键模型的标记法Author:Dave Weininger(Daylight)23CMethaneC1CCCCC1cyclohexaneOwaterc1ccccc1benzene
9、CCethaneCOmethanolOC methanol NCH(C)C(=O)OCCOethanolCC(=O)CacetoneO=C=Ocarbon dioxideL-alanineSMILE标记示例24atom:symbol sign 双字母原子符号:Br(Upper/lower case)原子的预定义价键:B(3),C(4),N(3,5),O(2),P(3,5),S(2,4,6),F(1),Cl(1),Br(1),I(1)大写的字母表示非芳香体系示例:ClHydrochloric acidSH2S Fe+Iron(II)cationAtoms 语法25Bond 语法语法bond:|-
10、|=|#|.;single|double|triple|disconnectionEthene C=CFormaldehyde C=OHydrogen Cyanide C#NButadiene C=CC=C26分支分支 将支链放在括号中SMILES:CCCC(C(=O)O)CCCbranch:()|()|()|()27环定义环定义 合环键用数字标出合环键用数字标出28 非连接关系(disconnections):同位素表示:SMILES:Na+.O-c1ccccc1specified inside brackets.SMILES:13CH4其它定义其它定义29F/C=C/FF/C=CF双键构型
11、的表示双键构型的表示 /30从旋光中心沿字符串顺序观察,逆时针为,顺时针为NC(C)(F)C(=O)O手性表示手性表示 or or 31氢原子表示氢原子表示显式表示氢原子的四种情况:1.带电荷的氢,如:质子 H+2.与其它氢相连的氢,如:氢气 HH 3.氢桥4.同位素,如:重水,2HO2H 32芳香性芳香性N1ccccc1 N1=CC=CC=C1C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C133O-n+1ccccc1pyridine-N-oxideOCH1CCCCCH1Ocis-resorcinolCC(C)NCC(O)COc1cccc2ccccc12Propranolo
12、l a beta-blocker一些例子一些例子34SMILES的正规化标记c1ccccc1Oc2ccccc2(N)Nc2ccccc2Oc1ccccc1O(c1ccccc1)(c2ccccc2N)Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 35分子结构一维表示法(Line Notation)w 优点:n易于手工书写n结构紧凑w 局限:n信息量小n对复杂分子的标记比较繁琐。n某些情况下,标记具有二义性。36分子结构一维表示法的应用 构造查询语言 子结构匹配 相似性搜索(结构指纹)化合物组合库的压缩存储 反应数据库37SMILE
13、S 应用示例w ClogP 辛醇/水分配系数w 实验方法w logP计算 pH 7.0时的分配系数w 数据库规模=2,000,000化合物w 工作站搜索速度=500,000/s38ClogP的计算使用片断加和法(片断值校正项)片断值基于实验值,与片断的类型有关,如:极性基团、卤素、离子、不饱和键校正项描述不同片断间的相互作用,如:氢键等39http:/ 分子结构二维表示法n连接表 (Connection Table)n邻接矩阵(Adjacency Table)42连接表 (Connection Table)w 简介:计算机系统中主流结构表示方法w 类型 n“内部”CTs(内存)l程序处理n“外
14、部”CTs(磁盘文件)l文件存储 l数据交换43“Redundant”Connection Table1.O1 2 12.C0 1 1 3 2 4 13.O0 2 24.C 1 2 1 5 1 6 15.N2 4 16.C2 4 1 7 17.C0 6 1 8 212 18.C1 7 2 9 19.C1 8 110 210.C0 9 211 113 111.C110 112 212.C111 2 7 113.O110 19OHCH2CHNH2OHO13456811121344MDL Connection Tablew 数据交换的事实标准w 衍生文件格式nMolfile(single molec
展开阅读全文