计算机药物辅助设计cadd课件9-10.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《计算机药物辅助设计cadd课件9-10.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 药物 辅助设计 cadd 课件 10
- 资源描述:
-
1、2022-12-17化学信息学(Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics)利用计算机信息处理技术对化学分子结构,性质,来源及用途等相关信息进行管理(包括储存,分析,处理,检索和传递等)的一种综合性技术和学科。应用化学信息学可促进化学信息的获取、转化与共享 化学信息处理2D:3D:H3CC化学分子结构的层次1D:CH3CHOOH*一、2D和3D分子结构的计算机处理方法(一)以一维形式表示对2D结构进行编码储存和交换化学结构式数据的命名法 SMILES(Simplified Molecular I
2、nput Line Entry System,简化分子线性输入系统)SLN(Sybyl linear notation,Sybyl线性标记法)*SMILES按化合价模型,每个原子被氢原子饱和;双键用=表示;三键用#表示;环化分子用闭合原子序号表示;芳香环中不饱和原子用小写字母表示甲烷CH4C水乙醇H2O OC2H5OH CCO氰化氢 HCN C#N环已烷 C6H12C1CCCCC1吡啶C5H5N n1ccccc1*分子中分支用()表示;用/和 表示双键顺反异构;对映异构:手性原子用 表示,表示反时针,表示顺时针反式二溴甲烷顺式二溴甲烷L-丙氨酸D-丙氨酸Br/C=C/Br 或 BrC=CBrB
3、rC=C/Br 或 Br/C=CBrNCH(C)C(=O)ONCH(C)C(=O)O*用图表示 用矩阵表示CCCCCCCNCHHCOHO*(二)以二维形式表示 用连接表表示*(三)以三维形式表示1、直接坐标法用卡迪尔坐标直接存储每个原子的三维坐标(x,y,z)*每个原子位置以与其他原子间的3个相对位置关系表示距离、夹角、二面角r1和r2为键长,为键角,为扭转角87651432137862 45zr2r1y1,2-二氯乙烷*2、内坐标法(四)分子存储格式及其相互转换每一软件系统都有自己的分子存储格式MDL公司的MOL格式(MACSS格式)Tripos公司的MOL2格式剑桥晶体数据库CSD的FDA
4、T和CIF格式蛋白质数据库PDB的PDB格式(ENT格式)*基本存储:分子的元素组成、原子坐标、原子连接关系还能存储:分子子结构信息,能适用于生物大分子原子电荷信息,调用时不必再计算确定特定原子化学环境的原子类型信息*二、化合物数据库的生成和管理输入搜寻和检索管理输出合成反应信息管理软件及数据库目的:用于计算机获取,管理,搜寻,检索合成反应,包括反应物,产物的结构式及其反应的有关信息计算机辅助有机合成:应用计算机合成反应管理软件从反应数据库中寻找和检索合成反应方法合成反应信息管理软件及数据库管理软件的功能:输入:绘制反应物和产物结构输入其他反应信息搜寻与检索:一般用户绘制出并指明产物或反应物结
5、构。ISIS(Integrated Scientific Information ManagementSystem)MDL的综合性结构和反应管理软件 由三个主要分软件组成:(1)ISIS/DRAW用于输入结构式和搜寻询问条件(2)ISIS/BASE用于生成局部数据库及处理信息(3)ISIS/HOST主服务器应用程序,进行通讯连接,集中数据库数据并作处理2D结构输入:计算机绘制化学结构式 首先输入原子和键的骨架结构,原子数、电荷会自动变为上下标 软件的模板中收集大量分子片段 可智能分析结构式,处理结构式的编码和变换 还可有附加功能,如自动命名、化学计算、光谱分析等三维结构的转化:3D结晶结构转入
6、3D数据库软件将2D化学结构迅速地转为3D模型NHHNCH3OCH3O三.组合化学信息管理软件及数据库意义:产生先导化合物的有效方法库中化合物既可是分子实体,也可是虚拟化合物库的质量指标:化学多样性先导化合物优化库的规模 先导化合物筛选103106103分子相似性和多样性分析数据库的化学多样性(chemical diversity)数量巨大的、结构不同的贮藏和检索系统适用于先导化合物发现数据库的化学相似性(chemical similarity)适用于先导化合物优化化学多样性的定量表达 Tanimoto系数用化学空间中电荷和电势等描述符比较不同分子的性质TC=c/(a+b-c)a为A中基础片断
7、的描述符的数目;b为B中基础片断的描述符的数目;c为共有的基础片断的描述符的数目相同分子TC=1;分子没有共同描述符时TC=0四、化学信息学资源FCD(Fine Chemicals Directory)MDL 维护。收载约90 000个化合物和20 000种化合物数据,包括化学系统名、俗称、分子式、分子量、供应商、价格、CAS登录号、纯度等。可通过结构式或其它任何数据检索ACD(Available Chemicals Directory)MDL维护。FCD数据库加上可大批量供货的化学品信息。目前有25万个化合物CSD(Cambridge Structure Database)20多万个结晶的3
8、D结构实验数据及相关数据生物信息处理生物信息学(bioinformatics)基于数学、生命科学、化学和计算机科学的交叉学科 利用计算机信息处理技术对大量生物大分子作信息获取、加工、储存、分类、检索与统计分析,揭示生物大分子的分子结构、功能、同源性和进化关系 推动生命科学的发展,为创新药物的研究和开发奠定基础生物信息学的内容建立可贮存和管理大量生物信息学数据集的数据库处理大量数据的算法和统计方法分析和解释不同类型的生物数据,如RNA、DNA和蛋白质序列、蛋白质结构、基因表达以及生化途径可视化,数据处理结构预测(同源模建)GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACC
9、TCTGACACAT.ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV.序列分析蛋白质作用网络生物信息学的应用分子动力学模拟分子相互作用PowerEdge6400(一)单个序列分析根据单个氨基酸的物化性质推测整个蛋白质的性质,也可预测二级结构出现的可能性20种氨基酸的疏水参数*一、核酸和蛋白质的序列分析 sequence analysis根据统计值:谷氨酸(Glu)经常出现在-螺旋中;缬氨酸(Val)常在-折叠中发现;脯氨酸(Pro)通常不出现于-螺旋中和-折叠中,而倾向于在回折中(数值=1代表偏好处于平均;1代表偏好大于平均;1代表偏好小于平均
10、)*(二)双重序列比较序列比对sequence alignment序列对比可以用各种矩阵表达并作相似性打分两个残基越相似则打分值越高*多重序列比对可以从更多细节上揭示保守模式和结构信息可采用多种统计算法进行多重序列比对*(三)多重序列比对 multiple sequence alignment二、蛋白质三维结构预测基因蛋白质一级结构蛋白质三维结构决定折叠预测主要方法蛋白三维结构预测从头预测法ab initio线引法threading同源模建法homology modeling基于知识的预测方法knowledge-based prediction基于理论的预测方法theory-based pre
11、diction1、从头预测法(ab initio prediction)采用理论计算(分子力学、分子动力学、量子化学)方法,直接从分子和原子参数计算出蛋白质分子的稳定构象,理论上最理想的方法,但计算量极大,对于实际分子的计算超过能力范围2、穿针引线法,线串法,线程法,折叠识别(threading,fold recognition)根据已知的蛋白质三维结构来预测可能的三维结构 基于知识的预测可应用于进化非常疏远的结构预测未知蛋白序列与折叠库中已知结构的蛋白序列作匹配计算,将序列吻合的三维结构模块串连起来,得到整个蛋白三维结构3、同源蛋白模建法 homologous model building比
12、较分子模拟法 comparative molecular modeling同源模建 homology modeling同源蛋白法 protein homology根据已知的蛋白质三维结构来预测可能的三维结构 基于知识的预测同源蛋白有着相似的来源、相似的结构和生物功能。通过比较蛋白序列的相似性,按同源蛋白的三维结构为模板,构建未知蛋白的结构一般要求同源性在30%以上,特别是在结合区域同源性要好步骤:(1)根据未知蛋白质的序列,寻找同源蛋白(2)二重或多重序列对比(3)找出共同的二级结构区域,构建骨架(4)对初始模型作能量优化(5)判断结构合理性三、代表性生物信息学数据库(一)核酸数据库GenBa
13、nk美国国立卫生研究所美国国立卫生研究所NIH国家生物技术信息 中心NCBINucleic Acid Database(NDB)由EuropeanMolecular Biology Laboratory(EMBL)创建,现由英 国 剑 桥 的 欧 洲 生 物 信 息 学 研 究 所(EuropeanBioinformatics Institute,EBI)维护DNA Data Bank of Japan(DDBJ)日本国立遗传学研究所的日本信息生物学中心(Center forInformation Biology,CIB)开发维护三大库可交互PDB(Protein Data Bankat Br
14、ookhaven NationalLaboratories)美国Research Collaboration forStructural Bioinformatics(RCSB)开发维护的多肽、酶、病毒、碳水化合物和核酸的三维结构数据(二)蛋白质数据库虚拟筛选(virtual screening)计算机辅助筛选(computer-aided screening)计算机筛选(screening in silico)三维结构搜寻(three-dimensional structure searching)虚拟:计算机上进行 不需要化合物,只需结构 化合物数据库 实际分子的索引;虚拟分子;类药性分子
展开阅读全文