最新-第二章生物分子数据库-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最新-第二章生物分子数据库-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 第二 生物 分子 数据库 课件
- 资源描述:
-
1、生物分子数据生物分子数据高速增长高速增长 分子生物学分子生物学及相关领域研究人员及相关领域研究人员迅速获得最新实验数据迅速获得最新实验数据 建立生物分子数据库建立生物分子数据库 u 数据库记录数据库记录(entry,item)通常包括两部分通常包括两部分v 原始数据原始数据(序列组成等序列组成等)v 对这些数据进行的生物学意义的注释对这些数据进行的生物学意义的注释u 一个数据库通常链接了多个相关数据库一个数据库通常链接了多个相关数据库v 核苷酸数据库水稻抗病相关基因核苷酸数据库水稻抗病相关基因OsDR8 DQ176424Taxonomy 数据库数据库Pubmed 数据库数据库NCBI-Prot
2、ein 数据库数据库其他数据库其他数据库Cross-Referencev生物分子数据库分类 一级数据库(有冗余)v数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 v二级数据库(专业数据库)v对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的 v常用的生物分子数据库 v三大核酸序列数据库:Genbank、EMBL、DDBJ v特殊类型的核酸序列数据库:非编码RNA数据库(ncRNA)、表达序列标签数据库(dbEST)、miRNA、tRNAdbv蛋白质序列数据库:PIR、SWIS-PROT、MIPSv核酸和蛋白质三维
3、结构数据库:核苷酸三维结构数据库(NDB)、普纳大学核酸结构数据库(BNASDB)、蛋白质结构数据库(PDB,MMDB)v基因组相关数据库:人类基因组数据库(HGD)、基因组序列数据库(GSDB)、基因组在线数据库(GOLD)v基因表达数据库:基因表达库(GEO)、斯坦福微阵列数据库(SMD)、ArrayExpress国际上权威的核酸序列数据库国际上权威的核酸序列数据库 (1)欧洲分子生物学实验室的EMBL embl-heidelberg.de (2)美国生物技术信息中心的GenBank ncbi.nlm.nih.gov/Web/Genbank/index.html (3)日本遗传研究所的DD
4、BJ ddbj.nig.ac.jp/信息资源共享,以天为基础进行数据库之间的序列数据交换,三个数据库中的数据基本一致,仅在数据格式上有所差别属于国际合作项目,这三个几乎一致的数据库称为国际核酸序列数据库(INSD)这三个数据库是综合性的DNA和RNA序列数据库,每条记录代表一个单独、连续、附有注释的DNA或RNA片段 GenBank由美国国家医学图书馆的国家生物技术信息中心由美国国家医学图书馆的国家生物技术信息中心(NCBI)构建、维护和管理构建、维护和管理,NCBI位于美国马里兰国家健康研究位于美国马里兰国家健康研究所(所(NIH)。)。GenBank数据库的序列数据来源于序列发现者提数据库
5、的序列数据来源于序列发现者提交的序列、批量提交的表达序列标签(交的序列、批量提交的表达序列标签(expressed sequence tag,EST)基因组测序序列()基因组测序序列(genome survey sequence,GSS)和其)和其他测序中心提供的高通量数据,还包括美国专利商标局提供的他测序中心提供的高通量数据,还包括美国专利商标局提供的已发表专利的序列数据。已发表专利的序列数据。一、NCBI简介/GenBank数据库 GenBank(ncbi.nlm.nih.gov/genbank/)数据库包数据库包含含30万余种不同物种生物的核酸序列,这些数据万余种不同物种生物的核酸序列,
6、这些数据主要来源于全世界不同实验室和大规模测序计划主要来源于全世界不同实验室和大规模测序计划项目项目 大约大约12来源于来源于Homo sapiens排列前排列前6的物种的物种:Homo sapiens、Mus musculus、Rattus norvegicus、Bos taurus、Zea mays、Danio rerio(zebrafish)GenBank核酸序列格式v Locus name(位点名位点名,座位名,同座位名,同Accession)u每条序列有三种专有标识符(每条序列有三种专有标识符(identifier)和一个版本号)和一个版本号v GenInfo identifier(
7、GI)/Nucleotide ID(NID)v Accession number(登陆号,流水号,编号,注册号登陆号,流水号,编号,注册号)10位字符位字符 属名第一字母种名第一字母属名第一字母种名第一字母6位字符的注册号位字符的注册号 2个字母个字母6个阿拉伯数字个阿拉伯数字(present form)v Version(与登录号相同,后面有数字(与登录号相同,后面有数字1,2,3)Note:序列发生变化时,GI号改变,登录号不改变,但是版本号会发生改变GenBank核酸序列检索 NCBI检索首页检索窗口的数据库选项下拉菜单 Entrez集成检索系统 检索栏(for)输入“IL-2 huma
8、n”Entrez Gene检索结果摘要格式显示页面 Entrez Gene全文报告页面(前部分)Entrez Gene全文报告页面(后部分)GenBank核酸序列提交 欧洲生物信息学研究所(欧洲生物信息学研究所(EBI),是欧洲分子生物学实验室),是欧洲分子生物学实验室(EMBL)的一部分,)的一部分,EMBL-EBIEMBL-EBI的许多数据库是生物的许多数据库是生物学家们熟知的,包括:学家们熟知的,包括:EMBL-Bank(DNA和和RNA序列)、序列)、Ensemble(基因组)、(基因组)、ArrayExpress(基于微阵列的基因表达(基于微阵列的基因表达数据)、数据)、UniPro
展开阅读全文