基因表达数据库课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《基因表达数据库课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 表达 数据库 课件
- 资源描述:
-
1、 1.基本概念及数据库结构GEO(Gene Expression Omnibus)基因表达数据库,是由美国生物技术信息中心(NCBI)在 2000 年开发的一个开放的基因表达丰度的数据库,该数据库不仅包括许多基于基因芯片的基因表达数据信息,同时还包括一些非芯片技术如SAGE 和质谱的基因表达丰度信息。至 2014 年 1 月,该数据库已经收录了 12 422 个不同平台(Platform)上的 1062 513个样品(Sample)的基因表达数据信息。数据提交遵循 MIAME 原则,并提供了供查询和下载实验及基因表达资料的工具。登陆网址为:http:/www.ncbi.nlm.nih.gov/
2、geo/。2.数据库结构 提交给 GEO 的数据分为三种不同的实体,即平台(platform)、样本(sample)和系列(series)。平台,关于以高通量方式(microarray,SAGE)检查样本的物理试剂的信息。一个平台含有多个提交者提交的样本。平台的命名规则为“GPL+n(n 代表数字)”。样本,关于被检查的 mRNA 样本,实验条件和实验产生的基因表达测量数据信息。一个样本必须涉及一个平台,可能会包括在许多系列之中。样本的命名规则为:“GSM+n”。系列,样本收集,样本是如何相关的,如何排序的,分析是如何进行的,和聚类数据是如何获得的信息。系列含有数据的摘要信息。系列的命名规则为
3、“GSE+n”。GEO 的原始数据被放置在平台,样本和系列这三个数据库中;根据原始数据观测角度的不同,又将这些数据整理并分置两个不同的数据库中:数据集(datasets)和表达图谱(profile);数据集以“实验”的角度存储了所有的元数据,表达图谱从“基因”的角度存储了单个基因表达的数据资料。3.数据上传与下载 在 GEO 中上传数据前先要注册账号,注册信息中的联系方法会体现在 GEO 记录中。数据上传可以使用几种不同的格式,如电子表格、纯文本和 XML格式。不管采用哪种上传方式,最终的结果及包含的信息都相同。所有的 GEO 信息可以利用不同的工具下载不同格式的数据:查询到的每一条记录下均有
展开阅读全文