书签 分享 收藏 举报 版权申诉 / 16
上传文档赚钱

类型基因表达数据库课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4104954
  • 上传时间:2022-11-11
  • 格式:PPT
  • 页数:16
  • 大小:764.25KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《基因表达数据库课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基因 表达 数据库 课件
    资源描述:

    1、 1.基本概念及数据库结构GEO(Gene Expression Omnibus)基因表达数据库,是由美国生物技术信息中心(NCBI)在 2000 年开发的一个开放的基因表达丰度的数据库,该数据库不仅包括许多基于基因芯片的基因表达数据信息,同时还包括一些非芯片技术如SAGE 和质谱的基因表达丰度信息。至 2014 年 1 月,该数据库已经收录了 12 422 个不同平台(Platform)上的 1062 513个样品(Sample)的基因表达数据信息。数据提交遵循 MIAME 原则,并提供了供查询和下载实验及基因表达资料的工具。登陆网址为:http:/www.ncbi.nlm.nih.gov/

    2、geo/。2.数据库结构 提交给 GEO 的数据分为三种不同的实体,即平台(platform)、样本(sample)和系列(series)。平台,关于以高通量方式(microarray,SAGE)检查样本的物理试剂的信息。一个平台含有多个提交者提交的样本。平台的命名规则为“GPL+n(n 代表数字)”。样本,关于被检查的 mRNA 样本,实验条件和实验产生的基因表达测量数据信息。一个样本必须涉及一个平台,可能会包括在许多系列之中。样本的命名规则为:“GSM+n”。系列,样本收集,样本是如何相关的,如何排序的,分析是如何进行的,和聚类数据是如何获得的信息。系列含有数据的摘要信息。系列的命名规则为

    3、“GSE+n”。GEO 的原始数据被放置在平台,样本和系列这三个数据库中;根据原始数据观测角度的不同,又将这些数据整理并分置两个不同的数据库中:数据集(datasets)和表达图谱(profile);数据集以“实验”的角度存储了所有的元数据,表达图谱从“基因”的角度存储了单个基因表达的数据资料。3.数据上传与下载 在 GEO 中上传数据前先要注册账号,注册信息中的联系方法会体现在 GEO 记录中。数据上传可以使用几种不同的格式,如电子表格、纯文本和 XML格式。不管采用哪种上传方式,最终的结果及包含的信息都相同。所有的 GEO 信息可以利用不同的工具下载不同格式的数据:查询到的每一条记录下均有

    4、下载连接,通过此链接下载以.gz 或.tgz 为后缀名的压缩文件,通过 WinZip or 7-Zip 即可打开;所有的GEO 记录和原始数据文件都可以通过 FTP(ftp:/ftp.ncbi.nlm.nih.gov/pub/geo/)进行大批量下载;通过查询页面的“send tofile”下载。4.GEO 检索及结果 GEO 提供多种途径检索数据,如以数据集“GDS3176”,平台“GPL339”,系列“GSE9567”,样本GSM241927”进行检索。如果已知序列号,可以直接采用这种方式搜索;否则,可以用关键词、物种甚至作者姓名进行搜索。同时,可通过 Limits 和 Advanced

    5、Search 对搜索结果进行筛选。GEO 数据集的搜索结果以“实验”角度列示,内容包括名称、简述、物种、平台、提交者联系方式、系列、样本个数、数值类型和发表时间等,同时提供向NCBI 的其他数据库的链 接,如 PubMed,Epigenomics、SRA 和 GEO Profiles 等。GEO 表达图谱(profiles)的搜索结果以“基因”角度列示,用图片的形式展现一个基因对所有样本的表达水平,搜索结果中的实验条件方便我们观察一个基因在不同条件下表达水平的差异。搜索结果可利用“my NCBIcollection”进行在线保存。5.数据分析 “GEO datasets”提供了四种数据分析工具

    6、,分别是“find genes”“compare 2 sets of samples”“cluster heatmaps”“experiment design and value distribution”。“find genes”通过输入基因名称或符号直接定位到“profiles”中的相关基因。“compare 2 sets of samples”用以区别存在显著表达差异的两组样本,特别是比较属于不同实验的样本。“Cluster heat maps”工具提供了分层和 K-means 聚类分析方法,可以选择、扩增、下载大量感兴趣的簇,并制成线图或直接链接到 Entrez GEO 图谱。“experiment design and value distribution”用柱状图(box plot)表示每一样本的表达量。谢谢!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基因表达数据库课件.ppt
    链接地址:https://www.163wenku.com/p-4104954.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库