转录组高通量测序转录组数据分析差异表达基因分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《转录组高通量测序转录组数据分析差异表达基因分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 转录 通量 数据 分析 差异 表达 基因 课件
- 资源描述:
-
1、a11.转录组转录组2.高通量测序高通量测序3.转录组数据分析转录组数据分析4.差异表达基因分析差异表达基因分析5.趋势性上调和下调基因分析趋势性上调和下调基因分析6.基因集功能富集分析基因集功能富集分析a21.1transcriptome 转录组(transcriptome)是指特定生物体在某种状态或某一生理条件下,细胞内所有基因转录产物的总和,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。从RNA层次研究基因表达的情况,即为转录组学(transcriptomics),是研究细胞表型和功能的一个重要手段。a31.2转录组研究的重要性转录组研究的重要性 转
2、录组是连接基因组遗传信息与生物功能的蛋白质组的纽带,转录水平的调控是最重要也是目前研究最广泛的生物体调控方式。转录组的研究比基因组的研究能给出更高效的有用信息。与基因组不同,转录组更有时间空间性。除了异常的mRNA降解现象(如转录衰减)以外,转录组反映的是特定条件下活跃表达的基因a4 转录组的研究可以提供什么条件下什么基因表达什么信息,从而推断相应未知基因的功能,揭示特定调节基因的作用机制 对转录本的定量可以了解特定基因的活性和表达量,用于疾病的诊断和治疗 通过对转录组的研究,也让个性化医疗的目标,从共性转移到个性,成为可能a51.3转录组研究的技术主要包括如下三种:主要包括如下三种:1)基于
3、杂交技术的微阵列技术;2)基于Sanger测序法的SAGE(serial analysis of gene expression)和 MPSS(multiple parallel signature sequencing);3)基于新一代高通量测序技术的转录组测序。a6几种转录组研究所用技术的比较转录组所用技术转录组所用技术 MicroarraySAGE和和MPSS RNA-seq原理寡核苷酸杂交Sanger测序 高通量测序信号荧光信号数字化信号数字化信号分辨率数个-上百个单碱基单碱基分辨率高低高背景高低低成本高高相对较低起始RNA用量多多少a7 DNA芯片技术:只适用于检测已知序列,却无法捕
4、获新的mRNA。杂交技术灵敏度有限,对于低丰度的mRNA,微阵列技术难以检测,也无法捕获到目的基因mRNA表达水平的微小变化。a8SAGE(基因表达系列分析):可以全面了解特定组织或细胞类型中基因群体表达状态,它的显著特点是能够大量获取基因组范围基因表达的类别与丰度,该技术成功地应用于特异组织或细胞的转录组研究和mRNA群体间差异表达基因鉴定。缺点是需要大量的mRNAa9MPSS(多重性平行定序):对于功能基因组研究非常有效,能在短时间内捕获细胞或组织内全部基因的表达特征;对于鉴定致病基因并揭示该基因在疾病中的作用机制等发挥了重要作用。可以侦测到极为罕见的基因表现a101.4转录组测序转录组测
5、序(1)RNA聚合酶I和III负责种类稀少、功能重要的看家非编码RNA基因的转录,包括rRNA,tRNA,snoRNA,snRNA等。由这两类RNA聚合酶转录的非编码RNA属于看家RNA,在各种生理和病理状态下都被高水平转录,转录产物占细胞内RNA总量的95%以上,不是生命科学研究前沿领域的主要关注对象a11 (2)RNA 聚合酶II负责蛋白质编码基因和调控非编码RNA的转录,在真核生物的不同生理和病理状态下表达量被严格调控,一直吸引着各生命科学研究领域的重点关注,无比幸运的是,由RNA聚合酶II生成的转录的末端均含有3端多聚腺苷尾【3poly(A)tail】。转录组测序一般是对用多聚胸腺嘧啶
6、(oligo-dT)进行亲和纯化的RNA聚合酶II转录生成的成熟mRNA和ncRNA进行高通量测序。这样的数据有效排除了看家非编码RNA的干扰,可以通过一次测序获得一种细胞内几乎所有重要基因的表达参数。a12转录组高通量测序的优势?转录组高通量测序的优势?高通量、更精确的数字信号、无需已知序列、能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能够发现未知转录本和稀有转录本,精确的识别可变剪接位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。a13转录组前沿研究简介转录组前沿研究简介单细胞转录组分析转录组测序确定RNA结构转录组测序在疾
7、病中的应用a142.高通量测序高通量测序 测序技术的发展 高通量测序技术(High-throughput sequencing)又称“第二代”测序技术(“Next-generation”sequencing technology),高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)a152.1高通量测序优势?高通量测序优势?价格比第一代大幅度降低 可扩展的高通量 需要样品量少 新颖的测序化学技术 单个或配对末端支持a162.2高通量测序技术的应用高通量测序技术的应用 重头测序(de novo sequencing)重测序(
8、resequencing)全转录组测序(whole transcriptome resequencing)小分子RNA测序(small RNA sequencing)染色质免疫共沉淀测序(ChIP-seq)a172.2.3 3三种常见的测序平台三种常见的测序平台a18Illumina Genome Analyzer 专利核心技术“DNA 簇”和“可逆性末端终结”,达成自动化样本制备及基因组数百万个碱基大规模平行测序。具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控,基因功能,蛋白/核酸相互作用)研究。Genome
9、 Analyzer IIxGenome Analyzer IIx测序技术原理测序技术原理1)文库制备:将基因组DNA打成几百个碱基(或更短)的小片段,并在两个末端加上接头(adapter)。2)桥式PCR产生DNA簇a19a、Solexa 测序专用的测序芯片(flow cell)表面连接有一层单链引物(Primer),单链状态的 DNA片断与芯片表面的引物通过碱基互补被一端固定在芯片上;b、通过扩增反应使得单链 DNA成为双链 DNA;a20c、双链再次变性后成为单链,其一端固定在测序芯片上,另外一端(5或 3)随机和附近的另外一个引物互补,被固定住,形成“桥“(bridge);d、在测序芯片
10、上同时有上千万 DNA 单分子发生以上的反应;e、c 中形成的单链桥,以周围的引物为扩增引物,在测序芯片表面再次进行扩增,形成双链;a21f、双链经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应;g、在反复进行 30 多轮扩增,每个单分子得到了 1000 倍扩增,成为单克隆“DNA簇群”;h、“DNA簇群”在Genome Analyzer IIx测序仪上进行序列分析;a223 3)测序反应)测序反应 Illumina Genome AnalyzerIIx是一种基于单分子簇的边合成边测序技术,基于专有的可逆终止化学反应原理。测序时加入带有4种荧光标记的dNTP,每个碱基末端被保护基团封
11、闭,每个循环只允许单个碱基合成,经过扫描,读取该次反应后的荧光信号结果,该保护基团被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列。a23illuminaillumina测序平台的特点测序平台的特点1 1)可控制的高通量:)可控制的高通量:一次实验可读取量大于 15 亿个碱基/芯片2 2)上样需求低:)上样需求低:上样量只在pmol级(ng级)3 3)简单、快速、自动化)简单、快速、自动化4 4)低错误测序比例)低错误测序比例 利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的错配。a244
12、54/GS-FLX 454/GS-FLX 系统的测序技术系统的测序技术1 1)技术原理:)技术原理:GS FLX System是一种基于焦磷酸测序原理而建立起来的高通量基因组测序系统。焦磷酸测序的原理如下:(1)1个特异性的测序引物和单链DNA模板结合,然后加入酶混合物(包括DNA Polymerase、ATP Sulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。(2)向反应体系中加入1种dNTP,如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3末端,同时释放出一个分子的焦磷酸(PPi)。a25
13、(3)在ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成ATP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比。(4)反应体系中剩余的dNTP和残留的少量ATP在Apyrase的作用下发生降解。(5)加入另一种dNTP,使第24步反应重复进行,根据获得的峰值图即可读取准确的DNA序列信息。a262)工作流程:3.GS FLX系统的技术优势和限制系统的技术优势和限制1)读长优势:单个序列的读长平均可达到450个碱基左右;2)操作简便高效,不需建库、克隆挑取、质粒提取等工作;3
14、)分析结果快速、信息高通量,10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息;4)应用广泛且稳定,测序结果一致性较高;5)同聚物的限制,即相同碱基的连续掺入,如AAA或GGG,由于没有终止元件来阻止单个循环的连续掺入,同聚物的长度就需要从信号强度中推断出来。此处可能产生误差。因此,主要错误类型是插入-缺失,而不是替换。a27ABI SOLID3 systemABI SOLID3 systemSOLID平台技术原理:SOLID是基于寡核苷酸连接和检测进行测序的技术。它以4色荧光标记寡核苷酸的连续连接反应为基础,以双碱基编码技术为检测技术,对单拷贝的DNA片段进行大规模扩增和高
15、通量测序。基本过程如下:(1)文库制备:根据实际情况制备文库:片段文库或末端配对文库(2)乳液PCR(3)磁珠富集技术制备单分子模板:含有DNA模板的磁珠共价结合在SOLiD玻片表面。(4)连接测序:上机测序,边连接边测序,获得SOLiD原始颜色序列。a28SOLiDSOLiD系统特点系统特点1)高准确度:双碱基编码检测技术在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。2)高通量:单次运行可产生50GB的序列数据。3)可扩展性4)灵活性5)运行时间较长,测序片段相对较小:单次运行时间长达7天,最短3.5天。最长2*50bp。a29测序技术的比较测序技术的比较a30I
16、llumina Genome Analyzera313.转录组数据分析转录组数据分析a324.4.差异表达基因分析差异表达基因分析统计学分析:1.Fold change,一般2-fold increase or decrease(平行实验的样本较少)2.p-value(平行实验的样本较多)under-expressedover-expressed/2/2a334.14.1差异倍数法差异倍数法Fold change=log2(A/B)Fold change=log2(A/B)A:sampleA表达值B:sampleB表达值通常以1和-1为作为差异表达的阈值,判断基因是否差异表达a34倍数法是比较
展开阅读全文