多样本混合测序的编码设计和解码算法.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多样本混合测序的编码设计和解码算法.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多样 混合 编码 设计 解码 算法
- 资源描述:
-
1、多样本混合测序的编码设计和解码算法BioinformaticsDNA测序技术快速发展测序技术快速发展2全球首批全球首批NovaSeq 进驻南京进驻南京2017.03.30Bioinformatics多样本混合测序多样本混合测序3n充分利用测序通量充分利用测序通量 同时测序多个样本同时测序多个样本n关键问题关键问题区分不同样本区分不同样本 编码编码(1)Barcoding(显性编码)(显性编码)(2)Overlap pooling(隐性编码)(隐性编码)Nat Rev Genet.2014,15(11):749-63Bioinformatics多样本混合测序多样本混合测序4n Barcoding
2、(显性编码)(显性编码)readBarcode样本标记样本标记Nat Methods.2008,5(3):235-7.关注的问题关注的问题编码的数量编码的数量编码的容错和纠错能力编码的容错和纠错能力Bioinformatics多样本重叠混合测序多样本重叠混合测序5n Overlap pooling(隐性编码)(隐性编码)Genome Res.2009 19:1243-1253Genome Res.2009 19:1254-1261Nature Biotechnology,2009.以样本的混合模式作为编码以样本的混合模式作为编码提高测序效率提高测序效率编码设计复杂,解码困难编码设计复杂,解码困
3、难多样本混合测序实验设计及数据解码多样本混合测序实验设计及数据解码Cao CC,Sun X.Quantitative Biology,2016,4(1):3646.重叠混合测序重叠混合测序 n 编码编码n 解码解码6Overlapping Pool Sequencing重叠重叠混合混合7混合池1混合池2混合池3样本混合模式样本之间重叠混合样本混合矩阵样本混合矩阵一个混合池测序多个样本一个样本在多个池中测序重叠混合测序重叠混合测序的编码与解码的编码与解码 筛选稀有变异携带者筛选稀有变异携带者8问题:问题:保证准确解码保证准确解码辨别测序误差与突变辨别测序误差与突变辨别多个阳性样本辨别多个阳性样本
4、重叠混合测序重叠混合测序的优化设计的优化设计n测序深度模型测序深度模型n分组重叠混合模型分组重叠混合模型Optimal sequencing depths of coverage for pooled sequencing of diploid samplesData requirement for different number of blocks9重叠混合测序重叠混合测序的优化设计的优化设计n测序深度模型测序深度模型n分组重叠混合模型分组重叠混合模型n优化选择优化选择 代价模型:文库+数据+混合 根据代价选择最优设计Cao CC,Sun X.Genetic Epidemiology.20
5、1310重叠混合测序重叠混合测序的优化设计的优化设计n优化选择样本混合方案优化选择样本混合方案n利用群试理论进行解码利用群试理论进行解码单独测序成本大幅降低筛选稀有突变大幅降低筛选稀有突变携带者的测序成本携带者的测序成本Cao CC,Sun X.Genetic Epidemiology.2013在不同混合样本数目下的测序代价11STD设计参数:n=200,d=2基于定量群试的重叠混合测序基于定量群试的重叠混合测序设计及解码设计及解码前面只用到每个混合池的阳性样本定性检测结果前面只用到每个混合池的阳性样本定性检测结果携带突变的测序片段个数能够反映携带者的比例携带突变的测序片段个数能够反映携带者的
6、比例定量群试:利用覆盖变异位点测序片段个数信息定量群试:利用覆盖变异位点测序片段个数信息1号2号3号4号5号6号7号8号I号II号III号IV号V号12基于定量群试的重叠混合测序基于定量群试的重叠混合测序设计及解码设计及解码n 样本混合设计样本混合设计定义定义PI指标评价样本混合设计指标评价样本混合设计lPI为阳性混合池数目比阳性样本数目 与不确定属性的阴性样本数目之和还高的概率值l PI能够反映识别稀有突变携带者的可能性大小l 根据PI选择随机设计的最优设计参数 n 解码:识别突变携带者解码:识别突变携带者贝叶斯解码算法贝叶斯解码算法A:样本混合模式 O:测序结果13基于定量群试的重叠混合测
7、序基于定量群试的重叠混合测序设计及解码设计及解码与普通群试相比,该方法能够容许检测更多的与普通群试相比,该方法能够容许检测更多的稀有变异稀有变异携带者携带者Cao CC,Sun X.BMC Bioinformatics.2014Least sequencing data throughput required to achieve a 95%correct decoding rate.Only 36 pools were allowed to identify heterozygous variant carriers among 100 diploid samples.Performance
8、 of overlapping pool sequencing using random k-set pool design14正确解码前提下的数据通量需求面向面向单倍型单倍型的的混合测序混合测序解码解码从混合测序结果中准确估计从混合测序结果中准确估计单倍型频率单倍型频率,并判断,并判断稀有单倍型稀有单倍型携带者携带者Ehapp新算法Cao CC,Sun X.Bioinformatics.2015.15面向面向单倍型单倍型的的混合测序混合测序解码解码76r76s200400600800020406080100120140Read length(bp)Rdiff(%)Harp allHarp p
9、ooledEhappn Ehapp在较短的测序读长下具有较大的优势n 应用重叠混合测序筛选稀有单倍型携带者Cao CC,Sun X.Bioinformatics.2015.0510152025303300.050.10.150.2STDEstimated frequency0510152025303400.050.10.150.2SudokuPool IDEstimated frequency16基于重叠混合的单倍型测序方法基于重叠混合的单倍型测序方法研究动机:研究动机:尝试将重叠混合测序方法应用于单倍型测序,尝试将重叠混合测序方法应用于单倍型测序,解决存在的问题,以期提高单倍型构建性能解决存
展开阅读全文