书签 分享 收藏 举报 版权申诉 / 17
上传文档赚钱

类型石油地震勘探及其大数据快速存储技术研究介绍-IndicoIHEP课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4488895
  • 上传时间:2022-12-14
  • 格式:PPT
  • 页数:17
  • 大小:6.29MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《石油地震勘探及其大数据快速存储技术研究介绍-IndicoIHEP课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    石油 地震 勘探 及其 数据 快速 存储 技术研究 介绍 IndicoIHEP 课件
    资源描述:

    1、报告人:韩昭报告人:韩昭核探测器与核电子学国家重点实验室(科大部)核探测器与核电子学国家重点实验室(科大部)2013年年5月月3日日1石油地震勘探及其大数据快速存石油地震勘探及其大数据快速存储技术研究介绍储技术研究介绍2石油地震勘探简介石油地震勘探简介 石油地震勘探是指利用仪器检测、记录人工激发地震的反射石油地震勘探是指利用仪器检测、记录人工激发地震的反射波、折射波的传播时间、振幅、波形等,对地层界面、岩土波、折射波的传播时间、振幅、波形等,对地层界面、岩土性质、地质构造进行成像分析。性质、地质构造进行成像分析。人造地震是现在最重要的一种油气勘探方法人造地震是现在最重要的一种油气勘探方法。3石

    2、油地震勘探简介石油地震勘探简介地震石油勘探的特点与发展趋势:地震石油勘探的特点与发展趋势:1、在地震数据处理中,利用检波器采集的数据对、在地震数据处理中,利用检波器采集的数据对地质结构成像分析。地震数据有很大的噪声,检地质结构成像分析。地震数据有很大的噪声,检波器排布越密集,可以得到越准确的地质结构。波器排布越密集,可以得到越准确的地质结构。2、为了勘探更深处的油气,探测设备覆盖的范围、为了勘探更深处的油气,探测设备覆盖的范围越来越广。越来越广。3、因为上述原因,现在地震勘探使用的地震仪器,、因为上述原因,现在地震勘探使用的地震仪器,达到了万道量级,有些勘探公司已经做到了十万达到了万道量级,有

    3、些勘探公司已经做到了十万道,并且提出了百万道的目标。道,并且提出了百万道的目标。4石油地震勘探中要解决的问题石油地震勘探中要解决的问题对如此大规模的地震勘探设备,在前端的数据对如此大规模的地震勘探设备,在前端的数据采集传输,后端的数据存取都要面临很多问题采集传输,后端的数据存取都要面临很多问题1、数据采集传输中的问题、数据采集传输中的问题(1)大量节点的管理)大量节点的管理(2)数据可靠传输)数据可靠传输(3)供电)供电(4)低功耗)低功耗(5)节点同步)节点同步5石油地震勘探中要解决的问题石油地震勘探中要解决的问题2、数据存取处理中的问题、数据存取处理中的问题(1)近年来处理器的能力随着半导

    4、体工艺的发展进步很快,比如,主流)近年来处理器的能力随着半导体工艺的发展进步很快,比如,主流PC的的CPU主频已经达到主频已经达到3GHz以上,服务器以上,服务器CPU大都达到十核以上。然而提供数据大都达到十核以上。然而提供数据存储的仍然是传统的磁介质硬盘,它的性能却提高很有限。很多文献资料表明存储的仍然是传统的磁介质硬盘,它的性能却提高很有限。很多文献资料表明IO速度速度已经成为制约数据处理过程的一个已经成为制约数据处理过程的一个瓶颈瓶颈。(2)地震数据采集中,原始数据是记录在磁带中的,进行数据处理时,会将磁)地震数据采集中,原始数据是记录在磁带中的,进行数据处理时,会将磁带中的数据按一定的

    5、格式存储在硬盘中。现阶段由于检波器数目的增大带中的数据按一定的格式存储在硬盘中。现阶段由于检波器数目的增大地球物地球物理勘探理勘探所产生的数据量越来越大,大都达到了所产生的数据量越来越大,大都达到了TB甚至甚至PB的量级,这对于后端的量级,这对于后端的的大数据处理大数据处理产生了巨大的压力。在一些地震数据处理的过程中数据分发所用产生了巨大的压力。在一些地震数据处理的过程中数据分发所用的时间已经和数据处理所花费的时间基本相当。的时间已经和数据处理所花费的时间基本相当。(3)地震数据处理的过程中,需要对各种不同的数据组合进行读取分析,大部)地震数据处理的过程中,需要对各种不同的数据组合进行读取分析

    6、,大部分情况下,这些数据都离散的分散在文件中,并不是连续的,这些离散的数据分情况下,这些数据都离散的分散在文件中,并不是连续的,这些离散的数据会导致数据获取的速度大大降低。会导致数据获取的速度大大降低。(4)本人主要工作是解决这一部分的问题。)本人主要工作是解决这一部分的问题。6离散数据存取速度慢的原因离散数据存取速度慢的原因事实上,硬盘读出数据的速度并不慢,但受到事实上,硬盘读出数据的速度并不慢,但受到机械运动因素机械运动因素的影响,寻道时间的影响,寻道时间非常慢。非常慢。对于对于8KB数据,数据读取时间约为数据,数据读取时间约为0.05ms平均寻道时间约为平均寻道时间约为 9ms平均寻道时

    7、间平均寻道时间数据读取时间数据读取时间对于机械式硬盘,最影响速度对于机械式硬盘,最影响速度的是随机访问。然而地震的数的是随机访问。然而地震的数据需要不同的组合,绝大部分据需要不同的组合,绝大部分是随机的小数据访问模式。是随机的小数据访问模式。解决办法,多硬盘有效并行工作解决办法,多硬盘有效并行工作7磁盘阵列磁盘阵列磁盘阵列(磁盘阵列(Redundant Arrays of Inexpensive Disks RAID),利用数组方式来作磁盘组,在一定程度上),利用数组方式来作磁盘组,在一定程度上实现了数据的分布存储,可以达到并行,增加实现了数据的分布存储,可以达到并行,增加IO的的作用。作用。

    8、8传统的地震数据存取方式传统的地震数据存取方式以以POSIX为代表的基于文件系统的存储是现为代表的基于文件系统的存储是现在大多数实验中大数据的存储模式。在大多数实验中大数据的存储模式。地震数据按照一定格式存储在文件中,典型地震数据按照一定格式存储在文件中,典型的访问函数为的访问函数为open文件,文件,seek到特定的位置,到特定的位置,read一定长度的内容。一定长度的内容。POSIX标准是以一种标准是以一种流(流(stream)的串行的方式来访问数据存储)的串行的方式来访问数据存储区的。区的。9磁盘阵列存在的问题磁盘阵列存在的问题磁盘阵列并没有抛弃传统的串行的文件系统存储方式,磁盘阵列并没

    9、有抛弃传统的串行的文件系统存储方式,每个硬盘并不知道自己的数据,这些需要上层的串行命每个硬盘并不知道自己的数据,这些需要上层的串行命令,并靠令,并靠RAID控制器分发实现。而这一过程是串行的,控制器分发实现。而这一过程是串行的,在硬盘数量不断增加的情况下,会成为阻碍性能的瓶颈。在硬盘数量不断增加的情况下,会成为阻碍性能的瓶颈。其次,其次,RAID是一种通用的存储设备,并不理解数据的含是一种通用的存储设备,并不理解数据的含义,只是固定长度的切割,这也会造成性能的下降。义,只是固定长度的切割,这也会造成性能的下降。因为磁盘阵列并没有实现硬盘与硬盘之间的完全独立,因为磁盘阵列并没有实现硬盘与硬盘之间

    10、的完全独立,因此很难实现太大规模的并行。因此很难实现太大规模的并行。10Google提出的提出的key-value存储模式存储模式 完全抛弃了完全抛弃了POSIX的访问模式,把每一个数据(的访问模式,把每一个数据(value)打)打上一个上一个key标签,然后作分布式的存储。需要访问数据的标签,然后作分布式的存储。需要访问数据的时候以时候以key为关键字进行检索,可以同时有很多的客户端为关键字进行检索,可以同时有很多的客户端同时响应,从而实现并发访问。同时响应,从而实现并发访问。11Key-value面临的最大问题面临的最大问题因为与传统的以文件系统为基础的数据存储方式因为与传统的以文件系统为

    11、基础的数据存储方式差异太大,提出的主要应用对象是针对差异太大,提出的主要应用对象是针对数据库数据库的的应用。应用。很多已经成熟的软件应用无法直接使用很多已经成熟的软件应用无法直接使用key-value模式,即使重新移植风险也太大。这是因为模式,即使重新移植风险也太大。这是因为key-value模式与传统的数据存储方式,底层操作差别模式与传统的数据存储方式,底层操作差别太大,需要对原本成熟的应用程序进行大量修改。太大,需要对原本成熟的应用程序进行大量修改。12我们提出的我们提出的iSmartDisk方案方案 基于基于key-value的思想,提出了的思想,提出了iSmartDisk的分布式存储模

    12、的分布式存储模式,把实验数据分布的存储在用式,把实验数据分布的存储在用internet连接起来的具有连接起来的具有CPU控制的硬盘上,访问时,利用控制的硬盘上,访问时,利用Key-value的方式,向各的方式,向各个节点分发需要的数据的标签。所有节点并行的查找,提个节点分发需要的数据的标签。所有节点并行的查找,提供自己的数据。在提供供自己的数据。在提供快速快速IO并发并发访问的同时,对现有的访问的同时,对现有的大型大型应用程序保持兼容应用程序保持兼容。13iSmartDisk初步测试结果初步测试结果系统测试结果,系统测试结果,IO性能同节点数呈线性能同节点数呈线性增长关系。性增长关系。在同传统

    13、的建立在在同传统的建立在RAID的基础上的的基础上的文件系统的文件系统的IO速度相比,在同样的硬速度相比,在同样的硬盘数目下,盘数目下,IO速度提高了速度提高了8倍!倍!现有现有RAID速度速度 测试平台:地空学院曙光服务器测试平台:地空学院曙光服务器 存储设备:服务器存储设备:服务器26个计算节点上的硬盘个计算节点上的硬盘 测试方法:将数据文件按照相应的算法分布存储在计算节测试方法:将数据文件按照相应的算法分布存储在计算节点的硬盘上,然后根据需要读取数据点的硬盘上,然后根据需要读取数据14iSmartDisk的特点的特点iSmartDisk提出了把提出了把key-value分布式数据库的存储

    14、分布式数据库的存储思想用于大型实验数据的新存储概念。思想用于大型实验数据的新存储概念。实现了每个硬盘的完全独立,所有的节点都是并行实现了每个硬盘的完全独立,所有的节点都是并行处理,正因如此,可以支持大量的并行。处理,正因如此,可以支持大量的并行。在在key-value的基础上还提出了通过算法实现无元数的基础上还提出了通过算法实现无元数据(据(meta-data)的存储模式,进一步加快随机)的存储模式,进一步加快随机IO速度。速度。利用虚拟文件的技术,在利用利用虚拟文件的技术,在利用iSmartDisk的快速的快速IO能力的同时保持了应用程序级的兼容。能力的同时保持了应用程序级的兼容。15目前所使用的控制节点硬件平台目前所使用的控制节点硬件平台16目前的研究状态目前的研究状态 基本完成了架构设计。在地空学院提供的专业地球物理软件基本完成了架构设计。在地空学院提供的专业地球物理软件GeoTomo的平台下进行了对比测试,得到了的平台下进行了对比测试,得到了8-10倍速度的提升。倍速度的提升。正在进行样机系统平台的硬件与软件方案设计。正在进行样机系统平台的硬件与软件方案设计。发明专利申请中。发明专利申请中。17

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:石油地震勘探及其大数据快速存储技术研究介绍-IndicoIHEP课件.ppt
    链接地址:https://www.163wenku.com/p-4488895.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库