书签 分享 收藏 举报 版权申诉 / 22
上传文档赚钱

类型基于OpenStack的海量影像入库方案.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4420621
  • 上传时间:2022-12-08
  • 格式:PPTX
  • 页数:22
  • 大小:1.80MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《基于OpenStack的海量影像入库方案.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基于 OpenStack 海量 影像 入库 方案
    资源描述:

    1、基于OpenStack的海量影像入库方案目标本测试是基于OpenStack环境和消息队列,将海量影像数据导入到集中关系型数据库,实现导入方式的并行性处理和自动化处理,体现云环境为GIS应用带来的价值。数据概述 数据情况 全球影像数据 数据格式 TIF 数据量 2.67TB 数据分为南北半球,各占1-60分带,大小在200MB7GB不等数据概述 其他说明 该数据为分带数据N-02-00.tif N-02-15.tifN-02-20.tif N-03-15.tifN-03-00.tif N-03-45.tifWGS_1984_UTM_zone_2NWGS_1984_UTM_zone_3N环境Ope

    2、nStack:icehouseGIScript:2005 Python3RabbitMQ:3.2.4 Pika for PythonUbuntu:15.04SuperMap:iDesktop 7.1.2Oracle:11.2.0.4原理通过消息队列,将所有影像数据按照带号进行逻辑划分,带号可以从tif影像的文件名称获得,然后将每个带号下的tif影像的路径写到一个job文本文件中,通过消息服务发出这些工作请求,python服务器接收相关的job文件,然后读取job里面的tif文件,进行创建影像数据集和影像导入追加镶嵌,创建金字塔工作。02.Job04.Job05.Job/temp/data/ge

    3、otiff/N-04-15.tif/temp/data/geotiff/N-04-25.tif分带投影文件流程Geotiff*.dbfRedhatGeotiff:/data/geotiffOracleMQ(VM)Python(VM)物理刀片存储挂载Data:/temp/data/geotiffMQ:/temp/job/doing|done|todo/tempmountmount02.Job04.Job05.Job/temp/data/geotiff/N-04-15.tif/temp/data/geotiff/N-04-25.tif分带投影文件04.job02.job存储层刀片层虚拟机层关于数据

    4、和路径首先为数据库服务器挂载约3TB的存储,映射路径为/data/geotiff,然后消息队列虚拟机和Python虚拟机通过mount命令将数据挂载到虚拟机本地,确保两者的路径信息完全一样,这样可以保证消息队列分配的任务,python机器可以访问同样的路径获得数据。GeotiffRedhatGeotiff:/data/geotiffOracleMQPythonPython物理刀片存储挂载Data:/temp/data/geotiffMQ:/temp/job/doing|done|todo/temp/tempmountmount导入策略-1导入并镶嵌导入并镶嵌影像数据集影像数据集Tif影像影像投

    5、影转换投影转换Tif影像影像Tif影像影像创建全球影创建全球影像数据集像数据集直接创建一个全球地理坐标系,然后将tif文件进行投影转换,再导入或者追加镶嵌到全球影像数据集,最后创建金字塔。优势:投影一致,如果对全球影像数据进行分布式集群切图效率会很高。问题:目前我们的GIScript2005程序还没有将投影转换功能集成过来。导入策略-2分分幅幅影像数影像数据集据集Tif影像影像Tif影像影像分分幅幅影像数影像数据集据集Tif影像影像Tif影像影像创建分幅投影的影像数据集,在创建影像数据集时需要注意获得所包含tif文件的最大最小范围,然后比较后获得一个包络矩形范围,这样才能保证所有的tif影像可

    6、以导入并镶嵌到该影像数据集内。优势:任务切分逻辑明显,金字塔操作也可以归类到不同的Python虚拟机执行。缺点:如果最终需要切图,因为需要创建一个全球地图投影的地图,然后其他影像数据集进行动态投影到一幅全球影像地图,对影响切图效率。创建影像数据集读取读取影像影像获得获得影像影像参数参数WidthHeightPixelFormatBound(L、T、B、R)BandCountBlockHeightBlockWidth影像列表影像列表循环比较影像比较影像Bounds创建影像数据集消息队列关于消息队列使用了RabbitMQ作为消息服务器,根据相关原理介绍,将相关文件按照分带进行job文件的生成,然后

    7、发送到消息队列中,针对消息的处理,划分四个维度。将处理的任务(todo)、正在处理的任务(doing)、已经完成处理的任务(done)、出错的任务(error),也就是创建四个文件夹,Python客户端接收任务时根据处理的情况,将job文件存放在不同的操作目录中。架构图消息队列关于消息队列使用了RabbitMQ作为消息服务器,根据相关原理介绍,将相关文件按照分带进行job文件的生成,然后发送到消息队列中,针对消息的处理,划分四个维度。将处理的任务(todo)、正在处理的任务(doing)、已经完成处理的任务(done)、出错的任务(error),也就是创建四个文件夹,Python客户端接收任务

    8、时根据处理的情况,将job文件存放在不同的操作目录中。结果展示结果展示入库效率对比方案1:使用一体机刀片服务器入库,刀片服务器配置32个CPU核心,128GB内存,将整个北半球的影像(1.95TB)入库共花费时间约23.77小时。而且入库过程中造成了资源利用率低下,浪费了大量的计算资源。入库效率对比方案2:可以将同资源的的刀片进行虚拟化,基于OpenStack的私有云技术,然后生成两种虚拟机类型,消息服务器虚拟机和Python工作虚拟机。OpenStackRabbitMQ ServerPython Worker入库效率对比Python工作虚拟机可以根据资源情况虚拟多台,例如本次设置的Pytho

    9、n虚拟机的云主机配置类型为4个vCPU和4GB内存,但是在入库过程中发现,其实虚拟机的CPU利用率并不高。本次测试开启了1个消息服务器,和18个Python工作服务器,导入时间约5小时(由于不同的虚拟机接到的job的工作量不一样),以最后一个导入完毕计算结束时间。入库效率对比 单个刀片单个虚拟机(4核/4GB)单个tif(4-5GB)240s300-600s批量导入56GB约40分钟41GB约112分钟可见虚拟化对资源的损耗还是比较明显的,但是考虑到整个程序对整体的资源利用率不高,所以通过资源池化管理,进行分布式导入,完全可以提高相关的导入效率,如果Python的虚拟机再开启更多,导入效率会更加的高效。超图研究院SuperMap GIS Technology Institute

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于OpenStack的海量影像入库方案.pptx
    链接地址:https://www.163wenku.com/p-4420621.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库