Greenplum数据仓库技术架构介绍课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Greenplum数据仓库技术架构介绍课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Greenplum 数据仓库 技术 架构 介绍 课件
- 资源描述:
-
1、Greenplum数据仓库技术架构介绍1OLAP 在互联网公司的实践与思考Greenplum状态描述状态描述2三三Greenplum体系架构体系架构二二数据仓库体系架构数据仓库体系架构一一Greenplum开发规范开发规范五五Greenplum运维体系运维体系四四数据仓库体系架构3数据仓库架构要点 数据生命周期 业务数据特点 OLAP场景举例 OLAP架构示意 数据流转过程 具体技术实现- 数据认识- 业务认识- 业务需求- 整体框架- 数据流转- 实现方式数据仓库体系架构4数据生命周期与业务归类时间维度:过去 - 现在 - 未来 (数据的生命周期) “现在”的数据 OLTP “过去”的数据
2、OLAP “未来”的数据 趋势分析数据仓库体系架构5业务数据特点 现在的数据 OLTP实时,在线系统,客户使用事务小,频率高,并发高 过去的数据 OLAP非实时(T+1,或小时级),离线系统,分析决策事务大,频率相对小,并发低 未来的数据 趋势分析非实时,离线+在线流系统,趋势分析算法分析,持续计算数据仓库体系架构6OLAP场景举例 业务相关场景用户状态 (注册数,活跃数,并发量,峰值)金币状态 道具/物品状态 对账状态活动反馈 架构相关场景不同数据量,不同事务特点,不同查询需求历史数据归档与冷热分离实时与延时需求的权衡数据仓库体系架构数据架构示意图7数据仓库体系架构8数据流转过程 1 业务数
3、据的产生 OLTP 2 业务数据的中转 ETL服务器 3 数据的存储和计算 OLAP集群 4 结果数据的展现 数据集市 5 访问接口的封装 API接口服务器 6 最终数据的显示 前端界面 7 结果数据的交互 OLTP,趋势分析 8 OLAP数据流转 dbsync平台数据仓库体系架构9架构的具体技术实现 轻量级数据仓库 Inforbright 与MySQL数据库结合,易使用,冷热分离 数据库归档,只能load,不支持DML 对特定OLAP类查询有很好的支持作用 通用性数据仓库 Greenplum 独立的数据库仓库解决方案 可以很好支持各种方式的数据加载和DML操作 具备海量的数据存储和计算性能G
4、reenplum状态描述状态描述10三三Greenplum体系架构体系架构二二数据仓库体系架构数据仓库体系架构一一Greenplum开发规范开发规范五五Greenplum运维体系运维体系四四greenplum体系架构11体系结构要点 postgresql体系结构 pg逻辑和物理结构 Greenplum体系结构 GP架构特点与功能- 单元结构- 单元分解- 集群结构- 集群特点greenplum体系架构postgresql体系结构12greenplum体系架构13postgresql体系结构 pg结构组成 连接关系系统 编译执行系统 存储执行系统 事务系统 系统表 pg逻辑和物理结构 insta
5、nce实例 - user - tablesapce database - schema - table,view,function - data r o w 物理文件 - oid - 表空间 - 数据文件命名greenplum体系架构greenplum的体系结构14greenplum体系架构greenplum的体系结构15greenplum体系架构16greenplum的体系结构 greenplum的架构特点 MPP ShareNothing 海量并行处理+完全无共享 cpu计算能力 数据从Disk上的I/O吞吐性能 master管理节点 segment数据节点 greenplum的核心功能
6、无共享MPP 多态存储(gpfdist+外部表,每小时4TB+) 高效数据加载 分布分区 数据压缩 外部访问Greenplum状态描述状态描述17三三Greenplum体系架构体系架构二二数据仓库体系架构数据仓库体系架构一一Greenplum开发规范开发规范五五Greenplum运维体系运维体系四四Greenplum现状说明18Greenplum集群现状概述 三大Greenplum集群体系 公司IDC_01机房Greenplum体系 公司IDC_02机房Greenplum体系 公司IDC_03机房Greenplum体系Greenplum现状说明19三大Greenplum集群定位分类 公司IDC
7、_01机房Greenplum体系 公司第一套Greenplum集群,网络环境为千兆网 数据来源为OLTP库,针对小数据量传输和计算,部分实时交互操作 以对账业务为主,统计计算为辅 公司IDC_02机房Greenplum体系 针对数据来源主要是kfk产生csv文件的业务,不直接从数据库传数 以重点业务线、活动数据、非OLTP业务数据的任务计算为主 公司IDC_03机房Greenplum体系 数据来源来源为OTLP库库,针对大数据量传输和计算,采用T+1方 式 以核心业务的数据计算、统计为主Greenplum现状说明数据架构示意图20Greenplum现状说明21三大Greenplum集群关系 数
展开阅读全文