XXX商业银行数据仓库系统完整解决方案-(上半部)课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《XXX商业银行数据仓库系统完整解决方案-(上半部)课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XXX 商业银行 数据仓库 系统 完整 解决方案 上半部 课件
- 资源描述:
-
1、XX商业银行数据仓库系统解决方案EDCBA主题3Longtop BI基础数据平台行业背景数据交换数据交换体系数据加工数据处理环境+数据整合模型数据服务综合应用平台+多层次数据服务系统剧增;网状交换数据化经营对数据的需求数据加工资源重复投入业务系统减负;T+1数据需求业务创新带来应用的多样化解决问题数据配套数据治理+数据安全数据质量、数据标准、数据安全问题Longtop BI基础数据平台典型案例分析EDCBA主题EDCBA主题背景与需求总体规划逻辑架构数据架构ETL架构物理架构数据质量管理运营管理技术架构7背景与需求n背景背景:整合所有的业务系统源数据,准确完整地分析南充市商业银行现有的数据及其
2、流向,建设一套强大的基础数据平台n整合系统整合系统:p一阶段:核心、外汇、财务管理、信贷管理、卡平台、综合前置;六个系统p二阶段:网上银行、人行支付、电话银行三个系统n建设范围建设范围:p基础数据平台建设pKPI仪表盘p业务报表应用p绩效考核系统数据源接口设计公共数据标准化仓库模型设计指标库设计应用模型设计总体框架设计ETL作业设计ETL调度平台建设BI门户建设KPI指标梳理KPI仪表盘框架设计KPI仪表盘开发及测试业务报表梳理报表平台设计报表设计报表开发及测试客户经理绩效考核系统调研及需求整理应用功能开发及测试数据应用开发及测试主题总体规划逻辑架构数据架构ETL架构物理架构数据质量管理运营管
3、理技术架构9原则与目标n设计原则设计原则:p实用性和适用性p开放性、兼容性和连通性p先进性p高可靠性和可用性p灵活性和可扩充性p易维护性p标准化n总体目标总体目标:n业务目标业务目标:p基础数据平台初步建设p180张核心系统报表p200业务报表n技术目标技术目标:p系统搭建基础数据平台p标准化数据进行处理,建立业务数据模型。p支持主流厂商ETL、报表和展现工具。p基于J2EE框架设计。p采用平台化设计,支持功能性拓展。p通过系统设计,保持统计结果的一致性。p支持多用户并发查询报表和海量数据处理。p提供报表管理功能。p提供调度控制功能。p包含元数据的管理功能。p提供监控管理功能。p支持水平扩展和
4、垂直扩展。p有效的数据质量提升策略和方法。p具有数据分发和报表分发功能。p支持集中式和分布式部署模式。p扩充方便,修改灵活,操作简单。p提供相关接口功能p具有开放性,做到标准化、通用化。p系统安全、可靠。p按照软件工程要求提供各类文档。系统规划蓝图10系统规划线路图11逻辑架构主题数据架构ETL架构物理架构数据质量管理运营管理技术架构13本期逻辑架构14逻辑架构:系模块间关联1415逻辑架构:系统间数据流向15技术架构主题数据架构ETL架构物理架构数据质量管理运营管理17技术架构17数据架构主题ETL架构物理架构数据质量管理运营管理19数据架构1920数据模型:总体设计20数据标准层SDM基础
5、数据层FDM团体主体产品主题渠道主题事件主题总账主题公用模型加工汇总数据层ADM应用接口层源数据缓冲层TDM数据模型层次划分数据模型层次划分协议主题ODS缓冲区21数据模型:源数据缓冲层21n层次设计p源的统一数据采集区,主要存放增量数据p数据结构接近于源,进行数据的临时保存p可作为全行历史归档数据的提供者n数据获取的两种方式p源卸数后主送p直接抽取n源系统增量获取的关键点p确认增量数据的识别规则p确认增量卸出的时间p增量文件的接口规范定义数据标准层SDM基础数据层FDM团体主体产品主题渠道主题事件主题总账主题公用模型加工汇总数据层ADM应用接口层源数据缓冲层TDM数据模型层次划分数据模型层次
6、划分协议主题ODS缓冲区22数据模型:数据标准层22n层次设计p对数据缓冲层的增量数据进行标准化处理p消除不同源在信息表达上的差异p为后续的数据整合流程提供标准化基础n标准化范围p公共代码标准化p数据类型标准化p数据格式标准化数据标准层SDM基础数据层FDM团体主体产品主题渠道主题事件主题总账主题公用模型加工汇总数据层ADM应用接口层源数据缓冲层TDM数据模型层次划分数据模型层次划分协议主题ODS缓冲区23数据模型:基础数据层23n层次设计p按主题对全行各业务系统的关键基础数据进行归类、整合和存储p数据来源于数据标准层p数据结构采用近源结构,可剪裁非关键数据p制定数据保存策略,保存全量快照或者
7、明细表,保存关键数据的历史拉链p维护稳定的主体模型,需求变更时通过辅表的方式关联,避免主体模型受到变更影响。p主题划分p对数据进行归类p提高数据的使用便利性p分为:团体、协议、事件、渠道、产品、总账、公用模型设计概述基础数据层模型设计概述基础数据层(团体)模型设计概述基础数据层(产品)模型设计概述基础数据层(渠道)模型设计概述基础数据层(协议)模型设计概述基础数据层(事件)模型设计概述基础数据层(总账)31数据模型:建总ODS模型示例数据模型:加工汇总层32n层次设计p应用上共享的原子共性汇总,一次计算,多次共享p源于应用需求,统一分析、统一提炼p汇总主题划分交易汇总账户汇总客户汇总渠道汇总机
8、构汇总33数据模型:物理化33n接口设计p源是数据库时,从源直抽并直接加载到目标的直接用DataStage实现,无需接口。p源是文本时,采用DataStage直接加载。p文件直传由交换层直接实现,无需接口p目标需要文本的,使用目标文本接口标准p针对多个目标的一致性应用,无需复杂处理的可以建立统一的数据视图,需要复杂处理的可以编制统一数据发布接口,为多个目标提供统一应用p统一对外的XML报文接口标准n存储优化设计p确定索引策略p确定数据存放位置p确定存储分配n稳定性设计p不使用“select*”p数据标准层SDM中尽量不删除和修改字段,只是新增字段p使用辅表方式n屏蔽源系统设计p模型标准层入库设
9、计p数据筛选设计34数据模型:模型设计工艺34划定数据范围表级映射字段级分析逻辑模型设计模型规划模型规范Mapping设计数据库物理设计模型验证字段差异调整35数据模型:模型设计工艺(示例)35ETL架构主题物理架构数据质量管理运营管理37ETL架构3738ETL组件化3839ETL并发调度3940ETL处理集群4041ETL最佳实践41n工具、组件积累nDatastage开发规范Stage Name命名说明AggregatorAGG_description聚合Change CaptureCCP_description变化数据比对CopyCPY_description数据拷贝Data SetD
10、TS_filenameData Set文件,其中filename为文件名DB2/UDB API(DB2/UDB Enterprise)DBA_tablenameDB数据表,其中tablename为表名File SetFST_filenameFile Set文件,其中filename为文件名n常见的Datastage错误处理、经典的场景案例、DatastageAPI开发等案例问题描述解决方法JOIN组件关联不到如果在Join之前有做过排序操作的话,数据在各个分区的分布会重新被打乱,如果不进行重新分区的话,会出现记录关联不上的问题在Join组件里面进行重新分区,分区方法一般选取HASH分区方式,H
11、ASH的主建就选取需要做关联的组件即可数据库乱码问题用Oracle Enterprise组件进行入库,常常会出现汉字入库后变成乱码的问题这是由于数据库中的字符集和DataStage中用到的字符集不一致导致的。这时需要去查看数据库中的字符集,然后修改DataStage中的字符集映射:$APT_ORCHHOME/etc/oracle_cs.txt文件,文件中要能够找到映射关系,并且映射关系要于数据库中相符。物理架构主题数据质量管理运营管理总体物理架构44软硬件配置:软件配置建议44软件类别软件类别软件功能软件功能配置配置1基础数据平台 管理和存储基础数据的数据库Oracle 2ODS数据模型 管理
12、和存储基础数据的数据模型LFT ODS DataModel3控管软件实现系统的调度、监控和自动化开发ETL PLUS4ETL软件支持对ETL任务的定制和自动调度,以实现数据自动抽取和装载SQL/SPL5前端展现平台 实现报表、查询、多维分析、仪表盘的定制和开发功能BI.Office6应用服务器实现Web应用服务器功能在用的应用服务器45软硬件配置:硬件配置建议45系统硬件配置系统硬件配置DB Server1台4CPU 8GB内存今后可以扩充为RAC 集群管控、报表、传输服务器1台4CPU 8GB 安装ETL PLUS、BI.Office,今后根据业务增长再各自独立ETL Server1台2CP
13、U 4GB内存今后可能需要再增加1台ETL Work1台4CPU 8GB内存今后可能需要再增加12台数据质量管理主题运营管理数据质量:度量标准47n非功能性p及时性:指数据刷新、修改和提取等的及时和快速性p安全性:主要包括数据在传输、使用过程中的安全性p扩展性:该系统数据体系在不满足业务需求时进行扩展的可能性与复杂度n功能性p完整性:主要包括实体缺失、属性缺失、记录缺失和字段值缺失四个方面p唯一性:指主键唯一和候选键唯一两个方面p一致性:指统一数据来源、冗余存储和统一口径的一致性p准确性:指计量误差、度量单位等方面的精确度p合法性:主要包括格式、类型、值域和业务规则的有效性数据质量:问题根源4
14、8n缺乏明确、一致的数据需求定义p数据不正确p数据不完整p数据不一致n缺乏统一的数据规范p规范不完整p规范不一致n缺乏数据质量问题解决的组织和既定的流程p缺少合适的组织来解决质量问题p缺少制定合适的解决流程数据质量:解决框架49n成立专门的数据质量管理团队p高层管理人员把控,协调不同部门,不同系统间关系。p制定数据质量规则p不定期发现质量问题及解决n建立统一的数据质量规则p统一术语规范p统一通用代码p禁止对数据的直接修改,以新记录方式修改数据。n建立并完善数据质量问题处理流程p质量问题报告p协调相关部门p形成数据问题处理建议和方案p执行方案,反馈结果p质量问题持续跟踪n数据质量长期治理n在治理
15、的规范,流程支持下,建立数据质量管理平台主题运营管理51系统运营管理:实施工艺5152运营管理:系统运行管理52n系统运维管理p定制日常标准操作流程和特殊标准操作流程p对系统资源的监控、对系统性能的分析p数据服务情况监控和干预(到数、作业加工和供数)n数据服务基线管理p源系统简称、目标系统简称、源最早来数时间、源最晚来数时间p文件就绪时间、数据处理结束时间、传输结束时间p供数基线时间、目标系统要求数据时间、数据平台服务时间n系统运行分析p制定分析的指标,系统定时收集运行信息p阶段分析运行指标,持续调整和优化应用53运营管理:安全管理53n安全策略p机密性:确保信息不暴露给未授权的实体或进程。p
16、完整性:只有得到允许的使用者才能修改数据,并且能够判别出数据是否已被篡改。p可用性:得到授权的实体在需要时可访问数据,即攻击者不能占用所有的资源而阻碍授权者的工作。p可控性:可以控制授权范围内的信息流向及行为方式。p可审查性:对出现的网络安全问题提供调查的依据和手段。n系统安全设计n应用与数据安全设计p身份验证p权限控制p验证登录客户机p数据传输安全p数据存储安全54运营管理:备份与恢复54n制定数据备份策略p全备份:备份系统中所有的数据;p增量备份:只备份上次备份以后有变化的数据;p差异备份:只备份上次完全备份以后有变化的数据;p按需备份:根据临时需要有选择地进行数据备份。n制定数据恢复策略
17、p全崩溃恢复机制p服务器崩溃恢复机制p磁盘阵列崩溃恢复机制p系统软件全崩溃恢复机制p操作系统崩溃恢复机制p数据库系统崩溃恢复机制p部分数据丢失恢复机制p单磁盘崩溃恢复机制主题主题数据交换ETLPLUS调度监控综合报表应用实施工艺促进非功能性BIOFFICE报表平台数据加工57数据交换:整体架构5758数据交换:组件部署58n数据传输客户端p查询某个节点上某个数据文件是否存在。p将本地数据文件安全,完整,快速的传输到指定的节点。p将指定节点上的数据文件安全,完整,快速的下载到本地。n数据接收服务端p提供安全认证。p提供数据传输服务p相关管理功能59数据交换:数据采集59n定向推送1.源系统自行判
展开阅读全文