数据仓库培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据仓库培训课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 培训 课件
- 资源描述:
-
1、数据仓库与数据中心数据仓库与数据中心内部知识培训内部知识培训数据仓库与数据中心概述OLTP 与 OLAP多维数据分析模型数据整合应用介绍数据仓库与数据中心概述数据仓库的起因数据库方式数据库方式数据仓库方式数据仓库方式数据与应用分离,以实现数据高数据与应用分离,以实现数据高度共享、支持日常业务处理过程度共享、支持日常业务处理过程为目的(为目的(OLTPOLTP)以支持经营管理过程中以支持经营管理过程中的决策制定为目的的决策制定为目的(DSS(DSS,OLAP,DM)OLAP,DM)2020世纪世纪9090年代年代之前之前2020世纪世纪9090年代年代之后之后什么是数据仓库数据仓库就是一个面向主
2、题的、集成的、不可更新的、随时间不断变化的数据集合,用于支持经营管理过程中的决策制定。W.H.Inmon数据仓库与数据中心概述数据仓库与数据中心概述数据仓库的四个特征数据仓库就是一个数据仓库就是一个面向主题面向主题的、的、集成集成的、的、不不可更新可更新的、的、随时间不断变化随时间不断变化的数据集合,用的数据集合,用于支持经营管理过程中的决策制定。于支持经营管理过程中的决策制定。W.H.Inmon数据仓库与数据中心概述特征一 面向主题主题是用户使用数据仓库进行决策时所关心的重点方面,每一个主题基本对应一个宏观的分析领域。如:CRM 优质客户的挖掘 潜在大客户的发现 ERP 合同管理 物资库存的
3、管理 面向主题是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。传统数据库中的数据是原始、基础数据,而特定分析领域数据则是需要对它们作必要的抽取、加工与总结而形成数据仓库中的主题有时会因用户主观要求的变化而变化数据仓库与数据中心概述特征二 集成数据仓库中的数据是为分析服务的,而分析需要多种广泛的不同数据源以便进行比较、鉴别,因此数据仓库中的数据必须从多个数据源中获取,这些数据源包括多种类型数据库、文件系统以及Internet网上数据等,它们通过数据集成而形成数据仓库中的数据。统一 消除不同数据源之间的数据不一致的现象综合 对原有数据进行综合和计算数据仓库与数据中心概述特征
4、三 不可更新数据仓库中的数据是经过抽取而形成的分析型数据,不具有原始性,主要供企业决策分析之用,执行的主要是查询操作,一般情况下不执行更新操作。同时,一个稳定的数据环境也有利于数据分析操作和决策的制订。需要更新的情况进行新的决策时需要抽取和更新新的数据通过删除丢弃一些过时的数据数据仓库与数据中心概述特征四 随时间不断变化数据仓库中的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息可以对企业的发展历程和未来趋势作出定量分析和预测。时间属性数据仓库中的数据通常都带有时间属性数据统一更新以时间段为单位什么是数据中心数据中心是公司一体化信息
5、平台的重要组成部分。数据仓库与数据中心概述广义 企业业务应用与数据资源进行集中、集成、共享、分析的场所、工具、流程等的有机组合狭义 应用层面的数据中心,具体包括数据仓库和建立在数据仓库之上的决策分析应用、数据ETL、ODS数据库、数据仓库、商务智能应用和元数据管理等数据仓库与数据中心概述数据中心的定位数据中心是企业一体化信息平台的基础,它可以为应用系统的整合与数据共享提供有效的解决方案,保障企业数据的一致性、及时性、完整性、安全性、有效性和准确性,提高企业信息系统的统一性,消除企业普遍存在的信息孤岛,解决信息系统沟通不畅的问题。数据仓库与数据中心概述数据中心的逻辑架构(广义)数据仓库与数据中心
6、概述数据中心的功能单元数据仓库与数据中心概述OLTP 与 OLAP多维数据分析模型数据整合应用介绍也叫事务处理,是指对数据库的日常联机访问操作,通常是对一个或一组记录的查询和修改,主要是为企业特定的应用服务的。也叫联机事务处理(OLTP)。操作型处理OLTP:On-Line Transaction Processing特点1、通常仅仅是对一个或一组记录的查询或修改2、执行频率高3、关心处理的响应时间、数据安全性和完整性等指标OLTP与OLAP也叫做信息型处理,主要用于企业管理人员的决策分析,为制订企业的未来经营管理计划提供辅助决策信息。也叫做联机分析处理(OLAP)。分析型处理OLAP:On-
7、Line Analytical Processing特点1、需要对大量的事务型数据进行统计、归纳和分析 2、需要访问大量的历史数据 3、执行频率和对响应时间的要求都不高 典型的OLAP 决策支持系统(DSS-Decision Support System)OLTP与OLAPOLTP与OLAP在应用上的差异OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如电费交易OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果OLTP与OLAPOLTP 环境不适宜 OLAP 应用的原因在OLTP中直接构建OLAP应用是不合适的,要提高分析处理
8、和决策支持的效率和有效性,必须将OLAP及其所需的综合性数据从传统的OLTP和细节性数据中分离出来,按照DSS的需要重新进行组织,建立单独的分析处理环境。原因有六条:1、事务处理和分析处理的性能特性不同2、数据集成问题3、数据的动态集成问题4、历史数据问题5、数据的综合问题6、数据的访问问题OLTP与OLAP原因一、事务处理和分析处理的性能特性不同OLTP 每次操作处理的时间短,存取数据量小,但操作频率高,并发程度大。OLAP 每次分析可能需要连续运行很长的时间,存取数据量大,但很少做这样的分析处理,也没有并发执行的要求。OLTP与OLAP原因二、数据集成问题OLTP 一般只需要与本部门业务有
9、关的当前细节数据,而对整个企业范围内的集成应用考虑很少,这就造成大部分企业内部的数据是分散而非集成的。造成上述状况的原因1、事务处理应用的分散性2、数据不一致问题3、缺少分析所需的外部及非结构化数据OLAP 需要集成的数据,包括整个企业内部各部门的相关数据,以及企业外部、竞争对手等处的相关数据。因此用于分析处理的数据可能来自多种不同的数据源OLTP与OLAP原因三、数据动态集成问题对所需数据进行一次集成,以后就不再发生变化,称为静态集成对集成后的数据进行周期性刷新,称为动态集成在采用静态集成策略时,如果数据源中的数据发生了变化,那么这些变化就不能反映给决策者,导致决策使用的是过时的数据。因此集
10、成数据必须以一定的周期进行刷新(即采用动态集成策略),但传统的 OLTP 环境并不具备动态集成的能力。OLTP与OLAP原因四、历史数据问题OLTP 一般只需要当前数据,在数据库中一般也只存储短期数据(3-6个月),且不同数据的保存期限也不一样OLAP更看重历史数据(5-10年),可以通过对大量历史数据的详细分析来把握企业的发展趋势历史数据对于事务处理作用不大,但对于决策分析而言,如果没有历史数据的支撑,就变成了“无源之水”、“无本之木”。OLTP与OLAP原因五、数据的综合问题OLTP 需要的是当前的细节性操作数据,OLAP 需要的往往是大量的总结性分析型数据,而非数据库中的细节性操作型数据
11、OLTP 系统中积累的是大量的细节数据,而 OLAP 并不对这些细节数据进行分析,其原因是1、细节数据量太大,影响处理效率2、不利于分析人员将注意力集中于有用的信息上这就是常说的数据库中“数据丰富、信息贫困”现象。因此,在分析前往往需要对细节数据进行不同程度的综合,传统的事务处理系统不具备这种综合能力,而且在数据库系统中,这种综合还往往因为是一种数据冗余而被限制。OLTP与OLAP原因六、数据的访问问题OLTP 需要提供多种不同类型的数据访问操作,且对于需要修改的数据必须实时更新数据库OLAP数据的访问操作以读操作为主,且不需要实时的更新操作,只需要定时刷新OLTP与OLAPOLAP 与 OL
12、TP 分离的好处1、提高两个系统的性能2、提高操作型数据库的事务吞吐量3、避免两个系统中数据的结构、内容和用法的不同带来的困扰建立数据仓库的目的并不是要代替传统的事务处理系统(数据库),而是为了适应因市场商业经营行为的改变和精细化管理而进行的DSS的需要。数据仓库技术正成为企业信息集成和辅助决策应用的关键技术之一数据仓库技术正成为企业信息集成和辅助决策应用的关键技术之一OLTP与OLAP数据仓库与数据中心概述OLTP 与 OLAP多维数据分析模型数据整合应用介绍基本概念 对象(Object)和度量值(Measure)对象是我们所关心和分析的内容观察对象又称为度量值度量值是一组值,而且通常为数字
13、值度量值的选择取决于最终用户所请求的信息类型。一些常见的度量值有销售电量库存量发生金额职工人数线损率发现缺陷数量多维数据分析模型基本概念 维度(Dimension)维度是我们观察分析对象的角度例如:我们可以从三个“维度”来观察“发现缺陷”这个对象时间维度缺陷类型缺陷等级多维数据分析模型基本概念 层(Layer)对分析对象可以在不同的深度层面上进行分析与观察,并可能得到不同的分析结果。因此,层 反映了对分析对象的观察深度一般而言,层是与维相关联的。在一个维中可允许存在若干个层,并且可以采用多种不同的层次划分方法 年年份份 季季度度 月月份份 日日期期 周周 日期维 1、日期月份季度年 2、日期周
展开阅读全文