数据仓库数据仓库概述ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据仓库数据仓库概述ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 概述 ppt 课件
- 资源描述:
-
1、第第1 1讲讲 数据仓库概述数据仓库概述1数据仓库概述数据仓库概述1.1 1.1 数据仓库产生的原因数据仓库产生的原因1.2 1.2 数据仓库的基本概念数据仓库的基本概念1.3 1.3 数据仓库的体系结构数据仓库的体系结构2数据仓库概述数据仓库概述1.1 1.1 数据仓库产生的原因数据仓库产生的原因v 1.1.1 1.1.1 操作型数据处理操作型数据处理v 1.1.2 1.1.2 分析型数据处理分析型数据处理v 1.1.3 1.1.3 两种数据处理模式的差异两种数据处理模式的差异v 1.1.4 1.1.4 数据库系统的局限性数据库系统的局限性31.11.1数据仓库产生的原因数据仓库产生的原因两
2、者有何不同?v 数据库:存放数据的地方。v 数据仓库:存放数据的地方。41.11.1数据仓库产生的原因数据仓库产生的原因两者有何不同?v 数据库:存放数据的地方。v 数据仓库:存放数据的地方。51.11.1数据仓库产生的原因数据仓库产生的原因两者有何不同?v 数据库:存放数据的地方。v 数据仓库:存放数据的地方。61.11.1数据仓库产生的原因数据仓库产生的原因71.11.1数据仓库产生的原因数据仓库产生的原因81.11.1数据仓库产生的原因数据仓库产生的原因两者有何不同?v 数据库:存放数据的地方。v 数据仓库:存放数据的地方。91.11.1数据仓库产生的原因数据仓库产生的原因数据处理的类型
3、 操作型处理(OLTP):数据的收集、整理、存储、查询和增、删、改操作。 分析型处理(OLAP):数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析。101.1.11.1.1操作型数据处理操作型数据处理v 是数据库系统的主要应用v 特点:数据存取频率高、响应时间要快、 存取数据量小、数据存储正确可靠。v 系统基本架构: 数据库数据库用户用户用户用户用户用户数据库管理系统数据库管理系统应用系统应用系统111.1.11.1.1操作型数据处理操作型数据处理为了有效地对事务进行处理,数据库管理系统在技术和管理上采取了很多措施:v提出了事务的概念v采用日志、备份等恢复技术和并发控制技术v采用索引
4、技术快速定位数据121.1.11.1.1操作型数据处理操作型数据处理在数据库设计中v广泛采用了规范化理论,消除表中属性间的部分函数依赖和传递函数依赖。v消除了数据的冗余,缩短了数据处理时间。131.1.21.1.2分析型数据处理分析型数据处理典型的分析型应用就是决策支持系统。需要具备的基本功能是:建立各种数学模型,对数据统计分析,得出有用的信息作为决策的依据。141.1.21.1.2分析型数据处理分析型数据处理常规应用实例:某产品的销售经理希望通过调整该产品在各零售店的分配数量来扩大其销售量。v需要查询历史数据库中各类零售店最近若干年(例如5年)内每天的销售记录。v统计运算计算出近5年来各店的
5、年度销售量。v比较确定销售量增长较快的零售店。151.1.21.1.2分析型数据处理分析型数据处理决策支持系统:需要花数小时甚至更长时间的处理、需要遍历数据库中的大部分数据,进行复杂的计算,需要消耗大量的系统资源。161.1.3两者数据处理模式的差别操作型数据操作型数据分析型数据分析型数据细节的 综合的,或提炼的当前数据历史数据更新的不可更新,只读的生命周期符合SDLC(软件开发生命周期)完全不同的生命周期对性能要求高 对性能要求宽松一个时刻操作一个单元一个时刻操作一个集合事务驱动分析驱动面向应用面向分析一次操作数据量小,计算简单一次操作数据量大,计算复杂支持日常操作支持管理需求171.1.4
6、数据库系统的局限v传统的数据库系统在操作型数据处理应用中取得了巨大的成功。v将其应用到分析型数据处理方面却无能为力。 181.1.4数据库系统的局限v信息系统建设的阶段性和分布性的特点,信息系统建设的阶段性和分布性的特点, 导致导致“信息孤岛信息孤岛”的存在。的存在。191.1.4数据库系统的局限201.1.4数据库系统的局限(续)1)数据的分散联机事务处理系统一般只需要与本部门业务相关的当前数据。企业内部各应用之间实际上几乎都是独立的。212)“蜘蛛网”问题v 解决数据分散的一种方法就是对数据进行集成v 抽取程序带来了“蜘蛛网”问题,即需要在抽取的数据中再次抽取,将导致企业数据之间形成错综复
7、杂的网状结构。1.1.4数据库系统的局限223)数据不一致问题由于数据分散,导致多个应用间的数据不一致:u 同一字段在不同应用中具有不同的数据类型u 同一字段在不同应用中具有不同的名字u 字段名字相同,但含义不同1.1.4数据库系统的局限234)数据动态集成问题u 数据集成开销很大。一些应用仅在开始时对进行集成,以后一直以这部分集成数据作为分析基础,称为静态集成。导致决策者使用过时数据。u 如果希望能够用上最新数据,每次分析之前都进行数据集成,称为动态集成。联机事务处理系统不具备动态集成能力。1.1.4数据库系统的局限245)历史数据问题v联机事务处理一般只需要当前数据,数据库适于存储高度结构
8、化的日常事务细节数据。v决策型数据多为历史性、汇总性或计算性数据。1.1.4数据库系统的局限256)数据的综合问题u 联机事务处理系统中积累了大量的细节数据,决策支持系统并不对细节数据进行分析。u 决策分析环境中,细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力。u 因此分析前,需要对细节数据进行不同程度的综合。1.1.4数据库系统的局限26v结论u 要提高分析和决策的效率和有效性,必须把分析数据从事务处理环境中提取出来,按照决策支持系统处理的需要进行重新组织,建立单独的分析型处理环境。u 数据仓库正是为了构建这种新的分析型处理环境而出现的一种数据存储和组织技术
9、。1.1.4数据库系统的局限27数据仓库概述数据仓库概述1.1 1.1 数据仓库产生的原因数据仓库产生的原因1.2 1.2 数据仓库的基本概念数据仓库的基本概念1.3 1.3 数据仓库的体系结构数据仓库的体系结构28 “数据仓库”一词最早是在1990年,由Bill Inmon提出的。数据仓库的四个基本特征:u数据仓库的数据是面向主题的(Subject Oriented);u数据仓库的数据时集成的(Integrate);u数据仓库的数据不可更新(Non-Volatile);u数据仓库的数据时随时间不断变化(Time Variant)的。 1.2 数据仓库的基本概念29v数据仓库就是一个面向主题的
展开阅读全文