第2章数据仓库环境课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第2章数据仓库环境课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 环境 课件
- 资源描述:
-
1、第第2 2章章 数据仓库环境数据仓库环境数据仓库的定义数据仓库的定义n以1992年W.H.Inmon出版Building the Data Warehouse为标志,数据仓库速度发展起来,Inmon也被誉为“数据仓库之父”。nW.H.Inmon对数据仓库数据仓库的定义是:“数据仓库数据仓库是支持决策过程的、面向主题的、集成的、随是支持决策过程的、面向主题的、集成的、随时间变化的、持久的数据集合。时间变化的、持久的数据集合。n数据仓库是体系结构化环境的核心,是决策支持系统DSS处理的基础数据仓库的特征数据仓库的特征n数据仓库是面向主题(Subject-Orientation)的;n数据仓库是集成
2、(Integration)的;n数据仓库是稳定/非易失性(Nonvolatile)的;n数据仓库是随时间变化(Time Vagrancy)的;n数据仓库是信息的概括和聚集。面向主题面向主题汽车人寿健康意外伤亡操作型环境操作型环境应应 用用顾客保险单保险费索赔数据仓库数据仓库主主 题题集成集成 操作型环境操作型环境 应用A m,f应用B 1,0应用C x,y应用D 男,女 数据仓库数据仓库 m,f编码应用A 管道cm应用B 管道inches应用C 管道mcf应用D 管道yds管道cm属性度量应用A 描述应用B 描述应用C 描述应用D 描述应用A char(10)应用B dec fixed(9,2
3、)应用C pic 9999999应用D char(12)多重信息源描述char(12)冲突的键码集成集成?操作型环境数据仓库 J Jones女1945年7月20日。J Jones去年有两张罚单一次大事故。J JonesMain大街123号已婚。J Jones两个孩子高血压。人寿保险汽车保险房产保险健康保险J Jones女1945年7月20日出生去年两张罚单一次大事故已婚两个孩子高血压。顾客非易失性非易失性插入删除插入修改删除访问修改访问数据的逐个记录方式处理数据的逐个记录方式处理数据的批量载入数据的批量载入/访问访问操作型环境操作型环境数据仓库数据仓库随时间变化随时间变化操作型环境操作型环境数
4、据仓库数据仓库时间期限:当前到6090天 记录更新键码结构可能包括也可能不 包括时间元素时间期限:510年 数据的复杂快照关键字结构包括时间元素数据仓库的结构数据仓库的结构元数据元数据高度综合级高度综合级轻度综合级轻度综合级(数据集市数据集市)销售细节级销售细节级2000-2001操作型转换操作型转换早期细节级早期细节级每月销售每月销售1994-2001每周销售每周销售1994-2001当前细节级当前细节级销售细节级销售细节级1994-1999面向主题面向主题n数据仓库面向在高层企业数据模型中已定义好的企业主题域n每个主要主题域都是以一组相关的表来具体实现的,一般通过一个公共关键字联系起来n数
5、据仓库中可能有多个DBMS对数据进行管理,或根本没有DBMS管理nGIS中表现为:河流、宗地、土地利用图斑、地形等面向主题面向主题-“顾客顾客”主题主题主题可能包含不同介质上的数据主题可能包含不同介质上的数据每个表都有时间元素每个表都有时间元素粒度粒度n粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。n粒度是设计数据仓库最重要的方面。n细化程度越高,粒度级就越小;细化程度越低,粒度级就越大。n粒度细节的级别n粒度的划分决定了数据仓库中数据量的大小和查询的详细程度。n多重粒度:图幅比例尺大小、投影方式、数据采集的精度、数据的时间和空间分辨力、系统功能等来合理划分不同的粒度。粒度粒度细
6、节的级别细节的级别高细化低粒度例如:一个顾客一个月内 的每个电话的细节低细化高粒度例如:一个顾客一个月内 的电话的综合n数据仓库中粒度化的数据是重用性的关键n可利用数据仓库对数据一致性进行协调n粒度数据包含了整个企业的活动和事件历史n可以预测将来未知的需求n低粒度化数据的优点:n可由多个用户以不同的方式使用n低级别粒度具有更高的灵活性n不足:n粒度级别低会占用更多的存储空间n粒度级别低会降低数据的访问能力n粒度级别低需要更多的索引项n高粒度化数据的优点:n如果数据仓库空间有限,高粒度表示数据将比用低粒度级表示效率高很多n高粒度级只需要较少的字节表示,而且只需较少的索引n数据压缩在数据仓库中很有
展开阅读全文