数据仓库多维数据库模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据仓库多维数据库模型课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 多维 数据库 模型 课件
- 资源描述:
-
1、何谓数据仓库?何谓数据仓库? 一种面向分析的环境;一种面向分析的环境; 一种把相关的各种数据转换成有商业价值的信息一种把相关的各种数据转换成有商业价值的信息的技术。的技术。1、从数据库到数据仓库、从数据库到数据仓库 数据库系统能够很好的用于事务处理,但它对分数据库系统能够很好的用于事务处理,但它对分析处理的支持一直不能令人满意。特别是当以业务处析处理的支持一直不能令人满意。特别是当以业务处理为主的联机事务处理(理为主的联机事务处理(OLTP) 应用和以分析处理应用和以分析处理为主的为主的DSS应用共存于一个数据库系统时,就会产生应用共存于一个数据库系统时,就会产生许多问题。许多问题。 例如,事
2、务处理应用一般需要的是当前数据,例如,事务处理应用一般需要的是当前数据,主要考虑较短的响应时间;而分析处理应用需要是历主要考虑较短的响应时间;而分析处理应用需要是历史的、综合的、集成的数据,它的分析处理过程可能史的、综合的、集成的数据,它的分析处理过程可能持续几个小时,从而消耗大量的系统资源。持续几个小时,从而消耗大量的系统资源。 人们逐渐认识到直接用事务处理人们逐渐认识到直接用事务处理环境环境来支持来支持DSS是是行不通的。要提高分析和决策的有效性,分析型处理及行不通的。要提高分析和决策的有效性,分析型处理及其数据必须与操作型处理及其数据分离。必须其数据必须与操作型处理及其数据分离。必须把分
3、析型把分析型数据从事务处理环境中提取出来,按照数据从事务处理环境中提取出来,按照DSS处理的需要处理的需要进行重新组织,建立单独的分析处理环境进行重新组织,建立单独的分析处理环境。 数据仓库技术正是为了构建这种新的分析处理环境数据仓库技术正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。而出现的一种数据存储和组织技术。操作型数据操作型数据分析型数据分析型数据细节的细节的综合的,或提炼的综合的,或提炼的在存取瞬间是准确的在存取瞬间是准确的代表过去的数据代表过去的数据可更新可更新不更新不更新操作需求事先可知道操作需求事先可知道操作需求事先不知道操作需求事先不知道生命周期符合生命周期符
4、合SDLC完全不同的生命周期完全不同的生命周期对性能要求高对性能要求高对性能要求宽松对性能要求宽松一个时刻操作一个单元一个时刻操作一个单元一个时刻操作一个集合一个时刻操作一个集合事物驱动事物驱动分析驱动分析驱动面向应用面向应用面向分析面向分析一次操作数据量小一次操作数据量小一次操作数据量大一次操作数据量大支持日常操作支持日常操作支持管理需求支持管理需求数据仓库与决策支持系统(数据仓库与决策支持系统(DSS) 用户在进行决策制定时需要得到企业各方面的信用户在进行决策制定时需要得到企业各方面的信息,因此用户一般首先根据各个业务部门数据库中的息,因此用户一般首先根据各个业务部门数据库中的数据,创建数
5、据仓库,存储各种历史信息和汇总信息。数据,创建数据仓库,存储各种历史信息和汇总信息。 对数据仓库的进一步应用由功能强大的分析工具对数据仓库的进一步应用由功能强大的分析工具来实现。现在主要有三类分析工具可用于决策支持。来实现。现在主要有三类分析工具可用于决策支持。 第一类能够支持涉及分组和聚集查询,并能够对第一类能够支持涉及分组和聚集查询,并能够对各种复杂的布尔条件、统计函数和时间序列分析提供各种复杂的布尔条件、统计函数和时间序列分析提供支持的系统。主要由上述查询组成的应用称为联机分支持的系统。主要由上述查询组成的应用称为联机分析处理,即析处理,即OLAP。在支持。在支持OLAP查询的系统中,数
6、据查询的系统中,数据最好看成是一个多维数组。最好看成是一个多维数组。 第二类系统仍为支持传统第二类系统仍为支持传统SQL查询的查询的DBMS,但为,但为了有效地执行了有效地执行OLAP查询而进行了特殊的设计。这些系查询而进行了特殊的设计。这些系统可以看作是为决策支持应用进行了优化的关系数据库统可以看作是为决策支持应用进行了优化的关系数据库系统。许多关系数据库厂商对他们的产品进行了扩展,系统。许多关系数据库厂商对他们的产品进行了扩展,并且随着时间的推移,专门的并且随着时间的推移,专门的OLAP系统和支持决策支系统和支持决策支持的关系数据库系统之间的差别将逐渐取消。持的关系数据库系统之间的差别将逐
7、渐取消。 第三类的分析工具可用于在大量的数据集合中,找第三类的分析工具可用于在大量的数据集合中,找到有意义的数据趋势或者模式,而不是上面提到的复杂到有意义的数据趋势或者模式,而不是上面提到的复杂数据查询。在数据分析过程中,尽管分析者能够判定得数据查询。在数据分析过程中,尽管分析者能够判定得到的数据模式是否有意义,但是生成查询来得到有意义到的数据模式是否有意义,但是生成查询来得到有意义的模式还是很困难的。例如,分析者查看信用卡使用记的模式还是很困难的。例如,分析者查看信用卡使用记录,希望从中找出不正常的信用卡使用行为,以表明是录,希望从中找出不正常的信用卡使用行为,以表明是被滥用的丢失的信用卡;
8、商人希望通过查看客户记录找被滥用的丢失的信用卡;商人希望通过查看客户记录找出潜在的客户来提高收益。许多应用涉及的数据量很大,出潜在的客户来提高收益。许多应用涉及的数据量很大,很难用人工分析或者传统的统计分析方法进行分析,很难用人工分析或者传统的统计分析方法进行分析,数数据挖掘据挖掘的目的就是对这种大量数据的分析提供支持。的目的就是对这种大量数据的分析提供支持。2、数据仓库的定义及特征、数据仓库的定义及特征 数据仓库理论的创始人数据仓库理论的创始人W.H.Inmon在其在其Building the Data Warehouse一书中,给出了数据仓库的四个一书中,给出了数据仓库的四个基本特征:基本
9、特征:面向主题,数据是集成的,数据是不可更新面向主题,数据是集成的,数据是不可更新的,数据是随时间不断变化的的,数据是随时间不断变化的。采购子系统采购子系统: 订单(订单号,供应商号,商品号,类别,单价。数订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日期,量,总金额,日期, ) 供应商(供应商号,供应商名,地址,电话,供应商(供应商号,供应商名,地址,电话,)销售子系统:销售子系统: 客户(客户号,姓名,地址,电话,客户(客户号,姓名,地址,电话, ) 销售(客户号,商品号,数量,单价,日期,销售(客户号,商品号,数量,单价,日期, )库存子系统:库存子系统: 进库单(编号,商品
10、号,数量,单价,日期,进库单(编号,商品号,数量,单价,日期, ) 出库单(编号,商品号,数量,单价,日期,出库单(编号,商品号,数量,单价,日期, ) 库存(商品号,库存(商品号, 库房号,类别,单价,库存数量,库房号,类别,单价,库存数量,总金额,日期,总金额,日期, ) 商品固有信息:商品号,类别,单价,颜色,商品固有信息:商品号,类别,单价,颜色, 商品采购信息:商品号,类别,供应商号,供应商品采购信息:商品号,类别,供应商号,供应日期,单价,数量,日期,单价,数量, 商品销售信息:商品号,客户号,数量,单价,商品销售信息:商品号,客户号,数量,单价,销售日期,销售日期, 商品库存信息
11、:商品号,商品库存信息:商品号, 库房号,库存数量,日库房号,库存数量,日期,期, )商品主题域:商品主题域:采购子系统采购子系统销售子系统销售子系统库存子系统库存子系统3、数据仓库中的数据组织、数据仓库中的数据组织 数据仓库中的数据分为四个级别:早期细节级,当数据仓库中的数据分为四个级别:早期细节级,当前细节级,轻度综合级,高度综合级。前细节级,轻度综合级,高度综合级。19851998年年销售明细表销售明细表19982003年年销售明细表销售明细表19982003年年每月销售表每月销售表19982003年年每季度销售表每季度销售表 DW中还有一类重要的数据:元数据(中还有一类重要的数据:元数
12、据(metedata)。)。元数据是元数据是“关于数据的数据关于数据的数据”(RDBMS中的数据字典中的数据字典就是一种元数据)。就是一种元数据)。 数据仓库中的元数据描述了数据的结构、内容、索数据仓库中的元数据描述了数据的结构、内容、索引、码、数据转换规则、粒度定义等。引、码、数据转换规则、粒度定义等。4、数据仓库系统结构、数据仓库系统结构RDBMS数据文件数据文件其他其他 综合数据综合数据 当前数据当前数据 历史数据历史数据 元数据元数据 抽取、转换、装载抽取、转换、装载数据仓库数据仓库OLAP工具工具 DM工具工具 查询工具查询工具分析工具分析工具二、数据仓库设计二、数据仓库设计 数据仓
展开阅读全文