第4章-OLAP-在线联机分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第4章-OLAP-在线联机分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OLAP 在线 联机 分析 课件
- 资源描述:
-
1、OLAP多维数据集多维数据集n多维数据集提供了一种信息系统结构,这种结构可以使企业灵活地对数据进行访问,可以用多种方法对数据进行切片、分块、动态地考察汇总数据和细节数据之间的关系n数据仓库中的细节数据为多维数据集提供了稳健方便的数据源.多维数据集和数据仓库多维数据集和数据仓库n数据仓库与多维数据集的区别:n多维数据集数据量比数据仓库少一个数据量级n数据仓库只适合少量灵活访问,多维数据集适合大量不可预知的访问和分析n数据仓库存储很长时间范围内的数据,多维数据集存储较短时间范围内的数据n数据仓库只允许分析人员以受限的形式访问数据,而多维数据集允许自由地访问n多维数据集和数据仓库有着互补的关系:n数
2、据仓库中可以存储非常细节的数据,而多维数据集中往往会对细节数据进行轻度综合,DSS分析人员可以同时获取这二种数据n汇总信息在多维数据集中计算和聚集后存储在数据仓库中维(Dimension)n维是人们观察数据的特定角度。n例如,企业常常关心产品销售随着时间推移而产生的变化的情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。n企业也常常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。维度维的层次n人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这个描述方面为维的层次。n一个
3、维往往具有多个层次,例如:n描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;n同样,城市、地区、国家就构成了一个地理维的多个层次。维成员n维的一个取值就称为该维的一个维成员。n如果一个维是多层次的,那么该维的维成员就是不同维层次的取值的组合。n例如,考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到时间维的一个维成员,即“某年某月某日”。多维数组n一个多维数组可以表示为(维1,维2,维n,变量),这样可以构成三维、四维及多维的数据表示结构。其中,变量表示我们所观察的数据对象,维1、维2、维n分别表示我们
4、观察该数据对象的角度。n如(时间,商品种类,商店,销售额),从而构成一个有关商品销售额的三维数组。(2000年,家电,南京市,1亿)(2000年7月,女性服装,江苏省,10亿)数据单元(单元格)n多维数组的取值称为数据单元。n当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个观察对象的值,即(维成员1,维成员2,维成员n,对象值)。立方体和超立方(Cube)多维数据模型的数据结构可以用这样来一个多维数组来表示:(维1,维2,维n,度量值),例如:商品销售数据是按时间、地区、商品种类,加上度量“销售额”组成的一个三维数组:(地区,时间,商品种类,销售额)。三维数组可以用一个立方
5、体来直观的表示,立方体中每一个交点对应于一个事件。一般地多维数组用多维立方体来表示,但数据立方体并不一定限于三维,因此又称为超立方数据立方体数据立方体日 期一季度二季度三季度四季度ALL品VCDTV产PCALLNO1NO2NO3ALL商 店可以按照产品、日期、商店三个维度任意组合,生成销售情况OLAP的产生背景的产生背景n60年代,关系数据库之父年代,关系数据库之父E.F.Codd提出了关系提出了关系模型,促进了联机事务处理模型,促进了联机事务处理(OLTP)的发展的发展(数据数据以表格的形式而非文件方式存储以表格的形式而非文件方式存储)。n1993年,年,E.F.Codd提出了提出了OLAP
6、概念,认为概念,认为OLTP已不能满足终端用户对数据库查询分析的已不能满足终端用户对数据库查询分析的需要,需要,SQL对大型数据库进行的简单查询也不对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。而查询的结果并不能满足决策者提出的需求。因此,因此,E.F.Codd提出了多维数据库和多维分析提出了多维数据库和多维分析的概念,即的概念,即OLAP。n 什么是OLAP?nOLAP,英文全称为On-Line Analy
7、sis Processing,中文名称为联机分析处理,也称为在线分析处理。nOLAP允许以一种称为多维数据集的多维结构访问来自商业数据源(如数据仓库)的经过聚合和组织整理的数 据。nOLAP是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。OLTP与OLAPn随着数据库系统广泛应用,数据库系统记录和随着数据库系统广泛应用,数据库系统记录和处理的数据越来越多,及时地记录和处理企业处理的数据越来越多,及时地记录和处理企业的各种业务数据,这些系统成为联机事务处理的各种业务数据,这些系统成为联机事务处理(OLTP)(OLTP)系统
8、。数据库技术的广泛应用和技术的系统。数据库技术的广泛应用和技术的发展,人们已经不再满足于仅仅用数据库系统发展,人们已经不再满足于仅仅用数据库系统来记录企业的业务活动数据和对数据的简单处来记录企业的业务活动数据和对数据的简单处理,人们需要对企业业务活动的数据进行各种理,人们需要对企业业务活动的数据进行各种分析,以便发现企业业务趋势,这些系统称为分析,以便发现企业业务趋势,这些系统称为联机分析处理联机分析处理(OLAP)(OLAP)系统。系统。OLTPOLAP数据库原始操作数据库导出数据或数据仓库数据细节性数据综合性数据当前数据历史性数据经常性更新数据不可更新,但可周期性刷新数据一次性处理的数据量
9、少一次性处理的数据量多对响应时间要求高响应时间合理用户量大用户量少面向操作人员、支持日常操作面向决策人员、支持管理需要面向应用、实物驱动面向分析、分析驱动OLTP与OLAP对比表OLAPOLAP特性特性n快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户的大部分分析要求做出反应。客户/服务器体系结构两层或三层C/S结构。n可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。n多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。n信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息
10、,并且管理大容量信息。n数据仓库是一个包含企业历史数据的大规模数数据仓库是一个包含企业历史数据的大规模数据库,这些历史数据安用十对企业的经营决策据库,这些历史数据安用十对企业的经营决策提供分析和支持。数据仓库中的数据是不能用提供分析和支持。数据仓库中的数据是不能用于于OLTP的,而的,而OLAP技术则利用数据仓库中技术则利用数据仓库中的数据进行联机分析,将复杂的分析查询结果的数据进行联机分析,将复杂的分析查询结果快速地返回用户。快速地返回用户。n OLAP利用多维数据集和数据聚集技术对数利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析据仓库中的数据进行组织和汇总,用联机
11、分析和可视化工具对这些数据迅速进行评价。和可视化工具对这些数据迅速进行评价。提取提取,清清理转换理转换,装入刷装入刷新新输输出出查询/报告分析数据挖掘OLAPOLAP服务器OLAPOLAP服务器监控 管理元数据存储数据仓库数据集市操作数据库外部数据源顶层:前端工具中间层:OLAPOLAP服务器底层:DWDW服务器数据数据仓库系统结构nOLAPOLAP是是DWDW主要的前端支持工具。在主要的前端支持工具。在OLAPOLAP系统中,客户能够以多维视觉图的方式,系统中,客户能够以多维视觉图的方式,搜寻数据仓库中存储的数据。搜寻数据仓库中存储的数据。n多维报表多维报表n饼图饼图n直方图直方图n柱状图柱
12、状图n曲线图曲线图n切片和切块切片和切块n旋转旋转n地图地图nOLAP前端展现方式前端展现方式OLAP的基本操作nOLAP的基本操作是指对以多维形式组织起来的数据采取钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)、以及旋转(Pivot)等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而深入地了解包含在数据中的信息和内涵。钻取钻取(Drill)(Drill)n钻取:是改变维的层次,变换分析的粒度。n维度的层次反映了数据的综合程度。层次高,代表数据综合程度高,细节数据少,数据量也少;层次低,代表数据综合度低,细节数据多,数
展开阅读全文