数-据-仓-库-设-计课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数-据-仓-库-设-计课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课件
- 资源描述:
-
1、OLAP的旋转功能平面数据的坐标轴转换。12.78.5-4.38.9差量%-4432225402-299531102差量35000030000069000350000计划30667732540266005381102现有其它汽车家具服装销售量199912.7-44322350000306677所有其他8.525402300000325402汽车-4.3-29956900066005家具8.931102350000381102服装差量%差量计划现有销售量1999数数 据据 仓仓 库库 设设 计计1.1 1.1 系统设计的差异系统设计的差异操作型数据库操作型数据库数据仓库数据仓库面向应用面向应用面
2、向分析面向分析确定的应用需求确定的应用需求应用需求的收集和分析在系统设计前期确定;一旦确定,一般不再改变。不确定的分析需求不确定的分析需求数据分析需求的收集、分析和理解一般贯穿整个系统设计过程。事务处理性能事务处理性能数据的全局一致性数据的全局一致性数据来自于组织外部数据来自于组织外部数据获取;存储数据;数据查询;数据更新;数据安全;数据有效。数据来自于系统内部数据来自于系统内部数据转换、重组、综合;数据分析效率、准确性。1.2 SDLC与CLDSnSDLC操作型环境中,业务过程和规则比较规范和固定。系统设计人员能够清晰地了解应用的需求和数据流程,系统的设计一般采取系统生命周期法 (Syste
3、ms Development Life Cycle) 。nCLDS分析型环境中,DSS分析对决策分析的需求不能预先作出规范说明,只能给设计人员一个抽象模糊的描述。设计人员必须在与用户不断的交流中,将系统需求逐步明确与完善。为了强调这种开发的不确定型,将此设计方法定名为CLDS方法(与SDLC相反)。收集应用需求系统实施系统测试应用编程构建数据库应用1应用B应用CDB分析应用需求SDLC方法方法DSS应用编程DBDB外部数据数据仓库建模理解需求数据获取与集成系统测试构建数据仓库DWCLDS方法方法“数据驱动数据驱动”1.3 “数据驱动”的系统设计思路n识别出当前系统设计与已做工作的共同性; 出发
4、点n从已有数据库系统出发,按照分析领域对数据及数据之间的联系重新考察,组织数据仓库中的主题;n利用数据模型有效识别原有数据库中的数据和数据仓库中主题的数据的共同性。 中心数据驱动系统设计方法的中心数据驱动系统设计方法的中心数据模型数据模型操作型数据库设计数据仓库设计数据库数据仓库操作型数据库应用开发与设计DSS应用开发与设计数据模型2 数据仓库设计的三级数据模型n概念模型现实世界到机器世界的中间层次信息世界E-R法(实体-联系法)n逻辑模型关系模型n物理模型逻辑模型在数据仓库中的实现。物理存取方式、数据存储结构、数据存放位置以及存储分配等。数据模型对现实世界进行抽象的工具。3 提高数据仓库的性
5、能n粒度划分粒度划分细节级、轻度综合级、高度综合级n数据分割数据分割分割的标准:时间、业务领域、地理分布n物理设计中的其他问题物理设计中的其他问题表合并引入冗余建立广义索引建立数据序列表的物理分割生成导出数据提高系统的物理提高系统的物理I/O性能性能粒度划分n粒度划分的决定性因素是表的总行数粒度划分的决定性因素是表的总行数 数据存取是通过存取索引来实现的,索引是对应表的行来组织的。因此与表的数据量无关。n估算数据仓库中数据的行数估算数据仓库中数据的行数对每一已知表 统计一年内数据行数的最大行数和最小行数; 统计五年内数据行数的最大行数和最小行数。n根据估算出的数据行,决定是否要划分粒度根据估算
6、出的数据行,决定是否要划分粒度一年105行左右细节级、综合级一年106行以上细节级、轻度综合级、高度综合级五年106行左右细节级、综合级五年107行以上细节级、轻度综合级、高度综合级表合并表合并n当查询涉及到分散在几个物理块的多个表的数据,表的存取和连接操作会影响系统的性能。n为了节省I/O开销,可以把这些表的数据混合存放在一起。n表的合并只是物理上的合并,并非逻辑上的合并ENCS3MABS2CSAS1系别D姓名N学号S#学生表CCC2S3BC1S3BC4S2BC1S2AC4S1BC3S1AC1S1成绩G#课程号C#学号S#学生选课表SCS1C4AS1ASAC3BS1C1AS3CS2BS2C1
7、BS3C1BS2C4BS3C2C物理存储块n处理最值问题的方法广义索引。这个月销售最差的十种商品是什么?n从操作型数据库抽取数据并装载到数据仓库的同时,根据用户需要建立广义索引。引入冗余引入冗余建立广义索引建立广义索引n一些表的某些属性经常会被使用到,且不常更新,就可以将这些属性复制到多个表中,从而减少处理时被存取的表的个数。n商品固定信息表(商品号、商品名、类别 ) 商品销售表(商品名、销售量、销售日期 )商品销售表(商品名、商品名、类别、销售量、商品销售表(商品名、商品名、类别、销售量、销售日期销售日期 )数据序列数据序列1356472物理块1物理块2物理块31234567物理块1物理块2
8、表的物理分割n“数据分割数据分割”表的逻辑分割。表的逻辑分割。将一个表按一定的分割标准分成两个或多个表。n表的物理分割表的物理分割依据数据的存取频率和数据的稳定性来进行;将一张表按照各属性被存取的频率分成两个或多个表。n事先在原始数据的基础上进行总结或计算,生成导出数据。减少了I/O的次数,免去计算和汇总的步骤;建立了公共数据源,避免了不同用户进行重复计算可能产生的偏差。生成导出数据4 数据仓库设计步骤n数据驱动的系统设计方法n设计步骤 概念模型设计 技术准备工作 逻辑模型设计 物理模型设计 数据仓库生成 数据仓库运行与维护n实例:商店的数据仓库设计2技术环境准备技术环境准备2确定主题域确定主
9、题域1技术评估技术评估1界定系统边界界定系统边界概念模型设计概念模型设计技术准备工作技术准备工作2数据分割策略数据分割策略4记录系统定义记录系统定义1粒度层次划分粒度层次划分3关系模式定义关系模式定义1确定存储结构确定存储结构4确定存储分配确定存储分配2确定索引结构确定索引结构3确定存放位置确定存放位置逻辑模型设计逻辑模型设计物理模型设计物理模型设计数数 据据 仓仓 库库 生生 成成 1设设计计接接口口2数数据据输输入入数据仓库运行与维护数据仓库运行与维护分析主题域,针对每一个当前实施的主题域分析主题域,针对每一个当前实施的主题域数据类型数据类型分析分析数据仓库设计步骤数据仓库设计步骤源系统源
10、系统分析分析程序程序说明说明技术评估技术评估粒度分析粒度分析编编程程数据数据装入装入数据仓库设计数据仓库设计运行与维护运行与维护技术环境准备技术环境准备1854327611109反反 馈馈循循 环环主题域主题域分析分析IBMnIBMVisual Warehouse(VW)Essbase/DB2 OLAP Server 5.0及管理器IBM DB2 UDBHyperion Wired for OLAP/Business ObjectsnInformixInformix Formation和Informix DataStageInformix Red Brick Warehouse数据库Infor
11、mix MetaCube OlAP服务器Informix MetaCube Exploer/Web ExplorerOracalnOracal8i关系型数据库引擎nOracle Warehouse BuilderingETL工具nExpress多维数据库引擎nDiscover关系OLAP查询工具nOracle数据挖掘套件其他厂商nMicrosoftSQL ServerPlato和Data Transformation ServicesnSybasenSASnNCR4.1.1 界定系统边界需求分析n要做的决策类型由哪些?n决策者感兴趣的是什么问题? n这些问题需要些什么样的信息?n要得到这些信息
展开阅读全文