BI基础概念PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《BI基础概念PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BI 基础 概念 PPT 课件
- 资源描述:
-
1、.1 nBI的价值n如何构建BIn 数据仓库设计中的几个重要概念 n维度建模目目录.2 操作型数据 如:某商场1瓶价格为88元的葡萄酒在被购买的过程中,收银员实际收到100元,找零12元。 特点:细节化,分散化关键概念.3关键概念 决策型数据 如:该商场在1月9日上午一共卖出了多少瓶葡萄酒?该商场的所有葡萄酒总销量在一年中什么时候最高和最低? 特点:综合化,集成化.4企业对应用集成的需求我要了解企业目前的运转情况!(实时监控)我要知道某地区近5年内的销售情况以制定未来的发展策略!(决策支持)我要知道哪些是值得发展的优质的顾客!(预测).5BI应用带来的关键效益获得对业务绩效,流程和客户的可见性
2、和洞察力更好的进行决策和执行决策,以快速应对机会和挑战协同一致横跨多个业务和数据源,获得唯一的、一致的企业信息在各业务层面中协同战略和执行.6BI应用带来的关键效益中层管理分析 :专注点是 绩效的战术应用 与目标相比,我做的如何? 问题在哪里高层领导分析 : 专注点是 计划战略 & 目标制定 业务发展得如何,我们下一步该往哪里走通过集成实时与历史数据,将分析转换为执行力一线分析 :专注点是 执行有效性与行动 我每天要做哪 3-5 件事情 哪些信息能让我更有效地执行这些行动? 回答问题: 我现在该做哪些事情?.7数据仓库的概念.8 nBI的价值n如何构建BIn 数据仓库设计中的几个重要概念 n维
3、度建模目目录.9BI BI应用架构BI 应用.10BI BI系统架构Microsoft OfficeBI ServerBI Presentation Server交互式信息板 即席查询 报表分析 预警提醒 商务智能应用前端展示层商务智能服务层前端展示层应用服务层数据库层ERP系统其他应用系统财务平台Excel XML业务流程数据源层商务智能应用模型架构:财务、销售、订单、服务、市场、供应链、人力ETL商务智能应用数据存储星型模型DWCube.11构建BI BI涉及的开发工具查询工具与电子制表ETL 与元数据管理报表与文档管理OLAP多维分析DataMining数据挖掘Portal门户网站主流产
4、品:ETL: Informatica、Datastage 、Kettle、SSIS前端展现:Oracle BIEE、Business Object、MicroStregy、 Cognos、Oracle Essbase、SmartBI整体解决方案:Oracle BI Apps.12数据仓库设计中的几个重要概念.13数据仓库设计中的几个重要概念 .14数据仓库设计中的几个重要概念 .15数据仓库设计中的几个重要概念 .16数据仓库设计中的几个重要概念ExternalDataODSCentral DataWarehouseDataMartDataMartDataMartDataMartCentral
5、 DataWarehouseExternalDataODSpartpartpartpartpartpart1.建造企业数据仓库n 建设中心数据模型n 一次性的完成数据的重构工作n 最小化数据冗余度和不一致性n 存储详细的历史数据2.从企业数据仓库中建造数据集市n 得到大部分的集成数据n 直接依赖于数据仓库的可用性1.创建部门的数据集市n 范围局限于一个主题区域n 快速的ROI - 局部的商业需求得到满足n 本部门自治 - 设计上具有灵活性n 对其他部门数据集市是一个好的指导n 容易复制到其他部门 n 需要为每个部门做数据重建n 有一定级别的冗余和不一致性2.扩大到企业数据仓库n 创建EDB作为
6、一个长期的目标投资效益的时间?建设中心数据模型的必要性和可能性?初始费用 ?自上而下VSVS自下而上数据集市的数据都是可用的吗?能生成数据模型吗?如何解决不一致性?.17目录nBI的价值n如何构建BIn数据仓库设计中的几个重要概念 n维度建模n基础术语n建模中的三种模型n维度的类型n常用的事实表类型n建模的一般过程.18基础术语 事实表是指其中保存了大量业务度量数据的表。事实表中的度量值一般称为事实。在事实表中最有用的事实就是数字类型的事实和可加类型的事实。事实表的粒度决定了数据仓库中数据的详细程度。 一般事实表中只存放数字或者一些Flag用来统计(Count),如收益、数量、支出等销售事实收
7、益数量支出毛利.19基础术语 维度表可以看作是用户分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息。客户维时间维商场维产品维销售事实时间ID客户ID产品ID商场ID收益数量支出毛利.20基础术语 粒度是指数据仓库中数据的细化或综合程度的级别,也就是数据的详细程度。细节程度越高,粒度级就越低,反之亦然。我可以用很多的数据,但同样我也可以只用必需的数据。而这起决于存储器。如果有很大的硬盘,那就没有我们不能存的事情。设计粒度是设计数据仓库中的一个重要前提高细化低细化每月200个记录每月40,000个字节每月
8、一个记录每月200个字节通过检索可以回答无细节无法回答询问某一电话的细节.21基础术语 粒度是指数据仓库中数据的细化或综合程度的级别,也就是数据的详细程度。细节程度越高,粒度级就越低,反之亦然。我可以用很多的数据,但同样我也可以只用必需的数据。而这起决于存储器。如果有很大的硬盘,那就没有我们不能存的事情。设计粒度是设计数据仓库中的一个重要前提高度综合级轻度综合级(数据集市)销售细节级2000-2001操作型转换每月销售1994-2001每周销售1994-2001当前细节级.22目录nBI的价值n如何构建BIn数据仓库设计中的几个重要概念 n维度建模n基础术语n建模中的三种模型n维度的类型n常用
9、的事实表类型n建模的一般过程.23建模中的三种模型.24建模中的三种模型 事实表被维度所包围,维表和事实表通过主关键字和外关键字联系在一起,且维度没有被新的表连接客户维时间维商场维产品维销售事实时间ID客户ID产品ID商场ID收益数量支出毛利.25建模中的三种模型 事实表被多个维表或一个或多个层次所包围,雪花模型一般在处理大的且相对静态的层次的时候使用客户维时间维商场维产品维销售事实时间ID客户ID产品ID商场ID收益数量支出毛利联系人维区域维.26目录nBI的价值n如何构建BIn数据仓库设计中的几个重要概念 n维度建模n基础术语n建模中的三种模型n维度的类型n常用的事实表类型n建模的一般过程
10、.27维度的类型.28维度的类型,简称 缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流失发生缓慢的变化(如:组织结构的调整、客户更改了他的名称或地址)。这种随时间发生变化的维度我们一般称之为缓慢变化维,并且把处理维度表的历史变化信息的问题称为处理缓慢变化维的问题,有时也简称为处理SCD的问题。 处理缓慢变化维的方法通常有三种方式: 第一种方式是直接覆盖原值,通常简称为“TYPE 1” 。这样处理,最容易实现,但是没有保留历史数据,无法分析历史变化信息。 第二种方式是添加维度行,通常简称为“TYPE 2” 。这样处理,需要代理键的支持。实现方式是当有维度属性发生变化
11、时,生成一条新的维度记录,主键是新分配的代理键,通过自然键可以和原维度记录保持关联。 第三种方式是添加属性列,通常简称为“TYPE 3” 。这种处理的实现方式是对于需要分析历史信息的属性添加一列,来记录该属性变化前的值,而本属性字段使用TYPE 1来直接覆盖。这种方式的优点是可以同时分析当前及前一次变化的属性值,缺点是只保留了最后一次变化信息。.29维度的类型 客户Simmy将自己的地址由原先的Addr1改为Addr2。这时我们需要将这个记录了客户Simmy的记录中Address从Addr1更新为Addr2,且不记录历史ID:111Name:SimmyAddress:Addr1ID:111Na
12、me:SimmyAddress:Addr2OLD记录ID为111的客户Simmy的信息的记录中地址直接更改为Addr2,不保存历史Addr1NEW.30维度的类型 客户Simmy将自己的地址由原先的Addr1改为Addr2。这时我们需要将这个记录了客户Simmy的记录中的有效截止日期改为现在,并重新添加一条有效截止日期为现在的和一个新的版本号且Address为Addr2的记录ID:111Version:1Name:SimmyAddress:Addr1Effective Start Date:2007-4-21Effective End Date:NowID:111Version:2Name:S
13、immyAddress:Addr2Effective Start Date:NowEffective End Date:NullID:111Version:1Name:SimmyAddress:Addr1Effective Start Date:2007-4-21Effective End Date:Null更新为添加新的记录.31维度的类型ID:111Name:SimmyCurrent Address:Addr1Old Address:NullID:111Name:SimmyCurrent Address:Addr2Old Address:Addr1.32维度的类型Rapidly Chang
14、ing Dimension,RCDn 当某个维度的变化是非常快的时候,我们认定他为快速变化维(具体要看实际的变化频率),比如:客户的地址、联系电话等。 数据仓库中最有意思的维度是一些非常大的维度,比如客户,产品等等。一个大的企业客户维度往往有上百万记录,每条记录又有上百个字段。而大的个人客户维度则会超过千万条记录,这些个人客户维度有时也会有十多个字段,但大多数时候比较少见的维度也只有不多的几个属性。.33维度的类型 以客户维度举例来说,如果维度表中有数百万行记录或者还要多,而且这些记录中的字段又经常变化,这样的维度表一般称之为快变超大维度。对于快变超大维度,设计人员一般不会使用TYPE 2的缓
展开阅读全文