第四讲-数据仓库课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四讲-数据仓库课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据仓库 课件
- 资源描述:
-
1、2023-1-22第四讲 数据仓库第四讲第四讲 数据仓库数据仓库第四讲 数据仓库数据库与数据仓库数据库与数据仓库l数据不一致数据不一致l可频繁删除数据可频繁删除数据l存放短期数据(存放短期数据(3个月内)个月内)l存在数据冗余存在数据冗余第四讲 数据仓库数据仓库概述数据仓库概述l数据仓库与CRM有着难以割舍的密切关系,客户关系管理的很多工作都是以数据仓库为基础展开的。l利用数据仓库,企业可以对客户行为进行分析和预测,从而制定准确的市场策略、发现重点客户和评价市场性能。对于客户量大、市场策略对企业影响较大的企业来说,必须在客户关系管理系统中包含数据仓库。第四讲 数据仓库数据仓库的产生数据仓库的产
2、生l早期的数据库主要支持联机事务处理l传统数据库不能满足决策支持对数据库的要求(1)事务处理和分析处理的性能特性不同(2)数据集成问题(3)历史数据问题第四讲 数据仓库(1)事务处理和分析处理的性能特性不同l所有联机事务处理强调的是数据更新处理性能数据更新处理性能和系统系统的可靠性的可靠性。在事务处理环境中,用户的行为特点是数据的存取操作频率高,每次操作处理的时间短。l在分析处理环境中,用户的行为模式与此完全不同,强调的是数据处理和分析的能力数据处理和分析的能力。在传统数据库系统基础上的决策支持(DSS)应用程序可能需要连续几个小时,从而消耗大量的系统资源。l联机分析和事务处理对系统的要求不同
3、,同一个数据库在理论上难以做到两全,将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。第四讲 数据仓库(2)数据集成问题lDSS需要集成的数据。全面而正确的数据全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。当前绝大多数企业内数据的真正状况是分散而非集成的。l造成这种分散的原因有多种,主要有事务处理应用分散、“蜘蛛网”问题、数据不一致问题、外部数据和非结构化数据。第四讲 数据仓库(3)历史数据问题l事务处理一般只需要当前数据,在数据库中一般也是存储短期数据存储短期数据,且不同数据的保存期限也不一样,即使有一些历史数据保存下来了,也被束之
4、高阁,未得到充分利用。l但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据大量的历史数据为依托。没有历史数据的详细分析,是难以把握企业的发展趋势的。DSS对数据在空间和时间上都有了更高的要求,而事务处理环境难以满足这些要求。第四讲 数据仓库l要提高分析和决策的效率和有效性,分析型处理及其分析型处理及其数据必须与操作型处理及其数据相分离数据必须与操作型处理及其数据相分离。必须把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境,数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。l数据仓库的数据从联机的事务处理
5、系统、异构的外部数据源、脱机的历史业务数据中得到。它是一个联机的系统,专门为分析统计和决策支持应用服务专门为分析统计和决策支持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。第四讲 数据仓库数据仓库的概念和特征数据仓库的概念和特征l著名的数据仓库专家W.H.Inmon在其著作Building the Data Warehouse一书中给予如下描述:l数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。第四
6、讲 数据仓库数据仓库概念的两个层次数据仓库概念的两个层次l功能上:数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;l内容和特征上:数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。第四讲 数据仓库数据仓库特点数据仓库特点-面向主题面向主题l数据仓库是面向主题而进行数据组织的。主题是一个在较高层次上对数据的抽象,在逻辑意义上,它是对企业中某一宏观领域所涉及的分析对象,即将数据组织成主题域。将数据组织成主题域。第四讲 数据仓库数据仓库特点数据仓库特点-集成集成l数据仓库中的数据是集成的。数据仓库中的数据
7、是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。在数据仓库建设中,这是最关键最复杂的一个步骤,主要工作有:一是,进行数据的综合和计算;二是,统一源数据中所有不一致和矛盾的地方(如同名异义、异名同义、字长不一致、单位不一致等)。第四讲 数据仓库第四讲 数据仓库数据仓库四个特点数据仓库四个特点-相对稳定相对稳定l操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后
8、,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作有大量的查询操作,但修改修改和删除操作很少和删除操作很少,通常只需要定期的加载、定期的加载、刷新刷新。第四讲 数据仓库数据仓库四个特点数据仓库四个特点-相对稳定的相对稳定的第四讲 数据仓库数据仓库四个特点数据仓库四个特点-反映历史变化反映历史变化l数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期限。操作型系统的时间期限一般是6 06 09 09 0
9、天天,而数据仓库中数据的时间期限通常是5 51 01 0年年。第四讲 数据仓库数据仓库四个特点数据仓库四个特点-反映历史变化反映历史变化第四讲 数据仓库数据仓库本质数据仓库本质l如果说传统数据库系统的要求是快速、准确、安全、可靠地将数据存进数据库中的话,那么数据仓库的要求就是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析使用。l数据仓库所要研究和解决的问题就是从数据库中获取信息。第四讲 数据仓库数据仓库系统体系结构数据仓库系统体系结构 第四讲 数据仓库数据源数据源l数据源是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内
展开阅读全文