第5章-数据仓库与数据挖掘-数据库新技术-教学课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第5章-数据仓库与数据挖掘-数据库新技术-教学课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 数据库 新技术 教学 课件
- 资源描述:
-
1、数数据据源源1 1数 据 集 成 系 统数数据据源源2 2数数据据源源3 3结结 果果请请 求求用用 户户中中间间件件封封装装器器封封装装器器全全局局数数据据模模式式数数据据源源1 1数数据据源源2 2用用户户查查询询结结果果.基于中间件的数据集成模型基于中间件的数据集成模型 知识知识决策决策n模式模式n趋势趋势n事实事实n关系关系n模型模型n关联规则关联规则n序列序列n目标市场目标市场n资金分配资金分配n贸易选择贸易选择n在哪儿做广告在哪儿做广告n销售的地理位置销售的地理位置n金融金融n经济经济n政府政府nPOS.n人口统计人口统计n生命周期生命周期5.2 数据仓库数据仓库为什么创建数据仓库
2、为什么创建数据仓库?苦恼苦恼:太多的数据太多的数据;却不能制定合适的决策却不能制定合适的决策!n面向应用的面向应用的n有限的集成有限的集成n经常修改经常修改n仅仅使用当前的数据仅仅使用当前的数据n支持每天的业务操作支持每天的业务操作n为便于更新,进行了规范化为便于更新,进行了规范化操作型数据操作型数据决策型信息数据决策型信息数据 操作型数据和决策型信息数据是根本不一样的操作型数据和决策型信息数据是根本不一样的 TrustAccountsCheckingAccountsLoanAccounts创建数据仓库得到合适的信息创建数据仓库得到合适的信息年年月月日日Account History数据库方式
3、数据仓库方式80年代以后90年代以后以支持日常业务处理过程为目的(OLTP)以支持经营管理过程中的决策制定为目的(DSS)自进入自进入90年代以后,数据库系统的应用从传统的事务处年代以后,数据库系统的应用从传统的事务处理应用扩展到辅助决策等新的集成应用领域。理应用扩展到辅助决策等新的集成应用领域。操作型数据操作型数据分析型数据分析型数据细节的细节的综合的(提炼的)综合的(提炼的)当前数据当前数据历史及周边相关数据历史及周边相关数据可更新可更新不更新(周期性刷新)不更新(周期性刷新)面向应用,事务驱动面向应用,事务驱动面向分析,分析驱动面向分析,分析驱动操作需求事先可知道操作需求事先可知道不知道
4、不知道一次操作数据量小一次操作数据量小一次操作数据量大一次操作数据量大支持日常操作支持日常操作支持管理需求支持管理需求性能要求高性能要求高对性能要求较宽松对性能要求较宽松表表1 操作型数据与分析型数据的区别操作型数据与分析型数据的区别 数据仓库的四大特色数据仓库的四大特色 (1)面向主题面向主题4.数据仓库的四大特色数据仓库的四大特色(1)面向主题面向主题4.数据仓库的四大特色数据仓库的四大特色4.数据仓库的四大特色数据仓库的四大特色4.数据仓库的四大特色数据仓库的四大特色4.数据仓库的四大特色数据仓库的四大特色主题一:主题一:商品商品4.数据仓库的四大特色数据仓库的四大特色主题二:主题二:供
5、应商供应商4.数据仓库的四大特色数据仓库的四大特色主题三:主题三:顾客顾客4.数据仓库的四大特色数据仓库的四大特色(1)面向主题面向主题4.数据仓库的四大特色数据仓库的四大特色(1)面向主题面向主题 多维数据库多维数据库(MDDBMulti-Dimensional DataBase)用多维数组形式存储数据。用多维数组形式存储数据。关系数据库关系数据库用一组关系来组织数据的存储,同一主题的一组用一组关系来组织数据的存储,同一主题的一组关系都有一个公共的关键字,存放的也不是细节性关系都有一个公共的关键字,存放的也不是细节性的业务数据,而是经过一定程度的综合形成的综合的业务数据,而是经过一定程度的综
6、合形成的综合性数据。性数据。4.数据仓库的四大特色数据仓库的四大特色(2)集成集成统一:消除不一致的现象统一:消除不一致的现象综合:对原有数据进行综合和计算综合:对原有数据进行综合和计算4.数据仓库的四大特色数据仓库的四大特色(2)集成集成水文信息水文信息气象信息气象信息大堤抗洪能力大堤抗洪能力守堤抢险人员守堤抢险人员抗洪物资供应抗洪物资供应qDBMS4.数据仓库的四大特色数据仓库的四大特色(3)不可更新不可更新 4.数据仓库的四大特色数据仓库的四大特色(4)随时间不断变化随时间不断变化不断增加新的数据内容不断增加新的数据内容不断删去旧的数据内容不断删去旧的数据内容更新与时间有关的综合数据更新
7、与时间有关的综合数据4.数据仓库的四大特色数据仓库的四大特色 数据库数据数据库数据数据仓库数据数据仓库数据1原始性数据原始性数据加工型数据加工型数据2分散性数据分散性数据集成性数据集成性数据3当前数据当前数据历史数据历史数据4即时数据即时数据快照数据快照数据5多种数据访问操作多种数据访问操作读操作读操作元元数数据据高高度度综综合合数数据据层层轻轻度度综综合合数数据据层层当当前前基基本本数数据据层层历历史史基基本本数数据据层层数据仓库系统(数据仓库系统(DWS)由数据仓库、仓库管理和分析工具三部分由数据仓库、仓库管理和分析工具三部分组成组成业务数据业务数据外部数据外部数据数据仓库数据仓库管理工具
8、管理工具抽取、转换、抽取、转换、装载装载元数据库元数据库数据建模数据建模工具工具查询报表查询报表多维分析多维分析数据挖掘数据挖掘解释评估解释评估数据源数据源管理模块管理模块数据存储数据存储决策支持分析工决策支持分析工具具 数据仓库数据仓库 数据集市数据集市ODS 源数据:源数据:来自于多个数据源,包括企业内部业务运作来自于多个数据源,包括企业内部业务运作数据库的数据、外部数据,即来自企业外部的信息,数据库的数据、外部数据,即来自企业外部的信息,如市场调查与分析及各种文档之类的外部数据。包含如市场调查与分析及各种文档之类的外部数据。包含大量的细节数据,大量的细节数据,彼此彼此作用不同。作用不同。
9、数据仓库管理:数据仓库管理:明明确需求后,进行数据建模,确定从确需求后,进行数据建模,确定从源数据到数据仓库的数据抽取、清理和转换过程,划源数据到数据仓库的数据抽取、清理和转换过程,划分维数及确定数据仓库的存储结构。元数据是数据仓分维数及确定数据仓库的存储结构。元数据是数据仓库的核心,它存储数据模型和定义数据结构、转换规库的核心,它存储数据模型和定义数据结构、转换规则、仓库结构、控制信息等。仓库管理包括对数据的则、仓库结构、控制信息等。仓库管理包括对数据的安全、归档、备份、维护安全、归档、备份、维护、恢复等工作恢复等工作。数 据 存 储:数 据 存 储:由 数 据 仓 库、数 据 集 市 与由
10、 数 据 仓 库、数 据 集 市 与 O D S(Operating Data Store)构成,由关系或非关系)构成,由关系或非关系的的数据引擎提供来自数据源的数据存储和管理的的数据引擎提供来自数据源的数据存储和管理。分析工具:分析工具:由报表工具、分析与决策支持工具、由报表工具、分析与决策支持工具、多维数据的多维数据的OLAP分析工具、数据分析工具、数据挖掘挖掘工具等组工具等组成,以实现决策支持系统的各种要求成,以实现决策支持系统的各种要求。维维度度表表事实表维维度度表表维维度度表表维维度度表表维维度度表表维维度度表表维维 度度 表表事事 实实 表表维维 度度 表表维维 度度 表表维维 度
11、度 表表维维 度度 表表维维 度度 表表详详 细细 类类 别别 表表详详 细细 类类 别别 表表 不同格式的数据:不同格式的数据:由于企业在长期事务处理过程中随数由于企业在长期事务处理过程中随数据库管理系统本身发展,形成了企业内从简单到复杂、据库管理系统本身发展,形成了企业内从简单到复杂、从小型到大型的各种,其中有大型关系数据库、对象数从小型到大型的各种,其中有大型关系数据库、对象数据库、桌面数据库、各种非格式化的数据文件等据库、桌面数据库、各种非格式化的数据文件等。不同的数据操作平台不同的数据操作平台 不同的物理位置不同的物理位置1).数据源数据源企业内部各部门当前及其历史上的细节性业企业内
12、部各部门当前及其历史上的细节性业务数据务数据为了进行分析决策操作而生成的分析型数据为了进行分析决策操作而生成的分析型数据2).数据仓库管理数据仓库管理2).数据仓库管理数据仓库管理2).数据仓库管理数据仓库管理-数据仓库管理系统数据仓库管理系统2).数据仓库管理数据仓库管理-数据仓库数据仓库建模建模2).数据仓库管理数据仓库管理-数据的抽取与刷新数据的抽取与刷新 通过通用的数据库接口程序或协议从中抽取数据通过通用的数据库接口程序或协议从中抽取数据 编制特殊的数据抽函数进行数据抽取编制特殊的数据抽函数进行数据抽取2).数据仓库管理数据仓库管理-数据抽取数据抽取2).数据仓库管理数据仓库管理-数据
13、刷新数据刷新 时间戳时间戳 DELTADELTA文件文件 建立映象文件建立映象文件 日志文件日志文件2).数据仓库管理数据仓库管理-数据刷新方法数据刷新方法 -时间戳时间戳2).数据仓库管理数据仓库管理-数据刷新方法数据刷新方法 -DELTADELTA文件文件2).数据仓库管理数据仓库管理-数据刷新方法数据刷新方法 -建立映象文件建立映象文件2).数据仓库管理数据仓库管理-数据刷新方法数据刷新方法 -日志文件日志文件在一个数据仓库系统中,可以同时采用上述的四种数在一个数据仓库系统中,可以同时采用上述的四种数据刷新方式,以满足不同数据源的数据刷新需要。据刷新方式,以满足不同数据源的数据刷新需要。
14、2).数据仓库管理数据仓库管理-元数据(元数据(MetadataMetadata)与)与 元数据管理元数据管理 数据源系统数据源系统:数据存取的规范、数据库文档、信息描述、:数据存取的规范、数据库文档、信息描述、安全性、数据所有者权限等;安全性、数据所有者权限等;数据处理过程数据处理过程:数据的抽取、加载、清洗、过滤、协调:数据的抽取、加载、清洗、过滤、协调及完成处理所需遵守的规则;及完成处理所需遵守的规则;数据的刷新数据的刷新:数据刷新方式、刷新频率等信息。:数据刷新方式、刷新频率等信息。2).数据仓库管理数据仓库管理-元数据(元数据(MetadataMetadata)与)与 元数据管元数据
15、管理理1 1).设计原则设计原则 -面向主题原则面向主题原则 数据仓库是面向主题的、集成的、不可更新的数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的,这些特点决定、随时间的变化而不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的了数据仓库的系统设计不能采用同开发传统的OLTPOLTP数据库一样的设计方法数据库一样的设计方法,其设计过程必须,其设计过程必须遵循下述三条原则:遵循下述三条原则:1 1).设计原则设计原则 -面向主题原则面向主题原则管理人员能够在适当的时候,订购适当的管理人员能够在适当的时候,订购适当的商品,并把它们分发到适当的商店中去销商品,并把它
展开阅读全文