数据模型基本概念及建模方法论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据模型基本概念及建模方法论课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据模型 基本概念 建模 方法论 课件
- 资源描述:
-
1、数据模型的基本概念及建模方法论NCR(中国)有限技术经理1PPT学习交流内容安排数据模型相关术语 什么是数据模型建模注意事项 数据模型方法论2PPT学习交流什么是数据模型?以数学的方式对现实事物的一种抽象表达以数学的方式对现实事物的一种抽象表达,特征:特征:内容:描述了数据、及其之间的关系形式:反映了数据的组织与管理形式用途:用途:(数据仓库)系统建设中的数据信息的蓝图(数据仓库)系统建设的核心业务人员与IT人员沟通的语言和工具3PPT学习交流数据模型的分类数据仓库项目中数据模型可以分为以下几种:Conceptual Data Model(CDM)概念数据模型Logical Data Mode
2、l(LDM)逻辑数据模型Physical Data Model(PDM)物理数据模型Application Data Model(ADM)应用数据模型4PPT学习交流概念数据模型Conceptual Data Model(CDM)概念数据模型从全局上、宏观上介绍模型设计思路、范围和内容。主要组成元素主要组成元素 主题 主题间关系 主题中的重要实体 实体间的相互关系目标与用途目标与用途 圈定建模的范围 划分建设主题 理清主要业务关系 构造逻辑数据模型的框架5PPT学习交流定义:定义:使用逻辑建模语言定义数据与数据之间的逻辑关系以图形化的形式反映客户的业务规则达到数据组织的设计目标逻辑数据模型符号
3、体系设计内容表现形式反映内容设计目标6PPT学习交流逻辑数据模型Logical Data Model(LDM)逻辑数据模型设计人员设计人员:业务人员、IT人员设计目标设计目标 设计蓝图,指导整个数据仓库系统的建设 业务语言,业务人员与技术人员沟通的手段和方法 业务视图,独立于数据库技术实现设计内容设计内容:实体、关系和属性建模方法建模方法:3NF的设计方法后续工作后续工作:物理数据模型的输入7PPT学习交流物理数据模型Physical Data Model(PDM)物理数据模型设计目标设计目标:面向物理实施的具体细节输入条件输入条件 继承于逻辑数据模型 依赖于所选择的数据库 决定于业务需求和性
4、能之间的平衡设计内容设计内容 数据库、表和字段、索引 需要作非正则化处理后续工作:后续工作:ETL、元数据管理和前端应用输入8PPT学习交流应用数据模型Application Data Model(ADM)应用数据模型设计目标设计目标 满足最终用户对数据的访问(内容、形式要求)满足应用系统对数据的存取(性能、存储要求)主要特征主要特征 面向Power User和业务人员 与具体的应用相关 多维分析时一般采用星型结构或者雪花状结构 的设计方法 是事实表和维度表的组合9PPT学习交流逻辑数据模型与物理数据模型比较逻辑数据模型逻辑数据模型物理数据模型物理数据模型包含内容包含内容实体、属性表、字段定位
5、记录定位记录主键主索引使用名称使用名称业务名称物理名称(受限于DBMS)正则化正则化3NF建设可能会按照性能、空间要求进行非正则化冗余数据冗余数据无冗余数据含冗余数据派生数据派生数据无派生数据包含派生数据开发人员开发人员业务人员与建模人员物理数据库设计人员10PPT学习交流逻辑数据模型在数据仓库中的定位存储和管理采集回答业务问题 析取 清洗 条件 剔除家庭关系 加载 业务系统 业务系统 业务数据 外部数据 关系数据库管理系统聚集 统计 人工智能 神经网络 多维 可视化 EIS/DSS 电子表 对象语言 开发 企业 数据仓库 从属数据集市 业务人员 IT 用户数据导入 知识发现 数据挖掘 信息存
6、取 工具源数据 逻辑数据模型应用数据模型11PPT学习交流内容安排数据模型相关术语 什么是数据模型建模注意事项 数据模型方法论12PPT学习交流逻辑数据模型基本术语(一)模型结构模型结构 q第三范式(第三范式(3NF)结构结构 q星型结构(多星型结构)星型结构(多星型结构)q雪花型结构雪花型结构 模型分类模型分类q概念数据模型概念数据模型q逻辑数据模型逻辑数据模型q物理数据模型物理数据模型q应用数据模型应用数据模型3NF基础数据模型Star Schema汇总数据/已知应用模型Snowflake星型结构的演变13PPT学习交流实体实体 q独立型实体独立型实体 q依赖型实体依赖型实体 q子类实体子
7、类实体 q主题域主题域q层面层面q核心实体核心实体 q关系实体关系实体 q特征实体特征实体q分类实体分类实体逻辑数据模型基本术语(二)14PPT学习交流属性:属性:(描述真实或抽象事物相关联的特征或性质)q主键主键(识别实体实例唯一性的属性、属性组)q可选键可选键(能识别实体实例唯一性的其他属性、属性组)q外键外键(通过父实体到子实体关系转移到子实体的属性)q非键属性非键属性(不是实体主键属性的其他属性)q基础名基础名(外键的原来名称)q角色名角色名(外键的新名称,表明取值是父实体属性的子集)q鉴别器鉴别器(取值决定父实体实例属于哪个子类的属性)逻辑数据模型基本术语(三)15PPT学习交流关系
8、关系q二元关系二元关系父实体的一个实例严格关系子实体的0,1或多个实例的这种关系是二元关系 q基数基数父、子实体实例的比例,如1:1,1:Mq识别(型)关系识别(型)关系子实体实例唯一性的识别与父实体相关联,父实体的主键属性成为子实体的主键属性 q非识别(型)关系非识别(型)关系子实体不需要与父实体的关系就可以确定实例唯一性,父实体的主键属性成为子实体的非键属性 逻辑数据模型基本术语(四)16PPT学习交流关系关系q确定关系确定关系父实体的一个实例对应子实体的0、1或多个实例,并且子实体的一个实例对应0或1个父实体的实例 q非确定关系非确定关系多对多关系 q子类关系子类关系子类实体和所属父实体
9、的关系 q完全子类群完全子类群所属父实体的每个实例都能够与子类群的一个实体实例相关联 q不完全子类群不完全子类群所属父实体的每个实例不一定都有子类相关联 逻辑数据模型基本术语(五)17PPT学习交流Logical Data Model(LDM)Example EntityKey AttributeNonkey AttributeRelationshipCardinalityOne-to-many1:MBusiness Rule:one customer invoice at least contains one invoice item逻辑数据模型基本术语(示例)18PPT学习交流范式理论 N
10、ormal Form 关系数据库:原子性 第一范式:每个属性的值唯一 第二范式:键值依赖 非键属性依赖所有的主键属性。(不存在部分键属性就决定的非键属性)第三范式:完全键值依赖 非键属性完全依赖且只依赖与键属性。(不存在非主键属性依赖其他非主键属性的情况)BCNF 第四范式 第五范式关系数据库理论中对于实体划分、实例(记录)设计的规则The KEY-1stNormalForm(1NF)The WHOLE Key-SecondNormalForm(2NF)And NOTHING BUT the Key-ThirdNormalForm(3NF)-E.F.Codd19PPT学习交流违反第一范式如果数
11、Quantity属性被定义为“不是与Order相关,就是与Part相关”例如:在OLTP系统中常见的字段复用现象,属此类问题11015220PPT学习交流违反第二范式依赖了复合主键的一部分客户经理/地域客户经理编号21PPT学习交流违反第三范式依赖了非主键属性(不参与主键的外键属性)22PPT学习交流正则化LDM对数据库物理实现的优势 保留了更多的业务关系 更多的主索引选择 最佳的数据分布 更少的全表扫描 更多的连接选择 增强优化器使用更有利于提高性能的合并、聚合连接方法 最佳的数据分离(耦合度)最佳的底层模型与用户分离 最佳的数据控制 每行更少的字段 最佳的与应用分离 更小的行 最佳的数据块
12、大小 减少临时与永久日志空间 减少物理 I/O要考虑正则化对数据库性能的要求23PPT学习交流内容安排数据模型相关术语 什么是数据模型建模注意事项 数据模型方法论24PPT学习交流NCR数据仓库实施方法论数据仓库实施方法论?规划规划解决方案支持数据仓库管理(处理流程与操作)物理数据库设计数据转换应用开发数据挖掘服务设计与实现设计与实现支持与增强支持与增强解决方案体系结构设计元数据管理数据仓库评估应用增强逻辑数据模型回顾物理数据库回顾性能调整容量规划解决方案集成定制解决方案规划详细数据分析解决方案准备就绪解解决决方方案案实实施施建建议议现成解决方案规划数数据据仓仓库库策策略略开开发发业务探索业务
展开阅读全文