书签 分享 收藏 举报 版权申诉 / 50
上传文档赚钱

类型数据库与数据仓库课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:5139023
  • 上传时间:2023-02-14
  • 格式:PPT
  • 页数:50
  • 大小:785KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《数据库与数据仓库课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据库 数据仓库 课件
    资源描述:

    1、2023-2-14数据库与数据仓库数据库与数据仓库数据库与数据仓库数据库与数据仓库 第一节第一节 数据管理数据管理n数据组织的层次n实体、属性和关键字n数据管理的传统方法n数据管理的数据库方法数据库与数据仓库数据组织的层次n将数据按照层次方式进行组织将数据按照层次方式进行组织n由位、字节、字段、记录、文件和数据库组成由位、字节、字段、记录、文件和数据库组成n位、比特(位、比特(Bit)n位是计算机中最小的数据单位,其值为位是计算机中最小的数据单位,其值为0或或1,是一个,是一个二进制位。二进制位。n字节(字节(Byte)n字节是由若干个二进制位组成的(通常是字节是由若干个二进制位组成的(通常是

    2、8位),可位),可代表一个字符(如代表一个字符(如ASCII码)。码)。数据库与数据仓库数据组织的层次n字段(字段(Field)n多个字符组成一个词或者一个完整的数字(如姓名、年龄)多个字符组成一个词或者一个完整的数字(如姓名、年龄)n字段不能再分成有意义的数据单位字段不能再分成有意义的数据单位n记录(记录(Record)n由与某个特殊对象或活动有关的所有字段组成由与某个特殊对象或活动有关的所有字段组成n如学生姓名、性别、所在班级、专业、年龄等如学生姓名、性别、所在班级、专业、年龄等n文件(文件(File)n同一类型的所有记录组成一个文件同一类型的所有记录组成一个文件n文件就是与某个特定主题相

    3、关的数据记录的集合文件就是与某个特定主题相关的数据记录的集合n数据库(数据库(Database)n综合的、相关的文件集合综合的、相关的文件集合n不仅包含了所有的数据层次,还包含了各层次之间的关系不仅包含了所有的数据层次,还包含了各层次之间的关系数据库与数据仓库(字母J的ASCII码)数据的层次数据的层次举例举例文件字节字段记录01001010900811刘汉云 2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期职员文件(名字字段)职员文件部门文件财务文件900811刘汉云 2000-9-4900206李卓宇 2002-7-2910810张昕阳 2001-8-2数据的层

    4、次数据的层次数据库与数据仓库实体、属性和关键字实体、属性和关键字n实体(实体(Entity)n与所收集的数据相关的一类事物。与所收集的数据相关的一类事物。n实体是指人、或者其它具体的事物。实体是指人、或者其它具体的事物。n如如 员工、库存、客户、订单、教室、学生员工、库存、客户、订单、教室、学生数据库与数据仓库实体、属性和关键字实体、属性和关键字n属性(属性(Attribute)n实体的某一方面的特征;实体的某一方面的特征;n学生(学号、姓名、年龄、性别、专业、班级)学生(学号、姓名、年龄、性别、专业、班级)n产品(产品编号、名称、供应商、类型、单位产品(产品编号、名称、供应商、类型、单位数量

    5、、单价、库存量、订购量、再订购量)数量、单价、库存量、订购量、再订购量)数据库与数据仓库实体、属性和关键字实体、属性和关键字n关键字(关键字(Primary Key)n定义:用来识别记录的一个或一组字段,是定义:用来识别记录的一个或一组字段,是识别记录和在文件中查找记录的标志;识别记录和在文件中查找记录的标志;n如,学生文件中的学号如,学生文件中的学号n产品文件中的产品编号产品文件中的产品编号n订单文件中的订单号订单文件中的订单号数据库与数据仓库数据管理的传统方法数据管理的传统方法n文件是相关数据记录的集合文件是相关数据记录的集合n利用文件管理数据利用文件管理数据n对每个特定的应用程序,都需要

    6、创建一对每个特定的应用程序,都需要创建一个或多个数据文件个或多个数据文件应用程序 A文件A应用程序 B文件B应用程序 C文件C数据库与数据仓库数据管理传统方法的不足数据管理传统方法的不足n容易造成数据冗余(容易造成数据冗余(redundancy)n在多个数据文件中重复出现相同的数据。在多个数据文件中重复出现相同的数据。n难以保证数据之间的一致性(难以保证数据之间的一致性(consistency)n难以保证对不同文件中相同数据的修改同时难以保证对不同文件中相同数据的修改同时发生。发生。n数据与程序独立性不高数据与程序独立性不高n数据文件和维护它的相关程序之间过分依赖。数据文件和维护它的相关程序之

    7、间过分依赖。数据库与数据仓库数据管理的数据库方法数据管理的数据库方法n数据库是逻辑相关的记录和文件的集合。数据库是逻辑相关的记录和文件的集合。n把先前提及的所有存储在独立文件中的记录把先前提及的所有存储在独立文件中的记录归并在一个数据库内,以便让不同的应用程归并在一个数据库内,以便让不同的应用程序存取。序存取。n储存在数据库中的数据既独立于使用它的计储存在数据库中的数据既独立于使用它的计算机程序,也独立于存储它的外部存储器的算机程序,也独立于存储它的外部存储器的类型。类型。数据库与数据仓库数据库管理系统nDatabase Management System,DBMSn在数据库管理系统中,应用程

    8、序不能直接从存储介质获得所需的数据。n应用程序必须先将数据访问请求提交给DBMS,再由DBMS负责从存储介质检索数据并提供给应用程序使用。数据库与数据仓库数据库方法的优点数据库方法的优点n减少了数据冗余,能够更有效地利用存储空间减少了数据冗余,能够更有效地利用存储空间并增强数据的一致性。也为应用提供了更大地并增强数据的一致性。也为应用提供了更大地利用数据的灵活性。利用数据的灵活性。n不同文件中的数据放在了同一个数据库,可以不同文件中的数据放在了同一个数据库,可以用多种方法定位数据并获得要处理的数据。用多种方法定位数据并获得要处理的数据。n能够实现共享数据和信息资源。能够实现共享数据和信息资源。

    9、数据库与数据仓库第二节第二节 数据库与数据库管理系统环境数据库与数据库管理系统环境n数据库及其特征数据库及其特征n数据库管理系统数据库管理系统n数据库查询语言数据库查询语言n数据的逻辑视图和物理视图数据的逻辑视图和物理视图DBMS负责联机事务处理(负责联机事务处理(Online Transaction Processing,OLTP)和联机分析处理()和联机分析处理(Online Analytical Processing,OLAP)。)。数据库与数据仓库数据库及其特征数据库及其特征n数据库的定义数据库的定义n数据库(数据库(Database)是一个信息的集合,在)是一个信息的集合,在这个集合

    10、中可以按照信息的逻辑结构对其进这个集合中可以按照信息的逻辑结构对其进行组织与存取。行组织与存取。n数据库由两部分组成数据库由两部分组成n信息本身信息本身n信息的逻辑结构信息的逻辑结构数据库与数据仓库数据库的特征数据库的特征n信息的集合信息的集合n一个数据库中包含多个信息相关的文件(表)。一个数据库中包含多个信息相关的文件(表)。n销售数据库包含两个文件:产品文件和供应商文件。销售数据库包含两个文件:产品文件和供应商文件。数据库与数据仓库数据库的特征数据库的特征n逻辑结构逻辑结构n在使用数据库时,对信息的组织与存取是根据信息的逻辑在使用数据库时,对信息的组织与存取是根据信息的逻辑结构而不是物理结

    11、构进行的。结构而不是物理结构进行的。n信息的逻辑结构包含在数据字典(信息的逻辑结构包含在数据字典(Data DictionaryData Dictionary)中。)中。数据库与数据仓库数据库的特征数据库的特征n信息中的逻辑联系信息中的逻辑联系n建立信息间的联系或关系意味着找出文件(表)之间的建立信息间的联系或关系意味着找出文件(表)之间的相互关系。相互关系。n主关键字主关键字n主关键字是数据库文件中的一个字段,它唯一地描述了一主关键字是数据库文件中的一个字段,它唯一地描述了一个记录。个记录。n如,产品文件中的产品如,产品文件中的产品ID,供应商文件中的供应商,供应商文件中的供应商ID(图(图

    12、5-45-4)。n“供应商供应商ID”ID”同时也在产品文件中出现,这样通过这个共同时也在产品文件中出现,这样通过这个共同的字段就建立了两个文件之间的逻辑关系。同的字段就建立了两个文件之间的逻辑关系。n当一个文件的主关键字出现在另一个相关的文件中时,我当一个文件的主关键字出现在另一个相关的文件中时,我们称其为外部关键字。们称其为外部关键字。数据库与数据仓库数据库的特征数据库的特征n内在的内在的完整性(完整性(IntegrityIntegrity)约束)约束n完整性约束是保证信息质量的一种规则完整性约束是保证信息质量的一种规则n比如比如n产品产品ID不能重复不能重复n产品文件中的产品文件中的供应

    13、商供应商ID不能是供应商文件中没不能是供应商文件中没有的有的供应商供应商ID数据库与数据仓库数据库管理系统数据库管理系统nDatabase Management Systemn是一组系统软件,能够集中并有效地管理数是一组系统软件,能够集中并有效地管理数据以供应用程序访问。据以供应用程序访问。n相当于应用程序和物理数据文件之间的接口。相当于应用程序和物理数据文件之间的接口。数据库与数据仓库数据库管理系统的组成数据库管理系统的组成n数据定义语言数据定义语言n数据字典数据字典n数据操作语言数据操作语言数据库与数据仓库数据库管理系统组成数据库管理系统组成n数据定义语言(Data Definition

    14、Language,DDL)n定义和描述数据库内容和结构的正式语言。n格式:nCREATE TABLE 表名(字段名1 数据类型(长度),字段名2 数据类型(长度).)nCREATE TABLE STUDENT(STUDENT_NO INTEGER,NAME TEXT(8),SPECIALITY_NO TEXT(8)nCREATE TABLE STUDENT(STUDENT_NO INTEGER,NAME TEXT(8),SPECIALITY_NO TEXT(8),BIRTHDAY DATE,PHOTO GENERAL)数据库与数据仓库数据库管理系统组成数据库管理系统组成n数据字典(Data D

    15、ictionary)n自动生成或者手工生成的文件,用来存储数据元素的定义和特性。n数据字典包含着数据库中所含信息(字段)的逻辑结构,如名称、类型、格式、缺省值、有效范围等。n演示 ACCESS。数据库与数据仓库数据库管理系统组成数据库管理系统组成n数据操作语言(Data Manipulation Language,DML)n提供了一组从数据库中提取数据的命令。nSQL(Structured Query Language)是一种 DML。n格式:nSELECT 字段名1,字段名2,FROM 表1,表2 WHERE 条件nSELECT 供应商ID,供应商名称 FROM 供应商文件 WHERE 城市

    16、=上海n演示演示 ACCESS数据库与数据仓库数据库查询语言(数据库查询语言(DML)n自然语言查询自然语言查询nLIST THE NAMES AND ADDRESSES OF ALL SUPPLIERS WHO LIVE IN SHANGHAIn仿效实例查询(仿效实例查询(Query By Example,QBE)n通过拖曳数据项等方法来查询数据。通过拖曳数据项等方法来查询数据。数据库与数据仓库数据库查询语言数据库查询语言n结构化查询语言(结构化查询语言(Structured Query Language,SQL)n可在大多数数据库环境中使用的可在大多数数据库环境中使用的标准的标准的第第4代

    17、结构化代结构化查询语言。查询语言。n无论用户使用什么硬件或何种无论用户使用什么硬件或何种DBMS软件,软件,SQL都将都将遵循已规定好的通则进行处理。遵循已规定好的通则进行处理。n利用利用SQL可以查询不同数据库管理系统下的数据。可以查询不同数据库管理系统下的数据。n基本形式基本形式nSELECTFROMWHERE数据库与数据仓库数据的逻辑视图和物理视图数据的逻辑视图和物理视图nDBMS把数据的逻辑视图和物理视图分开。把数据的逻辑视图和物理视图分开。n逻辑视图以最终用户所使用的直观的方式来显逻辑视图以最终用户所使用的直观的方式来显示数据。示数据。n物理视图则显示了数据的实际组织形式以及它物理视

    18、图则显示了数据的实际组织形式以及它在物理存储介质上的结构。在物理存储介质上的结构。n使用专门的数据库管理系统,使得物理数据库使用专门的数据库管理系统,使得物理数据库可用于不同应用程序所需的不同的逻辑视图。可用于不同应用程序所需的不同的逻辑视图。数据库与数据仓库数据的逻辑视图和物理视图数据的逻辑视图和物理视图n演示演示 ACCESS。n物理视图物理视图产品:表产品:表n逻辑视图逻辑视图查询查询1:产品(产品名称、供应商):产品(产品名称、供应商)n 查询查询2:产品(产品名称、类别):产品(产品名称、类别)查询查询1查询查询2查询查询n产品:表产品:表逻辑视图逻辑视图物理视图物理视图应用程序应用

    19、程序物理文件物理文件数据库与数据仓库第三节第三节 关系数据库模型关系数据库模型n四种数据库模型四种数据库模型n层次型层次型n网状型网状型n关系型关系型n目前使用最为广泛目前使用最为广泛n面向对象面向对象数据库与数据仓库关系数据库关系数据库(Relational Database)模型)模型n利用一系列的二维表存储信息。利用一系列的二维表存储信息。n在关系模型中,每个二维表都描述了在关系模型中,每个二维表都描述了一一个实体个实体或或实体之间的联系实体之间的联系。n图图5-4、11(P93、99)n二维表使描述信息间的关系十分便利,二维表使描述信息间的关系十分便利,容易处理二维表所包含的信息。容易

    20、处理二维表所包含的信息。数据库与数据仓库关系数据库模型关系数据库模型n可以灵活地查询数据库和建立报表。可以灵活地查询数据库和建立报表。n查询单个表和多个表。查询单个表和多个表。n演示演示 ACCESS 订单订单ID、客户、订购日期、客户、订购日期、产品、产品n在建立关系数据库时,不必事先确定实体之间的在建立关系数据库时,不必事先确定实体之间的所有联系,可以随时建立实体之间的联系所有联系,可以随时建立实体之间的联系。n先建立实体,再建立实体之间的联系。先建立实体,再建立实体之间的联系。数据库与数据仓库第四节第四节 关系数据库的建立关系数据库的建立n确定实体和关键字确定实体和关键字n确定实体之间联

    21、系确定实体之间联系n利用利用E-R图得到关系图得到关系n为每个关系确定信息为每个关系确定信息(字段字段)n用数据定义语言创建数据库用数据定义语言创建数据库数据库与数据仓库学生选修课程管理学生选修课程管理n实体:学生、专业、课程实体:学生、专业、课程n学生修课管理工作中的规定:学生修课管理工作中的规定:n每位学生只能被安排到一个专业(第每位学生只能被安排到一个专业(第一专业),但一个专业可拥有许多学一专业),但一个专业可拥有许多学生;生;n每位学生可选修多门课程,一门课程每位学生可选修多门课程,一门课程也会被若干学生选修,但并不一定每也会被若干学生选修,但并不一定每个学生都必须选修所有课程。个学

    22、生都必须选修所有课程。数据库与数据仓库学生选修课程管理学生选修课程管理n学生选修报表样本学生选修报表样本数据库与数据仓库一、确定实体和主关键字一、确定实体和主关键字n三个实体三个实体n学生学生n专业专业n课程课程n主关键字主关键字n学号学号n专业编号专业编号n课程编号课程编号数据库与数据仓库二、确定实体之间的联系二、确定实体之间的联系-画实体联系图画实体联系图n实体联系图(实体联系图(Entity-Relationship Diagram,E-R图)图)n矩形表示实体矩形表示实体n菱形表示实体之间的联系菱形表示实体之间的联系n直线表示连接直线表示连接n1代表只出现一次,代表只出现一次,M代表可

    23、出现多次代表可出现多次数据库与数据仓库二、确定实体之间的联系二、确定实体之间的联系-画实体联系图画实体联系图数据库与数据仓库二、确定实体之间的联系二、确定实体之间的联系-画实体联系图画实体联系图n先画上矩形先画上矩形n填上实体名填上实体名n判断是否有联系判断是否有联系n有联系画上菱形,判断联系是有联系画上菱形,判断联系是1还是还是M数据库与数据仓库三、利用三、利用E-R图得到关系图得到关系n1、将每个实体转化为一个关系(二维表)、将每个实体转化为一个关系(二维表)n学生、课程、专业(图学生、课程、专业(图5-13,P102)n实体的属性作为关系中的字段实体的属性作为关系中的字段n学生、课程、专

    24、业的关键字?学生、课程、专业的关键字?n2、将每个多对多的联系转换为一个关系、将每个多对多的联系转换为一个关系(二维表)(二维表)(图(图5-13,P102)n选修选修n复合关键字(学号和课程编号的组合)复合关键字(学号和课程编号的组合)数据库与数据仓库三、利用三、利用E-R图得到关系图得到关系n3、将每个一对多的联系转换为一个关系、将每个一对多的联系转换为一个关系(二维表)(二维表)n分配(关键字、外部关键字)分配(关键字、外部关键字)n4、合并具有相同关键字的关系(二维表)、合并具有相同关键字的关系(二维表)n学生与分配合并学生与分配合并数据库与数据仓库四、为每个关系确定信息(字段)四、为

    25、每个关系确定信息(字段)n确保每个关系中所含的信息(字段)确实确保每个关系中所含的信息(字段)确实处于正确的关系之中处于正确的关系之中n确保信息(字段)只依赖于所属关系的主关确保信息(字段)只依赖于所属关系的主关键字键字n学生姓名是否是由学号决定的呢?学生姓名是否是由学号决定的呢?图图5-14n专业编号是否是由学号决定的呢?专业编号是否是由学号决定的呢?图图5-14n专业名称是否也是由学号决定的吗?专业名称是否也是由学号决定的吗?图图5-14 n专业名称这个字段该在那个关系中出现呢?专业名称这个字段该在那个关系中出现呢?数据库与数据仓库五、用数据定义语言创建数据五、用数据定义语言创建数据库库n

    26、根据前面四步的结果来,使用数据定义语言来创根据前面四步的结果来,使用数据定义语言来创建关系(二维表)建关系(二维表)nCREATE TABLE STUDENT(STUDENT_NO INTEGER,NAME TEXT(8),SPECIALITY_NO INTEGER)nCREATE TABLE SPECIALITY(SPECIALITY _NO INTEGER,SPECIALITY_NAME TEXT(18)nCREATE TABLE COURSE(COURSE_NO INTEGER,COURSE_NAME TEXT(18),CREDIT_HOUR INTEGER)n使用可视化的编程工具创建关

    27、系使用可视化的编程工具创建关系(二维表)(二维表)nELECTIVE(STUDENT_NO INTEGER,COURSE _NO INTEGER,GRADE INTEGER)使用可视化的编程工具数据库与数据仓库第五节第五节 数据仓库与数据挖掘数据仓库与数据挖掘n使用传统的数据库技术,数据常常被保使用传统的数据库技术,数据常常被保存在不同的运行系统中,存在不同的运行系统中,难以收集到完难以收集到完整的数据,需要整的数据,需要花费大量的时间去寻找花费大量的时间去寻找和收集相关的数据。和收集相关的数据。n通过数据仓库可以对企业的关键运行数通过数据仓库可以对企业的关键运行数据进行集成,进而产生一致、可

    28、靠和易据进行集成,进而产生一致、可靠和易于访问的数据形式。于访问的数据形式。数据库与数据仓库数据仓库数据仓库(Data Warehouse)nData Warehouse的定义:信息的逻辑的定义:信息的逻辑集合,这些信息来自于许多不同的业集合,这些信息来自于许多不同的业务数据库,并用于支持企业的信息分务数据库,并用于支持企业的信息分析活动和决策任务。析活动和决策任务。数据库与数据仓库数据仓库的特征(一)数据仓库的特征(一)n通过汇总和分类,数据仓库将来自于不同数据库通过汇总和分类,数据仓库将来自于不同数据库的信息结合在一起。的信息结合在一起。数据库与数据仓库数据仓库的特征(二)数据仓库的特征(

    29、二)n数据仓库是多维的,数据仓库是多维的,Multidimensional Databasen包含若干层的行列,包含若干层的行列,Hypercuben数据字典:除包含信息的逻辑结构外,还包括信息的数据字典:除包含信息的逻辑结构外,还包括信息的来源和处理方式。来源和处理方式。n来源:来源:信息是从哪个业务数据库中生成的信息是从哪个业务数据库中生成的。n处理方式:信息是经过何种方法(总计、计数、平均、处理方式:信息是经过何种方法(总计、计数、平均、标准差等)处理的。标准差等)处理的。数据库与数据仓库数据仓库的特征(三)数据仓库的特征(三)n数据仓库支持决策而不是事务处理数据仓库支持决策而不是事务处

    30、理n数据库数据库面向事务面向事务联机事务处理(联机事务处理(OLTP)n数据仓库数据仓库支持决策支持决策联机分析处理(联机分析处理(OLAP)数据库与数据仓库数据挖掘工具数据挖掘工具nData Mining Tools Data Mining Tools 是用户对数据仓库是用户对数据仓库进行信息查询的软件工具。进行信息查询的软件工具。n支持支持OLAPOLAP概念和决策任务。概念和决策任务。数据库与数据仓库数据挖掘工具数据挖掘工具n包括:包括:n查询与报表工具查询与报表工具nQBEQBE,SQLSQL,报表生成器。,报表生成器。n智能代理(智能代理(Intelligent AgentIntelligent Agent)n应用各种像神经网络、模糊逻辑这样的人工智能工应用各种像神经网络、模糊逻辑这样的人工智能工具,形成具,形成OLAPOLAP中中“信息发现信息发现”的基础。的基础。n多维分析工具(多维分析工具(Multidimensional Analysis ToolsMultidimensional Analysis Tools)n是一种横纵分割的技术,它允许人们从不同的角度是一种横纵分割的技术,它允许人们从不同的角度来观看多维信息。来观看多维信息。2023-2-14数据库与数据仓库

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:数据库与数据仓库课件.ppt
    链接地址:https://www.163wenku.com/p-5139023.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库