数据库的讲义存储与文件结构 课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据库的讲义存储与文件结构 课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库的讲义存储与文件结构 课件 数据库 讲义 存储 文件 结构
- 资源描述:
-
1、存储与文件结构存储与文件结构存储与文件结构存储与文件结构4物理存储介质概述物理存储介质概述4磁盘磁盘4RAID4第三级存储第三级存储4存储访问存储访问4文件组织文件组织4文件中的记录组织文件中的记录组织物理存储介质的分类物理存储介质的分类4数据存取的速度数据存取的速度4每单位数据的成本每单位数据的成本4可靠性可靠性 系统故障或者电源故障造成的数据丢失系统故障或者电源故障造成的数据丢失 存储设备的物理故障存储设备的物理故障4可以将存储介质分为:可以将存储介质分为:易失存储:当电源关闭时,所存储的内容就会丢失易失存储:当电源关闭时,所存储的内容就会丢失 非易失存储:非易失存储:即便在电源关闭时,存
2、储内容也不会丢失即便在电源关闭时,存储内容也不会丢失 包括辅助存储和第三级存储,以及具有后备电源的主存储包括辅助存储和第三级存储,以及具有后备电源的主存储器器物理存储介质物理存储介质4高速缓存高速缓存 最快和最昂贵的存储介质;是易失最快和最昂贵的存储介质;是易失的;由计算机操作系统管理。的;由计算机操作系统管理。4主存储器主存储器 快速存取快速存取(10到到100纳秒;纳秒;1纳秒纳秒=109 秒)秒)通常太小(或者太贵)而不能存储整个数据库通常太小(或者太贵)而不能存储整个数据库 容量可达数容量可达数G字节,当前得到了广泛的应用字节,当前得到了广泛的应用 其容量不断上升,而每一字节的购买成本
3、却在稳定而快速其容量不断上升,而每一字节的购买成本却在稳定而快速的下降(大约每的下降(大约每2至至3年下降一倍)年下降一倍)易失的易失的 如果发生电源故障或者系统故障,主存如果发生电源故障或者系统故障,主存储器中的内容通常会丢失。储器中的内容通常会丢失。物理存储介质(续)物理存储介质(续)4闪存闪存 在电源故障时能够将数据保存下来在电源故障时能够将数据保存下来 数据可以被擦除和写入数据可以被擦除和写入 只能支持有限次的写入和擦除操作。只能支持有限次的写入和擦除操作。擦除数据时,必须擦除整个闪存中的数据擦除数据时,必须擦除整个闪存中的数据 读速度与主存储器一样快读速度与主存储器一样快 但写速度很
4、慢(需要几个微秒)但写速度很慢(需要几个微秒),擦除速度则更慢擦除速度则更慢 单位存储成本与主存储器大致相当单位存储成本与主存储器大致相当 广泛应用于嵌入设备如数字相机中广泛应用于嵌入设备如数字相机中 也称为也称为EEPROM(Electrically Erasable Programmable Read-Only Memory)物理存储介质(续)物理存储介质(续)4磁盘磁盘 数据存储在旋转的盘片上,通过电磁方式读写数据存储在旋转的盘片上,通过电磁方式读写 是用于长期保存数据的主要介质;通常能够存储整个数据库是用于长期保存数据的主要介质;通常能够存储整个数据库 在存取数据时需要把数据从磁盘移动
5、到主存储器,修改完毕在存取数据时需要把数据从磁盘移动到主存储器,修改完毕后还需要将数据写回磁盘后还需要将数据写回磁盘 与主存储器相比,磁盘的存取速度要慢的多与主存储器相比,磁盘的存取速度要慢的多 直接存取直接存取 与磁带不同,磁盘可以以任意顺序读取盘片上的与磁带不同,磁盘可以以任意顺序读取盘片上的数据数据 硬盘与软盘硬盘与软盘 现在,磁盘的容量可达现在,磁盘的容量可达100 GB 与主存储器和闪存相比,磁盘在容量上要大得多,而每字节代价与主存储器和闪存相比,磁盘在容量上要大得多,而每字节代价却小得多却小得多 随着技术的进步,磁盘的性能仍然在稳定和快速的提高随着技术的进步,磁盘的性能仍然在稳定和
6、快速的提高(大约(大约每每2至至3年增长一倍)年增长一倍)在电源故障和系统故障时不会丢失数据在电源故障和系统故障时不会丢失数据 磁盘故障会毁坏数据,但这种情况很少发生磁盘故障会毁坏数据,但这种情况很少发生物理存储介质(续)物理存储介质(续)4光存储器光存储器 非易失的,使用激光器从旋转的盘片上读取数据非易失的,使用激光器从旋转的盘片上读取数据 最常见的形式是:最常见的形式是:CD-ROM(640 MB)和)和DVD(4.7到到17 GB)使用只能写一次,但能多次读的光盘来归档数据使用只能写一次,但能多次读的光盘来归档数据(CD-R和和DVD-R)也存在可以多次写的光盘也存在可以多次写的光盘(C
7、D-RW,DVD-RW和和DVD-RAM)与磁盘相比,光盘的读写速度都更慢与磁盘相比,光盘的读写速度都更慢 光盘柜系统,使用大量可移动的盘片,少数驱动器光盘柜系统,使用大量可移动的盘片,少数驱动器和自动装载和卸载盘片的机构来存储大量的数据和自动装载和卸载盘片的机构来存储大量的数据物理存储介质(续)物理存储介质(续)4磁带存储器磁带存储器 非易失的,主要用来备份(以便对磁盘故障进行恢非易失的,主要用来备份(以便对磁盘故障进行恢复)和归档数据复)和归档数据 顺序存取顺序存取 比磁盘的速度要慢得多比磁盘的速度要慢得多 非常高的容量(非常高的容量(40到到300 GB)可以从磁带驱动器中移出磁带可以从
8、磁带驱动器中移出磁带 磁带存储的代价磁带存储的代价远低于磁盘远低于磁盘 磁带库可以用来存储海量的数据磁带库可以用来存储海量的数据 从数百从数百TB(1TB=109 字节字节)到到PB(1PB=1012 字节字节)存储设备层次结构存储设备层次结构存储设备层次结构(续)存储设备层次结构(续)4基本存储:最快的存储介质但却是易失的(包基本存储:最快的存储介质但却是易失的(包括高速缓存、主存储器)括高速缓存、主存储器)4辅助存储器:下一层存储介质,非易失的,存辅助存储器:下一层存储介质,非易失的,存取速度较快,也称为联机存储设备取速度较快,也称为联机存储设备 例如:闪存,磁盘例如:闪存,磁盘4第三级存
9、储:层次的最低一级,非易失的,存第三级存储:层次的最低一级,非易失的,存取速度较慢,也称为脱机存储设备取速度较慢,也称为脱机存储设备 例如:磁带,光盘例如:磁带,光盘硬盘工作原理图硬盘工作原理图磁盘磁盘4读写头读写头位置与盘片表面非常接近(几乎挨到)位置与盘片表面非常接近(几乎挨到)以电磁方式读或者写信息以电磁方式读或者写信息4盘片的表面划分为圆形的磁道盘片的表面划分为圆形的磁道在通常的硬盘上每个盘片上有超过在通常的硬盘上每个盘片上有超过16,000条磁道条磁道4每个磁道又划分为多个扇区每个磁道又划分为多个扇区扇区是读写的最小数据单位扇区是读写的最小数据单位扇区的大小通常为扇区的大小通常为51
10、2个字节个字节每条磁道通常包含:每条磁道通常包含:200(在内侧磁道)(在内侧磁道)到到 400(在外侧磁道)个扇(在外侧磁道)个扇区区4要读写扇区要读写扇区磁盘臂要通过摆动将磁头定位到正确的磁道上磁盘臂要通过摆动将磁头定位到正确的磁道上随着盘片的不断旋转,当扇区从磁头下经过时,就可以对数据进行随着盘片的不断旋转,当扇区从磁头下经过时,就可以对数据进行读写读写4磁头和磁盘的组合方式磁头和磁盘的组合方式多个磁盘盘片安装在一个轴上(通常是多个磁盘盘片安装在一个轴上(通常是2到到4个磁盘)个磁盘)每个盘片一个磁头,安装在同一个磁盘臂上每个盘片一个磁头,安装在同一个磁盘臂上4柱面柱面 i由所有盘片的第
11、由所有盘片的第 i 条磁道构成条磁道构成磁盘(续)磁盘(续)4早期的磁盘容易产生磁头故障早期的磁盘容易产生磁头故障 早期磁盘的表面覆盖着一层金属氧化涂层,这层涂层会在早期磁盘的表面覆盖着一层金属氧化涂层,这层涂层会在磁头故障中碎裂,并毁坏磁盘上的所有数据磁头故障中碎裂,并毁坏磁盘上的所有数据 现在的磁盘很少会发生这样灾难性的故障,尽管某些扇区现在的磁盘很少会发生这样灾难性的故障,尽管某些扇区还是可能损毁的还是可能损毁的4磁盘控制器磁盘控制器 计算机系统和磁盘驱动器硬件之间的接口计算机系统和磁盘驱动器硬件之间的接口 能够接受对扇区进行读写的高级命令能够接受对扇区进行读写的高级命令 能够进行一些操
12、作,例如将磁盘臂移动到右侧磁道,并读能够进行一些操作,例如将磁盘臂移动到右侧磁道,并读写数据写数据 能够为每个扇区计算和附加校验和来验证读取的数据是否能够为每个扇区计算和附加校验和来验证读取的数据是否是正确的是正确的 如果数据损坏了,在大多数情况下,重新计算的校验和如果数据损坏了,在大多数情况下,重新计算的校验和与存储的校验和都是不匹配的与存储的校验和都是不匹配的 在写完数据后,重新读回数据以确保写操作是正确的在写完数据后,重新读回数据以确保写操作是正确的 对坏扇区进行映射对坏扇区进行映射磁盘子系统磁盘子系统4多个磁盘通过一个控制器连接到计算机系统多个磁盘通过一个控制器连接到计算机系统4控制器
13、的功能(求校验和,进行坏扇区映射)通常是由各个磁盘控制器的功能(求校验和,进行坏扇区映射)通常是由各个磁盘来完成的,以便减少磁盘控制器的负担。来完成的,以便减少磁盘控制器的负担。4磁盘接口标准簇磁盘接口标准簇 ATA(AT adaptor)系列标准系列标准 SCSI(Small Computer System Interconnect)系列标准系列标准 上述各个标准的一些变化形式上述各个标准的一些变化形式(在速度和容量上有所不同在速度和容量上有所不同)磁盘的性能度量磁盘的性能度量4存取时间存取时间 从发出读写请求到数据开始传输之间的时从发出读写请求到数据开始传输之间的时间,由:间,由:寻道时间
14、寻道时间 将磁盘臂重定位到正确的磁道上所花费的时间将磁盘臂重定位到正确的磁道上所花费的时间 平均寻道时间是最坏情况下寻道时间的平均寻道时间是最坏情况下寻道时间的1/2 在通常的磁盘上为在通常的磁盘上为4到到10 毫秒毫秒 旋转等待时间旋转等待时间 等待被存取的扇区出现在磁头下的时间等待被存取的扇区出现在磁头下的时间 平均旋转等待时间是最坏情况下旋转等待时间的平均旋转等待时间是最坏情况下旋转等待时间的1/2 在通常的磁盘上为在通常的磁盘上为4到到11 毫秒毫秒(每分钟每分钟5400到到15000转转)4数据传输率数据传输率 是从磁盘获取数据或者向磁盘存储数据是从磁盘获取数据或者向磁盘存储数据的速
15、率的速率 通常为通常为 4到到8 MB每秒每秒 由于多个磁盘可能会共用同一个控制器,所以控制器的速率由于多个磁盘可能会共用同一个控制器,所以控制器的速率也是很重要的也是很重要的 例如:例如:ATA-5:66 MB/秒,秒,SCSI-3:40 MB/秒,光纤通道秒,光纤通道:256 MB/秒秒磁盘的性能度量(续)磁盘的性能度量(续)4平均故障时间平均故障时间(MTTF)磁盘在不出现磁盘在不出现故障的情况下可以持续运行的平均期望故障的情况下可以持续运行的平均期望时间时间4通常为通常为3到到5年年4新磁盘出现故障的可能性非常低,其理新磁盘出现故障的可能性非常低,其理论论MTTF为为30,000到到1
16、,200,000小时小时磁盘块存取的优化磁盘块存取的优化4磁盘块磁盘块 一条磁道上连续的几个扇区构成的序列一条磁道上连续的几个扇区构成的序列 数据在磁盘和主存储器之间以块为单位进行传输数据在磁盘和主存储器之间以块为单位进行传输 块的大小从块的大小从512字节到几字节到几KB不等不等 磁盘块越小,需要传输的次数越多磁盘块越小,需要传输的次数越多 磁盘块越大,被浪费的空间越多,因为存在许多没有被填满的磁盘块越大,被浪费的空间越多,因为存在许多没有被填满的块块 现在,磁盘块的大小一般为现在,磁盘块的大小一般为4到到16KB4磁盘臂调度算法对等待中的磁道访问请求进行调度安磁盘臂调度算法对等待中的磁道访
17、问请求进行调度安排,使磁盘臂移动的距离最小化排,使磁盘臂移动的距离最小化 电梯算法:向一个方向移动磁盘臂(从外侧磁道到内侧磁道电梯算法:向一个方向移动磁盘臂(从外侧磁道到内侧磁道或者相反),处理下一个与磁盘臂移动方向相同的请求,直或者相反),处理下一个与磁盘臂移动方向相同的请求,直到没有该方向的请求为止,然后向反方向移动,并重复上述到没有该方向的请求为止,然后向反方向移动,并重复上述步骤步骤磁盘块存取的优化(续)磁盘块存取的优化(续)4文件组织文件组织 根据对文件的存取方式来组织磁盘根据对文件的存取方式来组织磁盘块,从而优化磁盘块的存取时间块,从而优化磁盘块的存取时间 例如,将相关的信息存储在
18、同一个或者邻近的柱面例如,将相关的信息存储在同一个或者邻近的柱面上上 随着时间的流逝,文件会变得碎片化随着时间的流逝,文件会变得碎片化 例如,对文件进行插入、删除数据的操作例如,对文件进行插入、删除数据的操作 或者磁盘上空闲的磁盘块是分散的,那么新创建的文件所或者磁盘上空闲的磁盘块是分散的,那么新创建的文件所包含的磁盘块就会分散在整个磁盘上包含的磁盘块就会分散在整个磁盘上 对碎片化的文件进行顺序存取会增加磁盘臂的移动对碎片化的文件进行顺序存取会增加磁盘臂的移动 一些系统具有能够减少文件系统碎片的应用程序,一些系统具有能够减少文件系统碎片的应用程序,以便加快文件的存取速度以便加快文件的存取速度磁
19、盘块存取的优化(续)磁盘块存取的优化(续)4非易失写缓冲区非易失写缓冲区 通过将块立即写入非易失的通过将块立即写入非易失的RAM缓冲区来加速缓冲区来加速磁盘写操作磁盘写操作 非易失非易失RAM:具有后备电源的:具有后备电源的RAM或者闪存或者闪存 即使电源故障,当电源恢复时仍然可以安全地将数据写回到磁盘即使电源故障,当电源恢复时仍然可以安全地将数据写回到磁盘 当磁盘没有其他请求时或者请求已经等待了一段时间,控制器就会当磁盘没有其他请求时或者请求已经等待了一段时间,控制器就会将数据写入到磁盘将数据写入到磁盘 那些需要首先将数据安全地保存才可以继续执行的数据库操作,现那些需要首先将数据安全地保存才
20、可以继续执行的数据库操作,现在就可以不必等待将数据写入磁盘了在就可以不必等待将数据写入磁盘了可以对写操作进行重新排序,以最小化磁盘臂的移动可以对写操作进行重新排序,以最小化磁盘臂的移动4磁盘日志磁盘日志 将对于块的修改按照顺序记录在一个专门的磁盘上将对于块的修改按照顺序记录在一个专门的磁盘上 可以像非易失可以像非易失RAM那样使用那样使用 因为不需要寻道,写日志磁盘的速度是非常快的因为不需要寻道,写日志磁盘的速度是非常快的 不需要特殊的硬件不需要特殊的硬件(NV-RAM)4文件系统通常通过对写操作进行重新排序来提高性能文件系统通常通过对写操作进行重新排序来提高性能 基于日志的文件系统:将数据以
21、安全的顺序写入基于日志的文件系统:将数据以安全的顺序写入 NV-RAM或者日志或者日志磁盘磁盘 如果不采用日志的方式记录数据,就会冒文件系统数据损坏的风险如果不采用日志的方式记录数据,就会冒文件系统数据损坏的风险RAID4RAID:Redundant Arrays of Independent Disks(廉价(廉价磁盘冗余阵列)磁盘冗余阵列)一种对大量磁盘进行管理,并提供单个磁盘视图的磁盘组织一种对大量磁盘进行管理,并提供单个磁盘视图的磁盘组织技术技术 通过并行使用多个磁盘从而达到高速度和高容量通过并行使用多个磁盘从而达到高速度和高容量 通过数据的冗余存储,即使在磁盘故障的情况下也可以恢复数
22、据通过数据的冗余存储,即使在磁盘故障的情况下也可以恢复数据4N个磁盘组成的集合中的一些磁盘出现故障的几率远个磁盘组成的集合中的一些磁盘出现故障的几率远高于特定的单个磁盘发生故障的几率高于特定的单个磁盘发生故障的几率 例如,对于一个拥有例如,对于一个拥有100个磁盘,每个磁盘的个磁盘,每个磁盘的MTTF为为100,000小时小时(约约11年)的系统,其系统年)的系统,其系统MTTF为为1000小时(约小时(约41天)天)对于拥有大量磁盘的系统来说,使用冗余的技术避免数据丢对于拥有大量磁盘的系统来说,使用冗余的技术避免数据丢失是非常重要的失是非常重要的4RAID最初是作为大而昂贵的磁盘的替代方法而
展开阅读全文