云计算导论:概念-架构与应用第7章课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《云计算导论:概念-架构与应用第7章课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 导论 概念 架构 应用 课件
- 资源描述:
-
1、1 第 7 章 云存储第7章 云存储2 第 7 章 云存储结构模型概述云存储架构云存储类型及其适合的应用7.17.2内容导航C O N T E N T S关键技术7.37.47.5典型的云存储服务7.63 第 7 章 云存储7.1 概述云存储这个概念一经提出,就得到了众多厂商的支持和关注。Amazon公司推出“简单存储服务”(Simple Storage Service,S3)技术支持数据持久性存储;Google推出在线存储服务Gdrive。云存储(Cloud Storage)的概念与云计算类似,它是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件
2、集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。用户使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备向存储服务的转变,是一个以数据存储和管理为核心的云计算系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。4 第 7 章 云存储7.1 概述云存储系统的通用特征(3)低成本(4)多租户(5)无接入限制(2)高可扩展性(1)易管理5 第 7 章
3、云存储概述云存储类型及其适合的应用7.1内容导航C O N T E N T S结构模型云存储架构7.2关键技术7.37.47.5典型的云存储服务7.66 第 7 章 云存储7.2 结构模型云存储系统与传统存储系统相比,具有如下不同:l从功能需求来看,云存储系统面向多种类型的网络在线存储服务,而传统存储系统则面向如高性能计算、事务处理等应用l从性能需求来看,云存储服务首先需要考虑的是数据的安全、可靠、效率等指标,而且由于用户规模大、服务范围广、网络环境复杂多变等特点,实现高质量的云存储服务必将面临更大的技术挑战l从数据管理来看,云存储系统不仅要提供类似于POSIX的传统文件访问,还要能够支持海量
4、数据管理并提供公共服务支撑功能,以方便云存储系统后台数据的维护。7 第 7 章 云存储7.2 结构模型与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。l存储层:云存储最基础的部分。l基础管理层:云存储最核心的部分,也是云存储中最难以实现的部分。l应用接口层:不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。l访问层:任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受云存储
5、服务。云存储的结构模型8 第 7 章 云存储概述云存储类型及其适合的应用7.1内容导航C O N T E N T S结构模型7.2云存储架构关键技术7.37.47.5典型的云存储服务7.69 第 7 章 云存储7.3 云存储架构云存储架构可以分为两大类:紧耦合对称架构和松耦合非对称架构。传统的存储系统利用紧耦合对称架构,这种架构的设计旨在解决HPC(高性能计算、超级运算)问题,现在其正在向外扩展成为云存储,从而满足快速呈现的市场需求。新的存储系统已经采用了松弛耦合非对称架构,集中元数据和控制操作,这种架构并不非常适合高性能HPC,但是这种设计旨在解决云部署的大容量存储需求。10 第 7 章 云
6、存储7.3 云存储架构构建TCS系统是为了解决单一文件性能所面临的挑战,这种挑战限制了传统NAS系统的发展。HPC系统所具有的优势迅速压倒了存储,因为它们需要的单一文件I/O操作要比单一设备的I/O操作多得多。为了解决这一问题,业内创建了TCS架构的产品,很多节点同时伴随着分布式锁管理(锁定文件不同部分的写操作)和缓存一致性功能。紧耦合对称(TCS)架构LCA系统采用不同的方法来向外扩展,它不是通过执行某个策略来使每个节点知道每个行动所执行的操作,而是利用一个数据路径之外的中央元数据控制服务器。l节点可以利用不同的商品硬件CPU和存储配置,而且仍然在云存储中发挥作用。l用户可以通过利用硬件性能
7、或虚拟化实例来调整云存储。l消除节点之间共享的大量状态开销可以消除用户计算机互联的需要,进一步降低成本。l异构硬件的混合和匹配使用户能够在需要的时候在当前经济规模的基础上扩大存储。l存储节点可以旋转地进行深层次应用程序归档,而且在控制节点上,元数据经常都是可用的。松弛耦合非对称(LCA)架构这种解决方案对于单文件吞吐量问题很有效,已经在很多HPC客户中得到了广泛应用,同时也很先进,需要一定程度的技术经验才能安装和使用。11 第 7 章 云存储概述7.1内容导航C O N T E N T S结构模型7.2云存储架构7.3云存储类型及其适合的应用关键技术7.47.5典型的云存储服务7.612 第
8、7 章 云存储7.4 云存储类型及其适合的应用云存储是为解决传统存储无法解决的问题而产生的,并不是要完全取代传统的存储。存储方案的选择,要根据数据的形态、数据量及数据读写的方式来做规划。每个存储方案都有它的优点与缺点,用户需要根据自己的应用场景选择合适的云存储类型。我们可以把云存储分成三类:块存储(Block Storage)、文件存储(File Storage)和对象存储(Object Storage)。13 第 7 章 云存储7.4.1 块存储块存储会把单笔的数据写到不同的硬盘,借以得到较大的单笔读写带宽,适合用在数据库或者需要单笔数据快速读写的应用。它的优点是对单笔数据读写很快,缺点是成
9、本较高,并且无法解决真正海量文件的存储。块存储系统主要适合于下面两种应用场合。l快速更改的单一文件系统。快速更改单一文件的例子包括数据库、共用的电子表单。l针对单一文件大量写的高性能计算(HPC)。某些高性能计算有成百上千个使用端,同时读写同一个单一的文件,为了提高读写效能,这些文件被分布到很多个节点,这些节点需要紧密地协作,才能保证数据的完整性,这些应用由集群软件负责处理复杂的数据传输。例如石油探勘及财务数据模拟。14 第 7 章 云存储7.4.1 块存储两种块存储类型DAS是直接连接于主机服务器的一种储存方式,每一台主机服务器有独立的存储设备,每台主机服务器的存储设备无法互通,需要跨主机存
10、取资料时,必须经过相对复杂的设定,是一种应用较为早的技术实现。DAS(Direct Attached Storage)SAN(Storage Area Network)SAN是一种用高速(光纤)网络连接专业主机服务器的一种储存方式,此系统会位于主机群的后端,它使用高速I/O 连接方式,如SCSI、ESCON 及Fibre-Channels。SAN特点是代价高、性能好。15 第 7 章 云存储7.4.2 文件存储l文件较大,总读取带宽要求较高。例如,网站、IPTV。l多个文件同时写入。例如,监控系统。l长时间存放的文件。例如,文件备份、存放或搜寻。文件存储系统适合的应用场合l文件的并发读取。l文
11、件及文件系统本身较大。l文件使用期较长。l对成本控制要求较高。存储应用共通的特性文件存储是基于文件级别的存储,它是把一个文件放在一个硬盘上,即使文件太大拆分时,也放在同一个硬盘上。它的缺点是对单一文件的读写会受到单一硬盘效能的限制,优点是对一个多文件、多人使用的系统,总带宽可以随着存储节点的增加而扩展,它的架构可以无限制地扩容,并且成本低廉。16 第 7 章 云存储7.4.3 对象存储与文件系统不同,对象存储系统并非将文件组织成一个目录层次结构,而是在一个扁平化的容器组织中存储文件(在Amazon的S3系统中被称作“桶”),并使用唯一的ID(在S3中被称作“关键字”)来检索它们。其结果是对象存
12、储系统相比文件系统需要更少的元数据来存储和访问文件,并且它们还减少了因存储元数据而产生的管理文件元数据的开销。l对象存储系统是针对Linux集群对存储系统高性能和数据共享的需求而研究的全新的存储架构。Amazon的S3和OpenStack的Swift存储系统就是典型的对象存储系统。l对象存储系统的功能通常是最少的,用户仅仅能够存储、检索、复制和删除文件,还可以控制哪些用户可以进行哪些操作。l对象存储系统的HTTP接口允许全球各地的用户快速、方便地访问文件。l对象存储的另一大缺点是只支持数据的最终一致性。每当用户更新一个文件,直到这一更改被传播到所有副本以后,用户才能获取到最新版本。l对象存储和
13、文件系统在接口上的本质区别是对象存储不支持随机位置读写操作。17 第 7 章 云存储7.4.3 对象存储对象存储系统的出现主要是为了满足数据归档和云服务两大需求,对象存储的主要应用场景如下。01OPTION02OPTION03OPTION04OPTION存储资源池(空间租赁)。使用对象存储构建类似Amazon S3的存储空间租赁服务,向个人、企业或应用提供按需扩展的弹性存储服务。网盘应用。使用图形用户界面(GUI)实现对象存储资源的封装,向用户提供类似百度云的网盘业务。集中备份。对象存储通过与Comvault Simpana、Symantec NBU等主流备份软件结合,可向用户提供更具成本效益
14、、更低TCO的集中备份方案。归档和分级存储。对象存储通过与归档软件、分级存储软件结合,将在线系统中的数据无缝归档/分级存储到对象存储,释放在线系统存储资源。18 第 7 章 云存储7.4.4 小结S u m m a r y云存储是希望借由服务器便宜的成本及弹性的架构,解决传统存储不能满足的问题,客户可以根据数据的形态,选择合适的存储方案。l对象存储打破了原来文件系统一统天下的局面,给用户带来了更多的选择,但这并不意味着对象存储系统可以取代文件系统。l文件系统将来的发展趋势更多的是专用文件系统,而不再是像以前那样一套文件系统适用于所有场景,更有一些部分要让位于对象存储或者其他存储形态。l对象存储
15、系统更适合于互联网和类似互联网的应用场景。l对象存储系统适合存储海量10KB级到GB级对象/文件的存储。如果一个应用具有上述两种特点,就可以考虑使用对象存储系统。19 第 7 章 云存储概述7.1内容导航C O N T E N T S结构模型7.2云存储架构7.3云存储类型及其适合的应用关键技术7.47.5典型的云存储服务7.620 第 7 章 云存储7.5.1 存储虚拟化1主要存储虚拟化技术存储虚拟化技术虽然在不同设备与厂商之间略有区别,但从总体来说,可以概括为以下3种:基于存储设备虚拟化基于存储网络虚拟化基于主机虚拟化基于主机的虚拟化存储的实现,其核心技术是通过增加一个运行在操作系统下的逻
16、辑卷管理软件将磁盘上的物理块号映射成逻辑卷号,并以此实现把多个物理磁盘阵列映射成一个统一的虚拟的逻辑存储空间(逻辑块),实现存储虚拟化的控制和管理。基于存储设备虚拟化技术依赖于提供相关功能的存储设备的阵列控制器模块,常见于高端存储设备,其主要应用针对异构的SAN存储构架。基于存储网络虚拟化的技术的核心是在存储区域网中增加虚拟化引擎实现存储资源的集中管理,其具体实施一般是通过具有虚拟化支持能力的路由器或交换机实现。在此基础上,存储网络虚拟化又可以分为带内虚拟化与带外虚拟化两类。21 第 7 章 云存储7.5.1 存储虚拟化2存储虚拟化技术对比实现层面主机网络设备优点支持异构的存储系统;不占用磁盘
17、控制器资源与主机无关,不占用主机资源;能够支持异构主机、异构存储设备;对不同存储设备构建统一管理平台,可扩展性好与主机无关,不占用主机资源;数据管理功能丰富;技术成熟度高缺点占用主机资源,降低应用性能;存在操作系统和应用的兼容性问题;主机数量越多,管理成本越高占用交换机资源;面临带内、带外的选择;存储设备兼容性需要严格验证;原有的磁盘阵列的高级存储功能将不能使用受制于存储控制器接口资源,虚拟化能力较弱;异构厂家存储设备的高级存储功能将不能使用主要用途使服务器的存储空间可以跨越多个异构磁盘阵列,常用于在不同磁盘阵列之间做数据镜像保护异构存储系统整合和统一数据管理(灾备)异构存储系统整合和统一数据
18、管理(灾备)适用场景主机已采用SF卷管理,需要新接多台存储设备;存储系统中包含异构阵列设备;业务持续能力与数据吞吐要求较高系统包括不同品牌和型号的主机与存储设备;对数据无缝迁移及数据格式转换有较高时间性保证系统中包括自带虚拟化功能的高端存储设备与若干需要利旧的中低端存储不适用场景主机数量大,采用SF会涉及高昂的费用,待迁入系统数据量过大,如果只能采取存储级迁移方式,数据格式转换将耗费大量的时间和人力对业务持续能力和稳定性要求苛刻需要新购机头时,费用较高;存在更高端的存储设备存储虚拟化技术对比22 第 7 章 云存储7.5.2 分布式存储技术分布式存储是通过网络使用服务商提供的各个存储设备上的存
19、储空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在各个存储设备上。分布式存储面临的数据需求比较复杂,大致可以分为三类。1概述非结构化数据半结构化数据结构化数据一般存储在关系数据库中,可以用二维关系表结构来表示。介于非结构化数据和结构化数据之间,HTML文档就属于半结构化数据。包括所有格式的办公文档、文本、图片、图像、音频和视频信息。23 第 7 章 云存储7.5.2 分布式存储技术分布式文件系统分布式块存储系统分布式对象存储系统分布式表存储系统目前的分布式文件系统存储的实现有软硬件一体和软硬件分离两种方式。主要通过NAS虚拟化,或者基于x86硬件集群和分布式文件系统集成在一
20、起,以实现海量非结构化数据处理能力。分布式块存储系统以标准的Intel/Linux 硬件组件作为基本存储单元,组件之间通过千兆以太网采用任意点对点拓扑技术相互连接,共同工作,构成大型网格存储,网格内采用分布式算法管理存储资源。如IBM XIV存储系统。对象存储系统是针对Linux集群对存储系统高性能和数据共享的需求而研究的全新的存储架构。对象存储系统架构具有高可扩展性,支持数据的并发读写,一般不支持数据的随机写操作。最典型的应用实例就是Amazon的S3。分布式表格系统以表格为单位组织数据,每个表格包括很多行,通过主键标识一行,支持根据主键的CRUD功能以及范围查找功能。分布式表格系统借鉴了很
21、多关系数据库的技术,典型的系统包括Google Bigtable等。2分布式存储系统的种类不同的分布式存储系统适合处理不同类型的数据,分布式存储系统可以分为以下四类:24 第 7 章 云存储7.5.2 分布式存储技术S u m m a r y如今分布式存储系统已经得到了快速的发展,其技术已经较为成熟。先进的分布式存储系统必须具备下面几个特性:l高性能:对于分布式系统中的每一个用户都要尽量减小网络的延迟和因网络拥塞、网络断开、节点退出等问题造成的影响;l高可靠性:分布式环境通常都有高可靠性需求,用户将文件保存到分布式存储系统的基本要求是数据可靠;l高可扩展性:分布式存储系统需要能够适应节点规模和
22、数据规模的扩大;l透明性:需要让用户在访问网络中其他节点中的数据时能感到像是访问自己本机的数据一样;l自治性:分布式存储系统需要拥有一定的自我维护和恢复功能。小 结25 第 7 章 云存储7.5.3 数据容错数据容错技术是云存储研究领域的一项关键技术,良好的容错技术不但能够提高系统的可用性和可靠性,而且能够提高数据的访问效率。数据容错技术一般都是通过增加数据冗余来实现的,以保证即使在部分数据失效以后也能够通过访问冗余数据满足需求。冗余提高了容错性,但是也增加了存储资源的消耗。因此,在保证系统容错性的同时,要尽可能地提高存储资源的利用率,以降低成本。目前,常用的容错技术主要有基于复制(Repli
23、cation)的容错技术和基于纠删码(Erasure Code)的容错技术两种。基于复制的容错技术简单直观,易于实现和部署,但是需要为每个数据对象创建若干同样大小的副本存储空间开销很大;基于纠删码的容错技术则能够把多个数据块的信息融合到较少的冗余信息中,因此能够有效地节省存储空间,但是对数据的读写操作要分别进行编码和解码操作,需要一些计算开销。26 第 7 章 云存储7.5.3 数据容错通过集中式的存储目录来定位数据对象的存储位置,这种方法可以利用存储目录中存放的存储节点信息,将数据对象的多个副本放置在不同机架上,提高系统的数据可靠性,Google文件系统(GFS)、Hadoop 分布式文件系
展开阅读全文