云存储技术和应用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《云存储技术和应用课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 存储 技术 应用 课件
- 资源描述:
-
1、云存储技术和应用提纲 存储发展历史 云存储概念和技术 云存储应用存储的发展历史 直连存储DAS 存储区域网络SAN 网络附着存储NAS 对象存储设备OSD存储发展历史-直连存储DASnDirect-Attached Storagel概念:存储设备是通过电缆(通常是SCSI接口)直接到服务器的,I/O(输入/输入)请求直接发送到存储设备。存储发展历史-直连存储DASnDirect-Attached Storagel备份和恢复:占用服务器资源,数据量越大,备份和恢复的时间就越长lCPU发展速度比存储发展速度快,磁盘阵列容量增大,IO成为瓶颈l服务器或磁盘阵列扩展都需要停业务,电信和银行无法忍受l服
2、务器SCSI插槽数量有限,存储资源和数据无法服务器之间共享存储发展历史-存储区域网络SANnStorage Area Network l概念:SAN的概念是允许存储设备和CPU(服务器)之间建立直接的高速网络(与LAN相比)连接,通过这种连接实现只受光纤线路长度限制的集中式存储。光纤交换机存储发展历史-存储区域网络SANnStorage Area Network l独立于服务器网络的高速光纤存储网,适合大数据高速处理l存储资源全局多主机动态共享l备份与恢复:不需要服务器参与lIO带宽:多个服务器可以并行访问统一存储设备l在线升级:在线增加服务器或存储设备l扩展性:光纤交换机提供很多接口,也可以
3、连接其他交换机存储发展历史-块访问存储发展历史-块访问存储发展历史-网络附着存储NASnNetwork Attached Storagel概念NAS由SUN公司在上个世纪80年代中期推出NFS开始,是一种面向用户提供文件级服务的专用数据存储设备,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络直接相连,由用户通过网络访问。存储发展历史-网络附着存储NASnNetwork Attached Storagel容易部署:不需要依赖任何其他设备,只要有一个网络端口就可以在任何能上网的设备上使用l易于使用:文件接相对块接口更容易使用l文件共享:方便多个主机共享数据l长
4、距离传输:基于IP网络l易于扩展:简单的增加NAS设备到网络中即可l低成本:相对SAN价格便宜存储发展历史-文件访问存储发展历史-文件访问文件的Inode包含多个块,为了提高大文件操作效率还会将两个或三个块组合起来提供访问。存储发展历史-本地文件系统文件/目录管理 10%工作量块管理90%工作量存储发展历史-分布式文件系统通过NFS/CIFS接口访问存储发展历史-对象存储存储发展历史-对象存储设备OSDSCSIBlock InterfaceStorage DeviceBlock I/O ManagerObject InterfaceApplicationsFile SystemUser Com
5、ponentFile SystemStorage ComponentSystem Call InterfaceCPUApplicationsFile SystemUser ComponentSystem Call InterfaceCPUStorage DeviceBlock I/O ManagerFile SystemStorage Component存储发展历史-对象存储设备OSDManagers Object-based Storage DevicesMANAGEMENTEth switchSAN Access Request DATAClient存储发展历史-对象存储vs块存储存储发展
6、历史-对象存储vs文件存储存储自治:容量扩展负载均衡备份QoS、SLA感知和数据分组预取压缩/去冗余强安全/加密Compliance、Retention、secure delete可用性、副本自治愈存储发展历史-对象定义n对象的定义lObject ID:对象唯一标示lUser Data:对象的数据lMetadata:元数据,空间管理信息lAttributes:对象属性存储发展历史总结提纲 存储发展历史 云存储概念和技术 云存储应用云存储需求云存储需求2011年全球数据量将达1.8ZB,这人类将开始进入ZB时代云存储需求 高容量:海量,且可扩展 高性能:快速的访问、定位 高可用:个别磁盘失效,甚
7、至整个中心被毁 低成本:传统的NAS、SAN技术构建大规模存储系统成本很高云存储概念和特点 云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。高可用、可扩展、按需付费BigTableGoogle App EngineMapReduceLive Services SQL Services.NET ServicesSharepoint ServicesDynamic CRM ServicesHadoopD
8、B2Xen&PowerVMWebsphereTivoli SoftwareS3SimpleDBEC2Simple QueueEBS云存储有哪些?云存储的热点 分布式文件系统(Google GFS、Hadoop HDFS。)NoSQL数据库(Google BigTable、Facebook Cassandra。)对象存储(Amazon S3)分布式块存储(Amazon EBS)分布式文件系统应用场景 Google:搜索、AppEngine、Gmail、Youtube、Map。Baidu:Hadoop HDFS搜索、数据分析 Taobao:TFS存储图片网页 Hadoop HDFS数据分析GFS-
9、需求分析l 组件失效是常态l 文件规模一般都在几个G以上l Write once read many负载模型文件写入后,基本不需要重写操作文件被大量地连续读操作,随机读很少发生l 允许大量客户端并行追加写同一个文件,追加写操作必须是原子操作l 对海量数据处理来说,带宽是稀缺资源GFS-接口(API)l 提供文件系统接口 非标准的POSIX API 仅仅提供几种最基本的操作create,delete,open,close,read,write 利用写时拷贝(copy-on-write)技术实现快照功能GFS-体系结构l文件被切割成固定大小的块(Chunk)l一个主Master,多个Shadow
10、Masterl多个Chunkserver l多clientGFS-Master设计l 主master 将所有元数据保存在内存中,实现快速访问 同时提供chunk令牌管理、孤立块垃圾回收、块迁移、副本管理功能 定期与chunkserver发送心跳消息,收集chunkserver状态 任何对元数据的写操作都会保存到日志中 元数据在一段时间内会缓存在clients中l Shadow masters Master的状态(checkpoint和log)会定期复制到shadow masters中,以保证系统的可靠性。当master失效后,系统会尝试从shadow master中读取checkpoint和l
11、og进行数据恢复,恢复周期一般为秒级 即使master失效,shadow也能提供文件的只读访问。GFS-ChunkServer设计l 在linux系统中以实体文件存放chunkl 默认放置3个chunk副本,2个在同一个机架的不同机器,1个在另外的机架 平衡访问负载 平衡存储空间 提供可用性和可靠性 l 块数据不缓存l 块大小为64MB 减少元数据,每chunk对应64Bytes元数据,2P数据需要2G内存 减少网络开销,因为client往往对一个chunk进行多次操作,所以chunkserver可以在一段时间之类保持住一个client和chunkserver之间的TCP连接 小文件容易形成访
12、问热点,解决方案:为小文件准备更多的副本GFS-client设计 client是一组供上层应用调用文件系统的API,它向master请求元数据,向client请求数据 client在有限时间内缓存元数据 client不缓存数据,因为用户请求的数据往往很大或者是流式写操作,缓存没有意义Amazon S3 概念 数据模型 接口对象存储(应用场景)Amazon S3 Facebook hystack 盛大云分布式key-value存储l各种媒体文件,如图片,音乐,视频等等;l最终用户数据的存储,比如文档,数据表格,数据文件等;l数据备份和存档,如交易数据,log数据,用户访问的数据等;阿里云l基于O
展开阅读全文