第五讲集群计算技术课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第五讲集群计算技术课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 集群 计算 技术 课件
- 资源描述:
-
1、第五章第五章 高性能集群计算技术高性能集群计算技术第三讲第三讲 高性能集群计算技术高性能集群计算技术1.机群系统的产生与发展机群系统的产生与发展 n成熟的理论基础成熟的理论基础q计算机体系结构计算机体系结构的发展已经比较成熟的发展已经比较成熟n从向量多处理机系统、共享存储的多处理机(包括对称和非对称两种)到MPP结构,人们积累了相当丰富的经验,发展了一套比较完整的理论n商用工作站或商用工作站或PC机能保持性能上的优势机能保持性能上的优势q由于由于RISCRISC技术的发展技术的发展,使得微处理器的性能不断提高。,使得微处理器的性能不断提高。高档芯片的运算能力平均每年增长高档芯片的运算能力平均每
2、年增长30%30%,而价格不断,而价格不断降低降低q直接使用商用工作站或直接使用商用工作站或PCPC机作为运算节点的机群机作为运算节点的机群,系系统在节点性能上能够同处理器的发展保持同步增长统在节点性能上能够同处理器的发展保持同步增长第三讲第三讲 高性能集群计算技术高性能集群计算技术1.1.机群系统的产生与发展机群系统的产生与发展 n网络技术的进步网络技术的进步q网络传输速度的提高网络传输速度的提高,提高了应用程序之间的通信带宽,提高了应用程序之间的通信带宽q交换技术的发展交换技术的发展则大幅度地降低了传输延迟,使得许多高则大幅度地降低了传输延迟,使得许多高速局域网的性能和速局域网的性能和MP
3、PMPP专用互连网络的性能相当专用互连网络的性能相当 n并行编程环境的开发使得编制并行程序更为容易并行编程环境的开发使得编制并行程序更为容易 并行应用程序的开发和在不同平台之间的可移植性并行应用程序的开发和在不同平台之间的可移植性,一直是传统一直是传统 并行系统能否广泛应用的一个关键。并行系统能否广泛应用的一个关键。q近年来出现了很多并行程序开发及运行系统近年来出现了很多并行程序开发及运行系统n如如PVMPVM、MPIMPI、ExpressExpress、LindaLinda等系统等系统n这些系统可以适应很多平台,应用程序在这些系统上的可移植性也比较好这些系统可以适应很多平台,应用程序在这些系
4、统上的可移植性也比较好(特别是特别是PVMPVM和和MPIMPI),由于其开放性,受到了许多大学和研究机构的重视,由于其开放性,受到了许多大学和研究机构的重视,并且在这些环境下开发了许多应用程序并且在这些环境下开发了许多应用程序 第三讲第三讲 高性能集群计算技术高性能集群计算技术2.2.使用廉价集群系统的好处使用廉价集群系统的好处n相对于专用并行超级计算机的性能相对于专用并行超级计算机的性能/价格比价格比n其增长速度与年度资金计划的匹配其增长速度与年度资金计划的匹配n提供多用途的系统提供多用途的系统q科学计算科学计算q网络应用服务网络应用服务第三讲第三讲 高性能集群计算技术高性能集群计算技术3
5、.3.集群技术的研究机会集群技术的研究机会第三讲第三讲 高性能集群计算技术高性能集群计算技术3.3.集群技术的研究机会集群技术的研究机会n并行处理并行处理 n用多个处理机构成类似用多个处理机构成类似 MPP/DSMMPP/DSM系统来进行并行计算。如何考虑一些新技术系统来进行并行计算。如何考虑一些新技术带来的新因素,优化并行计算模型、算法?带来的新因素,优化并行计算模型、算法?异构多核,协处理器为中心思想异构多核,协处理器为中心思想n网络网络 RAMRAMn基于新技术,如基于新技术,如PCI-ExpressPCI-Express设备,测试分析已有方法,提出优化新方法。新技设备,测试分析已有方法
6、,提出优化新方法。新技术有新特点,有效利用新特点就有新效果。术有新特点,有效利用新特点就有新效果。n用每台工作站上的内存构成用每台工作站上的内存构成协作缓存协作缓存,提高虚存和文件系统的性能,提高虚存和文件系统的性能n固态硬盘固态硬盘n软件软件 RAIDRAID、并行文件系统、并行文件系统n廉价磁盘的冗余阵列廉价磁盘的冗余阵列n使用工作站的磁盘阵列提供一个便宜、高可用性和可扩展的文件存储器使用工作站的磁盘阵列提供一个便宜、高可用性和可扩展的文件存储器n利用利用MPI-I/OMPI-I/O,有可能对应用程序提供并行,有可能对应用程序提供并行I/OI/O支持支持n多路通信多路通信n在节点间通过多网
7、络对数据进行并行传输,如链路聚集技术在节点间通过多网络对数据进行并行传输,如链路聚集技术n负载均衡负载均衡n资源动态分配,作业迁移等。基于虚拟化新技术等资源动态分配,作业迁移等。基于虚拟化新技术等n单一系统映像单一系统映像n集群文件系统,内存统一编址等集群文件系统,内存统一编址等.n低功耗问题低功耗问题新技术:多核技术,虚拟化技术,新技术:多核技术,虚拟化技术,IBA,PCI-E,等,等新理念:自主新理念:自主/自动计算,等自动计算,等4.4.集群计算机体系结构集群计算机体系结构第三讲第三讲 高性能集群计算技术高性能集群计算技术4.4.集群计算机体系结构集群计算机体系结构n集群:是一种并行或分
8、布式处理系统;由很多连在一起的独立计算集群:是一种并行或分布式处理系统;由很多连在一起的独立计算机组成;象一个单独集成的计算资源一样协同工作。机组成;象一个单独集成的计算资源一样协同工作。q节点可以是一个单处理器或多处理器的系统,拥有内存、节点可以是一个单处理器或多处理器的系统,拥有内存、I/OI/O设备和操作系统。设备和操作系统。q一般是连接在一起的两个或多个计算机。一般是连接在一起的两个或多个计算机。q节点节点n可以是在一起可以是在一起q对于用户和应用程序来说象一个单一个系统。对于用户和应用程序来说象一个单一个系统。q提供了一种价格合理的并可以获得所需性能和优势的解决方案。提供了一种价格合
9、理的并可以获得所需性能和优势的解决方案。n可以是物理上分散而通过可以是物理上分散而通过LANLAN连接在一起的连接在一起的第三讲第三讲 高性能集群计算技术高性能集群计算技术典型的集群系统结构典型的集群系统结构第三讲第三讲 高性能集群计算技术高性能集群计算技术集群集群/机群体系结构机群体系结构 所有节点都是完整的商用计算机系统所有节点都是完整的商用计算机系统高档高档PCPC、工作站,也可以是、工作站,也可以是SMPSMPIntel IA-32Intel IA-32,Intel EM64TIntel EM64T,PowerPower,AMD AMD x86_64x86_64,Intel IA-64
10、 Intel IA-64 每个节点机上都安装有一份完整的商每个节点机上都安装有一份完整的商用操作系统用操作系统LinuxLinux机群(如机群(如BeowulfBeowulf)、)、SolarisSolaris机群(如机群(如Berkeley NOWBerkeley NOW)、)、NTNT机群(如机群(如HPVMHPVM)、)、AIXAIX机群(如机群(如IBM SP2IBM SP2)、)、HP-UXHP-UX机群和微软机群和微软WolfpackWolfpack机群等机群等 系统域网(系统域网(SAN:System Area Network SAN:System Area Network)Gi
11、gabit EthernetGigabit Ethernet,MyrinetMyrinet,InfinibandInfiniband,QuadricsQuadrics,SCI SCI 单一的系统映象单一的系统映象(Single System ImageSingle System Image,简称,简称SSISSI)单一登录点、单一控制点、单一文件系统、单一登录点、单一控制点、单一文件系统、单一作业管理、单一用户界面、单一进程空单一作业管理、单一用户界面、单一进程空间等间等 高可用性保证机制高可用性保证机制第三讲第三讲 高性能集群计算技术高性能集群计算技术集群集群/机群系统举例机群系统举例 10
12、/100M快速以太网交换机 Node1 Node2 Node10 图2.2 Node1到Node10是并行工作站机群的计算节点,由八台UNIX工作站组成,它们直接挂接在Internet 上。Internet 第三讲第三讲 高性能集群计算技术高性能集群计算技术曙光曙光30003000超级服务器超级服务器 系统 管理员 RAID 磁带 3D 显示 外围子系统 内置Disk CPU cache内存 I/O 接口 PCI 总线 高速以太网接口 外部以太网接口 PCI-系统网络接口 结点 1点结点1 结点 n 用户 系统网络 高速以太网 控制台 UNIX工作站 用户 PC 终端 用户 外部以太网 CPU
13、 Cache 内存 PCI 总线 高速以太 网接口 图形接口 PCI-系统网络接口 内置Disk 内置Disk 图图 2.3 曙光曙光 3000 的体系结构的体系结构 CPU:80个个内存:内存:40GB硬盘:硬盘:180GB磁盘阵列:磁盘阵列:2TB第三讲第三讲 高性能集群计算技术高性能集群计算技术集群计算机的重要部件集群计算机的重要部件n节点:节点:q多个高性能计算机(多个高性能计算机(PCPC、工作站或、工作站或SMPSMP)q优秀的操作系统(完整或基于微内核)优秀的操作系统(完整或基于微内核)n网络:网络:q高性能网络高性能网络/交换开关(千兆以太网、交换开关(千兆以太网、Myrine
14、tMyrinet、InfiniBandInfiniBand等)等)q网络接口卡(网络接口卡(NICNIC)q快速通信协议和服务(活动消息和快速消息)快速通信协议和服务(活动消息和快速消息)n集群中间件:集群中间件:q单一映像系统单一映像系统(SSI)(SSI)和系统可用性基础和系统可用性基础q并行编程环境和工具,如编译器、并行编程环境和工具,如编译器、PVMPVM(并行虚拟机)和(并行虚拟机)和MPIMPI(消息传递接口)(消息传递接口)n应用程序:串行、并行应用程序:串行、并行第三讲第三讲 高性能集群计算技术高性能集群计算技术5.5.集群计算机的互连网络集群计算机的互连网络第三讲第三讲 高性
15、能集群计算技术高性能集群计算技术标准链路聚集标准链路聚集扩展的链路聚集扩展的链路聚集第三讲第三讲 高性能集群计算技术高性能集群计算技术交 换 机H U B外 部 网 络接 口 节 点 1接 口 节 点 2处 理 机 节 点0处 理 机 节 点1处 理 机 节 点n.内部交换网络网 络 服 务 器 系 统网 络 接 口 子 系 统举例:举例:网络接口子系统网络接口子系统第三讲第三讲 高性能集群计算技术高性能集群计算技术Myrinet第三讲第三讲 高性能集群计算技术高性能集群计算技术InfiniBand是面向下一代服务器的输入输出总线,原本是以是面向下一代服务器的输入输出总线,原本是以IntelI
16、ntel的的“Next Next Generation I/OGeneration I/O(NGIONGIO)”和和IBMIBM、惠普等主导的、惠普等主导的“Future I/OFuture I/O(FIOFIO)”合并在一起的合并在一起的I/OI/O架构架构 统一机箱内部和外部的互连方法统一机箱内部和外部的互连方法基于基于Switched FabricSwitched Fabric互连互连LinkLink具有具有x1x1、x4x4、x12x12规格。传输速度分别为规格。传输速度分别为2.5Gbps2.5Gbps、10Gbps10Gbps、30Gbps30Gbps。每个每个LinkLink可以
17、使用铜线或者光缆。如果使用铜线,传输距离可达可以使用铜线或者光缆。如果使用铜线,传输距离可达1717米米;如果使用光缆最长可以传输如果使用光缆最长可以传输1010公里。公里。第三讲第三讲 高性能集群计算技术高性能集群计算技术使用使用InfiniBandInfiniBand的系统的系统是由多个子网构成的,子网之间通过路由器是由多个子网构成的,子网之间通过路由器以及网桥连接,一个子网最多可以由以及网桥连接,一个子网最多可以由6.46.4万个节点构成。万个节点构成。使用使用IPv6IPv6扩展地址扩展地址,使,使InfiniBandInfiniBand交换机可以将数据包直接交换到交换机可以将数据包直
18、接交换到正确的设备上正确的设备上 消除了内部消除了内部I/OI/O总线总线,服务器的占地面积可以减少,服务器的占地面积可以减少6060,从而取代,从而取代体积庞大的服务器体积庞大的服务器 开发出速度更快的软件开发出速度更快的软件,因为开发人员可以使应用程序不必再经过,因为开发人员可以使应用程序不必再经过CPUCPU就可直接调用就可直接调用I/OI/O设备。设备。不仅能用于单台服务器,而且也可以用于不仅能用于单台服务器,而且也可以用于集群服务器集群服务器以及服务器之以及服务器之间高速互联间高速互联支持支持RMDARMDA、VIAVIA、多播、网管等、多播、网管等InfiniBandInfiniB
19、and将会在大型数据中心、系统互连方面发挥重要作用将会在大型数据中心、系统互连方面发挥重要作用InfiniBand第三讲第三讲 高性能集群计算技术高性能集群计算技术第三讲第三讲 高性能集群计算技术高性能集群计算技术第三讲第三讲 高性能集群计算技术高性能集群计算技术6.PCI Express第三讲第三讲 高性能集群计算技术高性能集群计算技术 点对点连接点对点连接与与PCIPCI相比,相比,PCI ExpressPCI Express采用点对点技术,能够为每一设备分采用点对点技术,能够为每一设备分配独享通道,不需要在设备之间共享资源,这样充分保障了配独享通道,不需要在设备之间共享资源,这样充分保障
20、了各设备的宽带资源,提高数据传输速率。而各设备的宽带资源,提高数据传输速率。而PCIPCI是所有设备共是所有设备共享同一条总线资源。享同一条总线资源。第三讲第三讲 高性能集群计算技术高性能集群计算技术 易于布线、减少串扰,多方式连接易于布线、减少串扰,多方式连接与与PCIPCI相比,相比,PCI ExpressPCI Express导线数量导线数量比比PCIPCI减少了将近减少了将近75%75%,速度会,速度会加快加快数据不需要同步数据不需要同步,在同一系统内能够以不同频率运行,在同一系统内能够以不同频率运行,而且能够而且能够延伸到系统之外,采用专用线缆可将各种外设直接与系统内的延伸到系统之外
21、,采用专用线缆可将各种外设直接与系统内的PCI ExpressPCI Express总线连接在一起。这是总线连接在一起。这是PCIPCI无法做到的。无法做到的。第三讲第三讲 高性能集群计算技术高性能集群计算技术支持不同工作速度支持不同工作速度设备之间的通信设备之间的通信第三讲第三讲 高性能集群计算技术高性能集群计算技术PCI ExpressPCI Express数据传输速率快数据传输速率快 连接可以由连接可以由x1x1、x2x2、x4x4、x8x8、x12x12、x16x16、x32x32组成组成 每个通道带宽为每个通道带宽为2.5Gb/s2.5Gb/s 理论上最高连接带宽可以达到理论上最高连
22、接带宽可以达到8-10GB/s8-10GB/s。第三讲第三讲 高性能集群计算技术高性能集群计算技术n兼容兼容PCIPCI和和PCI-XPCI-Xq跨平台兼容跨平台兼容,目前被广泛采用的目前被广泛采用的PCI 2.2PCI 2.2,但不兼容目前,但不兼容目前的的AGPAGP接口接口n其它功能其它功能qPCI ExpressPCI Express接口标准可以支持不同的接口标准可以支持不同的信令信令协议协议q采用先进的电源管理技术,支持热插拔功能采用先进的电源管理技术,支持热插拔功能q可以对所有的接入设备进行实时监控可以对所有的接入设备进行实时监控q同时采用独特的纠错机制保证整个系统的稳定运行同时采
23、用独特的纠错机制保证整个系统的稳定运行第三讲第三讲 高性能集群计算技术高性能集群计算技术包括处理层、数据连接层和物理层这三个协议层包括处理层、数据连接层和物理层这三个协议层处理层负责拆分和组装数据包、发送读写请求和处理连接设置和处理层负责拆分和组装数据包、发送读写请求和处理连接设置和控制信号,使数据控制信号,使数据顺利地实现顺利地实现端到端的通信。端到端的通信。数据连接层则用于保证数据数据连接层则用于保证数据完整地从完整地从一端传输到另外一端,通过一端传输到另外一端,通过命令应答校验协议技术检验错误并且进行修正。命令应答校验协议技术检验错误并且进行修正。PCI ExpressPCI Expre
24、ss通信协议通信协议第三讲第三讲 高性能集群计算技术高性能集群计算技术第三讲第三讲 高性能集群计算技术高性能集群计算技术7.7.集群计算机的系统层次结构集群计算机的系统层次结构第三讲第三讲 高性能集群计算技术高性能集群计算技术8.8.集群的特点集群的特点n开发周期短,开发成本低,投资风险小开发周期短,开发成本低,投资风险小n高性能高性能q单机性能越来越高,并且并行处理单机性能越来越高,并且并行处理q网络性能和协议性能不断提高网络性能和协议性能不断提高n性能价格比高性能价格比高q商品化部件商品化部件qNOWNOW不需要单独投资不需要单独投资n可扩展性、高吞吐量可扩展性、高吞吐量n可靠性、可用性可
25、靠性、可用性q备份计算机备份计算机 q作业动态迁移,负载均衡,等作业动态迁移,负载均衡,等 n易用性,编程方便易用性,编程方便q象使用普通工作站一样使用和编程象使用普通工作站一样使用和编程q已有应用可以不加修改地在集群上运行串行程序已有应用可以不加修改地在集群上运行串行程序第三讲第三讲 高性能集群计算技术高性能集群计算技术n2020世纪世纪8080年代的年代的VAXVAX机群称为第一代机群机群称为第一代机群n2020世纪世纪9090年代年代IBMIBM的的SP2SP2看成第二代机群的起点看成第二代机群的起点n第三代机群要突破的关键技术包括:第三代机群要突破的关键技术包括:q降低成本、降低功耗、
展开阅读全文