第六章并行处理技术课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第六章并行处理技术课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 并行 处理 技术 课件
- 资源描述:
-
1、第六章 并行处理技术北京航空航天大学计算机学院2005 年 5 月1.什么是并行处理2.为什么要开发并行处理技术3.并行机的分类及基本结构4.并行处理的基本问题和技术 多个处理单元(a collection of computing elements)协作、通信(cooperate&communicate)快速求解大型问题(to solve large problems fast)并行体系结构:用通信体系结构(Communication Architecture)对传统的体系结构进行扩展。处理器之间协同的基础是什么?互连与通信 编程人员使用何种方式编程?编程模型 如何保证并行程序的正确性?存储
2、一致性1、互连与通信的问题 互连网络的定义及特性 静态网络 动态网络 多处理器通信问题 并行计算机往往采用多个处理节点。其根本思想就是将要完成的任务尽量分布到各个处理节点并发执行,在最理想的情况下并行计算机的性能是所有节点计算性能的简单相加。但是由于节点间存在着通信延时和各个节点间的同步关系,使得系统的整体性能通常达不到理想情况。比如在某些MPP上其持续速度只是峰值速度的3%10%。同时,并行计算也逐步向着松耦合(loosely Coupled)和复杂化的方向发展。大量的SMP集群(CLUMPs)的出现,使得并行计算机内部节点与节点间的通信瓶颈愈发明显。因此,解决并行计算机的通信问题也就成为了
3、一个研究的热点。互连与通信的问题互连与通信的问题互连网络的定义及特性定义:由开关元件按一定拓扑结构和控制方式构成的网络,以实现计算机系统内部多个处理机或多个功能部件间的相互连接。互连网络对并行处理机的性能影响很大,是系统构成的主要部分。互连网络有三大要素,即互连拓扑(包括连接通路)、开关元件和控制方式。由于这三大要素的工作方式和所处的地位不同,才出现了各种各样的互联网络。操作方式:同步通信(Synchronous Communication):收发双方必须在时间上同步。这类似于电话网中需要呼叫方和被呼叫方同步。异步通信(Asynchronous Communication):收发双方不需要同步
4、。这类似于发送和接收mail。互连与通信的问题控制策略:集中控制(Centralized control):互连网络中的各级互连开关由一组信号统一控制。其优点是控制简单,实现容易,但网络的灵活性相对较差。分布控制(Distributed control):互连网络中的各级互连开关由多个或多组信号分别控制,各(组)开关可处于不同状态。其优点是网络的灵活性强,但控制相对复杂,实现相对困难。互连与通信的问题 电路交换(Circuit switching):采用与电话网类似的方式,在数据传输期间,从发送节点到接收节点的整个连接通路必须保持。优点:信息的传输延迟小,对一次接续而言,传输时延固定不变。信息
5、的编码方案和信息格式由双方协调,不受网络限制。缺点:电路资源被通信双方独占,电路利用率低。交换方式:分组交换(Packet switching):采用存储转发方式,把数据分解成许多比较短的、规格化的片段,进行交换和传输。优点:为用户提供了灵活的通信环境(不同速率、不同代码、不同通信协议机制等)。实现线路动态统计复用,通信线路利用率高,可以在一条物理线路上同时提供多条信息通路。可靠性高,经济性好。缺点:由于网络附加的传输信息较多,对长报文通信的传输效率比较低。技术实现复杂。互连与通信的问题网络拓扑结构:静态网络(Static network)静态网络的特点与指标 典型的静态网络动态网络(Dyna
6、mic network)互连函数 多级互联网络互连与通信的问题A.静态网络的特点 静态网络由点点直接相连而成,这种连结方式在程序执行过程中不会改变。如果用图来表示,结点代表开关,边代表通信链路,则:a)结点间的链路无源,不能重构;b)开关元件与处理机相连;c)不直接相连结点间的通信需通过中间结点中转。静态网络的特点与指标B.静态网络的指标 结点度:与结点相连接的边(链路或通道)数,表示节点所需要的I/O端口数,模块化要求结点度保持恒定。根据通道到结点的方向,结点度可以进一步表示为:结点度=入度+出度 其中入度是进入结点的通道数,出度是从结点出来的通道数。距离:与两个结点之间相连的最少边数。网络
7、直径:网络中任意两个结点间距离的最大值。静态网络的特点与指标 网络规模:网络中结点数,表示该网络功能连结部件的多少。等分宽度:某一网络被切成相等的两半时,沿切口的最小边数称为该网络的等分宽度。结点间的线长:两个结点间的线的长度。对称性:从任何结点看,拓扑结构都一样,这种网络实现和编程都很容易。结点是否同构。通道是否有缓冲。静态网络的特点与指标1).线性阵列 对N个结点的线性阵列,有N-1条链路,直径为N-1(任意两点之间距离的最大值),度为2,不对称,等分宽度为1。N很大时,通信效率很低。典型的静态网络2).环 对N个结点的环,考虑相邻结点数据传送方向:单向环:链路数为N,直径N-1,度为2,
8、对称,等分宽度为2。双向环:链路数为N,直径N/2,度为2,对称,等分宽度为2。比如KSR-1(1990)。典型的静态网络3).带弦环对上图中12个结点的带弦双向环,结点度为3:链路数为18,直径4(比如红色结点),度为3,不对称,等分宽度为2。度为3的带弦环度为4的带弦环 结点度为4:链路数为24,直径3(比如红色结点),度为4,对称,等分宽度为8。典型的静态网络4).链接(全互联)链接是带弦环的一种特殊情形。链接中的每个结点和其他结点之间都有单一的直接链路。如下图中8个结点的链接:有28条链路,直径为1,度为7,对称,等分宽度为16。典型的静态网络5).树形4层的二叉树一棵K层完全二叉树应
9、有N=2K-1个结点,对大结点度为3,直径为2(K-1)(即右边任意一个叶子结点到左边任意一个叶子结点)。不对称,等分度为1。由于结点度为常数,所以树是一种可扩展的系统结构。K=4典型的静态网络树形的扩展:带环树二叉胖树 这两种结构都可以缓解根结点的瓶颈问题。典型的静态网络6).星形 星形实际上是一种二层树(如右图)。有N个结点的星形网络,有N-1条链路,直径为2,最大结点度为N-1,非对称。典型的静态网络有N个结点的rr网(其中),有2r(r-1)=2N-2r条链路,直径为2(r-1),结点度为4,非对称,等分宽度为r。Nr 7).网r-1条边R 个节点典型的静态网络有N个结点的rr网(其中
10、),有2N条链路,直径为r-1,结点度为4。Nr 网的变形:Illiac 网典型的静态网络 有N个结点的rr网(其中),有2N 条链路,直径为2r/2,结点度为4,对称。Nr 网的变形:环形网(2DTorus)典型的静态网络网的变形:搏动式阵列(Systolic Array)典型的静态网络8).超立方体0-立方体1-立方体2-立方体3-立方体4-立方体典型的静态网络一个n-立方体由N=2n个结点构成,它们分布在n维上,每维有两个结点。直径为n,结点度为n,对称。由于结点度随维数线性增加,所以超立方体不是一种可扩展结构。例子:Intel的iPSC/1、iPSC/2、nCUBE典型的静态网络9).
11、带环立方体一个带环n-立方体由N=2n个结点环构成,每个结点环是一个有n个结点的环,所以结点总数为n2n个。直径通常为2n,结点度为3,对称。带环3-立方体典型的静态网络特点:网络的开关元件有源,链路可通过设置这些开关的状态来重构。只有在网络边界上的开关元件才能与处理机相连。动态网络 互连函数是一级动态互联网络的一种抽象描述,是从输入到输出的一个映射。排列:N个数的每一种有确定次序的放置方法叫做一个N排列。置换:把一个N排列变成另一个N排列的变换叫做N阶置换。在有N个输入端和N个输出端的网络中,输入端和输出端的连接关系可以用置换来表示(输入端与输出端一一对应)。互联函数1).恒等函数)()(0
12、21021XXXXXXXXfknnknne 其中,Xn-1 Xn-2Xk X0是PE的地址(通常为二进制)。n为3时的恒等函数的连接情形如下:000001010011100101110111000001010011100101110111互联函数2).方体函数(cube0,cube1,cuben-1)()(021021XXXXXXXXcubeknnknnk 方体函数是由n个互连函数组成,其中0kn。比如,n为3时,3-立方体各结点地址如下:YZX010011110000111001100101互联函数00000100100001001101101010010110110011011111111
13、0Cube0:)()(0120120XXXXXXcube01234567YZX010011110000111001100101互联函数Cube1:)()(0120121XXXXXXcube00001000101101000001100110010111011110010111011101234567YZX010011110000111001100101互联函数Cube2:)()(0120122XXXXXXcube01234567000100001101100000010011101110111001010011110111YZX0100111100001110011001010000003).
14、洗牌函数:均匀洗牌(Shuffle-Exchange)11111101234567)()(102021nknknnXXXXXXXXSh001010010100011110100001101011110101201012)(XXXXXXSh互联函数子洗牌)()(01110111kkknkkknkXXXXXXXXXXSh 即最低k位循环左移一位。000000001010010001011011110111111100100110101101012345671020121)(XXXXXXSh互联函数超洗牌)()(01120121XXXXXXXXXXShknnknnknknnnk 即最高k-1位循环左
15、移一位。0210123)(XXXXXXSh00000000100101010001010001110101110111011111111001234567互联函数000000逆洗牌函数11111101234567)()(1100111XXXXXXShnn001100010001011101100010101110110011互联函数000000010010101101111111012345674).蝶式)()(11200121nnnnXXXXXXXX001100100001110011011110互联函数5).PM2I函数(加减2i)共有2n个互连函数,对N个结点的网络为NnniNjNjjP
16、MNjjPMiiii2log1010mod2)(2mod2)(2,其中,例1:N=8(8个结点),则n=log28=3,所以:i=0,1,2;j=0,1,7。6个PM2I函数如下:互联函数PM2+0:(0 1 2 3 4 5 6 7)01234567PM2-0:(7 6 5 4 3 2 1 0)01234567互联函数PM2+1:(0 2 4 6)()(1 3 5 7)01234567PM2-1:(6 4 2 0)()(7 5 3 1)01234567互联函数PM2 2:(0 4)()(1 5)()(2 6)()(3 7)01234567互联函数A.多级网络的三要素(1)开关单元:a个输入a个
17、输出的开关单元记做aa的开关单元,其中,a是2的整数倍。常见的有2 2、4 4、8 8等。根据开关单元功能的多少,2 2又可以分为两功能和四功能开关。如下图所示:多级互连网络0101直送0101交叉0101上播0101下播多级互连网络(2)级间互连模式(InterStage Connection):均匀洗牌、蝶式、多路洗牌(比如四路洗牌即是把牌平均分成4份,然后4堆分别进行均匀洗牌)、纵横开关(Cross Switch)及立方体连结等。(3)控制方式级控制:每级只有一个控制信号单元控制:每个开关一个控制信号部分级控制:几个开关合用一个控制信号多级互连网络B.网0123456701234567第
18、0级第1级第2级201012)(XXXXXXSh网的特点:开关单元:22四功能开关ISC:洗牌变换控制方式:采用单元控制方式。当目的地址编码从高位开始的第i位(从0开始)为0时,第i级的22开关的输入端与上输出端连接,否则输入端与下输出端连接。例子:UIUC的CedarIBM的RP3NYU的Ultracomputer多级互连网络0123456701234567第0级第1级第2级无阻塞的实现置换1=(0 7 6 4 2)()(1 3)()(5)多级互连网络0123456701234567第0级第1级第2级置换2=(0 6 4 7 3)()(1 5)()(2)在开关F、G、H、I和J上发生阻塞FG
19、HJI多级互连网络网的特点(2):并不是所有的置换在网中一次通过便可以实现。网是阻塞网络:出现冲突时,可以采用几次通过的方法来解决冲突。多级互连网络0123456701234567第0级第1级第2级网的广播功能:0018个输出端多级互连网络44开关构成的网:多路洗牌如16输入4路洗牌:网路级数为log416=201第1级234567891011121314150123456789101112131415第0级级间变换:Sh(Sh()可以认为是由4个2*2开关组成多级互连网络网的特点(3):当采用kk开关元件时,则可以定义k路洗牌函数来构造更大的级数为logkn的网络。多级互连网络C.蝶式网络(
20、Butterfly switch network)蝶式网络的开关不允许广播功能,它实际上是Omega网的一个子集。两级64 64的蝶式网络如下图所示:它采用16个8 8交叉开关构成,两级间采用8路洗牌连接。多级互连网络8888880.7888888第1级第0级8.1556.63.078155663.两级64 64的蝶式网络多级互连网络 总线本质上是一组导线和插座,用于处理器、存储模块和外围设备之间的数据传输。系统总线用于主设备如处理器和从设备如存储模块之间传输数据。总线仲裁逻辑每次只授予一个请求存储总线,因此也称争用总线。单总线 层次总线 总线 目前已建立了许多标准总线,例如PCI、VME、M
21、ultibus、Sbus、MicroChannel、IEEE Futurebus。大多数总线在构造单处理机系统时价格很低。我们关心的是多处理机总线和层次总线,用它们来构造SMP、NUMA和DSM机器。这些可扩展的总线一般用硬件来支持高速缓存一致性、快速多处理机同步、以及分离事务中断处理等。总线M P C高速缓存 IF系统总线(在底板或中夹板上)系统总线(在底板或中夹板上)局部总线存储器存储器总线 C IF IOP IF IF IF IF C缓存器缓存器局部总线局部总线CPU板I/O板网络接口卡以太网打印机磁盘存储板总线总线互连的缺陷 总线有多个处理机分时共享,因此即使当总线带宽很高,每个处理器
22、的带宽也只是总带宽的一部分。此外总线由于缺乏冗余机制易于出错,请总线也有有限的可扩展性。这些缺陷主要是受封装技术和价格因素的约束。总线一般限制在很小的机架内,当层次总线扩展到几个机架时,始终扭转和全局时问题就变得难于克服。使用交叉开关和多级网络代替总线结构将在一定程度上克服这些缺陷。总线 基本术语与性能指标 通信方式 寻径算法 软件开销多处理器通信问题基本通信方式 无论网络拓扑结构如何,高性能计算机节点间通信对于用户是透明的。其通信模式无外乎以下4种:单播(Unicast):一个源节点到一个目的节点;多播(Multicast):一个源节点到多个目的节点;广播(Broadcast):一个源节点到
23、全体节点;会议(Conference):多个源节点到一个目的节点。多处理器通信问题1).消息、包和片 消息(Message):是在多计算机系统的处理接点之间传递包含数据和同步消息的信息包。它是一种逻辑单位,可由任意数量的包构成。包(Packet):包的长度随协议不同而不同,它是信息传送的最小单位,64-512位。片(Flit):片的长度固定,一般为8位。它们的相互关系如下图:基本术语与性能指标包消息包据片头片尾片 顺序号数片b b b b b b b b基本术语与性能指标2).互连网络 互连网络用来在多处理机(计算机)系统的处理结点之间传递消息。互连网络性能的两个重要指标:传输时延(Trans
展开阅读全文