并行计算模型课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《并行计算模型课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 计算 模型 课件
- 资源描述:
-
1、并行算法1 / Ch12022-6-22Parallel Algorithms Chapter 1 Foundation of Parallel AlgorithmsSpring, 2018并行算法2 / Ch12022-6-22主要内容主要内容n1.1 并行计算机体系结构并行计算机体系结构并行计算机的分类并行计算机的分类并行计算机的互连方式并行计算机的互连方式n1.2 并行计算模型并行计算模型 PRAM模型模型异步异步APRAM模型模型BSP模型模型LogP模型模型n1.3 并行算法的一般概念并行算法的一般概念并行算法的定义和分类并行算法的定义和分类相关性与可并行化相关性与可并行化并行算法的
2、表示并行算法的表示并行算法的复杂度并行算法的复杂度并行算法的并行算法的WT表示表示加速比性能定律加速比性能定律并行算法的同步和通讯并行算法的同步和通讯并行算法3 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 并行计算机分类并行计算机分类nFlynn分类(分类(1966年)年) (1)单指令流单数据流机单指令流单数据流机SISD,即传统的单处理机,即传统的单处理机 (2)单指令流多数据流机单指令流多数据流机SIMD (3)多指令流单数据流机多指令流单数据流机MISD,实际中不存在的机器,实际中不存在的机器 (4)多指令流多数据流机多指令流多数据流机MIMDn并行
3、机的结构模型并行机的结构模型实际的机器体系结构 SIMD (Single Instruction Multiple Data, 单指令流多数据流机) PVP (Parallel Vector Processor, 并行向量机) SMP (Symmetric Multiprocessor, 对称多处理机) MPP (Massively Parallel Processor, 大规模并行处理机) COW (Cluster of Workstation, 工作站机群) DSM (Distributed Shared Memory, 分布共享存储多处理机) 注:SIMD是专用并行机,后5种属于MIMD
4、并行机。并行算法4 / Ch12022-6-22SISD computer -Von Neumanns model1.1 并行计算机的体系结构并行计算机的体系结构: 并行计算机分类并行计算机分类SIMD computer并行算法5 / Ch12022-6-22Symmetric multiprocessor MIMD-SM1.1 并行计算机的体系结构并行计算机的体系结构: 并行计算机分类并行计算机分类Massively parallel processor MIMD-DM并行算法6 / Ch12022-6-22Cluster of workstations MIMD-DM1.1 并行计算机的体
5、系结构并行计算机的体系结构: 并行计算机分类并行计算机分类并行算法7 / Ch12022-6-22VPVPVP交叉开关交叉开关SM(a) PVPP/CP/CP/C总线或交叉开关总线或交叉开关SM(b) SMP, 物理上单一地址空间物理上单一地址空间P/CP/CP/C定制网络定制网络LMLMLM(c) MPP, 物理物理/逻辑上多地址空间逻辑上多地址空间P/CP/CP/C定制网络定制网络LMLMLM虚拟分布共享存储虚拟分布共享存储(DSM) (d) DSM (MPP/Cluster),逻辑上单一地址空间逻辑上单一地址空间结构模型物理机模型P/CP/CP/C定制定制/标准网络标准网络LMLMLM(
6、e) Cluster/COW, 物理物理/逻辑上多地址空间逻辑上多地址空间1.1 并行计算机的体系结构并行计算机的体系结构: 并行计算机分类并行计算机分类并行算法8 / Ch12022-6-22SMPMPPMPPWANLMDSMSM(h) Grid (Cluster of Clusters)SMPSMPSMPSAN/LANSMSMSMMPPMPPMPPSAN/LANDSMDSMDSM(f) SMP-Cluster(g) DSM-Cluster结构模型物理机模型1.1 并行计算机的体系结构并行计算机的体系结构: 并行计算机分类并行计算机分类并行算法9 / Ch12022-6-221.1 并行计算
7、机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连网络(固定连接固定连接) connected graph vertices = processing nodes edges = communication links(1)一维线性连接LA(1-D Linear Array)一维阵列 不带环绕的1-D LA,带环绕的1-D LA(2)网孔连接MC (Mesh Connected)二维阵列 不带环绕的MC,带环绕的MC并行算法10 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连网络 (3)树形连接TC
8、(Tree Connected) 二叉树, 胖树并行算法11 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连网络 (4)树网连接MT(Mesh of tree) 并行算法12 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连网络(5)金字塔连接(Pyramid)(6)超立方连接HC (Hypercube Connected) 3立方, 4立方(7)立方环连接CCC (Cube Connected-Cycles)(8)洗牌交换连接SE(Shuffle Ex
9、change)(9)蝶形连接(Butterfly Connected)并行算法13 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连网络: 嵌入嵌入将网络中的各节点映射到另一个网络中去用膨胀(Dilation)系数来描述嵌入的质量,它是指被嵌入网络中的一条链路在所要嵌入的网络中对应所需的最大链路数 如果该系数为1,则称为完美嵌入。 环网可完美嵌入到2-D环绕网中 超立方网可完美嵌入到2D环绕网中并行算法14 / Ch12022-6-221.1 并行计算机的体系结构并行计算机的体系结构: 互连方式互连方式n静态互连网络静态互连
10、网络: 嵌入嵌入0 01 10 01 10 01 10 00 00 00 00 00 00 00 00 01 10 01 11 11 10 01 11 10 00 00 01 10 00 00 01 11 11 11 10 01 11 11 10 00 01 10 00 00 01 10 00 01 11 11 11 11 11 11 11 10 01 10 01 10 01 10 01 11 11000100110111010110011011111111001000101011101100000000100110010并行算法15 / Ch12022-6-221.1 并行计算机的体系结构并
11、行计算机的体系结构: 互连方式互连方式n动态互连网络动态互连网络(非固定连接非固定连接)(1)总线Bus(2)交叉开关Crossbar Switcher:一种高带宽网络(3)多级互连网络Multistage Interconnection Network 一种大型开关网络 并行算法16 / Ch12022-6-22主要内容主要内容n1.1 并行计算机体系结构并行计算机体系结构并行计算机的分类并行计算机的分类并行计算机的互连方式并行计算机的互连方式n1.2 并行计算模型并行计算模型 PRAM模型模型异步异步APRAM模型模型BSP模型模型LogP模型模型n1.3 并行算法的一般概念并行算法的一般
12、概念并行算法的定义和分类并行算法的定义和分类相关性与可并行化相关性与可并行化并行算法的表示并行算法的表示并行算法的复杂度并行算法的复杂度并行算法的并行算法的WT表示表示加速比性能定律加速比性能定律并行算法的同步和通讯并行算法的同步和通讯并行算法17 / Ch12022-6-221.2 并行计算模型并行计算模型: PRAM模型模型n描述描述由由FortuneFortune和和Wyllie1978Wyllie1978年提出,称为并行随机存取机器年提出,称为并行随机存取机器PRAMPRAM,又称又称SIMD-SMSIMD-SM模型。有一个集中的共享存储器和一个指令控制器模型。有一个集中的共享存储器和
13、一个指令控制器,通过,通过SMSM的的R/WR/W交换数据,隐式同步计算。交换数据,隐式同步计算。n假设假设SMSM的容量无限的容量无限有限有限/ /无限个功能相同的处理器无限个功能相同的处理器本地指令和本地指令和SMSM的的R/WR/W操作都取单位时间操作都取单位时间n结构图结构图Control UnitInterconnection NetworkPLMPLMPLMPLMShared Memory并行算法18 / Ch12022-6-221.2 并行计算模型并行计算模型: PRAM模型模型n分类分类(1)(1)PRAM-CRCWPRAM-CRCW并发读并发写并发读并发写CPRAM-CPRA
14、M-CRCW(CommonCRCW(Common PRAM-CRCW) PRAM-CRCW):仅允许写入相同数据:仅允许写入相同数据PPRAM-PPRAM-CRCW(PriorityCRCW(Priority PRAM-CRCW) PRAM-CRCW):仅允许优先级最高的处理器:仅允许优先级最高的处理器写入写入APRAM-APRAM-CRCW(ArbitraryCRCW(Arbitrary PRAM-CRCW) PRAM-CRCW):允许任意处理器自由写入:允许任意处理器自由写入 (2)(2)PRAM-CREWPRAM-CREW并发读互斥写并发读互斥写 (3)(3)PRAM-EREWPRAM-
15、EREW互斥读互斥写互斥读互斥写 n计算能力比较计算能力比较PRAM-CRCWPRAM-CRCW是最强的计算模型,是最强的计算模型,PRAM-EREWPRAM-EREW可可logplogp倍模拟倍模拟PRAM-CREWPRAM-CREW和和PRAM-CRCWPRAM-CRCW。令。令TmTm是在模型是在模型M M上的运行时间,则:上的运行时间,则: 1979 1979年,年,EckstainEckstain曾经使用二叉树方法来解决冲突问题曾经使用二叉树方法来解决冲突问题 解决读冲突:只允许一个解决读冲突:只允许一个PEPE从共享存储单元取内容。从共享存储单元取内容。 解决写冲突:用树作一种竞赛
16、机构,确保仅有一个解决写冲突:用树作一种竞赛机构,确保仅有一个PEPE在写。在写。CRCWCREWEREWTTT)log()log(pTOpTOTCRCWCREWEREW并行算法19 / Ch12022-6-221.2 并行计算模型并行计算模型: PRAM模型模型n优点优点适合并行算法表示和复杂性分析,易于使用,隐藏了并适合并行算法表示和复杂性分析,易于使用,隐藏了并行机的通讯、同步等细节行机的通讯、同步等细节。n缺点缺点不适合不适合MIMDMIMD并行机,忽略了并行机,忽略了SMSM的竞争、通讯延迟等因素的竞争、通讯延迟等因素n推广推广存储竞争模型:存储竞争模型:将Memory分成一些模块,
17、每个模块一次可处理一个访问,可以在模块级处理存储器的竞争。延迟模型:延迟模型:考虑了信息的产生到能够使用之间的通信延迟 。局部局部PRAMPRAM模型:模型:考虑了存储带宽,假定每个PE均有无限局存,而访问全局存储器是十分昂贵的。 分层存储模型:分层存储模型:将存储器视为分层的存储模块,每个模块由其大小及传送时间表征。异步异步PRAMPRAM模型模型并行算法20 / Ch12022-6-221.2 并行计算模型并行计算模型: SIMD-IN模型模型n描述描述又称又称SIMD-DMSIMD-DM模型,分布式存储,处理器通过互连网络相连,用模型,分布式存储,处理器通过互连网络相连,用传递数据方式实
18、现通讯,算法时间复杂性考虑计算和选路传递数据方式实现通讯,算法时间复杂性考虑计算和选路( (时间时间) ),结构图如下:,结构图如下: n常见模型常见模型SIMD-LC SIMD-LC 一维线性连接一维线性连接SIMD-MC SIMD-MC 网孔连接网孔连接SIMD-TC SIMD-TC 树形连接树形连接SIMD-MT SIMD-MT 树网连接树网连接SIMD-HC SIMD-HC 超立方连接超立方连接SIMD-CCC SIMD-CCC 立方环连接立方环连接SIMD-SE SIMD-SE 洗牌交换连接洗牌交换连接并行算法21 / Ch12022-6-221.2 并行计算模型并行计算模型: 异步
19、异步APRAM模型模型n描述描述又称分相(又称分相(PhasePhase)PRAMPRAM或或MIMD-SMMIMD-SM。每个处理器有其局。每个处理器有其局部存储器、局部时钟、局部程序;无全局时钟,各处理部存储器、局部时钟、局部程序;无全局时钟,各处理器异步执行;处理器通过器异步执行;处理器通过SMSM进行通讯;处理器间依赖关进行通讯;处理器间依赖关系,需在并行程序中显式地加入同步路障。系,需在并行程序中显式地加入同步路障。n指令类型指令类型( (1)1)全局读全局读 (2)(2)全局写全局写 (3)(3)局部操作局部操作 (4)(4)同步同步 并行算法22 / Ch12022-6-221.
20、2 并行计算模型并行计算模型: 异步异步APRAM模型模型n计算过程计算过程由同步障分开的全局相组成由同步障分开的全局相组成 ,*号表示局部操作。号表示局部操作。并行算法23 / Ch12022-6-221.2 并行计算模型并行计算模型: 异步异步APRAM模型模型n计算时间计算时间 设局部操作为单位时间;全局读设局部操作为单位时间;全局读/ /写平均时间为写平均时间为d d,d d随着处理器随着处理器数目的增加而增加;同步路障时间为数目的增加而增加;同步路障时间为B=B=B(pB(p) )非降函数。非降函数。 令令 为全局相内各处理器执行时间最长者,则为全局相内各处理器执行时间最长者,则AP
展开阅读全文