第8章-其它计算机分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第8章-其它计算机分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 其它 计算机 分析 课件
- 资源描述:
-
1、计算机系统结构计算机系统结构王若成王若成 教研室:教研室:B-40282022年12月16日星期五计算机系统结构2第第1章章 计算机系统结构基本概念计算机系统结构基本概念 第第2章章 数据表示与指令系统数据表示与指令系统 第第3章章 总线、中断与输入输出系统总线、中断与输入输出系统 第第4章章 存储体系存储体系 第第5章章 重叠、流水和向量处理机重叠、流水和向量处理机 第第6章章 阵列处理机阵列处理机 第第7章章 多处理机多处理机 第第8章章 其它计算机结构其它计算机结构 目 录2022年12月16日星期五计算机系统结构38.1 8.1 脉动阵列机脉动阵列机 8.2 8.2 大规模并行处理机与
2、机群系统大规模并行处理机与机群系统 8.3 8.3 数据流机数据流机 8.4 8.4 归约机归约机8.5 8.5 智能机智能机 2022年12月16日星期五计算机系统结构48.1 8.1 脉动阵列处理机脉动阵列处理机 脉动阵列结构是由一组处理单元脉动阵列结构是由一组处理单元PE构成构成的阵列。每个的阵列。每个PE的内部结构相同,一般由一的内部结构相同,一般由一个加法个加法/逻辑运算部件或加法逻辑运算部件或加法/乘法运算部件乘法运算部件再加上若干个锁存器构成,可完成少数基本再加上若干个锁存器构成,可完成少数基本的算术逻辑运算操作。阵列内所有处理单元的算术逻辑运算操作。阵列内所有处理单元的数据锁存
3、器都受同一个时钟控制。运算时的数据锁存器都受同一个时钟控制。运算时数据在阵列结构的各个处理单元间沿各自的数据在阵列结构的各个处理单元间沿各自的方向同步向前推进。称其为脉动阵列结构。方向同步向前推进。称其为脉动阵列结构。2022年12月16日星期五计算机系统结构5 为了执行多种计算,脉动型系统内的输为了执行多种计算,脉动型系统内的输入数据流和结果数据流可以在多个不同方向入数据流和结果数据流可以在多个不同方向上以不同速度向前搏动。上以不同速度向前搏动。阵列内部的各个单元只接收前一组处理阵列内部的各个单元只接收前一组处理单元传来的数据,并向后一组处理单元发送单元传来的数据,并向后一组处理单元发送数据
4、。数据。只有位于阵列边缘的处理单元,才与存储只有位于阵列边缘的处理单元,才与存储器或器或I/OI/O端口进行数据通信。端口进行数据通信。2022年12月16日星期五计算机系统结构6 主要适用于计算量很大的信号主要适用于计算量很大的信号/图像处理,图像处理,以及某些特定计算类算法题目的求解,特别以及某些特定计算类算法题目的求解,特别是需要对大量数据执行重复计算的运算受限是需要对大量数据执行重复计算的运算受限类问题的求解。类问题的求解。2022年12月16日星期五计算机系统结构72022年12月16日星期五计算机系统结构8例如给出了在一个脉动式二维阵列结构上进例如给出了在一个脉动式二维阵列结构上进
5、行两个行两个3 33 3矩阵矩阵A A、B B相乘的例子。每个处理相乘的例子。每个处理单元单元PEPE内含一个乘法器和一个加法器,可完内含一个乘法器和一个加法器,可完成一个内积步运算。每经一拍,处理单元可成一个内积步运算。每经一拍,处理单元可把把3 3个输入端送来的信息沿三个不同方向,即个输入端送来的信息沿三个不同方向,即由左向右的水平方向、由下向上的垂直方向由左向右的水平方向、由下向上的垂直方向和由左下角到右上角的斜和由左下角到右上角的斜4545方向,同时将方向,同时将结果传送到对应的结果传送到对应的3 3个输出端,使个输出端,使aa aa,bb bb,dadab+cb+c。2022年12月
6、16日星期五计算机系统结构92022年12月16日星期五计算机系统结构102022年12月16日星期五计算机系统结构112022年12月16日星期五计算机系统结构12给出了给出了t t1 1、t t2 2、t t3 3时刻送入阵列中的数据时刻送入阵列中的数据情况,到情况,到t t6 6时,从斜时,从斜4545向右上角将同向右上角将同时输出时输出c c1313、c c1212、c c1111、c c2121、c c3131的值的值,t,t7 7时时输出输出c c2323、c c2222、c c3232的值的值,t,t8 8时输出时输出c c3333的值。的值。可以看出,总共只需要可以看出,总共只
7、需要8 8拍就可以完成两拍就可以完成两个个3 33 3的矩阵相乘,比单处理机上循环的矩阵相乘,比单处理机上循环执行所需的执行所需的2727拍,速度提高了两倍多。拍,速度提高了两倍多。2022年12月16日星期五计算机系统结构13 两个两个n nn n矩阵的相乘,用矩阵的相乘,用3n3n2 2-3n+1-3n+1个个PEPE构成的脉动阵列上只需构成的脉动阵列上只需3n-13n-1步运算步运算即可全部完成,运算所需要的时间只是即可全部完成,运算所需要的时间只是以近似以近似3n3n的线性关系增加,比用单处理的线性关系增加,比用单处理机的近似机的近似n n3 3的关系增加要小得多。当的关系增加要小得多
8、。当n n较较大时,采用脉动阵列进行运算的速度提大时,采用脉动阵列进行运算的速度提高尤为显著。高尤为显著。2022年12月16日星期五计算机系统结构14脉动阵列结构具有如下一些特点:脉动阵列结构具有如下一些特点:(1)(1)结构简单、规整,模块化强,可扩充好,非常结构简单、规整,模块化强,可扩充好,非常适合用超大规模集成电路实现。适合用超大规模集成电路实现。(2)PE(2)PE间数据通信距离短、规则,使数据流和控制间数据通信距离短、规则,使数据流和控制流的设计、同步控制等均简单规整。流的设计、同步控制等均简单规整。(3)(3)脉动阵列中所有脉动阵列中所有PEPE能同时运算,具有极高的计能同时运
9、算,具有极高的计算并行性,可通过流水获得很高的运算效率和吞吐算并行性,可通过流水获得很高的运算效率和吞吐率。率。(4)(4)脉动阵列结构的构形与特定计算任务和算法密脉动阵列结构的构形与特定计算任务和算法密切相关,具有某种专用性,限制了应用范围,这对切相关,具有某种专用性,限制了应用范围,这对VLSIVLSI是不利的。是不利的。2022年12月16日星期五计算机系统结构158.1.2 8.1.2 通用脉动阵列结构通用脉动阵列结构 受阵列结构的通用性及受阵列结构的通用性及I/OI/O带宽约束所限带宽约束所限制的阵列结构的规模大小的限制,脉动阵列制的阵列结构的规模大小的限制,脉动阵列机应用范围是有限
10、的。不同的算法往往要求机应用范围是有限的。不同的算法往往要求能有不同的阵列结构,以及大小不同的阵列。能有不同的阵列结构,以及大小不同的阵列。为了克服脉动阵列结构通用性差的弱点,研为了克服脉动阵列结构通用性差的弱点,研究和发展了一些可有效执行多种算法的较为究和发展了一些可有效执行多种算法的较为通用的脉动阵列结构。通用的脉动阵列结构。2022年12月16日星期五计算机系统结构16发展通用脉动阵列结构的途径有三种。发展通用脉动阵列结构的途径有三种。第一种途径是通过增设附加的硬件,第一种途径是通过增设附加的硬件,对阵列的拓扑结构和互连方式用可编程对阵列的拓扑结构和互连方式用可编程开关进行重构,即经程序
11、重新配置阵列开关进行重构,即经程序重新配置阵列的结构。的结构。美国美国PurduePurdue大学的可重构高度并行大学的可重构高度并行计算机计算机CHiPCHiP就是典型的例子。就是典型的例子。2022年12月16日星期五计算机系统结构172022年12月16日星期五计算机系统结构18 第二种途径是用软件把不同的算法映第二种途径是用软件把不同的算法映像到固定的阵列结构上。像到固定的阵列结构上。这一方法依赖于面向并行运算所采用的这一方法依赖于面向并行运算所采用的程序语言、操作系统、编译程序和软件开发程序语言、操作系统、编译程序和软件开发工具的设计。工具的设计。美国卡内基美国卡内基-梅隆大学用于信
12、号、图像和梅隆大学用于信号、图像和计算机视觉处理的计算机视觉处理的WARPWARP机是一台由机是一台由1010个以上个以上处理单元组成的线形脉动阵列机。处理单元组成的线形脉动阵列机。2022年12月16日星期五计算机系统结构19 第三种途径是探寻与问题大小无关第三种途径是探寻与问题大小无关的脉动处理方法,以及的脉动处理方法,以及VLSIVLSI运算系统的运算系统的分割矩阵算法,使它们可以克服阵列只分割矩阵算法,使它们可以克服阵列只能求解固定大小题目的缺陷,同时探寻能求解固定大小题目的缺陷,同时探寻发展适合一类计算问题的通用算法和相发展适合一类计算问题的通用算法和相应的设置方案。应的设置方案。2
13、022年12月16日星期五计算机系统结构208.28.2大规模并行处理机与机群系统大规模并行处理机与机群系统发展背景:发展背景:由于由于VLSIVLSI和微处理技术的发展,以及高科和微处理技术的发展,以及高科技应用领域对计算机和通信网络在计算、处技应用领域对计算机和通信网络在计算、处理和通信性能上不断提出理和通信性能上不断提出更高的要求更高的要求(极大的极大的处理数据量、异常复杂的运算、很不规则的处理数据量、异常复杂的运算、很不规则的数据结构、极高的处理速度数据结构、极高的处理速度),),使发展大规模使发展大规模的并行处理成了的并行处理成了2020世纪世纪8080年代中期计算机发年代中期计算机
14、发展的热点。展的热点。2022年12月16日星期五计算机系统结构21大规模并行处理机:大规模并行处理机:通过新的计算方法、存储技术、处理手通过新的计算方法、存储技术、处理手段和结构组织方式,将数百至数万个高性能、段和结构组织方式,将数百至数万个高性能、低成本的低成本的RISCRISC微处理器用专门的互连网络互微处理器用专门的互连网络互连,组成大规模并行处理机连,组成大规模并行处理机MPPMPP。这种处理机。这种处理机可进行中粒度和细粒度大规模并行处理,构可进行中粒度和细粒度大规模并行处理,构成成SIMDSIMD或或MIMDMIMD系统。系统。2022年12月16日星期五计算机系统结构22优点:
15、它具有性能价格比高和可扩展性好的优点。优点:它具有性能价格比高和可扩展性好的优点。如果一个如果一个RISCRISC微处理器的性能为微处理器的性能为100MFLOPS100MFLOPS,则,则10241024个这样的微处理器组搭成的个这样的微处理器组搭成的MPPMPP系统,其最高系统,其最高性能就可达性能就可达100GFLOPS100GFLOPS。这比用单一主处理机构成。这比用单一主处理机构成的巨型机的性能要高出许多倍,而造价可能只是它的巨型机的性能要高出许多倍,而造价可能只是它的的1/51/5。可扩展性好表现在能比较方便地增减结点。可扩展性好表现在能比较方便地增减结点处理器数,来使系统的规模、
16、处理速度、系统价格处理器数,来使系统的规模、处理速度、系统价格满足应用的需要。采用分布式存储器来减少访存冲满足应用的需要。采用分布式存储器来减少访存冲突。突。2022年12月16日星期五计算机系统结构23MPPMPP的系统软件:操作系统采用微内核和大外壳。的系统软件:操作系统采用微内核和大外壳。内核只提供中断处理、进程调度、进程间简单内核只提供中断处理、进程调度、进程间简单通信及其他最基本的功能,将大量的服务功能搬移通信及其他最基本的功能,将大量的服务功能搬移到内核之外。内核基本功能是同构的,对不同用户到内核之外。内核基本功能是同构的,对不同用户的不同服务需要,允许进行异构服务。的不同服务需要
17、,允许进行异构服务。为适应系统的开放性,采用客户为适应系统的开放性,采用客户/服务器模式。服务器模式。在进程通信上,由内核提供基本的通信,由服务层在进程通信上,由内核提供基本的通信,由服务层提供网络的通信。负荷平衡调度可有分配型、调整提供网络的通信。负荷平衡调度可有分配型、调整型和复合型等多种。型和复合型等多种。2022年12月16日星期五计算机系统结构248.2.2 8.2.2 机群系统机群系统 将多个高性能的工作站或高档微型计算机,使将多个高性能的工作站或高档微型计算机,使用高速的通信网络加以互连组成的系统。在并行程用高速的通信网络加以互连组成的系统。在并行程序设计和集成开发环境的支持下,
18、进行统一调度和序设计和集成开发环境的支持下,进行统一调度和协调处理,以实现对中、粗粒度并行进程的高效并协调处理,以实现对中、粗粒度并行进程的高效并行处理。行处理。机群系统中的主机和网络可以是同构的,也可机群系统中的主机和网络可以是同构的,也可以是异构的。主机间的通信主要采用消息传递。从以是异构的。主机间的通信主要采用消息传递。从结构和结点间的通信来看,是一种分布式存储方式,结构和结点间的通信来看,是一种分布式存储方式,而从用户来看,表示出的是一个完整的并行系统。而从用户来看,表示出的是一个完整的并行系统。2022年12月16日星期五计算机系统结构25机群系统比起传统的并行处理系统有几个明机群系
19、统比起传统的并行处理系统有几个明显优点。显优点。(1)(1)系统有高的性能价格比。系统有高的性能价格比。(2)(2)系统的开发周期短。系统的开发周期短。(3)(3)系统的可扩展性好。系统的可扩展性好。(4)(4)系统的资源利用率高。系统的资源利用率高。(5)(5)用户投资风险小。用户投资风险小。(6)(6)用户编程方便。用户编程方便。2022年12月16日星期五计算机系统结构268.3 8.3 数据流计算机数据流计算机8.3.18.3.1数据驱动的概念数据驱动的概念计数器控制驱动的控制流方式:计数器控制驱动的控制流方式:VonNeumann VonNeumann型计算机的基本特型计算机的基本特
20、点是在程序计数器集中控制下,顺次点是在程序计数器集中控制下,顺次地执行指令,因此,它是以控制流方地执行指令,因此,它是以控制流方式工作的。式工作的。2022年12月16日星期五计算机系统结构27特点:通过访问共享存储单元让数据在指令特点:通过访问共享存储单元让数据在指令之间传递;指令执行的顺序性隐含于控制流之间传递;指令执行的顺序性隐含于控制流中,但却可以显示使用专门的控制操作符来中,但却可以显示使用专门的控制操作符来实现并行处理;指令执行的顺序受程序计数实现并行处理;指令执行的顺序受程序计数器控制,即是受控制令牌所支配。器控制,即是受控制令牌所支配。2022年12月16日星期五计算机系统结构
21、28数据驱动的数据流方式:数据驱动的数据流方式:指的是只要一条或一组指令所要求的操作数全指的是只要一条或一组指令所要求的操作数全部准备就绪,就可立即激发相应的指令或指令组部准备就绪,就可立即激发相应的指令或指令组执行。执行结果的输出将送往等待这一数据的下执行。执行结果的输出将送往等待这一数据的下一条或下一组指令。如果其中一些指令因此而使一条或下一组指令。如果其中一些指令因此而使所需用到的数据全部准备就绪,就可被激发执行。所需用到的数据全部准备就绪,就可被激发执行。在这种机器上不需要程序计数器,指令的执行基在这种机器上不需要程序计数器,指令的执行基本上是无序的,完全受数据流的驱动,与指令在本上是
22、无序的,完全受数据流的驱动,与指令在程序中出现的先后顺序无关。程序中出现的先后顺序无关。2022年12月16日星期五计算机系统结构29特点:数据驱动的数据流方式没有通常的特点:数据驱动的数据流方式没有通常的共享变量的概念,即没有共享存储数据的共享变量的概念,即没有共享存储数据的概念;指令执行顺序只受指令中数据相关概念;指令执行顺序只受指令中数据相关性的制约;数据是以数据令牌方式直接在性的制约;数据是以数据令牌方式直接在指令之间传递的。指令之间传递的。2022年12月16日星期五计算机系统结构30数据令牌:实质上是一种表示某一操作数或数据令牌:实质上是一种表示某一操作数或参数已准备就绪的标志。一
23、旦执行某一操作参数已准备就绪的标志。一旦执行某一操作的所有操作数令牌都到齐,则标志着这一操的所有操作数令牌都到齐,则标志着这一操作是什么操作,以及操作结果所得出的数据作是什么操作,以及操作结果所得出的数据令牌应发送到哪些等待此数据令牌的操作的令牌应发送到哪些等待此数据令牌的操作的第几个操作数部件等有关信息,都将作为一第几个操作数部件等有关信息,都将作为一个消息包,传送到处理单元或操作部件并予个消息包,传送到处理单元或操作部件并予以执行。以执行。2022年12月16日星期五计算机系统结构31需求驱动的数据流方式:而需求驱动是按需求值,需求驱动的数据流方式:而需求驱动是按需求值,只有当某一函数需要
24、用到某一自变量时,才驱动对只有当某一函数需要用到某一自变量时,才驱动对该自变量的求值操作,是一种滞后求值的策略。需该自变量的求值操作,是一种滞后求值的策略。需求驱动计算,其操作则按数据需求所决定的次序进求驱动计算,其操作则按数据需求所决定的次序进行。行。数据驱动计算,其操作是按输入数据可用性决数据驱动计算,其操作是按输入数据可用性决定的次序进行;数据驱动计算只要所要求的输入数定的次序进行;数据驱动计算只要所要求的输入数据全部就绪,即可驱动操作执行,是一种提前求值据全部就绪,即可驱动操作执行,是一种提前求值的策略;的策略;2022年12月16日星期五计算机系统结构32 显然后者较之前者可以减少许
展开阅读全文