一章计算机体系结构的基本概念.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《一章计算机体系结构的基本概念.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机体系结构 基本概念
- 资源描述:
-
1、一章计算机体系结构的基本概念1.第一台通用电子计算机诞生于第一台通用电子计算机诞生于1946年年 18000个电子真空管个电子真空管 33万亿个晶体管万亿个晶体管 (18亿倍亿倍)800字节存储容量字节存储容量 4万亿字节万亿字节 (50亿倍亿倍)运算速度运算速度5000次次/秒秒 12.5万亿次万亿次/秒秒 (25亿倍亿倍)2.经历了经历了4个发展过程个发展过程 1.1 1.1 引论引论1.1 1.1 引论引论时时 间间原原 因因每年的性能每年的性能增长增长1946年起的年起的25年年 制造技术和体系结构的发制造技术和体系结构的发展展 25%20世纪世纪70年代年代末末80年代初年代初 大规
2、模集成电路和微处理大规模集成电路和微处理器出现器出现,以集成电路为代表以集成电路为代表的制造技术的发展的制造技术的发展 约约35%20世纪世纪80年代年代中开始中开始 RISC结构的出现,系统结结构的出现,系统结构不断更新和变革,制造构不断更新和变革,制造技术不断发展技术不断发展50%以上以上维持了约维持了约16年年 2002年以来年以来 更大规模集成电路技术的更大规模集成电路技术的发展为体系结构的发展尤发展为体系结构的发展尤其是并行化技术的发展提其是并行化技术的发展提供了空间供了空间约约20%4推动性能提高的主要因素:推动性能提高的主要因素:1)更高的主频更高的主频 器件工艺的进步器件工艺的
3、进步(Natural frequency growth)更深的流水线更深的流水线2)开发各个层次的并行性开发各个层次的并行性 指令级并行性指令级并行性 线程线程/进程级并行性进程级并行性 数据级并行性数据级并行性3)减少内存延迟减少内存延迟 大容量、高性能的片上多级大容量、高性能的片上多级Cache 及更成熟的先行控制、指令预取等技术及更成熟的先行控制、指令预取等技术指令的深度流水线指令的深度流水线乱序执行乱序执行超标量处理机超标量处理机分支预测及前瞻执行分支预测及前瞻执行1.1 1.1 引论引论 计算机技术的飞速发展得益于计算机技术的飞速发展得益于:计算机制造技术的发展计算机制造技术的发展
4、计算机系统结构的创新计算机系统结构的创新1.1 1.1 引论引论进一步发展面临的问题进一步发展面临的问题 主频主频指令级并行性指令级并行性 内存访问速度的内存访问速度的功耗问题功耗问题1.1 1.1 引论引论7微处理机的发展轨迹遵从摩尔定理:微处理机的发展轨迹遵从摩尔定理:Moores law:The number of transistors that can be placed inexpensively on an integrated circuit doubles approximately every two years.This trend has continued for m
5、ore than half a century and is expected to continue until at least 2015 or 20201.1 1.1 引论引论8晶体管尺寸的减小晶体管尺寸的减小速度的提高速度的提高连线尺寸的缩小连线尺寸的缩小传输距离传输距离缩小缩小更少的电更少的电荷能驱动荷能驱动从性能的角度来看:从性能的角度来看:.1.1 1.1 引论引论9摩尔定律有三种解释摩尔定律有三种解释:一种是集成电路芯片上所集成的电路的数目,每一种是集成电路芯片上所集成的电路的数目,每隔隔18个月就翻一番;个月就翻一番;第二种是微处理器的性能每隔第二种是微处理器的性能每隔18个
6、月提高一倍,个月提高一倍,而价格下降一半;而价格下降一半;第三种解释是用一个美元所能买到的电脑性能,第三种解释是用一个美元所能买到的电脑性能,每隔每隔18个月翻两番。个月翻两番。1.1 1.1 引论引论101)功耗问题功耗问题:晶体管尺寸的减小晶体管尺寸的减小速度的提高速度的提高数量的增加数量的增加电压的降低电压的降低线间距的缩小线间距的缩小功耗增加功耗增加功耗降低功耗降低连线尺寸的缩小连线尺寸的缩小电阻的增加电阻的增加功耗增加功耗增加漏电流的增加漏电流的增加可靠性下降可靠性下降功耗增加功耗增加功耗增加,功耗增加,Pentium 4 达到达到100w,平均平均0.5w/mm2功耗增加功耗增加1
7、.1 1.1 引论引论11Max Power(Watts)i386 i486 Pentium Pentium w/MMX tech.1101001.5m1.5m1m1m0.8m0.8m0.6m0.6m0.35m0.35m0.25m0.25m0.18m0.18m0.13m0.13m Pentium Pro Pentium II Pentium III 1.1 1.1 引论引论12应用中可利用的应用中可利用的ILP在在4 10 之间之间,目目前可达到的前可达到的ILP在在4 8 之间之间 进一步发展的空间并不是很大进一步发展的空间并不是很大1)2)实现过于复杂可能反而造成性能下降实现过于复杂可能反
8、而造成性能下降2)ILP(指令级并行指令级并行)问题问题:1.1 1.1 引论引论1.1 1.1 引论引论包含上亿个晶体管包含上亿个晶体管芯片复杂性芯片复杂性的不断提高的不断提高正确性验证非常困难正确性验证非常困难+体系结构的不断复杂化体系结构的不断复杂化研发、生产的成本不断提高研发、生产的成本不断提高3)复杂性问题复杂性问题:14 主频:主频:不可能无限提高不可能无限提高 散热:散热:主频每增加主频每增加1G,功耗将上升,功耗将上升25瓦,而在芯瓦,而在芯片功耗超过片功耗超过150瓦后,现有的风冷散热系统将无法满瓦后,现有的风冷散热系统将无法满足散热的需要足散热的需要 复杂度复杂度:英特尔的
9、奔腾:英特尔的奔腾(Pentium)四至尊版四至尊版840处理处理器,晶体管数量已经增加至器,晶体管数量已经增加至2.5亿个亿个 有效性:有效性:不到不到6%的晶体管用于计算的晶体管用于计算 1.2.1 计算机系统中的层次概念计算机系统中的层次概念1.计算机系统是计算机系统是软件硬件软件硬件/固件固件2.计算机语言由低级向高级发展。计算机语言由低级向高级发展。高一级语言的语句相对于低级语言功高一级语言的语句相对于低级语言功能更强,更便于应用,但又都以低级语言能更强,更便于应用,但又都以低级语言为基础。为基础。3.从计算机语言的角度,把计算机系统按功从计算机语言的角度,把计算机系统按功能划分成能
10、划分成多级层次结构多级层次结构。1.2 1.2 计算机体系结构的概念计算机体系结构的概念 第第 6 级级:应应 用用 语语 言言 虚虚 拟拟 机机 第第 5 级级:高高 级级 语语 言言 虚虚 拟拟 机机 第第 4 级级:汇汇 编编 语语 言言 虚虚 拟拟 机机 第第 3 3 级级:操操 作作 系系 统统 虚虚 拟拟 机机 第第 2 2 级级:机机 器器 语语 言言(传传 统统 机机 器器 级级)第第 1 1 级级:微微 程程 序序 机机 器器 级级 1.2 1.2 计算机体系结构的概念计算机体系结构的概念(1)虚拟机:虚拟机:由软件实现的机器由软件实现的机器。(2)语言实现的两种基本技术语言
11、实现的两种基本技术 翻译:翻译:先把先把N+1级程序全部变换成级程序全部变换成N级程序后,级程序后,再去执行新产生的再去执行新产生的N级程序,在执行过程中级程序,在执行过程中N+1 级程序不再被访问。级程序不再被访问。解释:解释:每当一条每当一条N+1级指令被译码后,就直接级指令被译码后,就直接 去执行一串等效的去执行一串等效的N级指令,然后再去取下一级指令,然后再去取下一 条条N+1级的指令,依此重复进行。级的指令,依此重复进行。解释执行比翻译花的时间多,但存储空间占用较少。解释执行比翻译花的时间多,但存储空间占用较少。1.2 1.2 计算机体系结构的概念计算机体系结构的概念1.2.2 计算
12、机体系结构的定义计算机体系结构的定义1.计算机体系结构:计算机体系结构:程序员所看到的计算机的属性,程序员所看到的计算机的属性,即即概念性结构概念性结构与与功能特性功能特性。2.按照计算机系统的多级层次结构,不同级程序按照计算机系统的多级层次结构,不同级程序 员所看到的计算机具有不同的属性。员所看到的计算机具有不同的属性。如低级语言程序员所看到的许多计算属性对高级语如低级语言程序员所看到的许多计算属性对高级语 言程序员透明言程序员透明透明性:透明性:在计算机技术中,对这种本来是存在的事物在计算机技术中,对这种本来是存在的事物或属性,但从某种角度看又好象不存在。或属性,但从某种角度看又好象不存在
13、。1.2 1.2 计算机体系结构的概念计算机体系结构的概念3.Amdahl 提出的体系结构:提出的体系结构:传统机器级的体系结构传统机器级的体系结构 即一般所说的机器语言程序员所看到的传统机器级即一般所说的机器语言程序员所看到的传统机器级所具有的属性。所具有的属性。5.对于通用寄存器型机器,这些属性主要是指:对于通用寄存器型机器,这些属性主要是指:指令系统指令系统 包括机器指令的操作类型和格式、指令间的包括机器指令的操作类型和格式、指令间的排序和控制机构等。排序和控制机构等。数据表示数据表示 硬件能直接识别和处理的数据类型。硬件能直接识别和处理的数据类型。寻址规则寻址规则 包括最小寻址单元、寻
14、址方式及其表示。包括最小寻址单元、寻址方式及其表示。1.2 1.2 计算机体系结构的概念计算机体系结构的概念 寄存器定义寄存器定义(包括各种寄存器的定义、数量和使用方式)(包括各种寄存器的定义、数量和使用方式)中断系统中断系统(中断的类型和中断响应硬件的功能等)(中断的类型和中断响应硬件的功能等)机器工作状态的定义和切换机器工作状态的定义和切换(如管态和目态等)(如管态和目态等)存储系统存储系统(主存容量、程序员可用的最大存储容量等)(主存容量、程序员可用的最大存储容量等)信息保护信息保护(包括信息保护方式和硬件对信息保护的支(包括信息保护方式和硬件对信息保护的支持)持)1.2 1.2 计算机
15、体系结构的概念计算机体系结构的概念 I/O结构结构包括包括I/O连结方式、处理机连结方式、处理机/存储器与存储器与I/O设备之设备之间数据传送的方式和格式以及间数据传送的方式和格式以及I/O操作的状态等操作的状态等经典计算机体系结构概念的实质:经典计算机体系结构概念的实质:计算机系统中软硬件界面的确定,其界面之上计算机系统中软硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。的是软件的功能,界面之下的是硬件和固件的功能。1.2 1.2 计算机体系结构的概念计算机体系结构的概念1.2.3 计算机组成和计算机实现技术计算机组成和计算机实现技术1.计算机组成:计算机组成:计算机
16、体系结构的逻辑实现。计算机体系结构的逻辑实现。2.计算机实现:计算机实现:计算机组成的物理实现。计算机组成的物理实现。计算机组成包括的内容可以有:计算机组成包括的内容可以有:处理机、主存等部件的逻辑结构,机器级内数据流和处理机、主存等部件的逻辑结构,机器级内数据流和控制流的组成、各部件的功能以及之间的联系等控制流的组成、各部件的功能以及之间的联系等。计算机实现包括的内容可以有:计算机实现包括的内容可以有:处理机、主存等部件的物理结构,包括器件的集成度处理机、主存等部件的物理结构,包括器件的集成度和速度的确定,器件、模块、插件、底板的划分与连和速度的确定,器件、模块、插件、底板的划分与连接,组装
17、装配技术及信号连接、电源、冷却方法等。接,组装装配技术及信号连接、电源、冷却方法等。1.2 1.2 计算机体系结构的概念计算机体系结构的概念体系结构与组成、实现之间的关系为:体系结构与组成、实现之间的关系为:体系结构是组成的抽象,组成是实现的抽象体系结构是组成的抽象,组成是实现的抽象一种体系结构可以有多种组成。一种体系结构可以有多种组成。一种组成可以有多种物理实现。一种组成可以有多种物理实现。广义的计算机体系结构概念包括体系结构的外部特性广义的计算机体系结构概念包括体系结构的外部特性和内部特性:和内部特性:1)计算机体系结构外部特性计算机体系结构外部特性-计算机体系结构的经典计算机体系结构的经
18、典定义定义2)计算机体系结构内部特性计算机体系结构内部特性-计算机组成与实现中一计算机组成与实现中一些比较抽象的内容些比较抽象的内容(微体系结构)(微体系结构)1.2 1.2 计算机体系结构的概念计算机体系结构的概念系列机系列机在一个厂家内生产的具有相同的体系结构在一个厂家内生产的具有相同的体系结构(经典定经典定义义),但具有不同组成和实现的一系列不同型号的机,但具有不同组成和实现的一系列不同型号的机器。器。如如 IBM 370系列有系列有370/115、125、135、145、158、168等一系列从低速到高速的各种型号等一系列从低速到高速的各种型号。相同点:相同点:程序员所看到的概念性结构
19、和功能属性程序员所看到的概念性结构和功能属性 指令系统一致指令系统一致不同点:不同点:组成和实现技术组成和实现技术 速度特性不一样速度特性不一样 1.2 1.2 计算机体系结构的概念计算机体系结构的概念1.2 1.2 计算机体系结构的概念计算机体系结构的概念1.2.4 计算机系统结构的分类计算机系统结构的分类常见的计算机系统结构分类法有两种:常见的计算机系统结构分类法有两种:Flynn分类法、冯氏分类法分类法、冯氏分类法1.2 1.2 计算机体系结构的概念计算机体系结构的概念冯氏分类法冯氏分类法用系统的最大并行度对计算机进行分类。用系统的最大并行度对计算机进行分类。最大并行度:最大并行度:计算
20、机系统在单位时间内能够处理计算机系统在单位时间内能够处理的最大的二进制位数。的最大的二进制位数。用平面直角坐标系中的一个点代表一个计算用平面直角坐标系中的一个点代表一个计算机系统,其横坐标表示字宽(机系统,其横坐标表示字宽(n位位),纵坐标),纵坐标表示一次能同时处理的字数(表示一次能同时处理的字数(m字字)。)。mn就表示了其最大并行度。就表示了其最大并行度。Flynn分类法分类法 按照指令流和数据流的多倍性进行分类。按照指令流和数据流的多倍性进行分类。指令流:指令流:计算机执行的指令序列。计算机执行的指令序列。1.2 1.2 计算机体系结构的概念计算机体系结构的概念数据流:数据流:由指令流
21、调用的数据序列。由指令流调用的数据序列。多倍性:多倍性:在系统受限的部件上,同时处于在系统受限的部件上,同时处于同一执行阶段的指令或数据的最大数目。同一执行阶段的指令或数据的最大数目。Flynn分类法把计算机系统的结构分为分类法把计算机系统的结构分为4类:类:单指令流单数据流单指令流单数据流(SISD)单指令流多数据流单指令流多数据流(SIMD)多指令流单数据流多指令流单数据流(MISD)多指令流多数据流多指令流多数据流(MIMD)4类计算机的基本结构类计算机的基本结构IS:指令流,:指令流,DS:数据流,:数据流,CS:控制流,:控制流,CU:控制部件,:控制部件,PU:处理部件,:处理部件
22、,MM和和SM:存储器。:存储器。CUPUMMISCSPU1PU2PUnPU1PU2PUnCU1CU2CUnCS1CS2CSnPU1PU2PUnCU1CU2CUnCS1CS2CSnMM1MM2MMmDSIS1IS2ISnSMDS(c)MISD 计计算算机机 DS1DS2DSnMM1MM2MMmSMIS1IS2ISn(d)MIMD 计计算算机机(a)SISD 计计算算机机 MM1MM2MMmSMCUDS1DS2DSnIS(b)SIMD 计计算算机机 CSDS1.3 1.3 定量分析技术定量分析技术4个定量原理:个定量原理:以经常性事件为重点以经常性事件为重点对经常发生的情况采用优化方法的原则进对
23、经常发生的情况采用优化方法的原则进行选择,以得到更多的总体上的改进。行选择,以得到更多的总体上的改进。优化优化是指分配更多的资源、达到更高的性是指分配更多的资源、达到更高的性能或者分配更多的电能等。能或者分配更多的电能等。1.3.1 计算机系统设计的定量原理计算机系统设计的定量原理1.3 1.3 定量分析技术定量分析技术Amdahl定律定律 加快某部件执行速度所能获得的系统性加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统能加速比,受限于该部件的执行时间占系统中总执行时间的百分比。中总执行时间的百分比。系统性能加速比:系统性能加速比:加速比加速比系统性能系统性能改进后改
24、进后系统性能系统性能改进前改进前总执行时间总执行时间改进前改进前总执行时间总执行时间改进后改进后 1.3 1.3 定量分析技术定量分析技术加速比依赖于两个因素加速比依赖于两个因素可改进比例:可改进比例:在改进前的系统中,可改进在改进前的系统中,可改进部分的执行时间在总的执行时间中所占的部分的执行时间在总的执行时间中所占的比例。它总是小于等于比例。它总是小于等于1 1。例如:例如:一个需运行一个需运行6060秒的程序中有秒的程序中有2020秒的运算可以加秒的运算可以加速,那么这个比例就是速,那么这个比例就是20/6020/60。部件加速比:部件加速比:可改进部分改进以后性能提可改进部分改进以后性
25、能提高的倍数。它是改进前所需的执行时间与高的倍数。它是改进前所需的执行时间与改进后执行时间的比。一般情况下部件加改进后执行时间的比。一般情况下部件加速比是大于速比是大于 1 1 的。的。例如:例如:若系统改进后,可改进部分的执行时间是若系统改进后,可改进部分的执行时间是2 2秒,秒,而改进前其执行时间为而改进前其执行时间为5 5秒,则部件加速比为秒,则部件加速比为5/25/2。1.3 1.3 定量分析技术定量分析技术改进后程序的总执行时间改进后程序的总执行时间总执行时间总执行时间改进后改进后 不可改进部分的执行时间不可改进部分的执行时间 可改进部分改进后的执行时间可改进部分改进后的执行时间总执
展开阅读全文