书签 分享 收藏 举报 版权申诉 / 40
上传文档赚钱

类型第2章2[1]2CPU的逻辑结构与原理课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4642755
  • 上传时间:2022-12-28
  • 格式:PPT
  • 页数:40
  • 大小:2.80MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第2章2[1]2CPU的逻辑结构与原理课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    CPU 逻辑 结构 原理 课件
    资源描述:

    1、2.2 CPU的逻辑结构的逻辑结构与工作原理与工作原理2.2.1 CPU的逻辑结构的逻辑结构 2.2.2 指令与指令系统指令与指令系统2.2.3 CPU的性能指标的性能指标22.2 CPU的逻辑结构与原理2.2.1 CPU的逻辑结构的逻辑结构32.2 CPU的逻辑结构与原理冯冯诺依曼计算机的结构与原理诺依曼计算机的结构与原理(1)计算机的工作由程序控制,程序是一个指令序列,指令是能被计计算机的工作由程序控制,程序是一个指令序列,指令是能被计算机理解和执行的操作命令;算机理解和执行的操作命令;(2)程序程序(指令指令)和数据均以二进制编码表示,均存放在存储器中和数据均以二进制编码表示,均存放在存

    2、储器中;(3)存储器中存放的指令和数据按地址进行存取存储器中存放的指令和数据按地址进行存取;(4)指令是由指令是由CPU一条一条顺序执行的。一条一条顺序执行的。中央中央处理器处理器运算器和控制器运算器和控制器输入设备输入设备输出设备输出设备存储器存储器42.2 CPU的逻辑结构与原理“存储程序控制存储程序控制”原理原理n将问题的解算步骤编制成为将问题的解算步骤编制成为程序程序,程序连同它所处理的数,程序连同它所处理的数据都用据都用二进位表示二进位表示并并预先预先存放在存储器存放在存储器中中n程序运行时,程序运行时,CPU从内存中一条一条地取出指令和相应的从内存中一条一条地取出指令和相应的数据,

    3、数据,按指令操作码的规定按指令操作码的规定,对数据进行运算处理,直到,对数据进行运算处理,直到程序执行完毕为止程序执行完毕为止 CPU从内存中逐条从内存中逐条读取该程序的指令及读取该程序的指令及相关的数据相关的数据将指令的运算处理将指令的运算处理结果送回内存保存结果送回内存保存任务完成后,将处任务完成后,将处理得到的全部结果成理得到的全部结果成批传送到外存以长久批传送到外存以长久保存保存外存储器外存储器内存储器内存储器CPU任务启动时,执行任务启动时,执行该任务的程序和数据该任务的程序和数据从外存成批传送到内从外存成批传送到内存存指令1指令2指令k指令n程序程序数据1数据2数据m数据数据CPU

    4、逐条逐条执行指令执行指令,按按指 令 要 求 完指 令 要 求 完成 对 数 据 的成 对 数 据 的运算和处理运算和处理52.2 CPU的逻辑结构与原理存储器存储器中央中央处理器处理器存储数据存储数据和指令和指令执行指令执行指令处理数据处理数据指令,数据指令,数据处理结果处理结果CPU的任务的任务nCPU的主要任务是执行指令,它按指令的规定对的主要任务是执行指令,它按指令的规定对数据进行操作数据进行操作62.2 CPU的逻辑结构与原理指令是什么?指令是什么?n指令就是命令,它用来规定指令就是命令,它用来规定CPU执行什么操作。指令是构执行什么操作。指令是构成程序的基本单位,程序是由一连串指令

    5、组成的成程序的基本单位,程序是由一连串指令组成的n指令采用二进位表示,大多数情况下,指令由两个部分组指令采用二进位表示,大多数情况下,指令由两个部分组成:成:操作码操作码操操 作作 数数 地地 址址指出CPU应执行何种操作的一个命令词,例如加、减、乘、除、取数、存数等 指出该指令所操作(处理)的数据或者数据所在位置 举例举例:10 02 06把把02存储单元和存储单元和06存储单元中的内存储单元中的内容相加,和数保存在容相加,和数保存在02单元单元72.2 CPU的逻辑结构与原理CPU的结构和任务的结构和任务nCPU主要由运算器、控制器和寄存器组主要由运算器、控制器和寄存器组3个部分组成个部分

    6、组成nCPU的任务:取指令并完成指令所规定的操作的任务:取指令并完成指令所规定的操作寄寄存存器器组组运运算算器器中央处理器中央处理器指令计数器指令计数器指令寄存器指令寄存器控制器数数 据据程序程序指令指令1指令指令2指令指令k指令指令n数据数据1数据数据2数据数据m数据数据内存储器内存储器指指 令令 指令地址指令地址 操作数地址操作数地址存放待执行存放待执行指令的地址指令的地址已经启动运已经启动运行的程序和行的程序和数据数据存放待执行的存放待执行的指令并进行译指令并进行译码码完成规定的运完成规定的运算算暂存等待处暂存等待处理的数据理的数据操作命令操作命令82.2 CPU的逻辑结构与原理内存储器

    7、内存储器AC927BALU0 1 2 3 4 5 6 7运算器运算器(ALU)与通用寄存器与通用寄存器(GPR)n运算器用来对数据进行各种算术或逻辑运算,所以称为算术逻运算器用来对数据进行各种算术或逻辑运算,所以称为算术逻辑部件辑部件(ALU),参加参加ALU运算的操作数通常来自通用寄存器运算的操作数通常来自通用寄存器GPR,运算结果也送回运算结果也送回GPRSTORER1内存地址内存地址C例例3:存数指令:存数指令9例例2:加法指令:加法指令ADDR1R3R5(3寄存器内容与寄存器内容与5寄存器内容相寄存器内容相加,并把和数写入加,并把和数写入1寄存器寄存器)例例1:取数指令取数指令LOAD

    8、R3内存地址内存地址ALOADR5内存地址内存地址B27362793636通用寄存器通用寄存器GPR92.2 CPU的逻辑结构与原理2.2.2 指令与指令系统指令与指令系统instruction setsoftwarehardware102.2 CPU的逻辑结构与原理指令及其格式指令及其格式n指令采用二进位表示,大多数情况下由两个部分组成:指令采用二进位表示,大多数情况下由两个部分组成:操作码操作码操操 作作 数数 地地 址址指出指出CPU应执行何种操作的一个命应执行何种操作的一个命令词,例如加、减、乘、除等令词,例如加、减、乘、除等 指出该指令所操作指出该指令所操作(处理处理)的的数据或者数

    9、据所在位置数据或者数据所在位置 n指令的格式:指令的格式:n操作码用几位表示?操作码用几位表示?(多少种不同的操作功能多少种不同的操作功能)n操作数地址是操作数地址是2个还是个还是3个?个?nR1R3+R5 nR1R1-R3 n如何指出内存地址?如何指出内存地址?(寻址方式寻址方式)n指令长度是多少位,固定长度指令长度是多少位,固定长度/可变长度?可变长度?ADDR1R3R5SUBR1R3112.2 CPU的逻辑结构与原理n1.操作码用几位表示?操作码用几位表示?n(有多少种不同的操作功能,采用不同的二进制数有多少种不同的操作功能,采用不同的二进制数)n如:加减如:加减2种功能,可采用一位种功

    10、能,可采用一位0,1;n 加减乘除加减乘除4种功能,可采用种功能,可采用2位位00,01,10,11;n 依此类推依此类推n操作数地址是操作数地址是2个还是个还是3个?个?从从0个地址到个地址到3个地址都有个地址都有n零地址指令,如零地址指令,如NOP,CLRn一地址指令,如一地址指令,如INR R1n二地址指令,如二地址指令,如ADD R1,R2n三地址指令,如三地址指令,如ADD R1,R2,R3n如何指出内存地址?如何指出内存地址?(寻址方式寻址方式)隐含方式,立即方式,寄存器方式,隐含方式,立即方式,寄存器方式,直接寻址,间接寻址,相对寻址,直接寻址,间接寻址,相对寻址,变址和基址寻址

    11、变址和基址寻址,复合寻址,复合寻址n指令长度是多少位,固定长度指令长度是多少位,固定长度/可变长度?可变长度?16,32,64.122.2 CPU的逻辑结构与原理指令在计算机中的执行过程指令在计算机中的执行过程1.取指令取指令:CPU的控制器从的控制器从存储器读取一条指令并放存储器读取一条指令并放入指令寄存器入指令寄存器2.指令译码指令译码:指令寄存器中:指令寄存器中的指令经过译码,决定该的指令经过译码,决定该指令应进行何种操作、操指令应进行何种操作、操作数在哪里作数在哪里3.执行指令执行指令3.1 取操作数取操作数3.2 进行运算进行运算4.修改指令计数器修改指令计数器,决定下,决定下一条指

    12、令的地址一条指令的地址1 取指令取指令4 修改指修改指令计数器令计数器3 执行指令执行指令2 指令译码指令译码指令执行周期指令执行周期问题:问题:CPU的时钟频率的时钟频率(主频主频)与指令执行速度是什么关系?与指令执行速度是什么关系?132.2 CPU的逻辑结构与原理指令执行过程的模拟指令执行过程的模拟模拟程序模拟程序1 (flash动画,单步)动画,单步)模拟程序模拟程序2 (flash动画,自动)动画,自动)142.2 CPU的逻辑结构与原理关于指令系统关于指令系统nCPU可执行的全部指令称为该可执行的全部指令称为该CPU的指令系统,的指令系统,即它的机器语言即它的机器语言n指令应该简单

    13、,简单才能提高速度指令应该简单,简单才能提高速度!1.操作功能要简单,不宜太多、太复杂操作功能要简单,不宜太多、太复杂2.指令的格式要统一:指令的格式要统一:固定长度、统一分段固定长度、统一分段3.操作数的来源要有限制:操作数的来源要有限制:n算术逻辑运算指令的操作数只能来自寄存器算术逻辑运算指令的操作数只能来自寄存器nLOAD/STORE指令的操作数来自指令的操作数来自(或送到或送到)内存内存寄存器寄存器内存内存 内存内存寄存器寄存器nIntel 奔腾处理器的指令系统由于历史的原因,并奔腾处理器的指令系统由于历史的原因,并不符合上述原则!不符合上述原则!152.2 CPU的逻辑结构与原理关于

    14、指令的操作功能关于指令的操作功能n指令系统中的指令分成许多类,例如指令系统中的指令分成许多类,例如奔腾奔腾4处理器处理器中共有七大类指令中共有七大类指令:n数据传送类数据传送类 算术运算类算术运算类n逻辑运算类逻辑运算类 移位操作类移位操作类n位位(位串位串)操作类操作类 控制转移类控制转移类n输入输入/输出类等输出类等n每一类指令(如数据传送类、算术运算类)又按照每一类指令(如数据传送类、算术运算类)又按照操作数的性质(如整数还是实数)、长度(操作数的性质(如整数还是实数)、长度(16位、位、32位、位、64位、位、128位等)而区分为许多不同的指令,位等)而区分为许多不同的指令,因此因此C

    15、PU往往有数以百计的不同的指令往往有数以百计的不同的指令162.2 CPU的逻辑结构与原理关于奔腾关于奔腾4系列的指令系统系列的指令系统n产品发展过程为:产品发展过程为:8088(8086)80286 8038680486 PentiumPentium PROPentium II Pentium III Pentium 4 奔腾奔腾D奔腾至尊奔腾至尊酷睿酷睿酷睿酷睿2n为解决软件兼容性问题,采用为解决软件兼容性问题,采用“向下兼容方式向下兼容方式”开发新的处理开发新的处理器,即所有新处理器均保留老处理器的全部指令,同时还扩充器,即所有新处理器均保留老处理器的全部指令,同时还扩充功能更强的新指令

    16、。例如:功能更强的新指令。例如:nPentium比比80386增加了的增加了的80多条浮点指令,多条浮点指令,nPentium II比比Pentium增加了增加了50多条处理多媒体信息的指令多条处理多媒体信息的指令(Multimedia Extension,称为称为MMX),),nPentium III比比Pentium II增加了增加了70条处理条处理128位长操作数的流式单位长操作数的流式单指令多数据指令指令多数据指令(Streaming SIMD Extention,SSE)nPentium 4又比又比Pentium III 增加了增加了144条指令(称为条指令(称为SSE2)n奔腾奔腾

    17、D、奔腾至尊、酷睿奔腾至尊、酷睿2等又增加了等又增加了13条条SSE3指令指令172.2 CPU的逻辑结构与原理关于关于CPU的兼容性的兼容性n不同公司生产不同的不同公司生产不同的CPU产品:产品:nIntel公司:公司:Pentium系列、赛扬系列系列、赛扬系列、至强等、至强等nAMD公司:独龙、闪龙、炫龙等公司:独龙、闪龙、炫龙等nIBM公司:公司:Power5、Power6等(苹果的等(苹果的Macintosh使用)使用)nSUN公司:公司:Ultra SPARC处理器处理器nHP公司:公司:PA-RISC、Itanium 处理器处理器n同一公司同一系列的同一公司同一系列的CPU具有向下

    18、(前)兼容性:具有向下(前)兼容性:nA计算机(使用新型号计算机(使用新型号CPU)的程序不能在)的程序不能在B计算机(使用老型号计算机(使用老型号CPU)上运行,上运行,B计算机的程序却能在计算机的程序却能在A计算机上运行计算机上运行n不同公司的不同不同公司的不同CPU产品其指令系统不同,它们互相不兼容:产品其指令系统不同,它们互相不兼容:nA计算机的程序不能在计算机的程序不能在B计算机上直接运行,计算机上直接运行,B计算机的程序也不能在计算机的程序也不能在A计算机上直接运行计算机上直接运行互相兼容互相兼容182.2 CPU的逻辑结构与原理2.2.3 CPU的性能指标的性能指标192.2 C

    19、PU的逻辑结构与原理如何衡量如何衡量CPU的性能?的性能?n计算机的性能主要表现在程序执行速度的快慢,计算机的性能主要表现在程序执行速度的快慢,它由许多因素决定,例如它由许多因素决定,例如CPU、内存、硬盘、显、内存、硬盘、显卡等,但通常卡等,但通常CPU是主要因素是主要因素nCPU性能高低的主要指标是性能高低的主要指标是CPU的速度的速度,有,有2种种衡量方法:衡量方法:1.计算每秒钟可执行的指令数目(单位:计算每秒钟可执行的指令数目(单位:MIPS、MFLOPS)2.使用常用软件(办公软件、数字媒体处理软件和使用常用软件(办公软件、数字媒体处理软件和3D游戏等)的运行速度来衡量游戏等)的运

    20、行速度来衡量CPU的性能的性能 202.2 CPU的逻辑结构与原理影响影响CPU性能的主要因素性能的主要因素(之一之一)nCPU的字长(位数)的字长(位数)n目前目前PC使用的使用的CPU大多是大多是32位处理器,新一代的位处理器,新一代的PC机将使用机将使用64位处理器位处理器n主频(主频(CPU时钟频率)时钟频率)n主频提高,主频提高,CPU的处理速度通常也会加快的处理速度通常也会加快nCPU总线(前端总线)的速度总线(前端总线)的速度nCPU总线速度决定了总线速度决定了CPU与内存间数据传输速度的快与内存间数据传输速度的快慢慢n高速缓存(高速缓存(cache)的容量与结构)的容量与结构n

    21、cache容量越大、级数越多,其效用就越显著容量越大、级数越多,其效用就越显著 212.2 CPU的逻辑结构与原理影响影响CPU性能的主要因素性能的主要因素(之二之二)nCPU的指令系统的指令系统n指令的格式和功能会影响程序的执行速度指令的格式和功能会影响程序的执行速度nCPU的逻辑结构的逻辑结构nCPU包含的定点运算器和浮点运算器数目包含的定点运算器和浮点运算器数目n是否流水线结构,流水线的条数和级数是否流水线结构,流水线的条数和级数n有无指令预测和数据预测功能有无指令预测和数据预测功能n是否具有数字信号处理功能是否具有数字信号处理功能n是否多核,有几个内核是否多核,有几个内核n222.2

    22、CPU的逻辑结构与原理Pipelining and Parallel ProcessingInstructionsResults aresequenced1.指令排队等指令排队等候进入候进入CPU处处理理并行处理并行处理提高计算机速度的有效途经提高计算机速度的有效途经3.每个每个CPU负负责完成分配给责完成分配给它的指令它的指令2.哪一个哪一个CPU空闲,就把等空闲,就把等候的指令交给候的指令交给它执行它执行(包含包含3个内核个内核)232.2 CPU的逻辑结构与原理Intel 微处理器主要技术参数比较微处理器主要技术参数比较 处理器处理器主要参数主要参数8086802868038680486

    23、奔腾奔腾高能奔腾高能奔腾奔腾奔腾奔腾奔腾奔腾奔腾4酷睿酷睿2(双核双核)酷睿酷睿2(四核四核)推出时间推出时间(年年)197819821985198919931996199519971997199819992003200020062007主频主频(MHz)4.7710620163333100 602001502002333334501400150038001800316024002830前端总线频前端总线频率率(MHz)4.7710620163325或或3350或或666666100或或133400,533或或800,10668001333 1066,1333外部数据线外部数据线数目数目161

    24、6323264646464646464地址线数目地址线数目2024323232363636363636L2 cache容容量量无无无无无无仅仅L1仅仅L10.25MB0.5MB0.5MB0.252MB26MB612MB内核数目内核数目11111111124晶体管数目晶体管数目(万万)2.913.427.51203105507509504200291004100082000制造工艺制造工艺(m)21.51.51.01.00.80.80.350.60.350.350.250.250.130.130.090.065,0.0450.065,0.045芯片引脚数芯片引脚数目目,4068132168273

    25、或或296387242370478或或775775775242.2 CPU的逻辑结构与原理附:附:Pentium4的逻辑结构的逻辑结构寄存器组与寄存器组与CPU字长字长超标量结构超标量结构ALU流水线处理技术流水线处理技术SIMD技术技术EM-64T超线程技术超线程技术双核与多核技术双核与多核技术252.2 CPU的逻辑结构与原理Pentium 4 处理器的逻辑结构处理器的逻辑结构 指令译码器指令译码器整整 数数 寄寄 存存 器器 组组L2cache(48GB/s)L1数据数据cache(8KB)浮浮 点点 寄寄 存存 器器 组组慢慢ALU复杂指令复杂指令2xALU简单指令简单指令2xALU简

    26、单指令简单指令2xAGU存地址存地址浮点存浮点存浮浮 点点 取取2xAGU取地址取地址MMXSSE/SSE2浮点加浮点加浮点乘浮点乘浮点除浮点除跟踪跟踪cache分支预测器分支预测器执行跟踪执行跟踪cache(12000微操作微操作)微码微码ROM微操作队列微操作队列微操作队列微操作队列指令预取部件指令预取部件动态分支预测器动态分支预测器前前端端总总线线256位,时钟频率位,时钟频率64位位,时钟频率时钟频率总线总线接口部件接口部件预取预取控制逻辑控制逻辑总线接口总线接口运算器运算器寄存器组寄存器组控制器控制器262.2 CPU的逻辑结构与原理Pentium 4 处理器的芯片布局处理器的芯片布

    27、局L1数据数据cacheL2 cacheTrace cache(L1指令指令cache)浮点运算器浮点运算器MMX超级流水线超级流水线技术技术前端总线前端总线及其接口及其接口定点运算器定点运算器高级动态执行高级动态执行272.2 CPU的逻辑结构与原理Pentium 4 的的寄存器组寄存器组整数寄存器组整数寄存器组P4 Pentium 80486 80386 8086 8088浮点寄存器组浮点寄存器组指令计数器指令计数器标志寄存器标志寄存器282.2 CPU的逻辑结构与原理Pentium 4的超标量结构运算器的超标量结构运算器n采用超标量(采用超标量(superscalar)结构,一共包含)结

    28、构,一共包含9个个ALU,均可同时工作:,均可同时工作:n2个高速整数个高速整数ALU(每个时钟周期进行每个时钟周期进行2次操作次操作),用于完成简单的整数运算用于完成简单的整数运算(如加、减法如加、减法)n1个慢速整数个慢速整数ALU(需要多个时钟周期才能完成需要多个时钟周期才能完成1次操作次操作),用于完成整数乘、除法运算,用于完成整数乘、除法运算n2个地址生成部件(个地址生成部件(AGU),用于计算操作数的有效地址,所生成的地址分别用于从内),用于计算操作数的有效地址,所生成的地址分别用于从内存取操作数或向内存保存操作结果存取操作数或向内存保存操作结果n1个个ALU用于完成浮点操作数地址

    29、的计算用于完成浮点操作数地址的计算n1个个ALU用于完成浮点加法、乘法和除法运算用于完成浮点加法、乘法和除法运算n1个个ALU用于执行流式的用于执行流式的SIMD处理(处理(SSE/SSE2/SSE3指令)指令)n1个个ALU用于完成多媒体信号处理(用于完成多媒体信号处理(MMX指令)指令)整整 数数 寄寄 存存 器器 组组 L1数据数据cache(8KB)浮浮 点点 寄寄 存存 器器 组组慢慢ALU复杂复杂指令指令2xALU2xALU简单简单指令指令2xAGU存地址存地址浮点浮点 存存浮浮 点点 取取2xAGU取地址取地址MMXSSESSE2SSE3浮点加、减、浮点加、减、乘、除等运乘、除等

    30、运算算简单简单指令指令292.2 CPU的逻辑结构与原理TT0 T1 T2 T3 T4 T5 T6 T7 T8 T9I6I5I4I3指令的流水线执行指令的流水线执行指令指令1(I1)指令指令2(I2)指令指令3(I3)I2指令的顺序执行:指令的顺序执行:I1指令的流水线执行:指令的流水线执行:Pentium 4的流水线分成的流水线分成20级,每一级的操作都很简单级,每一级的操作都很简单,执行速度极快,因而允许时执行速度极快,因而允许时钟频率高达钟频率高达1GHz以上以上302.2 CPU的逻辑结构与原理超流水线超流水线(Hyper-pipeline)技术技术nPentium 4有多条超流水线,

    31、每有多条超流水线,每条流水线的级数均很长,定点运条流水线的级数均很长,定点运算达算达20级,浮点运算达到级,浮点运算达到29级,级,处于执行状态的指令数最多可达处于执行状态的指令数最多可达到到126条条整数寄存器组整数寄存器组浮点数寄存器组浮点数寄存器组n超级流水线中每步操作都非常简单,因此主频可以显著提高超级流水线中每步操作都非常简单,因此主频可以显著提高 取指阶段取指阶段译码阶段译码阶段执行阶段执行阶段保存结果保存结果,修改修改IPn Pentium 4 的的20级级超流水线结构的示意图:超流水线结构的示意图:312.2 CPU的逻辑结构与原理指令流水线的效果指令流水线的效果AddAddA

    32、ddAddAddDivSubMulAddSubAddCPU流水线会阻塞吗?流水线会阻塞吗?如何确保指令流水线通畅?如何确保指令流水线通畅?运算运算结果结果LOAD R1,BLOAD R2,CLOAD R3,DADD R2,R1LOAD R4,ESTORE R2,ASUB R4,R3调整后调整后:LOAD R1,BLOAD R2,CADD R2,R1STORE R2,ALOAD R3,DLOAD R4,ESUB R4,R3例例:a=b+c;e=e-d;假设假设a,b,c,d,e分分别存储在地址为别存储在地址为A,B,C,D,E的单的单元中元中322.2 CPU的逻辑结构与原理指令预取和分支预测指

    33、令预取和分支预测n为了使流水线不中断,指令预取部件用于完成指令地址的计算,为了使流水线不中断,指令预取部件用于完成指令地址的计算,并从指令并从指令 cache中读取指令(一次中读取指令(一次64位),它还通过动态分位),它还通过动态分支预测器对即将执行的指令提前进行预取,如果预测发生错误,支预测器对即将执行的指令提前进行预取,如果预测发生错误,那么流水线就会中断,那么流水线就会中断,CPU的速度将会受到影响的速度将会受到影响 指令指令cache及指令预取部件及指令预取部件动态分支预测器动态分支预测器指令译码器指令译码器跟踪跟踪cache分支预测器分支预测器执行跟踪执行跟踪cache(12000

    34、微操作微操作)微码微码ROM控制整数控制整数ALU的微操作队列的微操作队列控制浮点控制浮点ALU的微操作队列的微操作队列A=A+2;If(A10)B=A;332.2 CPU的逻辑结构与原理MMX/SSE/SSE2/SSE3指令指令n所谓所谓SSE指令,其特点是指令,其特点是1条指令可处理条指令可处理128位的数据,它可位的数据,它可以是下列情况之一:以是下列情况之一:4个单精度浮点数个单精度浮点数(各各32位位)2个双精度浮点数个双精度浮点数(各各64位位)16个个8位整数位整数8个个16位整数位整数4个个32位整数位整数2个个64位整数位整数1个个128整数整数n由于一条指令可以处理若干个整

    35、数或浮点数,因而大大提高了由于一条指令可以处理若干个整数或浮点数,因而大大提高了计算速度,这种做法称为单指令多数据技术(计算速度,这种做法称为单指令多数据技术(single-instruction,multiple-data,简称,简称SIMD)nSSE/SSE2/SSE3指令在完成指令在完成3D图形、语音识别、图像处理等图形、语音识别、图像处理等多媒体应用的时候非常有效多媒体应用的时候非常有效 342.2 CPU的逻辑结构与原理SSE指令的指令的SIMD操作举例操作举例xmm0 xmm1指令:指令:addps xmm0,xmm1+(1次完成4个单精度浮点数相加个单精度浮点数相加)xmm0 x

    36、mm1指令:指令:addpd xmm0,xmm1+(1次完成2个双精度浮点数相加个双精度浮点数相加)352.2 CPU的逻辑结构与原理为什么需要为什么需要64位计算?位计算?n原因:原因:n可以进行更大范围的整数运算可以进行更大范围的整数运算n可以支持更大的内存可以支持更大的内存 n进行进行64位计算的条件:位计算的条件:n64位的处理器位的处理器n64位的操作系统位的操作系统(如如 Windows XP X64,Windows Vista)n64位的应用软件位的应用软件 n产品:产品:nRISC(UltraSparc、IBM公司的公司的POWER5、HP公司的公司的Alpha)nIntel

    37、安腾处理器安腾处理器(Itanium 和和 Itanium 2)nAMD64(Athlon 64系列、系列、Athlon FX系列和系列和Opteron系列系列)nIntel EM-64T(Extended Memory 64 Technology)n至强至强(Xeon)系列、系列、Pentium 4 6xx系列系列 和和 Pentium D系列、系列、P4 至尊版至尊版 362.2 CPU的逻辑结构与原理Pentium的的64位扩展技术位扩展技术(EM-64T)整整 数数 寄寄 存存 器器 组组P4 Pentium 80386 80486 8086 8088指令计数器指令计数器标志寄存器标志

    38、寄存器64位处位处理器的理器的整数寄整数寄存器组存器组 共共16个个64位寄存器,另外位寄存器,另外还增加还增加8个个128位的位的SSE寄存器寄存器 增加了处理增加了处理64位整数的指令位整数的指令 支持支持c语言中的语言中的“long int”数据类型,对应的是数据类型,对应的是64位整数位整数Pentium 4 的的64位寄存器组位寄存器组372.2 CPU的逻辑结构与原理超线程超线程(Hyper-Threading,HT)技术技术n背景:背景:n实际应用中实际应用中CPU的执行单元没有被充分使用,性能未得到充分发挥的执行单元没有被充分使用,性能未得到充分发挥n超线程超线程(HT)技术:

    39、把硬件模拟成两个处理器芯片,从技术:把硬件模拟成两个处理器芯片,从OS来看就像有两个来看就像有两个CPU一样,可同时执行一样,可同时执行2个线程个线程nP4处理器增加了一个逻辑处理器增加了一个逻辑CPU指针,而整数运算单元、浮点运算单元、指针,而整数运算单元、浮点运算单元、L2 Cache等均由等均由2个线程共享个线程共享n处理器有两种运行模式:处理器有两种运行模式:nSingle Task Mode(单任务模式):系统只有(单任务模式):系统只有1个逻辑处理器个逻辑处理器nMulti Task Mode(多任务模式):系统有(多任务模式):系统有2个逻辑处理器个逻辑处理器n分析:分析:n由于

    40、不是由于不是2个真正的个真正的CPU,它们需要共享,它们需要共享ALU、cache等资源,当两个线程等资源,当两个线程同时需要使用某个资源时,一个线程必须暂停运行,直到该资源空闲后才能同时需要使用某个资源时,一个线程必须暂停运行,直到该资源空闲后才能继续执行。因此超线程的性能达不到继续执行。因此超线程的性能达不到2个物理个物理CPU的性能的性能n超线程技术需要芯片组、超线程技术需要芯片组、OS和应用软件支持,才能发挥该项技术的优势,和应用软件支持,才能发挥该项技术的优势,Windows2000就不支持双线程就不支持双线程 n当运行单线程应用软件时,超线程技术甚至会降低系统性能当运行单线程应用软

    41、件时,超线程技术甚至会降低系统性能382.2 CPU的逻辑结构与原理双核处理器出现的背景双核处理器出现的背景n提高主频来提升处理器性能的瓶颈是散热问题:提高主频来提升处理器性能的瓶颈是散热问题:n3.2GHz 的的Pentium 4处理器功率超过处理器功率超过100W,内核,内核温度达摄氏温度达摄氏70度度n提升到提升到4.0GHz时功率会达到时功率会达到150W,散热问题更难,散热问题更难处理处理n超线程技术虽然可以提高执行部件的使用效率,超线程技术虽然可以提高执行部件的使用效率,但有一定开销,对于单线程的软件反而降低了效但有一定开销,对于单线程的软件反而降低了效率率n集成电路制造及封装技术

    42、的进步,有能力把集成电路制造及封装技术的进步,有能力把2个甚个甚至更多个处理器做在至更多个处理器做在1个芯片内个芯片内392.2 CPU的逻辑结构与原理双核处理器双核处理器n1个芯片中有两个功能相同的处理器个芯片中有两个功能相同的处理器(内核内核),在操,在操作系统看来,系统中有作系统看来,系统中有2个个CPU n2个内核可以各有自己的个内核可以各有自己的L2 cache,但必须保正其,但必须保正其中的信息完全一致,否则就会出现运算错误中的信息完全一致,否则就会出现运算错误(由由955X芯片组中北桥芯片负责芯片组中北桥芯片负责),也可以共享同一个,也可以共享同一个L2 cachen用途:面向计

    43、算密集型应用和娱乐发烧友用途:面向计算密集型应用和娱乐发烧友 n产品:产品:nPentium D(不支持超线程技术不支持超线程技术)nPentium Extreme Edition(至尊版至尊版)支持支持HT,最多可作为最多可作为4个处理器用个处理器用n酷睿酷睿(Core Duo)双核处理器双核处理器(嵌入式应用和嵌入式应用和笔记本笔记本):不支持:不支持HT和和64位扩展位扩展n酷睿酷睿2(Core 2 Duo)双核处理器:支持双核处理器:支持EM64T揭开外壳后的揭开外壳后的Pentium D处理器处理器独立独立cache共享共享cache402.2 CPU的逻辑结构与原理小结:小结:Pe

    44、ntium4提高速度的措施提高速度的措施n扩展扩展CPU的字长:的字长:64位存储扩展位存储扩展n提高提高CPU的主频:已经从的主频:已经从1.5GHz逐步提高到逐步提高到3GHz以上,目前最高已经接以上,目前最高已经接近近4GHz;n加快加快CPU前端总线的数据传输速度:前端总线的数据传输速度:nCPU总线宽度增加为总线宽度增加为64128位位nCPU总线频率从总线频率从400MHz、533 MHz提高到提高到800MHz和和1066MHzn因此,传输速率也相应地从因此,传输速率也相应地从3.2GB/s、4.3GB/s提高到提高到6.4GB/s和和8.6GB/sn采用采用cache存储器存储器n增大增大cache容量:容量:L2 cache的容量从的容量从256KB也已经增大为也已经增大为1MB或或2MBn增加增加cache的级数:有些处理器采用的级数:有些处理器采用L3 cachen采用超标量运算器结构和超流水线技术采用超标量运算器结构和超流水线技术n提供和支持向量运算指令(提供和支持向量运算指令(SIMD指令)指令)n采用超线程技术,提高执行部件的工作效率采用超线程技术,提高执行部件的工作效率n采用双采用双(多多)核处理器技术核处理器技术

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第2章2[1]2CPU的逻辑结构与原理课件.ppt
    链接地址:https://www.163wenku.com/p-4642755.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库