PCA课件 第二章 Intel PCA开发系统.ppt.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《PCA课件 第二章 Intel PCA开发系统.ppt.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PCA课件 第二章 Intel PCA开发系统.ppt PCA 课件 第二 开发 系统 ppt
- 资源描述:
-
1、第二章 Intel PCA开发系统 XScale 系统结构 PXA255 处理器结构与特性 基于XScale的PXA255 开发系统 2.1、 XScale 系统结构2.1.1 采用改进型哈佛结构CPUCPU程序存程序存储器储器操作 数操作 数存储器存储器地址总线地址总线数据总线数据总线其结构特点为:其结构特点为: 使用两个独立的存储器模块,分别存储指令和数据,每个使用两个独立的存储器模块,分别存储指令和数据,每个存储模块都不允许指令和数据并存,以便实现并行处理存储模块都不允许指令和数据并存,以便实现并行处理; 具有一条独立的地址总线和一条独立的数据总线,利用公具有一条独立的地址总线和一条独立
2、的数据总线,利用公用地址总线访问两个存储模块(程序存储模块和数据存储用地址总线访问两个存储模块(程序存储模块和数据存储模块),公用数据总线则被用来完成程序存储模块或数据模块),公用数据总线则被用来完成程序存储模块或数据存储模块存储模块与与CPU之间的数据传输之间的数据传输; 两条总线由程序存储器和数据存储器分时两条总线由程序存储器和数据存储器分时共用。共用。2.1.2 采用7级超级流水线PXA255拥有7级超级流水线,主要由主流水线、MAC流水线和内存访问流水线组成。五级流水线流水线技术 流水线是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。统水线要求所有的流水级部件必须在相同的
3、时间内完成各自的子过程,在流水线中指令流动一步是一个机器周期。机器周期的长度必须由最慢的流水级部件处理子过程所需的时间决定。指令流水线是将指令执行分成几个子过程,每一个子过程对应一个工位,我们称为流水级或流水节拍。指令流水执行特点:1、一条指令分成几个子过程,每个子过程为一个流水级。2、每个子过程由专门的硬件功能部件来完成。3、每个流水功能部件的工作时间是不相同的,流水节拍时间由最长的流水功能部件处理时间决定。4、流水线工作一般有三个阶段,即建立、稳态和排空阶段。5、理想情况下,在流水线处于稳态时,每一流水节拍时间都得到一条指令执行的结果,流水加速比就等于流水线的级数,即流水深度。 F1/F2
4、指令读取 ID指令译码 RF寄存器文件/移位级 X1执行级 X2执行级 XWB写回级PXA255主流水线MAC 流水线 执行所有的乘/累加指令,它执行40位累加寄存器acc0同时也能将指令值转化成普通的ARM寄存器值。MAC不是真正的一条流水线,指令的类型和资源均定它所需的周期数。不会同时两条指令出现在MAC 流水线上。当MAC 在处理一条指令的时候其它指令不允许进出到M1 中,除非原来的指令在下一个周期中处理完成。MAC单元执行开始于 M1,接受2个32位操作数,N个周期后完成并返回寄存器文件。内存访问流水线 内存流水线有D1、D2和DWB3级构成,独立完成指令的装载和存储。在执行完X1后开
5、始执行D1 级,计算有效的存/取地址。在D2 级数据Cache和小型数据cache返回目的数据,在DWB级进行填入缓冲器和写入缓冲器操作。2.1.3 XScale 乘/累加MAC MAC只需一个周期即完成乘只需一个周期即完成乘/累加操作;累加操作;MAC由由32位乘法和一个位乘法和一个CSA(Carry Save Adder)华莱士加法树()华莱士加法树(WT结构)构成,最后产结构)构成,最后产生生40位累加器位累加器CSA(Carry Save Adder)将本级进位传至下级将本级进位传至下级,求求和速度快和速度快,且速度与字长无关。在阵列乘法器中且速度与字长无关。在阵列乘法器中,CSA把把
6、PP阵列(被乘数与乘数中的某一位相乘阵列(被乘数与乘数中的某一位相乘, 产生一产生一组组PP)缩减至)缩减至Sum和和Carry两项两项,再用高速加法器求再用高速加法器求和得积。和得积。CSA加法器构成的乘法器(a)普通串行结构;(b) 华莱士压缩树 2.1.4 内存管理(MMU) 提供内存访问保护和虚拟地址到物理地址的映射 支持指令TLB和数据TLBTLB-Translation Lookaside Buffers, 地址变换后备缓冲器) 使用CP15协处理器来完成MMU 一般从虚拟地址到物理地址需2次主存,为减少主存接入代价, 就在虚拟地址和物理地址之间插入一个TLB。 一般每个存储器有一
7、个TLB,所以Xscale中有D TLB 和I TLB。 为了减少TLB的开销,TLB中只存放最近使用过的页表项,其淘汰替代算法采用循环法。 TLB增加了相应的锁操作。TLB-地址变换后备缓冲器2.1.5 Cache结构结构 XScale 的Cache有32KB I Cache和 D Cache、2 KB微小型I Cache 和D Cache有128入口的直接映像Cache结构的分支目标缓冲器BTB Xscale支持写回和写直通操作。 写回:命中Cache的存储操作不产生一个到外部存储器的写操作。它缓解了外部存储器压力。 写直通:所有的存储操作 都要写到外部存储器,它保持了外部存储器和Cach
8、e的一致性分支目标缓冲器(BTB) 2.1.6 Xscale性能检测性能检测(使用使用CP14协处理器协处理器)XScale的性能监测模块可以通过CP14的寄存器03进行控制 2个32位性能计数器,它可以分别对2个独立的事件同时进行计数;1个时钟计数器,记录内核时钟数,用来表示时间延迟 。 2.1.7 Xscale调试调试Xscale的JTAG调试方式 接收/发送控制寄存器(TXRXCTRL) RR位, 为1时RX准备好, 为0时无数据或不可用。OV位, 为1时RX溢出, 为0时无溢出。D位,该位为高速下载标志位。TR位,为1时TX准备好,为0时无数据或不可用。通用RX应答协议监听RR监听RR
9、若RR1,继续监听若RR1,继续监听RR0RR0写数据到RX写数据到RX监听RR监听RR若RR0,继续监听若RR0,继续监听RR1RR1从RX读数据从RX读数据置RR为1置RR为1置RR为0置RR为0调试程序调试程序TXRXCTRLTXRXCTRL调试代理程序调试代理程序 XScale 系统结构 PXA255 处理器结构与特性 基于XScale的PXA255 开发系统 Intel PXA255结构PXA255结构特点时钟和电源控制器存储器控制器:支持100MHz SDRAM DMA控制器:具有16个优先级通道 LCD控制器:支持被动和主动LCD显示 系统集成模块:包括GPIO、中断控制器、实时
10、时钟、PWM。 支持各种接口:I2S, I2C, 2路UART, IrDa, USB Client ,MMC, NSSP等2.2.1、时钟管理2.2.2 电源管理电源管理Turbo Mode: 在短时间内高速运行在短时间内高速运行. 快速方式的加速倍率有快速方式的加速倍率有CCCR寄存器寄存器N值决定值决定.Run Mode:正常工作方式正常工作方式 . Idle Mode: 停止停止CPU内核时钟,但仍继续监视片内外中断内核时钟,但仍继续监视片内外中断服务请求服务请求当发生允许中断时可唤醒当发生允许中断时可唤醒CPU,重新启动,重新启动CPU时钟时钟.nSleep Mode: CPU内核无电
11、源,仅内核无电源,仅RTC核电源管理器继续工核电源管理器继续工作。作。SDRAM置为自我刷新方式。置为自我刷新方式。 功耗最低功耗最低2.2.3、DMA控制器 共有16各通道,每个通道有4各32位寄存器控制 外设与存储器及存储器与存储器之间的传送 提供了两种操作模式: 非描述子接入方式: 主要用于轮询模式 描述子接入方式: 主要用于中断模式(更有效) 16个信道被分为四组,其优先级各不相同 每个外设都有一个或多个专用DMA请求线2.2.4、存储器控制器 SDRAM 最大100MHz存储器总线接口可与DRAM、SDRAM、ROM、SMROM、SRAM以及其它潜在的I/O器件共享数据信号 SDRA
12、M支持4个块,每块最大可为64MB。4个块又可分两对,每对中两个块大小和管理必须一样,不同对可以不一样。 静态存储器接口和潜在的可变速率I/O接口支持6个片选(CS5.0),每个片选可独立管理. 支持16位PC卡/Compact Flash接口2.2.5、LCD控制器 最大支持10241024,16bits 颜色的LCD Sitsang开发板使用的LCD是640480 支持被动(DSTN)和主动(TFT)显示模式 DSTN:扫描屏幕被分为上下两部分,CPU同时并行对这两部分进行刷新(双扫描),DSTN显示屏上每个像素点的亮度和对比度因不能独立控制,显示效果不佳。每个像素点不能自身发光,是无源像
13、点。 TFT:每个液晶像素点是由集成在像素点后面的薄膜晶体管来驱动,是有源像素点。lInterrupt controllerlGPIOlReal time clocklOS timerlPWM2.2.6、系统集成单元 Interrupt controller 提供22个中断源,各中断可设置为IRQ或FIQ, FIQ优先级高于IRQ 中断控制器分两级: 第一级包含中断屏蔽寄存器(ICMR)和中断状态寄存器(ICPR)。 第二级为该中断的源器件的寄存器。通常情况下多个二级中断可通过或操作产生一个一级中断。 GPIOGPIO可产生和捕捉输入和输出信号;很多GPIO有第二功能,可通过GAFR设置;GP
14、DR:设置GPIO脚的输出还是输入写GPIO(设置为输出脚):GPSR(H), GPCR(L)读GPIO (设置为输入脚): GPER和GFER用于设置上升/下降沿检测; GEDR用于读出GPIO跳变类型。实时时钟(RTC) RTC可设置产生1Hz输出的周期性信号。 可由RTC在预定时间产生中断或唤醒事件。 时钟由3.6864MHz振荡器产生;OS计数寄存器OSCR ,四个匹配寄存器OSMR3:0,状态寄存器OSSR,中断允许寄存器OIER 当OSCR与任一个OSMR值相同且允许中断时,将置位OSSR中的标志位。 PWM(脉冲宽度调制) 可产生两个独立的输出信号PWM0, PWM1 可通过相应
展开阅读全文