新型多核网络处理器-PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《新型多核网络处理器-PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新型 多核 网络 处理器 PPT 课件
- 资源描述:
-
1、新型多核网络处理器主要参考文献pAdvanced Processor with System on a Chip Interconnect Technology.patentstorm.us p思科QuantumFlow处理器及其战略研究。tektalk。研发背景p今天的网络要求越来越高的带宽和越来越复杂的数据包处理:n链路带宽迅速提高(增长速度高于CPU性能的提升速度)n新的业务大量涌现(音/视频通信、P2P业务等),要求网络设备具备快速的业务升级能力。n业务流量持续增长(每12个月翻一番)n包处理越来越复杂:p安全:IPSec/VPN,SSL,防火墙p应用认知(application aw
2、areness)p流量工程(Traffic Engineering):QoS/SLA等。p深度数据包检查(Deep Packet Inspection,DPI)现状p目前的网络设备大多采用通用处理器+ASIC的设计模式:nASIC无法提供业务快速升级所需的灵活性p传统网络处理器:n主要用于加速基本的包处理任务n内部资源有限,无法支持DPI这样的复杂处理n采用低级语言,缺乏相应的支持软件新型NP与传统NP的不同p传统NP只处理数据面任务,新型NP可应用于控制面、数据面、管理面处理。p传统NP主要卸载网络层和传输层功能,而新型NP可以卸载第四层以上的处理(如DPI、加/解密、压缩/解压缩等),这主
3、要通过集成各种特殊的硬件加速器来实现。p传统NP一般采用微码编程,新型NP支持标准嵌入式操作系统和高级语言(C/C+)编程。主要的多核NP半导体厂商pCavirm(MIPS架构)pBroadcom(MIPS架构)pRMI(MIPS架构)pCiscopFreescale(PowerPC架构)pTilerap1.Cavium OCTEON处理器处理器 p面向网络、无线、控制和存储等应用,提供高度集成和低成本的64位计算解决方案,广泛用于各种网络设备。p 一种片上系统(SoC),集成了:n12个定制的cnMIPS64 CPU core:专门针对网络服务而设计,功耗很小。n各种硬件加速器(应用,安全)
4、:针对下一代IP网络各种需求的L3-L7数据、内容和安全服务硬件加速选项,分担MIPS core的很多任务。n丰富的可配置网络接口:以太网、PCI/PCI-X、VoIP、USB 2.0等。OCTEON CN31XX的内部结构CN31XX的组成pcnMIPS64 core:n带有片上存储管理单元MMU(负责虚拟地址和物理地址之间的映射)n增强的MIPS64 Release 2整数指令集n双发射、5级流水线的超标量体系结构n32KB指令缓存和8KB L1数据缓存p一致存储子系统:n256KB L2 cache n64/72-bit DDR2 内存控制器n(可选的)低延迟16-bit DDR2-66
5、7,用于基于内容的处理和保存元数据 CN31XX的组成(续)p集成的应用加速协处理器:n数据包I/O处理引擎:针对L2-L4的包处理和缓冲区管理引擎。nTCP加速:包括全面的检查、标签产生、校验和、定时器和缓冲区管理。n队列/调度和服务质量硬件:对于输入包实现基于Diffserv、QoS/ToS、输入端口的队列/调度;对于输出包实现基于固定优先级或加权公平队列(WFQ)的队列/调度。n安全硬件完全分担:针对IPSec、SSL、SRTP、WLAN 802.11i安全协议处理,支持所有的标准算法。n压缩/解压缩硬件加速:实现GZIP、PKZIP和各种协议。n模式匹配硬件加速引擎(8个):深度数据包
6、检查。p不同的处理器版本(通信处理器、安全通信处理器、网络服务处理器)包含不同的硬件加速选项。CN31XX的组成(续)p集成的高性能网络接口:n最多3个可配置的以太网接口:3个10/100/1000 Ethernet MAC RGMII,或者1个RGMII+1个GMII。n32位PCI/PCI-X 主设备或从设备。n支持无缝VoIP的TDM/PCM接口。n480Mbps USB2.0 主设备性能p每秒最多执行10亿条(CN3110)或20亿条(CN3120)指令。p500Mbps2Gbps的应用性能:n最高2Gbps 64B IP转发n最高2Gbps TCP、IPSec、SSL、压缩/解压缩n
7、最高1Gbps正规表达式匹配p工业标准的编程模型,不需要任何专用工具或微代码 2.Broadcom BCM14803.RMI XLR处理器p采用SoC技术,将网络连接、负载平衡、安全、XML等功能集成在一个芯片上。p基于Mips64架构。p支持Linux SMP和VxWorks等常见的操作系统,允许利用工业标准的开发工具和环境进行软件设计,没有代码空间的限制。p可用于任何需要网络加速的场合,目标市场包括多业务交换机,路由器,防火墙/VPN/IDS/内容认知网络、网络服务、虚拟存储和负载平衡等网络应用。XLR732的内部结构XLR处理器的设计特色p多核多线程:包含多个Mips64核心,每个核心拥
8、有4个线程,每个线程拥有完全独立的寄存器组,在线程调度时不需要进行上下文切换。p高速内部网络:采用专利技术构成的内部网络连接各个核、网络接口、DMA和安全引擎,允许以上各部件之间独立并行地传递数据。p硬件加速器:数据包处理,安全处理。p丰富的接口:以太网、Hyper Transport、内存、PCI-X、DMA、串口等。XLR处理器内部结构XLR的专利设计p自带数据cache和指令cache的处理器核p与各个核的cache相连的data switch interconnect ring(DSI),在各个核之间传递与内存相关的数据。p连接到DSI上的共享L2 cache,存放内核可直接访问的数据
9、。p与各个核的指令cache及各个通信端口相连的fast messaging ring,在核与通信端口之间提供与存储无关的点对点消息传输。p与消息网络及通信端口相连的interface switch interconnect(ISI),用于在消息网络和通信端口之间传输消息。p与DSI和至少一个通信端口相连的内存桥,在DSI和通信端口之间直接通信。p与DSI、ISI和至少一个通信端口相连的超级内存桥,与DSI、ISI和通信端口通信。3.1 处理器核p每个处理器核采用4路多线程单发射10级流水线结构,为线程级并行而优化。(指令级并行对于访存密集型应用而言意义不大,而数据包处理具有自然的线程级并行。
10、)p不同的核可以执行不同的程序,甚至运行不同的操作系统。p一个核中的不同线程可以执行不同的程序,甚至运行不同的操作系统。p处理器核之间通过消息网络进行通信。线程调度-Eager round-robin线程调度Multithreaded fixed-cycle scheduling线程调度-Multithreaded fixed-cycle scheduling with eager round-robin可编程中断控制器PIC 可编程中断控制器(PIC)从中断源接受中断请求后,可以将中断指派给任何一个核/线程去处理。CPU mask是一个32比特的数,用于指示哪些核/线程不处理该中断。如有多个
11、未屏蔽的核或线程,采用round-robin方式进行任务分配。XLR还允许一个线程中断另一个线程。3.2 L2 Cachep统一的(指令与数据)片上L2 Cache,2MB容量,32B cache line。p包含与处理器核数量一样多的bank。p每个时钟周期最多可以同时接收8路访问。p可以不包括L1 cache中的内容,从而有效地提高整个内存系统的容量。p可被处理器核直接访问。3.3 数据交换(data switch)pDSI、内存桥和超级内存I/O桥构成一个用于数据交换的环,其中内存桥连接存储端口与处理器核,超级内存I/O桥连接存储端口、通信端口与处理器核。p每个处理器核、内存桥和超级内存
展开阅读全文