第三代网络系统课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三代网络系统课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三代 网络 系统 课件
- 资源描述:
-
1、第三部分 网络处理器技术主要内容p第三代网络系统与网络处理器p网络处理器体系结构p网络处理器的扩放 p网络处理器举例 p网络处理器的设计权衡1.1 第二代网络系统回顾p第二代网络系统对第一代网络系统的扩展:n将包的分类和转发功能下放到NIC上n引入了快速数据通路的概念p优点:可以支持更多的网络连接p缺点:仍依赖通用CPU处理例外的包,当集合包速很高时,CPU仍然是瓶项。1.2 第三代网络系统p出现于上世纪90年代后期p在每个网络接口上使用定制的硬件处理例外的包及高层协议(至第四层),即执行数据面(data plane)上的所有任务:n第一、二层功能:市售的物理层芯片组n第三层基本功能、包分类及
2、转发:ASIC硬件n第四层协议及例外包:嵌入式处理器n流量管制、监视和统计: ASIC硬件 p标准CPU负责执行控制面(control plane)上的任务。第三代网络系统的概念组织嵌入式处理器p为什么采用嵌入式处理器而不是ASIC?n处理任务不涉及快路径,不需要太快的速度n第四层协议庞大而复杂,采用软件实现比较合适p为什么选用RISC而不是CISC处理器?nCISC处理器的大指令集对于协议处理没有增强作用nRISC的指令集比较简单,CPU可运行在较高的频率nRISC芯片的硬件接口比较简单,硬件设计较容易nRISC处理器通常比较便宜,且功耗较小 第三代网络系统的问题p由于执行一个复杂的任务需要
3、许多条指令,当集合速率很高时,RISC处理器仍然是瓶颈。p上世纪90年代中期,工业界普遍认为能够处理因特网骨干连接的唯一可行技术是专用芯片。p使用ASIC代替RISC处理器的缺点:n开发周期长:设计复杂,芯片设计者不了解协议处理,修改费时n成本高:开发周期长,生产成本高,修改代价高,产品寿命短n仿真困难:对协议栈进行大量仿真不可行n可重用性低:在不同的产品、不同版本的产品中几乎不能重用或重用很有限n需要专业人员pRISC VS. ASIC是一个两难的抉择。1.3 第四代网络系统p目标:n结合第一代网络系统的灵活性与第三代网络系统的高速度。p在因特网早期,第一代网络系统能够很好地适应新的协议标准
4、和网络功能。pIP协议的相对稳定及以太网成为企业网主流技术减小了对网络产品灵活性的要求。p为什么仍然需要灵活性:n新的IP特性(如QoS,MPLS,多播,移动IP)要求网络产品支持新的应用n网络接口的类型在增加1.4 网络处理器的概念p网络处理器的设计目标:n结合ASIC的高速度和嵌入式处理器的灵活性,p网络处理器的定义:n网络处理器是一种专门针对网络处理而优化的可编程芯片,它结合了RISC处理器的低成本和高灵活性以及ASIC硬件的高速度。p网络处理器应具有的特点:n较低的成本n简单的硬件接口n内存访问能力n可编程能力n可扩展到高速度网络处理器的基本设计思想p通过可编程性获得灵活性,通过灵活性
5、降低成本:n类似于常规处理器,硬件保持不变,通过软件来控制包的处理。n硬件复用性好,可应用于任何一种协议处理。n方便系统设计、实现、修改和升级,缩短开发周期。p高性能设计的关键:n针对协议处理优化的指令集(通用性 VS 速度)n利用多处理器体系结构获得可扩展性(并行 VS 流水线) 网络处理器的位置p目前n比传统CPU贵,比ASIC慢n比传统CPU快,比ASIC便宜网络处理器 VS. ASICp用ASIC开发的系统n开发成本高(一百万美元)n生产成本低p用网络处理器开发的系统n开发成本低n生产成本高p使用网络处理器的动机主要是经济方面的:n开发成本比ASIC低n处理速度比传统CPU高1.5 网
6、络处理器的一般设计问题p网络处理器的设计取决于:n要执行的操作n在网络系统中的作用p研究目标:n一个通用、优化的硬件设计,能够应用于系统体系结构中的任何地方和处理任何协议p设计的困难:n不仅要求功能全面,而且要求功能最小化包处理功能p地址查找和包转发p差错检测和纠正p分片、分段和重组p解多路复用p包分类p排队和包丢弃p调度p安全:认证和保密p流量测量、整形和管制p定时器管理 问题p以上列出的任务包括所有的协议处理了吗?p哪些功能的优化是最重要的?p以上功能如何映射到一个典型的网络系统的硬件单元上?p在一个典型的网络系统中,哪些硬件单元可以用网络处理器来替代?p实现以上功能的最小通用指令集是什么
7、? 1.6 任务分组p为设计最小指令集,将协议处理任务划分成几个组,分别找出适合于每一组任务的指令集,然后将它们集成到一个最终的指令集中。p最常见的一种划分方法是将包处理任务分成两个组:n当包到达时执行的处理,称为ingressn当包离开时执行的处理,称为egress Ingress处理p差错检测和安全检验p分类或解多路复用p流量测量和管制p地址查找和包转发p包头修改和传输层接续p排队和调度 p包重组或流终止Egress处理p校验码生成p地址查找和包转发p分段或分片p流量整形p定时和调度p排队和缓存p输出安全处理(如加密) Ingress 和 Egress的分界线1.7 并行和分布式处理结构p
8、提高网络处理器扩展能力的三种技术:n包括专门的硬件单元用以处理特定的任务n关键的硬件单元被复制多份,各自独立运行(并行或流水线执行)n网络处理器工作在分布式环境,可以一起工作以获得更高的集合吞吐量 p对扩展性的关注给网络处理器的设计带来很大的困难:n必须选择适合每个特殊任务的硬件单元n选择要被复制的硬件单元n选择支持分布式执行的硬件单元n缺乏网络协议的经验,硬件设计者没有现成的经验规则可以使用。1.8 网络处理器在网络系统架构中的作用p代替一个常规的CPUp增强一个常规的CPUp用在NIC的输入路径上p用在NIC和交换结构之间p用在交换结构和输出接口之间p用在NIC的输出路径上p像其它端口一样
9、连接到交换结构上 代替一个常规的CPUp网络处理器必须具有常见的CPU功能和优化包处理的特殊功能p指令集中应包括:n常规指令:算术指令,数据操作指令n特殊指令:处理数据包的指令增强一个常规的CPUp将网络处理器附加到一个常规CPU上nCPU执行大部分的包处理n网络处理器执行特殊的任务p两种结构上的方法:n作为预处理器:在包进入CPU前进行处理,比如从硬件端口获取数据包,执行Ingress处理等n作为协处理器:可以执行任何操作p使用网络处理器来增强CPU而不是替代CPU的优点:n不用考虑常规指令,网络处理器的设计复杂度低p缺点:n需要有调用网络处理器的硬件,增加硬件开销置于NIC的输入路径上p网
10、络处理器从输入端口获取数据包,执行Ingress操作p优点:n灵活性好,可以方便地修改Ingress处理置于NIC和交换结构之间p网络处理器作为NIC和交换结构之间的仲裁者。p通过与交换结构的控制器交互建立路径、传输数据和释放路径。置于交换结构和输出接口之间p在使用分布式控制机制的交换结构中,每个输出端口控制对自己的访问。p当输入端口准备好使用交换结构时,输入端口使用另一个独立的机制通知输出端口;输出端口调度请求,在交换结构准备好时通知发送者。p网络处理器可用于协调输出端口的访问。置于NIC的输出路径上p网络处理器执行Egress处理,从交换结构接收分组、管理队列、流量整形、向输出端口发送包等
11、。直接连接到交换结构上p网络处理器可以像任何其它端口那样连接到交换结构上,从而可以作为一个中间节点,执行包处理任务。p如果将多个网络处理器连接到交换结构上,系统可以将输入的数据包分布到整个网络处理器集合。p优点:n易于扩展n允许最大的并行性1.9 宏观数据流水线p每个stage由一个网络处理器实现,网络处理器直接连接到交换结构上,利用交换结构提供相邻stage之间的连接。p优点:n支持异构处理器,降低对网络处理器通用性的要求n允许跳过流水线中的某个(些)stage,克服了流水线的一个主要缺点。1.10 网络处理器设计和软件仿真p硬件设计者依靠软件仿真评估设计的性能和正确性p和常规处理器不同,传
12、统的软件基准测试对于网络处理器不适用:n不同体系结构的低层硬件细节不同,应用和基准程序不能在不同的网络处理器间共享。n软件必须被重写以适应要测试的体系结构,甚至可能需要完全重新组织,这使得性能比较很困难。p网络处理器设计的关键是软硬件协同设计。1.11 网络处理的其它方案pNet ASICn一类特殊的网络处理集成电路的统称,包含能实现大部分网络处理功能的辅助硬件,但不可编程。n优点:p全硬件实现,具有确定的处理性能p软件开发环境是开发人员熟悉的n采用Net ASIC的公司大多缺乏设计和工程经验,缺乏资金或者市场,无法忍受专用ASIC漫长的开发周期,另外也不愿意去学习陌生的开发平台,导致开发周期
13、延长。n由于商业的原因,Net ASIC的开发进程已终止。网络处理的其它方案(续)p基于IP Core(Intelligent Property ) 设计:n20世纪90年代得到广泛应用,现在一个完整的SOC包括了多个结构化的核心电路模块。n系统设计者向可靠的第三方获取电路核心设计的使用许可,避免重新设计n核心电路采用标准化设计,易于集成n模块可重用,缩短开发周期n授权费用高昂n主要客户是大的网络设备提供商,市场较小。主要内容p第三代网络系统与网络处理器p网络处理器体系结构p网络处理器的扩放 p网络处理器举例 p网络处理器的设计权衡2.1 网络处理器体系结构的多样性p多种网络处理器体系结构存在
14、:n网络处理器内在的复杂性允许采用多种不同的体系结构来设计n固定用户群的缺乏给了开发商在选择设计方案时有更大的自由度n工业界对于网络处理器设计的许多问题没有一个统一的认识p哪些协议处理功能要映射到专用硬件上,如何映射p网络处理器在整个系统体系结构中的最佳作用p网络处理器中应包括哪些硬件构件块,哪些硬件功能要被复制,如何组织各个部件p如何在多个网络处理器之间建立有效的分布式连接2.2 网络处理器体系结构的主要特征p处理器体系(processor hierarchy)p存储器体系(memory hierarchy)p内部传输机制:在芯片内部各功能单元之间提供数据通路p外部接口和通信机制:与网络系统
15、其余部分的连接p专用硬件p轮询和通知机制:异步事件处理机制p并发执行支持:最大化系统吞吐量p编程模型和范例(programming model and paradigm)p硬件和软件分配机制(hardware and software dispatch mechanisms)p隐式或显式并行处理器体系p指执行各种包处理任务的硬件单元,包括可编程的和不可编程的p一个典型的网络系统中的处理器体系:网络处理器中包含的处理器p网络处理器通常包含了许多协同工作的物理处理器:n一个或多个嵌入式处理器,处理高层协议和提供整体控制n一个或多个专用协处理器,为特定的包处理任务而优化n一个或多个I/O处理器,以线
16、速执行ingress和egress处理n一个或多个与交换结构的接口n一个或多个数据传输单元,在I/O设备与内存之间传递数据包。存储器体系p分级存储系统可以较低的代价获得较高的性能:n分级存储系统呈金字塔形,等级越高的存储器容量越小、速度越快,成本越高n各种数据依照访问频度的高低放在相应层次的存储器中p网络处理器芯片通常不包含大容量的存储器,但包含接口硬件。p存储器体系是对网络处理器的基本补充。内部传输机制p在网络处理器芯片的功能单元间提供数据通路的任何机制,用于传送元数据、数据包及辅助数据等。p由于网络处理器芯片包含多个独立的处理器,内部通信对于性能来说非常重要。p大多数网络处理器包括多种传输
17、机制:n内部总线:提供连接多个功能单元的数据通路,多数使用集中式访问控制,确保每次只有一个单元访问总线。n硬件FIFO:用于连接不同速度的功能单元n传输寄存器:提供缓存的传输,不要求顺序访问n片上共享存储外部接口和通信机制p外部连接包括:n标准和专用的总线接口:处理电气连接的细节和提供对片上处理器的总线访问;n存储器接口:优化与存储器的交互;n直接I/O接口:允许片上处理器访问外部I/O设备;n交换结构接口:处理与交换结构的接口细节专用硬件p除协处理器外,网络处理器可以包含至少两类专用硬件:n控制硬件:协调硬件单元对共享资源的访问n可配置硬件单元:其参数可被配置,然后被调用执行某个任务,是对专
18、用协处理器和完全可编程处理器的一个折衷。轮询和通知机制p处理异步事件的两种机制:n轮询:要求一个活动单元不断地测试与事件相关的硬件n通知:用硬件或软件中断实现p高速系统倾向于使用轮询以避免中断的开销。并发执行支持p一个典型的网络处理器在多个层次上提供对并发线程的支持:n嵌入式RISC处理器中:由操作系统提供并发支持,上下文切换开销大n低级I/O处理器中:由硬件提供并发支持,切换代价很低或没有p两个问题:n线程的执行可否跨越多个处理器:全局线程提供更多的灵活性,但带来处理器间切换的开销。n线程是否可抢占:允许抢占则编程比较容易,不使用抢占则程序员有更多的控制处理的能力。程序设计的硬件支持p对程序
19、设计的两种最流行的硬件支持形式:n异步事件处理程序:程序员创建一组处理程序,每个处理程序同一个特定的事件关联,当事件发生时系统调用相应的事件处理程序。事件可能来自硬件或软件。n通信线程:多个线程独立执行,线程使用进程间通信机制将数据从一个线程传递给另一个线程。一个线程典型地执行一个无限循环。 do forever wait for next input packet, P;process P;send P on to next thread; 硬件和软件分配机制p分配(dispatch)是指对并行或并发任务的整体控制p分配器将一个准备就绪的任务指派给一个特定的处理器或线程p可以使用硬件或软件来
20、控制分配,一般而言,n软件分配用在有操作系统的处理器上n硬件分配由没有操作系统的低级I/O处理器使用显式或隐式并行p显式并行:n硬件体系结构的并行细节暴露给程序员n程序员具有更多的控制执行的能力n要求程序员了解底层硬件细节n程序可重用性差p隐式并行:n向程序员隐藏硬件体系结构的并行细节,程序员采用单线程执行模式编写程序,由硬件自动完成并行化处理。n减小了编程的复杂度,易于程序重用。2.3 网络处理器的主要设计风格p嵌入式处理器加不可编程的协处理器p嵌入式处理器加可编程I/O处理器p多个并行的处理器p处理器流水(pipelined processors)p数据流(dataflow)嵌入式处理器结
21、构p单个处理器,处理所有的功能p称为run-to-completion并行体系结构p每个处理器处理总负载的1/N流水线结构p每个处理器执行一个功能p数据包穿过流水线处理器的时钟速率p单处理器结构中,处理器的处理包速为线速。p并行结构中,每个处理器的处理包速为1/N线速,时钟速率为单处理器结构时钟速率的1/N。p流水线结构中,每个处理器的处理包速为线速,时钟速率小于单处理器结构时钟速率,理想情况下为1/N。数据流体系结构p一个数据流处理器由一个大内存和一个选择器硬件组成;p内存中的每一个数据项包含一个标签,说明需要进行的处理;p当一个功能单元空闲时,选择器从内存中选择一个数据项交给功能单元处理;
22、p数据流结构可以有多个并行执行的功能单元以提高性能n每个功能单元的时钟速率可以降低n选择器和内存仍必须运行在线速以上 2.4 软件体系结构p集中式程序,像调用子例程一样调用协处理器 p集中式程序,与智能可编程I/O处理器上的代码交互p通信线程p事件驱动程序pRPC风格(程序在处理器之间划分)p流水线(即使硬件不使用流水线)p以上模式的组合 可编程处理器的使用例子p最佳利用底层硬件特点的软件体系结构必须被设计为与处理器体系相匹配,特别是每个处理器被用来处理与其能力相适应的任务。p通用CPUn最高级功能,管理接口,系统控制,整体管理功能,路由协议p嵌入式处理器n中间级功能,高层协议,I/O处理器控
23、制,异常和错误处理,高级的输入处理(如包重组),高级的输出处理(如流量整形)pI/O处理器n基本包处理,分类,转发,低级的输入/输出操作数据包流经处理器体系p包处理任务应当被分配到能够执行该任务的最低级处理器上去执行。pI/O处理器的处理能力对系统性能的影响很大。主要内容p第三代网络系统与网络处理器p网络处理器体系结构p网络处理器的扩放 p网络处理器举例 p网络处理器的设计权衡3. 网络处理器的扩放(scaling)p扩放:支持更高的数据速率或更多的网络接口p限制网络处理器扩放规模的主要因素:n处理器(处理速度)n内存(访存速度)p其它因素:n芯片面积,电气及光学特性,软件,3.1 处理能力的
展开阅读全文