2-6-Intel-OPA介绍与使用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《2-6-Intel-OPA介绍与使用课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Intel OPA 介绍 使用 课件
- 资源描述:
-
1、Intel OPA介绍与使用介绍与使用服务服务与实施部与实施部人工智能与高性能人工智能与高性能产品服务交付处产品服务交付处认识认识OPA网络网络Intel OPA产品介绍产品介绍OPA网络环境部署网络环境部署OPA网络环境网络环境检查检查OPA网络性能测试及优化网络性能测试及优化认识认识OPA网络网络集群常见高速网络集群常见高速网络InfiniBandOmni-Path ArchitectureRDMA over Converged Ethernet点对点双向串行链路,低延迟,解放点对点双向串行链路,低延迟,解放CPU资源,资源,以应用程序为以应用程序为中心,子网管理服务中心,子网管理服务(o
2、pensm)。)。英特尔收购了英特尔收购了QLogic的的InfiniBand产品线和产品线和Cray互互联部门,结合两种网络架构的优点,开发出全新的联部门,结合两种网络架构的优点,开发出全新的Omni-Path网络网络架构,其已经脱离架构,其已经脱离IBTA制定的制定的InfiniBand标准,标准,所以在所以在软硬件上与软硬件上与InfiniBand设备设备互不互不兼容。兼容。RoCE,一种允许通过以太网使用,一种允许通过以太网使用RDMA的网的网络协议,不需要子网管理络协议,不需要子网管理(Subnet Manager)服务,不支持服务,不支持IB协议下的高可用服务。协议下的高可用服务。
3、服务与实施部1 认识认识OPA网络网络1 认识认识OPA网络网络已有高速网络技术已有高速网络技术服务与实施部1 认识认识OPA网络网络已有高速网络技术已有高速网络技术服务与实施部1 认识认识OPA网络网络Omni-Path Architecture服务与实施部1 认识认识OPA网络网络Omni-Path Architecture服务与实施部1 认识认识OPA网络网络OPA链路链路层的创新架构层的创新架构应用程序产生应用程序产生消息包消息包消息包被拆分成包裹消息包被拆分成包裹最大最大MTU大小大小直到分拆的包裹直到分拆的包裹传传送完成送完成,整个,整个消息消息包传送完成。包传送完成。Infini
4、Band每个包裹分装每个包裹分装在在65-bit的的容器容器Flow Control Digits or Flits1 Flit = 65 bits将将16 Flits(带带CRC)封装封装成成 Link Transfer Packets(LTPs)直到直到Flits传送传送完成完成,整个,整个消息包消息包传送完成。传送完成。Omni-Path Fabric16 Flits = LTP服务与实施部1 认识认识OPA网络网络1.5链路层确保链路层确保网络的网络的可靠性可靠性细粒度控制细粒度控制描述描述优势优势通讯流控通讯流控的优化的优化OPA更优化的服务质量更优化的服务质量(QoS),除了基于除
5、了基于VL&SL消息包发消息包发送机制,送机制,OPA采用固定长度的采用固定长度的Flits和和LTP封装数据包,提封装数据包,提供更细颗粒度的消息包传递控制;供更细颗粒度的消息包传递控制;数据包传递的优先级控制,高优先级包优先传递,低优先数据包传递的优先级控制,高优先级包优先传递,低优先级包等待。级包等待。确保高优先级的消息包(如确保高优先级的消息包(如MPI包)包)优先快速传递优先快速传递-更快完成作业;更快完成作业;稳定的延迟性能稳定的延迟性能-减少减少MPI和大块存和大块存储数据混合环境下,多次运行任务,储数据混合环境下,多次运行任务,延迟性能不一致的问题。延迟性能不一致的问题。消息包
6、消息包完整性保护完整性保护OPA不增加额外延迟的情况下,快速的透明的修复传输错不增加额外延迟的情况下,快速的透明的修复传输错误的链接;误的链接;只需重传更小的携带只需重传更小的携带error的的LTPs(仅仅1056bits),而不是,而不是整个数据包整个数据包(IB FEC);重传只发生在主机到交换机或交换机间,而无需整个链路重传只发生在主机到交换机或交换机间,而无需整个链路的重传,极大减少延迟惩罚。的重传,极大减少延迟惩罚。更效的链路层错误修复,对比更效的链路层错误修复,对比IB标准标准定义的定义的Forward Error Correction(FEC);无需无需CPU负担,除非错误修复
7、发生在负担,除非错误修复发生在主机到交换机。主机到交换机。动态链路动态链路扩展扩展OPA在在4x链路上,有链路上,有1x或多或多x的的link失效后,保存重启或失效后,保存重启或返回前一个返回前一个checkpoint,继续保持,继续保持link可用性;可用性;应用任务继续运行,直到修复。对比当前应用任务继续运行,直到修复。对比当前Infiniband,通,通常是断掉整个常是断掉整个4xlinks。确保确保workload继续完成,减少任务继续完成,减少任务运行失败概率。运行失败概率。1 认识认识OPA网络网络OPA交换机路由特性交换机路由特性描述描述优势优势 静态路由静态路由 传统的传统的I
8、nfinband路由方式路由方式 最短路径最短路径 分散路由分散路由 允许源允许源/目的多路径对目的多路径对 通讯负载均衡通讯负载均衡 支持乱序包支持乱序包 可用于可用于Intel PSM MPIs SHMEM 自适应式路由自适应式路由 基于分散路由支持的交换机基于分散路由支持的交换机 自动切换失效路径自动切换失效路径/拥塞拥塞服务与实施部1 认识认识OPA网络网络OPA软件实现软件实现服务与实施部1 认识认识OPA网络网络ASIC级别的性能及特征提升级别的性能及特征提升TrueScale HCA(1 port)Intel OPA HFI(1 port)Improvement FactorPC
9、Ie InterfaceGen2 x8 = 4 GB/sGen3 x16 = 16 GB/s4xFabric interfaceQDR = 4GB/s100 Gbps = 12.5 GB/s3.125xAchievable uni BW3.3 GB/s (PCIe limited)12-12.5 GB/s3.6x - 3.8xAchievable bi BW6.4 GB/s (PCIe limited)24-25 GB/s3.7x - 3.9xMaximum uni message rate36 Million/sec160 Million/sec4.4xMaximum bi message
展开阅读全文