多核与众核处理机芯片技术发展页PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多核与众核处理机芯片技术发展页PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多核 处理机 芯片 技术发展 PPT 课件
- 资源描述:
-
1、1高性能多核和众核处理机高性能多核和众核处理机芯片技术发展芯片技术发展李三立教授李三立教授清华大学清华大学2引言引言o处理机永远是计算机技术和产业的重要驱动力。处理机永远是计算机技术和产业的重要驱动力。o要进一步发展千亿次(要进一步发展千亿次(Petaflops)高性能计算机,)高性能计算机,是离不开多核与众核芯片的发展的是离不开多核与众核芯片的发展的;计算机体系结构的计算机体系结构的新技术大多体现在高性能多核与众核芯片上。希望我新技术大多体现在高性能多核与众核芯片上。希望我们关注高性能计算技术的发展;们关注高性能计算技术的发展;o现在计算机体系结构是现在计算机体系结构是“系统系统”都做到都做
2、到“芯片上芯片上”去去了(了(SOC)。希望我们计算机学院的)。希望我们计算机学院的“计算机组织计算机组织”和和“计算机体系结构计算机体系结构”课程的老师和学生能够在教学课程的老师和学生能够在教学与学习中增加这方面内容,老师在申请自然科学基金与学习中增加这方面内容,老师在申请自然科学基金和其它科研经费方面也注意加重这方面的研究方向;和其它科研经费方面也注意加重这方面的研究方向;o希望我们年轻教师和学生把兴趣放在这一领域,把我希望我们年轻教师和学生把兴趣放在这一领域,把我国的处理机芯片技术搞上去。国的处理机芯片技术搞上去。3我国万万亿次超级计算机我国万万亿次超级计算机CPU有望全部国产有望全部国
3、产化化 世界第一的世界第一的“天河一号天河一号”超级计算机系统采用了超级计算机系统采用了“飞腾飞腾-1000”高性能多核微处理器。高性能多核微处理器。“天河一号天河一号”:4700万亿次的峰值速度万亿次的峰值速度和和2566万亿次的持续速度万亿次的持续速度;1000万亿次万亿次/秒为:秒为:1Petaflops 2019-3-8日环球网报道国防科大校长张育林谈话日环球网报道国防科大校长张育林谈话4我国天河一号千万亿次超级计算机我国天河一号千万亿次超级计算机世界世界500强第一名,奥巴马专门提到它强第一名,奥巴马专门提到它5世界世界500强第一名天河强第一名天河1号插件版号插件版6提纲提纲o1。
4、多核与众核处理机结构芯片技术的需要。多核与众核处理机结构芯片技术的需要o2。多核和众核体系结构处理机芯片的发展。多核和众核体系结构处理机芯片的发展o3。异构多核众核结构芯片。异构多核众核结构芯片o4。片上系统片上系统SOC互联网络的发展互联网络的发展o5。微电子工艺的进一步发展。微电子工艺的进一步发展o6。未来。未来exaFlops高性能计算机芯片预测高性能计算机芯片预测o7。结论。结论7(一)。(一)。多核与众核处理机多核与众核处理机结构芯片技术的需要结构芯片技术的需要87/26/20228 8高性能计算应用需求高性能计算应用需求1 Zettaflops100 Exaflops10 Exaf
5、lops1 Exaflops100 Petaflops10 Petaflops1 Petaflops100 TeraflopsSystem PerformancePlasma Fusion Simulation Jardin 03Simulation of more complex biomolecular structures200020202019No schedule provided by sourceApplicationsJardin 03 S.C.Jardin,“Plasma Science Contribution to the SCaLeS Report,”Princeton
6、 Plasma Physics Laboratory,PPPL-3879 UC-70,available on Internet.Malone 03 Robert C.Malone,John B.Drake,Philip W.Jones,Douglas A.Rotman,“High-End Computing in Climate Modeling,”contribution to SCaLeS report.NASA 99 R.T.Biedron,P.Mehrotra,M.L.Nelson,F.S.Preston,J.J.Rehder,J.L.Rogers,D.H.Rudy,J.Sobies
7、ki,and O.O.Storaasli,“Compute as Fast as the Engineers Can Think!”NASA/TM-2019-209715,available on Internet.NASA 02 NASA Goddard Space Flight Center,“Advanced Weather Prediction Technologies:NASAs Contribution to the Operational Agencies,”available on Internet.SCaLeS 03 Workshop on the Science Case
8、for Large-scale Simulation,June 24-25,proceedings on Internet a pnl.gov/scales/.DeBenedictis 04,Erik P.DeBenedictis,“Matching Supercomputing to Progress in Science,”July 2019.Presentation at Lawrence Berkeley National Laboratory,also published asSandia National Laboratories SAND report SAND2019-3333
9、P.Sandia technical reports are available by going to sandia.gov and accessing the technical library.HEC04 Federal Plan for High-End Computing,May,2019.Compute as fast as the engineer can thinkNASA 99 100 1000 SCaLeS 03 Geodata Earth Station Range NASA 02Full Global Climate Malone 03 Courtesy of Erik
10、 P.DeBenedictis simulation of medium biomolecular structures(us scale)simulation of large biomolecular structures(ms scale)protein folding50 TFLOPS250 TFLOPS1 PFLOPSHEC04cpeg421-2019-F/Topic-3-I等离子体等离子体全球气候模型全球气候模型海量海量地球地球数据数据更复杂生物更复杂生物分子结构模拟分子结构模拟蛋白质结构蛋白质结构生物生物分子分子结构结构系统性系统性能能应用应用1万万万亿万亿次次100万万万亿次万
11、亿次1000万万亿万万亿次次9晶体管数目增长晶体管数目增长-Intel320亿晶体管亿晶体管10芯片上频率不能持续增长芯片上频率不能持续增长功耗问题功耗问题停顿了停顿了11功耗引起发热直观图片12CPU的水冷和风冷的水冷和风冷水冷系统水冷系统风冷系统风冷系统13解决功耗增长和晶体管增长的矛盾解决功耗增长和晶体管增长的矛盾o解决方案:解决方案:新制造材料;新制造材料;新制冷技术;新制冷技术;多核和众核体系结构多核和众核体系结构14多核和众核的发展对于性能的影响多核和众核的发展对于性能的影响多核三年的变化多核三年的变化性能性能年份年份Intel着重在着重在PC机发展机发展15体系结构进展:体系结构
12、进展:单核单核多核多核众核众核-片上互联片上互联1993,Pentium2019,Pentium MMX2019,Pentium II2019,Pentium III2019,Tualatin2019,Pentium 4Northwood2019,Pentium D2019,Core 2 Duo(Conroe)2019,Core 2 Quad(Kentisfield)2019,TeraScale 80-core prototypeSingle core with increased performanceMulticore processor with more and more cores!
13、Key for Multicore:Interconnection16AMD通用通用单核的内部结构单核的内部结构 AGUAGUInt Decode&RenameFADDFMISCFMUL44-entryLoad/StoreQueue36-entry FP schedulerFP Decode&RenameALUAGUALUMULTALUResResResL1Icache64KBL1Dcache64KBFetchBranchPredictionInstruction Control Unit(72 entries)FastpathMicrocode EngineScan/Align/Decode
14、ops取指取指转移转移预测预测微码微码硬布线硬布线微操作微操作数据缓存数据缓存指令缓存指令缓存17AMD 双核芯片的布局双核芯片的布局o双核双核AMD Opteron 处理机处理机o 199mm2 90nm 工艺工艺o单核单核 AMD Opteron 处理机处理机 o 193mm2 130nm 工艺工艺18AMD Opteron 的多核架构的多核架构19Intel多核与众核解决路线多核与众核解决路线2005200920062008200720102004201120122013201420152016201720182019202012481625632641285121024Pentium
15、DCore DuoCore 2 DuoConroe,Allendale,Wolfdale,Merom,PenrynCore 2 DuoKentsfield,YorkfieldCore i7Sandy BridgePolaris TeraScale80 Cores/80 ThreadsSingle Chip Cloud Computing48 Cores/48 ThreadsKnight Corner50 Cores/200 ThreadsCommercial PathResearch PathNehalem 核数核数商业路径商业路径研究路径研究路径20Intel的的 Nehalem多核结构多核
16、结构要有图形要有图形核核快速快速通道通道接口接口21Intel 的的 Nehalem四核芯片布局四核芯片布局快速通道连接快速通道连接96GB/S 快速通道连接快速通道连接96GB/S22Intel Nehalem多核处理机层次式存储结构多核处理机层次式存储结构CPU Core32KB L1 D$32KB L1 I$256KB L2$8MB Shared L3$CPU Core32KB L1 D$32KB L1 I$256KB L2$4-8 CoresDDR3 DRAM Memory ControllersQuickPath System InterconnectEach direction i
17、s 20b6.4Gb/sEach DRAM Channel is 64/72b wide at up to 1.33Gb/sQPI是是重要特点重要特点23Intel 通用通用Nehalem的单核结构的单核结构预取缓冲预取缓冲预译码预译码指令队列对准指令队列对准转移预测转移预测循环流译码循环流译码快速通道访存快速通道访存QPI乱序执行缓冲乱序执行缓冲第三级第三级Cache 24J FMAMJ JASOND J FMAMJ JASOND J FMAMJ JASOND J FMAMJ JASOND J FMAMJ JASOND J FMAMJ JASOND J FMAMJ JASOND J FMAM
18、J JASOND J FMAMJ JASOND J FMAMJ JASONDPower4(2019)1.1 to 1.3 GHz(1)(2)(2)Power4+(2019)1.9 GHz(1)(2)(2)Power5(2019)1.5-1.9 GHz(1)(2)(4)Power5+(2019)1.5-2.26 GHz(1)(2)(4)CBE(2019)3.2 GHz(1)(9)(10)PowerXCell8i(2019)3.2GHz(1)(9)(10)Xenon(2019)3.2 GHz(1)(3)(6)Power63.5-4.7 GHz(1)(2)(4)Power6+5 GHz(1)(2)(
19、4)Power6+5 GHz(1)(2)(4)Pentium D3.8 GHz(1)(2)(4)Core 21.8-3.2 GHz(1)(4)(8)Dual Core Atom0.8-2.06 GHz(1)(2)(2)Sandy Bridge4.6 GHz(1)(8)(16)Xeon2.863.56 GHz(1)(2)(2)Xeon Quad Code2.133.56 GHz(1)(4)(8)Xeon Beckton2.83.56 GHz(1)(8)(16)Core 7i2.663.33 GHz(1)(4)(8)Opteron Denmark1.6-2.8GHz(1)(2)(2)Opteron
20、 Barcelona1.76-2.6GHz(1)(4)(4)Opteron Istanbul2.26-2.66GHz(1)(6)(6)Opteron Sao Paolo?(1)(6)(6)Opteron Magny Cours?(1)(12)(12)Opteron Interlagos?(1)(16)(16)Ultra SPARC IV1-1.356 GHz(1)(2)(2)Ultra SPARC IV+1.5-2.16 GHz(1)(2)(2)Ultra SPARC T11-1.46 GHz(1)(4)(32)Ultra SPARC T21-1.66 GHz(1)(8)(64)Ultra S
21、PARC VII2.4-2.56 GHz(1)(4)(16)Ultra SPARC VIIIfx2.4-2.56 GHz(1)(8)(16)IBMSUN/ORACLEAMDINTEL20192019201920192019201920192019200920192019NameHertz(Processor)(Cores)(Threads)7/26/202224JPL-Dec-01-2009Chips with 8 physical cores or more其他公司多核其他公司多核/众核发展计划众核发展计划25晶体管数(千)单线程性能单线程性能(SpecINT)频率(MHz)典型功耗(瓦瓦)
22、核数目小结:小结:35年处理机发展综合趋势年处理机发展综合趋势26(二)。多核和众核体系结构(二)。多核和众核体系结构处理机芯片的发展处理机芯片的发展27为何要多核?为何要多核?CoreCacheCoreCacheCoreVoltage=1Freq =1Area =1Power =1Perf =1Voltage=-15%Freq =-15%Area =2Power =1Perf =1.8In the same process technology28GPGPGPGPGPGPGPGPGPGPGPGPGeneral Purpose Cores进一步多核异构芯片进一步多核异构芯片-SOCSPSPSP
23、SPSpecial Purpose HWCCCCCCCCCCCCCCCCInterconnect fabric通用核通用核专用硬件专用硬件互联网络互联网络29多核技术将要多样化多核技术将要多样化!Multiple parallel general-purpose processors(GPPs)Multiple application-specific processors(ASPs)Sun Niagara8 GPP cores(32 threads)IntelXScale Core32K IC32K DCMEv210MEv211MEv212MEv215MEv214MEv213Rbuf64 1
24、28BTbuf64 128BHash48/64/128Scratch16KBQDRSRAM2QDRSRAM1RDRAM1RDRAM3RDRAM2GASKETPCI(64b)66 MHzSPI4orCSIXStripeE/D QE/D QQDRSRAM3E/D QMEv29MEv216MEv22MEv23MEv24MEv27MEv26MEv25MEv21MEv28CSRs-Fast_wr-UART-Timers-GPIO-BootROM/SlowPortQDRSRAM4E/D QIntel Network Processor1 GPP Core16 ASPs(128 threads)IBM Ce
25、ll1 GPP(2 threads)8 ASPsPicochip DSP1 GPP core248 ASPsCisco CRS-1188 Tensilica GPPs处理机上有处理机上有上千个线程上千个线程处理机就是摩尔定理中的处理机就是摩尔定理中的晶体管晶体管“The Processor is the new Transistor”Rowen30AMD做的做的GPU多核多核SIMD芯片结构芯片结构31多核伴随指令的扩展多核伴随指令的扩展-加速加速32众核处理机结构众核处理机结构3232Intel Terascale 80 核处理机Tilera 64核处理机云存储服云存储服务器务器无线网络无线
展开阅读全文