自1976年英特尔推出X86架构以来,CPU一直以“中央处理器”的身份,发挥着计算、存储、控制等核心作用,被称为现代信息技术的“核芯”。近年来,人工智能、云计算、大数据等技术的兴起和服务的升级,对网络能力提出了更高、更加多样化的诉求,对算力的需求产生了爆发性增长,CPU已难以高效应对更为复杂的计算场景。尤其是英伟达1999年推出GPU后,全球计算架构出现了进一步明显分化,CPU包打天下的局面正在被GPU、DPU、IPU、FPGA、ASIC等多种功能的高算力芯片改变。全球计算架构格局正处于重新洗牌的前夜,以数据为中心的新型计算架构路线正在迅速兴起。
“缺芯少魂”一直是我国信息技术和产业发展的心头之痛!我国大力推动的信创工程主线就是以CPU为核心国产化替代目标,打造信息技术全产业链生态系统。但是,现在CPU的核心地位正在被取代,国产化替代目标突然消失了,或者说替代目标已经升级迭代了,我们的国产化替代应如何应对?信创工程的发展应何去何从呢?北京交通大学信息管理理论与技术国际研究中心(ICIR)认为,面对全球计算架构路线从“单一核心”到“多元核心”的发展变化趋势,我国信创工程要抓住机遇,加快布局,把握和遵循现代信息技术发展的基本规律,尽快研究和部署各种基础芯片及其模块技术,开发推广异构技术及系统,构建新型基础芯片模块生态,建立全球领先的信息技术创新体系,避免出现当前信息技术中CPU国产化替代还未实现,又在新一轮技术发展周期中产生新的“缺芯少魂”问题,又要去对GPU、DPU、FPGA、ASIC等新型核心器件进行新一轮国产化替代的局面。
一、全球网信巨头正在发起一场全新的计算架构革命
1.英伟达正在引领CPU+GPU+DPU“多元核心”计算架构变革
近期英伟达发生了两件大事:一是英伟达成为全球市值最高的芯片公司。英伟达市值突破了5000亿美元,同期英特尔市值只有2117亿美元,不到英伟达的一半;而2020财年英伟达营收仅为154亿美元,英特尔营收为则高达779亿美元,是英伟达的5倍。二是2021年9月15日英伟达创始人兼首席执行官黄仁勋先生被《时代》周刊列入2021年度最具影响力人物榜单,并成为全球100位最具影响力人物年度特刊的七位封面人物之一,并指出“黄仁勋的英伟达团队独具优势,能够持续推动未来几十年的科技发展。”英伟达与英特尔的市值反差和黄仁勋的耀目光芒,在很大程度上反映了市场对新兴计算架构路线与传统计算架构路线的态度。市场认为,以英特尔为代表的以CPU为“单一核心”的计算架构路线正步入生命终点,而以英伟达(NVIDIA)为代表的CPU+GPU+DPU的“多元核心”计算架构路线代表了全球计算架构路线的方向。也就是说CPU已不再那么重要了,正在被GPU、DPU、IPU、FPGA、ASIC等不同功能的逻辑控制器所替代。事实确实如此,20多年来英伟达(NVIDIA)一直领导着全球计算架构路线的一场革命。
在GPU方面,自1999年英伟达首次提出GPU概念后,陆续推出游戏、数据中心、专业视觉和自动驾驶等业务的GPU解决方案,成功实现了由芯片供应商向计算平台的转型,并成为GPU计算领域公认的全球领导者。英伟达的游戏业务由GeForce和Shield组成,其中Shield面向移动端和云,GeForce面向PC。英伟达的数据中心业务源于2006年首次推出的G80核心CUDA,同时首创了GPGPU。数据中心产品包括适用于AI的DGX系统、适用于边缘计算的EGX平台、适用于超算的HGX平台、适用于数据处理的DPU、以及简化深度学习、机器学习、高性能计算的NGC目录。英伟达专业视觉业务主要由Quadro产品线组成,被广泛应用在台式工作站、笔记本电脑、EGX服务器、虚拟工作空间、云端、定制化方案中。英伟达的汽车产品包括相关驾驶软件、驾驶基础设计、AGX平台,提供训练、模拟、智能驾驶舱体验、高清地图和定位等解决方案。2011年TESLA GPU计算卡发布,标志着英伟达将用于计算的GPU产品线正式独立出来,凭借着架构上的优势,GPU在通用计算及超级计算机领域,逐渐取代CPU成为主角。
在DPU方面,2019年英伟达以69亿美元收购DPU龙头企业Mellanox,并于2020年推出了BlueField-2与BlueField-2X两款DPU产品。2021年又发布了BlueField-3 DPU,这是首款为AI和加速计算而设计的DPU,而一个BlueField-3 DPU所提供的数据中心服务相当于300多个CPU核才能实现的服务,从而释放更多的CPU资源来运行关键业务应用。
在CPU方面,英伟达在完成了GPU、DPU的布局之后,又把目光瞄上了CPU,2020年9月英伟达计划用400亿美元收购ARM,如若这笔交易最终达成,英伟达引领的CPU+GPU+DPU的“多元核心”新型计算架构将快速形成,数据中心、人工智能、移动终端、汽车等多个领域的竞争格局将重新洗牌。
2.AMD已形成CPU、GPU、FPGA三箭齐发的格局
AMD与英特尔是全球仅有的 X86架构授权两家厂商之一。2006年AMD通过收购ATI科技进入GPU市场,使AMD成为全球唯一可以同时提供高性能GPU和CPU的企业。2019年AMD以350亿美元收购了赛灵思(Xilinx),成为FPGA市场龙头企业。
在CPU方面,自2015 年AMD 设计完成Zen 架构,2018年推出了Zen的改进架构Zen+,2019年推出Zen+的下一代微架构Zen 2,2017 年AMD采用Chiplet设计思路,通过模块化来组合不同核心的处理器,推出 X86 微处理器锐龙(Ryzen )系列,2018年推出锐龙3000处理器后,AMD 的全球服务器 CPU 市场份额止跌回升,从2015年的不到1%上升到2021年8 月的54%,Zen架构成为AMD重返高性能计算的重要产品。AMD将与台积电合作生产7nm服务器 CPU,预计2022年和2023年还将分别推出5纳米Zen4架构处理器和3纳米Zen5架构处理器,继续保持在CPU方面的技术优势。
在GPU方面,AMD的数据中心GPU业务由Radeon Instinct加速器系列、数据中心解决方案和ROCm组成。Radeon Instinct MI 100加速器采用专注计算的CDNA微架构,其高性能计算工作负载性能提升近3.5倍,人工智能工作负载性能提升近7倍。ROCm是全球首个针对加速式计算且不限定编程语言的超大规模开源平台,适合大规模计算,支持多路GPU,有包括框架、库、编程模型、互联和Linux Kernel上游支持等丰富的系统运行库,支持大规模应用、编译器和语言运行库的开发。近日,AMD第二代 CDNA 架构的下一代 Instinct MI200加速器正式出货,标志着AMD成为第一家采用MCM技术的GPU公司。AMD是戴尔、惠普等OEM厂商的产品提供商,也是微软AZURE和亚马逊网络服务提供视觉云解决方案商,同时,AMD正与美国能源部、橡树岭国家实验室和Cray公司合作,使用EPYC(霄龙)CPU、Radeon Instinct GPU和ROCm打造超过150亿亿次FLOPS的全球最快超算平台。
在FPGA方面,2019年AMD以350亿美元收购了赛灵思,赛灵思是全球排名第一的FPGA解决方案提供商,其FPGA产品包括Spartan系列、Artix系列、Kintex和Virtex系列、以及全可编程 SoC 和 MPSoC系列。Spartan系列定位于低端市场,目前最新器件为28nm工艺的Spartan7;Artix系列是中间过渡产品,尤其在通信接口方面有很大优势;Kintex和Virtex系列是赛灵思(Xilinx)的高端产品,包括28nm的Kintex7和Virtex7系列,以及16nm的Kintex7 Ultrascale+ 和Virtex7 Ultrascale+系列,具有丰富的高速接口,主要用于通信、雷达、信号处理、IC验证等高端领域;全可编程 SoC 和 MPSoC系列有Zynq-7000 和Zynq UltraScale+ MPSoC系列FPGA,可嵌入ARM Cortex系列CPU。
3.英特尔(Intel)正在向CPU以外的计算架构领域拓展
自1976年推出X86CPU架构后,英特尔引领全球计算架构路线发展长达40余年,至今仍然以779亿美元的收入雄居全球芯片企业榜首。但是,近年来英特尔遭遇到了英伟达和AMD的围追堵截,其7nmCPU研发进程受阻,长年的技术领先优势受到极大挑战,英特尔终于意识到:江湖虽仍在,但再也不是那个CPU一统天下的江湖了!英特尔也开始在GPU、FPGA、ASIC等方面积极布局,并提出了自己的IPU概念。
在GPU方面,英特尔是全球最大的PC GPU供应商,也是PC和服务器显卡唯一的IDM厂商。英特尔于2020年发布了基于Xe架构的独立显卡“Xe DG1”,宣布进入GPU市场。2021年8月英特尔又发布了基于Xe HPG微架构、高性能显卡产品—英特尔锐炫™(Intel®Arc™),并将陆续发布Battlemage、Celestial和Druid等后续几代GPU产品,直接向英伟达和AMD发起挑战。英特尔也开始将MCM技术应用于其最新的GPU产品—基于Xe HPC架构的Ponte Vecchio加速器。
在FPGA方面,英特尔于2015年以167亿美元收购了阿尔特拉(Altera)高调进入FPGA领域。阿尔特拉是业界与赛灵思齐名的FPGA供应商,其产品包括MAXII 系列、Cyclone系列、Stratix系列、Arria系列和Arria 10 FPGA系列。MAXII 系列为CPLD;Cyclone系列定位于消费类产品,最新产品Cyclone10,与赛灵思的Spartan为对标产品;Stratix系列是高端应用,与赛灵思的Virtex系列为对标产品,最新产品是Stratix10;Arria系列是SOC系列FPGA, 内置ARM Cotex A9的核;Arria 10 FPGA系列是支持DDR4存储器接口的FPGA,存储器性能比前一代FPGA提高了43%。
在IPU方面,2021年6月,英特尔正式发布了面向基础设施应用的IPU处理器,并正式推出了旗下首个ASIC IPU—Mount Evans,以及全新的基于FPGA的IPU参考平台。目前,英特尔已拥有自己的CPU、GPU、FPGA、IPU、人工智能处理器等众多XPU产品,以及基于Arm和基于RISK-5的CPU产品,为此,英特尔于2020年推出了OneAPI项目,提供了一个开放、规范、跨架构和跨厂商的统一软件栈。
4.其他云服务商和芯片巨头也在积极布局ASIC、DPU、IPU
亚马逊云(AWS)早在2013年便着手开发定制ASIC芯片Nitro,2015年AWS斥资3.5亿美元收购了Annapurna,并自研成功Nitro2,目前AWS Nitro已发展到第四代,AWS已将管理程序、网络和存储虚拟化转移到AWS Nitro上。
阿里云通过自研方式实现了DPU应用,早在2015年神龙服务器核心组件MOC卡中应用了专用X-Dragon芯片,统一支持网络、I/O、存储和外设的虚拟化。
百度云正在与英特尔在IPU领域展开全面合作,基于英特尔的IPU解决方案,百度自研智能网卡实现裸金属、虚机、容器多种算力在网络和存储功能的全面卸载和统一,极大赋能了百度云主机产品。
UCloud基于英伟达BlueField DPU打造了高性能裸金属物理云方案,该方案将原来的10G网卡提升到现在DPU 25G,通过双网口bonding将带宽提升至50G,在性能与可靠性等方面均实现了提升,并且有效降低了裸金属云的成本。
安谋科技(ARM)于近日发布了“A+X双轮驱动战略”,即一个轮子为代理的Arm CPUIP,另外一个轮子为自研的核芯动力XPU,XPU的主要产品是安谋科技自研的IP业务,包括“周易”NPU、“山海”SPU、“玲珑”ISP、“玲珑”VPU等。
除此以外,Broadcom、Marvell、Fungible、Pensando等国外芯片企业均参与DPU赛道。
二、全球计算架构路线的发展走向
1.传统IT时代冯·诺依曼计算架构局限性凸现,适应DT时代新型计算架构的雏形显露
过去40多年来以X86为代表的全球计算架构路线是由冯·诺依曼架构决定的,数据中心大多是面向以业务为中心的场景,CPU被称为中央处理器,是整个数据中心的核心,不仅负责数据的计算处理,而且还负责处理网络、存储、安全等基础负载。近年来,随着云计算、大数据、人工智能等新技术的快速崛起,区块链、边缘计算、车联网、数据中心等新型市场需求大爆发,全球数据量出现爆炸式增长,原来面向业务场景的数据中心正快速向面向以数据为中心的场景转变。人类社会正在从IT时代走向DT时代,而传统冯·诺依曼架构制约了这一转型。
一是传统冯·诺依曼架构下CPU已经无法处理海量的数据运行。在传统冯·诺依曼架构下,运行数据中心的网络、存储、安全等传统基础设施需消耗CPU 20-30%的核心资源,只有70%-80%的CPU资源被用到了对外计算方面。在业务场景单一、数据量还不大的传统IT时代,CPU以及数据中心性能或许还勉强够用。而在进入DT时代的当今,由于数据量爆发以及摩尔定律趋于极限,CPU已无法在处理其他基础设备资源后,再处理全部的计算业务,数据中心的性能也达到了瓶颈。
二是传统冯·诺依曼架构下海量数据带来了网络通信困扰。进入DT时代后,使用传统的CPU方式不仅浪费资源,而且还会延迟问题,甚至无法解决问题,也就是说基于传统冯·诺依曼架构必然造成DT时代的网络拥塞。
因此,新型的全球计算架构路线面临两个必须要解决的问题,一是为CPU“减负”。让CPU从“中央处理器(CenterProcessing Unit)”的众多功能中“瘦身”成只专注于外部计算的“计算处理器(Computing Processing Unit)”。二是增加各种“专用功能”。数据中心的存储、网络、安全、虚拟化等功能由不同的专业模块专门负责,降低网络传输中的延时、丢包等问题。
事实上,CPU计算资源被耗费导致的计算能力下降和网络延时不畅等问题由来已久。开始这个问题是通过CUP加速卡——智能网卡SmartNIC来解决,在一定程度上降低网络互联、安全、虚拟化、内存访问等对CPU资源的消耗。后来,GPU、DPU、IPU、FPGA、ASIC等各种专用功能模块陆续被发明出来,CPU在被从“额外负担”中解决出来的同时,其重要性也相应下降了。随着新型软硬件融合架构的不断深入,GPU、DPU、IPU、FPGA、ASIC将颠覆数据中心以CPU为中心的传统架构。冯·诺依曼传统计算架构正走向终点,而新型计算架构路线正大踏步向我们走来。
2.CPU+GPU+DPU将成为新型计算架构路线的标准配置
由于摩尔定律趋于极限,CPU的算力增长远远赶不上当下数据流增长的速率。而GPU对图形、渲染、加速方面的功能远远高于CPU,以专用芯片如ASIC、FPGA等形式出现的DPU经过定制化的设计后,在完成网络、存储、安全等方面效能也远远高于CPU。GPU和DPU将分担原来由CPU承担的一些基础功能,CPU专门负责核心计算任务。但GPU和DPU只是分担核心计算外的特定功能,并不能替代CPU的全部工作。因此,新型计算架构将由CPU、GPU、DPU三大支柱支撑运行,未来的数据中心标配是“CPU+GPU+DPU”,CPU负责通用计算,GPU负责加速计算,DPU负责数据处理。
3.云计算数据中心将成为最重要的增长引擎
云计算相关业务已经成为亚马逊、微软、谷歌等全球网信巨头最主要的增长引擎,同时阿里、腾讯、华为、小米等国内科技公司也在纷纷往企业级业务或云端转型,作为云计算业务支撑基础的云计算数据中心将得到快速发展。对于芯片公司来说,英特尔、AMD、英伟达等也都在全力扩展数据中心芯片的产品组合,其中不仅包括数据中心CPU,还有针对数据中心打造的GPU、各种专用的硬件加速单元,以及基于FPGA的加速卡等等。可以说,当前的数据中心芯片和硬件领域是百花齐放、百家争鸣的状态,各种架构和技术层出不穷。
三、信创工程要主动开拓新型计算架构新赛道
从全球网信产业发展历史来看,技术优势和产业生态的形成领先都是在技术路线发展重大变化的时候发生的。英特尔的X86个人计算机替代IBM的小型机,就是计算机专用路线被X86通用技术路线替代的结果。而智能手机等移动终端的快速崛起,也是ARM精简指令计算路线适在移动计算市场代替了X86技术路线的结果。今天,数据爆炸式增长又把我们带到了一个新的技术路线选择关头,也为我国网信产业发展提供了一次难得的换道超车机会。在这样一个重大选择关头,信创工程是自囿于以CPU为核心的传统信息系统替代,还是顺应技术发展趋势,主动开拓“CPU+GPU+DPU”新型计算架构新赛道,实现新兴技术产品领先和产业生态构建,是关系到我国信息技术产业继续采用“跟随发展”战略,还是采用“换道超越”战略的大是大非问题。
1. 尽快调整信创工程建设思路,将目前的国产化替代调整为应用创新
自2014年信创工程实施以来,我国信创工程已从党政机关电子公文系统,扩展到党政机关办公系统,并进一步在数字政府、数字金融和企业数字化转型等领域全面铺开。目前信创工程以国产化替代为主要实施路径,通过建立CPU、操作系统、数据库、中间件、PC终端、服务器等信创产品目录,要求在党政机关和重要领域的信息系统从信创产品目录中采购,逐步实现国产化替代。总体来看,信创工程的实施取得了明显成效,党政机关和国家重要信息基础设施领域的国产化率不断提升,国产信创产品和企业也得到较大支持而发展迅速。但是,国产化替代思路存在两个致命缺陷:一是产品技术永远落后于他人。通常情况下,我们现在确定的替代对象都是三年或更早以前国外厂商部署的,再加上我们自己研发还需要二年左右时间,等研发出来实现替代后,与世界先进水平已经落后至少三代以上;二是产业生态很难建立起来。替代一种产品相对比较容易,但是当一种产品尤其是像CPU、操作系统、数据库等基础产品实现替代后,在原有基础产品上开发的各种应用都必须与之适配,可能涉及上万甚至几十万级的应用重新开发适配,这是一个令人绝望的工程。因此,国产化替代绝非最佳路径选择,而是一种不得已而为之的手段。实际上,信创工程的最佳路径还是要从信创的本意和信创的初心去探讨。
信创工程是“信息技术应用创新工程”的简称,其主体是“信息技术”,手段是“应用”,目的是“创新”,也就是说实施信创工程的最终目标是要通过鼓励市场应用实现信息技术的创新,因此,信创工程的初心本没有国产化替代这个选项,在全球网信技术路线没有重大变化的情况下,国产化替代只是一种权宜之计,一旦网信技术路线发生重大变化,我们就要果断地将目前的国产化替代的信创工程路径调整为创新路径。
今天,全球计算技术路线变革的风口正加速到来,以X86为代表的“CPU单一核心”计算架构路线正在被以CPU+GPU+DPU为特征的“多元核心”异构计算架构取代。技术路线变革之际,也正是培育自主可控核心技术、打造安全可行产业生态之时。我国信创工程应抓住全球计算架构路线变革的重大战略机遇,将CPU+GPU+DPU异构计算路线确立为我国信创工程主流技术路线,在党政机关和国家重要信息基础设施中部署全球领先、自主可控的CPU+GPU+DPU异构计算路线,以应用促进我国CPU、GPU、DPU核心技术和龙头企业的形成,并带动相应产业生态的完善。
2. 将GPU、DPU、IPU、FPGA、ASIC等新型计算芯片纳入信创产品目录
目前,我国信创工程已将CPU领域的飞腾、鲲鹏、龙芯、海光、兆芯、申威等6家自主可控的领头企业及其产品列入信创产品目录,对我国CPU企业的快速发展起到了巨大的催化作用。但是,目前全球计算架构正在发生变革,CPU的核心地位正在快速下降,而GPU、DPU、IPU、FPGA、ASIC等新型计算芯片正在越来越多地取代CPU的地位各种功能,其在计算架构路线中的重要性越来越显著。信创工程在继续鼓励国产CPU不断创新,更多地占领国内市场份额的同时,也应兼顾国产GPU、DPU、IPU、FPGA、ASIC等新型计算芯片的发展,避免原有的“缺芯”状况还未缓解,又出现了新的、面积更大的“缺芯”问题。制定新的信创产品目录时,不仅要鼓励飞腾、鲲鹏、龙芯、海光、兆芯、申威等现有CPU目录体系中的企业,向GPU、DPU、IPU、FPGA、ASIC等产品延伸,也要鼓励其他新型计算芯片的发展,如在GPU领域的景嘉微、天数智芯等企业,在FPGA领域的安路科技、紫光同创等企业,在ASIC领域的寒武纪科技、阿里平头哥等,在DPU领域的中科驭数、芯启源、星云智联等企业。
3.开展国产CPU+GPU+DPU“多核异构”数据中心应用示范
国家网信领域主管部门应会同国家发展改革委和财政部制定国产CPU+GPU+DPU“多核异构”数据中心应用示范相关管理办法,鼓励政府部门和国家关键信息基础设施领域在数据中心建设时,采用“多核异构”技术路线,并鼓励采用国产CPU、GPU、DPU进行建设。要按照数据中心项目投资额的一定比例(不少于30%)采购国产CPU、GPU、DPU等计算芯片,并在公共通信和信息服务、能源、交通、水利、金融、公共服务、电子政务、国防科技工业等八个国家关键信息基础领域中,各选择1—3个典型应用开展3年左右的试点示范,并在10年内向全行业全领域全面推广。试点示范内容既要考虑数据中心的技术先进性,也要考虑国产CPU、GPU、DPU等计算芯片的比重,同时,要鼓励企业从芯片产品提供商向计算平台提供商转型。(涂群 张茜茜)
原创内容,转载必须注明出处(“交大评论”公众号),侵权必究。
声明:本文来自交大评论,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。