国产CPU的再进一阶

按照Counterpoint 的数据显示,2022年全球服务器芯片市场中,X86占了91%的份额,ARM占6%,其它芯片大约占了3%。

不过,在中国的服务器市场中,采用ARM架构以及其他架构的国产CPU,正越来越受大家欢迎。ARM有40%的市场份额在中国,同时美国投行Bernstein表示,目前在中国市场,ARM份额中大约15%为服务器市场份额,而其它架构的国产CPU,比如龙芯、海光、兆芯、申威等,在服务器市场也占了约10%的份额,这意味着在中国服务器市场,国产CPU已经拿下了约25%左右的市场份额了。


(资料图片)

中国是全球*的芯片消耗国,在最近几年需求迫切以及供应环境动荡等背景的推动下,中国正涌现不少优秀的CPU处理器芯片后备军。截至目前,国产CPU已经形成多条路线发展的模式,包括走X86技术授权路线的海光和兆芯,ARM指令集授权路线的华为鲲鹏和飞腾,自研指令集路线的龙芯和申威。

下面看一下六家CPU公司的具体实力。

01 龙芯:顶住质疑,迎来成长

8月1日,龙芯中科宣布,基于龙架构(LoongArch)的新一代4核心8线程处理器龙芯3A6000流片成功,代表了中国自主桌面CPU设计领域的最新里程碑成果。

龙芯架构是龙芯中科基于二十年的CPU研制和生态积累所推出的,包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分,近2000条指令。完全自主、技术先进、兼容生态是龙芯架构的三大特点。

可以说,龙芯中科是目前中国CPU企业中自主程度最高的企业之一,现已构建了面向嵌入式专门应用的龙芯1号、面向工控和终端类应用的龙芯2号、面向桌面/服务器类应用的龙芯3号系列处理器及配套桥片的完整产品矩阵。

主要应用:在信息化领域,国内数十家整机品牌推出了基于龙芯CPU的台式机、笔记本、一体机与服务器设备,已经广泛应用于电子政务办公信息化系统,并在金融、教育等应用中展开批量应用试点。在工控领域,国内上百家主要工控和网络安全设备厂商推出了基于龙芯CPU的工控和网安产品,包括工业PC、工业服务器、工业存储设备、DCS(分布式控制系统)、PLC(可编程逻辑控制器)、交换机、路由器、防火墙、网闸、网络监测设备、数据加密通信设备等。

根据龙芯2022年底透露的消息,该公司的竞争优势目前还是在工控业务领域。与此同时,龙芯也在布局服务器CPU。该公司透露,16核的芯片产品3C5000已经推出,32核3D5000也已研制成功。龙芯中科董事长胡伟武表示,“服务器市场是公司的增量市场,在未来会有比较大的机会。”

性能对标:近日发布的龙芯3A6000处理器是龙芯第四代微架构的*产品,较上一代龙芯3A5000桌面CPU,龙芯3A6000在相同工艺下单线程性能提升60%以上。龙芯称综合相关测试结果,龙芯3A6000处理器总体性能与Intel公司2020年上市的第10代酷睿四核处理器相当。

龙芯的优势与劣势

龙芯最突出的优势便是其完全自主的龙架构,在一众国产CPU中,龙芯也以“自主化程度最高”著称,这使其有着不被任何架构所约束与限制的底气。其次兼容是龙架构的另一个亮点。LoongArch架构遵循了RISC的基本设计思想,在设计时充分考虑兼容生态需求,融合了各国际主流指令系统的主要功能特性,同时依托龙芯团队在二进制翻译方面十余年的技术积累创新,能够实现多种国际主流指令系统的高效二进制翻译。

不过,龙芯的商业化落地难度同样极高,因此生态体系的建设也是龙芯的一大劣势。“将自主进行到底”的龙芯可以说进入了一个“生态孤岛”,要想打破生态壁垒,龙芯一方面要反向适配其他软硬件,解决兼容性问题,另一方面还要做到“自主”,构建基于LoongArch的软件生态。

对于软件生态来说,只有用户基数增长到一定程度,软件开发商才会正视用户的需求,自主的生态建设才能够越来越完善。如今对于普通用户来说,LoongArch的软件生态已经能够满足普通办公和影音娱乐,但是专业应用和游戏软件还有欠缺。未来龙芯的发展会越来越好,中国也需要龙芯这般走自主创新之路的企业,希望那些对于应用没有强需求的用户能够多给龙芯一些机会。

胡伟武表示,2023年将是非常关键的一年,龙芯将继续完善性价比和软件生态,争取CPU产品性能整体逼近或达到主流水平,希望Linux桌面生态能全面超过X86和ARM,并会开始打造自己的应用生态环境。对于生态体系的建设,胡伟武也给出明确的实现路径:“到2025年龙芯的生态体系初步建成,2030年要更加完善,2035年争取做到和Wintel、AA(ARM-Andriod)三足鼎立。”

02 申威:为超算而生

再看另一家走自研指令集路线的申威。

相比站在舆论风口的龙芯,申威的曝光率要低得多。申威早期采用Alpha指令集(来源于美国DEC公司),并基于此架构研制出首颗芯片SW-1;后续出于安全可控考虑,公司设计出完全自主可控的指令集SW_64,完全区别于原有Alpha指令集,主要面向军用等对安全性要求极高的特种领域,为其提供CPU处理器及其相关解决方案。目前在神威、太湖之光中使用的就是SW26010芯片。

主力产品:申威现已形成多线程处理器、单核处理器、多核处理器三大产品线。多线程处理器方面,公司产品为申威 26010,主要用于超算。单核处理器方面,公司产品为申威111,产品已达到国军标 B 级标准,可以面向军工、工控等领域应用。多核处理器方面,公司具有 221、411、421/421M 等一系列产品,满足桌面和服务器领域需求。

性能对标:在服务器领域,浮点运算算力相比于同期国外处理器毫不逊色。申威在研的 432、443 将分别采用第四代、第五代申威核心,综合性能将分别达到同期国际主流桌面 CPU 的 60%和 80%。此外,申威在研的 3232 为 32 核 CPU,主要面向云计算、大数据领域,综合性能预计为同期英特尔主流服务器 CPU 的 60%-70%。

申威的优势和劣势

由于申威自身的应用背景,申威的路相比龙芯要平坦得多。首先申威是军方项目,不仅不用面对IC设计公司最头痛的技术人才流失问题,还能在人力物力财力得到军方充足保障。其次,申威专注于超算领域,超算领域不像PC领域那样存在软件生态的掣肘。最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环,竞争环境要温和得多。

基于信创的应用,申威也一直积极布局软硬件生态建设,并联合业内优秀企业成立产业联盟,不过,申威本就更侧重于军用设备的应用场景,市场化能力较弱,应用生态构建可能会存在更多困难。还有一个遗憾就是预计申威后续仍将专注深耕原有领域,在民用PC市场,可能看不到申威的身影。

03 海光:国产服务器CPU芯片龙头

海光的CPU主要面向数据中心的服务器。

2016年,海光获得AMD的x86授权,此后海光基于*授权的x86架构不断进行自我研发,迭代升级。

目前,海光CPU系列产品海光一号、海光二号、海光三号已经实现商业化应用,海光四号、海光五号处于研发阶段。

海光一号是*代的CPU,产品型号有31xx、51xx和71xx系列。海光二号是第二代CPU产品,产品型号包括有32xx、52xx和72xx系列。根据产品分类,海光CPU产品可以分成海光7000系列,海光5000系列,还有海光3000系列。

海光7000系列产品最多集成32个处理器核心,*支持8个内存通道和128个PCIe接口,主要应用于高端服务器,主要面向数据中心、云计算等复杂应用领域。

海光5000系列产品最多集成16个处理器核心,*支持4个内存通道和64个PCIe接口,主要面向政务、企业和教育领域的信息化建设中的中低端服务器需求,并发处理能力和单核心处理器性能较为均衡。

海光3000系列产品最多集成8个处理器核心,*支持2个内存通道和32个PCIe接口,主要应用于工作站和边缘计算服务器,面向入门级计算领域。

主力产品:2022年,海光二号为主力销售产品,海光三号已经实现小批量销售。

出货情况:根据中国电信发布的2021-2022年服务器集中采购项目集中资格预审公告,国产化服务器占总招标的26.7%,其中海光服务器在国产化服务器中的占比为72%。中国移动2021-2022年PC服务器第1批集采及补采项目中,国产化服务器占招标的41.65%,其中海光服务器在国产化服务器中的占比达到47.4%。

性能对标:海光7285 CPU的SPECCPU2017的实测性能与 Intel在2020年(与海光7285同期)发布的6款至强铂金系列产品的实测性能总体相当。

海光的优势和劣势:首先看优势,海光拥有性能和生态两大优势。在性能优势上,海光*代、第二代CPU和*代DCU产品的性能均达到了国际同类型主流高端处理器的水平,在国内处于*地位。在生态优势中,海光CPU兼容X86指令集,处理器性能参数与国际同类型主流处理器产品相当,支持国内外主流操作系统、数据库、虚拟化平台或云计算平台,能够有效兼容目前存在的数百万款基于X86指令集的系统软件和应用软件,具有优异的生态系统优势。

再看劣势,海光的劣势在于海光信息虽然拿到AMD授权,但该架构局限于Zen1,且AMD首席执行官苏姿丰已证实不再向其中国合资公司授权新的x86 IP产品,即Zen2架构,这也意味着海光的自主化程度相对较低。还有一点,海光未获得桌面产品授权,根据海光官网介绍,其处理器产品支持服务器和工作站,没提及桌面系统;支持国内外主流操作系统,但没提到微软公司,也没有支持Windows的驱动下载链接。

04 兆芯:合资CPU的探路者

作为国产6大CPU中的兆芯,备受关注。这主要是因为兆芯与海光一样使用的是X86架构,不同的是海光的X86架构来源于AMD,兆芯的X86授权主要来自与VIA合资,VIA(中国台湾威盛公司)在上世纪90年代收购了美国拥有X86专利的公司 Cyrix和具有高性能x86微架构设计能力的centaur 这两家公司。获得了高性能X86芯片的合法生产权利和能力。

架构来源的不同给海光和兆芯这两家的应用导向也带来了一定影响,因为海光未获得桌面产品授权,而兆芯可以做到安装Windows。自主信息化建设“迫切”需要能满足桌面/服务器应用需求的CPU产品。兆芯就是完成这一使命的“宠儿”。

兆芯已成功研发并量产多代通用CPU,形成“开先”、“开胜”两大产品系列,实现“从双核心到八核心”、“从1.6GHz到3.0GHz”、“从处理器+芯片组方案到SoC单芯片方案”等多方面的发展与创新,具备自主演进发展的能力和条件。

产品应用:目前,基于兆芯新一代处理器(KX-6000/KH-30000),联想、同方、东海、海尔、锐捷、升腾、攀升等品牌已经推出了 20 余款不同形态的桌面 PC 及服务器产品,研华、研祥、盛博、威强电、信步、安勤、深惟、华北工控、汉智兴、智微、芯杰英、经纬天地、凌壹、海川智能、爱鑫微、众新等 30 多种工业主板、工业电脑模块和嵌入式计算平台,此外 30 多种网络安全平台也相继推出。

性能对标:通过 KX-6000 系列处理器横向对比,8 核心的 KX-U6780A 产品性能与第七代的 4 核心英特尔 i5 整体水平仍存在差距,尤其是单核性能不足 7 代 i5 一半,但整数性能方面对英特尔 i5 实现了反超。

兆芯的优点与缺点

优点:兆芯掌握自主通用处理器及其系统平台芯片研发设计的核心技术,全面覆盖其微架构等关键领域,构建了较为完整的知识产权体系,支撑国家产业信息安全和国家数字经济实现高质量发展。其次,兆芯的基本要求是兼容政府PC上跑的所有通用软件,必须使用x86的指令集架构,与此同时兆芯也可以得到国家巨额资金扶持。

缺点:市场份额较小,尽管兆芯的纸面性能优良,但在国内的党政军领域,兆芯在市场占有率上并不高。在民用市场上,兆芯没有足够的价格和性能优势。兆芯的产品也不够完善,缺乏实物接口支持。另外,由于VIA与Intel协议到期的因素,兆芯只能使用2018年之前的x86指令集,无法使用2018年以后的新指令,这也意味着兆芯未来的X86产品升级遇阻。

05 飞腾:党政信创中坚力量

作为国产CPU的主力军,飞腾公司也是一支不可忽视的力量。2020年飞腾交付芯片150万片,比2019年的20万片大幅增长650%,营收也达到了13亿元。

飞腾以ARM指令集为基础自研内核构架,已形成了完善的CPU产品线,在党政信创市场占有很大优势。其产品主要包括腾云S系列、腾锐D系列和腾珑E系列三大系列,为从端到云的各类设备提供核心算力支撑。其中“飞腾腾云S”面向高性能服务器产品领域,为服务器和数据中心应用提供强算力、高并发的计算能力;“飞腾腾锐D”面向高效能桌面产品领域,打造高性能、高安全的单用户*体验;“飞腾腾珑E”面向高端嵌入式产品领域,提供定制化的、契合各行各业嵌入式应用的解决方案。

主力产品:飞腾腾锐D系列产品线销量*,2021年出货量超过200万片,应用到政务、金融、电信、能源、交通等领域。

性能对标:2020年7月,飞腾发布的新一代可扩展多路服务器芯片腾云S2500,具有可扩展、高性能、高可靠等优势,可对标 Intel 在 2016 年发布的至强 E5。目前,长城、浪潮、清华同方、中科曙光、中兴等业界*的服务器厂商均已基于腾云S2500芯片推出2路、4路和8路服务器,并获得了市场的认可。

出货情况:面向各类应用场景,飞腾构建了1000多个从端到云自主可信的行业联合解决方案,芯片交付累计超过600万片,在国产CPU市场上占据了半壁江山。飞腾公司副总裁王瑞彬表示,飞腾在全国政府信创中标超过300万片,市占率超过50%,有力支撑了国家信创工程推进,并逐步向更复杂的电子政务、智慧政府领域延伸。

飞腾的优势和劣势

飞腾的优势有三:

其一,飞腾已获得 ARM v8 架构层级*授权,其技术授权的确定性和可持续性较强,目前在移动终端市场,AA体系占据统治地位,虽然主机和服务器端与移动端授权有所差异,但不需要研发自己的编译器,可兼容 AA 体系的软件生态,大幅降低研发的技术门槛、时间和资金成本。

其二,飞腾产品谱系不断完善,产品性能大幅提升。

其三,合作厂商不断扩展,目前,飞腾合作伙伴数量超过 1000 家、累计研制了 6 大类900 余种整机产品,已经适配和正在适配的软件和外设超过 2400 种,并发布了四大类、80 多个行业联合解决方案,覆盖信创、电信、金融、能源、交通、医疗、数字城市、工业制造等行业。同时,2019 年以来,中国长城与各地方政府展开合作,共建信创产业生态基地。

根据自主可控原则,飞腾是存在一些瑕疵的。去年高通与Arm在美国地方法院就知识产权许可问题开展法律斗争,同时也给中国ARM CPU和整机企业带来诸多警示。ARM不仅可以终止芯片架构或IP授权,也可以改变其商业模式,即绕过芯片厂商直接施压终端厂商,胁迫终端厂商不得使用特定品牌的ARM CPU。最近这两年的一系列事实情况证明,基于ARM授权模式来发展国产芯片,也可能面临受制于人的风险。

此外,相比同样采用ARM架构的鲲鹏,飞腾在商业市场竞争中也存在一些劣势。下面分析一下鲲鹏究竟具有哪些优势。

06 鲲鹏:国产CPU潜力股

华为官网显示,鲲鹏系列芯片目前只有鲲鹏920一款,该处理器2019年发布,采用7nm制造工艺,基于ARM v8.2架构授权,由华为自主设计完成。

鲲鹏 920 有 64 个内核,主频为 2.6GHz,与 8 通道的 DDR4内存配对,带宽比其他竞争系统快 46%。其他板载配件包括两个100G RoCE 端口,支持 PCIe Gen4 和CCIX。在 SPECint(一个基准测试套件)上,鲲鹏920 的得分超过 930 分,比行业基准高出近 25%,且功率比“行业目前*者低 30%”。

性能对标:鲲鹏 920已实现通用计算最强算力,性能优于其他厂商的同类型芯片。有测试结果显示,48核心的鲲鹏 920可以与Intel至强8180媲美,64核心的鲲鹏920甚至超过Intel至强8180。

出货情况:2022年10月的统计显示,中国移动2021-2022年PC服务器集采第1批次及补采共采购204696台服务器,国产芯片服务器占比41.65%,鲲鹏占21.90%。2022年4月,中国移动2021年-2022年PC服务器集采第2批次开始招标。其中,(标包1-6)采购47845台服务器,国产芯片服务器占比26.41%,鲲鹏占比15.05%;(标包7-9)采购规模为34400台,国产化率为61.04%,鲲鹏占比19.95%。

中国移动本轮PC服务器集采中,采用鲲鹏芯片的服务器已达58901台(占比20.53%),整体国产服务器占比将达41.43%。鲲鹏的优势和劣势

鲲鹏的优点主要有两方面,一方面即性能突出,特别是几乎在所有指标上都优于国际同类产品。另一方面,鲲鹏是华为面向政企市场,与地方政府和合作伙伴共同打造鲲鹏产业生态、构建具有国际竞争力的通用计算技术路线,可以得到地方政府的大力支持。2020年4月,成都市印发《关于加快培育发展鲲鹏产业工作方案的通知》,明确2025年成都鲲鹏产业规模超过500亿元,并成为全国*的鲲鹏软件生态基地、鲲鹏硬件制造基地和鲲鹏应用示范基地,该案例为鲲鹏产业体系的推进提供了重要模板。

其缺点也具有两方面,一方面即ARM架构的不自主性,另一方面则为制程工艺的局限。不过,当前其鲲鹏芯片正沿着“量产一代、研发一代、规划一代”的策略持续升级产品。作为一名国产CPU的潜力股,鲲鹏处理器必将为整个产业链带来新的发展机遇。

CPU是支撑数字底座生态架构发展的基础,也是决定信创底层发展逻辑的关键所在。随着中国产业链体系的不断完善,在基础软硬件领域,国内厂商正在实现从无到有,从可用到好用的发展,研发实力逐渐强大。我们有理由并且应该坚信,国产CPU 可以做的更好!

关键词: