本文将重点围绕国产CPU的发展历程与当前产业链各领军企业的布局情况作详尽解读(并包含特大号独家整理的最新进展),具体如下:
1、国产CPU发展历程回溯2、飞腾:PK生态的主导者3、鲲鹏:快速崛起的领导者4、海光:性能领先的实干者5、龙芯:完全自主的引领者6、兆芯:合资CPU的探路者7、申威:为超算而生的强者
01
国产CPU发展历程回溯
回溯中国的国产CPU发展历程,可分为三个阶段:
起步:上世纪50-70年代。1956年,半导体科技被列为国家新技术四大紧急措施之一。此后,中科院计算所、109厂、半导体所先后成立,锗晶体管、硅平面晶体管、集成电路等半导体器件相继实现突破,为109乙机、109丙机、156机的诞生分别提供了基础。1975年,伴随大规模集成电路技术的兴起,我国第一台集成电路百万次计算机013机研制成功。这一时期独立自主的产业发展为我国CPU事业打下了坚实基础。转折:上世纪80-90年代。1985年,中科院计算所、半导体所有关研制大规模集成电路的单位和109厂合并,成立中科院微电子中心。但这一时期,由于政策支持力度有所减弱等原因,产业完全市场化但自主性不足。提速:21世纪初至今。从“十五”开始,国产CPU自主性的问题再度提上议程,产业政策不断加码。泰山计划、863计划等催生了一批国产CPU品牌,2002年,我国首款通用CPU——龙芯1号(代号X1A50)流片成功。2006年,“核高基”重大专项推出,“高”即为高端通用CPU。2014年,我国发布《国家集成电路产业发展推动纲要》,国家集成电路产业投资基金(简称国家大基金)第1期成立,主要投资集成电路制造企业。2019年,国家大基金第2期成立,主要投资应用端。在经历数十年的艰辛探索后,目前,国产CPU产业已初具规模,涌现出一批领军企业。我们根据CPU指令集体系进行分类:1)复杂指令集(CISC)下,以X86架构为主,国内代表厂商包括海光、兆芯;2)精简指令集(RISC)下,涉及ARM架构、MIPS架构、Alpha架构等,国内代表厂商包括鲲鹏(ARM)、飞腾(ARM)、龙芯(MIPS)、申威(Alpha)等。
02
飞腾:PK生态的主导者
飞腾CPU由国防科技大学研究团队创造,起步于1999年。目前是国资比例最高(CEC通过中国长城控股)的国产CPU企业,是聚焦国家战略需求和重大项目的CPU国家队。在以往信创项目中具有较强的实战经验。曾先后尝试X86、Epic、SPARC、ARM四个指令集,并以SPARC开源代码为基础设计了FT-1000、FT-1000A、FT-1500等CPU。之后出于生态考虑,获得了ARM指令集授权,集成全自主处理器内核,形成了覆盖桌面、服务器和嵌入式等领域的完整产品线。在生态建设上,飞腾作为独立的芯片供应商,只提供芯片,秉承开放策略,与所有整机厂商都是对等的开放合作的关系,且全栈各层次生态伙伴众多,用户有更多选择,供应链安全性有保障。
服务器CPU:FT-2000 /64于2017年发布,集成64个FTC662处理器内核,16nm工艺,主频2.0-2.3GHz,主要应用于高性能服务器领域,性能与Intel Xeon E5-2695V3系列相当。在ARM v8指令集兼容的产品中,FT-2000 /64在单核计算能力、单芯片并行性能、单芯片cache一致性规模等指标上处于先进水平。2019年5月,基于FT-2000 /64的服务器产品群在福州数字中国峰会上发布。芯片能效(性能功耗比)方面,与其他芯片相比飞腾优势明显;数据库等应用的实测性能对比其他一些国产芯片也相对占优。
桌面CPU:2019年,飞腾发布FT-2000/4,整体性能与Intel Core I5系列相当。FT-2000/4集成4个FTC663处理器核,16nm制程,主频2.6-3.0GHz。在SPEC 2006测试中,全芯片实测整数计算得分61.1,浮点计算得分62.5,相比上一代的FT-1500A/4提升近1倍,访存带宽提升3倍。目前,FT-2000/4已和国产银河麒麟操作系统完成适配工作,包括联想、长城等整机厂商正在开展终端和板卡研制。生态健全完善,融合移动生态。飞腾与国内1000余家软硬件厂商构建起了国内最完善最庞大的生态体系,仅2019年就新开案板卡设计430余款,已与千余家软件进行了适配和应用。此外,飞腾兼容安卓生态,在飞腾台式机上可以运行200万级安卓应用,极大拓展了飞腾生态。具备系统级的安全可信:飞腾是唯一一个完整定义并实现了安全处理器平台架构规范的芯片厂商,考虑了密码加速引擎、密钥管理、可信启动、可信执行环境、安全存储、固件管理、量产注入、生命周期管理、抗物理攻击及硬件漏洞免疫等完整的安全要素,可以有效防止处理器出现安全短板,提升处理器的安全性。PK体系赋能信息技术应用创新。飞腾CPU积极参与CEC(中国电子集团)主导的PK(即飞腾Phytium CPU和麒麟Kylin操作系统)体系建设,打造安全可靠的中国计算机软硬件基础体系国家队。按:2020年7月23日,飞腾发布新一代高可扩展多路服务器芯片腾云S2500,作为FT-2000 的升级版,腾云S2500在多路扩展能力方面取得突破。
同时,飞腾三大主力产品线,也进行了重新梳理和品牌升级:腾云、腾锐、腾珑。
03
鲲鹏:快速崛起的领导者
鲲鹏是华为计算产业的主力芯片之一。为满足新算力需求,华为围绕“鲲鹏 昇腾”构筑双算力引擎,打造算、存、传、管、智五个子系统的芯片族,实现了计算芯片的全面自研。鲲鹏系列包括服务器和PC处理器。近年来,华为先后推出Hi1610、Hi1612、Hi1616等服务器CPU产品,不断实现主频与核数的提升,并最终开发出当下的旗舰产品鲲鹏920与鲲鹏920s,分别用于服务器和PC机。
鲲鹏具备“端边云算力同构”的优势。鲲鹏CPU基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。
2019年1月,华为宣布推出鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。鲲鹏920采用7nm制造工艺。规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。
鲲鹏生态蓬勃发展。华为坚持硬件开放、软件开源,使能合作伙伴,推动鲲鹏计算产业发展。目前,已有超过12家整机厂商基于鲲鹏主板推出自有品牌的服务器及PC产品,华为还与产业伙伴联合成立了至少15个鲲鹏生态创新中心。作为鲲鹏计算产业底座的鲲鹏处理器,华为将秉承量产一代、研发一代、规划一代的演进节奏,落实长期投入、全面布局,后向兼容和持续演进的战略,高效满足市场需求。
不过,华为由于是垂直整合型企业,其业务覆盖了从芯片、整机、操作系统、云、软件、集成、销售、服务等各个环节,市场上具有极强的排他性。虽然其在近期国产基础软硬件市场上表达了与其他厂商开放合作的态度,但依然不会单卖芯片,只卖整机和主板,希望其他厂商拿现成的解决方案帮助其开拓市场。这种方式下,下游集成商和整机厂商的利润空间非常狭窄,且发展权受限。按:刚刚(12月28日),搭载24核鲲鹏920处理器的华为擎云W510台式机参数曝光,该机型定位面向政企客户,还集成了华为自研的海思1GB独显。
04
海光:性能领先的实干者
海光芯片性能领先,海光信息技术有限公司是国内高性能计算机龙头中科曙光的参股子公司。2014年,在天津注册成立;后历经数次股权变更,2018年10月,中科曙光以5.5元/股受让海光信息1.948亿股股权,受让后合计持有海光信息36.44%股权,为海光信息第一大股东。2016年,海光信息同AMD达成合作,共同合资成立两家子公司,引入X86架构授权。其中,成都海光微电子技术有限公司拥有授权IP所有权,并负责芯片生产,成都海光集成电路设计有限公司负责芯片设计及销售工作。基于AMD提供的Zen1架构,海光开发出8核心桌面版CPU Dhyana、32核心服务器版CPU Dhyana Plus。
海光信息扭亏为盈,协同效应明显。2018年下半年,海光CPU实现量产,并陆续投入商用,主要客户为国内服务器整机厂商。2019年,海光实现营收3.90亿元,净利润为0.60亿元,首次扭亏为盈,体现出与中科曙光等厂商的协同效应明显。一方面,中科曙光拥有优质客户资源、良好销售渠道;另一方面,海光CPU满足国产化需求,将受益于以“中国芯”为底座的IT产业崛起。
近期,中国电信发布服务器(2020年)集中采购项目货物招标集中资格预审公告,公告显示,H系列服务器共集采11185台,CPU类型为鲲鹏 920系列处理器或海光Dhyana系列处理器,标志着国产CPU已在技术复杂度较高的运营商市场实现了规模化的产业落地。不过,海光技术的后续升级可能存在一定难度(AMD只授权了上一代架构 Zen)。另外,海光不支持移动生态,在移动生态方面劣势较大。
05
龙芯:完全自主的引领者
龙芯是我国最早研制的高性能通用CPU系列。2001年,龙芯起步于中科院计算所,曾得到863、973、核高基等项目的支持,先后成功流片我国首款通用CPU龙芯1号、首款64位通用CPU龙芯2B、首款主频超过1GHz的通用CPU龙芯2E、首款四核CPU龙芯3A等,完成底层核心技术的积累。
2010年,中科院、北京市政府共同牵头出资,龙芯中科技术有限公司正式成立,开始产业化运作。但龙芯基本上是民营企业,其目前的注册资本2.499亿元,有八个股东,其中中科院计算所(国资)25.21%,北京天童芯源科技公司(胡伟武个人投资260万元,占47.54%;其他股份为早期高管所有)25.21%,龙芯员工持股平台8.4%,其他5个股东是民间资本(上海鼎晖华蕴等)41.18%。
龙芯坚持走自主创新与生态建设之路。龙芯走市场带动技术的道路,通过体制内市场引导,带动技术进步,再参与体制外市场竞争。基于MIPS架构,龙芯形成了自主指令集LoongISA,处理器核心的微结构和物理设计全部自主研发,并取得了500多项专利。龙芯学习Intel Google Apple的商业和技术模式,打造从端到云开放的全产业链生态体系,实现OS的跨平台兼容。目前,龙芯共有三个产品系列定位。3号大CPU面向桌面/服务器类应用,定位Intel酷睿/至强系列;2号中CPU面向工控和终端类应用,定位Intel阿童木系列;1号小CPU面向特定应用与需求,曾用于北斗卫星、石油勘探、智能设备(门锁、水表、电表)等方面,实现“上天入地,守卫国门,保护家门”。
龙芯通用CPU在迭代中发展:第一代,基本可用。3A1000、3B1500单核性能较低,SPEC CPU2006测试分值仅2-3分,打开20M文档需要33秒,用户体验一般。第二代,可用。3A/B3000四核处理器采用28nm工艺,主频1.35-1.5GHz,单核性能达到10-11分,超过凌动系列,打开20M文档仅需6秒。具有安全自主程度高、整机厂商品类多、国产化桥片方案等特点。目前,累计出货超过30万颗,是此前信创工程上份额最大的通用CPU。
06
兆芯:合资CPU的探路者
兆芯系列CPU由上海兆芯集成电路有限公司推出。公司成立于2013年,由上海市国资委下属企业和台湾威盛电子合资成立。公司基于X86架构,成功研发并量产多代通用CPU,形成“开先”、“开胜”两大产品系列,实现了“从双核心到八核心”、“从1.6GHz到3.0GHz”、“从处理器 芯片组方案到SoC单芯片方案”等多方面的发展与创新,具备自主演进发展的能力和条件。
主力产品性能较好。2019年6月,兆芯在上海正式发布新一代16nm X86处理器产品——开先KX-6000和开胜KH-30000。新一代兆芯处理器是首款主频达到3.0GHz的国产通用处理器,支持双通道DDR4-3200内存,采用SoC设计,包含CPU、GPU和芯片组,芯片集成度进一步增强,性能功耗比上一代产品提升3倍。KX-6000适配win7、win10等主流操作系统,SPEC 2006 INT RATE成绩为170分,单芯片性能已经达到7代i5的同等水平,应用体验大幅提升。
积极开展前瞻研究。兆芯计划于2021年推出开胜KH-40000系列CPU,基于16nm工艺,32核心且支持双路互联,专门面向高性能服务器产品市场。此外,兆芯已着手7nm以下工艺产品的定义和研发工作,作为开先KX-7000系列,延续SoC设计方案,在内存、USB、PCIe等规范方面将瞄准国际同期主流水准。兆芯生态具有优势。兆芯在实现技术创新与产品进步的同时,始终保持开放合作,最大化兼容X86生态的优势。兆芯CPU广泛应用于电脑整机、笔记本、一体机、服务器和嵌入式计算平台等,能够为党政办公、金融、教育、交通、网络安全、能源等行业提供可靠的解决方案。
07
申威:为超算而生的强者
申威CPU由上海高性能集成电路中心研制,基于DEC公司的Alpha架构,并进行了指令集扩展和微结构自主创新,成功应用在国产超级计算机中。在探索中迭代发展。2006年,申威1单核CPU研制成功,130nm工艺,主频900MHz。2008年,申威2双核CPU推出,同为130nm工艺,主频1.4GHz。2010年,申威1600十六核CPU推出,65nm工艺,运用于神威蓝光超算。2012年,申威1610、410相继推出,均为40nm工艺、1.6GHz主频,分别用于服务器和PC。申威现已形成高性能计算CPU、服务器/桌面CPU、嵌入式CPU三个系列产品线。
申威432、443、3232在研。申威432、443均为4核CPU,分别采用第四代、第五代申威核心,主频将分别达2.2-2.5GHz和2.8-3.0GHz,综合性能将分别达到同期国际主流桌面CPU的60%和80%。申威3232为32核CPU,主要面向云计算、大数据领域,综合性能预计为同期英特尔主流服务器CPU的60%-70%。申威信息安全产业联盟应运而生。目前已有包括上海高性能集成电路中心、中国仪器进出口(集团)公司、中电科技(北京)有限公司等在内的50多家成员,覆盖芯片设计、基础软件、工业控制、整机及方案、定制服务等多个行业领域。2020年3月,统信UOS也已完成对申威421系列、1621系列机型的适配。