阿里平头哥发布堪称业界“最能打”的全球首款5nm服务器芯片
来源 | 物联网智库2021-10-25 16:47:09
10月19日,阿里云栖大会正式拉开大幕,在今天上午的主论坛期间,达摩院院长、阿里云智能事业群总裁张建锋带来了业界期待已久,堪称业界“最能打”的全球首款5nm服务器芯片——倚天710

导 读:10月19日,阿里云栖大会正式拉开大幕,在今天上午的主论坛期间,达摩院院长、阿里云智能事业群总裁张建锋带来了业界期待已久,堪称业界“最能打”的全球首款5nm服务器芯片——倚天710。

  1

今天,再次回归线下的云栖大会无疑引爆了整个科技圈,要说有哪家企业能把自己的活动做成整个科技圈的“晚会”,那一定要非阿里云栖大会莫属了。  2

在今天上午的主论坛上,阿里达摩院院长、阿里云智能事业群总裁张建锋带来了以“云深处,新世界”为主题的演讲。如果这个世界上有一家公司对“云”深信不疑,那一定是阿里巴巴。张建锋认为“云原来是IT的一部分,但现在IT已经变成了云的一部分。”

阿里始终坚持“一云多芯”的战略,向下屏蔽了硬件的差异性,向上提供一致的服务。而在这一最核心的环节,阿里巴巴旗下半导体公司平头哥也重磅发布了此前业界早已期待已久的自研云芯片——倚天710。

业界最能打的ARM服务器芯片

张建锋介绍,倚天710是基于Arm最新的ARMv9架构设计,采用了业界最先进的5nm工艺制程,单芯片容纳的晶体管数量高达600亿,堪称服务器芯片界性能“最能打”的Arm服务器芯片。  3

因为5nm工艺对能量密度、芯片内部结构的布局提出了极高的要求。为此,平头哥在研发过程中灵活调度了 30 种不同的 EDA 软件、深度定制时钟网络和定制 IP 技术。此外,他们还采用了先进的多芯片堆叠技术,最后成功确保了芯片性能、功耗的优化。

针对云计算场景中的高并发、高性能、高能效的需求,平头哥为倚天710做了深度定制化工作,同时也引入了众多自研新技术,将领先的的芯片设计技术与云场景的独特需求进行了结合,实现了在性能和能效比上的突破。

为解决核数众多条件下的带宽瓶颈,平头哥对片上互联作出特殊优化,采用新的流控算法,降低系统反压,有效提升了系统效率和扩展性,使单核高性能有效地转化为整个系统的高性能。此外,通过新的系统地址到DRAM地址的转换机制,倚天710支持安全、非安全隔离、多 NUMA、异常通道隔离多种特性,DRAM读写效率大幅度提升。  4

倚天710内含了128个CPU内核,主频最高达到3.2GHz,同时兼顾性能和功耗;而在内存和接口方面,倚天710集成了业界最领先DDR5、PCle5.0等技术,能够有效提升芯片的传输速率,适配各种云场景所需。

张建锋介绍,在全球权威CPU基准测试集SPECint2017上,倚天710的分数达到了440分,性能超过业界标杆20%,能效比提升50%以上,能有效帮助数据中心节能减排。  5

阿里云在全球管理着超过150万台服务器,这些大规模集群式的服务器同样带来了许多问题,阿里巴巴通过自研技术和创新不断降低整体计算的成本、解决高能耗等问题,比如在张北的数据中心,常年通过自然风供电,杭州的数据中心采用液冷解决高能耗问题。

除了在服务器芯片层面急流奋进,阿里巴巴也在现场发布了磐久服务器。

磐久自研服务器系列面向云原生时代,是首款搭载自研芯片倚天710,兼顾高性能计算、高性能存储的服务器系列,该款服务器将在今年部署,为阿里云自用。

张建锋介绍,磐久服务器系列采用灵活模块化设计,可实现计算存储分离,包括高性能计算系列、大容量存储系列、高性能存储。  6

随着 “倚天”出鞘和“磐久”的面世,阿里云也完善了全栈云基础设施的最后一环,实现从芯片、部件到整机的技术及架构创新和自研。

云计算提供弯道超车的机遇

倚天710是阿里云推进“一云多芯”战略的重要一步,同时也体现了阿里巴巴弯道超车的决心。

阿里在造芯方面一直以来保持着高调的态度,并且很早就开始布局。

在投资布局方面,2016年阿里投资软件定义网络(SDN)芯片公司Barefoot、翱捷科技、寒武纪、深鉴、耐能等多家芯片企业。今年10月,阿里巴巴和百度还战略入股了飞腾信息技术有限公司——一家基于Arm架构的国产CPU开发商。

在自研方面,2017年阿里巴巴成立达摩院并组建了一支由半导体行业顶级专家组成的技术团队。在2018年,阿里巴巴又全资收购了大陆唯一拥有自主嵌入式CPU IP core的中天微,并在同年的云栖大会上与达摩院自研芯片业务整合成阿里最强芯片公司“平头哥”。

2019年,平头哥便推出了首枚AI推理芯片“含光800”,并进入量产,2020年开始已经在阿里的超级数据中心大规模部署。  

从09年开始,经过十余年的发展,阿里已经建立起一个庞大、完整的软硬件生态体系。而这次阿里进军自研服务器CPU领域,发布倚天710的背后可能也是整个Arm生态的躁动和进攻发起。

从云的最底层设备——服务器来看,长期以来X86架构的服务器一直占据着市场的主导地位,并且构建起了一道成熟的商业生态高墙,占据着绝对的专利和标准制定话语权。根据天风证券数据显示,在服务器市场,国内X86架构市场占比高达96.4%,基本上由英特尔所垄断,而Arm架构自2018年下半年迎来服务器转折点后,迅速占领了国内0.9%的市场份额。

Arm架构的迅速发展,在很大程度上也带给了云厂商更多的积极性。近两年来,包括Ampere、富士通、Mavell、亚马逊、华为等厂商都在发力造芯。2018年11月,全球第一大云服务商亚马逊AWS推出基于Arm架构的首款AWS Graviton服务器芯片,并且在2019年12月又推出采用Arm Neoverse N1内核的7nm第二代Graviton服务器芯片。

而在国内,华为旗下海思半导体早在2019年1月就推出了基于Arm架构的7nm 64核服务器芯片鲲鹏920,以及服务器“泰山”。不过受制于制裁,下一代的“鲲鹏930”无法如期发布;百度则在2018年发布AI芯片“昆仑”,另外据报道百度第二代昆仑芯片业已流片成功,将于2021年下半年量产。

8

阿里倚天710“出鞘”虽迟但到,并且是业界首发5nm芯片,还是让阿里看到了无限的希望。

不过,张建锋表示,倚天710并不会出售,主要是阿里云自用,是阿里云“一云多芯”战略的重要一步。“我们将继续与英特尔、英伟达、AMD、Arm等合作伙伴保持密切合作,为客户提供更多选择。”

阿里的全栈布局和野心

在三年时间内,平头哥完成了从发布首款RISC-V处理器玄铁710、首款云端AI推理芯片含光800到首款通用服务器芯片倚天710的“三级跳”。

除了今天的主角倚天710之外,云栖大会现场,张建锋宣布玄铁CPU已出货超25亿颗,成为国内应用规模最大的国产CPU。玄铁系列处理器是平头哥面向IoT端侧应用开发的自研CPU,采用自研和RISC-V两大架构,覆盖从低功耗到高性能等各类场景,玄铁CPU被广泛应用于机器视觉、工业控制、车载终端、移动通信、多媒体和无线接入等领域。  9

而在本次大会上,阿里云还宣布开源四款玄铁RISC-V系列处理器,玄铁E902、E906、C906和C910,覆盖高、中、低应用场景,并开放相关的工具及系统软件。全球的开发者都可以通过平头哥Github和芯片开放社区(Open Chinp Community)下载玄铁源代码。

加上阿里第一颗已经实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户实现的云端AI推理芯片“含光800”和今天的“倚天710”,阿里平头哥已拥有处理器IP、AI芯片及通用芯片等产品家族,其端云一体化战略也愈发清晰。  

10

而随着5G通信技术的发展,未来计算和数据将加速向云上迁移,从而催生更多云上新物种。张建锋认为,就像最早有了电,后来有了电网,这样的基础设施建设完成之后,出现了丰富的电器,改变了我们的生活和生产方式。

云也一样,未来将出现无数的云上新物种,张建锋表示,“这样的技术爆发已经有了很坚实的基础,我们完成了基础设施的建设,即将看到“电器”爆发一样的时代机遇。”