过去多年,有关芯片性能的讨论是毫无疑问的头条新闻,但硬件设计人员同样关心功耗。因为当芯片使用更多功率时,这意味着更高的性能,但也意味着更多的热量,设计人员需要找到散热的方法,否则硅会熔化。而且您拥有的一切即使可以运行得更快,但不会持续太久。
因此,智能手机和 PC 设计师几十年来不得不走这条微妙的路线。几乎同样长的时间里,他们一直在乞求英特尔 ( INTC ) 和AMD ( AMD ) 在不牺牲太多性能的情况下制造功耗更低的芯片,但两者都未能实现——英特尔的 Atom 就是这项努力的主要成果。
关于这个为什么很重要的最好解释来自史蒂夫乔布斯。在他之前的一个WWDC 主题演讲傻姑娘,乔布斯向开发人员解释了为什么 Apple 在 2005 年将 Mac 的处理器从 PowerPC 切换到 Intel。
在他看来,重要的是产品,而不是芯片,由于散热问题,Apple无法使用PPC芯片制作他们想要的产品。15 年后,苹果在 WWDC 2020 上在 Mac 上从英特尔过渡到基于 ARM 的苹果芯片时,他们从大师那里得到了启示:
现在,在科技媒体上,每瓦性能开始受到更多关注,尤其是在像 AnandTech 这样的信息输出口。
AnandTech 的极客在测试这些东西方面比他们在数据可视化方面要好得多,但是正如您在 Y 轴上看到的那样,有他们的性能基准,而在 X 轴上是运行该基准序列所需的总能量芯片。稍后我们将整理这张图表,但这种两轴外观——性能和功耗——是硬件设计人员评估芯片的方式。这是 ARM 芯片的主要优势,尤其是苹果目前的优势。
它们没有笔记本电脑的可比功率测量值,但正如您在左上角的符号中看到的那样,Apple 的“高性能”A15 智能手机内核(深灰色)在性能上被您能买到的最快的笔记本电脑芯片AMD Ryzen 5950X更快。
在本文中,我们将通过对比较苹果的A15、谷歌的Tensor、高通主导的安卓旗舰手机芯片骁龙 888和三星的 Exynos 2100四种芯片,来获得更好的对比结果。
当前的移动芯片和现在越来越多的 PC 芯片都有两种类型的 CPU 内核,其中一种用于一般逻辑操作。这种架构被ARM 称之为“big.LITTLE”。LITTLE 内核可实现高能效,它们可以执行大多数任务,这也是大多数智能手机能够获得良好电池寿命的原因——它们可以在消耗很少电量的情况下完成大多数事情。大核心大多处于空闲状态,但它们会在重负载下启动。操作系统决定将任务发送到哪些内核。
让我们从 CPU 的高效内核开始进行这个讨论。
正如你所看到的,这是苹果真正摧毁安卓竞争的地方。他们完成基准测试的速度比第二好的高通公司快 3.5 倍,同时仅使用 40% 的能量来完成任务,主要是因为它完成得更快。
所有这些图表中的谷歌和三星点都会很有趣,因为三星帮助设计和制造了谷歌的 Tensor。每个人,包括我,都认为它与三星的 E2100 相同,但在那里有谷歌的 AI/ML 单元。但这并不完全正确。虽然它们很相似,但谷歌对 CPU 和 GPU 内核做了一些不同的设计选择。
在效率核心方面,谷歌决定比三星从 ARM 的库存 A55 核心获得更高的性能,所有这些芯片都使用 A55 核心,除了苹果的。但成本是 17% 的瓦数消耗,以及 10% 的能量用于完成基准任务,即使它完成得更快。尽管 S888 是由三星制造的,但高通在这方面领先于三星。苹果领先于所有这些。
转向高性能内核:
我们看到的大致相同:
苹果对高通的领先并不像高效内核那样显著,但他们仍然以 60% 的速度完成基准测试,并且使用的能源减少了 21%。苹果的芯片在全负载时的功率实际上比高通的高,但由于它完成得更快,所以它消耗的总能量更少。
高通也通过采用 ARM 的 X1 核心,在性能方面扼杀了三星,所有 Android 芯片高性能核心都基于该核心。
在性能核心上,谷歌在效率核心上做出了相反的决定。他们决定稍微调低性能并节省电量。
苹果真的把它的芯片带到了高通和三星难以企及的高度,所以安卓芯片制造商决定在 big.LITTLE 三明治中添加一个中间层。在我看来,这不是很好。
在这里,我们看到了 Google 在 Tensor 上的最大设计选择。三星对 ARM 的 A78 内核的实现比高通的差很多,以至于他们决定恢复到上一代 A76 并节省能源。但在这个过程中,他们的中核性能比苹果的效率差,但功耗却是苹果的三倍。
Apple 在这里对所有人的领先是非常明显,您可以理解为什么他们不需要中核,而是在芯片上留出更多空间来放置他们喜欢放入的其他东西。
在每瓦性能方面,苹果的领先优势更显而易见,而高通则遥遥领先。
效率核心是 A15 赚钱的地方。
GPU 功耗更难隔离,因此这里 AnandTech 在基准测试完成期间使用来自手机的持续瓦数功耗。
在性能方面,Apple 的领先优势显而易见,但两款 iPhone 13s 的功耗都比搭载骁龙 888 的 Galaxy S21U 或 Pixel 6 都要高。但这种额外的功耗为 Apple 提供了更高的性能,以至于它们仍然是每瓦性能的王者在图形方面也是如此。
高通的实现仍然是安卓芯片中最好的。谷歌选择调低三星 GPU 的功耗,在此过程中对性能造成了重大影响。
真正促使谷歌制造自己的芯片的是高通芯片的弱人工智能和机器学习性能。Apple 已经为此努力了一段时间,他们的机器学习核心和相关软件仍然是智能手机中最好的。但总的来说,谷歌是人工智能之王。没有人比谷歌更长时间、更努力地使用人工智能,但他们想要添加的功能在高通或三星的硬件上运行速度不够快,无法提供良好的用户体验。
所以这就是重点。Google 知道 Tensor 在 CPU 和 GPU 方面不如他们从高通那里买的那么好,但缺乏高端 AI/ML 硬件是他们的软件瓶颈。
我们这里有 ML 基准测试,但它们不如测试通用计算的 CPU 和图形基准测试相关。原因是将这些单元放在智能手机芯片上的目的是实现语音识别和照片处理等特定功能,而不是通用功能。因此,这是每个功能实现所独有的硬件、软件和数据库的组合,与一般机器学习任务的比较无关。
但对于 Apple 和 Google 来说,关键在于:他们可以在自己的手机上启用其他手机没有的重要功能——设备上的语音识别。还有更多。
笔记本电脑:M1 Pro 和 M1 Max
Apple 已经颠覆了每个人对笔记本电脑芯片的外观和功能的看法。智能手机和笔记本电脑芯片通常被称为“片上系统”或 SoC。来自英特尔和 AMD 的笔记本电脑芯片有一个 CPU 和一个弱集成 GPU。智能手机芯片有这些,还有更多。例如,在 iPhone 上:
机器学习核心。
安全飞地和加密加速器。
音频、视频和照片的专业单位。
高通公司的 Snapdragon 也搭载了 5G 功能。这些确实是片上系统。
现在,Apple 已将其引入笔记本电脑。我们将讨论 CPU 和 GPU,但所有 M1 芯片都有上述配置,加上所有 I/O,包括英特尔的 Thunderbolt,这是英特尔从未在 SoC 上使用的东西。与 CPU 和 GPU 相比,这些专用单元执行常见任务的速度更快,功耗更低。通过将它们放在 SoC 芯片上,Apple 节省了主板上的大量空间,并节省了额外芯片的功率/热量以执行相同的功能。
因此,首先,由于所有这些专用单元,M1 与 Intel 或 AMD 的任何产品都不同。Max 还具有仅在 Intel 和 AMD 的数据中心芯片中才有的内存带宽,以及更好的电源管理,空闲时为 0.2 瓦,而同类 Windows 笔记本电脑为 1.1 瓦。
M1 Pro 和 Max 上的内核与 M1 中的内核相同,只是它们位于更大的集群中。
与 M1 相比,Pro 和 Max 的性能核心都翻了一番,并将效率核心减半,从 4-4 配置变为 8-2 配置。
与 M1 相比,M1 Pro 的 GPU 内核数量增加了一倍,而 Max 则增加了四倍。
两者都有增强的音频/视频/照片复合体(Max 更是如此),因为这些笔记本电脑是针对创意专业人士的。M1 Max 可以在极低的功耗下完成 Windows 笔记本电脑无法完成的一些非常出色的 8k 视频操作。
这些笔记本电脑的目标用户是创意专业人士和其他有大工作的人,比如拥有大量代码库需要很长时间编译的开发人员。PC 界唯一能与之媲美的就是高端游戏本,比如微星 GE76 Raider,它似乎是个宠儿。它采用第 11 代英特尔酷睿 i7 SoC,带有单独的 Nvidia RTX 3080 GPU。它在亚马逊上的售价为 3500 美元,远高于大多数 PC 笔记本电脑,这正是 Apple 为类似配置的 M1 Max MacBook Pro 收取的费用。
请记住,英特尔正在开始推出他们的第 12 代酷睿处理器,第 12 代的笔记本电脑应该会在几个月内上市。我将单独介绍第 12 代。此外,目前还没有笔记本电脑配备 Nvidia 最好的移动 GPU,即 RTX 3090。
AnandTech 在 MSI 和 M1 Max MacBook Pro 上运行了一系列 9 个 CPU 和 GPU 基准测试。平均而言,M1 Max 在速度方面比英特尔笔记本电脑高 60%,在功耗方面比英特尔笔记本电脑高 52%。在每瓦性能方面,它平均比 MSI 笔记本电脑高出惊人的 215%。
AnandTech 发现 Windows 笔记本电脑的唯一优势是在 AAA 游戏中,MSI 是针对该游戏的。Windows 仍然是一个更好的 AAA 游戏平台,但目前在笔记本电脑领域仅此而已。Apple 重新设定了每个人对笔记本电脑芯片应包含的内容和功能的期望。
这是我对 Mrs. Trading Places 新到的 M1 Pro 笔记本电脑进行的单独测试。
根据 Geekbench 的数据,“ARM 虚拟机”是她在虚拟机中运行 Windows 的 MacBook Pro,与原生 Mac 相比,性能下降了约 12%。在这里,我将 Windows 虚拟机与我能为那台 MSI 笔记本电脑找到的最好的最新基准进行比较,而本机 Wintel 笔记本电脑几乎没有优势。
展望未来
苹果的芯片设计部门仍然是世界上最好的,这是他们未来的核心优势之一。他们拥有最好的智能手机芯片仍然是毋庸置疑的。他们现在已经通过 M1 将其扩展到他们的低端 Mac,自 M1 Mac 发布以来的第一个返校季度是 Mac 有史以来最好的季度。现在 M1 Pro 和 Max 已经重置了专业笔记本电脑中的表格。起初我不这么认为,但现在我认为我们将看到 Mac 的长期市场份额略有增加。它无疑激起了一波升级浪潮,包括在我家中。
剩下的就是高端的 iMac 和 Mac Pro,它们是销量最低的机型。当他们在 2023 年 6 月发布 Mac Pro 时,这将是一个巨大的成功,因为它很可能与英特尔和 AMD 最适合数据中心的产品相媲美,而且功耗要低得多。
尽管 Mac 只是 Apple 的一小部分,并将继续如此,但他们将在其经营的每个产品类别中重新设置芯片设计表。
对于谷歌来说,这是谷歌的第一步,有点像亚马逊的第一款ARM数据中心芯片,一个小小的失误。亚马逊挂了,他们的第二个数据中心芯片 Graviton2 更受云客户的欢迎。
谷歌在与三星合作时有点受挫,三星自己的芯片与高通的相比并不好,而且是臭名昭著的耗电热怪物。他们在中核上做出的妥协,向下一代以避免这种用户体验,是指示性的。
但同样,没有人比谷歌在人工智能方面投入更多。Pixel 6 启用的功能只是一个开始,它甚至可能给苹果带来一次压力。移动 CPU 和 GPU 在处理绝大多数用户任务时已经变得如此高效,以至于它们现在比功耗和芯片上的所有其他东西更重要。
在我看来,谷歌重新关注硬件,在硅谷设立了一个新的研究中心,并且有传言称他们正在开发像微软 这样的 ARM 笔记本电脑芯片。谷歌有时会遇到麻烦,但在我看来,他们已经做出了长期留在这里的战略决定,这只会让 Android 生态系统变得更有趣。
但与苹果一样,这将仍然是谷歌的一小部分。
至于高通,他们在移动类别中仍稳居第二位,仅次于苹果,但苹果的领先优势并没有缩小。此外,他们用于笔记本电脑和汽车的其他 Snapdragon 芯片很好,但不是很好。
好消息是,帮助正在进行中。高通对 Nuvia 的收购被广泛低估。Nuvia 由 Gerard Williams III 于 2019 年初创立,他之前的工作是让 Apple 的芯片设计部门成为第一。Williams 现在是 Qualcomm 的工程高级副总裁。我们应该很快就会看到第一款搭载 Nuvia IP 的 Snapdragons,这就是原因:
当我们这样做时,高通将在其整个 Snapdragon 产品线中在性能和功耗方面实现巨大飞跃。
在英特尔,PC 芯片在 2021 年前九个月的收入为 300 亿美元,占收入的 52%,占营业利润的 77%,达到 110 亿美元。那是为了让拥有出色 ARM 芯片供 PC 窃取的人使用。我的钱在高通。如果他们成功了,那将是公司的一次大规模扩张。
最后,三星的品牌是“第二好,但还是不错的”。他们的 Exynos 芯片仅次于 Snapdragons。他们的芯片代工厂仅次于 TSMC。但他们的优势在于,随着 TSMC仅在未来三年就以 1000 亿美元的资本支出来建立产能,他们的高端流程现在只能处理一个客户,至少在明年:Apple。
对于那些厌倦了等待 Apple 完成的人来说,这是个坏消息。高通去年跳槽三星代工,AMD 也刚刚紧随其后。这对三星代工厂来说是个好消息,直到 TSMC 能够扩大规模超过苹果的年度订单。随着更多产品的出现,这可能不会很快发生,让苹果独自一人拥有世界顶级的半导体工艺。