亚马逊的芯片策略:Graviton4 突破助推股价,AWS 重塑网络性能上限
西雅图 — 亚马逊股价周三上涨 1.4% 至 217.87 美元(目前回落至 216.73 美元),此前 AWS 发布了其定制 Graviton4 处理器的突破性更新。该处理器集成的网络带宽能力远超现有云产品,并可能重塑高性能计算领域的竞争格局。
亚马逊称其实现了“公共云中最高的网络带宽”,达到了惊人的每秒 600 吉比特,这不仅仅是一个技术里程碑。它标志着亚马逊正在加速推进垂直整合,减少对英特尔和 AMD 等传统芯片制造商的依赖,同时加强其在人工智能基础设施领域对抗英伟达主导地位的实力。
“每秒 100 张音乐 CD”:突破带宽瓶颈
AWS 的工程师们生动地描述了这项突破,将 600 Gbps 的网络带宽比作一个每秒能处理 100 张音乐 CD 的系统——这比以前 EC2 实例 50-100 Gbps 的容量实现了数量级的飞跃。
“这不仅仅是渐进式进展,”一位要求匿名的云基础设施分析师指出。“通过将这种级别的网络结构直接嵌入到 CPU 芯片中,而不是依赖外部网络接口卡,AWS 解决了分布式计算工作负载中最普遍的瓶颈之一。”
这款增强型芯片保持了其 96 个 Arm Neoverse V2 核心、12 个 DDR5-5600 内存通道和 192 MB 二级缓存的基础配置——这些规格此前已使 Graviton4 在网络应用、数据库和 Java 工作负载方面比上一代 Graviton3 实现了 30-45% 的显著性能提升。
表:AWS Graviton4 与主要云和服务器 CPU 竞争对手 — 关键特性和定位
平台/CPU | 核心数量 | 工艺 | 主要优势 | 云可用性 | 相较于 Graviton4 的定位 |
---|---|---|---|---|---|
AWS Graviton4 | 96 | 4 纳米 | 高性能/效率,内存带宽 | AWS | 基准;领先的 Arm 云 CPU |
Azure Cobalt 100 | 96 | ? | 自研 Arm,性价比 | Azure | 单核性能略低,性价比高 |
Azure Ampere Altra | 80 | 7 纳米 | 高核心数,高效率 | Azure,其他 | 适合横向扩展,单核性能较低 |
谷歌 Axion | ? | ? | 定制 Arm,高性能/高效率 | 谷歌云 | 声称性能持平或更优 |
谷歌 Tau (x86) | 最多 60 | 7 纳米 | 性价比,横向扩展 | 谷歌云 | x86 架构通常性价比更高 |
AmpereOne | 最多 192 | 5 纳米 | 高密度,云原生 | 甲骨文,Azure,其他 | 更多核心,单核性能较低 |
OCI Ampere Altra/A2 | 最多 156 | 5 纳米 | 高核心数,高性价比 | 甲骨文云 | 适用于网络/AI,成本领先者 |
英特尔 Xeon | 60–144 | 7–10 纳米 | AI/ML,广泛的生态系统 | 所有主要云 | 强大的单线程性能,成本更高 |
AMD EPYC | 96–192 | 5–3 纳米 | 高核心数,内存带宽 | 所有主要云 | 在某些工作负载中达到或超越 |
英伟达 Grace | 72 | 4 纳米 | HPC,AI,内存带宽 | 特定(未来) | 更高带宽,更高延迟 |
芯片独立:亚马逊垂直整合战略开花结果
尽管 AWS 自 2015 年收购 Annapurna Labs 以来一直在设计定制芯片,但 Graviton4 的网络增强可能代表了该公司芯片独立战略迄今最清晰的验证。
市场观察人士指出了几项战略优势。“从芯片到服务,AWS 正在控制更多其技术栈,”一位科技投资策略师解释道。“这降低了其面临供应链限制和许可成本的风险,同时与第三方芯片相比,可能将毛利率提高 5-10%。”
此次发布时机尤为重要,因为全球公共云服务终端用户支出预计在 2025 年达到 7230 亿美元——同比增长 21.4%——其中增长最快的是基础设施和平台服务,这些服务最能受益于高带宽、专用硬件。
表:AWS Graviton4 云处理器的主要规格和特性
特性 | Graviton4 详情 |
---|---|
发布日期 | 2023 年 11 月 28 日 |
工艺技术 | 4 纳米 (台积电) |
架构 | Arm Neoverse V2 (ARMv9.0-A ISA) |
核心数量 | 96 核 |
基本频率 | 2.8 GHz |
芯粒设计 | 7 芯粒 SoC (多芯片封装) |
SMP 支持 | 最多 2 路 (双插槽,每服务器 192 vCPU) |
内存支持 | 12 通道 DDR5-5600 ECC |
最大内存带宽 | 537.6 GB/秒 |
最大 PCIe 通道数 | 96 条 PCIe 5.0 通道 |
L1 缓存 | 总计 12 MiB (6 MiB 数据,6 MiB 指令) |
L2 缓存 | 总计 192 MiB |
每实例支持内存 | 最多 3 TiB (在 X8g EC2 实例中) |
支持本地存储 | 最多 11.4 TB NVMe SSD (在新实例类型中) |
制造商 | 台积电 |
设计者 | Annapurna Labs (亚马逊) |
性能提升 | 相较于 Graviton3,计算性能提升 30%,核心数增加 50%,内存带宽提升 75% |
目标工作负载 | 数据库、分析、HPC、网络/应用服务器、微服务 |
支持的 EC2 实例 | X8g, R8g, C8gd, M8gd (最高 192 vCPU,1.5 TiB 内存,11.4 TB SSD) |
生态系统 | 由主要的 AWS 托管服务和客户支持 |
大卫对抗多个歌利亚:重新定义竞争格局
AWS 的这项成就使其在传统芯片制造商和云竞争对手面前都处于独特的地位。目前,没有其他公共云提供商能提供接近 600 Gbps 的 CPU 集成网络结构,而基于英特尔和 AMD 的实例通常通过外部网卡最高达到约 100 Gbps。
像谷歌 T2A 实例中使用的云原生替代方案 Ampere Altra,在实际使用中最高达到约 32-78 Gbps。尽管包括谷歌、微软和华为在内的超大规模竞争对手正在开发自己的定制芯片,但尚未有任何一家公开展示出可比的网络集成能力。
然而,AWS 在最高性能细分市场仍面临严峻竞争。使用英伟达 NVLink 技术的 GPU 集群——提供高达 900 GB/秒的 GPU 间带宽——仍然是原始 AI 训练吞吐量的黄金标准。这种二元性突显了 AWS 的战略定位:为绝大多数工作负载提供有竞争力的替代方案,同时利用其 Trainium 和 Inferentia 芯片为 AI 开发专用选项。
不止于数字:经济影响与 AWS 的利润引擎
AWS 已成为亚马逊的利润引擎,2025 财年第一季度营收达到 293 亿美元(同比增长 19%),营业利润率为 39.5%,高于一年前的 37.6%。定制芯片在这个利润扩张故事中扮演着越来越核心的角色。
“真正的财务影响不仅仅是为客户提供每美元性能,”一位关注云基础设施的金融分析师观察到。“它关乎 AWS 逐步摆脱第三方组件对利润的侵蚀。”
这一转变伴随着巨大的前期成本。亚马逊仅第一季度就报告了 243 亿美元的资本支出,其中大部分用于数据中心基础设施。这些投资暂时抑制了自由现金流,但却建立了高利润产能,可能在未来 2-3 年推动持续的盈利能力提升。
采用曲线:前景与即时需求
尽管取得了技术成就,但关于即时客户采纳的问题依然存在。600 Gbps 的能力主要针对专门的高性能计算和 AI 训练工作负载,而非主流应用。
“AWS 面临的挑战是生态系统准备就绪,”一位云基础设施顾问表示。“要充分利用这种带宽,需要优化过的中间件、专门的集群放置组以及为极端吞吐量设计的应用程序。”
竞争也日益临近。行业消息人士表示,英特尔、AMD