谷歌Ironwood TPU v7 即将面世——这款推理超级芯片有望重塑AI的功耗与利润格局

作者
Anup S
9 分钟阅读

谷歌Ironwood芯片重塑AI经济学,赋能推理新时代

在功耗受限世界中的技术飞跃

谷歌云的Ironwood TPU v7在2025年4月预览后,正逐步走向全面上市,成为业界焦点。这不仅仅是一次芯片发布,更是一场大胆的架构赌注。在Hot Chips 2025大会上公布的新技术细节清晰表明,谷歌正大力押注推理而非训练。

每个Ironwood单元提供惊人的4,614万亿次浮点运算(FP8)计算能力,并由192吉字节的闪电般快速的HBM3e内存支持,其运行速度达到每秒7.3万亿字节。该芯片采用先进的5纳米工艺制造,功耗约为600瓦——对于其输出而言,这一功耗表现令人印象深刻。

真正的魔力体现在Pod层面。设想9,216个液冷芯片通过光路交换连接,共同实现42.5百亿亿次浮点运算(FP8)性能和惊人的1.77拍字节共享内存。这在机器学习系统领域是破纪录的数字。这种配置揭示了谷歌的核心信念:到2025年末,AI部署的最大障碍不再是原始计算能力,而是运行大规模、有状态AI智能体所需的内存、带宽和能效。

Ironwood每秒1.2万亿字节的I/O架构,以及其功耗性能比相较于上一代Trillium的翻倍提升,直接解决了这些痛点。超大规模云服务商正面临电网的物理极限,因此从每瓦功耗中榨取更多推理能力已成为新的衡量标准。在当今数吉瓦级的数据中心中,关键指标不再是你训练的速度有多快,而是你服务推理工作负载的效率有多高。

Anthropic交易激发需求,加剧与英伟达的竞争

转折点出现在2025年10月23日。Anthropic签署了一份巨额协议,承诺采购“高达一百万个TPU”和“数百亿美元”的合同,预计到2026年功耗将超过1吉瓦。一夜之间,Ironwood从一个路线图上的承诺,转变为由真实、高风险需求支撑的生产现实。

对谷歌而言,这笔交易意味着能见度和稳定性。现在,谷歌可以规划数据中心建设和电力协议,而无需担心产能闲置——这在4月份还是一个主要担忧。

Anthropic押注的规模说明了一切。Claude的开发者没有等待英伟达或AWS的最新芯片,而是选择了谷歌的Ironwood,看中了它的上市速度和能效。这清楚地表明了TPU v7的经济性:更强的推理能力,更低的能耗。在一个增长受限于电力而非芯片的世界里,这一点比以往任何时候都重要。

AI芯片领域的竞争如今正按工作负载进行分化。英伟达的Blackwell芯片仍在前沿训练领域占据主导地位,其推理速度比Hopper快30倍,并为2026年Rubin的3.6百亿亿次浮点运算机架级配置奠定了基础。与此同时,AWS已通过其UltraCluster网络部署了50万个Trainium2芯片,尽管每个芯片的板载内存较少(每16芯片块约1.29拍次浮点运算FP8)。微软的Maia项目仍然滞后,下一代硬件被推迟到2026年。

谷歌的战略有所不同。它不追求最大的数字,而是追求最正确的数字。Ironwood的1.77拍字节共享内存使其在处理混合专家模型、长上下文推理和检索密集型系统方面具有优势。这些都是现代AI的主力工作负载。当英伟达销售一站式解决方案时,谷歌正在构建为“推理时代”量身定制的基础设施。

投资洞察:通过垂直整合保护利润率

对于Alphabet的投资者来说,Ironwood不仅仅是一枚新芯片,更是应对云AI业务利润率萎缩的防御措施。像AWS这样的超大规模云服务商预计到2027年将达到11.8吉瓦的电力容量,整个行业在此期间都在大举投入。定制芯片让谷歌能够将这些投入转化为利润,从芯片设计到部署的整个价值链中获益。

数据说明了一切。Ironwood的功耗性能比是Trillium的两倍,这意味着2026年每兆瓦的数据中心容量可以产生2024年系统两倍的推理输出。再加上更智能的软件——如谷歌的vLLM集成和改进的Pathways调度——谷歌可以在保持竞争性AI服务定价的同时,提高利润率。简而言之,运行自己的芯片比转售他人的芯片更有优势。

Anthropic的合同还消除了谷歌资本支出计划中的不确定性。谷歌现在是根据有保障的需求来建设,而不是盲目建设并希望客户到来。这使得财务模式从投机转向确定性——AI基础设施支出现在直接与锁定的收入挂钩。

然而,三大问题依然悬而未决。首先,谷歌能否吸引更多核心客户?再获得两到三份长期TPU协议将证明Ironwood不仅仅是单一大客户的奇迹。其次,电力项目能否按计划进行?2026年的目标取决于变电站审批和施工时间表,这些并非完全掌握在谷歌手中。第三,谷歌的软件栈能否跟上英伟达CUDA生态系统的步伐?利用率将取决于此——从90%下降到70%会损害效率。

尽管英伟达在训练领域的主导地位依然稳固,但来自Ironwood等定制芯片的威胁是真实存在的。谷歌并未试图在研究或快速原型开发领域取代英伟达。相反,它瞄准的是核心工作负载——那些维持AI系统日常运行的大规模、稳定的推理任务。到2027年,谷歌的TPU可能会处理高达推理市场总量的30%。

这一转变,加上亚马逊和微软的类似举措,解释了为什么英伟达面临越来越大的定价压力。AI芯片市场正在从一个巨头供应商,演变为多个垂直整合的生态系统,每个生态系统都拥有自己的技术栈。

Ironwood的真正意义在于证明AI基础设施可以提升利润率,而不仅仅是无休止地扩展。对于Alphabet而言,它是一个战略安全网,提供了在内部使用和云服务租赁之间切换的灵活性,同时减少了对外部芯片制造商的依赖。在一个效率至上的世界里,谷歌的Ironwood可能正是重塑AI经济学的芯片。

非投资建议

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明