GPU市场并未放缓,反而正在全面爆发
人们常把AI硬件竞赛看作英伟达和谷歌之间的简单对决。这样的标题虽然简洁,却忽略了2025年末的真实情况。这个市场并未趋向于由单一赢家主导。相反,它更像是一条繁忙的跑道,新设计层出不穷,因为需求始终居高不下。芯片供应依旧紧张,资金持续涌入,足以容纳多家重量级企业同时成长。
市场仍受短缺驱动
回溯到2025年11月的GPU市场,你会发现与一年前相同的情况:供应紧张。台积电最先进的工艺节点全力运转,而大客户则提前数年锁定产能。这种紧张的供应链导致了我们熟悉的循环:短缺、剧烈的价格波动以及对任何出现库存的疯狂竞价。即使有新晶圆厂投产、现有晶圆厂扩产,它们也无法赶上需求浪潮,因为需求增速始终快于产出。
预测数据印证了这一点。分析师预计,数据中心GPU市场规模将从2025年的1020亿美元增长到2030年的近2000亿美元,这意味着年复合增长率约为14%。更广泛的GPU基础设施领域看起来更具爆发性。预测到2033年,该市场规模将达到约5920亿美元,年复合增长率高达惊人的28%。这并非饱和市场的表现。饱和市场会降温,价格趋软,增长数字收缩。而在这里,情况恰恰相反。
定制芯片如何做大整个蛋糕
许多人认为,大型云服务提供商的定制芯片将不可避免地侵蚀GPU的销售。谷歌、亚马逊、Meta和微软等超大规模企业现在正基于自研的Arm架构芯片提供大量算力。从理论上讲,这听起来像是直接竞争。但实际上,情况更为复杂。他们提供的算力中,约有一半使用这些内部设计,然而这种转变更像是增量而非替代。加速器总量正在增长,而非仅仅是将一种类型替换为另一种。
在他们的数据中心内部,这些公司是在部署专有芯片的同时也部署了大量的GPU,而非用前者取代后者。谷歌云公开表示,它“致力于同时支持”其TPU和英伟达GPU,将其视为同一机架上的合作伙伴而非竞争对手。Meta曾与谷歌就使用其TPU进行谈判,但仍订购了大量英伟达H100芯片,因为它希望实现冗余,而非将所有筹码押注在单一供应商上。英伟达下一代Blackwell芯片的订单簿也体现了这种双管齐下的策略。即使这四家美国最大的超大规模企业正在推进各自的内部芯片计划,它们总共仍预订了约360万颗Blackwell芯片。合乎逻辑的结论很简单:市场扩张速度足够快,足以让多种架构并存发展。
实际上保证多个赢家的新规则
这个生态系统的权力已向超大规模企业倾斜,这种转变正在重塑规则,自然而然地促进了更多而非更少的竞争。
首先,定制芯片最终赋予了最大的买家真正的议价能力。当一家云巨头拥有自己TPU式的替代方案时,它在与英伟达谈判时就不会空手而归。正如一项分析所指出的,这些公司对过度依赖单一供应商感到焦虑,现在它们有了反击的工具。这种压力甚至在双方都将产品描述为互补的情况下,也会体现在定价谈判中。
其次,供应链多元化已从“锦上添花”变为“生存必需”。Meta此前计划购买超过35万颗H100 GPU,现在看来更像是一个关于集中风险的警示。作为回应,更广泛的行业倾向于多源采购。这意味着将TPU采购、自研ASIC(专用集成电路)项目和传统GPU合同结合起来,形成一个更具韧性的堆栈。如果一条路径受阻,其他路径仍能确保系统正常运行。
第三,初创企业不再仅仅停留在演示文稿和实验室演示阶段。一批专业芯片公司已进入了重要的商业领域。Cerebras Systems刚完成11亿美元融资,正将其晶圆级引擎部署到Stargate阿联酋AI园区等大型项目中。Groq获得了沙特阿拉伯15亿美元的协议支持,并与IBM建立了合作关系,声称在某些特定工作负载下,其推理速度比同类GPU快三到四倍。SambaNova则在国家实验室安装系统,并持续推进其软硬件一体化平台。这些公司合计估值超过50亿美元,更重要的是,它们拥有真实的部署案例。竞争不再是理论层面的,它正在实际运行工作负载。
推动多样化的深层力量
在头条新闻之下,AI的经济学正在悄然倾向于一个多架构的世界。
推理在这里扮演着关键角色。在训练大型模型方面,英伟达仍然占据主导地位。然而,一旦模型建成,推理(即日常运行模型的行为)的量会增长得更快,并分散到许多用例中。模型稳定后,可以将其部署到针对特定需求优化的硬件上。Cerebras在内存密集型任务上表现出色。Groq则瞄准超低延迟流媒体。谷歌的TPU在谷歌自己的云堆栈中表现最佳。这种专业化使得单一芯片系列赢得所有竞争的可能性大大降低。
能源效率提供了另一个强劲的推动力。定制ASIC在特定工作负载下可提供高达60%的能效提升。当电力成本占超大规模数据中心运营成本的30%至40%时,这种优势在董事会中具有巨大的影响力。逻辑变得清晰:根据所需性能,将每个工作负载匹配到功耗最低的芯片。
制造限制也推动着同样的方向。台积电的尖端生产线始终供不应求,竞争对手无法通过简单地预订更多相同产能来复制英伟达的成功模式。这种瓶颈促使参与者寻求替代路径。英特尔推广其Gaudi加速器。Cerebras则精进其晶圆级集成方法。Groq正在扩展其独特的LPU架构。这些不同的策略通常采用不同的晶圆代工厂、工艺和封装技术。它们共同拓宽了行业的总产出,而非将一切都通过一个狭窄的通道输送。
总结:真正的多样化带来超速增长
将所有这些因素综合起来,2025年末的图景便不容忽视。加速器市场并未趋向于围绕单一GPU领导者进行整合。它正经历一种“相变”,从以GPU为中心的准垄断市场转变为一个基于多种架构的活跃生态系统。随着总潜在市场每年以约28%到33%的速度扩张,机遇显得无比巨大。供应仍然是主要的制约因素,需求并非问题。
在这种环境下,公司通过为明确界定的一系列问题带来独特的架构优势来取胜。市场已变得足够广阔和细分,以至于专注于某一点的策略也能各自发展成为数十亿美元的业务。一些参与者将主导流媒体性能。其他参与者将追求最大的计算密度或超紧密的软件集成。单一硬件巨头的时代已经过去,专业化公司的时代已经到来。
非投资建议
