权力博弈:OpenAI豪掷3500亿美元重塑半导体旧格局
与博通签订定制芯片协议,标志着AI领域从单纯的计算力转向基础设施控制——重绘AI经济未来的竞争格局
旧金山——OpenAI启动了科技史上最雄心勃勃的硬件计划之一,与博通(Broadcom)合作设计并部署10吉瓦的定制AI加速器。这项耗资3500亿至5000亿美元的多年期项目,远超芯片设计范畴,旨在重新定义AI生态系统中的权力(及利润)分配。
此次合作并非一味追求纯粹的处理速度,而是旨在攻克底层基础:能源获取、散热效率和网络架构。这些曾被忽视的要素,如今正驱动着大规模AI的竞争力。
从2026年末开始,持续到2029年,OpenAI将创建为其模型量身定制的加速器,而博通则负责制造并构建完整的机架系统。值得注意的是,整个平台将运行在博通的以太网网络上,而非英伟达(Nvidia)的InfiniBand——长期以来高性能计算领域的首选。
博通已通过推出其Tomahawk 6“Davisson”展示了这一未来的可能面貌,这是一款102.4太比特以太网交换机,首次实现了大规模的共封装光学(co-packaged optics)出货。通过将光学元件直接集成到芯片基板上,这一设计显著降低了功耗和网络不稳定性——这是大规模AI训练集群中最大的两个痛点。随着数据中心努力在不浪费能源或不引发链路故障的情况下连接数千个GPU,这一突破预示着AI网络构建和维护方式将发生重大转变。
电力成为瓶颈
其规模前所未有。10吉瓦的计算能力,在芯片层面每年相当于近88太瓦时。一旦计入散热和设施管理费用,总耗电量每年将接近105太瓦时——大约是瑞士全国用电量的两倍。
一位半导体分析师表示:“这不仅仅是一笔芯片交易,更是基础设施的圈地运动。”“确保可预测的电力供应正成为真正的护城河。”
电力获取已成为AI部署中最大的瓶颈。吉瓦级数据中心仍然稀少,审批缓慢,并且来自当地社区的反对声浪日益高涨。据报道,OpenAI与甲骨文(Oracle)在重大能源项目上的合作预示着一个更广泛的转变:控制电力与控制数据同样重要。
意想不到的网络“叛乱”
OpenAI转向以太网的举动可能会打破英伟达在AI网络领域的垄断。长期以来,InfiniBand因其低延迟而被认为是训练高级模型的关键。然而,对于目前大多数AI工作负载所在的推理环节,总吞吐量和操作灵活性比微秒级的延迟优势更具分量。
博通最近推出的Tomahawk 6以太网交换机,具备102.4 Tbps的吞吐量和共封装光学技术,似乎正逢其时。超以太网联盟(Ultra Ethernet Consortium)的新标准提供了一条厂商中立的路径,以实现此前只有通过专有技术才能达到的性能。
一位前云基础设施高管指出:“标准化网络是企业对抗垄断定价、获取优势的方式。”如果OpenAI能证明以太网能够扩展以满足实际AI需求,网络格局可能会迅速转变。
硅片背后的深意
此次合作结构揭示了OpenAI的战略:内部设计芯片,外包制造,并保留知识产权。这与谷歌(Google)的Tensor和亚马逊(Amazon)的Graviton方法不谋而合,但更侧重于AI推理。
业内人士预计,这些加速器将强调内存带宽和稀疏计算效率,而非峰值浮点性能。在每天处理数十亿个token的时代,每个token的成本比训练速度更重要。
这对英伟达构成了挑战。该公司通过提供集成硬件、软件和网络解决方案而蓬勃发展。如果推理经济与训练硬件脱钩,市场可能会分裂,转向专业化系统。
连锁反应
英伟达的近期前景依然强劲,但压力正在累积。分析师预计,英伟达将采取定价调整或捆绑策略,以保护InfiniBand的市场份额。
AMD面临着一个战略性的十字路口。尽管其MI加速器和ROCm堆栈使其成为一个开放的替代方案,但定制芯片的出现缩小了其潜在市场。如果以太网获得发展势头,AMD可能会受益——前提是它能更多地投入开放网络,而非专注于小众用例。
与此同时,博通似乎处于有利地位。其在以太网和定制加速器上的长期押注,现在正与超大规模(hyperscale)趋势保持一致。即使利润较低的系统集成工作,在结合其网络技术后也变得更有价值。
追逐兆瓦
投资故事已超越半导体领域。云服务提供商现在不仅在GPU库存上竞争,还在电力获取上展开竞争。据报道,甲骨文耗资3000亿美元的“星门”(Stargate)计划以能源优先的选址为核心,这凸显出真正的稀缺资源是电力,而非芯片。
数据中心枢纽的公用事业公司面临巨大的负荷增长。诸如燃料电池、模块化核反应堆和热量回收系统等“电表后”解决方案正从试点项目转变为优先事项。数据中心正开始变得像重工业一样,需要政治和社区的认可与支持。
校准预期与时间表
投资者应审慎看待OpenAI的2026年目标。第一代定制芯片常因封装、软件成熟度或散热问题而遭遇延误。短暂的延误属于正常现象,无需担忧。
拥有10,000多个节点的以太网,仍需证明其在复杂生产环境中能与InfiniBand的性能相媲美。实验室中的基准测试很少能反映实际使用情况。
电力采购也存在类似的风险。确保吉瓦级容量涉及监管障碍、输电限制以及社区谈判。建设能源基础设施通常比设计运行其上的芯片耗时更长。
市场参与者的投资考量
几大主题浮出水面。博通可能会受益于其网络和集成能力,但利润趋势值得关注。英伟达在训练领域的支配地位仍是一道防御性护城河,尽管多元化发展以太网基础设施可以作为一种对冲。
最容易被忽视的机会可能在于能源基础设施。拥有数据中心容量的公用事业公司、具备基础负荷电力的可再生能源开发商,以及擅长快速部署的建筑公司将获得最大收益。物理限制——电力、散热、土地——正成为AI增长的决定性制约因素。
一如既往,投资决策需要仔细评估风险和目标。市场条件可能发生变化,读者应寻求适合自身情况的专业指导。
OpenAI与博通的联盟标志着AI进入了一个工业化阶段——在这个阶段,成功不再仅仅依赖于巧妙的算法,而更多地取决于以前所未有的规模管理电力、热负荷和高效的基础设施。那些掌握了这些物流环节的企业,最终可能会定义未来十年的行业格局。