硅谷芯片突围战:Cerebras获11亿美元豪赌,冲击AI硬件主导地位
富达基金领投,将Cerebras估值推至81亿美元,预示AI芯片战远未尘埃落定。
加利福尼亚州森尼维尔——英伟达或许仍主导着全球AI计算领域,但其霸主地位正开始松动。今天,Cerebras Systems在超额认购的G轮融资中筹集了惊人的11亿美元。由富达管理与研究公司(Fidelity Management & Research)与阿特雷德斯管理公司(Atreides Management)共同领投的这笔交易,将这家初创公司的估值推高至81亿美元,使其成为迄今为止挑战英伟达GPU帝国最有力竞争者之一。
这笔资金的到来正值一个关键转折点。行业的关注点已从训练巨型语言模型转向了在实际生产中运行这些模型。这种转变暴露出现有硬件的弱点,并为那些心无旁骛地专注于一项任务——快速、可靠推理——而构建芯片的公司打开了大门。
速度才是真正的武器
资金大量涌入,因为推理——即让模型投入运行——已成为行业的瓶颈。训练曾一度占据所有头条,但如今公司更关心如何将响应时间缩短几毫秒。每一次延迟都可能让用户感到沮丧,减慢代码助手等工具的速度,甚至损害企业的竞争地位。
根据第三方公司Artificial Analysis的基准测试,Cerebras表示,其大规模晶圆级系统在主流开源模型上运行速度已比英伟达GPU快20多倍。该公司声称每月处理数万亿个token,不仅在实验室中,而且在客户数据中心、云基础设施和合作伙伴平台上。
客户名单堪称科技界的“名人堂”。亚马逊云科技(AWS)、Meta、IBM以及Mistral和Notion等热门初创公司均已成为其客户,美国能源部和国防部也在其中。甚至Hugging Face的开发者也似乎更青睐Cerebras:它现在是该平台上的顶级推理服务提供商,每月处理超过500万次请求。
本土芯片制造
Cerebras计划将大部分新资金投入美国本土制造和国内数据中心。时机再好不过了。华盛顿正通过《芯片法案》推动半导体独立,各机构也希望出于国家安全原因减少对单一供应商的依赖。
该公司的战略借鉴了英伟达的成功经验:控制从芯片设计到系统架构再到云交付的整个堆栈。区别在于?Cerebras没有选择通用GPU,而是押注专为推理工作负载设计的专业晶圆级处理器。在摩尔定律不再轻易带来性能提升的时代,专业化可能成为一张王牌。
AI基础设施的更广泛转变
Cerebras并非唯一追逐这一机遇的公司。竞争对手和相关参与者也筹集了巨额资金。Groq在9月完成了7.5亿美元融资,得益于中东地区的合同。Celestial AI、Lightmatter和Ayar Labs等光子学公司合计筹集了超过8亿美元,以解决带宽瓶颈问题。
科技巨头也纷纷自研芯片:Meta的MTIA、微软的Maia、亚马逊云科技的Inferentia以及谷歌的TPU。每一款芯片都代表着数十亿美元的投入,旨在削减对英伟达的依赖。总体而言,这些举动证实了一件事:推理的经济效益足以支撑大规模投资,即便并非所有押注都能成功。
分析师预计,到2026年,AI基础设施支出将飙升至近5000亿美元,到2029年可能达到2.8万亿美元。但这些数字取决于公司能否将利用率保持在足够高的水平,以证明其大规模建设的合理性。
利用率与严酷的现实
头条新闻背后隐藏着一个更棘手的真相。调查显示,企业集群中的大多数GPU闲置时间远超财务模型所假设。即使在需求高峰期,许多设施的运行利用率也远低于其承诺的80%-90%。这种差距至关重要,尤其是在数据中心通过数十亿美元贷款融资的情况下。
事实上,该行业已经开始依赖奇特的融资结构。仅在2025年上半年,各公司就发行了134亿美元的数据中心资产支持证券,并获得了超过110亿美元的GPU抵押贷款。甚至一些交易在贷款人提供豁免之前,已接近技术性违约。
再再加上现实世界的制约——电网短缺、公用事业升级缓慢以及高带宽内存供应有限——整个局面看起来比许多投资者想象的更为脆弱。
真实的速度到底如何?
Cerebras的基准测试数据也引人关注。它的数据主要来自Artificial Analysis,与MLPerf等公认标准相比,该公司的透明度有限。同时,英伟达仍在不断从其软件堆栈中榨取更多性能。TensorRT和高级量化等优化措施无需新硬件即可缩小性能差距,使得直接对比变得棘手。
专用芯片在特定应用场景中表现出色,但在处理复杂工作负载时则可能遇到困难。实际部署并非像华丽的基准测试那样——它们涉及不可预测的流量、更长的上下文长度和突发性需求。在这种情况下,经济效益而非市场宣传材料将决定胜负。
投资者真正应该关注什么?
对于投资者而言,华而不实的吞吐量声明是不够的。真正的衡量标准很简单:在目标延迟下的每千个token成本、首个token生成时间、每次推理的能耗,以及系统能否持续达到服务水平目标。在真实工作负载下的独立审计将比精心挑选的演示更能增加可信度。
一些分析师认为,更安全的押注在于AI基础设施的“镐和铲”领域——内存供应商、冷却系统、公用事业——因为无论哪个芯片制造商胜出,它们都能从中受益。像Cerebras这样的专业推理初创公司仍可能蓬勃发展,但它们可能更适合作为投资组合中的期权型配置,而非核心持股。
别忘了超大规模云服务商的巨大影响。随着亚马逊云科技、Meta、谷歌和微软不断推出自己的加速器,第三方芯片的市场可能会缩小到成本、主权或原始性能使其不可或缺的利基市场。
一个如履薄冰的市场
建设AI基础设施的热潮与20世纪90年代的电信泡沫有异曲同工之妙,当时过度建设导致大量资产闲置。今天的预测要求惊人的营收增长才能跟上资本流动的步伐。如果这种差距不缩小,泡沫就可能破裂。
结果可能大相径庭。在最好的情况下,Cerebras将证明其优势,赢得超大规模云服务商的采用,并作为英伟达真正的替代者进入公开市场。在中等情况下,它将在特定工作负载领域占据主导地位,而英伟达则在其他领域保持领先。最坏的情况呢?其基准测试数据不再突出,采用率放缓,现金消耗迫使其出售或合并。
投资者应明智地要求确凿证据:来自实际部署的审计指标、锁定的电力供应协议、关键内存的确认供应以及清晰的债务结构。这才是区分持久挑战者和一厢情愿的梦想家的标准。
这笔11亿美元的融资凸显了当今AI基础设施领域的核心问题:专用芯片能否夺取真正的市场份额,还是英伟达的生态系统和持续不断的软件改进将使其继续掌控大局?答案不会来自PowerPoint演示文稿或破纪录的融资。它将取决于这些系统在生产环境中、在规模化部署下、在压力之下的实际表现。然而,就目前而言,大笔资金的投资者正在押注Cerebras仍有一战之力。