英伟达的公开辩护揭示了人工智能万亿美元垄断的裂缝
英伟达罕见地选择在X平台发布一份针对谷歌竞争威胁的辩护声明,这标志着人工智能基础设施领域的一个分水岭时刻:GPU无争议主导的时代正在走向终结,英伟达对此心知肚明。
该声明发布之前,有报道称Meta正就数十亿美元的谷歌张量处理器(TPU)采购进行谈判,这可能分流英伟达约10%的年营收。受此影响,英伟达股价下跌3%,随后该公司声称其产品仍“领先行业一代”,并提供“比ASIC更高的性能、通用性和可替代性”。
然而,对这些主张进行技术审视后发现,事实远比安抚投资者复杂得多——它揭示了英伟达护城河依然坚固的精确边界,以及它已被侵蚀的区域。
营销背后的技术现实
公开的技术规格所呈现的情况与英伟达在X平台上的说法大相径庭。谷歌的TPU v7“Ironwood”提供约4.6千万亿次浮点运算(petaFLOPS)的FP8性能,配备192 GB HBM3e内存和7.4 TB/秒的带宽。英伟达的Blackwell B200则提供了几乎相同的规格:4.5千万亿次浮点运算(FP8)、192 GB HBM3e内存和7.7 TB/秒的带宽。
它们是同级别产品,而非代际差异。
英伟达在超低精度推理方面确实拥有真正的技术优势——其FP4支持实现了谷歌芯片目前无法比拟的巨大吞吐量增益。该公司还在公共MLPerf基准测试中占据主导地位,其GB200 NVL72机架在LLM推理方面创造了新纪录。这既体现了其硬件能力,也反映了CUDA卓越的软件优化。
但谷歌则以在超大规模计算中至关重要的架构优势予以反击。TPU Pods可以将9,216个芯片整合为一个紧密耦合的训练网络,而英伟达则需要在超过72个GPU后,通过较慢的InfiniBand连接桥接多个NVLink域。多项独立分析证实,对于大型、持续的生产工作负载——这正是超大规模厂商人工智能支出的绝大部分——TPU通常能提供更优越的每瓦性能和每token成本。
英伟达声称其提供“唯一能运行所有AI模型的平台”,这一点显然是错误的。Anthropic的Claude模型就在TPU上运行。主流的视觉模型、推荐系统和大语言模型(LLMs)都在AMD Instinct、AWS Trainium以及各种定制ASIC上运行。英伟达真正可以声称的是其拥有最广泛的统一软件栈,涵盖了云端、本地数据中心和工作站——这是一个真实但比X平台声明所暗示的更狭窄的优势。
议价能力的拐点
更深层次的问题在于英伟达的防御姿态所揭示的市场结构。最新文件显示,英伟达前两大客户占总营收的39%,前六大客户则占约85%。上季度,数据中心营收达到512亿美元,毛利率高达73%,这意味着该公司的整体估值逻辑取决于少数几家超大规模厂商是否会继续支付高溢价。
这些超大规模厂商现在本身也具备了可信的芯片设计能力。谷歌、亚马逊、Meta和微软已累计投入数十亿美元用于定制芯片,其目的正是为了摆脱一项分析所估算的“英伟达税”——即英伟达以20,000-35,000美元批量销售的GPU,其制造成本仅为每颗3,000-5,000美元。
投资论点:垄断利润与垄断销量之争
对投资者而言,这个拐点的重要性超越了任何季度业绩超预期。随着全球人工智能计算需求预计到2027年增长10倍,英伟达的绝对营收几乎肯定会继续增长。其总目标市场(TAM)依然巨大。
然而,主导定价权和利润可持续性的动态已经发生了根本性转变。当客户拥有可信的替代方案——而且这些客户占据你营收的85%时——谈判性质就变了。英伟达可能会获得垄断销量,却无法获得垄断利润。
该公司目前的估值包含了其能够维持70%以上毛利率和准垄断定价权的假设。如果超大规模厂商的多元化策略将毛利率推向60%中段范围,并迫使其采取更具竞争力的定价,那么英伟达的市盈率将趋向于“高质量半导体平台”的估值,而非不可动摇的基础设施垄断者。
英伟达在X平台上的声明本身就证实了这一分析。拥有无可撼动的竞争地位的公司不会对竞争对手的进展发布公开反驳。英伟达感到被迫捍卫其技术领导地位——甚至使用了从夸大到明显不实的主张——这一事实,足以让投资者了解新兴的威胁格局。
人工智能基础设施之战已真正打响。
非投资建议
