IBM 和 Anthropic 联手攻克企业级人工智能最棘手的瓶颈

作者
Amanda Zhang
15 分钟阅读

IBM与Anthropic携手攻克企业级AI最严峻瓶颈

一项新的合作旨在弥合AI试点项目与实际部署之间的鸿沟。内部测试暗示生产力将显著提升,华尔街也关注到IBM治理优先的策略。

纽约阿蒙克 — 多年来,大型企业已投入数十亿美元,在受控试点项目中试验人工智能,但当需要将这些系统投入日常运营时,却屡屡碰壁。安全担忧、合规性漏洞以及工具的无限制蔓延,导致许多项目陷入停滞。

本周二,IBM和Anthropic宣布建立合作关系,他们认为解决方案不一定是更大、更智能的模型,而是在高度受监管的企业中实现AI的实用化。该协议将Anthropic的Claude语言模型整合到IBM全新专注于AI的开发环境中。在超过6000名IBM开发者中进行的早期测试显示,生产力平均提高了45%。

投资者迅速做出反应。IBM股价在盘前交易中一度上涨5%,这表明市场对优先考虑治理而非仅仅速度或算力的企业级AI需求旺盛。但股价上涨背后存在一个更大的问题:AI能否最终突破地球上最厌恶风险的行业?


试点项目与现实

这项声明发布于一个关键时刻。对AI潜力的疑虑已基本消散,但实际部署仍然罕见。症结不在于想象力,而在于执行力。银行、保险公司和制造商需要符合严格IT规定、能与数十年遗留软件集成并满足从纽约到布鲁塞尔各地监管机构要求的系统。

IBM并非试图在“最智能”模型的竞争中取胜。相反,它将自己定位为尖端AI与日常企业需求之间的“翻译者”:审计日志、访问控制、合规文件以及希望确切了解每个决策是如何做出的监管机构。

IBM软件高级副总裁Dinesh Nirmal表示:“我们为开发团队提供了符合企业运作方式的AI,而不是会带来新风险的实验性工具。”这句话道出了挑战的核心。大多数AI初创公司都以速度和能力为设计重点,假设企业可以稍后附加治理。而IBM正在改变这种做法。


自动化那些不那么“性感”但耗资巨大的工作

新的开发环境专注于那些不引人注目但却耗费预算的问题:现代化旧应用程序、生成合规代码以及构建安全优先的工作流程。这些是财富500强企业每年投入数千万美元仅仅是为了维持日常运营的工作。

可以这样理解:如果AI能够安全地处理一部分繁琐而耗时的工作,即使是适度的生产力提升也能转化为可观的节省。IBM提出的45%生产力数据听起来令人印象深刻,但分析师警告称,这反映的是IBM自身生态系统中经过精心挑选的任务。在实际应用中——面对混乱的代码、定制框架和无休止的合规检查——提升幅度可能更接近15%到30%。

即便如此,对于大型工程团队来说,削减15%的开发成本也是一笔意外之财。真正的考验在于IBM能否为付费客户带来这些成果——以及与GitHub Copilot或自研工具等竞争对手相比,其定价、许可和集成成本是否具有优势。


押注标准:模型上下文协议

除了产品功能,这项合作也对未来AI标准提出了主张。两家公司都支持模型上下文协议(Model Context Protocol, MCP),这是一个关于AI系统如何与工具和数据交互的框架。IBM已经发布了一份手册——《使用MCP构建安全的企业AI代理》(Architecting Secure Enterprise AI Agents with MCP),其中阐述了其所谓的代理开发生命周期(Agent Development Lifecycle, ADLC),这是一份在大型组织内部署AI代理的分步指南。

为什么这很重要?如果MCP获得关注,它可能成为企业版的ITIL或PRINCE2——这些治理框架可能显得官僚化,但一旦采购部门采纳,就几乎无法取代。分析师预计,大约一年内,许多企业RFP(征求建议书)将把MCP合规性列为必备条件。无法满足这一要求的供应商可能会被排除在外。


数据分析

我们谈论的是哪种收入?估算范围很广。从保守角度看,IBM可能会在未来18个月内,在其客户群中推广15万至30万个席位,每月每个用户收取约60美元。这意味着仅软件收入每年就达到1.08亿至2.16亿美元——这还不包括与现代化项目和代理运营相关的服务。

更乐观的预测是,采用量将达到60万个席位,每个用户90美元,使收入接近6.5亿美元。但这些数字假设能顺利渗透到银行和制药等发展缓慢的行业,这些行业的决策周期以年为单位。

利润率取决于巧妙的工作负载管理。IBM计划将Anthropic的Claude用于复杂推理,而将其自身的Granite模型用于更简单、大批量的任务。未能妥善管理这种平衡——或导致代币成本飙升——可能会迅速侵蚀利润。


竞争格局

当然,IBM和Anthropic并非在空旷的场地上竞争。微软的GitHub Copilot仍然在新入门的开发者中占据主导地位,尽管其合规性和治理方面不那么强大。预计微软将迅速缩小这一差距。

与此同时,亚马逊的AWS和谷歌云将依靠其Bedrock和Vertex AI产品,可能会自行采用MCP或推动竞争标准来混淆视听。在未来一年内,如果每家主要云供应商都发布自己的代理生命周期方法论,请不要感到惊讶。

还有咨询巨头。德勤刚刚宣布部署47万个Claude席位,这表明大型公司正竞相成为“代理工厂”,为客户构建AI系统群。IBM凭借其软件产品和服务,独特地能够在这两条战线上作战。


可能破坏局面的风险

仍有许多可能出错的地方。如果IBM的治理框架在纸面上看起来不错,但在实践中未能真正执行控制,精明的买家会迅速发现这一差距。AI倾向于生成通过测试但在生产中失败的代码,这是另一个迫在眉睫的问题——尤其是在任务关键型系统中,其中错误可能导致灾难性后果。

即使是MCP本身也并非免疫。安全专家担心“困惑的代理人”问题,即AI代理无意中行使了超出其应有范围的权限。如果没有严密的身份管理,这无疑是导致泄露的秘诀。


买家应提出什么问题

对于考虑IBM平台的组织来说,尽职调查将是关键。精明的买家将在三个领域进行试点:Java框架升级、大型机安全修复和许可证合规性检查。这些场景提供了明确的投资回报率,并且在出现问题时风险有限。

需要提出的棘手问题包括:该系统能否真正执行关于敏感数据、加密标准和软件许可证的策略,并提供严密的审计日志?客户能否通过MCP轻松更换模型,还是会被锁定在IBM的生态系统中?当代币使用量飙升时,谁来支付超额费用——是IBM还是客户?

精明的买家也会设定现实的预期:生产力提升15%到30%,而非新闻标题中乐观的45%。将供应商付款与可衡量的吞吐量和缺陷率挂钩,可以保持各方的诚信。


投资者视角

对于投资者来说,IBM-Anthropic联盟并非一个普通的“AI概念股”。这是对治理驱动型采纳的有针对性的押注。股价的最初上涨反映了市场的兴奋,但持续上涨取决于未来几个财报周期中实际席位增长、工作负载经济效益和成功的客户部署。

与此同时,在一些人称为“代理运营”(AgentOps)的领域正在出现次要机会——AI系统的策略引擎、授权框架和可观测性工具。预计该领域将出现整合,大型供应商将收购有前景的初创公司。

归根结底?IBM与Anthropic的交易可能会塑造企业AI的下一阶段——不是通过构建最强大的“大脑”,而是通过向企业展示如何安全、负责任且有利可图地使用AI。

内部投资论点

维度摘要
核心论点IBM与Claude合作推出AI驱动的IDE,是其进入受监管企业市场的最明确的“治理优先”切入点,利用模型上下文协议(MCP)作为潜在标准,并在竞争对手薄弱的策略/审计控制方面展开竞争。
新亮点1. IBM IDE中的Claude(私有预览): 端到端、受治理的软件开发生命周期自动化。
2. 代理生命周期(ADLC): 一种正式、可审计的代理开发框架。
3. 标准押注: 全面采纳MCP以减少锁定并建立生态系统信誉。
投资案例 (IBM)货币化: 基于席位 + 按量计费定价。模型策略: Anthropic 用于推理,更经济的Granite模型用于成本控制。收入敏感性 (基准情景): 15万-30万席位,每月平均收入(ARPU)60美元 = 年经常性收入(ARR)1.08亿-2.16亿美元,加上可观的服务拉动效应。
投资案例 (Anthropic)通过IBM渠道和德勤47万席位的部署,获得大规模、低成本的企业分销,巩固其作为“值得信赖的企业模型”的地位,并提升MCP的影响力。
竞争态势对比微软/GitHub Copilot: IBM在遗留/受监管堆栈的治理方面取胜。对比AWS Q/Google Code Assist: IBM在代理标准方面领先;关注其MCP兼容性。系统集成商/开源: 将围绕MCP实现“代理运营”的产品化。
主要风险1. 治理作秀: ADLC仅仅是PDF,而非可执行的控制。
2. MCP安全漏洞: 工具凭证的“困惑的代理人”风险。
3. 总拥有成本冲击: 高昂、不受管理的代币成本。
4. 互换风险: IBM将客户锁定在Claude或将其模型从中替换掉。
5. 举证责任: 45%的生产力提升声称在真实、混乱的代码库中失败。
尽职调查清单测试遗留重构试点、验证策略执行和审计追踪、针对MCP工具进行安全桌面演练,并为代币成本建立FinOps防护措施。
催化剂 (6-12 个月)IDE转向公开预览/通用版,IBM发布MCP治理工具包,更多系统集成商(埃森哲等)宣布MCP工厂,以及详细定价/包装公布。
估值与交易股票: 作为治理-AI故事逢低积累;重新评级需要席位增长的证明。敏锐洞察: Anthropic/MCP生态系统中的二阶机会(安全、策略、MCP工具)。减持通用代码辅助供应商。
关键假设实际生产力稳定在15-30%(而非45%),代币成本保持稳定,以及MCP继续作为标准获得行业采纳。
关键绩效指标 (KPIs)生产席位、每个席位每天的任务量、重构通过率、审计日志完整性、每个席位每月代币用量、卸载到Granite的任务百分比、事件/回滚次数。

非投资建议

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明