OpenAI 推出 GPT-5-Codex,可连续编程 7 小时;开发者因性能下降放弃 Anthropic 的 Claude

作者
CTOL Editors - Ken
13 分钟阅读

OpenAI推出GPT-5-Codex,可自主编码数小时,开发者工具军备竞赛升级

突破性模型动态调整思考时间,威胁GitHub在280亿美元编程市场的主导地位

2025年9月15日 — OpenAI推出了GPT-5-Codex,这是一款专门的人工智能模型,能够进行持续超过七小时的自主编码会话,标志着在快速增长的开发者工具市场中争夺主导地位的竞争显著升级。

这家总部位于旧金山的公司最新产品代表了AI辅助编程的根本性转变,其动态“思考时间”功能允许系统根据任务复杂性分配计算资源——在简单请求上花费最少资源,同时将大量处理能力用于复杂的重构操作。

此次发布正值全球开发者数量接近2900万专业人士,AI编码助手在软件开发工作流程中变得越来越核心。这一时机尤为重要,因为OpenAI似乎已从Anthropic手中夺回了“智能体编程”的桂冠,Anthropic最近之前凭借Claude Code和Cursor主导了这一领域。行业消息人士报告称,由于Claude Sonnet 4和Claude Opus 4.1最近的性能问题,甚至在今天发布之前,大量开发者已从Claude Code/Cursor迁移到OpenAI的Codex平台,这表明市场动能已转向OpenAI的产品。

当机器开始“值夜班”

与传统的仅提供建议或完成代码片段的编码助手不同,GPT-5-Codex能够在最少人工监督的情况下独立执行多步骤工程任务。内部测试显示,在某些情况下,该系统持续工作超过七小时,迭代实现方案,修复测试失败,并交付功能性代码。

该模型的自适应架构代表了对传统方法的背离。GPT-5-Codex不是预先分配计算资源,而是在任务中途决定延长分析时间,可能会在一个它最初计划用五分钟解决的问题上花费一小时。

对于简单的交互,该系统相比其前身使用的计算令牌减少了93.7%。相反,对于难度最高的10%的复杂任务,它会将其推理时间增加一倍,展现出行业专家所称的“真正的解决问题持久性”,而非蛮力处理。

底层GPT-5模型的编码能力在这场竞争性转变中被证明是决定性的。CTOL.digital的工程团队报告称,GPT-5的思考模式在日常开发任务中,在很大程度上优于Anthropic的Claude Opus 4.1和谷歌的Gemini 2.5 Pro,提供更准确的代码生成、更出色的调试辅助以及更可靠的大规模重构——这些都是其优势所在。

永不休眠的代码审查

也许更具即时颠覆性的是GPT-5-Codex与GitHub拉取请求(pull request)工作流程的集成。该系统会在代码变更从草稿状态转变为可投入生产状态时自动审查代码,不仅分析语法,还会将声明的意图与实际实现进行匹配。

与静态分析工具不同,该AI智能体能够遍历整个代码库,推理依赖关系,并执行测试以验证行为。OpenAI内部开发的早期采用数据显示,该系统现在审查了他们大部分的拉取请求,在人工审查开始前,每天识别出数百个潜在问题。

软件工程经理长期以来一直面临审查瓶颈,这些瓶颈阻碍了开发周期。该系统能够提供经验丰富的工程师评价为“高影响力”的反馈,同时减少误报,解决了长期以来难以通过技术方案解决的关键工作流程瓶颈。

OpenAI重夺智能体编码宝座

OpenAI在终端、集成开发环境、GitHub和移动应用程序上的积极功能集成不仅仅是渐进式改进——这标志着该公司成功地从Anthropic手中夺回了智能体编程领域的领导地位(Anthropic曾凭借Claude Code和Cursor——主要以Claude LLM为基础——主导这一关键领域)。

这一转变在今天发布前几个月就开始了,因为开发者越来越放弃GitHub Copilot有限的基于建议的模型,并因近期性能下降而从Claude Code和Cursor迁移。行业观察家认为,面对更复杂的智能体替代方案,GitHub Copilot基本已过时,而Anthropic在自主编码领域曾占据的主导地位也已受到侵蚀,因为开发者发现GPT-5在实际工程任务中表现更优。

Cursor年化收入达到惊人的5亿美元的飞速崛起,验证了市场对AI原生开发环境的渴望,但其成功却讽刺地表明,纯粹的技术能力不如集成工作流执行重要——而这正是OpenAI的综合平台方法如今提供决定性优势的领域。

技术优势驱动开发者迁移

行业基准测试显示出显著进展,OpenAI报告称在SWE-bench Verified上有所改进,并在大规模重构任务中取得显著提升。更重要的是,开发者从Anthropic的Claude Code向OpenAI的Codex平台大量迁移——甚至在今天发布之前就已经加速——这反映了超越基准分数的实际性能优势。

工程团队持续报告称,GPT-5的思考模式与Claude Opus 4.1和Gemini 2.5 Pro相比,在各种编码任务中提供了显著更优的结果。这一技术优势,再结合Codex的集成工作流程方法,有效地结束了Anthropic在智能体编程领域短暂的领先地位。

该公司关于七小时自主编码会话的声明,代表了开发者已经开始体验的能力的逻辑延伸。与之前需要持续指导的AI助手不同,GPT-5-Codex能够保持上下文,并在最少人工干预的情况下追求复杂目标——这一能力在吸引开发者离开竞争平台方面起到了决定性作用。

安全研究人员注意到OpenAI强调沙盒执行和可配置的网络访问控制,解决了企业对AI智能体执行潜在有害命令的担忧。该系统默认为禁用网络操作,需要明确许可才能进行互联网访问或系统修改。

市场重新调整反映技术现实

这一时机反映了更广泛的行业共识:以GitHub Copilot基于建议的方法为代表的第一波AI编码助手已被更复杂的智能体系统所取代。OpenAI从Anthropic手中夺回市场领导地位代表着一个决定性的转变,转向结合了卓越底层模型和全面工作流集成的综合平台。

开发团队生产力已成为首席执行官(CEO)关注的问题,因为软件复杂性增长速度快于工程人才的供应。从Claude Code到Codex的大量迁移,甚至在今天增强版发布之前就已经发生,这表明当出现更优的替代方案时,开发者会迅速放弃原有工具,无论之前的偏好或机构惯性如何。

现在的竞争格局呈现出清晰的等级结构:OpenAI的集成Codex平台已夺回曾由Anthropic的Claude Code占据的领先地位,而GitHub Copilot一度占据主导地位的市场份额已大部分重新分配给Cursor和新兴智能体平台等更强大的替代方案。

投资影响与市场整合

对于机构投资者而言,OpenAI成功夺回智能体编程桂冠带来了引人注目的机遇,同时也凸显了该行业波动的竞争态势。开发者从Claude Code到Codex的快速迁移表明,当技术能力出现显著差异时,市场地位能多么迅速地转变。

GitHub Copilot基于建议模型的明显过时,以及Anthropic在智能体编码领域短暂主导地位的丧失,表明该市场的可持续竞争优势来源于卓越的底层模型性能,而非分销渠道或先发优势。

拥有明显卓越技术能力的公司,特别是那些采用OpenAI Codex平台这样集成工作流方法的公司,可能会获得高估值,因为市场将整合,围绕少数技术差异化的领导者。然而,开发者偏好的快速转变警告人们不要假定任何当前的市场领导者都拥有永久的竞争护城河。

云基础设施提供商可能会受益于计算需求的增加,特别是像GPT-5-Codex这样的智能体编码系统比传统的基于建议的工具需要更多的处理资源。这些先进AI编码系统对底层硬件加速的需求,代表了这次技术演进的潜在间接受益者。

人为因素依然重要

尽管技术能力令人印象深刻,GPT-5-Codex及类似系统在生产部署中仍需要人工监督。OpenAI明确建议将该系统视为额外的审查员,而非人类判断的替代品。

该公司的定位反映了行业内的普遍共识:尽管AI可以处理日常编码任务并识别技术问题,但软件开发最终需要人类的创造力、商业理解和伦理判断,这是当前技术无法复制的。

随着开发团队将这些工具整合到日常工作流程中,最成功的实施方案可能会将AI效率与人工监督相结合,创建同时利用人类和人工智能优势的混合方法。

投资决策应基于对个人情况和风险承受能力的全面分析。科技股过往表现不保证未来结果,读者在做出投资决策前应咨询合格的财务顾问。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明