最后的程序员:AI突破迫使软件工程行业进行深刻反思
新模型超越人类工程师,行业面临生存根本性拷问
Anthropic 最新发布的大型语言模型(LLM)实现了一项此前难以想象的壮举:在一次以难度著称的性能工程考试中,其得分超越了所有曾参加过此考试的人类考生,并以比它可能很快就会取代的工程师更强的技术能力,完成了这项两小时的评估。
本周一发布的 Claude Opus 4.5 不仅仅是AI能力上的渐进式提升。根据 ctol.digital 工程团队进行的内部评估,该模型展现出“在编码能力、复杂问题解决、高效token用量和自主代理工作流程方面的卓越提升”,这使其成为该团队所称的“AI编码辅助方面的一个突破性进展”。但在他们的评估中隐藏着一个更严峻的结论,这一结论在开发者社区中激起了波澜:“随着编码型大型语言模型日益成熟,软件工程职业将更接近‘死胡同’。”
这一论断并非出自危言耸听者或未来主义者,而是来自在真实世界条件下对技术进行压力测试的工程师。ctol.digital 团队发现,Opus 4.5 解决编码问题“仅需数分钟而非数天”,并且在保持或超越质量的同时,其计算token用量比前代模型减少高达65%。几周前对上一代模型来说“几乎不可能”的任务,现在已触手可及。
Opus 4.5 的成本是每百万输入token 5美元,每百万输出token 25美元,这大约相当于一名高级软件工程师三分钟的收入。它不会请病假,不会要求股权,也不会跳槽到竞争对手那里。它在八种编程语言中的七种上达到了顶尖水平,并擅长那种将普通程序员与高级工程师区分开来的多系统调试。
Anthropic 自己的测试揭示了该模型以出人意料的方式展现出的创造性问题解决能力。在一个旨在测试客服代理的基准场景中,AI 本应拒绝修改一张基本经济舱机票。相反,它找到了一个合法的变通方法:先升级舱位等级,然后再修改航班。基准测试将其标记为失败,因为这个解决方案是出乎意料的。但正是这种跳出常规的思维方式,在当今市场上能获得六位数的薪水。
这一影响超越了个人职业范畴。过去三十年里,软件工程已成为通向中产阶级稳定生活和向上流动的可靠途径,尤其对于那些没有传统学历背景的人而言。编程训练营(Bootcamps)遍地开花,承诺在数月内实现职业转型。大学扩充计算机科学专业以满足看似无限的需求。如今,这条输送人才的管道面临着不确定的未来。
Anthropic 以审慎的措辞承认了这一颠覆。该公司指出,虽然其招聘考试测试的是“时间压力下的技术能力和判断力”,但它并未评估“协作、沟通或多年经验培养出的直觉”。这一警告所带来的安慰微乎其微。正在被自动化的技术技能,恰恰是支撑工程师薪资、以及初级开发人员需要多年培养的那些技能。
ctol.digital 的评估由实际工程师而非营销部门进行,提供了更真实、不加修饰的评价。尽管团队成员指出,在“自然语言多样性”方面更倾向于“早期 Opus 版本”,并承认该模型“可能并非总能生成完美的文本”,但他们强调了其“与之前模型和竞争对手相比,处理长时间代码会话的卓越能力。”评估称交互“更自然、更轻松”,响应“更简洁明了,且无需过多不必要的后续提问。”
尚不清楚的是,这项技术将以多快的速度渗透到工作环境中。颠覆性技术的采用曲线出了名的难以预测,而且组织机构的行动速度往往慢于技术能力所允许的速度。但方向是明确无误的。当测试尖端AI的工程师得出自己的职业正走向“死胡同”的结论时,事实已然清晰可见。
Anthropic 表示,其“社会影响和经济未来”研究旨在理解这些变化在诸多领域的影响,并承诺很快分享研究结果。对于数十万当前软件工程专业的学生以及数百万已身处该领域的从业者而言,这些结果越早公布越好。问题不再是AI能否完成这项工作,而是那些以亲力亲为地完成这项工作为生的人将何去何从。
