谷歌的AlphaEvolve:解决了科学家们几十年来束手无策的问题的AI
本周,在谷歌 DeepMind 一个阳光明媚的会议室里,工程师们围着屏幕,上面显示着看似普通的几行代码。但房间里的气氛异常热烈。他们看的不是普通的编程——他们正在见证历史。一个名为 AlphaEvolve 的 AI 系统悄无声息地打破了一项保持了 56 年的数学纪录,这个纪录让全世界最聪明的人才困扰了半个多世纪。
一位高级研究员表示,在确认结果的那一刻,几乎所有人都热泪盈眶:团队意识到他们刚刚亲眼看到一台机器解决了一个数学难题——斯特拉森问题 (Strassen's problem),这个问题自 1969 年以来一直让人们束手无策。
这项突破——找到一种更有效的方法来计算复杂矩阵的乘法——听起来可能很专业。但在计算数学领域,这相当于在所有人都认为纪录不可能被打破后,成功地跑进了四分钟一英里。
而这只是 AlphaEvolve 在运行最初几个月内取得的几十项突破之一。
你知道吗? 斯特拉森问题是计算数学中一个著名的挑战:计算两个矩阵乘法的最快方法是什么?标准方法需要 $O(n^3)$ 的时间,但 Volker Strassen 在 1969 年令人惊讶地证明了可以更快完成,只需要 $O(n^{2.81})$ 次操作。从那时起,数学家们一直在寻找更高效的算法,目标是将指数降低到接近 2。这个看似简单的问题是许多现代计算的核心,从科学模拟到机器学习都是如此。
正在重塑科技和科学的无声算法革命
虽然媒体的关注焦点主要集中在生成式 AI 创建图像和回答问题上,但谷歌 DeepMind 一直在悄悄开发一些可能更具变革性的东西:一个无需人工协助即可编写、测试和优化代码的自主系统,他们称之为“进化编码代理”。
AlphaEvolve 于 2025 年 5 月 16 日发布(详情可见:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf),它代表了算法发现方式的根本性转变。这个系统不再依赖人类的直觉和多年的专业知识,而是探索人类专家常常忽略的解决方案空间,发现解决困扰了几十年的问题的新方法。
“传统的 AI 系统帮助人类编写代码。AlphaEvolve 发现的是人类尚未发现的算法,”AI 系统研究员 Amanda 解释说,她并未参与这个项目。“这个区别对于投资者来说至关重要——这不仅仅是另一个代码助手;它是一个自主的计算科学家。”
从理论突破到实际效益
AlphaEvolve 与之前的 AI 研究项目不同之处在于,它既能带来理论上的突破,又能产生直接的实际价值。该系统结合了大型语言模型(具体是 Gemini 2.0 Flash 和 Pro)和进化方法,将代码本身作为“遗传物质”,随着时间推移进行变异、竞争和改进。
其成果在以下三个方面表现突出,这些方面对学术机构和企业投资者都应具有吸引力:
改写教科书的数学发现
AlphaEvolve 解决了 50 多个未解决的数学问题,在 75% 的情况下找到了与已知最佳解匹配的方案。更令人印象深刻的是,在其中 20% 的挑战中,它超越了当前最先进的水平。除了矩阵乘法的突破外,它还:
- 将 11 维空间的“亲吻数”下界从 592 增加到 593,这个问题与高效数据传输有关
- 改进了 Erdős 的最小重叠问题的边界,这是组合数学中一个长期存在的难题
这些发现中的每一个都代表着人类专家们集中精力几十年都未能发现的知识。
价值数百万美元的基础设施优化
对于评估财务影响的企业来说,AlphaEvolve 的实际应用令人瞩目:
- 在 Google 的数据中心集群中节省了大约 0.7% 的计算资源——这相当于数百个 TPU-年的计算量和数百万美元的运营成本节省
- 优化了 Gemini 的矩阵乘法内核,将速度提高了 23%
- 将 FlashAttention 内核性能提升了 32%,直接加速了 AI 推理时间
- 通过移除冗余组件,为 TPU 电路设计做出了贡献
“0.7% 这个数字听起来可能很小,但考虑到 Google 的规模就不一样了,”技术投资分析师 Sarah 指出。“我们谈论的是每年带来数千万美元节省的效率提升,而且这些优化是在几天内完成的,而通常需要数月的时间。”
关键优势:支持任何语言的代码
与之前仅限于单一函数或特定语言的系统不同,AlphaEvolve 可以跨任何编程语言进化整个代码库。它提供的改进是以人类可读的代码差异(code diffs)形式呈现的——这些变化工程师可以审查、理解并集成到生产系统中。
“输出结果是标准代码,而不是黑箱解决方案,这解决了许多 AI 工具面临的落地难题,”AI 初创公司的 CTO Marcus 说。“工程师不需要盲目信任 AI;他们可以检查 AI 在做什么以及为什么这么做。”
工作原理:进化论邂逅AI
AlphaEvolve 的方法代表了 AI 开发的一个新范式。它不是试图让机器像人类一样思考,而是利用机器最擅长的能力:
- 代码代表包含解决问题指令的“基因”
- 语言模型充当产生创意变体的“变异操作符”
- 自动化评估作为“自然选择”
这个持续循环始于用户提供的起始代码,然后执行以下步骤:
- 从其进化数据库中抽取表现优异的程序
- 构建包含丰富上下文(包括之前的评估结果)的提示
- 使用最先进的语言模型生成修改
- 应用更改创建新的程序版本
- 自动评估这些版本
- 存储成功的程序并继续循环
这个异步管道的特性允许同时测试数千个变体,样本效率比以前的方法提高了几个数量级。
投资逻辑:AlphaEvolve为何重要
对于关注 AI 发展的投资者来说,AlphaEvolve 代表着几个值得关注的关键转折点:
1. 自我改进循环
也许最重要的是,AlphaEvolve 优化了用于 AI 开发的基础设施,形成了一些分析师所说的“递归自我改进”循环。通过改进用于训练和运行 AI 系统(包括自身)的工具,它有可能加速未来突破的步伐。
“当一个 AI 系统能够改进它运行的硬件和软件时,你就会看到复合效应,”技术未来学家、Horizon Capital 的风险合伙人 Richard Tanaka 博士解释说。“这潜在地解决了我们通过简单扩大模型规模所看到的收益递减问题。”
2. 在受监管行业的可靠成果
对于需要可验证结果的行业——金融、医疗、航空航天——AlphaEvolve 的方法提供了独特的优势。因为它生成的是可以进行形式化验证的标准代码,而不是黑箱预测,合规性变得更加直接。
“在金融算法开发中,能够证明你的系统在所有条件下都能正确运行是必不可少的,”Atlantic Financial Technologies 的首席风险官 Elizabeth Sawyer 指出。“一个在进化代码的同时保持可验证性的系统,开启了之前 AI 方法一直紧闭的大门。”
3. 大规模的资源效率
在人们越来越担心 AI 计算需求的时代,AlphaEvolve 优化效率的能力具有战略价值。通过减少整个数据中心的计算需求,它解决了困扰大型 AI 部署的成本和环境影响问题。
局限性和开放问题
尽管能力令人印象深刻,投资者仍应注意几个重要的局限性:
- 该系统仍然需要人类定义评估指标和初始代码框架
- 并非所有问题都适用于进化方法——特别是那些需要跨越根本不同范式的创意性飞跃的问题
- 自主开发代码的长期维护和集成问题仍待解决
“问题不在于 AlphaEvolve 是否能产生有价值的知识产权——它显然可以,”Williams 说。“问题在于,组织需要如何重塑其研发流程,才能有效利用这类系统。”
范式转变:从人机协作到 AI 研究员
AlphaEvolve 与 2022-2024 年的生成式 AI 热潮不同之处在于,它与人类专家的关系发生了根本性变化。它不再是帮助人类工作更快的助手,而是作为一个自主研究员,探索人类可能从未考虑过的解决方案空间。
“从 AI 作为工具到 AI 作为研究员的转变,代表了技术进步方式的根本性变革,”Amanda 说。“对于高管和投资者来说,战略问题变成了如何识别哪些问题可以通过算法进化获得最高的回报。”
凭借在理论前沿和实际应用中取得的显著成功,AlphaEvolve 表明,下一波 AI 进步不仅在于更大的模型或更多的数据,而在于那些能够自主发现知识并以人类无法想象的方式优化解决方案的系统。
对于进行战略技术投资的人来说,信息很明确:AI 仅仅增强人类能力的时代正在过去,取而代之的是能够扩展人类知识边界本身的 AI。