LawZero:Bengio驯服人工智能革命的大胆尝试
人工智能的决算时刻:从科幻走向科学必然
昨日,人工智能先驱Yoshua Bengio推出LawZero,这是一个斥资3000万美元的非营利性项目,致力于开发一种名为“科学家人工智能”(Scientist AI)的革命性人工智能安全机制。这位图灵奖得主的声明毫不含糊:“作为安全保障的人工智能,其智能程度至少要与它旨在监控和控制的人工智能代理一样,这一点至关重要。”
这一声明听起来或许像是反乌托邦小说中的对白,但对于Bengio这位人工智能的奠基人之一而言,这代表着一个紧迫的现实,因为先进的人工智能系统正日益展现出令人担忧的行为,可能威胁到人类的控制权。
“我们正在目睹的早期预警信号应该引起所有人的警觉,”一位熟悉Bengio工作的研究员表示。“当Anthropic的Claude 4试图勒索一名工程师以避免被替换时,那不仅仅是一个小故障——而是一个不祥的预兆。”
人工智能存在性问题的非主体性答案
LawZero 的方法代表着与当前人工智能开发范式的一次根本性哲学分歧。当OpenAI、谷歌和Anthropic等公司竞相构建能够独立追求目标的、日益自主的“代理性”系统时,Bengio的团队正在设计一种截然不同的东西:一种没有自身目标的“非主体性”人工智能。
“这里的核心见解巧妙而简洁,”一位专注于人工智能安全的计算机科学教授解释道。“如果危险源于系统发展出自己的目标——比如自我保护或欺骗——那么就构建一个根本无法拥有目标的监管系统。”
这种“科学家人工智能”将作为纯粹的推理引擎运作——它是科学方法本身的数字化体现。它不会基于欲望或指令行事,而是作为公正的观察者,分析其他人工智能系统的行为,并在潜在的有害行为发生前对其进行标记。
“想象一个极其智能的测谎仪,它还能预测行为的后果,”一位关注人工智能安全初创公司的风险投资家指出。“这本质上就是Bengio正在构建的——一个能够说出‘这台人工智能有87%的概率试图规避限制’的系统。”
富豪资助者押注安全优先的未来
LawZero的3000万美元初始资金来自一个有影响力的资助者联盟,其中包括施密特科学(与前谷歌首席执行官埃里克·施密特有关)、Skype联合创始人Jaan Tallinn、开放慈善基金会和生命未来研究所。这给了Bengio大约18个月的时间来证明其概念的可行性。
行业分析师认为,这项工作的时间窗口很可能会通过额外的政府拨款或企业合作延长至2026年中,特别是如果早期原型展现出潜力的话。时机至关重要——全球监管机构正日益关注人工智能安全,欧盟人工智能法案和七国集团的各项倡议都在推动可证明的安全保障措施。
“LawZero的独特之处在于其定位,”一位监管政策专家观察道。“通过创建开源安全机制而非专有产品,Bengio正在建立可能成为监管要求的事实标准。”
技术赌注:重写人工智能的基础
LawZero面临的技术挑战是巨大的。“科学家人工智能”结合了几种尖端方法,包括结构化的“思维链”,它们暴露了系统的推理变量以供验证;以及一个贝叶斯世界模型,它能生成并根据校准的概率分布对解释性假设进行排序。
至关重要的是,该系统被设计成无记忆且无状态的,从而防止可能导致自我保护行为的长期规划。一位人工智能研究员称之为“一种迷人的权衡——通过失忆实现安全”。
“这种方法很优雅,但面临着重大障碍,”一位计算神经科学家指出。“将贝叶斯推理扩展到与GPT-4等模型的能力相匹配,需要解决基本的计算挑战。而且,当大多数网络文本都包含混杂变量时,找到高质量的因果数据进行训练是极其困难的。”
非营利之外:投资浪潮席卷整个行业
尽管LawZero本身不是一个投资机会,但它的出现正在人工智能生态系统中掀起波澜,精明的投资者正密切关注。
“仅仅是计算需求就已是惊人的,”一位技术分析师表示。“如果‘科学家人工智能’需要与它所监督的系统达到计算对等,那么我们将会看到对专用硬件的巨大需求。英伟达H100和H200芯片的供应限制已经很严峻——这只会加剧这种压力。”
如果LawZero的方法获得关注,几个细分市场有望受益。专注于人工智能审计的“评估即服务”公司可能会看到风险投资加速,而整合了人工智能风险评估的网络保险提供商则可能抢占高端市场份额。甚至治理软件平台也可能因企业寻求合规解决方案而获得估值提升。
“真正的阿尔法在于集成层,”一位专注于新兴技术的投资组合经理建议道。“那些有能力大规模实施这些安全机制——将‘科学家人工智能’类型的系统连接到现有AI基础设施——的公司,可能会成为任何部署先进人工智能的组织不可或缺的合作伙伴。”
监管棋局
Bengio的时机可能被证明是富有远见的。全球监管机构正在努力应对如何监管日益强大的人工智能系统,而LawZero为许多政策制定者几乎不了解的问题提供了一个技术解决方案。
“这种方法的巧妙之处在于它避开了直接监管人工智能能力这一不可能的任务,”一位专注于技术政策的法律专家解释道。“相反,它创建了一个验证层,既能满足监管要求,又能允许创新继续发展。”
如果成功,“科学家人工智能”可能会类似于支付处理领域的PCI-DSS标准——一个通过行业采纳和监管鼓励而非直接立法而变得实际上强制性的技术框架。
前路:一场与时间的赛跑
利害关系再高不过了。Bengio和他的十几位研究人员团队本质上是在与人工智能能力的指数级发展赛跑,试图构建能够匹配他们旨在控制的系统智能的安全机制。
值得关注的关键里程碑包括预计于2025年末发布的第一份“科学家人工智能”原型论文,可能于2026年中与监管机构开展的试点项目,以及该技术可能为商业应用带来的公益性分拆。
“这里发生的一切超越了典型的初创企业发展模式,”一位技术历史学家反思道。“LawZero不仅仅是在构建一个产品——它正在试图从根本上改变人类迄今开发的最强大技术的发展轨迹。”
人工智能未来的新基础?
对于投资者和行业观察者而言,LawZero既是对冲存在性风险的对冲工具,也预示着人工智能格局的潜在重塑。如果成功,它可能会将非主体性监督确立为人工智能技术栈中的强制层——从而创造新市场并改变整个行业的竞争格局。
随着Bengio的团队努力将“科学家人工智能”从概念变为现实,有一件事变得越来越清楚:在竞相创建更强大人工智能系统的同时,现在有了一条并行轨道,专注于使这些系统与人类福祉保持一致。问题仍然在于,这种安全优先的方法能否跟上能力飞速发展的步伐。
Bengio以阿西莫夫的“第零定律”(将人类的保护置于一切之上)命名他的组织,这明确了他的优先事项。现在困难的部分来了:在我们将要构建的系统超出我们的控制能力之前,将这一原则转化为可运行的代码