米拉·穆拉蒂的首款产品Tinker面临重重阻碍,工程师质疑其价值主张

作者
CTOL Editors - Ken
8 分钟阅读

米拉·穆拉蒂的首款创业产品遭遇“冷遇”

工程师们对其微调API的投入产出比持怀疑态度,开源竞争对手依然强劲

旧金山 — 去年秋天,在数月紧张关系传闻之后,米拉·穆拉蒂离开OpenAI时,整个AI界都屏息以待。这位曾被视为公司最具影响力人物之一的前首席技术官,正在酝酿新的项目。本周,她的初创公司Thinking Machines终于揭开了面纱。首款产品是Tinker——一款托管式API,承诺将大规模、开放权重语言模型的微调过程变得不再那么痛苦。

然而,此次发布没有迎来掌声,反而遭遇了质疑。

“Unsloth要好得多,”CTOL.digital的一位工程师在我们内部的Slack频道中评论道,这概括了业界大部分人的初步反应。我们团队的分析显示,Tinker是否真正带来了创新,这一点令人严重怀疑。

对穆拉蒂而言,风险再高不过了。她没有追逐下一个大型GPT式模型,而是推出了微调服务,这表明她押注AI的未来在于定制化。这直接剑指她前雇主的“封闭盒子”哲学——也是一场豪赌,要么验证Thinking Machines的高估值,要么将其暴露为过度炒作。


承诺:简化最难的部分

理论上,Tinker提供了一个简单的解决方案。它负责处理繁琐的基础设施难题——例如调度、资源分配和从故障中恢复——同时让研究人员能够控制他们的数据和算法。团队只需一行代码,即可在不同模型间切换,从小规模构建到Qwen-235B-A22B这样的大型模型。

该系统运行在Thinking Machines的内部集群上,并利用LoRA(低秩适应)将计算资源扩展到多个训练任务中,从而可能降低成本。为帮助开发者入门,该公司还发布了“Tinker Cookbook”,这是一个包含现代训练后方法的开源库。

一些重量级研究团队已经对其进行了初步测试。普林斯顿大学、斯坦福大学和伯克利大学的团队在从数学定理证明到化学推理等各种项目中测试了Tinker。Redwood Research甚至用它在复杂的AI控制问题上训练了Qwen3-32B。


问题:如何让人们相信它的与众不同之处

症结在于:这些都无法回答工程师们不断提出的问题——为什么要放弃他们已经信任的开源工具?

我们CTOL.digital工程团队的评估指出了两个薄弱环节。首先是纯粹的怀疑。如果没有Tinker与Unsloth或TRL等成熟系统进行对比的公开基准测试数据,开发者就无法通过具体数字来判断它是否更快、更便宜或更稳定。“清晰、经过验证的优势”是他们想要的。到目前为止,他们还没有看到。

第二个问题更具杀伤力。一些工程师将Tinker斥为“投资者表演”,认为它是一款旨在打动投资人而非服务真正用户的工具。一旦这种看法根深蒂固,再怎么强调易用性也无济于事。

“我们想要透明、可复现的成果,在成本和性能上超越现有技术栈,”我们的一位工程师直言不讳地说道。在这些出现之前,疑虑将占据上风。


缺失:经得起检验的证据

Tinker首次亮相最大的漏洞显而易见:缺乏独立基准测试数据。至今没有发布任何一项训练运行数据,将其与替代方案在真正重要的指标上进行比较——例如每token成本、吞吐量、训练稳定性、收敛时间。

这种沉默让工程师们只能猜测,而非评估。他们无法判断Tinker的托管基础设施是否真正减轻了负担,或者其LoRA技巧与在租用GPU上运行Unsloth相比是否真的节省了费用。

同样引人注目的是那些没有被提及的信息。缺乏详细的bug报告或故障分析表明,大多数开发者甚至还没有认真投入时间对其进行测试。一旦内测(beta)范围扩大,用户开始分享日志、配置和可复现的错误,反馈要么会变成尖锐的批评,要么会逐渐被接受。


更宏大的图景:一场对抗AGI热潮的赌注

Tinker的发布也揭示了穆拉蒂对未来更深层次的看法。通过选择微调基础设施而非前沿模型开发,她是在表明她不认为通用人工智能(AGI)会在短期内实现突破性飞跃。

这一观点使她与OpenAI的其他校友,例如联合创始人John Schulman以及研究员Barret Zoph和Luke Metz站在了一起,他们都已转向开放权重模型。他们的行动共同表明了一种共识:目前,定制化开放模型比竞相开发下一个大型封闭系统更具实际价值。

这场争论触及了AI产业的核心。进步是来自于构建更大、更严密看管的模型,还是来自于发明更智能的方法来适配已有的模型?


前路:证明自己,否则销声匿迹

Thinking Machines正在逐步将用户从等候名单中移除。该服务在内测期间免费,但很快将转为按使用量计费的模式。当被问及工程师们的冷淡反应时,该公司拒绝置评。它也没有分享任何与竞争系统对比的基准测试数据。

这种沉默只留下了一条路。要赢得信任,穆拉蒂的团队需要发布确凿证据:可复现的基准测试、实际的成本节约、稳定性改进以及用实际训练曲线记录的生产力提升。没有这些,Tinker就有可能被记住为一个华而不实、未能站稳脚跟的首次亮相。

CTOL.digital的一些工程师直言不讳:“一旦内测扩大,用户发布了配置、日志和故障结果,预计会有更多实质性的批评。但等等,投资者现在是不是在哭了?”

穆拉蒂在OpenAI时期的声誉仍能为她赢得关注。她能否保持这种关注,取决于接下来会发生什么——不是口头承诺,而是实实在在的证据。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明