谷歌推出Gemini深度思考AI,可耗时30分钟进行思考,但性能超越OpenAI

作者
CTOL Editors - Ken
12 分钟阅读

谷歌 Gemini Deep Think:重塑机器智能规则的AI革命

加利福尼亚州山景城—— 在谷歌人工智能总部的冰冷走廊里,一场静悄悄的革命于今日公之于众。该公司迄今为止最雄心勃勃的人工智能模型 Gemini Deep Think 正式向订阅用户推出,它所带来的能力模糊了人类推理与机器计算之间的界限,同时跨越了安全阈值,引发全球监管机构的关注。

此次发布标志着人工智能军备竞赛中的一个关键时刻,谷歌首次推出了行业分析师所称的首个实现商业规模化的“深思熟虑型人工智能”模式。与那些在毫秒间生成响应的前代产品不同,Deep Think 却刻意放慢速度——有时甚至长达30分钟——以进行并行推理过程,这种方式反映了人类如何同时从多个角度探索复杂问题。

Deepmind (twimg.com)
Deepmind (twimg.com)

当速度成为优势而非缺陷

刻意放慢人工智能响应时间的反直觉方法,代表了科技公司对人工智能能力认知的根本性转变。当竞争对手专注于更快的推理和即时响应时,谷歌却将耐心武器化了。

一位早期用户在 Reddit 上报告说:“Deep Think 回复花了 30 分钟。”这句话既体现了用户初次体验中的沮丧,也体现了其带来的迷恋。然而,这种延长的“思考时间”使模型能够实现谷歌声称的复杂问题解决方面的突破:在 LiveCodeBench V6 的代码生成方面取得了 87.6% 的分数,在“人类终极考试”中取得 34.8%,在无需工具的环境下,表现优于 OpenAI 的 o3 和 xAI 的 Grok 4。

支撑这些能力的技术架构是多年研究成果的商业化体现。Deep Think 基于 Gemini 2.5 的稀疏专家混合模型基础构建,拥有 100 万个 token 的输入窗口,能够处理和推理传统模型无法承受的海量信息——从而实现科学研究到战略规划等此前不可能的应用。

并行思维的数学原理

Deep Think 的核心创新在于其推理方法本身。传统人工智能模型生成单一的响应路径,而 Deep Think 则通过谷歌所称的“并行推理”,同时生成、评估并组合多个想法。这一过程通过新颖的强化学习技术得到增强,使得模型能够在综合最终回复之前,探索数十种潜在解决方案。

这在实际应用中的影响变得显而易见。学术用户描述了一些案例,Deep Think “以与人类研究人员想象的完全不同的方法证明了数学猜想”——这表明是真正的独立问题解决能力,而非从训练数据中进行模式匹配。

对于企业而言,模型的扩展上下文处理能力开辟了全新的用例。处理百万 token 输入的能力意味着 Deep Think 可以分析完整的代码库、审查全面的法规文件,或合成海量研究数据集,这是拥有20万 token 限制的竞争对手在经济上无法匹敌的。

越界:当人工智能能力触发安全警报

也许比 Deep Think 能力本身更重要的是它所跨越的安全阈值。根据谷歌 DeepMind 的“前沿安全框架”,该模型触发了针对 CBRN(化学、生物、放射性、核)风险的“早期预警”警报——这意味着它现在可能以某种方式整合并呈现详细的双用途技术知识,从而降低资源匮乏者开发大规模杀伤性武器的门槛。

该模型也达到了网络安全风险的早期预警阈值,警示其潜在能力可能在安全防护失效时协助高影响力的网络操作。虽然谷歌已实施了多层防御措施——包括输出过滤、多级监控、账户滥用阻止和自动化红队测试——但这些阈值的跨越表明人工智能能力正在进入未知的监管领域。

这一发展正值人工智能治理的关键时刻。当全球监管机构根据欧盟人工智能法案和美国商务部拟议规则等框架起草前沿模型许可要求时,谷歌自愿披露安全阈值跨越行为,可能无意中加速整个行业的监管干预。

市场动态:高端人工智能的战场

从投资角度来看,Deep Think 代表了谷歌在日益商品化的人工智能市场中实现差异化的最大胆尝试。通过将其功能独家捆绑在其每月 249.99 美元的 AI Ultra 订阅中,谷歌创建了分析师所称的“高端用户锁定漏斗”,类似于亚马逊网络服务 (AWS) 的专有芯片策略。

保守估计,到 2026 财年,即使只有 150 万 Ultra 订阅用户,也将产生约 45 亿美元的年度经常性收入——大幅超过谷歌 2024 年人工智能广告试点收入约 9 亿美元。利润率似乎很有吸引力:Deep Think 每次交互的推断成本估计为 0.005-0.01 美元,仅占订阅价格的低个位数百分比,这甚至还没有计入附带的搜索和广告收入提升。

然而,该战略也伴随着显著风险。模型的计算需求随上下文长度而扩展,这意味着订阅用户激增至 300 万可能给谷歌的 TPU 容量带来压力,除非下一代 v7 芯片按计划推出。目前的日用量上限表明,该公司正在优化用户体验的同时管理容量限制。

人为因素:早期采用者探索新领域

真实用户反馈揭示了谷歌方法中固有的复杂权衡。数学和科学界都接受了 Deep Think 的彻底性,研究人员称赞其通过多个分析视角“过度解释”复杂问题的输出。一位数学家指出:“当我可能在思考三四个想法时,Deep Think 却在思考二三十个甚至上百个。”

然而,普通用户则对响应延迟和订阅复杂性表示不满。关于访问问题和退款困难的客户服务投诉浮出水面,这表明谷歌的溢价定位可能会疏远习惯于即时人工智能交互的用户。

模型倾向于冗长的回复——有时会产生 192,000 个 token 的输出——这在重视全面分析的高级用户与寻求快速答案的普通用户之间造成了分歧。这种分化最终可能验证谷歌的高级订阅策略,同时突显了用单一产品满足多样化用户需求的挑战。

投资展望:驾驭新的人工智能经济

对于投资者而言,Deep Think 带来了机遇与风险并存的局面。其技术能力和早期收入潜力支持看涨情景,特别是如果谷歌成功将 Deep Think API 整合到其更广泛的开发者工具和企业服务生态系统中。

需要关注的关键催化剂包括 Deep Think API 2025 年第四季度全面上市,如果与 OpenAI 替代品相比具有价格竞争力,可能会将日用量推高至 50 亿 token 以上。该公司计划于 2026 年第一季度推出的 TPU-v7 将决定谷歌能否扩大容量以满足需求,同时不损害利润率。

然而,监管风险隐约可见。作为首家自愿披露前沿安全阈值跨越情况的主要人工智能公司,谷歌可能面临更严格的审查,这会增加合规成本,同时也会形成竞争壁垒,不利于规模较小的参与者。

市场分析师建议 Alphabet 股价 12-18 个月目标价为 225 美元——这 15% 的上涨空间主要得益于增量的人工智能 SaaS 收入和 Workspace 集成带来的期权价值。该论点假设谷歌能够成功将其技术差异化变现,同时应对监管逆风和计算能力限制。

人工智能的深思熟虑未来

谷歌 Deep Think 的发布标志着行业的一个更广泛的拐点,即原始速度让位于深思熟虑的推理,成为人工智能竞争的下一个前沿。该模型进行长时间、并行思维过程的能力代表了机器智能的根本性进步——这可能重新定义各行业对人工智能能力的期望。

然而,这一进步也伴随着对此类能力所带来风险的清醒认识。当人工智能系统在敏感话题上进行复杂推理的能力越来越强时,行业面临着在平衡创新与安全方面的空前挑战。

谷歌方法的最终成功将取决于企业和高级用户是否足够重视 Deep Think 的扩展推理能力,以证明其高昂的定价和较慢的交互速度是合理的。早期迹象表明,市场渴望更复杂的人工智能工具,即使这意味着牺牲即时性。

对于更广泛的人工智能行业而言,Deep Think 确立了新的竞争方向:竞争不再仅仅是关于更快、更便宜的推理,而是关于哪些公司能够构建出真正具备独立推理能力的人工智能系统。在这场竞赛中,耐心可能确实是一种美德——也是显著的竞争优势。

投资预测基于公开数据,不应被视为个性化的财务建议。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯

我们网站使用Cookie来启用某些功能,为您提供更相关的信息并优化您在我们网站上的体验。更多信息请参阅我们的 隐私政策 和我们的 服务条款 。强制性信息可在 法律声明