超越提示词:上下文工程如何重塑人工智能经济格局
随着长上下文模型改变科技估值,投资者竞相抓住中间件机遇
硅谷一家初创公司熙熙攘攘的办公室里,键盘的轻柔敲击声和关于代币经济学与检索延迟的低语交谈声此起彼伏。工程师们不再是编写巧妙的提示词——他们正在为能够处理百万级上下文代币的人工智能模型架构整个内存系统。
这一转变不仅仅是技术演进;它预示着人工智能领域一场深刻的经济重新调整,正静悄悄地重塑着公共和私人市场的投资流向。
新的人工智能战场:内存,而非智力
“提示词从来就不是核心。它只是一种沟通技巧。上下文才是模型‘思考’的方式,”一位领先实验室的人工智能研究员解释道。
业界已迅速从精心设计完美指令转向构建精密的信息环境,为人工智能模型提供执行复杂任务所需的全面背景。这种方法——被称为上下文工程——已成为生成式人工智能决定性的竞争优势。
实际上,上下文工程涵盖了从对话历史、领域知识到工具集成和内存持久化的一切。虽然一个巧妙的提示词可能会产生令人印象深刻的一次性响应,但上下文工程使人工智能能够在长时间交互中保持认知,利用外部工具,并精准适应特定领域。
“好的上下文胜过好的模型,”一位资深工程师指出。“有了清晰和精心策划的上下文,即使是中等模型也能表现得像魔法一样。”
240亿美元争夺人工智能内存层
其经济影响是巨大的。仅在2024年,风险投资公司就向人工智能基础设施部署了大约240亿美元,尽管整个科技行业的季度环比融资下降了16%。这种集中投资源于一个引人注目的指标:专注于上下文工程的初创公司,一旦其产品进入生产环境,净收入留存率超过150%。
当前的市场格局具有多个竞争层级,每个层级都吸引了大量资本:
OpenAI和Anthropic领衔基础模型领域,估值分别约为900亿美元和610亿美元。他们最新的模型上下文窗口从20万到100万个代币不等,为大规模推理设定了新的价格底线。
Pinecone(在1亿美元的B轮融资后估值达7.5亿美元)等向量数据库和内存存储提供了检索增强生成(RAG)的骨干,毛利率高达80%以上。
LangChain、LlamaIndex和Context等编排平台正在竞相掌握开发者体验,其中Context在1100万美元的种子轮融资后估值达到7000万美元。
Rewind AI(个人记忆助手)和Airial等垂直应用通过利用上下文工程创造独特的用户体验,绕过了传统守门人。
聪明的资金流向:基础设施,而非小工具
公共市场已开始认识到这一转变,静静地重估那些拥有强大上下文工程能力的公司。Snowflake的“Snowpark容器服务”和Snowflake Cortex中的原生向量索引代表了重要的上下文工程敞口。同样,MongoDB的10维向量索引至少推动了25%的新工作负载。
科技巨头们也未错过这一趋势。微软将其上下文工程嵌入其Microsoft 365 Graph中,为Copilot提供动力;谷歌利用其Gemini模型进行知识图谱检索,并提供Vertex RAG API。亚马逊则将Bedrock RAG能力与Titan嵌入和“Redis版MemoryDB”结合,以巩固其地位。
“如果说提示词工程是与AI对话,那么上下文工程就是与AI协作,”一位行业分析师观察道。
即将到来的中间件革命
市场观察者将当前环境与早期的Hadoop/Spark时代相比较——但进展速度快5-10倍,且资本密集度显著更高。与以往的技术范式转变一样,最大的价值归属于那些控制和优化数据路径的人。
“我们正在目睹一场数据中心规模的中间件替换周期,”一家专注于科技的对冲基金高级投资组合经理解释道。“问题不在于你租用哪个基础模型,而在于谁拥有内存图谱。”
这一转变创造了几个值得关注的特定投资主题:
上下文编译器能够将数百万个代币压缩并排序到最重要的几千个,它们很可能控制成本曲线;开发基于Transformer的跨不同数据类型摘要技术的初创公司正处于优势地位。
垂直内存图谱,利用现有企业无法访问的监管或专业数据集,提供了另一个有前景的途径,特别是在放射学等医疗保健领域。
自托管的“信任云”,旨在解决欧洲监管要求,为提供企业支持的开源堆栈带来了机会。
实时处理视频和音频输入的多模态代理,可能彻底改变从自动驾驶到客户服务等行业。
内存经济中的隐藏风险
尽管热情高涨,但挑战依然严峻。没有可防御的上下文工程后端支持的消费级AI小工具已被证明容易快速过时,Humane AI Pin在推出10个月内就基本“变砖”。
其他担忧包括“上下文膨胀”——不加区分地扩展上下文窗口,导致运营费用暴增而没有相应的准确性提升——以及监管逆风,例如拟议的美国“国家AI日志记录规则”,该规则可能要求关键应用的所有检索上下文都必须不可变地存储。
经验丰富的投资者正在开发定制仪表板来跟踪关键绩效指标,包括有效上下文利用率、检索延迟、上下文代币成本占毛利率的百分比,以及以保留天数衡量用户级上下文深度。
明日的赢家:数据管道重于原始智能
展望未来,行业专家预计向量数据库领域将出现整合,至少一家主要的云提供商可能在2026年中期之前收购Pinecone或Weaviate等领先玩家,届时协同效应将使其估值在20-30亿美元之间。
普遍观点认为,开源上下文工程堆栈将使通用检索增强生成商品化,将价值推向领域特定的嵌入和压缩知识产权。此外,多模态上下文工程——尤其是针对视频的——到2028年可能将检索硬件的总潜在市场扩大到400亿美元以上。
“超额收益在于数据供应链,而不在于更高智商的模型,”一位专注于人工智能基础设施的风险投资家总结道。“一个拥有专有、持续刷新上下文的中端模型,将超越一个基于陈旧数据的万亿参数模型——这就像Netflix用物流击败百视达,而不是靠更好的DVD。”
在这个快速发展的格局中,一个结论变得越来越清晰:上下文工程不仅仅是一个流行词——它是基础设施。与以往的技术变革一样,那些控制内存层而非发声者的人,将可能攫取最大的价值份额。
免责声明:本分析基于当前市场数据和历史模式。过往业绩不保证未来结果。读者应咨询财务顾问获取个性化投资建议。