
关于人工智能领域价值如何累积的辩论,如今有了一个全新的框架:
智能体实验室 vs 模型实验室。
从 2015 年到 2025 年,模型实验室无疑是最佳去处。这十年,我们见证了预训练、规模化和推理这三大范式的演进。
如今 OpenAI 估值高达 5000 亿美元,每年烧钱 450 亿;Anthropic 估值也达 2000 亿。再加上 Gemini、Xai、DeepSeek、Qwen实验室等,越来越多具备竞争力的模型涌现,模型的多元化已成定局,这为应用层的开发者提供了全新的优化空间。
智能体实验室的路径是先交付产品,在获得数据、收入、信念和对问题领域的深刻理解后,再向下游探索。
模型实验室创造前沿模型,智能体实验室则将它们应用于尚未被完全攻克的领域。未来已来,只是分布尚不均衡。

有趣的是,智能体实验室以两种截然相反的方式发挥作用。它们要么将前沿技术分发到未触及的市场,要么通过烧钱或巧妙定价,利用自我一致性等技巧,模拟未来模型的能力,从而拉动未来的到来。这抢在了单位智能成本每 1.5 年下降 1000 倍的行业趋势之前。
将问题简单看作循环中的大语言模型是远远不够的。像 Devin 和 Cascade 这类智能体与这种简化模型之间的差距,正是开发者们长期低估的最后 10%。
Cursor 和 Cognition 可能是两家领先的智能体实验室,估值分别达到 200 亿和 100 亿美元。它们都依赖于 OpenAI 和 Anthropic 等公司的大型基础模型。与此同时,Claude Code 在正式发布后短短 4 个月内,年化收入就达到了 5 亿美元。
智能体实验室的商业模式挑战
早在去年 12 月我们初次探讨 AI 领域的垂直整合时,智能体实验室的差异化打法就已经日渐清晰。
我的朋友 Alex Mackenzie 写道,开发者过去可能认为 Cursor 一半以上的价值来自底层的第三方模型。但现在,资金充裕的 Cursor 完全有能力通过自研模型,彻底扭转这个价值比例。
不过,他们采取行动的顺序至关重要。因为他们已经赢得了开发者的心智份额。
现在,我们能以更高的分辨率看清智能体实验室和模型实验室的博弈棋局。SemiAnalysis 的 Dylan Patel 最近在谈论 Cursor 时,就阐明了支持智能体实验室的观点:
Anthropic 是否掌握所有权力?很多人都觉得是。但问题是,Anthropic 只是制造了生成代码的模型而已。
这个系统里还有更多环节。Cursor 获取了所有数据和用户,Anthropic 却得不到这些。他们只收到提示,然后返回一个响应。
Cursor 正在基于你的代码库训练嵌入模型。实际上,他们已经制作了嵌入模型和自动补全模型等多个模型。
我可以随时把 Anthropic 模型换成 OpenAI 模型。我用它,只是因为它目前最好。而且,因为我手握这些数据,或许我能在特定细分领域,训练出比你更好的模型。
这套打法确实引发了对商业模式与产品契合度的担忧,毕竟智能体实验室的市场份额依赖于模型实验室。
Cursor 的用户需要最顶尖的编码性能,而这恰恰由前沿模型实验室提供。这导致 Cursor 的运营成本被 OpenAI 和 Anthropic 的定价牢牢套死。Cursor 无法控制两个关键要素:
模型性能的前沿(用户需求所在)。 模型输入输出的定价(Cursor 的成本所在)。
如果 Cursor 转向更廉价、性能更弱的模型,追求性能的用户会立即流失。如果它坚守前沿却不涨价,服务重度用户的可变成本将急剧膨胀。为应对此困境,Cursor 不得不提价并设置用量上限,但这又导致了用户的愤怒和离开。
在一个可变成本的业务中,一旦出现不限量的承诺,其产品市场契合度就永远是个疑问:
用户究竟是冲着产品来的,还是冲着补贴来的? 如果按真实的边际成本付费,他们还会用这么多吗? 在能按成本比例定价之前,Cursor 自己也无法知晓答案。
数据:智能体实验室的最终王牌
但事实果真如此吗?
萨提亚·纳德拉曾这样描述微软与 OpenAI 的关系:
“我们有人才、有算力、有数据,我们拥有一切。我们在他们之下,之上,也在他们周围。
Cursor、Cognition 等智能体实验室的目标正是如此:通过在平台底层、顶层和外围进行全方位布局,来降低对任何单一模型实验室的依赖。
辩论至此,常见的一种反驳是:赌模型实验室会停止进步是愚蠢的。
然而,长期看好模型进步是一回事,将一切都拱手让给超级智能则是另一回事。正如 Cognition 首席执行官 Scott Wu 所说:
现实世界中的软件工程极其混乱。我认为大多数学科,如法律或医学,都是如此。
所以,尽管通用智能会越来越强,但在将技术转化为真正可用的产品体验上,仍有大量工作要做。这不仅关乎特定场景下的能力构建,更关乎如何交付和触达客户。

你可以认为,我们是在做空超级智能。
Scott 的话击中了智能体实验室的核心论点:
从硬件转向模型训练,是完全不同的两种逻辑。模型实验室的基因,是找到顶尖研究员,给他们尽可能多的 GPU,并围绕此建立一种文化。
而应用层则极为专注,其核心是想尽办法让一个具体用例跑通。对我们而言,我们只关心构建软件工程的未来。
很多人在真空中谈论 AI 代码,但我们独特的地方在于,我们真正思考的是软件工程本身,以及随之而来的所有混乱、产品界面、交付方式和使用模型。
实践证明,这个领域充满了大量的上下文知识和行业细节。如果你从未见过 Angular,也从未亲手做过 Angular 迁移,那你又能多擅长这项工作呢?让模型在这方面做得更好的方法,就是给它正确的数据。这其中存在一个天然的能力上限。
归根结底,智能体实验室拥有能够捕获强化学习所需的最有价值数据的产品接触面。
一键三连「