本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。

AI 创企 you.com 近日在完成 1 亿美元 C 轮融资,同时宣布从搜索引擎转型为 AI Infra 公司。业界认为这种转变遵循「产品驱动基础设施」的战略模式,是在 Agentic AI 从实验室成功商业化趋势下深思熟虑的策略。此前,如 E2B 的 SandBox,Browserbase 的 AI 浏览器等创业项目也曾引发相似的讨论。
目录
Sandbox 之外,还有哪些工具属于 Agent Environment?非共识下的 Agent Environment 有哪些热门创业项目?...
01 AI 会写代码后,Agent Environment 要如何跟上版本?
1、伴随 Agentic AI 在近两年疾速发展,人工智能的重心正在从专注内容创作的生成式 AI 转向目标驱动的、具有自主执行能力的 Agentic AI。
① 吴恩达在多次演讲中表示,AI Agent 将成为我们与计算机交互的新界面,用户只需用自然语言下达指令,而无需编写代码或点击按钮。
② 同时,诸如 Cursor、Bolt 和 Mercor 等公司利用具有特色的智能体产品实现了巨大的营收增长。
2、在此趋势下,具备 Computer Use 能力的 AI Agent 能够通过理解屏幕上的像素信息,直接使用虚拟的鼠标和键盘与图形用户界面进行交互,摆脱了对特定 API 的依赖,但人们同样不希望 Agent 能够随意支配自己的电脑。
① 以编码 AI 为例,开发者想给 agent 或 AI 应用尽可能大的自由度,让它们可以运行任何想运行的代码,这可能包括访问完整的文件系统、下载依赖包等。
② 从安全性与隔离性考虑,开发者希望确保不同用户的代码不会在同一个环境里运行,因为开发者并不知道用户的代码具体在干什么,也不知道有没有敏感信息被泄露。
3、这种矛盾促使人们开始思考如何开发适用于现代智能应用的「Agent Environment」,以及相应的的 AI Infra。[1-1]
① 如 E2B、Modal Labs 等公司通过虚拟机的形式为 Agent 提供安全、隔离的云环境(Sandbox),专用于运行 AI 生成的代码。
4、Agent Environment 可以理解为 AI 智能以生存、感知和行动的数字或物理空间。它为智能体提供了所有必要的输入(感知)和反馈,并定义了智能体可以采取的所有行动。
① Agent Environment的根源可追溯至强化学习领域。在 RL 的语境中,「环境」通常是一个用于训练的模拟空间(如游戏、物理引擎、棋盘等)。Agent 在这个封闭的环境中通过不断的试错和接收奖励信号来学习最优策略。
② 这类环境的核心目标是保证训练的保真度,使其能够有效地模拟特定领域的动态,从而让 Agent 学会解决特定问题。[1-2]
5、伴随 LLM-based Agent 的突破,现代 Agent 应用需要在真实世界中执行复杂的、多步骤的任务, 其对环境的需求也从「训练场」转变为「作业区」。[1-3]
① 以当下最受关注的编程任务为例,面向 Agent 的环境必须能够提供对真实世界工具的安全访问,包括文件系统、代码解释器、网络浏览器和外部 API。其核心目标也从训练保真度转变为确保执行的可靠性与安全性。
6、纵观 Agent 应用所应对的任务和交互对象,也有一种思潮引述强化学习中对环境的定义,用交互所需的「环境」来区分不同的 Agent。
① 从交互对象出发,部署于机器人或无人车的具身智能体需要「物理环境」(Physical Environment),虚拟助手需要「数字环境」(Digital Environment),甚至人类在作为 Chatbot 交互对象时也可被视为一种环境。[1-3]
② 从具体的 Agent 应用出发,Manus 的环境是虚拟机(VM),Devin 对应浏览器,flowith 对应笔记本...
