|
AI基建,还没有做好承接Agent爆发的准备。
|
文|周鑫雨
编辑|苏建勋
2025年12月,若是登上一架飞往美国的飞机,那你大概率会遇见两拨人:
一拨由大聊深度学习、注意力机制的博士,大厂高管,以及投资人组成。他们的目的地是圣地亚哥,AI研究界“奥斯卡”NeurIPS(神经信息处理)的举办地,押注未来最有价值的AI研究和人才。
另一拨,则指向当下最务实的AI落地。一群拿着名片的AI创业者、合作客户,涌入拉斯维加斯——在亚马逊云科技一年中最重要的展会re:Invent上,寻找AI确定性的机会。
至于这个确定性的机会——与re:Invent上的十多名在美开发者交流后,我们看到了大洋两岸的共识是:Agent的时代已经到来。
亚马逊云科技CEO Matt Garman宣布的12项有关AI的新发布,都围绕着Agent的基建、开发和管理。在演讲中,他下了一个判断:AI Agent的出现,正在让AI的价值真正释放。
亚马逊云科技的一名在美工程师,深切感受到了水温的变化。去年12月的re:Invent,铺满全会场的标语,是AI Cloud、Model as a Service,谈到Agent的,只有DataDog等不到五家厂商。
但今年不同了。“如果你和全场每一个宣称要做Agent的展商干杯,即便他们没有真的在做,”他开了个玩笑,“走一半你就醉了。”
<< 滑动查看下一张图片 >>
△会场中的Agent元素。图源:作者拍摄
然而,与令人迷醉的“Agent热”相对的,是弥漫在多数美国开发者之中的冷静。
“我要来‘泼冷水’。不管从成本,还是从AI-first的能力上来说,我觉得目前Agent的基础设施还很薄弱。”base在硅谷多年,数据库服务商PingCAP联合创始人兼CTO黄东旭对《智能涌现》坦言。
上述的亚马逊云科技工程师也有类似的看法。“Agent发展的速度是破坏性的。”他提到,当厂商们都看到Agent相较于人类千万倍的开发效率,他们对Agent开发的需求也是指数级增加。
这对训练、推理的算力,以及数据(作为训练Agent的资源)存储的软硬件,都会带来巨大的挑战,“现在,行业已经逐渐从GPU短缺,演变成了内存短缺。”他告诉《智能涌现》。
在推理成本的巨大压力下,Develop for Cost(为降低成本做开发),在美国Agent创业圈中,成了一种新的竞争力评价体系。
受制于模型推理能力,想要完成复杂任务或者长文本处理,Agent往往需要调用“Pro”级别的模型——这也导致了高昂的调用消耗。
Pokee.AI创始人兼CEO朱哲清曾公开表示,市面上AI Agent的成本,平均百分之八九十都在推理上。他提到,AI应用公司如果能将推理成本打下80%,才能有真正的利润。
“现在VC普遍会问Agent初创公司的一个问题是:推理成本多少?订阅能不能cover推理成本?”re:Invent上,一名美国Agent创业者告诉我们。
以及,开发者们对Agent的另一个灵魂一问是:市面上的软件,做好了被Agent调用的准备了吗?
“目前的软件生态,是为人开发的,而不是为AI Agent开发的。”Anthropic一名Code产品经理告诉我们。
作为数据库行业老兵,黄东旭有相同的观点,“人和AI对软件的使用偏好是不同的”。
比如,AI讨厌需要浪费更多Token去打通的数据孤岛,以及在面对众多调用接口时,AI容易因为注意力分散而出现幻觉、智力下降等“失控场面”。
黄东旭判断,厂商们需要围绕“给Agent使用”的理念,开展一场软件革命:
第一,在软件的交互界面,要让Agent能够用最简单的方式表达灵活的需求,比如给AI设计一套类似于SQL的数据库交互语言;第二,不要制造数据孤岛;第三,控制成本。
不过,“给Agent泼冷水”,也意味着作为Agent基础设施的模型层、Infra层、数据层厂商,还有不少的迭代优化空间,以及商业机会。
新的AI基建投资热潮正在席卷硅谷。通过优化AI Infra,降低模型调用过程中的推理成本,正在成为Infra创业的新风向。
比如,2025年9月,英伟达被曝豪掷超9亿美元,拿下了AI Infra初创公司Enfabrica的技术授权,并且雇佣了CEO。一名数据库展商告诉《智能涌现》,自己近期正在计划投资几个在美华人的AI Infra项目。
另一个Agent的基建,数据,也正在引起重视。在re:Invent展会上,Snowflake、MongoDB、Databricks等数据库厂商们占据了半壁江山。一名Snowflake的员工告诉我们,数据,决定了Agent对业务和场景的理解。
因此,数据库厂商的新命题,一是寻找能和Agent更为有效交互的数据库形态,二是扩容,做好承接爆发式的Agent开发需求的准备。
<< 滑动查看下一张图片 >>
△re:Invent上扎堆的数据服务厂商们。图源:作者拍摄
“Agent目前不是泡沫。”Anthropic一名员工总结,“但一旦人人追逐最显性的应用,没人做好与之匹配的基建,这就会成为泡沫。”
<< 滑动查看下一张图片 >>
△Anthropic展位挤满了听分享的观众。图源:作者拍摄






