

2025年,“AI Agent元年”声浪未歇,明星产品频出,成为了当今人工智能领域最有想象力的赛道。
但大半年过去了,Agent真的变得好用了吗?
一边是Manus的窘境,另一边是一群含着“金钥匙”出生的Agent产品体验达不到预期。任务表现参差不齐,让用户在技术炫技和“人工兜底”之间来回切换,浪费了大量优化时间。
AI Agent在单点上普遍已经能干活了,但离“干好活”还很远。人们丢给AI干的活越来越复杂,需要的不再只是线性交付,而是能从特定场景中突围的“系统级”选手。

只要3分钟,
同时完成超5个复杂任务
当下,AI Agent面临的核心瓶颈不是算力,也不是成本,而是单线程串行的架构。
单线程意味着一个个任务、一个个AI的调用,都是以线性思维被贯穿起来的,所有请求必须严格按照顺序排队处理。这种架构天然没法做到像人一样同时思考好几个复杂的问题,动态调整任务优先级,并发地思考和执行任务。
这种线性思维导致了Agent理解不了用户的复杂需求,用户描述起来难度很大。
此外,单线程的处理速度还特别慢。因为要按照生成、等待、下一个生成的阻塞链条单向运转,任何环节卡顿都会造成全局堵塞。从架构上来说,这种如同工厂传送带一样的单向Agent,就不可能同时满足用户对于效率、体验、交付质量的要求。
更别提在上下文记忆能力方面,很多Agent还没有从工具迈向知识库,执行任务和交付标准根本做不到个性化精准匹配。
这三个痛点本身就已经很“致命”了,偏偏AI Agent领域还苦于流量成本,排队邀请测试消耗了用户的耐心。这也是为什么,在Manus走红后,大厂们都以最快的速度上线了自己的Agent产品,希望能成为那个打破僵局的人。
过去几个月,各家的探索与迭代中,文库GenFlow 2.0的表现尤为突出。
首先,作为一个想象力更高的通用级Agent,文库GenFlow 2.0做到了“全端现货”:它是全球最早的全端通用Agent之一,在百度文库的Web、App端已经全面上线,不用邀请码排队,而且限时免费。
这背后,其实是基于对用户真实工作流的洞察,百度文库网盘自研出Multi-Agent的创新架构,抛弃了让一个“超级大脑”包办一切的智能体逻辑,转而构建由100多个垂直领域专家Agent组成的“AI专家团”,让它们以并行和协作的方式完成任务。

图注:文库事业部、网盘事业部负责人 王颖
依托于Multi-Agent和底层的MoE(混合专家模型)技术,不受“拥堵”限制的GenFlow2.0不但给出了令人惊喜的交付效果,在复杂任务上的处理速度也得到了质量和效率的双重提升。
这种架构上的突破和进化,彻底扩张了“AI像聪明人一样干活”的能力边界。比如,从数十分钟生成一个PPT、一份文档,升级成了3分钟能并行完成超5个复杂任务,交付一个跨模态的解决方案,让AI应用落地的想象力不再是“长着翅膀的马”。
通用能力上去了,场景壁垒也开始不断被弱化。全端通用代表的是更丰富的软硬件生态,和“无界”的跨端协作。尤其是在总被AI办公忽视的移动端,让用户在地铁上就可以改方案,把工作从桌面延伸到碎片化场景中,就不会再觉得AI干活反而耽误了时间。
“需求进,方案出”的Agent工作流,正在变得越来越简单便捷。

刷新AI人机交互形态:
不再是“找工具”,而是“搭专家团队”
文库GenFlow 2.0的“破局手法”,不止于架构、交付质量和速度的提升。更重要的是,人与智能体协作的底层逻辑,甚至已经超越了狭义的“Agent”概念。
Agent翻译过来是助理,目的是完成下达者的指令。但文库GenFlow2.0之所以把重点放在了Flow工作流,就是因为看到了一个盲区:现实中的“人类助理”,大多数都不是业务专家,而是擅于为决策者做整合与分发,把不同任务交给不同的专业团队。
但完成这些任务本身绝对是需要一线业务能力的。所以文库GenFlow2.0理念中,不可或缺的两点是:
第一,公私域数据、用户记忆库沉淀,对用户资料和偏好的持续累积;
第二,一个专业的AI Team。
这样一来,GenFlow2.0就成为了一个调度中枢,根据需求自主规划、动态调度专家Agent团。用户一两句话,就可以驱动一支“持续进化”的百人专业AI团队。
用可投入生产的工业设计来举个例子。用户输入“为我设计一套蜡笔小新的盲盒”,文库GenFlow 2.0“搭团队”的过程是怎么样的呢?
首先是需求解析,GenFlow 2.0的智能理解和模式切换,能精准识别用户意图,自主切换协作模式。

系统先会识别出“基于蜡笔小新的IP形象制作5-8个3D Q版角色设计”的需求,然后自主思考和规划路径,调度合适的设计Agent生成草图,根据用户在百度文库网盘里呈现出来的偏好、对用户的主动问询来推测风格和情景,同步进行生产成本核算等。这一步,更像是Agent在组建项目组,背后则是Multi-Agent架构的意图理解和多任务并行能力。
而在执行过程中,文库GenFlow2.0在任务全过程都可以直接干预,用户是可以随时暂停补充新要求、调用网盘中的文件,来实时优化和掌控生成的过程和结果的。交互方面做到了以人为本,比如在发现意图理解为“小新的不同形象”时,输入“引入蜡笔小新中的其他角色”,告诉Agent这一套盲盒里不只有小新,GenFlow2.0就会先在全网自动检索蜡笔小新中的其他人物,并选择合适的形象。


这时,如果想再为生成的盲盒图做一套产品方案,只需要补充做PPT的需求,就能同时得到图片和PPT的输出结果,PPT还能根据大纲重新生成、实时编辑。
任务全程可干预的能力,颠覆性地解决了生成过程“黑盒子”和结果不可控的痛点,也为知识库提供了像参考文献一样随时被翻阅的价值。记忆库与个性化的内容致力于续写和高质量交付,网盘中的文件可被调用,依托自研AI编辑器,还能随时随地全流程编辑,实现了创作从起点到终点的闭环。
AI专家团,为何是文库网盘率先拥有?答案是长达两年的AI重构,文库网盘头部Agent基本均为自研,所有多模态Agent都经过文库网盘数亿用户验证。除了访问量全球领先的智能PPT Agent之外,文库GenFlow 2.0在很多成熟的头部Agent都做到了专家级别。比如能输出几万字长度、带专业可视化图表的长研报、文生视频绘本、文生海报、深度和学术搜索等场景,呈现出了多模态、高质量、深搜索的特点。
文库GenFlow 2.0的惊艳表现,和百度文库网盘从第一天就坚持MoE架构密不可分。
MoE的核心突破在于让参数规模、效率和计算成本不再画等号。因为每个任务仅仅激活少量的专家,其他专家则保持“休眠”,成本效益比就会非常高。从同级密度模型来看,MoE架构的推理性价比可能是其他模型的几倍。
MoE的机制发光发热,对于文库GenFlow 2.0来说并非偶然,而是支撑Multi-Agent同时实现高效、低成本、高扩展性的必然技术选择,又通过垂直分工解决了通用模型“样样通、样样松”的瓶颈,帮助百度文库、网盘在各行各业复制标杆案例。
而在可扩展性这个方面,GenFlow2.0也为Multi-Agent提供了“乐高式”的能力,从而通过MCP等标准化协议接入第三方Agent,或者让文库网盘的能力,通过MCP Server的形式进行生态连接。这对于AI Agent来说是很重要的一步。毕竟,人类专家之所以能成为专家,也是在不断地交流和连接中完成的。
目前,文库GenFlow 2.0不仅能调用百度生态,也通过兼容MCP灵活接入了第三方服务生态,不再是“强依赖单一AGI”的幻想,而是兼收并蓄的可持续生产力。

国民级应用,
向开放生态走去
GenFlow 2.0的体验升级并非“无源之水”,其核心根基是百度文库网盘于今年4月推出的下一代内容领域操作系统——沧舟OS。
这一系统分为底层基建、中枢系统、应用服务三层架构,成为Agent调度、Agent能力输出、公私域数据管理和处理、生态连接的核心系统,重构了人机协作的方式与价值:
底座基建层通过构建工具框架和知识化框架,将公私域内容进行加工处理,并实现文件解析、转码、搜索、跨模态内容理解,中枢系统层基于GenFlow2.0调度中枢,结合用户记忆和画像数据,高效分配调度多Agent并行协作,应用服务层整合百度文库网盘数百个Agent,以及第三方Agent,形成任务闭环。
沧舟OS让GenFlow 2.0不仅能服务好用户,还能在B端产生巨大的价值。通过MCP Server与Agent to Agent的形式,将文库与网盘能力全面开放,支持厂商、企业用户、智能体应用、开发者等,低成本、高效率接入。比如,三星手机接入了MCP Server之后,能直接调用百度网盘的文件上传、内容理解功能,解决移动端大文件处理的难点。
荣耀等厂商做得更加“深水区”,通过MCP将GenFlow 2.0原生接入荣耀智能助理YOYO,实现AI Agent与硬件厂商的系统级原生调度。通过MCP生态与GenFlow 2.0智能体调度能力,荣耀MagicOS用户可一键获取个人网盘知识库与文库专业文档,获得网盘检索、内容分享、联网搜索、图片理解、文件总结与问答、文库PPT生成等优质体验。
在接入GenFlow 2.0以后,荣耀成为了全球首批接入MCP生态的硬件厂商,率先实现AI原生智能×硬件原生协同,沧舟OS输出的标准化生态,也在头部硬件厂商的认可中得到了场景和客户的延展。
沧舟OS的本质既不像传统OS那样严格控制硬件资源,也不像市面上的单一Agent产品一样具有明显的单点能力局限性。它通过MCP实现了Agent之间、Agent与外部服务之间的标准化连接,如同为AI内容世界制定了一门“通用语言”,让GenFlow2.0在此之上衍生出“专家团”的智能体调度模式。
这样一来,任何企业的AI需求都能感受到像水一样适应各种容器的柔性适配力。这种广度与弹性,正推动文库网盘从“C端神器”走向产业智能化不可或缺的利刃。
几个月来,沧舟OS与GenFlow 2.0的联动,为AI领域对于MCP生态的技术布局找到了一个具有切实商业可行性的立足点:构建一个“Agent即服务”的生态,让企业都可以低门槛地调用“专家团队”。
自GenFlow 2.0以后,智能生产力会从单枪匹马走向团队作战、系统作战。这种“一个人开N家公司,一天轻松干800件活”的新的效率边界,离我们并不算太遥远。
下一步,GenFlow2.0和沧舟OS要做的是在生态和场景的扩张中,持续降低门槛,创造更有潜力的商业场景。文库网盘也将逐渐转向,成为通用Agent领域的标准制定者。
但无论如何,GenFlow 2.0的到来,已经击碎了人们对于“技术理想主义”的质疑。人们正在把越来越复杂的活交给AI去做,一个更值得期待的未来也正在显形:将重复劳动交给不会疲倦的“团队”,人则专注大胆创新、提升自己、好好生活。
