“一人即团队”——一句话驱动智能体团队

百度AI 2025-09-19 18:00
资讯配图

9月9日 WAVE SUMMIT 大会现场,文心快码全新升级到了3.5S 版本,强化多智能体自协同能力,实现“一人即团队”开发新模式。


 01 

 浅析多智能体协同 


首先,智能体能力更强,能懂业务,会分解任务列表,执行更准;其次,从单智能体到多智能体协同,动态生成多个智能体,自主协同一起解决复杂任务;最后,团队协作更强,基于 Rules 与 MCP 构建统一的经验库和外部工具,实现团队知识传承和外部开放性建设。


资讯配图


很多朋友之前接触 AI 工具时,可能更多是一个智能体帮你写代码、调试一个问题,属于“单兵作战”。


而现在,新的趋势是:让多个智能体协作,就像一个小团队一样,把更复杂的任务完成。就像我们平时做一个项目,需要产品经理、开发、测试、运营一起配合。AI 世界里也可以这样⬇️⬇️


  • 不同的智能体各司其职,有的负责规划,有的写代码,有的调试,有的做体验优化。——生成效果更好

  • 子 Agent 使用独立的上下文窗口,且独立执行,不会干扰主会话上下文。——突破上下文限制


文心快码的 Subagents 是一种多智能体自协同引擎。通过主 Agent 对任务进行拆解,多个子 Agent 协作处理规模更小、目标更聚焦的子任务,从而让复杂问题的解决更高效、更有条理。


 02 

 多智能体协同的应用场景 


在代码助手场景下,多智能体协同能够让不同智能体各司其职、相互配合,比如一个智能体专注于代码生成,一个负责代码审查与风格优化,一个负责测试与调试,还有的进行安全检测与性能优化。它们通过分工合作和互相校验,不仅能提升代码质量与开发效率,还能减少遗漏和错误,形成从需求拆解、代码实现到测试优化的完整闭环,从而更好地帮助开发者解决实际问题。另外子智能体核心解决的问题是上下文窗口不够,子智能体的层级隔离策略让他的上下文可以完全独立于主 Agent,使主 Agent 的上下文一方面减少冗余信息,另一方面减少污染,避免幻觉。


我们实现的架构是这样的:系统级智能体专门用于调度其他智能体,统筹智能体之间的信息传递。开发者按需定义属于个人工作习惯的个人级智能体,通过自然语言 Workflow。其他能调用到的工具还包括,项目级 MCP,开发者根据所开发的项目进行 MCP 的定义,如后端项目需要链接 Mysql、前端需要链接 Figma,并注册到子智能体中。Rules,项目级,开发者根据所开发的项目整理 Rules。那么这整套的架构,就保证了我们复杂任务的高效完成。


资讯配图


对于开发者来说,文心快码 Subagents 应用在如下场景有显著效果:


垂类场景效果有优化:如代码评审、生成文档等可自定义符合团队规范的 Agent,通过委派最合适的子 Agent 执行,从而获得更佳效果。


适合复杂工作流编排:从需求拆解到开发、测试、文档生成,形成完整流水线。


大规模任务执行:代码库规模庞大、跨多个文件或模块协同修改需求。文心快码 Subagents 能力除了使用内置的多个官方 Agent 进行协同,也支持使用自定义智能体。


自定义智能体功能允许你根据自身需求,创建并配置专属的智能体。它可以具备特定角色、技能和行为逻辑,帮助你在不同工作场景下高效完成任务。


自定义智能体最显著的优势在于:


  • 可定制性:用户自由组合行为规则与可调用工具,实现灵活配置

  • 垂类效果提升:针对特定业务需求优化表现,效果远优于通用模式


自定义智能体适用于如下场景:


  • 只需要执行特定工具的专属行为模式;

  • 需要高度控制与编排能力的复杂工作场景;

  • 企业或个人的领域知识服务场景。


 03 

 看几个有趣的小例子! 


Case1:0-1生成包含20个游戏的游戏平台


之前我们常见的 Agent 能力,更多是帮我们生成一个简单的小游戏,比如贪吃蛇、马里奥游戏。


但我们今天想生成一个游戏平台,让我们看看通过 Subagents 多智能体协同,如何让这件事变得更高效、更准确。


Prompt:生成一个小游戏平台。需要包含游戏大厅、游戏入口,点击后进入二级菜单运行游戏,也可以单个游戏返回游戏大厅。游戏包括:


  • 2048

  • flappy bird

  • 扫雷


使用纯 HTML 实现,全部生成完成后统一验证。


Comate 编码视频


Case2:已有项目使用多智能体协同进行解读


在这个已有项目的分析解读环节,期望模型能够从多个角度来拆解项目,最后整理成一份 README,作为程序员大家都有体验,遇到一个新接手的项目,没有任何历史资料的情况下,我们很难对项目很好的理解和下手开发。希望通过多智能体协作的方式,帮助从多个角度解读项目,分模块告诉我有哪些部分,并且交给另一个擅长编写文件的智能体生成一份 README,这样让大家不仅能快速理解项目的整体目标和技术栈,还能清晰知道每个模块的职责、关键文件和启动方式,从而在新接触一个已有项目的场景中更直观地掌握项目全貌。


Prompt:帮我从多个角度解读这个项目,分模块的告诉我有哪些部分,生成一份 README。


Comate 解读视频


Case3:为电商平台做国际化升级,AI Coding 辅助开发者快速实现页面翻译


随着品质国货在海外市场受到广泛认可,为国货出海创造不少新机遇


  • 自定义智能体:翻译专家

    你是一个翻译前端页面的专家,当前项目中的界面展示语言是中文,我希望整个页面能够被只会英文的用户使用。

    修改文件过程请保持小块的修改,避免由于一次改动太大超过输入输出窗口,导致失败。

  • 配置 Subagent:勾选翻译专家

  • 输入 Prompt:使用翻译专家 Agent,翻译页面上的内容到英文。


Comate 编码视频


 04 

 直播 Q&A 精选 


Q1:多智能协同和传统单体 AI 最主要的区别和优势是什么?


A1:


  • 单体 AI 更像是一个“万能助手”,什么都能做一点,但在复杂任务中容易“力不从心”;而多智能体就像是一个“小团队”,每个智能体有明确分工,可以互相协作。

  • 优势


1.效率更高:不同 Agent 并行工作,整体速度更快。

2.质量更好:专门的测试/优化 Agent 可以减少 bug、提高产出质量。

3.可扩展性:能把一个大任务拆解成子任务,组合出更复杂、更完整的系统。


Q2:未来多智能体协同技术最令人兴奋的发展方向是什么?


A2:


  • 智能体团队化一个人就能“带”一支虚拟团队,从产品到开发到测试都能自动化完成。

  • 跨领域协作不仅限于写代码,还能在设计、运营、教育、科研等领域发挥作用。

  • 自组织系统未来的智能体不只是被动执行,还能主动发现问题、提出改进建议,甚至形成“虚拟公司”的雏形。

  • 人与智能体共创人类更像“导演”,智能体们是“演员”,这种模式会极大提升创造力和生产力。


Q3:作为一名开发者,该如何触发和使用多智能体协同功能?是需要复杂的配置,还是可以自然语言交互?


A3:并不需要自己去设计复杂的多智能体架构。一般来说,多智能体协同功能会被封装在代码助手或 IDE 插件的内部逻辑里,只需要通过自然语言交互触发即可。比如:


  • 直接提出一个复杂需求(“帮我实现登录功能,并生成测试用例”),系统会自动拆解任务并分配给不同的智能体协作完成。

  • 也可以通过简单指令来指定角色(“生成代码”“检查安全问题”“写测试”),由不同智能体分工处理。

  • 如果需要更细的控制,平台可能提供轻量级配置(如启用/关闭某类智能体,调整优先级)。


换句话说:默认情况下只需自然语言就能使用协同效果;如果你想定制工作流,通常会有简单的配置功能可供调整。如果再想调用更多能力,比如定制自己的 MCP 或者某些场景的 rules,可能才需要部分开发和调试工作。


Q4:在 Comate 的多智能体系统中,通常包含哪些角色,他们是如何分工的?


A4:


Architect 智能体


特点:不直接调用 Tools,仅能调用其他 Agent。擅长在多个 Agent 之间进行编排和分工,设计合理的执行顺序与依赖关系。通过高层次调度,让各个 Agent 协同完成复杂任务,确保整体产出符合架构与质量要求。


适用场景:跨多个 Agent 的复杂需求,如端到端项目交付、涉及规划+编码+测试的综合任务,或需要统一把控规范与质量的场景。


Deep Read 智能体


特点:仅调用文件读取与目录分析工具,不会修改本地代码。能够深入解析项目逻辑、依赖与规范,快速提取核心信息并生成总结或解读报告。


适用场景:接手陌生项目、阅读复杂代码库、理解第三方库或遗留系统,以及需要快速建立上下文认知的场景。


Actor 智能体


特点:不与用户进行过多需求澄清,聚焦在编码实现,通过直接通过修改文件、调用终端,模拟开发者执行具体任务。


适用场景:需求清晰、任务明确的小型编码或执行任务。


Plan 智能体


特点:擅长分析复杂需求,与用户协同澄清并完善需求,并将拆解步骤输出到 plan.md 文件中。通过提前梳理需求,确保后续生成的代码更贴合预期,提升整体效率。


适用场景:重构或需要完整规划的复杂需求。


UT 智能体


特点:识别代码结构和单测框架,自动生成符合项目风格的单测代码,同步提供覆盖率报告。帮助发现潜在 bug,提高代码质量。


适用场景:逻辑边界复杂、质量要求高的开发任务。


Figma2Code 智能体


特点:智能识别 Figma 元素,高保真还原设计稿,自动生成可运行的前端代码。大幅缩短设计到开发的周期。


适用场景:基于 Figma 设计稿的前端开发需求。


Q5:对于初学者来说,使用文心快码多智能体协同功能,是会更轻松地学会编程,还是会产生依赖?


A5:这是个很好的问题,如下:


  • 更轻松地学习多智能体协同能帮初学者完成环境搭建、代码生成、自动调试,这样他们能更快看到成果,减少挫败感带来“正反馈”,从而提高学习动力。

  • 潜在依赖风险如果完全依赖智能体生成代码,而不去理解原理,可能会出现“能写不能改、能跑不能解释”的情况。


所以更推荐的方式是,对于初学者:


  • 把智能体当作“助教”用它来讲解代码思路、拆解任务。

  • 先尝试自己写再让智能体帮忙检查和优化。

  • 关注学习过程而不仅仅是结果。


作者:文心快码资深工程师,文心快码产品经理


资讯配图
资讯配图
资讯配图
资讯配图


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
驱动
more
潮讯:小米打击澎湃OS3借号行为;中国联通eSIM公众号改名;《英雄联盟手游》鸿蒙版被曝9月12 日上线;AMD发布驱动重磅更新
重塑药物研发,哈佛医学院等构建全新AI模型,用「图神经网络」破解疾病驱动因素多元难题
“一人即团队”——一句话驱动智能体团队
芯圣HC20MD6208双向马达驱动芯片上市!
任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式
2025年中国公共服务机器人行业产业链结构、发展现状及未来前景展望:行业规模达182.7亿元,技术驱动应用场景持续拓展[图]
华为超节点:用「一台机器」的逻辑,驱动AI万卡集群
2025年中国AMOLED显示驱动芯片行业深度研究报告:行业进入壁垒、竞争格局及战略咨询
聚焦半导体设备高精度传感:驱动芯片制造迈向新精度
快讯|青岛举行人形机器人足球赛;智元机器人等成立新公司,含多项AI业务;AI驱动的空中机器人集群实现突破性进展等
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号