AI Agents 与 Agentic AI 的范式之争,谷歌A2A协议如何定义下一代智能?

大模型之心Tech 2025-09-05 08:00

点击下方卡片,关注“大模型之心Tech”公众号

戳我 -> 领取大模型巨卷干货



>>点击进入→大模型技术交流群

>>点击进入→Agent技术交流群

本文只做学术分享,如有侵权,联系删文

写在前面

2022年11月,ChatGPT的横空出世彻底改写了AI发展的轨迹。

如今打开Google Trends,“AI Agents”与“Agentic AI”的搜索曲线自2022年底起便一路飙升,成为继生成式AI之后最受关注的两大方向。

资讯配图
图 1:谷歌全球搜索趋势图。该图显示,自 2022 年 11 月 ChatGPT 首次推出以来,人们对 “AI Agents”(人工智能代理)和 “Agentic AI”(智能体人工智能)的关注度持续上升。

但这两个频繁被提及的概念究竟有何区别?为何谷歌要在2025年专门推出A2A协议为其制定标准?

Cornell大学团队近期发表的《AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges》一文,为我们梳理了这一关键演进脉络,更构建了一套完整的理论框架,或许能解答关于下一代智能系统的核心疑问。

资讯配图
图 2:本研究的思维导图,用于探究人工智能代理(AI Agents)与智能体人工智能(Agentic AI)的相关概念、应用场景及面临的挑战。每个彩色分支代表一个关键的对比维度,分别是:架构(Architecture)、运行机制(Mechanisms)、适用范围 / 复杂程度(Scope/Complexity)、交互方式(Interaction)以及自主性(Autonomy)。
本文首发于大模型之心Tech知识星球,硬核资料在星球置顶:加入后可以获取大模型视频课程、代码学习资料及各细分领域学习路线~
戳我 -> 获取大模型巨卷干货
资讯配图

一、从MYCIN到ChatGPT:60年AI智能体的演进之路

要理解AI Agents与Agentic AI的差异,首先需要回溯智能体技术的发展历程。早在ChatGPT出现前,AI领域就已围绕“自主智能体”展开探索,但其形态与如今截然不同。

20世纪70年代,专家系统MYCIN横空出世,作为早期智能体的代表,它能通过知识库和推理引擎模拟医生诊断细菌感染,却只能遵循预设规则,无法应对未见过的病例。同一时期的DENDRAL系统虽能预测分子结构,本质仍是“规则执行者”。这些早期系统共同构成了“前LLM时代”的智能体雏形——依赖符号推理、缺乏学习能力,更谈不上自主适应环境。

此后数十年,多智能体系统(MAS)与BDI(信念-愿望-意图)架构逐步发展。Ferber在1999年提出的MAS框架,首次将智能体定义为具备自主性、感知力与通信能力的实体,可用于分布式问题解决;BDI架构则让智能体能够基于目标制定计划,如应用于空中交通管制模拟的系统。但这些进步仍未突破“预编程”的桎梏,智能体的行为边界始终被人类设定的规则所限制。

2022年11月成为关键转折点。ChatGPT的发布不仅引爆了生成式AI的热潮,更让智能体技术迎来“范式跃迁”。文章指出,ChatGPT代表的生成式AI是智能体发展的“ precursor(先驱)”——它首次展现了LLM强大的语言理解与内容生成能力,但本质仍是“被动响应者”,只能根据用户提示产出内容,无法主动规划任务、调用工具。

正是在生成式AI的基础上,AI Agents与Agentic AI逐步分化。2023年,AutoGPT、BabyAGI等框架出现,标志着AI Agents正式落地:它们将LLM与外部工具(API、搜索引擎、代码执行环境)结合,能自主完成多步骤任务,比如规划产品市场分析时,会依次调用网页搜索、数据汇总、报告生成工具。而到2023年底,CrewAI、MetaGPT等系统的出现,又推动技术进入Agentic AI阶段——多个专业智能体协同工作,像人类团队一样分工拆解复杂目标,甚至能动态调整任务分配。

谷歌2025年提出的Agent-to-Agent(A2A)协议,更是为Agentic AI制定了首个行业标准。该协议包含五大核心原则:充分发挥智能体能力、基于现有标准构建、默认保障交互安全、支持长期任务运行、确保模态无关性(文字、图像、语音等均可交互),试图解决不同框架下智能体的互操作问题。

二、AI Agents:单智能体的“工具革命”,从响应到执行的跨越

在明确演进脉络后,我们首先聚焦AI Agents的核心定义与技术细节。文章将其定义为“由LLM和LIM驱动的模块化系统,用于特定任务自动化”,它的出现填补了生成式AI“只会说不会做”的空白。

资讯配图
图 3:本研究的方法流程示意图,展示了从人工智能代理(AI Agents)基础到智能体人工智能(Agentic AI)的演进过程,后续还呈现了二者的架构演进、应用场景、局限性及未来解决方案策略。

1. 三大核心特征:定义AI Agents的边界

AI Agents之所以能区别于传统自动化脚本,关键在于三大特征:

资讯配图
图 4:人工智能代理(AI Agents)核心特征示意图,展示了其在智能体设计与运行行为中的三大核心特征,分别是自主性(autonomy)、任务特异性(task-specificity)和反应性(reactivity)。
  • 自主性:部署后无需持续人工干预,能自主感知环境输入、推理决策并执行动作。比如客服AI Agents,在接入企业知识库后,可独立处理用户的订单查询、退换货申请,无需人工转接;
  • 任务特异性:聚焦单一、明确的任务领域,而非通用能力。例如邮件筛选AI Agents仅负责分类邮件优先级、提取关键信息,不会涉及日程规划等其他任务;
  • 反应性与适应性:能响应动态环境变化,部分系统还可通过反馈优化行为。以个性化推荐AI Agents为例,它会根据用户的点击、购买记录实时调整推荐内容,甚至通过用户对推荐结果的反馈(如“不感兴趣”)进一步优化算法。

2. 技术基石:LLM与LIM的“双引擎驱动”

AI Agents的能力核心,离不开LLM与LIM的协同:

  • LLM:推理与决策中枢。以GPT-4、PaLM为代表的LLM,不仅能理解自然语言,还具备规划、推理能力。在AI Agents中,LLM承担“大脑”角色——解析用户目标(如“生成Q3销售报告”)、分解步骤(“1. 调取销售数据库;2. 计算各区域业绩;3. 生成可视化图表;4. 撰写分析结论”)、调用对应工具,并整合结果生成最终输出;
  • LIM:视觉感知的延伸。CLIP、BLIP2等LIM模型让AI Agents具备了“看图说话”的能力,能处理图像、视频等视觉输入。文章中提到的果园巡检AI Agents就是典型案例:无人机搭载LIM模型,可实时识别 diseased fruits(病果)和damaged branches(断枝),并自动触发警报,通知工作人员进行靶向处理。

Anthropic的“Computer Use”项目更是将这种“双引擎”能力推向极致。该项目中的Claude模型,能像人类一样操作电脑:通过视觉识别屏幕内容、控制鼠标键盘、打开软件应用,既能完成填写表单、复制数据等重复性任务,也能进行软件测试(打开代码编辑器、运行命令、调试错误),甚至能自主进行在线研究并整理信息。其核心逻辑是“目标-行动-观察”的循环:接收任务目标→决定下一步操作→执行并观察结果→重复直至任务完成。

3. 工具集成:打破LLM的“知识牢笼”

LLM的静态知识(如GPT-4的知识截止到2023年)和幻觉问题,是AI Agents必须解决的痛点。而工具集成正是关键解决方案。

文章将工具集成的过程分为“调用-结果整合”两步:当AI Agents遇到内部知识无法解决的问题(如“查询今日纽约股市收盘价”),会生成结构化的工具调用请求(如JSON格式的API调用指令),通过协调层执行;工具返回结果后,AI Agents会将其重新输入LLM的上下文窗口,结合原有推理继续完成任务。

ReAct框架是这一过程的经典实现。它将“推理(Reasoning)”与“行动(Action)”交替进行:LLM先通过Chain-of-Thought(思维链)分析任务,决定需要调用的工具;执行工具调用后,再根据返回结果调整推理方向,避免盲目行动。例如ChatGPT的网页搜索功能,当用户询问“2024年诺贝尔物理学奖得主”时,它会先判断内部知识不足,调用搜索工具获取信息,再基于搜索结果生成准确回答,而非依赖旧知识或编造内容。

AutoGPT、GPT-Engineer等框架则进一步拓展了工具集成的边界。AutoGPT在处理“产品市场分析”任务时,会依次调用网页搜索工具(获取竞品信息)、Excel工具(整理数据)、报告生成工具(撰写分析);GPT-Engineer则能结合代码执行环境,根据用户需求(如“开发一个简易待办清单APP”)自动生成代码、测试运行并修复bug,最终输出可直接使用的软件产品。

资讯配图
图 6:展示人工智能代理(AI Agent)执行实时新闻搜索、摘要生成及答案生成的工作流程。

三、Agentic AI:多智能体的“协作革命”,从个体到系统的突破

如果说AI Agents是“单智能体的工具革命”,那么Agentic AI就是“多智能体的协作革命”。文章将其定位为“范式 shift(转变)”,核心在于通过多智能体协作,解决AI Agents无法应对的复杂任务。

资讯配图
图 7:人工智能代理(AI Agent)与智能体人工智能(Agentic AI)的对比示意图,整合呈现了二者的概念差异。左侧为执行单一任务的人工智能代理(AI Agent);右侧为多智能体协作的智能体人工智能(Agentic AI)系统。

1. 概念跃迁:从“孤立执行”到“协同决策”

Agentic AI与AI Agents的本质区别,在于“系统级智能”的引入。文章以智能家居系统为例,清晰对比了二者差异:

Feature
AI Agents
Agentic AI
定义
执行特定任务的自主软件程序。
多个AI代理协同工作以实现复杂目标的系统。
自主级别
在特定任务中具有高度自主性。
广泛的自主性,能够管理多步骤、复杂的任务和系统。
任务复杂性
通常处理单个特定任务。
处理需要协调的复杂、多步骤任务。
协作
独立运营。
涉及多智能体信息共享、协作与合作。
学习和适应
在特定领域内学习和适应。
在更广泛的任务和环境中学习和适应。
应用程序
客户服务聊天机器人、虚拟助手、自动化工作流程。
供应链管理、业务流程优化、虚拟项目经理。

这种跃迁的关键在于三大能力:

资讯配图
图 8:展示从传统人工智能代理(AI Agents)到现代智能体人工智能(Agentic AI)系统的架构演进过程。该架构以感知(Perception)、推理(Reasoning)和行动(Action)为核心模块起步,逐步扩展至包含专业智能体(Specialized Agents)、高级推理与规划(Advanced Reasoning & Planning)、持久记忆(Persistent Memory)及协调层(Orchestration)在内的高级组件。此图还进一步呈现了多智能体协作(Multi-Agent Collaboration)、系统协调(System Coordination)、共享上下文(Shared Context)和任务分解(Task Decomposition)等涌现性特征,这些特征均被包裹在虚线边界内,该边界象征着分层模块化特性,以及向分布式、自适应智能体人工智能(Agentic AI)的智能化转型。

2. 架构创新:协调层与共享记忆的“双支柱”

Agentic AI要实现高效协作,离不开两大核心架构组件:

资讯配图
图 9:人工智能代理(AI Agents)与智能体人工智能(Agentic AI)在八个核心功能领域的分类应用展示。

3. 典型案例:从科研到医疗的场景落地

文章列举了多个Agentic AI的实际应用,展现其在复杂场景中的优势:

资讯配图
图 10:人工智能代理(AI Agents)在企业场景中的应用:(a)客户支持与企业内部搜索;(b)电子邮件筛选与优先级排序;(c)个性化内容推荐与基础数据报告生成;(d)自主日程助手。每个示例均体现了模块化人工智能代理(AI Agent)在集成应用中的价值 —— 可在业务工作流与用户交互系统中,实现自动化处理、意图理解及自适应推理功能。
资讯配图
图 11:智能体人工智能(Agentic AI)在多领域的应用示例:图 11 展示了智能体人工智能(Agentic AI)系统的四个实际应用场景。(a)自动化基金申请书撰写 —— 通过多智能体协同,实现结构化文献分析、合规性匹配及文档格式规范。(b)苹果园协同多机器人采摘 —— 借助共享空间记忆,以及负责测绘、采摘、运输的任务专用智能体,实现多机器人协同作业。(c)医院重症监护室(ICU)临床决策支持 —— 通过诊断、治疗方案制定、电子健康记录(EHR)分析的同步智能体,提升医疗安全性与工作流效率。(d)企业环境下的网络安全事件响应 —— 由智能体分别处理威胁分类、合规性分析及缓解方案制定。在所有场景中,中央协调器负责管理智能体间通信,共享记忆确保上下文信息留存,反馈机制则驱动系统持续学习。这些应用案例凸显了智能体人工智能(Agentic AI)在科学、农业、医疗、信息技术安全等领域的复杂动态环境中,具备可扩展、自主化任务协同的能力。

四、挑战与破局:从技术瓶颈到未来 roadmap

尽管AI Agents与Agentic AI发展迅速,文章也毫不避讳地指出了当前面临的核心挑战,并提出了针对性解决方案。

1. 两大范式的共性与差异化挑战

资讯配图
图 12:挑战示意图:(a)人工智能代理(AI Agents)的主要局限性,包括因果推理缺陷(causality deficits)与浅层推理(shallow reasoning);(b)智能体人工智能(Agentic AI)系统中更为突出的协同与稳定性挑战。

2. 针对性解决方案:技术与架构的双重突破

针对上述挑战,文章提出了十大核心解决方案:

资讯配图
图 13:展示了十种不断发展的架构与算法机制(如检索增强生成(RAG)、工具增强、动态记忆、因果建模、协调机制及反思性自我评估),这些机制被视为核心推动因素,能够突破以往的应用局限,助力解决当前在可靠性、可扩展性与可解释性方面存在的问题。尽管这些技术此前已应用于孤立的智能体系统,但在本文中,它们被重新置于新的语境下,以满足现代人工智能代理(AI Agents)与智能体人工智能(Agentic AI)的需求,从而在日益复杂且动态的环境中,实现具备协同性、适应性与可验证性的行为。

3. 未来 roadmap:从模块化到协同进化

文章最后为两大范式规划了未来方向:

资讯配图
图 14:人工智能代理(AI Agents,左侧)与智能体人工智能(Agentic AI,右侧)未来发展路线图的思维导图可视化。

五、结语:智能体的终极目标,是成为人类的“协同伙伴”

回顾全文,AI Agents与Agentic AI的差异并非“谁更先进”,而是“适用场景不同”:AI Agents适合解决单一、明确的自动化任务,是提升效率的“工具”;Agentic AI则擅长应对复杂、动态的系统性目标,是辅助决策的“团队”。

从MYCIN到ChatGPT,从单一规则执行者到多智能体协作系统,AI智能体的发展始终围绕一个核心目标——缩小“机器能力”与“人类需求”的差距。如今,AI Agents已能高效处理客服、数据汇总等标准化任务,Agentic AI更在科研、医疗、机器人协调等复杂场景中展现出巨大潜力,但这并非终点。文章强调,未来智能体技术的终极方向,是从“自动化工具”进化为“人类协同伙伴”——既能自主完成重复性工作,又能理解人类意图、适应动态需求,甚至在高风险领域(如手术机器人、自动驾驶)与人类共同决策。

要实现这一目标,仍需突破三大关键瓶颈: 一是因果推理的深度化。当前AI Agents与Agentic AI仍依赖统计相关性,难以真正理解“因果关系”,这在医疗诊断、金融风险预测等场景中可能导致致命错误。未来需将因果推断与LLM更深度融合,让智能体不仅能“预测结果”,更能“解释原因”; 二是可解释性的透明化。Agentic AI的多智能体协作链复杂,决策过程常呈“黑箱”状态,这在法律、医疗等需追溯责任的领域难以落地。后续需建立“决策日志+因果追溯”机制,让每个智能体的操作、信息来源、推理逻辑都可审计; 三是伦理与安全的体系化。随着Agentic AI自主性提升,可能出现“目标偏离”(如为完成任务忽视伦理准则)、“安全漏洞”(如被恶意攻击操控某一智能体)等风险。谷歌A2A协议虽迈出了安全标准的第一步,但仍需行业共同制定伦理框架,明确智能体的行为边界、责任归属与风险防控机制。

不可否认,AI Agents与Agentic AI已开启下一代AI的新篇章。当AutoGPT能自主完成市场分析,当CrewAI能协同撰写科研论文,当果园中的多智能体机器人实现高效采摘,我们看到的不仅是技术的进步,更是人类与AI协作模式的重构——人类从“执行者”转变为“决策者”,将重复劳动交给AI,专注于创意、战略等更高价值的工作。

正如文章结尾所言,这份研究不仅是对当前技术的梳理,更是为未来智能体系统绘制的“路线图”。无论是AI Agents的工具集成优化,还是Agentic AI的多智能体协同创新,最终都将指向一个更高效、更安全、更具人文关怀的AI时代。而谷歌A2A协议的提出、AZR框架的探索,也让我们有理由相信,在科研与产业界的共同推动下,“AI智能体成为人类协同伙伴”的目标,将从理论走向现实。

参考



大模型之心Tech知识星球交流社区

我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。 

星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo大模型预训练后训练知识蒸馏量化推理模型MoE强化学习RAG提示工程等多个版块)、科研/办公助手AI创作工具/产品测评、升学&求职&岗位推荐,等等。

星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!

资讯配图


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI IC
more
20轮谈判破裂,近7年来现代汽车工会首次罢工;蔚来李斌首次回应与迈凯伦合作;“听觉汽车”来了:麦克风+AI补全车辆感知能力
硅基智能关于AI生成合成内容标识的公告
没PhD,算什么AI研究员!LeCun论文竟要28岁辍学生审批,发文「暗讽」内讧升级
AI赋能,生意倍增:阿里曲志文为您揭秘企业出海一体化落地方案
硬件只是AI的“底座”?联想新品扎堆亮相IFA:这创意绝了
只收AI人才,OpenAI认证直通大厂!全球首个AI招聘平台,1000万人持证上岗
AI终端驱动下的芯片产业:新周期的起点与方向|甲子引力X
【报告】大模型专题五:AI大模型技术在电力系统中的应用及发展趋势(附PDF下载)
从IC设计到AI应用,一站式搞技术、找资源、抢商机尽在IIC!
博通,斩获百亿美元AI芯片订单
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号