深度研究智能体正在成为大模型 Agent 发展的重要方向。
为了解决 Agent 在复杂任务执行中面临的长上下文、多轮交互、工具调用、环境反馈与推理成本协同优化问题,华为的研究者们提出面向 Agent 时代的模型—算法—系统协同设计路径,推动智能体从“单点能力优化”转向“端到端系统能力构建”的新范式。
开放式任务缺少唯一标准答案,传统 pointwise 奖励容易出现区分度不足、噪声放大的问题。为此,通义DeepResearch联合高德提出智能体强化学习新范式ArenaRL,通过将组内轨迹放入“竞技场”,使用 pairwise 对比和锦标赛排名来生成更稳定、更高信噪比的奖励,从而提升开放式 Agent 在复杂规划、搜索研究、写作等任务上的表现。
浙江大学的研究者们开源了一个深度研究智能体强化学习训练框架LiteResearcher,让 4B 级别的小模型具备长程检索、网页浏览、多跳推理和交叉验证等 Deep Research 能力。该框架通过构建镜像真实互联网搜索动态的本地虚拟环境,结合搜索/浏览工具、数据合成管线和难度感知课程强化学习,在稳定、可复现的训练闭环中持续提升 Search Agent 能力。
此外,上海交通大学研究团队提出基于SFT的搜索智能体训练框架OpenSeeker‑v2,通过扩大知识图谱规模、扩充工具集、严格低步数过滤三项数据合成优化,仅用10.6k高难度高质量轨迹与单一SFT训练,就在四项权威基准上刷新同量级ReAct搜索智能体的SOTA。
在上述背景下,深度研究智能体技术研讨会将于7月3日在2026中国AI智能体大会同期举行。
01
深度研究智能体技术研讨会议程出炉
拆解信息检索到自主研究的系统化演进
7月3日下午,本场研讨会将在大会分会场一进行,由主题报告+圆桌Panel两个环节组成。
上海交大博士、群智涌动创始人叶锐,Zilliz高级软件工程师&memsearch、claude-context项目负责人张晨,华为中央研究院先进计算与存储实验室大模型算法专家林炜哲,中国科大与上海创智学院联培博士、通义实习研究员张凡瑞,浙江大学博士研究生、LiteResearcher一作李万里等技术大咖与研究人员将作为报告嘉宾带来分享。其中,研讨会及圆桌Panel将由张凡瑞博士主持。

02
五位技术专家与研究人员将
分享报告主题和概要抢先了解

嘉宾:上海交大博士、群智涌动创始人 叶锐
简介:叶锐,上海交通大学四年级博士研究生,群智涌动创始人兼CEO。他的主要研究方向为长程通用智能体模型,以第一/共同第一作者身份在ICML、NeurIPS、ICLR、Nature Communications等国际顶级会议与期刊上发表学术论文10余篇,并曾担任顶级人工智能国际会议NeurIPS的领域主席,以及组织ICML多智能体研讨会。他曾作为核心成员深度参与通用科研智能体助手“SciMaster”的研发,是阿里Tongyi DeepResearch深度调研模型的核心贡献者,同时也是智能体上下文折叠方案AgentFold、高质量数据合成方案OpenSeeker等项目的第一作者。此外,他曾荣获博士研究生国家奖学金、上海交通大学“学术之星”,并作为学生代表在上海交通大学130周年校庆上发言。他的研究与工程实践紧密围绕长程智能体展开,致力于推动大模型在复杂、长链条任务中的自主推理与应用落地。
主题:长程深度研究智能体的数据构建与上下文管理范式
概要:本报告聚焦长程深度研究智能体的能力构建,围绕高质量数据与主动上下文管理两个方向展开。OpenSeeker 系列面向深度研究任务构建高难度、高信息密度的开源 QA 数据,通过 10K 规模样本实现前沿乃至 SOTA 训练效果,验证了数据质量对长程研究能力的重要作用。进一步地,针对传统 ReAct 范式在长程任务中面临的上下文爆炸与信噪比下降问题,AgentFold 与 LongSeeker 提出主动上下文管理机制,使智能体能够自主压缩、提纯和组织历史信息。上述工作共同探索了从数据基础设施到上下文管理范式的长程智能体技术路径。

嘉宾:Zilliz高级软件工程师&memsearch、claude-context项目负责人 张晨
简介:张晨,现任Zilliz高级软件工程师,专注向量数据库驱动的RAG、AI Agent与智能应用基础设施建设。拥有8年AI领域工作经验,长期深耕算法研发、模型工程与AI应用落地,在语义检索、上下文管理、长期记忆和深度检索等方向积累了丰富实践经验。作为claude-context、memsearch与DeepSearcher等开源项目的核心主导者和主要开发者,相关项目累计获得超过2万+GitHub Stars。持续探索向量数据库与大模型、Agent系统的结合,致力于将高性能检索能力转化为高效、可靠的智能应用与开发者工具。
主题:从RAG到Agent-Native Search
概要:从 RAG 到 Agent-Native Search,意味着 AI 的信息访问从一次性召回,走向持续、可验证的上下文访问。MFS 代表的方向,是把文档、代码、对话、业务系统和历史记录组织成面向 Agent 的统一认知界面,让 AI 在任务中持续发现线索、深入细节、校准判断。
未来的上下文系统会像基础设施一样支撑智能体运行。MFS 将 RAG 的候选召回与渐进式访问结合起来,让 AI 能在分散、动态的知识世界中获得稳定依据,并逐步具备跨系统理解和行动的能力。

嘉宾:华为中央研究院先进计算与存储实验室大模型算法专家 林炜哲
简介:林炜哲,华为中央研究院先进计算与存储实验室大模型算法专家,博士毕业于剑桥大学机器智能实验室,研究方向涵盖大模型推理加速与系统优化、多模态检索与问答、长上下文记忆、扩散模型等。其学术与产业经历交叉融合,本科阶段曾于香港大学学习,后转入剑桥大学三一学院,完成信息工程专业本硕连读,并于剑桥大学获得工程学博士学位。博士期间,他长期围绕视觉—语言交叉领域开展研究,同时参与面向材料科学的视觉智能研究。
加入华为后,林炜哲主要从事大模型算法研发与推理系统优化工作,聚焦Diffusion LLM、复杂Agent推理场景下的效率提升、测试时扩展(test-time scaling)以及大模型协同推理等前沿方向。此前,他还曾在Amazon、Microsoft等企业从事表格问答、推荐系统等方向的研究与实践,并曾担任创业公司首席技术官,主导相关智能系统的研发与产品推进,具备扎实的学术研究能力与丰富的产业落地经验。
在科研方面,林炜哲已在ACL、NAACL、NeurIPS、EMNLP、ICCV等国际顶级会议,以及Nature Machine Intelligence等高水平期刊发表多篇论文,研究成果覆盖多模态检索增强、视觉问答、非自回归生成、长视频理解与高效大模型推理等多个方向。其代表性工作包括多模态检索模型PreFLMR/FLMR、Agent深度研究加速系统AgentInfer,以及面向高效智能体的DLLM Agent等。他持续关注大模型从“能用”走向“高效可用”的关键技术路径,致力于推动高性能推理系统、智能体协同与多模态智能在真实场景中的落地应用。
主题:Agent时代的模型—算法—系统协同设计:从单点优化到端到端智能基础设施
概要:随着大模型从单轮问答走向复杂任务执行,Agent正在成为智能系统的重要形态。相比传统大模型应用,Agent具有长上下文、多轮交互、工具调用、环境反馈、任务规划与自我修正等新特征,使智能系统的性能瓶颈不再局限于模型能力本身,而是逐渐扩展为模型、算法、系统与底层计算基础设施之间的全链路协同问题。本演讲将围绕Agent时代的模型—算法—系统协同设计展开,探讨智能体应用需求如何反向牵引模型结构、推理算法与系统架构的共同演进。重点将讨论任务级推理机制、上下文管理、工具执行调度、缓存复用与高性价比部署等方向,强调从“单点能力优化”转向“端到端系统能力构建”的新范式。

嘉宾:中国科大与上海创智学院联培博士、通义实习研究员 张凡瑞
简介:张凡瑞,中国科大与上海创智学院联培博士,通义实习研究员。研究聚焦于开放式Agent及虚假信息检测。截至目前,以一作或共一身份在NeurIPS、ICML、WWW等CCF A类国际顶会发表学术论文7篇。
主题:基于组内相对排名的开放式Agent强化学习方法与实践
概要:开放式任务缺少唯一标准答案,传统 pointwise 奖励容易出现区分度不足、噪声放大的问题。ArenaRL 通过将组内轨迹放入“竞技场”,使用 pairwise 对比和锦标赛排名来生成更稳定、更高信噪比的奖励,从而提升开放式 Agent 在复杂规划、搜索研究、写作等任务上的表现。

嘉宾:浙江大学博士研究生、LiteResearcher一作 李万里
简介:李万里,浙江大学计算机科学与技术博士研究生,LiteResearcher一作。主要研究方向包括 Search Agent、Agentic Reinforcement Learning、Computer Use Agent、多模态生成与模型对齐。此前曾在北京智源人工智能研究院、SimplexAI等机构参与前沿大模型与Agent研究,研究内容覆盖数据构建、工具使用、强化学习训练、长程任务评测与模型落地。学术方面,以第一作者/共同一作/核心贡献者身份参与多篇ICLR、CVPR等多篇会议论文,并有多项工作投稿至COLM、EMNLP等会议;相关开源项目获得4k+ GitHub Stars和300+引用。在Search Agent方向,重点关注如何通过本地搜索环境、可扩展数据管线和Agentic RL,让小参数模型具备更强的长程检索、推理和工具调用能力。
主题:LiteResearcher:零边际成本的4B深度检索Agentic RL训练框架
概要:本次分享将围绕 LiteResearcher 展开,介绍如何通过 Agentic RL 训练,让 4B 级别的小模型具备长程检索、网页浏览、多跳推理和交叉验证等 Deep Research 能力。LiteResearcher 通过构建镜像真实互联网搜索动态的本地虚拟环境,结合搜索/浏览工具、数据合成管线和难度感知课程强化学习,在稳定、可复现的训练闭环中持续提升 Search Agent 能力——RL 阶段全部工具调用均在本地完成,实现零边际 API 成本与 10–46× 提速。最终模型在 GAIA、Xbench-DeepSearch 等 Benchmark 上达到开源 SOTA,并在部分指标上接近或超过更大规模开源模型及商业系统。
03
更多大会精彩议题:
聚焦Agentic AI范式演进与生产力革新
除了深度研究智能体技术研讨会,我们还设置了Agent Harness、自进化智能体、Coding Agent、Computer-Use Agent、多智能体协同、Agent Skills七个方向的技术研讨会,以及企业级AI智能体、AI智能体产品创新两个论坛。
大家可以扫描下方海报上的二维码报名。👇🏻👇🏻👇🏻









