Agent Harness 作为 LLM Agent 系统的核心运行时基础设施,正从早期简单的工具调用层,快速演进为包含 Memory、Skills、Protocols、Sandbox、Observability 和 Feedback Loop 等模块的完整工程化环境。它不再是模型的附属,而是决定 Agent 可靠落地、可长期运行和可治理的关键。
为了解决 Agent 时代中模型在复杂、昂贵、长链路任务中难以稳定产出可验证结果的问题,元枢智汇团队提出 Data Harness:构建模型在环的数据准备系统。他们将 DataFlow 重新梳理为一套面向 LLM-ready data 的可控运行环境,通过 operator、pipeline、global storage、serving interface、compile、WebUI、DataFlow-Agent 与 DataFlow-Skills 等组件,结合字段契约、运行前验证、可观测性和规则化 Skills,实现原始文档、代码、表格和知识库的生成、评估、过滤、精炼与验证,显著降低 agentic data workflow 的成本与不确定性,支持 SFT、RAG、QA、CoT 等数据的生产。
Agent 进化过程中不仅要关注“AI 如何变强”,还要关注“人如何在与 AI 协作中同步成长”的问题。为此,来自香港科技大学(广州)的研究者提出 Human-Agent Co-Evolution 视角下的 Context Layer 构建方案。该方案强调不仅让 Agent 从环境和人类反馈中学习,还让 AI 主动为人类提供思考原料、发现知识缺口、沉淀经验模式,并形成持续成长的反馈回环。
此外,上海交通大学联合中山大学等高校提出从“外部化范式”重新理解 LLM Agent 的发展路径。过去两年,大模型能力快速提升,但真正可落地的 Agent 往往并不只是更强的模型,而是由 Memory、Skills、Protocols 和 Harness Engineering 共同构成的运行时系统。Memory 将跨轮状态和长期经验外部化,Skills 将可复用的过程知识外部化,Protocols 将用户、工具与多智能体之间的交互结构外部化,而 Harness Engineering 则把这些模块组织成具备控制流、沙箱、权限、观测和反馈机制的智能体运行环境。由此来看,Agent Harness 不只是工程实现细节,而是 LLM Agent 从能力展示走向可靠生产力系统的关键范式。
在上述背景下,Agent Harness技术研讨会将于7月3日在2026中国AI智能体大会同期举行。
01
Agent Harness技术研讨会议程出炉
7月3日下午,本场研讨会将在大会主会场进行,由主题报告+圆桌Panel两个环节组成。
香港大学三年级博士生、Nanobot作者任旭滨,阿里云资深工程师、OpenKruise Agents核心维护者张振,海致科技产品技术总监李思宇,元枢智汇联合创始人梁昊,香港科技大学(广州)博士生、腾讯青云计划研究实习生王天富,香港科技大学(广州)博士生、IDEA研究院附属大模型算法研究员吴晓均,上海交通大学博士生、Agent Harness综述一作周宸宇等技术大咖与研究人员将作为报告嘉宾带来分享。其中,研讨会及圆桌Panel将由任旭滨博士主持。

02
七位技术专家与研究人员将分享
报告主题和概要抢先了解

嘉宾:香港大学三年级博士生、Nanobot作者 任旭滨
简介:任旭滨,香港大学在读三年级博士,导师为黄超教授。研究聚焦大语言模型、智能体等方向。他以第一作者、核心合作者身份在 WWW、SIGIR、WSDM、KDD、ICLR 等顶级国际会议发表论文,多篇第一作者论文入选会议最有影响力论文,谷歌学术引用量2600余次。个人曾获香港政府博士生奖学金、香港大学校长奖学金,主持国家自然科学基金博士研究生青年学生基础研究项目;同时获评中国人工智能学会 “清源学者”,入围世界人工智能大会青年优秀论文提名(全球 Top20)。在开源领域,他牵头研发nanobot、VideoRAG等多个热门开源项目,项目 GitHub 总星标数突破4.7万。
主题:从轻量智能体到 Agent-Native 基础设施:nanobot的设计实践
概要:随着大模型能力持续提升,AI 智能体的发展重心正在从“模型是否足够聪明”,逐渐转向“智能体能否稳定、低成本、可控地进入真实工作流”。相比单纯的聊天窗口,真正可用的智能体需要具备轻量运行时、上下文管理、工具接入、权限控制和长期任务执行等基础能力。
本次分享将结合开源智能体 nanobot 的实践,讨论轻量化 Agent Runtime 的设计思路,以及如何构建面向未来的 Agent-Native 基础设施。分享将重点探讨:如何让智能体在保持轻量和可扩展的同时,连接真实应用环境;如何将工具、文件、浏览器、命令行和外部系统抽象为智能体可理解、可调用、可约束的能力;以及如何从一次性的 tool calling,走向更长期、更可靠的人机协作工作流。
最后,分享将展望下一代智能体基础设施的发展方向。未来的 AI 智能体不只是“模型 + 工具”,而会逐渐演化为由模型、运行时、上下文、权限、应用接口与人类反馈共同构成的新型软件基础设施。

嘉宾:阿里云资深工程师、OpenKruise Agents核心维护者 张振
简介:张振,博士,阿里云资深工程师。他曾主导阿里巴巴集团的云原生迁移工程以及阿里云Serverless平台的建设工作。目前,他正联合负责阿里云智能体沙箱平台的技术研发。此外,他还是OpenKruise Agents项目的核心维护者之一,多次KubeCon演讲者,活跃的LFX和GsoC导师。
主题:从跑得起到管得住:使用OpenKruise Agents破解OpenClaw日常运维难题
概要:OpenClaw 及类似应用是当前国内外最热门的 Agent 应用之一,占据了大量的 Token 消耗。虽然在各类沙箱环境中运行 OpenClaw 已十分便捷,但 Day-2 阶段的运维挑战却鲜有深入探讨,例如沙箱故障、运行成本高昂以及 OpenClaw 版本频繁更新带来的兼容性问题。
在本次分享中,我们将展示如何利用 OpenKruise Agents 运行 OpenClaw,涵盖网络隔离与 API Key 注入等核心能力;深入解析如何实现 OpenClaw Agent 的自动休眠以节约成本,以及在零数据丢失的前提下完成平滑升级。此外,我们还将重点介绍沙箱重启与沙箱数据导出等关键运维动作的最佳实践,帮助开发者构建更加稳定、可维护的 Agent 运行环境。

嘉宾:海致科技产品技术总监 李思宇
简介:李思宇,在海致科技任职产品技术总监。带领团队基于大数据、知识图谱、大模型及智能体等数据智能技术,为政务、公安等行业的中大型客户提供平台研发与智能数字化转型支撑。IEEE知识工程标准委员会及全国信标委人工智能分委会知识图谱工作组专家委员,长期参与知识图谱与大模型融合领域的标准制定与行业实践分享。

嘉宾:元枢智汇联合创始人 梁昊
简介:梁昊,元枢智汇联合创始人、北京大学大数据科学研究中心博士,连续两年获得北京大学校长奖学金,第一作者发表10+篇CCF-A论文/期刊。主导Data-Centric AI系列开源项目设计开发,项目累计获得近万Github Star,其中DataFlow项目荣获ICML SeePhy比赛冠军,智源LIC挑战赛冠军。同时带领团队负责Camel,LLaMAFactory项目的数据模块设计开发,分别获得16k+和65k+ stars。
主题:Data Harness:构建模型在环的数据准备系统
概要:在Agent时代,真正困难的往往不是让模型调用工具,而是让模型在复杂、昂贵、长链路的任务中稳定产出可验证结果。LLM数据准备正是一个典型场景:原始文档、代码、表格和知识库需要经过生成、评估、过滤、精炼和验证,才能变成可训练、可检索、可复用的模型燃料。
本议题将从Agent Harness的视角重新理解DataFlow:它不只是一个数据pipeline框架,而是一套面向LLM-ready data的可控运行环境。分享将拆解DataFlow的operator、pipeline、global storage、serving interface、compile、WebUI、DataFlow-Agent与DataFlow-Skills如何共同构成一个模型在环的数据处理 harness,并讨论如何通过字段契约、运行前验证、可观测性和规则化Skills,降低agentic data workflow的成本与不确定性。
听众收益:
理解Agent Harness不只是工具调用层,也可以成为数据生产系统的核心架构。
理解一个分析LLM数据准备系统的新框架:从pipeline思维转向Aarness思维。
了解DataFlow如何把原始数据转化为SFT、RAG、QA、CoT等LLM-ready data。
学习如何用operator、字段契约、compile和Skills约束agent,避免“先花钱、后发现错”。
获得可复用的设计思路,用于构建自己的模型在环数据处理、RAG数据准备或post-training数据生产流程。

嘉宾:香港科技大学(广州)博士生、腾讯青云计划研究实习生 王天富
简介:王天富,港科大广州AI PhD,研究聚焦Agentic AI与AI应用产品。目前在头部基础模型公司进行Agent实践,曾在腾讯青云计划、微软AI、MSRA主导AI研究与产品项目。已发表AI顶会顶刊论文30余篇,Google Scholar引用500+,获ICML Workshop Best Paper。主导多项Agentic AI开源项目,GitHub Star 1k+。
主题:Human-Agent Co-Evolution:构建面向人机共进化的Context Layer
概要:Agent Evolution 关注如何从环境与人的反馈中积累经验,并通过自我改进持续变强。但当 AI 能力快速提升时,一个更关键的问题也随之浮现:人类如何在与 AI 的协作中同步成长,持续提升判断力、品味与创造力?本次分享将聚焦 Human-Agent Co-Evolution 这一视角。真正的人机共进化,不只是让 Agent 从自身经验和人类反馈中学习并变强,也需要让 AI 主动为人类提供思考原料,帮助人类发现知识缺口、沉淀经验模式、优化思维模式,并形成持续成长的反馈回环。分享将结合 MindOS 在人机共进化 context 管理上的探索,介绍如何构建面向长期协作的 Context Layer。它将人与 AI 协作中的经验、偏好、判断和反思沉淀下来,使每一次交互都不只是完成一个任务,而是成为下一次协作与共同成长的经验。

嘉宾:香港科技大学(广州)博士生、IDEA研究院附属大模型算法研究员 吴晓均
简介:吴晓均,IDEA研究院-香港科技大学(广州)联培博士生在读,IDEA研究院附属大模型算法研究员。曾参与Fengshenbang-LM,Touchstone-GPT,Think on Graph 3.0等开源仓库和模型,github累计stars数5k+,huggingface模型累计下载量百万次以上。目前主要研究方向为自然语言处理NLP,LLM Agent,LLM for Mathematical Modeling等。
主题:Bayesian vs. Frequentist for Skill Evolution: 为技能进化注入“贝叶斯后验信念”
概要:LLM Agent 的能力越来越不只来自模型参数本身,也来自外部推理环境中的 prompts、tools、memory、SOPs、skills 与 harness feedback。传统的技能进化往往更像一种频率学派式的无状态修补:观察失败、统计成功率、再追加补丁;但在真实 agent 场景中,任务轨迹稀疏、代价昂贵、上下文强依赖,简单的点估计很容易被早期偶然成功或失败误导。本次 talk 将以 Bayesian-Agent 为例,介绍如何把 reusable skills / SOPs 视为带有不确定性的假设,并为技能进化注入一个可累计、可审计、可迁移的贝叶斯后验信念状态。每个技能的可靠性不再只是“成功次数 / 总次数”,而是由先验、验证轨迹、失败模式、成本与上下文共同更新出的 posterior belief;这使得 agent 在少样本时更稳健,在新 harness 或新任务环境中能够迁移已有信念,并且每一次 patch、split、compress 或 retire 都能被追溯解释。换言之,Bayesian-Agent 将技能进化从“从零计数、点估计、无记忆”的朴素补丁机制,推进为一种 posterior-guided、evidence-calibrated 的 harness optimization 过程。

嘉宾:上海交通大学博士生、Agent Harness综述一作 周宸宇
简介:周宸宇目前是上海交通大学智能计算研究院的二年级博士生,导师为叶荫宇教授和葛冬冬教授,研究方向聚焦于大语言模型与运筹优化、复杂推理任务及其训练方法。他的研究兴趣还涵盖强化学习与区块链等方向,曾获得ACM-ICPC亚洲区域赛金牌,并在ICML、ICLR、WWW、CSCW等国际会议上发表多篇学术论文。除学术研究外,周宸宇具有较为丰富的产业与工程实践背景,曾在杉数科技、OPPO、腾讯、美团等公司从事与人工智能和优化相关的研究或技术工作,并在量化投资与金融科技领域积累了实践经验。
主题:模型之外的智能:LLM Agent的外部化范式
概要:过去两年,大模型能力快速提升,但真正可落地的 LLM Agent 往往并不只是“更强的模型”,而是一个围绕模型构建起来的运行时系统。本报告将以“外部化”为核心视角,重新理解 LLM Agent 的发展路径:从早期依赖模型权重,到通过上下文和 RAG 注入信息,再到今天通过 Memory、Skills、Protocols 和 Harness Engineering 构建可靠、可复用、可治理的智能体系统。
报告将介绍我们对 LLM Agent 外部化机制的系统性总结:Memory 将跨轮状态和长期经验外部化,Skills 将可复用的过程知识外部化,Protocols 将工具、用户和多智能体之间的交互结构外部化,而 Harness Engineering 则把这些模块组织成一个具备控制流、沙箱、权限、观测和反馈机制的运行时环境。最后,报告将讨论 Agent 未来的重要方向,包括自演化 Harness、共享 Agent 基础设施、外部化能力评测以及安全治理问题。
03
更多大会精彩议题:
除了Agent Harness技术研讨会,我们还设置了自进化智能体、Coding Agent、深度研究智能体、Computer-Use Agent、多智能体协同、Agent Skills七个方向的技术研讨会和企业级AI智能体、AI智能体产品创新两个论坛。

大家可以点击下方名片进入【智猩猩Pro】公众号后台回复关键词“AI智能体”报名参会。