通义张凡瑞博士：基于组内相对排名的开放式 Agent 强化学习方法与实践｜AgenticAICon 2026

7月2-3日，2026中国AI智能体大会（AgenticAICon 2026）将在杭州君悦酒店正式举行。

中国科大与上海创智学院联培博士、通义实习研究员张凡瑞已确认出席，将在7月3日分会场一下午的深度研究智能体技术研讨会带来报告，主题为《基于组内相对排名的开放式 Agent 强化学习方法与实践》。

Part.1

嘉宾介绍

张凡瑞，中国科大与上海创智学院联培博士，通义实习研究员。研究聚焦于开放式Agent及虚假信息检测。截至目前，以一作或共一身份在NeurIPS、ICML、WWW等CCF A类国际顶会发表学术论文7篇。

Part.2

报告主题

《基于组内相对排名的开放式 Agent 强化学习方法与实践》

Part.3

报告概要

开放式任务缺少唯一标准答案，传统 pointwise 奖励容易出现区分度不足、噪声放大的问题。ArenaRL 通过将组内轨迹放入“竞技场”，使用 pairwise 对比和锦标赛排名来生成更稳定、更高信噪比的奖励，从而提升开放式 Agent 在复杂规划、搜索研究、写作等任务上的表现。

大会日程

参会方式

大家可以扫描下方二维码添加小助手“桐桐”进行报名参会。已添加过“桐桐”的老朋友，可以给“桐桐”私信，发送“AgenticAI 26”即可报名。