7月2-3日,2026中国AI智能体大会(AgenticAICon 2026)将在杭州君悦酒店正式举行。
中国科大与上海创智学院联培博士、通义实习研究员张凡瑞已确认出席,将在7月3日分会场一下午的深度研究智能体技术研讨会带来报告,主题为《基于组内相对排名的开放式 Agent 强化学习方法与实践》。
Part.1
嘉宾介绍

张凡瑞,中国科大与上海创智学院联培博士,通义实习研究员。研究聚焦于开放式Agent及虚假信息检测。截至目前,以一作或共一身份在NeurIPS、ICML、WWW等CCF A类国际顶会发表学术论文7篇。
Part.2
报告主题
《基于组内相对排名的开放式 Agent 强化学习方法与实践》
Part.3
报告概要
开放式任务缺少唯一标准答案,传统 pointwise 奖励容易出现区分度不足、噪声放大的问题。ArenaRL 通过将组内轨迹放入“竞技场”,使用 pairwise 对比和锦标赛排名来生成更稳定、更高信噪比的奖励,从而提升开放式 Agent 在复杂规划、搜索研究、写作等任务上的表现。
大会日程

参会方式
大家可以扫描下方二维码添加小助手“桐桐”进行报名参会。已添加过“桐桐”的老朋友,可以给“桐桐”私信,发送“AgenticAI 26”即可报名。
