7B小模型逆袭GPT-4o!复旦&创智邱锡鹏团队造出「世界感知」具身智能体,代码数据完全开源!

3D视觉工坊 2025-08-13 07:00

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了复旦大学-上海创智学院博士一年级研究生施君豪,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图World-aware Planning Narratives Enhance Large Vision-Language Model Planner
论文https://arxiv.org/pdf/2506.21230
代码库https://github.com/sjh0354/World-Aware-Planning

直播信息

时间

2025年08月13日(周三)19:00

主题

7B小模型逆袭GPT-4o!复旦&创智邱锡鹏团队造出「世界感知」具身智能体,代码数据完全开源!

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

资讯配图施君豪
复旦大学-上海创智学院博士一年级研究生

复旦大学-上海创智学院博士一年级研究生,师从邱锡鹏教授。研究方向聚焦于大模型后训练与具身智能,目前主要致力于具身规划和视觉-语言-动作(VLA)模型的前沿研究。研究成果已发表于ACL等国际顶级学术会议,相关工作被机器之心等知名科技媒体转发,并得到上海创智学院官方公众号的推荐。

直播大纲

  1. 引言
  2. 相关工作
  3. 技术方法
  4. 实验
  5. 结论与展望

参与方式

资讯配图

:3D视觉工坊很荣幸邀请到了复旦大学-上海创智学院博士一年级研究生施君豪,为大家着重分享他们团队的工作。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:姓名/昵称+工作名称,则不予通过。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
为什么是北京?17天内两刷全球开源大模型榜首……
文心开源服务站赋能DAY·成都站圆满落幕,共绘西部AI创新生态新篇章
最强开源具身大脑模型!智源研究院提出面向真实环境的RoboBrain 2.0,显著提升空间与时序推理能力
刚刚,智谱开源千亿参数视觉大模型,能区分麦当劳肯德基炸鸡,看图猜地点击败99%人类
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源
欧洲“开源版Coze”火了,4个月估值暴涨6倍
OpenAI开源霸权5天终结,百川M2一战夺冠!实测比GPT更懂中国医疗
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号