一个乒乓球台,两只机械臂:DeepMind 用 “对抗学习” 让机器人离自主更近一步

具身智能大讲堂 2025-08-01 12:00




资讯配图

欢迎关注具身智能大讲堂

资讯配图



你敢信吗?现在连机器人都开始偷偷内卷学打乒乓球了!


想象一下:两个机械臂站在球台两端,你来我往间不仅能打几十回合不落地,还会互相使坏—— 一个突然放短球,另一个立刻跨步扑救,打急了甚至会琢磨怎么把球扣到对手接不到的角落。这群钢铁学霸不靠教练手把手教,全凭互相对打偷偷进步,愣是把乒乓球打成了 内卷现场。更绝的是,它们现在已经能吊打乒乓球初学者,跟中级选手掰手腕也不落下风。


而这波机器人乒乓内卷大赛,正是 DeepMind 甩出的新大招 —— 利用深度强化学习训练机器人进行乒乓球比赛。这个项目展示了AI 在复杂物理世界中应用的巨大潜力


资讯配图


机器人如何学习?


乒乓球被认为是一个非常复杂的运动,机器人在乒乓球的对抗中需要掌握除感知之外的快速反应、精确判断与精细的动作控制等技能,这些技能正好包含在机器人技术的许多艰难挑战中。 在这个项目中,DeepMind 的科学家们没有依赖传统的编程技巧,而是通过深度强化学习让机器人自行学习如何打球。


具体来说,机器人通过大量的模拟训练与我对战”不断优化自己的打球策略。在两个机械臂的乒乓球对决中,若一方机器人采用更高级的策略,它的对手将不得不进行适应和改进,以此形成技能的持续升级。通过与虚拟对手的反复训练,智能体学会了如何预测来球轨迹,并且及时做出反应。



一个令人印象深刻的细节是,该机器人能够根据不同对手的打球方式,调整自己的策略和动作。这显示了它在比赛中的高度智能和适应性。比如说,当对手的回球方式发生变化时,机器人能够迅速做出相应的调整,从而保持竞争力。这种能力展示了 AI 在面对实时、动态环境时的强大适应性。乒乓球场作为 “微缩训练场”,不仅能够高效地打磨机器人核心学习能力,而且还能为机器人在其他场景应用奠定坚实的基础


此外,该团队还对机器人与人类的对抗性训练进行了研究。在乒乓球对抗赛中,人类表现更佳,机器人则有机会学习人类的投球技巧。在与人类的比赛中,机器人能达到与中级玩家水平,由此可见机器人竞争性训练对机器人学习进步明显有效。



DeepMind 的创新学习路径


在传统的机器人学习过程中,通常需要依赖大量的、由人类提供的演示数据。这些数据往往伴随着复杂的人为设计的奖励函数,以便于机器人能够根据这些奖励进行学习。然而,在这样的框架下,机器人很难实现真正的自主学习能力。


DeepMind设计机械臂乒乓球对抗实验中,这两个机械臂不仅能够连续不断地进行运动和自动集球,而且通过远程监控的方式,人类可以间接地参与实验过程,并且收集到相关的数据。


DeepMind提出的第二条学习路径是让AI充当教练的角色,通过分析和指导,帮助机器人在不断的实践中进步和提高。为了实现这一点,他们利用了名为Gemini的视觉语言模型(VLM),这种模型能够持续地分析机器人玩家的表现,并且根据分析结果提出具体的改进意见,从而帮助机器人在乒乓球对抗中不断进步。


资讯配图


这一成就不仅仅是对乒乓球机器人技术的推进,它还展示了深度学习和强化学习在多个领域的巨大潜力。从医疗、自动驾驶到工业自动化,类似的技术可以推动机器人与人类之间的更好协作,或者在危险环境中代替人类进行任务


DeepMind 也表示,这项技术的成功应用远不止于乒乓球。 尽管目前机器人的主要任务是与虚拟对手进行对抗,但其背后的深度学习框架同样适用于其他复杂任务,如精密手术或多轮对话等领域。


▍结语与未来


尽管取得了突破,DeepMind 仍然面临一些技术挑战。 比如,在更为复杂的现实环境中,机器人如何适应更多变化的物理条件与不确定性? 此外,如何将这一技术推广到更加广泛的应用领域,仍然需要更多的探索与实验。


随着技术的不断发展,未来的人工智能可能会在更多物理和认知挑战中表现得越来越出色。而这仅仅是开始——DeepMind 的乒乓球机器人无疑为 AI 与现实世界的融合打开了新的大门。


参考文章https://spectrum.ieee.org/deepmind-table-tennis-robots



  END 




资讯配图

科技热点


1.仅重18克的被动伸缩扑翼机器人

2.全球首例 SoftFoot Pro仿生脚原型

3.腾讯Robotics X实验室全新分层框架曝光

4.受螳螂视觉启发的立体人工复眼技术


大咖观点


1.具身智能与人形机器人 产业大佬们怎么说?

2.人形机器人是继PC、手机之后人类的第三台计算机

3.傅利叶智能顾捷分享人形机器人探索历程

4.上交大高峰:人形与多足机器人的设计与控制分析


热点评论


1.A++++轮 融资超10亿 估值超70亿的具身智能公司

2.地球上最先进的人形机器人来了

3.英伟达大会发布人形机器人开发工具

4.宇树Unitree B2对战波士顿动力Spot


新品速递


1.GTC 2024 黄仁勋发布王炸技术

2.傅利叶GR-1通用人形机器人表演架子鼓视频

3.逐际动力全尺寸人形机器人CL-1

4.地表最强Figure 02发布!算力提升3倍!


资讯配图

微信号|具身智能大讲堂

专注AI具身智能产业前沿话题



加入社群

欢迎加入【具身智能大讲堂】读者讨论群,共同探讨具身智能机器人相关领域话题,共享前沿科技及产业动态。


添加微信号(Robospeak2015)或堂博士手机号(15611695072)备注“具身茶谈”可进入交流群。


兼职作者&投稿

机器人大讲堂正在招募【兼职内容创作者】,如果您对撰写机器人【科技类】【产业类】文章感兴趣,可添加微信:具身智能大讲堂客服(19016903753,手机与微信号相同)。我们对职业、所在地等没有要求,欢迎朋友们的加入!



声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
机器人不只会抓和放!北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能
签下360万美元大单,这家四川机器人企业全年产值有望翻番
极智嘉成立具身智能子公司;周杰伦概念股巨星传奇携手宇树科技开发IP消费级机器人 | 本周要闻
15.8万起!逐际动力全尺寸人形机器人新品震撼上市,以极致性价比领跑行业
EA200 轮式人形机器人:四大优势打通具身智能开发全流程,让科研创新更高效
【半导体】机器人动力系统芯片“再添新成员”
人形价格直降90%?阿里京东罕见联手:投资的逐际动力洗牌「人形机器人」市场的背后……
【机器人】首家机器人概念股退市,传递了哪些行业信号?
人形机器人的一次重大拐点
CVPR2025|Tartan IMU:机器人惯性定位领域的轻量级基础模型深度解析
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号