不管厂商还是人们都希望打造像人类一样聪明的人形机器人,拥有一个能独立思考和快速反应的大脑和执行力——它能听懂人们的话,看懂眼前的活,然后灵巧地动手完成。现在,它正一步步走向现实。比如之前1X发布Redwood VLA 模型,就展示了板载AI运行和泛化的潜力。
谷歌今天发布了一项名为 Gemini Robotics On-Device 的VLA AI模型,加快这一现实到来——这是今年谷歌3月份发布Gemini Robotics的加强版。其目标就是为机器人打造一个强大、高效且能直接在机器人自己身上运行的「本地大脑」,自主感知-决策和行动。

「本地大脑」厉害在哪
简单来说,这个AI模型解决了机器人应用中的两大痛点:延迟和网络依赖。
传统的智能机器人,很多时候需要把看到的信息传到云端服务器,等服务器“思考”完再把指令传回来。这一来一回,不仅有延迟,而且一旦网络不好或者断网,机器人就瞬间罢工。
而这个「本地大脑」则完全不同。它在机器人内部署,不依赖网络。这意味着:
反应超快:没有了网络传输的延迟,机器人能瞬间响应指令,动作更流畅、更精准。
在哪都能用:无论是在网络信号差的地下室、偏远的仓库、户外,还是在灾后救援这种没有网络的极端环境,它都能稳定工作。
聪明又灵巧:它继承了Gemini大模型的视觉和语言理解能力,能“看懂”复杂的场景,“听懂”人类的自然语言指令——在广泛的测试场景中实现了强大的视觉、语义和行为泛化能力,并能能完成像拉开背包拉链、折叠衣物这样需要精细操作、高度灵巧的复杂任务——所有这些都是在机器人上直接操作时完成的。
Gemini Robotics On-Device 的另一个强大之处,是它惊人的学习和适应能力。一个AI模型再强大,也不可能预先学会世界上所有的任务。而Gemini Robotics On-Device最厉害的一点,就是它能快速学习新技能。开发者只需要给它演示50到100次,它就能掌握一项全新的任务。这就像教一个学霸新知识,它能迅速举一反三,融会贯通。与此同时,快速适应包括之前从未见过的物体,然后自主操作,表现强大的泛化能力。例如谷歌测试了在双臂 Franka 上,该模型可以执行通用指令,包括处理以前未见过的物体和场景、完成折叠衣服等灵巧的任务,或执行需要精确度和灵巧性的工业皮带组装任务 。除了上面双臂机器人上测试成功,还成功地将这个模型“移植”到了形态差异巨大的机器人身上,其中就包括Apollo人形机器人。值得一提的是,Apollo是奥斯汀机器人公司Apptronik的明星人形机器人,在去年12月加入谷歌Gemini2.0的战略合作,同时今年获得了谷歌的战略投资。OpenAI在重启机器人模型研发之后,似乎还没出成果,投资的1X和解除了战略合作的Figure,都分别推出自研的VLA模型:RedWood和Helix。这一点至关重要,这既是厂商们通用人形机器人的目标,为人们描绘了人形机器人未来应用的图景。当一个足够智能的“大脑”搭载在一个人形机器人时,机器人的潜力将会前所未有地释放了。它不再是一个只能在流水线上拧螺丝的专用工具,或是从A到B的搬运工,而是一个可以走进我们生活和工作的通用帮手。例如在家庭里,它可以成为照顾老人和行动不便者的得力助手,帮忙取物、整理房间、准备简单的餐食,甚至在我们手忙脚乱时帮忙折叠洗好的衣服。因为它不依赖网络,所以隐私和响应速度都更有保障,甚至可以陪家人走出室外活动。1X NEO便可以跟随人在户外散步。
在仓库和工厂,不只是会操作重复固定任务,而是能根据口头指令,灵活地处理各种形状和材质的包裹,或者在复杂的生产线上进行需要高精度和灵巧性的组装工作。尤其是在危险环境中,在地震、火灾等灾难现场,网络通讯往往中断。这种能独立工作的人形机器人可以代替救援人员进入危险区域,搜寻幸存者、搬开障碍物,执行高风险任务。可以说本地运行的AI模式体现了一个根本性的转变,人们不再需要为每一个新任务都去定制、编程一个新机器人,也不必依赖云端大脑的统一调控,而是去中心化的部署本地大脑运行人形机器人,让其可以自主快速行动,并可以教会它不同的技能,就能适应各种不同的工作岗位,并且能够相互协作。为了让更多人参与到这场变革中,谷歌还提供了相应的SDK(软件开发工具包),邀请开发者们来测试和适配这个模型,共同探索机器人的边界。当然,在赋予机器人强大能力的同时,安全永远是第一位的。谷歌也强调,他们正在通过严格的测试和安全措施,确保这项技术在负责任和安全的前提下发展。Gemini Robotics On-Device不仅仅VLA AI模型的一次突破,它同样更像是一把钥匙,打开了通往真正通用、智能、实用的机器人大门,可以想象Gemini robotics搭载在各种形态的机器人,成为那个我们曾在科幻作品中无数次憧憬的、人机协作的未来。
Base会员
限时99元/年
(原价119元/年)
全球人形机器人wik
可视化分析看板
产业链分析AI
畅想交流群
Pro会员
339元/年
所有Base会员服务
每周Robo Insight
590+独家市场洞察分析
商业化解读与分享
Pro会员群
加入解锁更多
Business
品牌/产品宣传
海外社媒推广
品牌开发与建设
按需定制
欢迎加微详谈
详细👉:CyberRobo3.0:会员计划2025
*如有疑问,请后台加微咨询,备注来源
©CyberDaily