【主编特别策划】“具身智能机器人”专刊上线啦!(2025年4期)

机器人ROBOT 2025-08-25 19:00

点击蓝字关注并设为星标

具身智能机器人是颠覆性技术领域,涉及人工智能、机器人学、认知科学、心理学等多个学科的交叉。其重要意义在于提升机器人的自主性和智能性,使其能够在复杂和动态的环境中有效行动,从而推动智能制造、医疗、自动驾驶、家庭服务等领域的变革。

为实时跟进具身智能机器人领域的最新研究成果,促进相关学科协同发展,《机器人》主编于海斌院士领衔策划了“具身智能机器人”专刊,邀请王贺升教授、兰旭光教授、卢策吾教授、孙健教授、林倞教授、段海滨、徐凯教授、鲁继文教授、刘连庆研究员和刘浩研究员担任特邀编委并撰稿。



资讯配图

王贺升  教授

   上海交通大学

兰旭光  教授

   西安交通大学

资讯配图
资讯配图

卢策吾  教授

   上海交通大学

孙健  教授

   北京理工大学

资讯配图
资讯配图

林倞  教授

   鹏城实验室/中山大学

段海滨  教授

   北京航空航天大学

资讯配图
资讯配图

徐凯  教授

   国防科技大学

鲁继文  教授

   清华大学

资讯配图
资讯配图

刘连庆  研究员

   中国科学院沈阳自动化研究所

刘浩  研究员

   中国科学院沈阳自动化研究所

资讯配图



2025年第4期目次


资讯配图

腔道介入交互约束下的柔性机器人具身形态感知方法

作者刘浩  中国科学院沈阳自动化研究所

专家述评该文提出了一种基于光纤布拉格光栅(FBG)的柔性机器人具身感知方法,旨在提升柔性机器人在腔道介入中的安全性和智能化水平,具有一定的创新性和研究价值,对促进柔性机器人技术发展具有较好的推动作用

摘要:腔道疾病是最常见的人体疾病,柔性手术机器人因其柔顺性可以介入曲折狭窄的腔道,但是容易因接触交互而受阻。为了提升介入的安全性及智能化水平,提出了一种基于光纤布拉格光栅(FBG)的具身形态感知方法,从形态信息的采集、处理、理解到行为决策的层面实现机器人从本体形态感知到认知的过程。首先基于离散圆弧假设实现多芯FBG光纤的形状重建,然后通过逐步提取邻域圆弧状态的影响的方式,提出了一种改进的移动平均滤波(IMAF)方法,实现信号噪声的平滑处理。同时提出一种基于时―空变化的阻塞检测方法,通过与环境的动态交互对形状进行理解。利用理解得到的交互状态,采用基于仿人操作和瞬时全局一致性指数(IGII)的间歇式介入策略,保证介入的柔顺性。最后开展仿真实验和实物实验,通过与不同的滤波方法比较证明了IMAF方法的先进性,并且通过不同的场景验证阻塞检测方法以及介入方法的可行性及有效性
引用信息黎定佳, 郭钰琪, 杨永明, 李锐, 刘连庆, 刘浩. 腔道介入交互约束下的柔性机器人具身形态感知方法[J]. 机器人, 2025, 47(4): 497-507.
资讯配图

识别二维码,访问全文PDF



资讯配图

01

面向复杂光照场景的异质SLAM融合方法

通信作者:郁树梅  苏州大学

专家述评文提出了一种基于模糊神经网络的异质SLAM融合方法,将传统SLAM方法与仿生SLAM方法相整合,完成了基于标准型模糊神经网络的闭环决策方法和基于 T-S 模糊神经网络的轨迹优化方法,并完成了实验验证与分析。论文具有较好的技术性创新。思路清楚,工作完整,对复杂环境SLAM方法的推进和应用具有较好的理论价值与应用推广价值。

摘要:针对低光照、弱纹理等复杂光照环境中同步定位与地图构建(SLAM)面临的闭环检测失败和机器人轨迹精度低的问题,将传统视觉SLAM方法的高精度地图构建和精确定位能力与仿生SLAM方法在复杂光照环境下的强场景识别能力相结合,提出了一种基于模糊神经网络的异质SLAM融合方法,包括基于标准型模糊神经网络的闭环决策方法以提升复杂光照场景下闭环检测的成功率,以及基于T-S(Takagi-Sugeno)模糊神经网络的轨迹优化方法以提升机器人轨迹估计的精准性,从而实现在复杂光照环境中更准确的定位和更可靠的环境建模。实验结果表明,相较于ORB-SLAM2和RatSLAM方法,提出的异质SLAM融合方法在自采集数据集和公开数据集上能获得更高的闭环检测召回率和更低的绝对轨迹误差(ATE),在复杂场景下展现出较强的鲁棒性,对提升复杂光照场景下机器人自主作业的精准性及稳定导航定位能力具有积极意义

引用信息:孙荣川, 高水镕, 张鑫, 郁树梅, 孙立宁. 面向复杂光照场景的异质SLAM融合方法[J]. 机器人, 2025, 47(4): 508-516.

资讯配图

识别二维码,访问全文PDF


02


面向居家服务机器人任务规划的具身大模型

作者:闫海滨  北京邮电大学

专家述评文针对居家服务机器人任务规划提出了一个基于大语言模型的具身任务规划框架(TaPA)。通过将场景信息与大语言模型(LLM)对齐,TaPA能够生成可执行的任务规划,解决了传统LLM缺乏场景感知的问题。

摘要:居家服务机器人需要任务规划能力以有效完成人类下达的复杂指令。最近的大语言模型(LLM)可以为机器人提供强大的推理能力以实现任务规划,但由于缺少真实场景信息的感知,现有的LLM通常会生成不可执行的任务规划。针对这个难点,提出了一个基于大语言模型的具身任务规划框架(TaPA),有效地将场景信息与LLM对齐从而实现可执行的任务规划。具体来说,通过合成包含场景信息、人类指令和动作规划的三元组指令调优多模态数据集,用以激发现有预训练LLM的具身机器人任务规划能力。进一步使用高泛化视觉感知模型为LLM提供场景物体信息。大量实验结果验证了所提出的TaPA框架的任务规划成功率比现有GPT-3.5模型高出6.38%,有效地促进了居家服务机器人落地部署的进程
引用信息吴振宇, 王子为, 许修为, 鲁继文, 闫海滨. 面向居家服务机器人任务规划的具身大模型[J]. 机器人, 2025, 47(4): 517-525.
资讯配图

识别二维码,访问全文PDF


03

基于关节协同控制的仿人双足机器人设计及优化

作者:王贺升  上海交通大学

专家述评提出了一种基于全身协同控制的仿真框架,结合时间和事件检测方法实现了稳定的触地检测,进而融合关节编码器和IMU信息实现了双足机器人状态估计,基于渐进式步态控制机制和机身倾角控制机制设计了全身协同控制器,并开展了仿真与实验验证。论文的写作规范,逻辑清晰,语言表达准确流畅。
摘要:提出了一种基于关节协同控制的双足机器人设计及控制方法,提高了双足机器人的运动稳定性及运行效率。首先,结合时间和事件检测方法实现了稳定的触地检测,并通过卡尔曼滤波器融合关节编码器和IMU(惯性测量单元)信息,对双足机器人的状态进行了准确估计。仿真结果表明,相比单一时间检测方法,所提出的方案具有更好的稳定性,且在10 m范围内的位置信息误差小于1%。在此基础上,设计了基于渐进式步态控制机制和机身倾角控制机制的关节协同控制器,显著提高了机器人行走的稳定性。渐进式步态和机身倾角控制策略使得机器人能在5 s内平稳地完成从站立到行走的转换。结合仿真方法,设计了协同驱动的机器人髋关节。仿真结果表明该设计方案降低了髋关节偏航角电机的最大扭矩需求,降幅达40%。最终,搭建了完整的双足机器人实机系统,经过实验测试,证明了所提方案的有效性和实机应用的潜力
引用信息孙振洋, 吴楷, 王贺升. 基于关节协同控制的仿人双足机器人设计及优化[J]. 机器人, 2025, 47(4): 526-536.
资讯配图

识别二维码,访问全文PDF


04


面向地下环境机器人的多模态目标检测方法

作者:周萌  北方工业大学

专家述评StarFusion模块的逐元素乘法与通道压缩策略结合具备一定创新性。
摘要:针对地下复杂环境中机器人感知系统面临的低光照干扰与计算资源受限双重挑战,提出一种轻量化双模态目标检测方法。通过构建融合激光雷达(LiDAR)点云与RGB图像的双分支网络架构,在浅层、中层和深层实现多尺度特征融合。所提方法引入StarFusion模块,采用逐元素乘法增强跨模态特征交互,结合深度可分离卷积与通道压缩策略,将模型参数量压缩至2.3M。为突破算法验证瓶颈,构建包含4类地下典型目标的低光照多模态数据集,其图像亮度(25±8.3)与清晰度(18.6±6.9)显著低于常规数据集。实验表明,本文方法在自建数据集上mAP50 (交并比为0.5时的平均精度均值)达到86.1%,较基准算法YOLOv8提升2.6%,推理速度达20帧/秒。将该方法实际部署于Jetson Orin NX平台的勘探机器人,结果表明,双模态互补机制有效克服了单传感器在低光照环境下的感知盲区,为地下自主作业提供了可靠的实时环境感知解决方案
引用信息王晶, 黄智鑫, 徐京邦, 周萌, 鞠爽. 面向地下环境机器人的多模态目标检测方法[J]. 机器人, 2025, 47(4): 537-547.
资讯配图

识别二维码,访问全文PDF


05

基于多模态扩散策略的长时任务规划

作者:兰旭  西安交通大学
专家述评针对机器人操作的长时任务的离线技能学习动作序列多样、自然语言指令理解与长时任务语义关系复杂、信息密度高等问题,提出一种多模态扩散策略的长时任务规划方法,该方法利用了大模型以及多模态扩散模型,经过仿真实验和真实实验,验证了算法的有效性
摘要:机器人完成长时任务时,离线技能学习的动作序列多种多样,自然语言指令理解与长时任务语义关系复杂,信息密度高。针对这些挑战,提出一种基于多模态扩散策略的长时任务规划方法(MMDPP)以提升复杂环境下的任务完成率与鲁棒性。该方法利用大型视觉-语言模型将自然语言任务转化为结构化任务元素,引入多模态融合模块,对低维状态、图像观测信息与任务语义进行统一建模,使用选择性通道,降低梯度冲突,减少梯度交叉干扰。在此基础上构建条件扩散生成模型,直接输出结构一致、任务对齐的动作序列,实现从语言输入到动作预测的端到端策略规划。在MuJoCo-Kitchen-Image厨房环境(自建数据集)中,MMDPP方法完成长时任务的成功率相比基线方法显著提高;在Robosuite-Kitchen环境中,成功率比SiMPL方法提高了2.4%;在UR5真实机器人平台整理场景的操作任务中成功率为80%,展现出良好的准确率与现实适应性。本文方法显著增强了长时任务动作策略学习对任务变化的适应性,为基于扩散模型的机器人长时规划提供了有效范式

引用信息罗佳媛, 刘泽阳, 兰旭光. 基于多模态扩散策略的长时任务规划[J]. 机器人, 2025, 47(4): 548-558.

资讯配图

识别二维码,访问全文PDF


资讯配图

01

面向人机物高效融合与协作的具身智能技术体系
通信作者:林倞  中山大学
专家述评首先对具身智能的定义,当前的研究现状进行了总结,提出当前该方向的不足和挑战。接着针对这些挑战,分五个部分综述了作者所在单位的工作,最后对未来方向进行展望,并对全文进行了总结。总的来说本文对具身智能有着深刻的理解,内容丰富,整体写作规范,是当下具身智能研究,非常重要和及时的综述性文章。
摘要:具身智能是迈向人机物高效融合与协作的关键路径,其核心在于实现人类、机器人、物理世界的深度融合,提升智能体对物理世界的感知、认知与协同能力。本文系统探讨了具身智能的关键要素与技术路径,围绕5个方面展开研究:首先,提出以任务为导向的多模态主动感知框架,结合具身交互与主动导航,构建视觉、语言与行为协同的环境感知体系;然后,基于世界模型与任务符号化技术,实现任务的动态分解与结构化规划,确保智能体具备可泛化的决策能力;其次,构建虚实迁移技术链,将大模型训练成果高效迁移至实体硬件,打通仿真与现实的部署壁垒;再次,基于视觉语言动作模型和MoE(混合专家系统)框架,提升具身智能体的复杂任务迁移能力与泛化能力;最后,依托中国算力网,打造国产自主可控生态体系,推动关键技术国产化与规模化落地。综上,本文系统综述了具身智能的技术体系与研究进展,为具身智能的发展提供了清晰的技术路径与实践框架,为通用人工智能的实现奠定了重要基础
引用信息:刘阳, 柏永杰, 林倞. 面向人机物高效融合与协作的具身智能技术体系[J]. 机器人, 2025, 47(4): 559-580.
资讯配图

识别二维码,访问全文PDF



02

面向柔性制造的具身智能综述

作者:徐凯  中国人民解放军国防科技大学

专家述评该文围绕工业具身智能这一前沿方向,系统性地梳理了技术发展脉络与核心挑战,兼具理论深度与实践价值,具备较高的学术意义与工业应用参考价值。论文结构清晰,论述系统,对工业具身智能的三大核心挑战(柔性适配与工艺精度的动态平衡、通用技能与专门工艺的有机融合、受限观测与精准建模的矛盾突破)的分析尤为深入
摘要:在新一代人工智能取得突破性进展的驱动下,具身智能正加速向工业制造领域渗透。柔性制造场景中的工业具身智能面临3大核心挑战:受限感知下的工艺精准建模监测难题、柔性适配与高精操控的动态平衡难题和通用技能与专用工艺的协同融合难题。为此,本文从“工业之眼、工业之手、工业之脑” 3个维度对现有工作进行综述:在感知层(工业之眼)重点探讨复杂动态环境下的多模态数据融合与实时建模方法,在控制层(工业之手)深入剖析复杂制造工艺的柔性自适应精准操控方法,在决策层(工业之脑)系统总结工艺规划与产线调度的智能优化方法。从多层级技术协同、多学科交叉融合的视角,揭示制造系统“感知―决策―执行”闭环优化的具身智能关键技术路径,提出柔性制造场景下具身智能发展的“认知增强―技能跃迁―系统进化” 3个阶段的演进模型,探讨了未来发展趋势,以期为柔性制造趋势下的工业具身智能跨学科融合发展提供理论框架和实践参考
引用信息徐凯, 赵航, 胡瑞珍, 杨敏, 刘浩, 张辉, 于海斌. 面向柔性制造的具身智能综述[J]. 机器人, 2025, 47(4): 581-624.
资讯配图

识别二维码,访问全文PDF


资讯配图

猜你还喜欢下列文章

点击蓝色字体可阅读
资讯配图

目次 | 2025年 第47卷 第3期

目次 | 2025年 第47卷 第2期

目次 | 2025年 第47卷 第1期

目次 | 2024年 第46卷 第6期

目次 | 2024年 第46卷 第5期

目次 | 2024年 第46卷 第4期

目次 | 2024年 第46卷 第3期

目次 | 2024年 第46卷 第2期

目次 | 2024年 第46卷 第1期


联系我们 :

资讯配图

电话:024-23970050

资讯配图

E-mail:jqr@sia.cn

资讯配图

网址:https://robot.sia.cn

资讯配图
欢迎关注《机器人》视频号

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
英伟达发布人形机器人最强芯片!中国公司宣布采用!网友:小心后门引进敌军!
工厂第一批人形机器人工人,现在怎么样了?
盘古大模型等多个部门将被裁撤?华为云官方回应;挖来英伟达大牛,小鹏机器人产线已落地几百台;萨里大学发明新型AI系统
英伟达推出新“机器人大脑”芯片模块,3,499美元的价格上市
2.5万一台!英伟达打造机器人“最强大脑”,性能提升750%,宇树已经用上…
倒计时1天!3大专场,20+主题分享,今年的焊接机器人市场有哪些变化?| 报名通道
成立两年即实现盈利,特种机器人企业拿下数千万元融资
迈尔微视:3D感知驱动具身智能机器人的未来
从技术突破迈向产业落地,万勋具身智能机器人助力桐翔科技构建低空经济应用场景闭环生态
英伟达机器人“新大脑”来了,售价2.5万元!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号