27M小模型超越o3-mini-high和DeepSeek-R1！推理还不靠思维链。

开发者是那位拒绝了马斯克、还要挑战Transformer的00后清华校友，Sapient Intelligence的创始人王冠。

这个27M小模型就是Sapient最新提出的开源可复现的分层推理模型Hierarchical Reasoning Model（下面简称HRM），模仿大脑的分层处理与多时间尺度运作机制，克服了标准Transfomer的计算局限。

2700万参数，就实现了对现有大模型的精准超车。

不用预训练补课，还不靠思维链打草稿，仅凭1000个训练样本，就把极端数独、30x30迷宫玩得明明白白。

甚至连衡量通用智能的ARC-AGI测试都能碾压一众参数规模更大、上下文更长的Claude 3.7等“大前辈”。

有网友感叹，这就像四两拨千斤AI版……

所以，HRM这个小模型是如何做到的？

核心是仿脑的双层循环模块设计

HRM之所以能有如此出色的表现，源于其五项核心技术的巧妙设计。

首先是分层循环模块与时间尺度分离。

HRM受大脑皮层区域分层处理和时间分离机制启发，设计了两个相互配合的循环模块：一个高层模块负责慢节奏的抽象规划，一个低层模块处理快节奏的细节计算，不用明确监督中间过程，一次就能完成推理。

两者在不同时间尺度上协同工作。低阶模块在每个高阶周期内完成多次计算并达到临时稳定状态后，高阶模块才会更新决策，随后低阶模块重置并开启新一轮计算。

这种设计既保证了全局方向的正确性，又提升了局部执行的效率。

比如，在需要大量树搜索和回溯的Sudoku-Extreme Full任务上，增加Transformer的宽度不能提升性能，增加深度才是关键，而标准架构会出现性能饱和，无法从深度增加中获益。

HRM则克服了这一限制，能有效利用计算深度实现近乎完美的准确率。

其次是分层收敛机制。

普通的循环神经网络常出现过早收敛的问题——计算几步就陷入稳定状态，后续再复杂的任务也无法推进。

而HRM中，低阶模块在每轮计算中会收敛到基于当前高阶状态的局部结果，但高阶模块更新后，会给低阶模块设定新的目标，使其进入新的收敛周期。

这就像完成项目时，先攻克一个子任务，再根据整体进度调整目标，确保持续推进不偷懒。

第三项是近似梯度技术。

传统循环模型训练时，需要存储所有中间状态并反向追溯，类似复盘时要回看每一步操作，既耗内存又低效。

HRM则采用一步梯度近似，只需根据最终状态反推优化方向，如同根据考试结果直接定位薄弱知识点，内存需求恒定且计算高效，更符合生物大脑的学习规律。

第四是深度监督机制。

它受大脑中神经振荡调节学习节奏的启发，引入了阶段性测试。

模型在学习过程中被分成多个阶段，每个阶段结束后立即评估并调整参数，且前后阶段的计算互不干扰。

这种方式能及时纠正偏差，就像学生每学一单元就测试巩固，比期末一次性考试的学习效果更扎实。

自适应计算时间让HRM能像人一样灵活分配思考时间。

它通过类似评估收益的算法（Q学习），动态决定是否继续计算，在保证准确率的同时避免算力浪费，推理时还能通过增加计算资源进一步提升表现。

比如，简单任务如简单迷宫快速给出答案，复杂任务如高难度数独则延长计算时间。

这些技术的融合，让HRM在多项测试中表现不凡。

下图通过可视化中间步骤，验证了HRM的分层推理机制能够有效拆解复杂任务，通过渐进式计算逼近正确结果，而非依赖黑箱式的一次性输出。

在衡量AI通用推理能力的ARC-AGI挑战中，HRM仅用2700万参数和1000个训练样本，就达到40.3%的准确率，超过了参数规模更大的o3-mini-high（34.5%）和Claude 3.7 8K（21.2%）。

对于需要反复试错的9x9极端数独，现有思维链模型完全无法解决（准确率0%），即便是结构相似的Transformer模型，用同样数据训练也毫无头绪。而HRM几乎能全部做对。

在30x30复杂迷宫的最优路径寻找任务中，HRM表现稳定，而1.75亿参数的大型Transformer模型准确率不足20%。

虽然，HRM被指参数太小、训练范围有限，只针对特定领域表现好，无法泛化到领域外，并不通用。但有人认为小而精的模型或许在某些角度上更智能。

人工智能的飞跃在于创造性。

也有人认为HRM的前景更在于“仿脑”，通过精心设计的高低两个模块避免过早收敛，对过拟合具有极强的抵抗力。

甚至有人相当乐观，认为这种新架构是神经网络一个巨大的进步。有可能是超越Transformer的时刻。

拒绝马斯克，挑战Transfomer

论文的第一作者王冠是一位00后，8岁开始学习编程，后保送至清华大学计算机系。

他是GitHub揽星5.1k开源项目OpenChat的独立开发者，独立完成了OpenChat全部版本的模型开发和训练框架搭建。

也正是因为OpenChat这个项目，他和马斯克产生了交集。

但他算得上是一个拒绝了马斯克的男人——此前，王冠多次拒绝了xAI等一线机构创始人的加入邀请。

原因是他认为自己要做的是颠覆Transfomer。

2024年，王冠和联合创始人Austin创办了Sapient Intelligence，并成功融资数千万美元。致力于打造“真正具有复杂推理和规划能力的全新大模型架构”。

论文地址：https://arxiv.org/abs/2506.21734
代码地址：https://github.com/sapientinc/HRM

参考链接：
[1]https://x.com/casper_hansen_/status/1951656675250684163
[2]https://x.com/deedydas/status/1951677875004100814
[3]https://x.com/omarsar0/status/1951751651729060081

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

相关阅读

干货推荐：

【AI加油站】第一部：《大型语言模型应用检索增强生成：改变搜索、推荐和 AI 助手》附下载

【AI加油站】第二部：《程序员的自我修炼手册》（附下载）

【AI加油站】第三部：《大规模语言模型：从理论到实践》（附下载）

【AI加油站】第四部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第五部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第六部：《时间序列：建模、计算与推断》（附下载）

【AI加油站】第七部：《因果关系的逻辑理论的好书-A Logical Theory of Causality》（附下载）

【AI加油站】第八部：《模式识别（第四版）-模式识别与机器学习》（附下载）

【AI加油站】第九部：《Python深度学习（中文版）》（附下载）

【AI加油站】第十部：《机器学习方法》（附下载）

【AI加油站】第十一部：《深度学习》（附下载）

【AI加油站】第十二部：《从零开始的机器学习》（附下载）

【AI加油站】第十三部：《Transformer入门到精通》（附下载）

【AI加油站】第十四部：《LLM 应用开发实践笔记》（附下载）

【AI加油站】第十五部：《大模型基础完整版》（附下载）

【AI加油站】第十六部：《从头训练大模型最佳实践》（附下载）

【AI加油站】第十七部：《大语言模型》（附下载）

【AI加油站】第十八部：《深度强化学习》（附下载）

【AI加油站】第十九部：清华大学《大模型技术》（附下载）

【AI加油站】第二十部：Prompt入门神书-《Prompt 学习指南》（附下载）

【AI加油站】第二十一部：吴恩达&open AI联合推出《大模型通关指南》（附下载）

【AI加油站】第二十二部：《李宏毅深度学习教程》值得反复阅读的神书！（附下载）

【AI加油站】第二十三部：Prompt经典中文教程-《提示工程指南》（附下载）

【AI加油站】第二十四部：爆火下载28万次！MIT最新神书《理解深度学习》（附下载）

【AI加油站】第二十五部：LLM4大名著，OpenAI专家强推《深度解析：大语言模型理论与实践》（附下载）

【AI加油站】第二十六部：NLP大牛Thomas Wolf等新书《Transformer自然语言处理》（附下载）

【AI加油站】第二十七部：哈工大博士耗时一年整理《PyTorch常用函数手册》，轻松掌握PyTorch的各种操作（附PDF下载）

【AI加油站】第二十八部：大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》（附下载）

【AI加油站】第二十九部：炸裂发布！《大语言模型：导论》重磅发布！（附下载）

【AI加油站】第三十部：最值得读的LLM书！下载量10w+！《基于Transformer和扩散模型的生成式AI》（附下载）

【AI加油站】第三十一部：RL稀缺宝典！《强化学习的艺术》（附下载）

【AI加油站】第三十二部：一本醍醐灌顶的教科书！《大语言模型提示工程：构建LLM应用的艺术与科学》（附下载）

【AI加油站】第三十三部：机器学习好评榜第一《机器学习基础》（附下载）

【AI加油站】第三十四部：所有大模型领域学习者必读，没有之一！由深度学习三巨头联合撰写！（附下载）

【AI加油站】第三十五部：{AI炼丹神书}——从0到1榨干深度学习模型每一滴性能的终极战术手册《深度学习调优指南》（附下载）

【AI加油站】第三十六部：面向生产环境的大型语言模型实战手册《LLM 大语言模型构建指南》（附下载）

【AI加油站】第三十七部：《深度学习的数学导论：方法、实现与理论》从神经网络架构到物理信息模型的全景综述（附下载）

【AI加油站】第三十八部：下载量10w+！《大型语言模型：语言理解和生成》从文本分类到主题建模的实战指南（附下载）

【AI加油站】第三十九部：包教包会！《从零开始构建大语言模型的关键要点》大模型训练全景指南：从0到1的系统性最佳实践（附下载）

【AI加油站】第四十部：《大规模机器学习训练工程实战手册》——从硬件选型到故障恢复的系统性指南（附下载）

【AI加油站】第四十一部：《ChatGPT后训练全景解析：技术演进、核心挑战与未来方向》（附下载）

【AI加油站】第四十二部：《百页机器学习书》：从算法到实战的全景指南（附下载）

【AI加油站】第四十三部：《掌握大语言模型》核心知识速览：从NLP基础到LLM前沿实践（附下载）

面试推荐：

【AI加油站】AI面试专题一：BIO,NIO,AIO,Netty面试题（附下载）

【AI加油站】AI面试专题二：Git常用命令面试题（附下载）

【AI加油站】AI面试专题三：Java常用面试题（附下载）

【AI加油站】AI面试专题四：Linux系统的面试题集（附下载）

【AI加油站】AI面试专题五：Memcached 面试题集（附下载）

【AI加油站】AI面试专题六：MyBatis框架的面试题（附下载）

【AI加油站】AI面试专题七：MySQL相关的面试题资料（附下载）

【AI加油站】AI面试专题八：Netty面试题资料（附下载）

【AI加油站】AI面试专题九：Nginx的面试题资料（附下载）

【AI加油站】AI面试专题十：RabbitMQ的面试题资料（附下载）

【AI加油站】AI面试专题十一：Redis的面试题资料（附PDF下载）

【AI加油站】AI面试专题十二：Spring的面试题资料（附PDF下载）

【AI加油站】AI面试专题十三：Apache Tomcat的面试题资料（附PDF下载）

【AI加油站】AI面试专题十四：Zookeeper的面试题资料（附PDF下载）

【AI加油站】AI面试专题十五：《阿里巴巴Java开发手册》终极版的面试题资料（附PDF下载）

【AI加油站】AI面试专题十六：大数据技术面试题资料（附PDF下载）

【AI加油站】AI面试专题十七：Java并发多线程面试题资料（附PDF下载）

【AI加油站】AI面试专题十八：设计模式的面试题资料（附PDF下载）

【AI加油站】AI面试专题十九：Java虚拟机（JVM）的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十：Elasticsearch的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十一：TCP UDP Socket Http网络编程的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十二：消息队列Kafka的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十三：Spring Boot的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十四：Spring Cloud的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十五：Dubbo的面试题资料（附PDF下载）

大模型课程推荐：

【AI加油站】大模型课程系列一：大模型应用：从提示工程到AI智能体——系统化知识地图（附PDF下载）

【AI加油站】大模型课程系列二：大模型应用：从提示工程到AI智能体——系统化知识地图--合集（附PDF下载）

【AI加油站】大模型课程系列三：《大模型应用·第3章：大模型提示词》-大模型提示词设计七步法（附PDF下载）

【AI加油站】大模型课程系列四：《大模型应用·第4章：大模型辅助工作学习》一站式检索-办公-创作全攻略（附PDF下载）

【AI加油站】大模型课程系列五：《大模型应用·第5章：大模型检索增强》读懂大模型检索增强生成（RAG）全景（附PDF下载）

【AI加油站】大模型课程系列六：《大模型应用·第6章：大模型认知框架》从情景模仿到自我进化的7种思维范式（附PDF下载）

【AI加油站】大模型课程系列七：《大模型应用·第7章：大模型使用工具》-从“会聊天”到“能办事”的7个关键洞察（附PDF下载）

人工智能产业链联盟高端社区

精选主题推荐：

Manus学习手册

从零开始了解Manus

DeepSeek 高级使用指南，建议收藏

一次性说清楚DeepSeek，史上最全（建议收藏）

DeepSeek一分钟做一份PPT

用DeepSeek写爆款文章？自媒体人必看指南

【5分钟解锁DeepSeek王炸攻略】顶级AI玩法，解锁办公+创作新境界！

DeepSeek接入个人微信！24小时智能助理，随时召唤！

PS×Deepseek：一句话编写PS脚本，搞定PS批量导出图层

如何让AI给自己打工，10分钟创作一条爆款视频？

荐：

【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！

【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

声明

免责声明：部分文章和信息来源于互联网，不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题，请立即与小编联系（微信号：913572853），我们将迅速采取适当的措施。本订阅号原创内容，转载需授权，并注明作者和出处。如需投稿请与小助理联系（微信号：AI480908961）

编辑：Zero