ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见

脑机接口社区 2026-03-26 11:11

 

如果人类的大脑能直接连接打印机,将我们脑海中闪过的画面实时还原出来,这个世界会变成什么样? 

这听起来像是在致敬《盗梦空间》,但近日一项名为 NeuroAdapter 的视觉解码框架正让这一幕变得触手可及。 来自哥伦比亚大学研究团队的最新成果表明,我们不仅能从 fMRI(功能磁共振成像)信号中高保真地重建视觉图像,还能第一次看清:到底是哪块脑区在“指挥”这场艺术创作。

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图2

01. 告别“中间商”:脑信号直接转化

传统的脑电图像重建就像玩“传声筒”游戏:先要把大脑信号翻译成一段文字或中间特征,再交给 AI 去画图。 痛点很明显:信息在层层转手间失真了,而且你根本分不清哪些细节来自大脑,哪些又是 AI 自己的瞎编。 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图3

左图:典型的两阶段解码流程首先将大脑活动映射至中间特征空间(例如 CLIP/DINO),随后利用这些嵌入向量来引导生成模型。右图:我们的端到端方法直接以大脑活动为条件来驱动潜在扩散模型,从而实现了对图像空间与大脑空间中生成动态的解读。


NeuroAdapter 选择了最硬核的路线:端到端直连。它舍弃了冗余的中间特征空间,直接让大脑表征去“约束”潜在扩散模型(LDM)的生成过程。下图为NeuroAdapter 训练流程。皮层分区 + 线性映射 + 扩散控制。通过将脑皮层顶点数据直接映射为“大脑标记(tokens)”,AI 就像直接读取了大脑的底层逻辑,重构质量直接比肩目前最前沿的复杂算法。 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图4

(a) fMRI 数据采集范式;(b) 皮层分区;(c) 基于分区的线性映射,将顶点数据映射为大脑表征标记(tokens);以及 (d) 利用这些标记对潜在扩散模型(Latent Diffusion Model)进行条件控制,以实现图像重构。

 

该框架的另一个重要组件是大脑编码器。受 Kneeland 等人的启发,研究人员使用了一个基于相同 fMRI 图像训练数据集训练的全脑编码器,以在评估过程中识别最佳解码刺激。

 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图5

(a) 基于大脑编码器的图像选择示例:针对一个 NSD 测试样本,利用预测的 fMRI 响应与实测的 fMRI 响应之间的皮尔逊相关系数进行图像筛选。(b) 红色曲线:由解码图像预测出的大脑活动与实测大脑活动之间的相关性。蓝色曲线:针对测试集中的刺激图像所预测的大脑活动与对应的 fMRI 响应之间的相关性。

 

02. IBBI 框架:给大脑解码装上监测器

光能画出来还不够,科学家更想知道“为什么”。 研究团队引入了一种“图像—大脑双向可解释性框架”(IBBI),通过分析扩散去噪过程各阶段的交叉注意力模式,来揭示不同皮层脑区如何影响生成过程的演进轨迹。本研究不仅突显了端到端“大脑—图像”重建技术的巨大潜力,更为实现可解释的神经解码确立了一条可行路径。

通过监控扩散去噪过程中的“交叉注意力模式”,IBBI 就像一台高速摄影机,捕捉到了惊人的动态: 

早期阶段:图像还是一团混沌时,大脑的注意力是“漫射”的,在广泛搜寻结构。 

中后期阶段:随着轮廓显现,注意力迅速“收敛”,精准锁定在图像的核心内容上。 

团队甚至给脑区排了序,划分出五个层级。 这种可视化方案让我们一眼就能识别出谁是主导生成的“高影响力脑区”,谁又是打酱油的“次要脑区”。 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图6

03. 因果扰动实验:遮住“高级语义区”会怎样?

为了验证这套逻辑的可靠性,研究者探索了其“因果扰动”。 他们尝试对特定的感兴趣区域(ROI)进行遮蔽: 

遮掉低层级脑区:生成的图像语义基本没变,就像少了点无关紧要的噪点。 

遮掉高层级脑区:图像瞬间崩塌,内容发生彻底改变! 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图7

模型对比。在八项图像质量指标上,对现有方法与本方法(NeuroAdapter)的解码性能进行了对比。为确保对比的公平性,图中结果均以相对于“特定受试者的 ImageNet 检索基线”的相对提升幅度形式呈现。

 

ICLR 2026 | NeuroAdapter:直接从大脑信号“画”出你所见图8

图示为去噪过程中平均脑区贡献向量在皮层表面的投影示例。黄色区域表示在去噪过程中影响较大的脑区,蓝色区域则表示影响较小的脑区。

 

实验数据证明,NeuroAdapter 在高级语义指标上表现尤为强悍,甚至在没有独立低级通路的情况下,依然跑出了极其扎实的性能指标。 

04. 未来:如何从形似走向神似

论文团队在讨论中提到一个深刻的观点:目前的脑解码基准测试已经快“饱和”了。 很多时候得分高只是因为 AI 模型更强,而不是我们更懂大脑。 

NeuroAdapter 的意义在于,它提供了一个“神经活动—生成过程”的交互界面。当我们能以双向互联的方式将脑活动与图像特征紧密耦合,脑机接口将不再是一个黑盒,而是一条通往理解人类意识的透明路径。 

下一步,团队将致力于解决扩散模型自带的随机性波动,让“大脑画笔”更加稳定、一致。 

也许不久后的未来,我们分享梦境的方式,将不再是苍白的文字,而是一张精准重构的快照。 

仅用于学术分享,若侵权请留言,即时删侵!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
IC
more
LLM幻觉不只是「胡说八道」?新理论首次拆解幻觉的两大根源丨ICLR'2026
8999荣耀Magic V6详细对比体验丨荣耀龙虾宇宙
Rivian旗下工业机器人公司Mind Robotics完成5亿美元A轮融资,估值达20亿美元
前SpaceX工程师创立Mesh Optical Technologies,瞄准AI数据中心光模块市场
荣耀Magic V6发布:6600mAh大电池、超薄铰链与苹果生态深度协同
SpaceX-xAI 万亿合并余震、Anthropic 200亿融资、安全高管出走 | AI 日报
腾讯版“小龙虾”WorkBuddy上线;中国大模型上周第三方调用量再超美国;最高法明确醉酒后启用辅助驾驶要担刑责;微博宣布接入KimiClaw...
Adobe Firefly视频编辑器上线Quick Cut功能,AI助力创作者快速生成初剪视频
印度AI峰会闹剧频出:奥特曼阿莫迪“拒牵手”、宇树机器人被冒充,OpenAI硬件梦与Anthropic安全主管离职引关注
iCAR V27应用磁流变技术引爆底盘革命,中国龙头京西智行扛起产业化大旗
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号