
上海人工智能实验室(上海 AI 实验室)联合清华大学、剑桥大学等合作单位,正式发布 BrainOmni—— 全球首个统一 脑电(EEG)与脑磁(MEG)的大脑基础模型。BrainOmni 通过一种新注意力机制,模拟了脑科学中源重构算法的前向过程,并且首次利用传感器的真实物理属性(坐标、方向、类型)替代通道命名,从而实现跨设备、跨模态兼容。通过 1997 小时 EEG 和 656 小时 MEG 的大规模自监督预训练,BrainOmni 在 9 项下游任务上超越现有基础模型与专用模型,并在未见过的设备上展现强零样本泛化能力。工作自发布以来,收到了来自牛津大学、剑桥大学、法国国家科学研究中心、荷兰 Radboud 大学、美国著名可穿戴脑磁图企业等的关注与合作邀请。

论文链接:https://arxiv.org/abs/2505.18185
开源链接:https://github.com/OpenTSLab/BrainOmni
BrainOmni: 统一 EEG-MEG 的脑基础模型
神经元活动是大脑功能的主要载体,对其精确的测量与理解对探究大脑思考过程、多模态刺激下的信息解码、神经疾病诊断等任务至关重要。脑电图(EEG)和脑磁图(MEG)通过记录神经电流引发的二次电流及磁场,间接测量大脑内部的活动,是两种相对安全便利的非侵入式测量手段,具有广阔的拓展与应用前景。
尽管 EEG 与 MEG 同源于神经电流激发的电磁场,二者长期以来多被分开建模。且由于脑电磁设备的异构特性(通道数、布局、朝向、传感器类型),过往的模型往往只能应用于特定的数据集 / 设备 / 任务,难以学习跨设备跨数据集的泛化知识。近来,一些 EEG 基础模型对脑电信号的大规模预训练进行了探索,然而这些模型大多仍依赖特定的通道命名系统,无法真正兼容全部的脑电数据。同时尽管 MEG 有比 EEG 更高的时空精度,因复杂性高且公开数据稀缺,还缺少基础模型的探索。
BrainOmni 首次在统一特征空间内对 EEG 与 MEG 进行联合预训练,兼容不同脑电磁设备,实现跨模态、跨设备、跨任务、跨被试的通用表征学习,在多种下游任务上表现优越。该工作配套提出 BrainTokenizer,把连续的脑活动压缩并量化为离散神经词元,为大规模 “脑信号语言建模” 奠定基础。
更强跨被试下游性能与零样本跨设备泛化
-
下游性能领先:跨被试实验设置下,BrainOmni 在运动想象、情绪识别、异常检测、抑郁检测、阿尔茨海默症检测、帕金森检测、 自闭症检测等 9 个下游任务上,取得了优于领域专家模型以及之前的 EEG 基础模型的性能。

表:八个 EEG 数据集上 BrainOmni 与 baseline 的比较。

表:MEG 和 EMEG 数据集上 BrainOmni 与 Baseline 的比较。
-
零样本跨设备泛化能力:在训练期间未接触的 EEG/MEG 设备上,BrainTokenizer 保持稳定的信号重建效果,体现了模型跨设备的强大泛化能力。

表:BrainTokenizer在零样本设备数据的重建结果。
-
脑电磁模态互增益:相比于单模态预训练,EEG/MEG 的联合预训练带来了稳定的性能提升,体现了将同源的脑电磁信号联合建模的优势。

表:联合EEG/MEG预训练与单独进行EEG或MEG训练的比较。
“潜在源变量” 建模与神经词元离散,实现异构数据统一与上下文建模
BrainTokenizer:研究团队创新性提出了 Sensor Encoder 模块对脑电磁传感器的物理特性进行可学习建模,通过设备信息的显式注入使得模型实现对多样化设备的兼容。同时团队受脑科学领域源活动估计方法的启发,假定异构的电磁信号由同构的一组神经活动源变量激发,将脑外电磁信号映射到统一特征空间,并将连续的源变量特征离散化,将脑信号转化为神经词元序列。

图:BrainTokenizer架构
BrainOmni:基于 BrainTokenizer 的得到的神经词元,使用掩码语言建模的无监督范式进行自监督学习,使模型学习高层次语义特征,显著提升对神经活动的理解能力。

图:BrainOmni架构
国家 “十五五” 规划已将脑机接口列为未来新经济增长点之一,其战略价值正日益凸显。要实现这一目标,算法、硬件与临床的深度融合至关重要。脑电磁信号因具备无侵入、可穿戴、高时空精度、低延迟等优势,具备广泛的普适性和应用潜力,是拓展脑机接口人群与场景、提升产业价值的关键方向。
BrainOmni 系列基础模型从 AI 角度破解了电磁信号融合、跨设备通用等长期技术瓶颈,并为高价值 MEG 数据稀缺这一行业痛点提供了新的解决途径。上海 AI 实验室正与国内外机构紧密合作,从 “通专融合” 的技术路线持续演进 BrainOmni 系列,在提升性能的同时拓展更多应用领域,进一步融入侵入式脑电、神经影像等更多模态信息。
未来,该系列模型将与上海人工智能实验室的『书生』通专融合基础大模型 Intern-S1与 科学发现平台 Intern Discovery 深度融合,发展为面向脑机接口研究与临床应用、覆盖全模态的 AGI4Science 关键组件之一。
作者丨论文团队
来源丨ScienceAI
仅用于学术分享,若侵权请留言,即时删侵!