有些人天生不能控制脑机接口,但AI或能“逆天改命”
脑机接口(BCI)技术通过将大脑神经信号转化为外部设备指令,为运动障碍者提供了重要的沟通与控制途径,但其广泛应用受限于两大关键问题:一是脑电(EEG)信号固有的低信噪比特性,头皮记录的神经信号易受肌肉活动、眼动、外部电磁干扰等噪声污染,导致有效信号难以分离;二是“脑机接口文盲”或“弱学习者”现象,这类用户因大脑结构功能差异、神经信号微弱或任务参与度不稳定等原因,即便经过训练也难以达到有效控制脑机接口的水平。
传统AI方法如卷积神经网络(CNN)虽能提取局部时空特征,但在捕捉EEG信号的长时依赖关系上存在局限,且现有模型多侧重优化平均水平学习者的表现,未充分解决弱学习者的性能短板。Transformer模型凭借自注意力机制在捕捉长程依赖上的优势,已在自然语言处理、医学影像等领域取得突破,但在脑机接口中的应用仍处于起步阶段,其与传统深度学习方法的融合潜力尚未充分挖掘。
注:Transformer模型是2017年由Google团队提出的基于自注意力机制(Self-Attention)的深度学习架构,核心用于解决序列数据(如文本、语音)的处理任务,现已成为自然语言处理(NLP)、计算机视觉(CV)等领域的基础框架(如BERT、GPT、Vision Transformer均基于其衍生)。
近日,悉尼科技大学研究团队创新性地将Transformer模型与卷积神经网络(CNN)、随机共振机制相结合,打造出混合神经网络架构STFNet(Stochastic Transformer Focus Network),成功破解脑机接口(BCI)领域两大核心痛点——低信噪比(SNR)和"脑机接口文盲"现象,为全球约15%-20%无法有效使用脑机接口的人群带来新希望。
该系统的核心突破在于"变废为宝"的噪声处理策略——不同于传统降噪技术对噪声的抑制,STFNet通过引入可控高斯噪声,利用随机共振效应放大微弱神经信号,让原本难以检测的脑电特征变得清晰可辨。同时,CNN模块负责提取局部时空特征,Transformer模块凭借自注意力机制捕捉长时依赖关系,三者协同实现了对复杂脑电信号的高效解析。
网络构建块架构组合的高级可视化 ©Computers in Biology and Medicine
为验证技术有效性,研究团队开展了三项递进式实验,基于PhysioNet和柏林BCI竞赛两大公开数据集,覆盖115名受试者的脑电数据。实验A中,融合Transformer与CNN的基础架构已实现91.4%的二分类验证准确率,显著优于传统CNN模型;实验B在多分类任务中进一步突破,STFNet将数据集II的整体准确率提升至84.5%,其中曾被判定为"脑机接口文盲"的受试者A02,准确率从传统方法的55.2%跃升至72.4%,受试者A05则从55%-62%提升至83.7%。
实验C针对106名受试者开展大规模验证,采用留一法交叉验证策略,对比STFNet与其他混合架构的鲁棒性。结果显示,STFNet 在各项指标上均表现最优:基础噪声设置下准确率高达88.69%,Kappa系数0.83;当噪声水平提升、数据增强强度降低时,准确率等性能进一步提升,且标准差显著降低,表明模型在异质受试者群体中具有更强的稳定性,即具备极强的跨人群适应性。
值得关注的是,STFNet在硬件适配方面也表现出色,已完成Apple Silicon芯片的优化部署,借助Metal编程框架实现高效训练,无需依赖高端GPU,为临床和家庭场景的普及奠定了基础。与现有主流技术相比,该系统不仅在准确率上领先,更通过噪声共振机制和多模块协同,首次实现了对弱学习者的精准赋能,大幅缩小了不同人群的脑机接口使用差距。
研究团队表示,STFNet的成功验证了Transformer与随机共振结合的技术潜力。未来,团队将进一步优化模型超参数配置,探索进化算法等自组织方法,推动技术在运动康复、辅助沟通等临床场景的落地应用。目前,研究使用的所有数据集均已公开,为全球科研人员提供了可复现的研究基础。
这项研究不仅是脑机接口技术的重要突破,更向“让脑机接口惠及所有人”的目标迈出了关键一步。随着技术的持续迭代,未来有望克服“脑机接口文盲”带来的技术可及性公平问题,摆脱用户个体差异的限制,成为更普惠、更可靠的人机交互工具,为残障人士的生活质量提升提供核心技术支撑。
https://doi.org/10.1016/j.compbiomed.2025.111378
本文资讯内容、图片来自网络,详情可参考文末链接,如有侵权请告知删除。