前沿 | 新型30分类听觉脑机接口拼写系统实现无障碍文字输入

脑机接口星球 2026-06-09 18:08

在渐冻症(ALS)、闭锁综合征等神经疾病患者群体中,无法自主视物、控制眼球是常态,传统视觉脑机接口(BCI)难以满足他们的沟通需求。近日,日本芝浦工业大学的研究团队发表的最新研究中,推出一款名为ASME-speller的全新听觉脑机接口拼写系统。该系统结合听觉流分离技术与大众熟知的QWERTY键盘布局,打造出无需视觉辅助、仅依靠普通耳机就能使用的文字输入工具,为视障及运动障碍人群开辟了全新沟通路径。

这款ASME-speller属于30分类听觉脑机接口系统,覆盖26个英文字母以及逗号、空格、删除、句号4种常用符号。研究团队巧妙将QWERTY键盘三行按键对应为三种不同音调的听觉流,键盘顶行、中行、底行分别匹配高频、中频、低频人声刺激,不同音高搭配差异化人声,让三条听觉流形成清晰区分。使用者只需将注意力聚焦目标字母所在的音频流,再锁定对应语音信号,大脑便会产生特征脑电(EEG)信号,系统借此识别输入意图,全程无需视觉参与,操作逻辑贴合大众使用键盘的固有习惯。

前沿 | 新型30分类听觉脑机接口拼写系统实现无障碍文字输入图1

ASME-speller BCI概念图。代表英文字母的语音刺激会在三条听觉信息流中反复播放,三条信息流分别对应标准键盘三行按键:上行(高频)、中行(中频)、下行(低频)。例如,若要输入标准键盘上行的字母“T”,使用者需关注高频信息流,并将注意力集中在语音刺激“T”上。大脑会针对被关注的刺激诱发出事件相关电位(ERPs),脑机接口系统通过检测该电位,判断使用者想要输入的目标字母。当序列数量为15组时,单次测试时长约为90秒。©作者团队/Front. Hum. Neurosci.

研究团队招募10名听力、神经功能正常的受试者开展在线实测,整套实验采用64通道设备采集脑电信号,语音刺激通过标准耳机播放,单个输入流程包含450组声音刺激,单次输入时长约90.8秒。首轮在线实验结果展现出不错的实用性,全体受试者平均分类准确率达到76%,平均信息传输速率为2.16比特/分钟。其中一名受试者因脑电数据存在大量运动伪迹导致识别失效,剔除该样本后,整体准确率提升至84%,信息传输速率也上涨至2.40比特/分钟,远高于30分类任务3.3%的理论随机猜测水平。

为进一步挖掘系统性能,团队开展多项事后分析,测试了线性判别分析、EEGNet深度学习模型等四种主流分类算法,同时对比静态停止与动态停止两种信号截断策略。测试发现,线性判别分析结合动态停止策略综合表现最稳定,受试者平均准确率维持在80%,信息传输速率提升至4.76比特/分钟。而深度学习模型潜力更为突出,表现最优的受试者借助EEGNet4,2模型与动态停止功能,实现100%识别准确率,信息传输速率高达14.44比特/分钟,输入效率实现大幅突破。

研究人员还针对脑电伪迹、样本类别失衡两大常见问题展开验证。实验显示,引入眼电伪迹去除算法后,系统整体准确率仅从76%微降至74%,二者不存在统计学差异,说明该系统对常规眼动干扰具备较强耐受能力。在类别失衡测试中,训练集目标与非目标样本比例从1:29逐步调整至1:1,结果显示比例失衡几乎不影响识别效果,仅当两类样本数量均等时,准确率才明显下滑,这也证明充足的非目标样本对模型稳定运行至关重要。

从脑电信号特征来看,实验全程捕捉到了典型的事件相关电位(ERP),包括N2、P300以及N700三大特征波形,这些信号在目标刺激出现时显著增强,也是系统实现精准识别的核心依据。对比离线训练与在线实测数据,在线阶段的脑电波形振幅更大,研究推测,实时反馈机制提升了受试者参与积极性,同时反复练习也让使用者对任务更加熟悉,进一步强化了脑电响应特征,助力识别精度提升。

前沿 | 新型30分类听觉脑机接口拼写系统实现无障碍文字输入图2

剔除噪音信号异常的第10名被试后,得到总平均ERP响应结果。橙色曲线与蓝色曲线分别代表中央中线电极Cz和额中线电极Fz的电位时序变化。实线与虚线依次对应目标刺激与非目标刺激引发的电位响应。时序图下方的色条展示了符号化决定系数r²的数值大小。脑地形图分别呈现了目标刺激、非目标刺激的响应信号以及符号化决定系数r²在头皮表面的空间分布。ERP时序图中的蓝色、橙色、棕色阴影区域,与脑地形图的底色一一对应。上述三个时间窗口分别对应N2、P300和N700三种脑电成分。(A)离线实验数据结果;(B)在线实验数据结果。离线与在线实验中,均观测到目标刺激引发了特征显著的ERP响应。©作者团队/Front. Hum. Neurosci.

纵观过往听觉脑机接口拼写设备,多数产品存在操作步骤繁琐、音声与字母对应关系晦涩、需要多声道音响等问题。部分传统系统需要分两步完成字母选择,还有设备依赖多扬声器布局,使用场景受到极大限制。而ASME-speller仅需普通单声道耳机,单步即可完成字母输入,依托QWERTY键盘的认知基础降低记忆负担,综合性能对标甚至优于同类型纯听觉脑机产品。虽然视听、听触觉多模态系统传输速率更高,但这类设备需要额外硬件支撑,普适性远不及纯听觉方案。

目前该研究仍存在不少待优化之处,本次实验受试者均为年轻日语使用者,未来还需针对老年人、非日语人群以及神经疾病患者开展测试。同时64通道脑电设备体积大、成本高,后续需要验证8通道、16通道等便携设备能否保留现有性能。此外,系统单次输入时长偏长,听觉任务带来的认知负荷也有待量化评估。

ASME-speller听觉脑机接口系统的成功研发,充分验证了听觉流分离技术在脑机文字输入领域的应用价值。它跳出视觉依赖的局限,用简易硬件、直观操作实现高效文字输入,不仅能服务于视障、闭锁综合征、渐冻症等特殊病患,也为日常人机交互提供了新方向。随着算法迭代、设备小型化以及个性化参数优化,这款听觉拼写系统有望走出实验室,成为实用化的辅助沟通工具,帮助行动不便人群重新建立顺畅的对外交流渠道。

论文信息

标题:The ASME-speller: 30-class auditory brain-computer interface speller using stream segregation and the QWERTY layout

期刊:Frontiers in Human Neuroscience

发表日期:2026/5/21

DOI:https://doi.org/10.3389/fnhum.2026.1807535

作者:Simon Kojima, Shin'ichiro Kanoh

前沿 | 新型30分类听觉脑机接口拼写系统实现无障碍文字输入图3

声明

本文内容来自论文,详情可参考文末链接,如有侵权请告知删除。

了解更多脑机接口行业资讯

扫码加入“脑机接口”知识星球


前沿 | 新型30分类听觉脑机接口拼写系统实现无障碍文字输入图4

咨询与合作添加微信:Ko-Sofia

科普神经科学知识,推广脑机应用技术

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
接口 脑机
more
明确!上海新增脑机接口耗材目录,医保暂不支付
国自然与术理创新设立9900万元联合基金,探索脑机接口基础研究产学研新模式
行研 | 2026-2035年脑机接口行业市场规模、发展趋势及增长前景
产品 | Neuralink推出新一代脑机接口植入手术机器人:面向规模化应用
倒计时4天|脑机接口产业联盟2026年第一次全会议程
从“读脑”到“写脑”:曦涟科技获数千万元融资,押注双向脑机接口
脑机政策|到2027年营收超50亿!浙江拟发布脑机接口产学研联动“政策包”
产业 | 全国脑机接口教育联合体成立、曦涟科技融资数千万元、依瑞德经颅磁刺激仪首获欧盟新标认证等
深度|如何做好脑机接口产业“ 基础设施 ”搭建?
中风后遗症,脑机接口能解决吗?两大龙头企业强强联手,介入式方案实现医学突破!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号