
ALS患者由于神经系统逐渐退化,通常会逐渐失去运动和言语能力,使得沟通成为难题。脑机接口(BCI)是近年来重要的研究方向之一,通过采集脑电信号并解码成指令,使得患者可以直接通过神经信号控制计算机或其他设备,实现沟通功能。尽管基于脑电图(EEG)或微电极阵列(MEA)的BCI已在一定程度上展现了可能性,但两者各自的限制(如EEG信号不稳定,MEA需要频繁校准)使得长期使用仍面临挑战。

本研究旨在探讨一种基于ECoG的BCI,通过检测脑电信号中的“点击”事件来控制拼写应用。研究选用了ALS患者为试验对象,并通过高密度皮质脑电图设备来解码患者的意图点击操作。与现有方法相比,该技术不仅在短时间内即可进行训练,更在无须重新校准的情况下可稳定运行长达3个月,展示出ECoG信号在BCI中稳定、持久的潜力。
研究方法
1. 临床试验背景与参与者
在本研究中的参与者是一名右利手的男性,确诊ALS已8年,由于肌肉萎缩,无法独立完成日常活动。他的手指虽能部分闭合以尝试抓握,但无力支撑物体。植入前进行了认知测试,未发现痴呆症状,参与者在试验过程中也没有表现出认知能力显著下降。
2. ECoG设备与手术植入
CortiCom研究设备包含两个8×8的皮质电极网格,由PMT公司生产,并通过开颅手术植入在负责上肢运动和言语功能的左侧运动皮层区域。该设备包含了128个信号采集通道,通过黑岩神经科技公司的Neuroport基座将信号传递到外部的放大装置,进而实现信号的数字化和传输。手术前使用MRI和功能性MRI(如手指敲击和舌头运动任务)确定了电极的植入位置,术后通过CT与MRI配准确认电极网格相对大脑表面解剖结构的位置,以确保信号来自特定的皮层区域。这种手术的成功率和无手术并发症的记录,进一步说明了该设备的植入安全性。

3. 信号采集与模型训练
(1)数据采集与实验设计:在每次实验开始时,记录60秒的基线校准期,期间参与者保持静坐和注视电脑屏幕,以获取静息状态下的皮层活动作为校准基线。实验团队通过四次训练课题进行数据采集,历时16天,总共记录了44分钟的神经信号。这些数据通过Neuroport系统以1千赫兹的采样率记录,BCI2000平台用于呈现视觉刺激并同步记录数据。
(2)训练任务:在训练过程中,参与者在视觉提示下尝试右手抓握(位于电极阵列对侧),并在抓握后松手。ALS患者上肢受限的实际动作主要涉及中指和无名指的弯曲,而手部恢复到放松位置则主要依靠手腕被动返回。每次抓握尝试包括一个100毫秒的“Go”提示,提示后是随机长度的刺激间隔,以减少患者的预期行为影响。

(3)特征提取与信号预处理:在特征提取环节,研究团队使用快速傅里叶变换(FFT)计算256毫秒窗口的高伽马(HG,110-170赫兹)功率,对数功率随后被放入1秒的缓冲区以形成一个历史特征向量。为了进一步处理这些特征,128通道的数据向量被输入到一个时间窗口循环神经网络(RNN)模型中。
(4)标签分配:在信号处理过程中,将HG功率特征在所有试验段重新对齐,以消除试验间的反应延迟差异。通过时间扭曲模型对HG功率进行重新排列后,研究团队基于视觉提示(“Go”提示)的时间点确定了抓握和休息标签,并对每个样本分配相应标签。值得注意的是,研究团队选用一种不依赖地面真实值的标记方法,以模拟ALS患者抓握意图的情况,从而在无实际动作反馈时也能确保模型的准确性。
(5)模型架构与训练:模型架构基于一个循环神经网络(RNN)构建,包含一个25隐藏单元的LSTM层和两个全连接(FC)层。模型使用10折交叉验证评估性能,每个折包含数量均等的“休息”和“抓握”样本,以防止类别不平衡导致的偏差。分类准确率在75个周期后趋于平稳,使用自适应矩优化(Adam优化)计算分类交叉熵损失。LSTM和全连接层均采用30%的权重丢弃率,以降低过拟合风险。
4. 在线流程与点击检测
研究团队使用基于Python的ezmsg消息架构搭建了一个有向无环图的处理单元,包括所有的预处理、分类和后处理步骤。神经数据以100毫秒的间隔传输到专用于在线推理的计算机。在线分类每100毫秒更新一次结果,这些结果进入一个7投票窗口,在达到预设阈值后触发点击,以避免误触发。应用投票窗口后,点击将触发拼写界面的高亮行或列的选择,完成拼写操作。

图3 | 开关扫描应用。参与者被指导在开关扫描周期中,通过在适当的高亮行或列点击来选择实验者提示的图形按钮(a)或拼写句子提示(淡灰色文本)(b)。有关(a)和(b)的详细描述,请分别参考补充图8和补充图9。
实验结果与分析
1. 拼写速率与系统性能
研究的核心在于验证该ECoG点击探测器是否能够在三个月内实现稳定的拼写性能。在使用切换扫描拼写应用的过程中,参与者需要通过抓握意图生成点击,以控制拼写界面的字母选择。实验数据显示,系统在整个测试期间能够维持中位数每分钟10.2个字符的拼写速率,这是一个相对较高的文字输入效率,尤其考虑到ALS患者的身体局限性,这一速度足以满足基本的沟通需求。
为了进一步评估系统性能,研究团队还观察了不同时间点的拼写速率变化。结果表明,尽管在部分测试阶段由于信号功率的波动性导致性能轻微波动,但系统整体的拼写效率保持稳定,没有明显下降。这一结果证明了ECoG信号的长期稳定性,即使在信号调制出现短暂降低的情况下,系统仍能提供可靠的拼写性能。
2. 不同投票阈值下的点击探测性能
研究团队在不同的测试阶段调整了系统的投票阈值,以优化系统的响应时间和误报率。投票阈值是指在一个固定时间窗口内,分类器需要达到多少次“抓握”分类才能被视为有效点击。初始阶段设置为10票的阈值(医疗通信板测试),这种设置虽然有效地减少了误报率,但在拼写应用中响应时间偏长。因此,后续测试中逐渐降低阈值至7票和4票,旨在提升系统的灵敏性并加快响应速度。
在使用7票阈值的阶段,系统的点击探测率较高,响应延迟有所改善。参与者能够更迅速地选择拼写界面中的字母,但该设置仍然保留了较低的误报率,使得拼写体验流畅。在第+81天后,投票阈值进一步降低至4票,以满足参与者对更高灵敏度的需求。此时,系统的响应时间明显减少,能够更及时地捕捉参与者的抓握意图。然而,这也导致了少量误报的增加,但在实际测试中,这种假阳性检测率保持在可接受的范围内,没有显著影响参与者的拼写效率。
3. 在线拼写应用的综合性能
实验结果显示,在7票和4票阈值设置下,参与者可以有效地使用拼写界面进行文字输入,系统的高伽马功率信号解码能够准确识别抓握动作,点击探测的准确性在整个测试过程中表现出色。通过这一设计,拼写应用不仅实现了高效的文字输入,还有效降低了参与者的操作负担,特别是在ALS患者眼动能力可能逐渐下降的情况下,ECoG点击探测器为重度运动障碍患者提供了一种有效的替代沟通方式。
4. 长期稳定性与误报率控制
本研究的一个关键目标是验证系统在长期使用中的稳定性,即在不重新训练模型的情况下,能否保持高效的点击探测性能。研究团队的长期观察结果表明,ECoG信号具有较高的稳定性,在长达三个月的测试期间无需重新校准或更新模型,系统依然能够维持稳定的性能。这种长期稳定性对于ALS患者及其护理人员尤为重要,因为频繁的模型重新训练将大大增加系统维护的复杂性,且不利于独立家庭使用。
在误报率方面,研究团队通过投票窗口的调节,有效控制了系统的误报率。尽管在更低阈值下存在少量误报,但总体误报率保持在可接受的范围内,系统能够可靠地过滤掉偶发的抓握分类误判。特别是在7票和4票窗口下,系统在保持高敏感度的同时,显著减少了因偶发信号变化导致的误点击,达到了理想的平衡。

图4 | 长期开关扫描拼写性能。
5. 不同信号调制强度下的系统表现
在三个月的测试过程中,研究团队记录到信号功率调制的短暂降低情况,但这种波动并未显著影响系统的整体表现。由于ECoG信号的长期稳定性,即便在功率调制强度变化的情况下,系统仍然能够正确解码点击意图。这说明基于ECoG的点击探测器具备在实际环境中适应不同信号波动的能力,从而确保系统的连续性和可靠性。
在出现功率波动的情况下,研究团队测试了快速重新训练的新模型。新模型仅使用了少量数据(<15分钟)进行训练,即能达到与原模型相似的性能,表明ECoG信号即便在短期数据收集中也具备足够的信息量用于点击检测。这为未来系统在实时适应信号变化、减少训练数据量方面提供了新的思路。
6. 误报控制与用户体验
为了保证良好的用户体验,研究团队在测试中注意到用户对误报的容忍度和响应速度的偏好。随着测试的进行,参与者反馈希望提高系统的灵敏度,即使可能会增加假阳性率。因此,在后期的测试阶段,研究团队选择将投票阈值从7票降低至4票,使得系统响应更为灵敏。这一改进有效提升了用户体验,使参与者可以更快捷地完成拼写操作,即便在偶尔的误报情况下,也并未显著影响整体使用效果。
7. 系统响应延迟与实用性评估
系统的响应延迟是评估脑机接口系统实用性的关键指标之一。研究团队通过调节投票窗口的大小,将响应延迟控制在最小限度。在4票阈值的设置下,系统可以更快速地响应抓握动作,相比10票或7票的设置,这一阈值显著减少了延迟,使参与者的拼写操作更加流畅。这样的设计提升了系统的实用性,使其更接近于日常生活中的实时响应需求。
8.电极通道对抓握动作分类的贡献
在本研究中,为了评估各电极通道对抓握动作分类的贡献,研究团队生成了所有通道的显著性图,分析这些通道的高频特征在分类任务中的重要性。结果表明,体感皮层上肢区域的通道112对抓握动作分类的贡献最为显著,其重要性明显高于其他通道。在使用包含所有通道的模型进行10折交叉验证时,分类的平均准确率达到了92.9%。
研究团队还评估了去除通道112,仅使用覆盖手部区域通道的高伽马(HG)特征对分类性能的影响。结果显示,虽然去除了最显著的通道112,但模型的准确率依然达到了91.7%,说明多个通道的特征对分类性能都有显著贡献,而非单一通道起决定作用。此外,仅使用覆盖皮质手结区域的电极进行分类,模型的平均准确率略降至90.4%,但仍然能够有效解码抓握意图。这表明这些区域的特征对于分类的关键性。
即使在系统性能出现下降时,通道112的相对显著性依然维持较高水平,其重要性在整体分类贡献中没有明显变化。综合来看,这些分析结果显示,高伽马特征中的显著通道对于确保分类准确性至关重要,但优化模型的性能还需要进一步深入探索参数设置和使用的通道组合。

图5 | 抓握分类的通道重要性。在线使用的模型的显著性图(a),不包括通道112的高伽马(HG)特征的模型(c),以及仅使用覆盖皮层手结区域通道的HG特征的模型(e)分别显示在(a)、(c)和(e)中。
结论
该研究通过对ALS患者的测试,展示了基于点击探测的ECoG脑机接口在长期高性能使用中的可行性。与传统的EEG脑机接口不同,ECoG技术的稳定性使得系统在不重新训练的情况下实现了长期应用。这不仅降低了护理人员的负担,也为ALS患者提供了独立的文字交流手段,特别是在ALS晚期眼动控制能力下降的情况下,系统依然能够通过抓握意图实现点击解码,有效提高了患者的生活质量。
尽管实验结果令人鼓舞,但受限于样本数量较少,该结果的推广性仍有待进一步验证。未来的研究可在更大规模的临床试验中进一步评估该系统的效果,特别是不同ALS患者群体的适用性。除此之外,研究团队还计划改进模型架构,进一步提升系统对信号变化的适应性,并测试其在非实验室环境中的性能,以推动该技术走向家庭使用场景。
仅用于学术分享,若侵权请留言,即时删侵!
欢迎加入脑机接口AI星球,获取更多脑机接口+AI等领域的知识和资源。
合作咨询请添加微信:RoseBCI【备注:姓名+行业/专业】。
欢迎来稿
1.欢迎来稿。投稿咨询,请联系微信:RoseBCI
点击投稿:脑机接口社区学术新闻投稿指南
2.加入社区成为兼职创作者,请联系微信:RoseBCI


一键三连「分享」、「点赞」和「在看」
不错过每一条脑机前沿进展