
撰文:田爽
审核:毕彦超
视觉的重要性不言而喻——无论是识别物体、接住飞来的球、理解他人的情绪、欣赏艺术、阅读乃至驾驶与导航,我们都在依赖视觉。过去大量研究关注我们如何通过视觉输入识别物体,或视觉如何服务于动作控制;但视觉远不止于此,它参与我们日常生活中几乎所有复杂的认知与行为任务。视觉不是单纯的“看到什么”,而是作为许多特定任务的输入。因此,Peelen教授关心的核心问题是:我们如何从视觉输入中提取任务相关信息?又如何从 “看到” 走向 “知道”?
大脑的视觉系统具有从简单特征到复杂物体的层级式表征结构,并在高阶脑区按照不同范畴(如面孔、场景、文字、身体部位、小型物体等)进行功能性组织。这类较高层级的加工(例如形成范畴标签)可以进一步被用于知识、记忆与评估。然而,大脑中也存在大量由高级到低级的反向连接,使得我们的思考与预期会反过来影响我们对视觉输入的解读。Peelen 教授在这两个加工方向上均开展了深入研究,并逐渐意识到:在大脑中,“看到”与“知道”之间的界线可能远比我们想象的更难分清。
整合“看到”与“想到”
Peelen教授早年的博士工作已发现在大脑的腹侧梭状回区域存在看到身体部位时的特异性加工脑区(Fusiform Body Area, FBA),而后他的团队通过功能磁共振实验(fMRI)发现特定于“手“的视觉加工区与FBA不同,但与工具加工区,即左侧外侧枕颞皮层(lateral occipitotemporal cortex, LOTC)重合(图1)。这一发现很让人惊讶,因为手和工具的视觉特征非常不同,因此不能被简单的视觉特征所解释,而手和工具都需要特定的行为操作方式以实现特定目的,这才是驱动该区域的关键特征。

图1. 工具和手的偏好性激活区域重合
在其他物体范畴中也有类似的发现,当我们看到文字,要进入语言系统;看到面孔,要加工情绪进入社交系统;看到某个建筑,会对应到特定的位置地点。也就说当我们看到一个物体时,不单单是加工其表面的视觉特征,而是加工与该物体相关联的一整套特征。因此“看到”和“想到”的发生边界已经变得模糊,它们已经整合到了一个共同的反应系统中。
知觉即推理
知觉是从输入的信息中推测意义的过程,我们对物体的识别会受到背景信息的影响,比如图2中的物体如果单独看的话,由于画面模糊,很难看出来是什么,但是结合背景的湖水,会很容易判断那是个绿头鸭子。通过fMRI实验和多体素激活模式分析(multi-voxel pattern analysis, MVPA)方法,发现大脑的双侧外侧枕叶皮层(lateral occipital cortex, LOC)对物体-背景结合的图片中的物体解码准确率显著高于对物体和背景分别进行解码的准确率的简单叠加。

图2. 结合背景的物体识别在大脑有更好的解码准确率
然而在该实验中有可能图片中的距离信息等相关线索会帮助解码,于是Peelen教授团队进行了另一个有趣的fMRI实验,实验前要求被试记忆一些物体-背景组合的图片(如图3-左侧),然后在实验中呈现对边缘模糊化处理过的图片,图片包括之前记忆过的、记忆过但去掉物体的、没有记忆过的(有或没有物体)。结果发现不仅在有物体(但模糊处理)的图片中,大脑左侧后侧梭状回区域对记忆过的物体的解码准确率高于没有记忆过的,当图片中没有物体时,大脑也表现出了对记忆过的图片物体有显著更高的解码准确率。这两个实验证据都支持背景信息会帮助我们判断知觉到的内容。

图3. 记忆影响物体知觉的解码准确率
目标与愿望导向的视觉加工
另一个体现认知影响知觉的方式,是我们在感知前已经带着特定的目标、意图或期待——我们往往更容易首先看到自己“想看到的”或对当前任务更有意义的内容。Peelen 教授团队在实验中精确操控目标指示与实际呈现的图像,将条件划分为“目标一致”(例如要求被试寻找车,并呈现汽车图片)与“目标不一致”(要求寻找车,却呈现人物图片)。他们利用高时间分辨率的脑磁图(MEG)记录被试在任务过程中的脑活动,并进行解码分析。结果显示在目标一致条件下,大脑在图像呈现后约 160 毫秒时(对应图4中的对角线)就已能够成功解码出所看到的物体;而在目标不一致条件下,成功解码出现得明显更晚。这一差异表明,任务目标会提前调节视觉系统,使其更快速地提取与目标相关的特征。

图4. 被试看与目标一致的图片时成功解码出现得更早
视觉思考
当物体不在眼前时我们仍然可以进行视觉形式的思考与想象,Peelen教授认为我们之所以需要想象是因为要为想要看到的东西做准备。基于这一观点,他的团队设计了一个“物体搜索”实验:被试根据线索提示(“盒子”或“甜瓜”)提前准备判断接下来呈现的图片中是否包含该物体。关键在于,实验中有一部分试次在线索之后并不会真正呈现任何物体,这些试次正是用来考察“纯想象”阶段的大脑表征。如果被试在脑中为即将搜索的目标构建了相应的视觉图像,那么大脑应能够成功解码想象中的物体。结果显示:研究者利用被试在观看真实物体图片时的物体选择区(object-selective cortex, OSC)激活模式来训练分类器,可以成功解码被试在想象中的目标物体。此外,想象到的物体也呈现出与真实视觉一致的空间特性——遵循“近大远小”的规律。只有当被试所想象的物体大小与其“预期空间距离”相匹配时,解码准确率才显著提升。

图5. 想象的物体大小与空间距离相匹配时解码准确率更高
外在输入与内在思考的竞争
在日常生活中,我们常常一边在脑海里想象特定的画面,一边又需要处理周围的视觉信息。例如,走在路上时思考中午要吃什么的同时,还必须躲避来往的行人和车辆。那么,大脑如何在“内在图像”与“外在输入”之间分配和竞争视觉加工资源呢?Peelen 教授团队的另一项研究利用脑电(EEG)进行了探讨。实验中,被试根据线索提示回忆并想象对应的图片内容;在想象过程中,屏幕的外围会呈现干扰刺激(图6)。结果发现:当干扰刺激与被试正在想象的目标不属于同一物体类别时,无论是对空间位置的解码还是对类别的解码,其效果都更好。这表明内部想象与外部视觉输入确实会竞争视觉加工资源。

图6. 物体视觉影响物体想象的解码准确率
由此可见,“看到”与“想到”高度交织,由外向内与由内向外的视觉加工彼此影响,使二者的界限难以清晰划定,也在一定程度上构成对同一加工资源的竞争。
参考文献
Integrating seeing and thinking: Peelen, M.V., & Downing, P.E. (2017). Category selectivity in human visual cortex: Beyond visual object recognition. Neuropsychologia, 105, 177-183.
Perception as inference: Peelen, M.V., Berlot, E., & de Lange, F.P. (2024). Predictive processing of scenes and objects. Nature Reviews Psychology, 3(1), 13-26
Goals and desires: Peelen, M.V. (2025). The neural basis of visual search in scene context. Current Directions in Psychological Science, 34(2), 114-121; Peelen, M.V., & Kastner, S. (2014). Attention in the real world: toward understanding its neural basis. Trends in Cognitive Sciences, 18(5), 242-250
Visual thinking: Battistoni, E., Stein, T., & Peelen, M.V. (2017). Preparatory attention in visual
cortex. Annals of the New York Academy of Sciences, 1396(1), 92-107
Naturalistic neuroscience and the importance of context: Willems, R.M., & Peelen, M.V. (2021). How context changes the neural basis of perception and language. iScience, 24(5)
MVPA cross-decoding to test cognitive theories: Peelen, M.V., & Downing, P.E. (2023). Testing cognitive theories with multivariate pattern analysis of neuroimaging data. Nature Human Behaviour, 7(9),1430-1441
来源:北大脑科学