仅4B！阿里千问最强视觉模型新开源，网友：我的16GB Mac有救了

仅4B！阿里千问最强视觉模型新开源，网友：我的16GB Mac有救了图2

小尺寸，核心能力不减配，击败谷歌和OpenAI同级选手。

作者 | 李水青

编辑 | 心缘

智东西10月15日报道，今日，阿里通义千问团队推出其最强视觉语言模型系列Qwen3-VL的4B与8B版本，两个尺寸均提供Instruct与Thinking版本，在几十项权威基准测评中超越Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。

▲阿里千问团队公告截图（图源：X平台）

这两个新版本模型实现了以下关键目标:

1、资源门槛更低：尺寸缩减显著降低VRAM的占用。现在，开发者可以在更广泛的硬件设备上部署和运行模型。

2、核心能力不减配：在缩减尺寸的同时，其完整保留了Qwen3-VL的全部核心功能。

3、基准性能优秀：在STEM、VQA、OCR、视频理解及Agent任务等多个权威基准上，其表现不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano，在许多场景下甚至能与阿里半年前的旗舰模型Qwen2.5-VL-72B相媲美。

如下图所示，在多模态性能方面，Qwen3-VL-8B Instruct在MIABench、OCRBench、SUNRGBD、ERQA、VideoMMMU、ScreenSpot等30项权威基准测评中取得SOTA（行业最佳）成绩，超越了Gemini 2.5 Flash Lite、GPT-5 Nano以及Qwen2.5-VL-72B等顶尖模型。

▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况（图源：Qwen）

Qwen3-VL-4B Instruct也展现出优秀的多模态性能，以更少的参数量，在STEM、VQA、OCR、视频理解及Agent任务等测评中，能与Gemini 2.5 Flash Lite、GPT-5 Nano对打。

在纯文本表现上，如下图所示，Qwen3-VL-8B Instruct和Qwen3-VL-4B Instruct也相比Qwen3-4B Instruct-2507和Qwen3-8B Non-Thinking有整体提高。

▲Qwen3-VL-8B Instruct与Qwen3-VL-4B Instruct基准测评情况（图源：Qwen）

在多模态性能方面，Qwen3-VL-8B Thinking取得了MathVision、MMStar、HallusionBench、MM-MT-Bench、CountBench等23项权威基准测评的SOTA，超越Gemini 2.5 Flash Lite、GPT-5 Nano高版本以及其他同等级顶尖开源模型。Qwen3-VL-4B Thinking同样表现出“以小敌大”的成绩。