Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

量子位 2025-07-22 12:35

闻乐发自凹非寺
量子位 | 公众号 QbitAI

开源大模型正在进入中国时间。

Kimi K2风头正盛，然而不到一周，Qwen3就迎来最新升级，235B总参数量仅占Kimi K2 1T规模的四分之一。

基准测试性能上却超越了Kimi K2。

Qwen官方还宣布不再使用混合思维模式，而是分别训练Instruct和Thinking模型。

所以，此次发布的新模型仅支持非思考模式，现在网页版已经可以上线使用了，但通义APP还未见更新。

Qwen官方还透露：这次只是一个小更新！大招很快就来了！

但总归就是，再见Qwen3-235B-A22B，你好Qwen3-235B-A22B-2507了。

By the way，这个名字怎么取得越来越复杂了。

先来看看这次的“小更新”都有哪些～

增强了对256K长上下文的理解能力

新模型是一款因果语言模型，采用MoE架构，总参数量达235B，其中非嵌入参数为234B，推理时激活参数为22B。

在官方介绍中显示，模型共包含94层，采用分组查询注意力（GQA）机制，配备64个查询头和4个键值头，并设置128个专家，每次推理时激活8个专家。

该模型原生支持262144的上下文长度。

这次改进主要有以下几个方面：

显著提升了通用能力，包括指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用。
大幅增加了多语言长尾知识的覆盖范围。
更好地符合用户在主观和开放式任务中的偏好，能够提供更有帮助的响应和更高质量的文本生成。
增强了对256K长上下文的理解能力。

在官方发布的基准测试中可以看到，相较于上一版本，新模型在AIME25上准确率从24.7%上升到70.3%，表现出良好的数学推理能力。

而且对比Kimi K2、DeepSeek-V3，Qwen3新模型的能力也都略胜一筹。

为了提高使用体验，官方还推荐了最佳设置：

Qwen3新版本深夜发布就立刻收获了一众好评：Qwen在中等规模的语言模型中已经领先。

也有网友感慨Qwen在开启新的架构范式：

One More Thing

有趣的是，就在Qwen3新模型发布的前两天，NVIDIA也宣称发布了新的SOTA开源模型OpenReasoning-Nemotron。

该模型提供四个规模：1.5B、7B、14B和32B，并且可以实现100%本地运行。

但实际上，这只是基于Qwen-2.5在Deepseek R1数据上微调的模型。

而现在Qwen3已经更新，大招已经被预告。

随着Llama转向闭源的消息传出，OpenAI迟迟不见Open，开源基础大模型的竞争，现在正在进入中国时间。

DeepSeek丢了王座，Kimi K2补上，Kimi K2坐稳没几天，Qwen的挑战就来了。

体验链接：https://chat.qwen.ai/

参考链接：
[1]https://x.com/Alibaba_Qwen/status/1947344511988076547
[2]https://x.com/giffmana/status/1947362393983529005

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

专属AI产品从业者的实名社群，只聊AI产品最落地的真问题

扫码添加小助手，发送「姓名+公司+职位」申请入群～

进群后，你将直接获得：

👉 最新最专业的AI产品信息及分析 🔍

👉 不定期发放的热门产品内测码 🔥

👉 内部专属内容与专业讨论 👂

🌟 点亮星标 🌟

科技前沿进展每日见

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

开源

more

Kimi K2 不仅抢了开源第一，还抢了自家论文署名：我「夸」我自己

APPSO 3天前

Kimi K2 不仅抢了开源第一，还抢了自家论文署名：我「夸」我自己

微妙情绪精准拿捏！DiT新框架FantasyPortrait首破多角色动画难题，开源数据集引爆行业！

AI生成未来 2天前

微妙情绪精准拿捏！DiT新框架FantasyPortrait首破多角色动画难题，开源数据集引爆行业！

iOS 26爆料人遭苹果起诉/Kimi超DeepSeek ，拿下全球开源第一/美团饿了么京东被约谈

APPSO 6天前

iOS 26爆料人遭苹果起诉/Kimi超DeepSeek ，拿下全球开源第一/美团饿了么京东被约谈

开源+AI，这个机器人众筹项目为什么火？

电子工程世界 1周前

开源+AI，这个机器人众筹项目为什么火？

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

新智元 5天前

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

Tenstorrent带来开源芯粒架构OCA，RISC-V将让AI“民主化”？

电子技术设计 4天前

Tenstorrent带来开源芯粒架构OCA，RISC-V将让AI“民主化”？

小模型逆袭！复旦&创智邱锡鹏团队造出「世界感知」具身智能体，代码数据完全开源！

具身智能之心 1周前

小模型逆袭！复旦&创智邱锡鹏团队造出「世界感知」具身智能体，代码数据完全开源！

清华RAL'25开源 | VR-Robo：通过3DGS实现机器人视觉运动与导航！

3D视觉工坊 2天前

清华RAL'25开源 | VR-Robo：通过3DGS实现机器人视觉运动与导航！

DeepSeek终于丢了开源第一王座，但继任者依然来自中国

量子位 1周前

DeepSeek终于丢了开源第一王座，但继任者依然来自中国

官方回应北京网约车平台禁燃油车；阿里开源 AI 编程模型 Qwen3-Coder；《阿凡达3》首张宣传海报公布 | 极客早知道

极客公园 2天前

官方回应北京网约车平台禁燃油车；阿里开源 AI 编程模型 Qwen3-Coder；《阿凡达3》首张宣传海报公布 | 极客早知道

Copyright © 2025 成都科技区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号