升级版Qwen3开源模型深夜来袭,超越Kimi-K2、DeepSeek-V3

大模型之心Tech 2025-07-22 10:28

作者 | 量子位 编辑 | 大模型之心Tech

点击下方卡片,关注“大模型之心Tech”公众号

戳我-> 领取大模型巨卷干货

本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询。更多大模型技术、行业咨询、求职交流,欢迎加入大模型之心Tech技术交流群!

深夜,开源模型 Qwen3 又更新升级了!阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。

链接:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

据介绍,新的 Qwen3 模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

公开测评得分显示,Qwen3-235B-A22B-Instruct-2507-FP8 在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,甚至了超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。

此外,本次更新的 Qwen3 模型,还增强了以下关键性能:

1、在多语言的长尾知识覆盖方面,模型取得显著进步。

2、在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。

3、长文本提升到 256K,上下文理解能力进一步增强。

目前,该模型已经在海外引起了开发者社区热议与讨论。

新 Qwen3 模型已在魔搭社区和 HuggingFace 上开源更新,欢迎开发者们体验。

大模型之心Tech知识星球交流社区

我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。 

星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo、大模型预训练后训练知识蒸馏量化推理模型MoE强化学习RAG提示工程等多个版块)、科研/办公助手AI创作工具/产品测评、升学&求职&岗位推荐,等等。

星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
人事变动:周锋调任东风汽车集团副总经理/党委常委;填补空白,人形机器人“天工”的运动控制框架开源;复旦大学推出革命性AI工具
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
车载AI机器人爆火,开源方案仅需100元?
遇复杂地形也能如履平地 机器人半马冠军“天工”运动控制框架开源
使智能体情商爆表直追GPT-4o!腾讯混元开源RLVER框架,融合RL与可验证情感奖励
vivo自研蓝河操作系统内核开源!Rust开发新机遇来了
最强开源易主!阿里Qwen3重磅发布,数学碾压GPT-4o,想能超越Kimi-K2,直逼Claude 4,全球性能榜单再次被刷新
碾压GPT4.1!阿里最强AI编程模型登顶全球开源模型榜首
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66
“AI大神”李沐终于开源新模型,爆肝6个月,上线迅速斩获3.6k stars!
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号