千问3.5-Max-Preview亮相LM Arena,阿里登顶中国大模型榜首

科技区角 2026-03-20 10:31

【科技纵览】3月20日,IT之家报道,阿里巴巴旗下通义千问大模型家族迎来新成员——Qwen3.5-Max-Preview。该模型作为千问3.5系列的旗舰预览版,当日正式登陆国际权威评测平台LM Arena,并斩获1464分的综合得分。



凭借这一成绩,阿里千问在全球大模型公司排行榜中跃升至第五位,稳居中国厂商首位。据阿里云介绍,LM Arena由国际开源研究机构LMSYS运营,采用两两匿名对战机制,由全球开发者进行盲测投票,再依据胜负关系生成模型评分与排名。因其融合开放式对战与人工评估,该榜单被业界广泛视为当前最具参考价值的大模型性能衡量标准之一。

在本次评测中,Qwen3.5-Max-Preview于“无风格控制”(without style control)条件下的绝对胜率比拼中,整体表现位列全球第六。细分能力方面,其数学推理能力排名全球第五,专家级文本处理能力则位居第十。值得注意的是,这是千问3.5系列首次以旗舰级身份参与国际第三方评测。

IT之家观察到,自2026年除夕起,阿里已陆续开源Qwen3.5系列共8款模型,参数规模覆盖从0.8B至397B。各尺寸版本均在其对应量级中展现出领先性能。其中,Qwen3.5-Plus采用总参数3970亿、激活参数仅170亿的稀疏架构,在激活计算资源更少的前提下,性能超越部分参数总量更大的竞品模型。

此次发布的Qwen3.5-Max-Preview为预览版本,阿里表示将依据社区反馈持续优化迭代。这一系列动作不仅凸显阿里在大模型效率与性能平衡上的技术积累,也反映出中国AI企业正加速通过开源生态构建全球影响力。在国际评测体系中稳步攀升的排名,或将成为国产大模型从“可用”迈向“可信”的关键转折点。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR 大模型 阿里
more
春晚机器人再次刷屏海外!联手清华用5小时学会打网球,马斯克点赞Karpathy直呼是AI
李开复陆奇重仓同一家Harness智能体公司,李笛带队,4个月2轮融资3-5年粮草
「微滔生物」A轮次融资超5000万美元,LNP路线体内CAR-T已发表初步人体数据丨早起看早期
Archer eVTOL电力推进系统转子平衡技术的核心创新解析
印度AI新锐Sarvam冲刺独角兽轮融资,英伟达亚马逊拟参投
突破HARC刻蚀的物理极限
「作弊」内幕曝光!3DMark回应将某知名国产手机除名;李想朋友圈炮轰东风日产恶意拉踩,后者高管回应;美的空调又发行业首创产品
Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri
Harness项目推荐丨CLI-Anything 、CrewAI、LangGraph、EigenFlux....
电动卡车初创企业Harbinger拓展新业务,携手Frazer打造混合动力救护车
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号