阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用

量子位 2026-06-03 08:15
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

带多模态的Agent模型,真就了不起。

一句话,十几分钟,仿写一个网页版MacOS界面。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图1

每个应用都能点进去,终端输入命令还能返回结果我是最服气的。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图2

这就是阿里上新的Qwen-3.7 Plus,多模态交互式混合Agent。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图3

多模态能力加入Vibe Coding

Qwen3.7-Plus把视觉和语言能力放进同一个底座,同时保留代码、工具使用。这些智能体能力。

它能感知现实场景,读屏并操作 GUI,从视觉参考里写代码,端到端导航App,还能结合网页知识回答视觉问题。

以前很多模型擅长单点能力,看图归看图,写代码归写代码,浏览网页归浏览网页。

Qwen3.7-Plus 想把它们放进同一个循环。

这也是“Hybrid”(混合)的含义。

官方展示里,最突出的是一个长程App研发任务。

团队基于Qwen3.7 构建的Hybrid-Agent系统,连续稳定运行超过 11 小时,自动完成一个英语词汇学习App的完整研发周期。

覆盖需求文档生成、自动编码、安装部署、测试用例创建、GUI 自动化测试、多场景并行测试、产品文档更新,以及自主版本演进。

10000+行代码,1000+次Agent调用。

另一个桌面应用开发案例是复刻了原生macOS Stocks App。

智能体先和原生应用交互,理解UI布局和功能细节,再生成SwiftUI源码,接入真实行情API,自动编译并启动复刻应用。

它还做了10项功能验证,包括实时行情加载、股票选择和切换、多周期视图切换、搜索过滤、详细统计面板展示等。

这10项都通过了。

Qwen3.7-Plus的基准测试环境配置有详细披露:

Terminal Bench 2.0使用Harbor/Terminus-2 harness,5小时超时,12核CPU/24GB内存,温度1.0,最大token数80K,上下文256K,取5次运行均值,每轮开头预置一个think token让模型自行决定是否启动深度思考;

Kernel Bench L3每个测试样本在独立Docker容器中运行,配备一块H100 80GB GPU,限制500次工具调用,连续100轮无改进则提前停止,并使用GPT-5.4检测潜在的作弊行为。

结果如何?

代码任务,各家模型表现已经非常接近,只有长程代码任务还能拉开一点差距。

通用智能体任务,Qwen 3.7 Plus基本也在第一梯队。

到了多模态任务,就是Qwen 3.7 Plus的强项了。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图4

Qwen3.7-Plus提供API调用,支持文本和图像/视频混合输入,并提供“preserve_thinking”功能,

在多轮对话的消息中保留每一轮的思考内容,官方推荐在智能体任务中开启此功能。

模型兼容OpenAI规范的chat completions和responses API。

在跨框架泛化方面,Qwen3.7-Plus在Claude Code、OpenClaw、Qwen Code等不同Agent框架中均能稳定运行,无需为特定框架做适配。

不过还是有大量开发者希望能继续像Qwen之前的模型一样开放权重,在本地部署。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图5

— 欢迎AI产品从业者共建 


📚「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

阿里Qwen上新多模态旗舰!11小时自动研发App,狂写10000+行代码1000+次调用图6


一键关注 👇 点亮星标

科技前沿进展每日见

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
阿里
more
“我们不看阿里财报”
一季度“乐观”业绩背后,阿里、腾讯、京东各有各的痛 | 全球深一度
突发,阿里、DeepSeek大动作曝光,行业变天了
AI记忆顶咖与AI芯片大牛领衔!Agent最火的九个方向,阿里美团腾讯7月同台切磋
阿里ATH事业群推零代码AI开发平台Meoo,1分钟生成全栈应用
早报 | 美伊就资产解冻问题达成谅解;宇树科技IPO,6月1日上会;传阿里京东美团竞购朴朴超市;币安创始人赵长鹏否认失联
对话自变量CEO王潜:国内唯一被四家大厂投资的具身智能企业,小米、字节、阿里、美团看中了什么?
阿里押注,一年融资12亿,诺瓦聚变创始人说商业化到了最后100米丨36氪专访
从龙虾热到 QoderWake,阿里给 AI 发了一张工牌
算力不再唯一,阿里平头哥以“网力”破局AI集群效率瓶颈
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号