阿里开源首个闭源级网页智能体,代码权重全开放,性能媲美SOTA

智能情报所 2025-09-22 17:01

通义 DeepResearch 的问世意义非凡,它是首个完全开源、并公开宣称性能可与顶级闭源系统相媲美的深度研究网页智能体。

资讯配图

它不仅基于宽松的许可证发布,还提供了完整的、可复现的代码和模型权重。对于需要可验证工作流和本地化部署的团队来说,这彻底扭转了局面。

过去封闭的演示不同,它将整个研究闭环(数据处理、模型训练、效果评估到最终推理)完整记录并开放,使其能被合法地应用在商业产品中。

重新定义智能体新标准

此次发布,实质上是拔高了实用级智能体的技术门槛。一个强大的智能体应具备稳健的长时程网页浏览能力、高效的测试时扩展技术,以及一个由强化学习精细调教的决策策略,而不是一堆脆弱的提示词拼凑物。

资讯配图

该项目来自阿里巴巴通义实验室,与通义千问系列模型同源。它采用了混合专家架构,总参数量为 305 亿,但每个 token 仅激活约 33 亿参数。

这种设计使其在拥有庞大专家库支撑强大推理能力的同时,实现了小模型的运行效率。它的上下文长度达到 128k,并且所有代码和权重都在 Apache-2.0 许可下开放。

技术揭秘:从架构到训练的完整革新

技术上,该项目的最大亮点是其全自动化的合成数据飞轮系统。该系统贯穿了持续预训练、监督微调,以及严格的同策略on‑policy强化学习,形成了一个自我强化的闭环。

为了确保在动态变化的网络环境中训练的稳定性,团队采用了一种名为“组相对策略优化”的变体算法,并结合了自动化的负样本过滤机制。

资讯配图

其推理过程支持两种模式:一种是用于检验核心能力的标准路径,另一种是引入了迭代式规划以冲击性能上限的重度模式。这一整套工程设计是其核心贡献。

超越基准:迈向可信的商业应用

在多个权威的智能体浏览任务基准测试中,通义 DeepResearch 都取得了顶尖或持平的成绩,系统性地超越了现有同赛道的专有及开源智能体。

除了跑分,它的设计哲学更强调「综合与重构」。智能体在每一轮浏览后,都会先将关键信息提炼到一个简洁的工作区和一份动态更新的核心报告中,再决定下一步行动

这种严谨的特性,使其能胜任复杂的现实任务。例如,在高德地图中执行多步旅行规划,或作为法律研究助手,确保所有结论都有可验证的引文支撑,这考验的正是工具编排与信息源的可靠性。

资讯配图
资讯配图

这次发布最重要的意义在于,它为业界提供了一套完整、开放、可复现的长时程智能体开发方案,企业可以对其审查、修改和加固,而不必再依赖于封闭的 API。

简而言之,通义 DeepResearch 不仅重塑了外界对一个顶尖开源智能体的认知,更关键的是,它为开发者和研究者提供了可以立即上手使用、评测并集成到产品中的强大工具

参考资料:https://tongyi-agent.github.io/zh/blog/introducing-tongyi-deep-research/

https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

https://github.com/Alibaba-NLP/DeepResearch

https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B


一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
首个代码世界模型引爆AI圈,能让智能体学会「真推理」,Meta开源
ICCV'25 Highlight 开源 | 即插即用!面向高斯和点云的可泛化显示连续表面重建!
大毛拆了一台前所未见的二毛无人机:树莓派+开源飞控+玄云SW400pro涡喷发动机
3天1.3k stars!Meta & CMU重磅开源MapAnything:统一12种3D重建任务!
Wan2.2-Animate-14B开源!地表最强开源角色动画模型媲美商用: 表情动作1:1完美复制!
京东AI一揽子开源!超多核心项目全开源,GitHub万star项目也有新进展了
【AI】重磅!ThinkingMachines开山之作:大模型输出随机的根本原因被揪出,并开源终结方案
马斯克辟谣“万台人形订单”;Figure再融超10亿美元;宇树官宣开源
快讯|西门子医疗与史赛克合作开发手术机器人;OpenMind 发布智能机器人开源操作系统;挪威ADAR 传感器公司开启全球扩张
NeurIPS 2025 | 面向具身场景的生成式渲染器TC-Light来了,代码已开源
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号