豆包大模型2.0正式发布,多模态与Agent能力全面对标国际顶尖水平

科技区角 2026-02-14 15:31

【科技纵览】2月14日,字节跳动正式推出豆包大模型2.0版本,标志着其大模型体系迈入以Agent为核心的新阶段。此次发布的系列包含Pro、Lite、Mini三款通用Agent模型及专用于编程场景的Code模型,整体架构围绕大规模生产环境的实际需求进行了系统性优化,重点强化了多模态理解、复杂指令执行以及长程任务处理等关键能力。

其中,豆包2.0 Pro定位于深度推理与长链路任务执行场景,官方明确表示其性能全面对标GPT 5.2与Gemini 3 Pro;2.0 Lite在兼顾性能与成本的前提下,综合能力已超越上一代主力模型豆包1.8;2.0 Mini则聚焦低时延、高并发及对成本高度敏感的应用环境;而Code版本(Doubao-Seed-2.0-Code)专为开发者设计,与AI编程工具TRAE协同使用效果更佳。

在多模态能力方面,豆包2.0实现了显著升级。其在视觉推理、感知能力、空间理解及长上下文处理等任务中均达到当前业界最高水平(SOTA)。尤其在TVBench与EgoTempo等动态场景评测中表现突出,后者得分甚至超过人类基准。此外,在长视频流式实时问答的多项基准测试中,该模型亦展现出优异的响应与理解能力。

在科学与逻辑推理领域,豆包2.0 Pro在SuperGPQA和HealthBench等权威评测中分数超越GPT 5.2,并于IMO国际数学奥林匹克、CMO中国数学奥林匹克及ICPC国际大学生程序设计竞赛相关测试中斩获金牌成绩,显示出强大的专业领域推理实力。尤为值得注意的是,尽管性能比肩国际顶尖模型,其推理成本却降低了约一个数量级。

目前,豆包2.0 Pro已上线豆包App、桌面客户端及网页端,用户切换至「专家」模式即可体验;Code模型则已集成至TRAE中国版。面向企业与开发者,火山引擎同步开放了豆包2.0全系列模型的API服务。这一系列举措不仅体现了字节跳动在大模型工程化落地上的成熟度,也预示着国产大模型正从“参数竞赛”转向“场景价值”驱动的新竞争维度。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
大模型
more
神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?
小米开源首代机器人VLA大模型Xiaomi-Robotics-0,突破具身智能推理延迟瓶颈
一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局
国产开源模型卷赢Gemini 3 Pro、GPT-5.2,最强多模态推理大模型易主?
全国首个!超3万卡国产AI算力上线,喂饱万亿参数大模型
豆包大模型2.0正式发布,多模态与Agent能力全面对标国际顶尖水平
月之暗面Kimi估值跃升至百亿美元,连续融资超12亿美元领跑大模型赛道
DeepSeek-OCR 2大模型开源,重塑文档AI的认知逻辑
Kimi K2.5正式开源,月之暗面推多模态全能大模型
大模型淘汰赛下半场,阶跃的底牌是什么?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号