豆包大模型2.0正式发布，多模态与Agent能力全面对标国际顶尖水平

【科技纵览】2月14日，字节跳动正式推出豆包大模型2.0版本，标志着其大模型体系迈入以Agent为核心的新阶段。此次发布的系列包含Pro、Lite、Mini三款通用Agent模型及专用于编程场景的Code模型，整体架构围绕大规模生产环境的实际需求进行了系统性优化，重点强化了多模态理解、复杂指令执行以及长程任务处理等关键能力。

其中，豆包2.0 Pro定位于深度推理与长链路任务执行场景，官方明确表示其性能全面对标GPT 5.2与Gemini 3 Pro；2.0 Lite在兼顾性能与成本的前提下，综合能力已超越上一代主力模型豆包1.8；2.0 Mini则聚焦低时延、高并发及对成本高度敏感的应用环境；而Code版本（Doubao-Seed-2.0-Code）专为开发者设计，与AI编程工具TRAE协同使用效果更佳。

在多模态能力方面，豆包2.0实现了显著升级。其在视觉推理、感知能力、空间理解及长上下文处理等任务中均达到当前业界最高水平（SOTA）。尤其在TVBench与EgoTempo等动态场景评测中表现突出，后者得分甚至超过人类基准。此外，在长视频流式实时问答的多项基准测试中，该模型亦展现出优异的响应与理解能力。

在科学与逻辑推理领域，豆包2.0 Pro在SuperGPQA和HealthBench等权威评测中分数超越GPT 5.2，并于IMO国际数学奥林匹克、CMO中国数学奥林匹克及ICPC国际大学生程序设计竞赛相关测试中斩获金牌成绩，显示出强大的专业领域推理实力。尤为值得注意的是，尽管性能比肩国际顶尖模型，其推理成本却降低了约一个数量级。

目前，豆包2.0 Pro已上线豆包App、桌面客户端及网页端，用户切换至「专家」模式即可体验；Code模型则已集成至TRAE中国版。面向企业与开发者，火山引擎同步开放了豆包2.0全系列模型的API服务。这一系列举措不仅体现了字节跳动在大模型工程化落地上的成熟度，也预示着国产大模型正从“参数竞赛”转向“场景价值”驱动的新竞争维度。