【科技纵览】2月14日,字节跳动正式推出豆包大模型2.0版本,标志着其大模型体系迈入以Agent为核心的新阶段。此次发布的系列包含Pro、Lite、Mini三款通用Agent模型及专用于编程场景的Code模型,整体架构围绕大规模生产环境的实际需求进行了系统性优化,重点强化了多模态理解、复杂指令执行以及长程任务处理等关键能力。
其中,豆包2.0 Pro定位于深度推理与长链路任务执行场景,官方明确表示其性能全面对标GPT 5.2与Gemini 3 Pro;2.0 Lite在兼顾性能与成本的前提下,综合能力已超越上一代主力模型豆包1.8;2.0 Mini则聚焦低时延、高并发及对成本高度敏感的应用环境;而Code版本(Doubao-Seed-2.0-Code)专为开发者设计,与AI编程工具TRAE协同使用效果更佳。
在多模态能力方面,豆包2.0实现了显著升级。其在视觉推理、感知能力、空间理解及长上下文处理等任务中均达到当前业界最高水平(SOTA)。尤其在TVBench与EgoTempo等动态场景评测中表现突出,后者得分甚至超过人类基准。此外,在长视频流式实时问答的多项基准测试中,该模型亦展现出优异的响应与理解能力。
在科学与逻辑推理领域,豆包2.0 Pro在SuperGPQA和HealthBench等权威评测中分数超越GPT 5.2,并于IMO国际数学奥林匹克、CMO中国数学奥林匹克及ICPC国际大学生程序设计竞赛相关测试中斩获金牌成绩,显示出强大的专业领域推理实力。尤为值得注意的是,尽管性能比肩国际顶尖模型,其推理成本却降低了约一个数量级。
目前,豆包2.0 Pro已上线豆包App、桌面客户端及网页端,用户切换至「专家」模式即可体验;Code模型则已集成至TRAE中国版。面向企业与开发者,火山引擎同步开放了豆包2.0全系列模型的API服务。这一系列举措不仅体现了字节跳动在大模型工程化落地上的成熟度,也预示着国产大模型正从“参数竞赛”转向“场景价值”驱动的新竞争维度。
豆包大模型2.0正式发布,多模态与Agent能力全面对标国际顶尖水平
科技区角
2026-02-14 15:31
声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。