月之暗面开源Kimi K2.6,代码与Agent能力全面对标国际顶尖模型

科技区角 2026-04-21 09:02

【区角快讯】2026年4月21日,月之暗面正式推出并开源其最新大模型Kimi K2.6,该版本在代码生成、长程任务处理及多智能体(Agent)协同等方面实现系统性升级。目前,用户已可通过Kimi官网、移动端最新应用、Kimi API接口以及Kimi Code编程助手访问该模型。



在多个权威评测基准中,Kimi K2.6展现出领先行业的综合性能。其在博士级难度的“人类最后的考试”(Humanity's Last Exam)、聚焦真实软件工程场景的SWE-Bench Pro,以及衡量Agent深度检索能力的DeepSearchQA测试中,成绩均达到或超过GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等主流闭源模型。

作为Kimi系列迄今最强的代码专用模型,K2.6显著增强了长时间连续编码能力。实测表明,该模型可稳定运行13小时不间断,单次任务编写或修改代码超4000行,足以支撑复杂系统的开发与重构。此外,通过深度融合视觉理解与编程能力,K2.6能够独立产出具备专业设计感的Web应用。

在内部代码评估体系Kimi Code Bench中,K2.6相较前代K2.5版本性能提升约20%。其泛化能力亦获验证:在Mac设备上本地部署Qwen3.5-0.8B模型时,借助小众语言Zig优化推理流程,历经12小时、4000余次工具调用后,吞吐量由15 tokens/s跃升至193 tokens/s,推理效率较LM Studio高出约20%。

Agent协同方面,K2.6支持调度具备不同专长的智能体组合,整合搜索、深度研究、文档解析与长文本生成等能力,显著提升复杂任务完成质量。其升级后的集群架构最多可并行运行300个子Agent,执行约4000个协作步骤,实现从原始文档到网页、PPT及表格的端到端多模态产物交付。

当前大模型竞争已从单一性能指标转向工程落地与系统协同能力的综合较量,Kimi K2.6的开源标志着国产模型在高复杂度任务自动化领域迈入新阶段。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
全球首个开源RISC-V架构符合性测试工具发布,亦测ACT引领生态高质量发展
开源巨头,中国研发团队被一锅端了
美团开源“语音克隆”模型,1B/3.5B双选,超自然复刻你的声音
国芯科技获批建设“RISC-V开源芯片先进技术研究院”,剑指自主芯生态主战场
全球OCR新王来自中国开源!GitHub狂揽73300+Star
黄仁勋率先开源量子AI大模型
谷歌开源Gemma 4,干掉了13倍体量的Qwen3.5
AI“复活”张雪峰引法律与伦理争议,开源项目“张雪峰.skill”登上GitHub热搜
浙大开源ClawGUI,打通GUI智能体训练、评估与部署全链路
大厂数据护城河打破!上交全开源Search Agent OpenSeeker登场
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号