智东西9月5日消息,刚刚,大模型独角兽月之暗面的Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。
为了测试Kimi K2-0905的性能,智东西对比了其与Kimi K2-0711在生成个人网站上的表现。
提示词:开发一个美观的个人网站,使用Bootstrap作为前端框架,直接输出相关代码。
下图左上是Kimi K2-0711生成的结果、左下是Kimi K1.5的生成结果,右侧均为Kimi K2-0905的结果。
可以看出,网站整体的美观度以及整体风格的一致性相比前代模型都有了一定提升,且包含的信息更加完善。

▲左上为Kimi K2-0711生成、左下Kimi K1.5生成、中和右为Kimi K2-0905生成
Kimi K2首次发布是在7月11日,该模型总参数10000亿,激活参数320亿。2天前,月之暗面就公开了Kimi K2-0905的一些细节,其基于基础模型构建,增强了编程能力,仍不具备思考或视觉,但保留了颇受欢迎的Kimi K2-0711模型的个性和风格。
月之暗面的官宣文章中提到,目前,AI编程工具Cursor、Windsurf、Trae、Cline、RooCode、Kilo Code等已内置或接入了Kimi K2模型,国内外云服务厂商均部署了Kimi K2模型。

论文地址:
https://arxiv.org/abs/2507.20534
Hugging Face地址:
https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905
Kimi K2-0905具体能力提升主要有以下四点:
Agentic Coding能力提升,在公开基准测试和真实的编程任务中均展现出更好的性能;
前端编程体验升级:提升了前端代码的美观度和实用性;
扩展上下文长度:从128K升级到256K,为复杂长线任务提供更好的支持;
提供高速版API:支持高达60-100Token/s的输出速度。
在侧重考察真实软件工程任务的SWE-bench Verified等基准测试,新版Kimi K2模型的表现如下:

Kimi开放平台已上架kimi-k2-0905-preview模型API:
上下文升级到256K;Token Enforcer保证toolcall 100%格式正确;完全兼容Anthropic API、支持WebSearch Tool,提供更好的K2+Claude Code使用体验;支持全自动Context Caching,有助于节省Input Token;定价与之前的0711版相同;速度达60-100 Token/s的高速版API(kimi-k2-turbo-preview)已同步升级新模型。

第二个是在具体的图书馆场景中,智东西要求其开发一个简易的图书馆借阅管理系统。
提示词为:设计一个图书馆借阅系统的核心功能,需支持:①书籍入库(记录书籍ID、书名、作者、库存数量);②读者借阅(记录读者ID、借阅书籍ID、借阅日期,需判断书籍是否有库存);③读者还书(记录还书日期,需判断是否超期,假设借阅期限为30天,超期按1元/天计算罚款);④查询功能(按书名查询书籍库存,按读者ID查询未还书籍及是否超期)。
Kimi K2-0905生成的系统界面中,明确包含了书籍入库、读者借阅、读者还书、查询库存、查询未还书籍的模块。


