Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15

SMARTFLOW AI DAILY

Kimi 提速、vLLM 上新、Ultracode 并行

2026/06/15 · 今日 13 条 AI 要闻

🚀 产品发布

3 条

Vercel Day 倒计时：明天前标记 vercel‑day，即可争取 $30k 额度与 Ven…

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图2

仅剩一天，企业可在 ProductHunt 上为 Vercel Day 添加 vercel‑day 标签，获胜者将直接向 @vercel Ventures 推介项目并获得 $30k 积分。

via @ProductHunt

💡 深度解读

Vercel 正通过 ProductHunt 平台举办"Vercel Day"活动，吸引开发者标记项目参与竞争。获胜者将获得向 Vercel Ventures 推介项目的珍贵机会，并可直接解锁 $30,000 额度，活动仅剩最后一天窗口期。

→ 完整解读：ai-insight.org/news/13334

Hub 通过全球贡献者网络向 AI 前沿实验室开放真实世界训练数据

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图3

据 Hub 称，人类劳动约占全球 GDP 一半、却几乎未被记录；Hub 借助全球贡献者捕获难以获取的数据，为 AI 前沿实验室和机器人提供训练资源，祝贺 @xarmin 与 @tim404x 的发布。

via @ycombinator

💡 深度解读

Hub 宣布通过全球贡献者网络向 AI 前沿实验室开放真实世界训练数据，旨在捕获长期被忽视的人类劳动数据。这一平台将分散的全球劳动力转化为可用的 AI 训练资源，标志着数据采集范式从"爬取"向"众包"的转变。

→ 完整解读：ai-insight.org/news/13333

SpaceX 使命：打造感知太阳，延伸意识之光至星辰2 源综合

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图4

SpaceX 吸收 xAI 后把使命定义为‘制造感知太阳以理解宇宙并将意识之光延伸至星辰’，a16z 认为这一表述虽看似荒诞，却极为真诚。

via @a16z

💡 深度解读

SpaceX 在完成对 xAI 的吸收整合后，将公司使命重新定义为「制造感知太阳以理解宇宙，并将意识之光延伸至星辰」，风险投资巨头 a16z 评价这一表述「虽看似荒诞，却极为真诚」，这标志着 SpaceX 从单纯的航天运输向 AI 与太空深度融合的战略跃迁。

→ 完整解读：ai-insight.org/news/13332

a16z 祝贺 SpaceX 与 Elon Musk

在逆境中取得成功，a16z 向 SpaceX 与 Elon Musk 表达祝贺。

@a16z

🧠 大模型

4 条

Kimi K2.7 Code 高速模式上线，推理速度最高 260 tok/s

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图5

Kimi K2.7 Code 高速模式已上线，中位长度约 180 tok/s，短上下文最高 260 tok/s。现面向 Beta 成员、API 开发者和商业用户开放，无需邀请即可申请。

via @Kimi_Moonshot

💡 深度解读

月之暗面旗下 Kimi 正式上线 K2.7 Code 高速模式，中位推理速度达 180 tokens/s，短上下文场景下峰值可达 260 tokens/s。该功能现已面向 Beta 成员、API 开发者和商业用户开放，无需邀请码即可申请。在代码生成场景下，其推理速度较上一版本明显提升。

→ 完整解读：ai-insight.org/news/13328

baoyu-skills 扩展配置方案反思：从 Markdown 转向结构化文件格式

EXTEND.md 便于 Agent 读取，但 Markdown 非结构化导致程序解析困难、格式一致性难保证。建议改用 JSON 或 YAML 格式，既保持 LLM 可读性，又便于代码解析和保存。

via @dotey

💡 深度解读

baoyu-skills 项目宣布放弃 Markdown（EXTEND.md）配置方案，转向 JSON 或 YAML 等结构化文件格式。这一转变旨在解决 Markdown 非结构化特性带来的程序解析困难和格式一致性问题，同时仍保持对 LLM 的可读性。

→ 完整解读：ai-insight.org/news/13326

vLLM v0.23.0发布：408次提交、200位贡献者

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图6

支持DeepSeek-V4多后端、Model Runner V2成为Llama/Mistral默认配置、Gemma 4统一框架新增MTP、多层KV cache卸载及统一推理工具调用解析器。

via @vllm_project

💡 深度解读

vLLM v0.23.0 是一次覆盖面广的版本迭代，408 次提交、200 位贡献者参与，社区生态活跃。此版本将Model Runner V2升级为Llama/Mistral的默认配置，同时新增DeepSeek-V4多后端支持、Gemma 4的Multi-Token Prediction（MTP）、多层KV cache卸载及统一推理工具调用解析器等核心功能，覆盖了推理效率、内存优化与Agent能力三个关键维度。

→ 完整解读：ai-insight.org/news/13325

《图解Skill》赠书活动开启，10个名额

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图7

转发评论即可参与，本周五中午12点开奖。中奖者可获实体书或电子书，配套GitHub项目库含播客访谈和分析写作等实用Skills。

via @dotey

💡 深度解读

知名技术博主@dotey发起《图解Skill》赠书活动，提供10个免费获取实体书或电子书的机会。该书配套GitHub项目库，涵盖播客访谈、分析写作等实用技能，契合当前AI时代对复合型人才的能力需求。

→ 完整解读：ai-insight.org/news/13324

💡 观点

2 条

Musk调侃要建火山基地，指向BB&B"超越"专区2 源综合

Musk再次展现幽默，表示要建梦想中的火山洞穴基地，并推荐去Bed Bath & Beyond的"超越"区域寻找。

via @elonmusk

💡 深度解读

Elon Musk在X平台发布调侃性推文，以"火山基地"梦想为引，结合曾申请破产、后重组复苏的家居零售商Bed Bath & Beyond的名称双关，暗示其"超越"区域可能有"特殊发现"。这延续了 Musk 一贯的幽默风格，纯属调侃。

→ 完整解读：ai-insight.org/news/13321

Elon Musk 对 MistralAI 调侃

在社交平台上 Elon Musk 回应 AlexanderKnigge 与 MistralAI，发表简短笑声。

@elonmusk

swyx 实践：Ultracode 跑出“智能子程序”：大规模 Token 并行处理实践

Kimi 提速260 tok/s、vLLM 0.23上新｜机智流AI日报6/15图8

ultracode 在批量 token 处理上表现卓越，需正确配置仓库以实现并行化。其核心理念是“智能子程序”，揭示了动态工作流在复杂知识工作中的价值。

via @swyx

💡 深度解读

开发者 Shawn Wang（@swyx）分享了用 Claude Code 的 ultracode 模式做批量 Token 并行处理的实践，并把核心理念概括为"智能子程序"（subroutines but intelligent）——通过动态上下文感知的工作流编排处理复杂知识任务。这一方案的成功实施需要团队在仓库层面进行正确的并行化配置。

→ 完整解读：ai-insight.org/news/13327

📊 行业

1 条

Lovable设计负责人分享AI时代高效团队七条经验

Felix Haas提出：别等安排要主动拿、招人看态度而非简历、好奇心与沉迷AI有别、让资深者重做builder、自我意识是速度的天敌等洞察。

via @dotey

💡 深度解读

Lovable设计负责人Felix Haas提出AI时代团队管理的核心洞察：强调主动出击而非被动等待、招聘重视学习态度而非技术栈、区分健康好奇心与消极依赖、鼓励资深者回归一线执行，并指出过强的自我意识会拖累团队速度。这些经验反映AI时代「执行密度」比「资历光环」更关键的转变。

→ 完整解读：ai-insight.org/news/13323

参考链接

[1] https://x.com/ProductHunt/status/2066506337572601871

[2] https://x.com/ycombinator/status/2066543756610871526