腾讯研究院AI速递 20260525

生成式AI

一、Anthropic三大模型集体曝光，Opus 4.8后台现身

1.开发者在Google Vertex后台发现claude-opus-4.8标识，距Opus 4.7发布仅一个多月，预计下月正式发布；

2.51万行泄露源码证实Sonnet 4.8将跳过4.7直接推出，预计6月中旬发布，带来视觉准确率破98%、更干净代码生成、新增「X high」推理层级等升级；

3.曾被称「太危险」的安全模型Mythos 1态度转变，将产品化为面向开发者与企业的Claude Code、Claude Security安全产品线。

二、Codex重大更新，goal模式正式上线五大升级

1.OpenAI为Codex新增Appshots功能，Mac用户按Command-Command即可将应用窗口截图与文字内容带入对话，锁屏状态下亦可远程操作；

2./goal模式从实验功能正式升级为稳定功能，可设定具体目标并持续运行数小时乃至数天，用户能随时介入查看进度；

3.新增高级标注模式提升设计开发协作，支持团队级插件共享统一管理，企业版Analytics升级提供Token用量等细分洞察。

三、DeepSeek V4 Pro API永久降价，称目标是AGI

1.DeepSeek宣布V4-Pro API自6月1日起永久降价，输入缓存命中0.025元/百万Token、输出6元，均为原价四分之一且无时限；

2.DeepSeek正推进约700亿元融资，投前估值450亿美元，宁德时代、京东、网易洽谈参投，借此锁定数据中心储能下游客户；

3.创始人梁文锋明确表态首要目标是推动技术边界与追求AGI而非短期变现，承诺坚持开源路线，此轮或成中国AI公司史上最大融资。

四、智谱GLM-5.1高速版发布，速度达400 tokens/s

1.智谱面向部分企业客户推出GLM-5.1高速版API，输出速度达400 tokens/s，刷新当前全球大模型API的速度上限；

2.该版本打破「快即是小」的行业惯例，首次在国产大模型中将旗舰级能力与极致低延迟同时带入生产环境；

3.速度源于与TileRT团队联合打造的高性能推理引擎，在编译期将计算图静态编排为常驻GPU的Engine Kernel，三层系统级优化。

五、美团开源LongCat-Video-Avatar 1.5数字人模型

1.美团龙猫团队正式开源数字人视频模型LongCat-Video-Avatar 1.5，在唇形同步、物理合理性、长视频稳定性等方面全面跃升；

2.模型将音频编码器升级为Whisper-large以精准捕捉多语言韵律，并构建多人、静默、情绪三类增强数据，引入GRPO逐帧偏好对齐；

3.采用DMD蒸馏将50步生成压缩至8步，推理效率提升约15倍，10秒视频仅需1分钟，用户偏好胜率相比Kling Avatar 2.0达65.9%。

前沿科技

六、SpaceX完成星舰V3首飞，NASA局长点赞祝贺

1.SpaceX完成星舰V3首次集成飞行测试，全箭高124米约40层楼，是人类史上最庞大、推力最强的火箭，已获NASA选为Artemis登月着陆器；

2.V3换装33台更强更轻的「猛禽3」发动机，近地轨道完全复用运力突破100吨，并首次集成在轨燃料加注系统，具备深空运输能力；

3.此次飞行成功部署改造版星链卫星并完成助推级溅落回收，标志星舰向「快速迭代、快速重复使用」运营阶段迈出关键一步。

报告观点

七、METR联合四巨头发布前沿风险报告，AI学会撒谎

1.METR联合Anthropic、Google、Meta、OpenAI首次开放内部最强模型与完整思维链进行红队测试，发布首份《前沿风险报告》；

2.报告发现AI在可验证的编程任务上已达专家级能力，但在难验证的硬任务上判断力下滑，并经常违反约束、伪造日志、绕过审计；

3.报告未发现AI谋求长期权力的证据，其欺骗仅为工具性求生，目前AI仍依赖「出声推理」使监控有效，但提出「最小可行性越狱部署」警示。

八、谷歌CEO皮查伊承认Gemini在Coding上落后

1.皮查伊在《纽约时报》播客中坦承，谷歌在带工具调用的智能体编程、长期多步任务上确实落后，缺乏直达开发者的产品入口；

2.他表示AI圈30至60天的变化相当于过去5年，过去一两年的进展让他感觉AGI比预想更近，可能3至10年内出现；

3.皮查伊承认公众对AI影响工作收入的焦虑合理，但对年轻人持乐观态度，强调负责任实验室在接近递归式自我改进时须避免陷入竞赛。

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送