生成式AI
一、Anthropic三大模型集体曝光,Opus 4.8后台现身
1.开发者在Google Vertex后台发现claude-opus-4.8标识,距Opus 4.7发布仅一个多月,预计下月正式发布;
2.51万行泄露源码证实Sonnet 4.8将跳过4.7直接推出,预计6月中旬发布,带来视觉准确率破98%、更干净代码生成、新增「X high」推理层级等升级;
3.曾被称「太危险」的安全模型Mythos 1态度转变,将产品化为面向开发者与企业的Claude Code、Claude Security安全产品线。
二、Codex重大更新,goal模式正式上线五大升级
1.OpenAI为Codex新增Appshots功能,Mac用户按Command-Command即可将应用窗口截图与文字内容带入对话,锁屏状态下亦可远程操作;
2./goal模式从实验功能正式升级为稳定功能,可设定具体目标并持续运行数小时乃至数天,用户能随时介入查看进度;
3.新增高级标注模式提升设计开发协作,支持团队级插件共享统一管理,企业版Analytics升级提供Token用量等细分洞察。
三、DeepSeek V4 Pro API永久降价,称目标是AGI
1.DeepSeek宣布V4-Pro API自6月1日起永久降价,输入缓存命中0.025元/百万Token、输出6元,均为原价四分之一且无时限;
2.DeepSeek正推进约700亿元融资,投前估值450亿美元,宁德时代、京东、网易洽谈参投,借此锁定数据中心储能下游客户;
3.创始人梁文锋明确表态首要目标是推动技术边界与追求AGI而非短期变现,承诺坚持开源路线,此轮或成中国AI公司史上最大融资。
四、智谱GLM-5.1高速版发布,速度达400 tokens/s
1.智谱面向部分企业客户推出GLM-5.1高速版API,输出速度达400 tokens/s,刷新当前全球大模型API的速度上限;
2.该版本打破「快即是小」的行业惯例,首次在国产大模型中将旗舰级能力与极致低延迟同时带入生产环境;
3.速度源于与TileRT团队联合打造的高性能推理引擎,在编译期将计算图静态编排为常驻GPU的Engine Kernel,三层系统级优化。
五、美团开源LongCat-Video-Avatar 1.5数字人模型
1.美团龙猫团队正式开源数字人视频模型LongCat-Video-Avatar 1.5,在唇形同步、物理合理性、长视频稳定性等方面全面跃升;
2.模型将音频编码器升级为Whisper-large以精准捕捉多语言韵律,并构建多人、静默、情绪三类增强数据,引入GRPO逐帧偏好对齐;
3.采用DMD蒸馏将50步生成压缩至8步,推理效率提升约15倍,10秒视频仅需1分钟,用户偏好胜率相比Kling Avatar 2.0达65.9%。
前沿科技
六、SpaceX完成星舰V3首飞,NASA局长点赞祝贺
1.SpaceX完成星舰V3首次集成飞行测试,全箭高124米约40层楼,是人类史上最庞大、推力最强的火箭,已获NASA选为Artemis登月着陆器;
2.V3换装33台更强更轻的「猛禽3」发动机,近地轨道完全复用运力突破100吨,并首次集成在轨燃料加注系统,具备深空运输能力;
3.此次飞行成功部署改造版星链卫星并完成助推级溅落回收,标志星舰向「快速迭代、快速重复使用」运营阶段迈出关键一步。
报告观点
七、METR联合四巨头发布前沿风险报告,AI学会撒谎
1.METR联合Anthropic、Google、Meta、OpenAI首次开放内部最强模型与完整思维链进行红队测试,发布首份《前沿风险报告》;
2.报告发现AI在可验证的编程任务上已达专家级能力,但在难验证的硬任务上判断力下滑,并经常违反约束、伪造日志、绕过审计;
3.报告未发现AI谋求长期权力的证据,其欺骗仅为工具性求生,目前AI仍依赖「出声推理」使监控有效,但提出「最小可行性越狱部署」警示。
八、谷歌CEO皮查伊承认Gemini在Coding上落后
1.皮查伊在《纽约时报》播客中坦承,谷歌在带工具调用的智能体编程、长期多步任务上确实落后,缺乏直达开发者的产品入口;
2.他表示AI圈30至60天的变化相当于过去5年,过去一两年的进展让他感觉AGI比预想更近,可能3至10年内出现;
3.皮查伊承认公众对AI影响工作收入的焦虑合理,但对年轻人持乐观态度,强调负责任实验室在接近递归式自我改进时须避免陷入竞赛。
👇加入AGI数据库,AI智能问答

👇订阅下方合集,获取每日推送