全文约 1000 字,预计阅读时间 3 分钟
新闻资讯
Gemini 成首个 IMO 认证 AI 金牌,而 OpenAI 没能蹭热度成功

谷歌DeepMind宣布其Gemini Deep Think在2025年国际数学奥林匹克(IMO)中斩获35分,成为首个获得官方认证的AI金牌得主。该模型在4.5小时内以自然语言完成5道题的完美解答,实现从"翻译数学"到"思维数学"的跨越。值得关注的是,OpenAI在未获官方认证情况下提前宣布"成果"引发争议,而DeepMind则严格遵循IMO官方流程,强调其成绩经过正式认证。DeepMind表示将先向受信任数学家开放测试,后续逐步向Google AI Ultra用户推出该模型。
https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf
https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
上海人工智能实验室发布超大规模跨域混训技术方案浦算

2025年7月19日,上海人工智能实验室发布DeepLink超大规模跨域混训技术方案,实现千公里级智算中心互联,支持千亿参数大模型混训。该方案融合中国联通、中国电信等合作伙伴技术,已连接上海与济南(1500公里)、北京、上海与贵州等地智算中心,等效算力达单芯片单集群算力的95%以上。方案通过"3D并行+PS"架构和异构流水线并行策略,解决了跨域通信效率低、稳定性差、异构芯片协同难等问题,为全国算力互联互通探索出新路径,助力实现算力共建共享。
https://deeplink.org.cn/home
字节跳动发布通用机器人模型 GR-3

7 月 22 日,字节跳动 Seed 团队正式发布全新 Vision-Language-Action Model(VLA)模型 GR-3。该模型通过融合遥操作机器人数据、人类 VR 轨迹数据及公开图文数据,实现了对新物体和环境的高效泛化能力,能理解 “把餐桌上的蓝色碗放进篮子” 等包含抽象概念的指令,并完成柔性物体操作、双手协同等复杂任务。
GR-3 的核心突破在于仅需少量人类数据即可快速微调,显著降低迁移至新任务的成本。例如通过 VR 设备采集 10 条轨迹数据,GR-3 操作新物体的成功率可从不足 60% 提升至 80%。团队还配套开发了具备 22 个自由度的双臂移动机器人 ByteMini,其手腕球角设计使其能在狭小空间完成精细操作。
https://seed.bytedance.com/zh/public_papers/gr-3-technical-report
阿里通义千问升级 Qwen3 模型,性能超越 Kimi-K2 等一众顶级开源模型

7 月 22 日,阿里巴巴通义千问宣布推出 Qwen3-235B-A22B-Instruct-2507-FP8 模型,在多语言知识覆盖、逻辑推理、编程等领域实现显著提升。新模型通过优化 MoE 架构和训练数据,在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)等测评中全面超越 Kimi-K2、DeepSeek-V3 等开源竞品,并达到 Claude-Opus4-Non-thinking 等闭源模型水平。
Qwen3-2507 的核心升级包括:支持 256K 长文本上下文,增强对复杂指令的理解;引入多语言长尾知识训练,提升跨文化任务表现;在主观任务中通过偏好对齐优化,生成更符合用户需求的高质量文本。例如,在未见过的复杂指令任务中,成功率较前代提升 42.8%。
https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
小工具
Supervision

Supervision是一个开源计算机视觉工具库,提供模型集成、数据集处理和标注功能。支持YOLO、Transformers等主流模型,可加载、转换COCO/Pascal VOC等格式数据集,提供高度自定义的标注器。适用于目标检测、分割等任务,简化计算机视觉应用开发流程。
-- 完 --
机智流推荐阅读:
1. 分享一个开源深度研究框架:DeepResearch Eco递归式工作流的设计与应用
2. 一起聊聊Nvidia Blackwell新特性之使用Thread Block Clusters的 GEMM
3. 上下文工程万字综述、Qwen“背题”疑云、反思性生成模型,HF本周30篇必读论文揭秘前沿趋势!
4. 从 PPO、DPO 到 GRPO:万字长文详解大模型训练中的三大关键算法
cc | 大模型技术交流群 hf | HuggingFace 高赞论文分享群 具身 | 具身智能交流群 硬件 | AI 硬件交流群 智能体 | Agent 技术交流群