腾讯研究院AI速递 20260612

生成式AI

一、腾讯混元开源HPC-Ops推理算子库，多项指标超主流基线

1.腾讯混元AI Infra开源升级工业级推理算子库HPC-Ops，新增五大关键算子，覆盖推理全链路优化能力；

2.Attention动态调度长文本最高加速2.95倍、端到端QPM提升17%，Sampler较vLLM提速4至7.5倍；

3.Router GEMM以双BF16重构FP32高精度计算，FusedMoE较主流框架提速1.2至1.6倍，全部正式开源。

二、谷歌开源26B文本扩散模型DiffusionGemma，生成提速4倍

1.谷歌发布实验性开源模型DiffusionGemma，采用Apache 2.0许可，26B规模MoE推理仅激活3.8B参数；

2.放弃逐token自回归方式，可一次性并行生成256个token整块文本，GPU上生成速度最高提升至4倍；

3.支持双向注意力与自我修正，适合行内编辑、代码补全等本地低并发场景，但输出质量低于标准版Gemma 4。

三、小米发布并开源MiMo Code，模型与Agent协同优化

1.小米发布终端AI编程助手MiMo Code V0.1.0，基于OpenCode二次开发，采用MIT协议，内置限免MiMo-V2.5模型；

2.独创持久记忆系统与Compose模式，自动完成设计、规划、编码、测试、审查全流程，交付工业级成品；

3.同模型对比下，MiMo Code在SWE-Bench Pro达62%、Terminal Bench 2达73%，均优于Claude Code。

四、Meshy发布全球首个3D创作AI Agent，建模提速近千倍

1.胡渊鸣创立的Meshy推出全球首个3D创作AI Agent，多轮对话完成从概念探索到模型导出全流程；

2.打通生成、编辑、风格统一、打印检查与多格式导出，把单点生成工具升级为3D资产生产工作流入口；

3.建模成本从约1000美元降至1美元、速度提升近千倍，已服务全球超千万用户、生成超1亿个3D模型。

前沿科技

五、Codex协助天体物理学家改写黑洞模拟，部分计算提速千倍

1.亚利桑那大学Chi-kwan Chan借助OpenAI Codex改进黑洞等离子体模拟算法，破解算力压制难题；

2.Codex帮助推导候选算法、发现新坐标变换与数值方法，某些计算速度据称可提升至1000倍；

3.研究者强调AI不替代人，所有方案仍需实现验证，决策只在测试之后，保持可重复性基础。

报告观点

六、Ramp报告：头部企业人均月花5万养AI，分层差距达680倍

1.Ramp最新AI Index显示，采用程度前1%企业人均每月AI支出达7500美元、约5万元人民币，上月环比涨14.1%；

2.token单价两年下降98%，但智能体放大用量令企业AI总账单上涨约320%，年均预算从120万增至700万美元；

3.前1%与中位数公司支出差距高达680倍，分歧不止订阅数量，更在工作流、数据与组织熟练度。

七、Sarah Guo：能被Benchmark衡量的工作，都不是创业方向

1.Conviction创始人Sarah Guo撰文反驳「AI绝望论」，认为凡可被基准测量的工作终将被商品化、被模型吃掉；

2.真正有价值的工作天生「不可读」，正确性只存在于企业私有数据与封闭系统，靠许可、问责与信任建立；

3.应用公司机会在于做脏活、定义行业「什么叫好」，用私有数据训练专用模型，而非在通用任务上硬拼算力。

八、Anthropic CEO万字檄文，主动呼吁政府强制监管前沿AI

1.Dario Amodei发文称AI指数级爆炸不可逆，主动要求政府对头部AI企业实施强制第三方测试与监管；

2.提议参照FAA适航模式，对网络、生物、失控、研发加速四类风险审查，政府对高危模型拥有部署否决权；

3.同步发布前沿监管与就业补偿两份提案，并承诺2亿美元用于研究、1.5亿美元用于技能培训奖学金。

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送