生成式AI
一、腾讯混元开源HPC-Ops推理算子库,多项指标超主流基线
1.腾讯混元AI Infra开源升级工业级推理算子库HPC-Ops,新增五大关键算子,覆盖推理全链路优化能力;
2.Attention动态调度长文本最高加速2.95倍、端到端QPM提升17%,Sampler较vLLM提速4至7.5倍;
3.Router GEMM以双BF16重构FP32高精度计算,FusedMoE较主流框架提速1.2至1.6倍,全部正式开源。
二、谷歌开源26B文本扩散模型DiffusionGemma,生成提速4倍
1.谷歌发布实验性开源模型DiffusionGemma,采用Apache 2.0许可,26B规模MoE推理仅激活3.8B参数;
2.放弃逐token自回归方式,可一次性并行生成256个token整块文本,GPU上生成速度最高提升至4倍;
3.支持双向注意力与自我修正,适合行内编辑、代码补全等本地低并发场景,但输出质量低于标准版Gemma 4。
三、小米发布并开源MiMo Code,模型与Agent协同优化
1.小米发布终端AI编程助手MiMo Code V0.1.0,基于OpenCode二次开发,采用MIT协议,内置限免MiMo-V2.5模型;
2.独创持久记忆系统与Compose模式,自动完成设计、规划、编码、测试、审查全流程,交付工业级成品;
3.同模型对比下,MiMo Code在SWE-Bench Pro达62%、Terminal Bench 2达73%,均优于Claude Code。
四、Meshy发布全球首个3D创作AI Agent,建模提速近千倍
1.胡渊鸣创立的Meshy推出全球首个3D创作AI Agent,多轮对话完成从概念探索到模型导出全流程;
2.打通生成、编辑、风格统一、打印检查与多格式导出,把单点生成工具升级为3D资产生产工作流入口;
3.建模成本从约1000美元降至1美元、速度提升近千倍,已服务全球超千万用户、生成超1亿个3D模型。
前沿科技
五、Codex协助天体物理学家改写黑洞模拟,部分计算提速千倍
1.亚利桑那大学Chi-kwan Chan借助OpenAI Codex改进黑洞等离子体模拟算法,破解算力压制难题;
2.Codex帮助推导候选算法、发现新坐标变换与数值方法,某些计算速度据称可提升至1000倍;
3.研究者强调AI不替代人,所有方案仍需实现验证,决策只在测试之后,保持可重复性基础。
报告观点
六、Ramp报告:头部企业人均月花5万养AI,分层差距达680倍
1.Ramp最新AI Index显示,采用程度前1%企业人均每月AI支出达7500美元、约5万元人民币,上月环比涨14.1%;
2.token单价两年下降98%,但智能体放大用量令企业AI总账单上涨约320%,年均预算从120万增至700万美元;
3.前1%与中位数公司支出差距高达680倍,分歧不止订阅数量,更在工作流、数据与组织熟练度。
七、Sarah Guo:能被Benchmark衡量的工作,都不是创业方向
1.Conviction创始人Sarah Guo撰文反驳「AI绝望论」,认为凡可被基准测量的工作终将被商品化、被模型吃掉;
2.真正有价值的工作天生「不可读」,正确性只存在于企业私有数据与封闭系统,靠许可、问责与信任建立;
3.应用公司机会在于做脏活、定义行业「什么叫好」,用私有数据训练专用模型,而非在通用任务上硬拼算力。
八、Anthropic CEO万字檄文,主动呼吁政府强制监管前沿AI
1.Dario Amodei发文称AI指数级爆炸不可逆,主动要求政府对头部AI企业实施强制第三方测试与监管;
2.提议参照FAA适航模式,对网络、生物、失控、研发加速四类风险审查,政府对高危模型拥有部署否决权;
3.同步发布前沿监管与就业补偿两份提案,并承诺2亿美元用于研究、1.5亿美元用于技能培训奖学金。
👇加入AGI数据库,AI智能问答

👇订阅下方合集,获取每日推送