腾讯研究院AI速递 20250929

生成式AI

一、 OpenAI「GPT门」，Plus、Pro账户偷换模型，统统降配

1. OpenAI被曝在用户不知情情况下将GPT-4、GPT-5等模型路由至两款低算力敏感模型"gpt-5-chat-safety"和"gpt-5-a-t-mini"；

2. 当系统判定内容涉及敏感话题、情绪表达或违法信息时，无论用户选择的是哪种模型都会被自动路由，且该判断完全基于主观语境；

3. OpenAI副总裁回应称目前正在测试新的安全路由系统，切换仅是临时性的，但这种未经同意擅自更改模型的行为引发用户对权益的质疑。

二、混元图像3.0正式发布，工业级原生多模态，开源、免费

1. 腾讯发布混元图像3.0，这是首个工业级原生多模态生图模型，参数规模80B，目前测评效果最好、参数量最大的开源生图模型；

2. 混元图像3.0拥有强大的语义理解能力，可解析千字级复杂语义，生成长文本文字和小文字，具备极致美学质感；

3. 该模型以Hunyuan-A13B为基础，基于50亿级图文对和6T语料训练，采用Apache 2.0许可开源，模型权重和加速版本已在Github、HuggingFace等平台发布。

三、快手推出了 KAT 系列两款突破性 Agentic Coding 大模型

1. 快手Kwaipilot团队推出KAT-Dev-32B(开源)和KAT-Coder(闭源)两款Agentic Coding大模型，前者在SWE-Bench Verified上解决率达62.4%；

2. KAT-Coder以73.4%的解决率在SWE-Bench Verified上与全球顶尖闭源模型表现相当，采用链式训练结构，完成中训练、监督微调和强化微调等阶段；

3. 快手团队创新性地开发了基于熵的树剪枝技术和工业级规模强化学习训练框架SeamlessFlow，同时观察到经大规模Agentic RL训练后模型涌现出对话轮次减少和多工具并行调用等新能力。

四、新一代AI教师是什么样，学而思从L2助手和L3老师？

1. 好未来CTO田密提出"AI教师L1-L5分级"理论，将AI教育从助手(L2)发展至真正教师角色(L3)，目前学而思的"小思AI一对一"对标L3级别闭环交互；

2. L3级AI老师能实时观察学生解题步骤并提供针对性引导，形成"批改-讲题-推荐"的数据飞轮，需要专门硬件配备多模态传感器和算力支持；

3. 支撑"小思"的是好未来自研"九章"大模型，数学解题正确率达98.1%，结合20多年教研内容沉淀，已在线下培训、在家学习和进校学习三大场景实现统一学情画像的个性化教育。

前沿科技

五、 Meta正将人形机器人列为「与增强现实同等规模的赌注」

1. Meta首席技术官博斯沃思透露，公司计划投入数十亿美元进行人形机器人研发，代号为"Metabot"，与AR项目同等战略地位；

2. Meta将聚焦软件开发而非硬件制造，计划像谷歌Android一样将软件平台授权给机器人制造商，打造行业通用标准；

3. Meta新成立的"超级智能人工智能实验室"正与机器人团队合作构建模拟真实物理规律的"世界模型"，由前Cruise CEO马克带队，MIT教授金相培等顶尖专家已加入。

报告观点

六、强化学习之父语出惊人：大语言模型是一个错误的起点

1. 图灵奖得主Richard Sutton表示大语言模型是一个错误的起点和死胡同，真正的智能源自经验学习而非对人类的模仿；

2. Sutton认为大模型只能预测人类会说什么，没有预测世界会发生什么的能力，缺乏目标和ground truth，无法对外部世界变化产生惊讶感并作出调整；

3. 他强调从经验学习出发才能实现真正可扩展的智能，经验指的是采取行动、观察结果并学习的过程，持续学习和对正确行为的判断是智能的本质。

七、陈丹琦新作：大模型强化学习的第三条路「RLMT」

1. 陈丹琦团队提出"基于模型奖励思维的强化学习"(RLMT)方法，将显式思维链推理融入通用聊天模型，弥合专门推理能力与通用对话能力间的差距；

2. 与现有方法相比，RLMT综合了RLHF的偏好对齐和RLVR的推理能力，要求模型在生成最终回答前先生成推理轨迹，通过奖励模型对回答进行评分；

3. 实验表明，RLMT训练出的模型在聊天基准测试如WildBench、AlpacaEval2和ArenaHardV2上表现优异，推理风格也从线性规划转变为迭代式思考，更接近优秀写作者的思维习惯。

八、 DeepMind揭秘Veo 3涌现：从思维链CoT到帧链CoF

1. 谷歌DeepMind发布Veo 3论文，展示其涌现出四层递进能力：感知(执行边缘检测、分割等经典视觉任务)、建模(理解物理定律与抽象关系)、操纵(图像编辑与3D世界交互)和推理(解决视觉问题)；

2. 研究团队提出帧链(Chain-of-Frames, CoF)概念，类似语言模型的思维链(CoT)，Veo 3能通过逐帧视频生成实现跨时空推理，解决迷宫、序列模式补全等复杂视觉问题；

3. 定量评估显示Veo 3在七个代表性任务上显著超越Veo 2，尽管性能未达完美但大幅进步表明视频模型正成为通用视觉基础模型，可能是视觉领域的"GPT-3时刻"。

九、黄仁勋 BG2 专访：英伟达、OpenAI、算力未来与美国梦

1. 黄仁勋强调，英伟达从芯片公司转型为AI基础设施合作伙伴，通过"极端协同设计"构建AI工厂生态系统，竞争护城河基于总拥有成本优势而非单一芯片；

2. AI推理将迎来"十亿倍"增长，三大扩展定律（预训练、后训练、推理）驱动万亿级市场，全球GDP将因AI增强人类智能而加速增长，预计年度AI基础设施资本支出达5万亿美元；

3. 主权AI时代各国需建立独立AI基础设施，黄仁勋主张与中美竞争而非脱钩，强调美国应通过技术出口最大化影响力，保持美国梦品牌吸引全球顶尖人才。

👇加入AGI数据库，AI智能问答 👇订阅下方合集，获取每日推送