腾讯研究院AI速递 20251215

生成式AI

一、GPT-5.2上线的24小时，X 大批网友给 GPT-5.2 打差评？

1. OpenAI十周年发布GPT-5.2系列号称"最强专业知识工作模型"，但上线24小时后X平台和Reddit用户集体差评，认为其过于平淡、安全审查过度、情商堪忧；

2. SimpleBench测试显示GPT-5.2得分低于一年前的Claude Sonnet 3.7，在garlic有几个r等简单问题上回答错误，LiveBench得分低于Opus 4.5和Gemini 3.0；

3. 最受诟病的是安全拒绝机制过于严格，用户反馈模型共情力和语境感知能力下降，在情感支持场景中给出机械且脱离现实的建议。

二、OpenAI发布同时，谷歌推出Gemini Deep Research Agent

1. 谷歌在GPT-5.2发布前一小时推出全新版Gemini Deep Research Agent，基于Gemini 3 Pro构建并通过多步强化学习训练提高准确性减少幻觉；

2. 新版在Humanity's Last Exam测试集中达到46.4%领先水平，在DeepSearchQA上取得66.1%，在BrowseComp测试中获得59.2%高分；

3. 同步推出开源网络研究Agent基准DeepSearchQA和全新交互API，后者支持服务器端状态管理、远程MCP工具调用和后台执行长时间推理循环。

三、Runway正式发布5大更新，首个通用世界模型GWM来了

1. Runway升级发布Gen-4.5旗舰视频模型和首个通用世界模型GWM-1，前者支持原生音频生成编辑和多镜头编辑功能；

2. GWM-1是自回归模型支持逐帧预测和实时干预，包括三种变体：可探索环境的GWM Worlds、对话角色的GWM Avatars和机器人操作的GWM Robotics；

3. 英伟达CEO黄仁勋专门发来祝贺视频，标志行业从单纯"视频生成"迈向真正的"世界模拟"，AI开始理解物理世界底层逻辑。

四、谷歌把AI同传放入耳机，顺手发了个颠覆性的AI浏览器

1. 谷歌翻译引入Gemini模型能力，推出支持任何品牌耳机的实时语音翻译Beta版，覆盖超过70种语言并保留说话者语调重音和节奏；

2. 文本翻译引擎重构后能智能解析俚语和成语上下文，而非生硬逐字翻译，支持英语与近20种语言互译包括中文日语德语等；

3. Chrome团队在Google Labs推出实验性浏览器Disco，核心概念是GenTabs生成式标签页，可将网页内容转化为包含地图行程表的交互式微型应用。

五、拓竹MakerWorld接入混元3D 3.0 ，上线手办神「印你」

1. 拓竹科技旗下3D模型平台MakerWorld全面升级接入腾讯混元3D 3.0大模型，上线全新手办生成器"印你"，用户只需上传一张图片即可生成可打印3D模型；

2. 混元3D 3.0首创3D-DiT分级雕刻技术，建模精度提升3倍几何分辨率高达1536³，支持36亿体素超高清建模，五官更立体细节更锐利纹理更逼真；

3. MakerWorld平台已有20款各具特色建模工具，吸引全球超过200万用户，此次接入顶尖生成式AI技术使设计周期大幅缩短创作不再受限于建模技术。

六、迪士尼与OpenAI合作，10亿美元入股超200角色授权

1. 迪士尼向OpenAI进行10亿美元股权投资并获得购买额外股权的认股权证，这是Sora平台首次迎来大型内容授权合作伙伴；

2. 三年期许可协议第一年具有排他性，Sora和ChatGPT Images将获得迪士尼旗下超200个角色授权包括米老鼠、漫威、皮克斯和星球大战角色，但不包含真人肖像或声音；

3. 迪士尼将利用OpenAI的API构建新产品工具覆盖Disney+流媒体平台，为员工部署ChatGPT用于内部工作流程，粉丝精选创作视频将在Disney+播放。

前沿科技

七、48小时，Erdos#1026问题在AI辅助下被攻克并给出正式证明

1. 数学家埃尔德什1975年提出的Erdos#1026问题困扰数学界50年，在AI辅助下人类团队仅用48小时攻克并给出正式证明，陶哲轩称AI带来全新理解绝非简单搜索；

2. Harmonic的AI系统Aristotle在Lean证明辅助语言中自动证出c(k²)=1/k，AlphaEvolve系统探索c(n)数值结果帮助提炼出干净公式；

3. AI深度搜索找到2024年Baek、Koizumi、Ueoro论文完整解，传统模式下可能需要数周甚至数月，此次证明了AI在生成新数学洞见而非仅检索现有文献。

八、宇树首发人形机器人「App Store」，功能模块化、标准化分发

1. 宇树科技正式上线人形机器人应用商店，这是行业内首个致力于将人形机器人功能模块化标准化的内容分发平台，解决复杂动作开发难用户上手门槛高问题；

2. 应用商店集成用户广场、动作库、数据集及开发者中心四大核心模块，用户无需底层代码编写能力即可像安装手机软件一样一键部署云端运动控制算法；

3. 首批上线应用包括基于G1系列机器人的"李小龙"截拳道与"扭扭舞"预设，通过独家动力学算法结合高精度动作捕捉数据将武术动作库无缝移植到机器人硬件。

报告观点

九、DeepMind科学家：AGI并不是一个临界点，最低AGI将到来

1. Google DeepMind首席AGI科学家Shane Legg预测最小AGI有50%可能性在2028年实现，完全AGI将在最小AGI出现后3-6年内实现，随后进入超级智能ASI阶段；

2. 他认为AGI并非临界点而是连续光谱，分为三阶段：最小AGI能完成普通人典型认知任务，完全AGI能完成最杰出人类认知任务，ASI全面超越人类所有认知领域；

3. AGI将导致倒挂式结构性失业，高层认知工作首当其冲基层体力工作暂时安全，社会需要重新设计分配机制并重构人类在失去工作身份后的幸福定义。

十、暴涨3倍！18-34岁占比反降15%：这届中年人开始占领AI

1. Similarweb发布2025年度AI报告显示全球GenAI平台月访问量超70亿次同比暴涨76%，移动端App下载量达19亿次一年内翻3倍多；

2. 18-34岁用户占比反而下降约15%说明年纪更大用户快速涌入，ChatGPT已跻身全球前五大网站但95%用户仍同时使用谷歌形成互补双入口格局；

3. AI Mode成为首个访问量突破1亿的生成式AI搜索功能，互联网正从"被搜索检索"变成"被AI谈论"。