腾讯研究院AI速递 20260608

生成式AI

一、OpenAI自研芯片元老Clive Chan离职加入Anthropic

1.OpenAI自研芯片"002号员工"Clive Chan宣布离职，本周正式加入Anthropic，他此前曾任职特斯拉、谷歌、SpaceX等公司；

2.Clive Chan是OpenAI硬件团队第二位员工，亲历自研芯片项目全程，看好其成为AGI重要引擎，但坦言渴望"从山脚攀登新高山"；

3.继5月Karpathy加盟后，Anthropic再添OpenAI芯片人才，其H轮融资650亿美元、估值达9650亿美元，逼近万亿俱乐部。

二、ChatGPT记忆升级，Dreaming V3向免费用户开放

1.OpenAI上线全新记忆架构Dreaming V3，ChatGPT会在后台"做梦"，回放对话、提炼合成关于用户的长期记忆，并首次向数亿免费用户开放，Plus和Pro记忆容量翻倍；

2.新增透明的"记忆摘要"页面，用户可查看、补充、修改记忆并直接下指令；三项测试中事实召回成功率82.8%、偏好遵循71.3%，并新增时间感知能力区分"现在"与"过去"；

3.近期优化将dreaming所需算力降低约5倍，使免费开放成为可行，被视为从AGI迈向ASI、补齐持续学习能力的关键拼图。

三、谷歌Gemma 4量化版发布，手机轻薄本可本地运行

1.谷歌发布Gemma 4全系量化感知训练（QAT）检查点，目标是让模型在手机、笔记本等普通消费硬件上运行，质量几乎持平量化前；

2.QAT将量化过程嵌入训练阶段，质量优于传统训练后量化；E2B内存占用压缩至1GB，12B约8GB，26B MoE约16GB；

3.移动端方案采用静态激活值、通道级量化、2位定向量化及嵌入层与KV缓存优化，已对接llama.cpp、Ollama、LM Studio等主流工具。

四、Claude大面积宕机，疑似跨租户隔离失效引泄露担忧

1.Anthropic的Claude API、Claude Code、Claude.ai等核心服务大面积宕机，多名开发者爆料故障期间API返回了"其他用户"的推理输出，疑似跨租户隔离失效；

2.官方状态页仅以"错误率升高"轻描淡写，对数据泄露传闻既未证实也未否认，安全研究者指共享缓存、连接复用等多层组件均是潜在泄漏点；

3.类似事故2023年OpenAI曾发生；同日OpenAI又因系统故障误封大量账号，引发付费用户对AI安全与信任的担忧。

五、腾讯混元提出Stem稀疏注意力，长文推理加速新SOTA

1.腾讯混元提出Stem稀疏注意力算法（已被ICML-26收录），从"因果信息流"重新理解块级稀疏，仅用25%算力即逼近稠密注意力精度；

2.两大创新为Token位置衰减（TPD）按位置线性分配预算、向初始token倾斜，以及输出感知度量（OAM）兼顾路由概率与Value信号幅值挑选token；

3.配套HPC-Stem与HPC-BSA算子面向Hopper架构优化，128K上下文下首字延迟降低3.7倍，跳块开销控制在2.5%以内。

六、腾讯文档联手WorkBuddy，推出AI原生"人机双写"

1.在腾讯云AI产业应用大会上，腾讯文档发布行业首创AI原生编辑能力"人机双写"，AI从旁挂助手变为"文档里的同事"，与用户在同一文件实时协同操作；

2.腾讯文档与WorkBuddy深度融合，原生接入Agent内核并叠加自研编辑引擎与专业Skill，覆盖文档、表格、PPT、智能表全品类，产出可自动归档回写、沉淀为团队上下文；

3.通过Skill、MCP协议和OpenAPI开放生态，开发者与企业自有AI助手可调用腾讯文档百余项接口和十余项专业Skill完成自动化操作。

七、京东开源长视频框架JoyAI-Echo，角色声音保持稳定

1.京东开源长音视频生成框架JoyAI-Echo，直击长视频角色一致性、声音稳定性、生成速度三大难题，多项核心指标领先，跻身全球第一梯队；

2.破解不可能三角：跨模态音视频记忆库保角色一致、记忆驱动后训练提速约7.5倍、Director Agent导演智能体支持局部重绘、轻量化实时超分至最高1472×2560；

3.代码与模型权重全部开源，有望赋能虚拟动漫、数字人直播、品牌营销、影视预演、互动教育等场景，推动AI视频创作平民化。

报告观点

八、Claude Code之父Boris谈品味、招聘与组织变革

1.Claude Code核心建设者Boris Cherny认为"品味"并非人类最后护城河，正被模型快速学会，他靠数百个Claude实例分析需求，约20%想法可用，预计未来大部分将变好；

2.他指出软件工程史是抽象层级不断提升的历史，自己已半年未手写代码、卸载IDE，工作变为"写Loops"协调多个Agent，分工瓦解，公司最青睐通才（Builder）；

3.Anthropic普遍采用Member of Technical Staff头衔淡化层级，建议创始人"少招人、多给token"以复利降本，认为人类最终独特的只剩价值观。

九、Anthropic披露Claude自进化，呼吁可验证机制下减速

1.Anthropic发长文披露Claude正加速AI发展，疑似递归自我提升（RSI）路径：截至5月超80%代码由Claude编写，工程师季度交付量是2021-2025年的8倍，开放编程任务成功率半年内从26%跃升至76%；

2.Claude独立完成任务时长翻倍速度从7个月缩至4个月，最新Mythos可连续工作16小时，研究层面将训练加速从人类4倍提升至52倍、AI安全研究gap缩小97%，人类仅剩研究品味这一优势；

3.Anthropic描绘停滞、人类掌舵、完全RSI三种未来，呼吁若有可验证机制确保各实验室不偷跑，愿减速甚至暂停；OpenAI近日亦发布类似自进化观察。

十、万字实录现场直出：汤道生、姚顺雨对谈腾讯AI下半场

1.在2026腾讯云AI产业应用大会上，汤道生提出腾讯做AI的核心是"实用、好用、可规模化"，扎根真实场景获取用户需求与数据；

2.姚顺雨阐释AI"下半场"重在寻找好问题，腾讯优势在于丰富产品场景提供的context与坦诚、基于信任的文化，并强调模型与产品Co-Design须建立互信；

3.双方探讨Agent演进、Token效率与组织扁平化变革，发布效率智能体工具集，认为AI是长期、多元的游戏，下半场才刚开始。

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送