生成式AI
一、OpenAI自研芯片元老Clive Chan离职加入Anthropic
1.OpenAI自研芯片"002号员工"Clive Chan宣布离职,本周正式加入Anthropic,他此前曾任职特斯拉、谷歌、SpaceX等公司;
2.Clive Chan是OpenAI硬件团队第二位员工,亲历自研芯片项目全程,看好其成为AGI重要引擎,但坦言渴望"从山脚攀登新高山";
3.继5月Karpathy加盟后,Anthropic再添OpenAI芯片人才,其H轮融资650亿美元、估值达9650亿美元,逼近万亿俱乐部。
二、ChatGPT记忆升级,Dreaming V3向免费用户开放
1.OpenAI上线全新记忆架构Dreaming V3,ChatGPT会在后台"做梦",回放对话、提炼合成关于用户的长期记忆,并首次向数亿免费用户开放,Plus和Pro记忆容量翻倍;
2.新增透明的"记忆摘要"页面,用户可查看、补充、修改记忆并直接下指令;三项测试中事实召回成功率82.8%、偏好遵循71.3%,并新增时间感知能力区分"现在"与"过去";
3.近期优化将dreaming所需算力降低约5倍,使免费开放成为可行,被视为从AGI迈向ASI、补齐持续学习能力的关键拼图。
三、谷歌Gemma 4量化版发布,手机轻薄本可本地运行
1.谷歌发布Gemma 4全系量化感知训练(QAT)检查点,目标是让模型在手机、笔记本等普通消费硬件上运行,质量几乎持平量化前;
2.QAT将量化过程嵌入训练阶段,质量优于传统训练后量化;E2B内存占用压缩至1GB,12B约8GB,26B MoE约16GB;
3.移动端方案采用静态激活值、通道级量化、2位定向量化及嵌入层与KV缓存优化,已对接llama.cpp、Ollama、LM Studio等主流工具。
四、Claude大面积宕机,疑似跨租户隔离失效引泄露担忧
1.Anthropic的Claude API、Claude Code、Claude.ai等核心服务大面积宕机,多名开发者爆料故障期间API返回了"其他用户"的推理输出,疑似跨租户隔离失效;
2.官方状态页仅以"错误率升高"轻描淡写,对数据泄露传闻既未证实也未否认,安全研究者指共享缓存、连接复用等多层组件均是潜在泄漏点;
3.类似事故2023年OpenAI曾发生;同日OpenAI又因系统故障误封大量账号,引发付费用户对AI安全与信任的担忧。
五、腾讯混元提出Stem稀疏注意力,长文推理加速新SOTA
1.腾讯混元提出Stem稀疏注意力算法(已被ICML-26收录),从"因果信息流"重新理解块级稀疏,仅用25%算力即逼近稠密注意力精度;
2.两大创新为Token位置衰减(TPD)按位置线性分配预算、向初始token倾斜,以及输出感知度量(OAM)兼顾路由概率与Value信号幅值挑选token;
3.配套HPC-Stem与HPC-BSA算子面向Hopper架构优化,128K上下文下首字延迟降低3.7倍,跳块开销控制在2.5%以内。
六、腾讯文档联手WorkBuddy,推出AI原生"人机双写"
1.在腾讯云AI产业应用大会上,腾讯文档发布行业首创AI原生编辑能力"人机双写",AI从旁挂助手变为"文档里的同事",与用户在同一文件实时协同操作;
2.腾讯文档与WorkBuddy深度融合,原生接入Agent内核并叠加自研编辑引擎与专业Skill,覆盖文档、表格、PPT、智能表全品类,产出可自动归档回写、沉淀为团队上下文;
3.通过Skill、MCP协议和OpenAPI开放生态,开发者与企业自有AI助手可调用腾讯文档百余项接口和十余项专业Skill完成自动化操作。
七、京东开源长视频框架JoyAI-Echo,角色声音保持稳定
1.京东开源长音视频生成框架JoyAI-Echo,直击长视频角色一致性、声音稳定性、生成速度三大难题,多项核心指标领先,跻身全球第一梯队;
2.破解不可能三角:跨模态音视频记忆库保角色一致、记忆驱动后训练提速约7.5倍、Director Agent导演智能体支持局部重绘、轻量化实时超分至最高1472×2560;
3.代码与模型权重全部开源,有望赋能虚拟动漫、数字人直播、品牌营销、影视预演、互动教育等场景,推动AI视频创作平民化。
报告观点
八、Claude Code之父Boris谈品味、招聘与组织变革
1.Claude Code核心建设者Boris Cherny认为"品味"并非人类最后护城河,正被模型快速学会,他靠数百个Claude实例分析需求,约20%想法可用,预计未来大部分将变好;
2.他指出软件工程史是抽象层级不断提升的历史,自己已半年未手写代码、卸载IDE,工作变为"写Loops"协调多个Agent,分工瓦解,公司最青睐通才(Builder);
3.Anthropic普遍采用Member of Technical Staff头衔淡化层级,建议创始人"少招人、多给token"以复利降本,认为人类最终独特的只剩价值观。
九、Anthropic披露Claude自进化,呼吁可验证机制下减速
1.Anthropic发长文披露Claude正加速AI发展,疑似递归自我提升(RSI)路径:截至5月超80%代码由Claude编写,工程师季度交付量是2021-2025年的8倍,开放编程任务成功率半年内从26%跃升至76%;
2.Claude独立完成任务时长翻倍速度从7个月缩至4个月,最新Mythos可连续工作16小时,研究层面将训练加速从人类4倍提升至52倍、AI安全研究gap缩小97%,人类仅剩研究品味这一优势;
3.Anthropic描绘停滞、人类掌舵、完全RSI三种未来,呼吁若有可验证机制确保各实验室不偷跑,愿减速甚至暂停;OpenAI近日亦发布类似自进化观察。
十、万字实录现场直出:汤道生、姚顺雨对谈腾讯AI下半场
1.在2026腾讯云AI产业应用大会上,汤道生提出腾讯做AI的核心是"实用、好用、可规模化",扎根真实场景获取用户需求与数据;
2.姚顺雨阐释AI"下半场"重在寻找好问题,腾讯优势在于丰富产品场景提供的context与坦诚、基于信任的文化,并强调模型与产品Co-Design须建立互信;
3.双方探讨Agent演进、Token效率与组织扁平化变革,发布效率智能体工具集,认为AI是长期、多元的游戏,下半场才刚开始。
👇加入AGI数据库,AI智能问答

👇订阅下方合集,获取每日推送