生成式AI
一、OpenAI将英特尔CTO招入麾下,专攻算力基础设施建设
1. OpenAI成功招募英特尔CTO兼首席AI官Sachin Katti,负责为OpenAI打造面向AGI的算力基础设施,而英特尔CEO陈立武被迫亲自接管AI部门;
2. Katti拥有20多年无线通信和AI基础设施领域深耕经验,曾创办多家科技公司并在斯坦福任教,今年4月刚被英特尔提拔为CTO;
3. OpenAI计划未来8年斥资约1.4万亿美元打造AI基础设施,Katti的加入对其自主算力布局版图意义重大,但对英特尔而言是一次重大失血。
二、Meta开源最强语音"基座模型",可支持1600+种语言?
1. Meta AI FAIR团队发布Omnilingual ASR语音识别模型套件,能为超过1600种语言提供自动语音识别能力,78%语言字符错误率低于10%;
2. 该框架采用社区驱动设计,用户仅需提供少量样本即可将模型扩展到新语言,首次实现大规模ASR框架的上下文学习能力;
3. 同时开源Omnilingual ASR Corpus数据集(覆盖350种服务欠缺语言)和70亿参数的Omnilingual wav2vec 2.0语音表征模型。
三、商汤开源SenseNova-SI系列空间智能大模型,2B&8B
1. 商汤发布并开源SenseNova-SI系列空间智能大模型(2B和8B版本),其中8B模型在四个核心空间智能任务上平均成绩60.99,领先GPT-5和Gemini-2.5-Pro;
2. 该系列模型首次在空间智能领域验证了"尺度效应",构建了六大核心维度的空间能力分类体系,包括空间测量、空间重构、视角转换等;
3. 模型已接入"悟能"具身智能平台,同步开源空间智能测评平台EASI,将补强具身智能在三维结构认知方面的基础能力。
四、字节推出编程优化的新代码模型Doubao-Seed-Code
1. 火山引擎推出Doubao-Seed-Code代码模型,调用价格降低,0-32k区间输入仅1.20元/百万Token;
2. 该模型是支持视觉理解能力的编程模型,可参照UI设计稿生成代码,原生256K长上下文,原生兼容Anthropic API实现零成本切换;
3. 同步推出Coding Plan套餐,基于10万容器镜像训练库和端到端强化学习。
前沿科技
五、Nature子刊:太空数据中心,无限能源与散热证实可行?
1. 浙江大学和新加坡南洋理工大学首次系统性提出在太空构建碳中和数据中心的完整技术框架,利用近乎无限的太阳能和深空散热条件;
2. 研究提出两种方案:在遥感卫星上集成AI加速器构建"轨道边缘数据中心",以及组建计算卫星星座形成"轨道云数据中心";
3. 创新性提出"全生命周期碳利用效率"评估模型,初步建模显示尽管制造和发射有一次性碳排放,但长期碳效率有望超越中等碳强度地面数据中心。
报告观点
六、Anthropic 顶级研究员:AI见顶是最大错觉,仍在指数加速
1. Anthropic研究员Julian Schrittwieser指出AI长任务能力每7个月翻一番,预测2026年中期模型将能自主工作8小时,年底前至少有一个模型在多个行业匹配人类专家;
2. 他强调公众反复误判AI发展,忽视指数曲线并以当下错误做永久性判断,前沿实验室数据显示AI能力增长极其稳定且呈指数级;
3. 他认为"预训练+Transformer+强化学习"范式足以实现AGI,预测2027-2028年AI模型将足够聪明能单独完成诺贝尔奖级别的科学突破。
七、月之暗面杨植麟等回应一切:打假460万美元、调侃OpenAI
1. 月之暗面核心团队在Reddit举行AMA活动,杨植麟打假Kimi K2训练成本460万美元传言,称训练成本很难量化,已在研究K2的VL版本;
2. 杨植麟解释K2 Thinking现阶段优先考虑绝对性能而非token效率,榜单高分与实测脱节会在模型通用能力补齐后改善,KDA混合线性注意力模块可能出现在K3中;
3. 团队调侃OpenAI称做出更好模型不需要套新的Chromium壳,周昕宇称OpenAI烧钱原因"只有Sam才知道,我们有自己的方式和节奏"。
八、《麦肯锡2025 AI报告》:用了AI之后,大家到底过得怎么样?
1. 麦肯锡调查显示88%组织至少在一个业务环节使用AI,但仅39%表示AI带来实质性财务回报(EBIT增长),用上不等于用深更不等于用出钱;
2. 62%组织已试验AI Agent类应用,但真正在任何一个部门推AI Agent的公司不到一成,主要集中在IT运维、知识管理等流程清晰的标准化部门;
3. 高绩效企业在AI变革上野心更高,50%打算推动AI主导的变革性改变(普通企业仅14%),55%会从根本上重新设计工作流程(约其他企业的2.8倍)。
九、李飞飞最新长文刷屏,AI 下个十年最需要的不是大语言模型
1. 李飞飞发表长文强调空间智能是人类智能基石甚至先于语言存在,当前LLM虽语言能力强但缺乏对物理世界的真实经验和理解;
2. 她定义世界模型必须具备三种能力:生成性(生成几何物理一致的世界)、多模态性(天生设计为多模态)、交互性(根据动作输出下一世界状态);
3. 李飞飞认为构建世界模型需克服新训练任务、大规模数据和新模型架构三大挑战,空间智能应用将分阶段展开:近期赋能创造力,中期实现机器人学,长期变革科学医疗教育。
十、 上线 40 天,Sora 团队分享了他们对于 AI 社交的关键思考
1. Sora上线40天内实现近200万周活跃用户,其中70%用户参与创作,远超传统互联网90-9-1规则,核心在于Cameo和Remix两大社交玩法设计;
2. 团队将Sora定位为社交创作平台而非单人工具,推荐算法优先推送"有二创价值"内容而非消费时长,强调真实人际关系和共创体验;
3. 采用积分制灵活变现,平衡平台、创作者和版权方三方利益,通过降低创作门槛实现用户民主化创作,模型与产品双线并行发展。