一周AI丨DeepSeek首登《自然》封面；英伟达50亿美元入股英特尔；宇树开源机器人世界大模型；Figure估值2700亿……

要闻列表

AI万象

DeepSeek-R1论文登上《自然》封面，通讯作者为梁文锋

OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平

大平台动作

微软将在美国威斯康星州建第二座数据中心，累计投资超70亿美元

英伟达斥资50亿美元入股英特尔

李飞飞发布世界模型新成果：一个提示，生成无限3D世界

Meta开源MobileLLM-R1模型，不到1B参数

宇树科技开源UnifoLM-WMA-0架构，助力机器人自主学习

新力量崛起

Luma AI发布Ray3：首款支持HDR视频生成的创新模型

投融资风向

AI推理芯片公司Groq完成7.5亿美元融资

Figure完成10亿美元融资，估值达2700亿人民币

DeepSeek-R1论文登上《自然》封面，通讯作者为梁文锋

AI万象

9月18日，由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文，登上了国际权威期刊《自然（Nature）》第645期的封面。与今年1月发布的DeepSeek-R1的初版论文相比，本次论文披露了更多模型训练的细节。

据悉，DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道：目前几乎所有主流的大模型都还没有经过独立同行评审，这一空白“终于被DeepSeek打破”。

论文摘要显示，通用推理一直是人工智能领域一项长期且艰巨的挑战。近年来，以大型语言模型（LLMs）、和思维链（CoT）提示为代表的技术突破，已在基础推理任务上取得了显著成功。然而，这种成功在很大程度上依赖于大量人工标注的演示数据，且模型在处理更复杂问题时的能力仍显不足。

研究表明，大型语言模型的推理能力可通过纯强化学习（RL）来激发，无需依赖人工标注的推理轨迹。所提出的强化学习框架能够促进高级推理模式的自主形成，例如自我反思、验证和动态策略调整。

因此，经训练的模型在数学、编程竞赛和STEM（科学、技术、工程、数学）领域等可验证任务上展现出更优异的性能，优于通过传统监督学习（基于人工演示数据）训练的同类模型。此外，这些大规模模型所呈现的自主形成的推理模式，可被系统性地用于指导和提升小型模型的推理能力。

同时，论文的贡献者名单中还包括两位熟悉的人物——2024阿里全球数赛AI挑战赛冠军、《WAIC UP!》嘉宾作者涂津豪以及“95后AI天才少女”罗福莉。

新闻拓展：

DeepSeek登上《Nature》封面，梁文锋打破质疑，给国人长脸了

独家观点｜2024阿里全球数赛AI挑战赛冠军涂津豪：要把AI当玩具一样用起来

OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平

AI万象

ICPC，即国际大学生程序设计竞赛，是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛，它比IMO等高中奥林匹克竞赛更高一级。每年，来自近3000所大学和103个国家的参赛者齐聚一堂，挑战现实世界的编程难题。

今年，GPT-5和Gemini 2.5 Deep Think作为参赛模型，受ICPC官方规则与组织监督，参与了与人类选手相同的解题环节。虽然它们并非与学生团队直接同场竞技，却交出了惊艳答卷：

● GPT-5拿下满分，12道题全解，相当于“金牌”水准。

● Gemini 2.5 Deep Think在677分钟内解出12题中的10题，也达到金牌级别。根据谷歌的说法，这样的成绩放在人类排名里将是全球第二。

根据OpenAI官方披露，GPT-5参赛时并没有针对ICPC做特别训练，也没有任何“外挂”工具。它像其他人类队伍一样：直接拿到同样的PDF赛题、通过官方判题系统提交答案、在5小时内完成所有解答。

结果令人瞠目：有11道题都是一遍过，唯一的难题在第9次提交时才解出，最终达成12/12满分——今年人类最强队伍的成绩是11/12，而GPT-5直接拿下满分，这在ICPC的历史上极为罕见。

与此同时，谷歌也公布了Gemini 2.5 Deep Think的比赛细节：45分钟内解出8题；3小时内解出10题；更令人震惊的是，Gemini在比赛前半小时内，就成功解决了问题C——一道没有任何大学队伍解出的难题。

其实，大模型在各种考试、基准测试中的高分表现早已不是新闻，但这些成绩往往被质疑为“靠记忆训练数据”或“靠海量算力暴力搜索”。而ICPC这种现场算法竞赛不同：首先题目新颖，几乎不可能出现在训练语料中；其次需要综合运用数学建模、推理和代码实现；最为重要的是，必须在有限时间内找到解法，而不是离线慢慢思考。

此次GPT-5 与 Gemini 2.5 Deep Think在ICPC中的表现，证明了它们已经具备临场推理、抽象建模、创造性解题的能力，这比在标准化考试中得高分更能说明问题。为此在社交媒体上，许多AI工程师感叹：“过去我们担心AI只是会背题库；现在它在现场比赛里击败人类冠军。这感觉像是见证了‘人机智力平权’的时刻。”

新闻拓展：

刚刚，OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平

微软将在美国威斯康星州建第二座数据中心，累计投资超70亿美元

大平台动作

美东时间9月18日，微软公布，公司在美国威斯康星州斥资33亿美元建设的“全球最强大AI数据中心”将于2026年初投入使用，计划再投入40亿美元，在同一州建设第二座同等规模的数据中心，在该州的总投资额超过70亿美元。

上述接近竣工的数据中心名为Fairwater，占地315英亩，采用独特的两层建筑设计，以实现更紧密的网络连接并降低延迟。微软介绍，它将作为一台大型AI超级计算机运行，使用单一扁平网络连接数十万块英伟达GB200 GPU，成为强大的AI训练设施，初期将用于训练OpenAI模型。

该设施配备了最先进的冷却系统，超过90%的设施将使用封闭循环系统循环水和化学物质，无需重新填充。剩余部分使用外部空气冷却，仅在高温天气时切换到水冷。微软总裁Brad Smith称，单个数据中心的年用水量相当于典型18洞高尔夫球场夏季高峰期一周的用水量。

微软CEO Satya Nadella称，Fairwater的性能将达到目前全球最快超级计算机的10倍。

本周四微软公布的新投资凸显了云计算巨头在AI基础设施领域的激烈竞争势头。荷兰的科技公司Nebius上周公布，拿下最高194亿美元的大单，为微软提供AI算力。微软本周二宣布，将在英国追加投入155亿美元用于基础设施。

新闻拓展：

https://baijiahao.baidu.com/s?id=1843619958804347296&wfr=spider&for=pc

英伟达斥资50亿美元入股英特尔

大平台动作

当地时间9月18日，英伟达宣布将斥资50亿美元收购竞争对手英特尔的股份，双方将共同为个人电脑（PC）和数据中心开发芯片。

英特尔表示，英伟达与英特尔将共同开发多代定制化数据中心和个人计算产品，加速超大规模计算、企业级及消费级市场的各类应用与工作负载的处理。双方通过英伟达NVLink技术实现架构无缝互连，融合英伟达AI与加速计算领域的优势、英特尔CPU技术与x86生态。

在数据中心领域，英特尔将为英伟达定制x86处理器，这些处理器将被集成至英伟达AI基础设施平台中。在个人计算领域，英特尔将推出集成英伟达RTX GPU芯粒（Chiplet）的x86系统级芯片 (SoC)。该x86 RTX SoC将用于驱动需要CPU与GPU集成解决方案的各类PC产品。

英伟达将以每股23.28美元的价格认购英特尔普通股。此项投资需符合惯例成交条件，包括获得必要的监管批准。

英伟达创始人兼首席执行官黄仁勋表示，AI正在推动一场新的工业革命，并重塑计算堆栈的每一层，从芯片到系统再到软件。这场变革的核心是英伟达的CUDA架构。此次历史性的合作将英伟达的AI和加速计算堆栈与英特尔的CPU和庞大的x86生态紧密结合，实现两大先进平台的融合，为新计算时代奠定基础。

英特尔首席执行官陈立武表示，几十年来，英特尔x86架构始终是现代计算的基石。英特尔数据中心和客户端计算平台，结合英特尔在制程技术、制造及先进封装领域的实力，将与英伟达在AI和加速计算领域的优势形成互补，共同推动行业实现新的突破。

在英伟达此次宣布投资英特尔的数周前，美国政府收购英特尔10%的股份，价值近90亿美元，日本软银也已向其注资20亿美元。

新闻拓展：

黄仁勋、陈立武详解英伟达50亿美元入股英特尔

李飞飞发布世界模型新成果：一个提示，生成无限3D世界

大平台动作

当地时间9月16日，李飞飞团队展示了一款名为Marble的模型的新成果。

只需给到一张图片或者给到一段文字提示，这款模型就能生成一个3D世界，用户可以在这个3D世界里随心所欲地探索，这个3D世界既没有时间限制，也没有变形和不一致性。

相比上一版模型，本次版本的模型能够生成更大的、风格更加多样的3D世界，同时还拥有更清晰的3D几何图形。一名未具名的虚幻引擎的VR电影制作人表示，自己很想尝试使用本次模型来向观众制作电影故事和设计互动体验项目。

对于使用本次模型所生成的3D世界，用户通过借助李飞飞团队的开源渲染库Spark，可以将其导出为高斯分布图，并能将其用于相关的下游项目。Spark可以将高斯分布图无缝地集成到开源JavaScript库Three.js之中，从而用于构建基于Web的3D体验，并能在台式机、笔记本电脑、移动设备和虚拟现实（VR，Virtual Reality）头显上进行高效渲染。

该模型具有较好的一致性和风格遵行能力，故能通过组合多个3D世界来构建大型3D世界。

总的来说，本次模型通过提供构建3D世界的能力，可以提高用户的生产力和创造力。目前，已有用户将该模型生成的3D世界集成到游戏项目和互动内容项目中，未来等到该模型的API开放之后，用户就可以实现无缝的3D世界集成。

未来，李飞飞团队将在marble.worldlabs.ai上推出Marble模型的有限访问Beta预览版，届时用户可以在上面查看和创建3D世界。

新闻拓展：

刚刚，李飞飞发布世界模型新成果！一张图生成 3D 世界，现在就能玩

Meta开源MobileLLM-R1模型，不到1B参数

大平台动作

9月19日，Meta AI团队正式发布了MobileLLM-R1。

这是MobileLLM的全新高效推理模型系列，包含两类模型：基础模型MobileLLM-R1-140M-base、MobileLLM-R1-360M-base、MobileLLM-R1-950M-base和它们相应的最终模型版。

它们不是通用的聊天模型，而是监督微调 (SFT) 模型，专门针对数学、编程（Python、C++）和科学问题进行训练。

除了模型本身之外，Meta还发布了完整的训练方案和数据源，以确保可重复性并支持进一步的研究。

值得注意的是，该系列参数最大的MobileLLM-R1 950M模型仅使用约2T高质量token进行预训练，总训练token量少于5T，但在MATH、GSM8K、MMLU和LiveCodeBench基准测试中，其性能与使用36T token进行训练的Qwen3 0.6B相当或更佳。

与现有的完全开源模型相比，尽管参数规模明显更小，MobileLLM-R1 950M模型在MATH基准上的准确率也比Olmo 1.24B模型高出约五倍，比SmolLM2 1.7B模型高出约两倍。此外，MobileLLM-R1 950M在编码基准测试中的表现远超Olmo 1.24B和SmolLM2 1.7B ，在完全开源模型中创下了新的最高水平。

MobileLLM-R1的发布引起了机器学习社区的讨论。这一方向的训练成本较为低廉，可以更加方便尝试各类最新论文提出的技术，更重要的是，模型体量的下降也意味着它可以覆盖更多端侧设备，实现更大面积的落地。

新闻拓展：

Meta开源MobileLLM-R1模型，不到1B参数，用1/10的训练就超越了Qwen3

宇树科技开源UnifoLM-WMA-0架构，助力机器人自主学习

大平台动作

9月15日，宇树科技宣布开源UnifoLM-WMA-0，其为宇树科技跨多类机器人本体的开源世界模型-动作架构，专为通用机器人学习而设计，其核心成分在于一个可以理解机器人与环境交互物理规律的世界模型。

该世界模型具备两大核心功能：

一是仿真引擎，作为交互式仿真器运行，为机器人学习提供合成数据；

二是策略增强，可与一个动作头进行对接，通过预测未来与物理世界的交互过程，进一步优化决策性能。

仿真引擎像一个虚拟训练场，可以生成大量合成数据供机器人学习和训练；策略增强可以预测机器人在真实环境中的下一步，为决策提供参考。根据公开演示，搭载该模型的机器人可以完成如按照红、黄、绿的顺序堆叠木块，整理橡皮和笔等日常物品，以及将黑色相机放入包装盒等复杂任务。

宇树科技表示，现将此世界模型—动作架构完整开源并持续更新，一起让通用机器人尽早成为可能。

此次开源将推动机器人从指令执行向自主学习进化，相关代码与文档已同步上线项目主页。该方案适配工业机械臂、服务机器人等多场景，为行业提供了可复用的通用技术框架。

新闻拓展：

开源！宇树科技重要动作

Luma AI发布Ray3：首款支持HDR视频生成的创新模型

新力量崛起

9月18日，Luma AI正式发布Ray3模型，这款被称为全球首个“推理视频模型”的产品，通过内置多模态推理系统彻底改变了AI视频生成的游戏规则。

Ray3的核心创新在于其智能推理能力。不同于传统的随机生成模式，这个模型能够像真正的创意伙伴一样理解用户意图、规划复杂场景并自我评估输出质量。它会先在“脑海”中构思故事板，然后进行迭代优化，这种类似动画师工作流程的方式显著提升了生成效果的准确性和艺术性。

技术规格方面，Ray3支持从草图到4K分辨率的完整创作链条。新增的草稿模式将生成速度提升了约20倍，让创作者能够快速测试多个创意方案。更重要的是，它是首款原生支持10位、12位和16位HDR视频生成的模型，采用ACES EXR格式输出，可直接导入专业后期制作管道。

从演示效果来看，Ray3在图像到视频转换方面表现出色，甚至能够解读图片中的涂鸦指令生成连贯的动态序列。物理模拟的真实感和角色一致性都达到了行业先进水平，生成视频的电影级质感令人印象深刻。

商业合作方面，Ray3已与Adobe Firefly深度整合，成为其首家第三方合作伙伴。日本数字营销公司Dentsu Digital、创意机构Monks UK等知名企业也已开始采用这项技术。

不过需要注意的是，虽然Ray3在技术指标上实现了显著突破，但AI视频生成的质量评判往往具有主观性。“令人叹服”的演示效果能否在实际使用中保持稳定性，还需要更多用户的实践验证。

新闻拓展：

https://lumalabs.ai/ray

AI推理芯片公司Groq完成7.5亿美元融资

投融资风向

当地时间9月17日，AI芯片初创公司Groq在官网宣布，已完成融资7.5亿美元。该公司融资后估值为69亿美元，在短短一年多的时间里翻了一倍有余。此轮融资由Disruptive领投，贝莱德（Blackrock Inc.）、路博迈集团（Neuberger Berman Group LLC）和德国电信资本合伙公司（Deutsche Telekom Capital Partners）等“大额投资”跟投，现有投资者包括三星电子、思科系统公司、D1和Altimeter。

Groq在一份声明中表示，参与投资的还包括一家“总部位于美国西海岸的大型共同基金”。

公司首席执行官乔纳森·罗斯（Jonathan Ross）表示，公司将利用这笔资金扩大其数据中心容量，包括在今年和明年新建数据中心。他还介绍，Groq计划今年宣布其首个亚太地区数据中心。

据了解，Jonathan Ross之前为谷歌Tensor处理单元核心团队成员。2016年，他在加利福尼亚州创建了Groq，专注于人工智能推理芯片研发，主要产品为语言处理单元（LPU）。该企业通过软件定义硬件架构优化能效比与成本控制，核心技术在动态调度算法和大规模并行计算单元领域。

Groq上一轮融资是在去年8月，获得BlackRock Inc.基金领投的6.4亿美元融资，思科和三星投资部门参与该轮融资。彼时估值为28亿美元。

从行业情况来看，当前全球AI芯片市场正在经历爆发式增长，据行业分析，2025年全球AI芯片市场规模预计将达到720亿美元，年复合增长率超过30%。NVIDIA（英伟达）虽然在训练芯片领域占据主导地位，但随着AI应用场景从研发向实际部署转移，推理芯片市场正成为新的战场，为Groq等创新企业提供了重要机遇。

据悉，目前已有多个大型科技公司和云服务提供商开始测试并部署Groq的技术，用于客服聊天机器人、实时搜索优化和个性化推荐等高时效性应用场景。

新闻拓展：

AI芯片独角兽一年估值翻番！放话“三年超英伟达”，最新融资53亿超预期

Figure完成10亿美元融资，估值达2700亿人民币

投融资风向

9月16日，机器人初创公司Figure宣布完成10亿美元C轮融资，投后估值390亿美元（约合人民币2700亿元），打破全球人形机器人公司估值记录。

成立于2022年的Figure起初并未进入主流投资人视野，创始人Brett Adcock曾回忆，公司早期被几乎所有科技投资人拒绝。在资金每月消耗100万美元的压力下，团队于成立一年内从零设计出人形机器人的大部分部件。

转机始于2023年5月，Figure完成7000万美元A轮融资，由Parkway Venture Capital领投，后续获得Big Sky Partners和Intel Capital等追加投资。2024年2月，公司完成约6.75亿美元B轮融资，贝索斯、微软、Nvidia和亚马逊附属基金均参与投资，估值升至26亿美元。

2025年初，Figure启动C轮融资，计划以400亿美元估值募集10亿至20亿美元。最终确认获得超10亿美元承诺资金，投后估值390亿美元，仅一年半时间估值翻了15倍。本轮融资由Parkway Venture Capital领投，Brookfield Asset Management、英伟达、麦格理资本、英特尔资本、LG Technology Ventures、Salesforce、T-Mobile Ventures和高通创投等共同参与。

Figure表示将加速通用人形机器人商业化进程，重点投入三方面：推动机器人进入家庭与商业运营领域、构建下一代GPU基础架构以加速训练与仿真、启动先进数据收集工作。公司强调团队、产品与路线均已准备就绪。

此前国内具身智能赛道存在泡沫争议，但随着Figure获千亿估值，市场重新评估行业价值。宇树科技6月融资时投前估值为百亿级别，业内认为“宇树们可能被低估”。Brett Adcock曾在访谈中提及宇树科技，承认中国工程团队在低成本、高效率方面的优势，并预测中国将成为全球机器人技术主要竞争者之一，最终成功者中“中国面孔一定不会缺席”。

新闻拓展：

王兴兴对手，估值2700亿

信息来源：WAIC综合整理

资讯配图

点击阅读原文查看WAIC 2025精彩！