
阿联酋推出低成本AI推理模型,宣称“性价比”超同行20倍
我国正在制定84项人工智能国家标准
重金留人!MiniMax、字节跳动重金发期权,AI人才争夺战升温
OpenAI支持AI动画电影《Critterz》,预计2026年全球上映
英伟达发布超长上下文推理芯片Rubin CPX
全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成
Thinking Machines发布首篇研究博客,揭示大语言模型推理中的不确定性根源
理想汽车OTA 8.0开启推送:全球首个VLA司机大模型上车
AI新贵Perplexity据悉获2亿美元融资,估值升至200亿美元
AI编程独角兽Cognition融资4亿美元,估值102亿
阿联酋推出低成本AI推理模型,宣称“性价比”超同行20倍
当地时间9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)在官网宣布,其与G42共同推出了一款低成本的推理模型“K2 Think”。
新闻稿声称,K2 Think仅需320亿个参数,却能超越其他公司的、规模大20倍的推理模型。该模型基于阿里巴巴开源Qwen 2.5模型构建,并在Cerebras提供的硬件上运行和测试。MBZUAI基础模型研究所所长Hector Liu告诉媒体,团队通过多种方法实现了高性能表现,包括:长链式思维监督微调(CoT) —— 一种逐步推理的方法;推理阶段扩展(test-time scaling) —— 在推理阶段分配更多计算资源来提升表现。Liu表示:“特别之处在于,我们把它当作一个系统来对待,而不仅仅是一个模型。和普通的开源模型仅仅‘发布’不同,我们会实际部署该模型,并观察如何随着时间的推移改进模型。”“如果问哪一步最关键,很难单独指出。这更像是一整套方法的组合,才得出了最终结果。”新闻稿写道,“K2 Think不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。”近年来,阿联酋也试图将自己定位为AI全球领导者,以提升地缘政治影响力,并减少对原油的依赖。阿联酋的AI企业G42就是其突围的例子。但其竞争对手包括邻国沙特,后者今年5月通过主权基金成立Humain,致力于打造全栈AI能力。尽管K2 Think的表现可与OpenAI相媲美,开发者强调,他们的目标并不是打造另一个ChatGPT。MBZUAI基础模型研究所总经理Richard Morton解释说,这个模型是为数学、科学等特定应用领域而设计。他说:“人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要1000到2000人耗费五年时间才能完成的问题思考或临床实验,大大缩短周期。”此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进AI技术。Morton总结道:“我们正在发现,用更少的资源,其实可以做到更多。”。
新闻拓展:
https://baijiahao.baidu.com/s?id=1842875305706858897&wfr=spider&for=pc
9月9日,国家市场监督管理总局新闻发言人、新闻宣传司司长王秋苹在2025年三季度例行新闻发布会上透露,目前,我国人工智能国家标准已经发布30项,正在制定的有84项,基本覆盖了基础软硬件、关键技术、行业应用和安全治理这些核心板块,为产业健康发展“铺好了轨道、筑稳了地基”。
她进一步介绍,尤其今年,市场监管总局在多模态大模型、智能体、具身智能等前沿方向,还有钢铁、电力等传统行业应用方面,新发布了10项国标,立项了48项技术文件,标准正加速牵引创新走向落地。“这些标准,实实在在成了产业的‘导航仪’和‘加速器’。”王秋苹举例,比如,“AI服务器性能测试方法”“异构加速器统一接口”等标准,把算力测评和软硬件接口统一起来,真正夯实了国产AI生态的根基。再比如,“人工智能生成内容标识方法”标准,就像给内容安全竖起“警示牌”、筑牢“防火墙”,为技术应用划出伦理底线。王秋苹还表示,中国牵头立项的《生成式人工智能风险处理指南》国际标准,正在把“中国方案”变成“世界语言”,为全球AI治理贡献中国智慧。对于机器人领域,王秋苹介绍,自2021年全国机器人标委会成立以来,已经发布国家标准126项,还有41项正在研制。覆盖工业、服务、人形、教育等多个领域,构建起“基础通用、零部件、整机、系统集成、行业应用”五位一体的标准框架,有力支撑了整个产业规范发展。王秋苹认为,人工智能正在为机器人“装上大脑”、“赋予灵魂”。具身智能、人形机器人,已经不再是科幻概念,而是实实在在的产业“新风口”。她进一步表示,“我们现在正全力推动15项人形机器人国标研制,接下来还会重点攻关人形机器人安全、驱动技术、数据利用等标准,给机器人产业插上‘标准的翅膀’,助力中国机器人飞得更高、更稳。”
新闻拓展:
https://baijiahao.baidu.com/s?id=1842776570174373382&wfr=spider&for=pc
重金留人!MiniMax、字节跳动重金发期权,AI人才争夺战升温
近日,“AI六小龙”之一的MiniMax传出启动百万美元期权激励人才的消息。根据员工对公司的贡献程度不同,MiniMax将向员工提供几十万美元到几百万美元不等的激励。9月8日,MiniMax确认了这一消息。
据MiniMax内部员工透露,本次期权发放来自于全员会口头通知,不仅是模型算法,产品、市场、增长、职能等岗位都在期权激励范围内,后续还会继续对突出贡献者进行即时期权激励。行业认为,大规模期权激励的背后,是AI行业愈演愈烈的人才争夺战与IPO预期的双重推动。此时加码激励既能稳定核心团队,也可通过期权绑定员工与公司长期利益。类似动作在业内并非首例。字节、月之暗面此前都曾传出期权激励的消息。9月4日,有消息称字节跳动近期为旗下Seed部门发放期权津贴,主要覆盖大模型方向的技术员工,据悉,根据员工综合绩效与职级差异分配,员工每月可获得价值9万元/11万元/13万元的字节期权,预计首批发放周期为18个月。Seed部门是字节大模型战略的核心团队,涉及模型训练、算法优化等多个关键技术方向。另一“六小龙”企业Kimi也传出近期为近百个K2项目员工发放“期权+现金”组合激励,并回购部分成熟期权以提升流动性。与这两家相比, MiniMax此次期权激励的突出特点在于覆盖非技术岗位,体现其全面业务导向的人才策略。今年来看,AI赛道头部企业的竞争正从技术研发、产品发布延伸至人才战略层面。在海外,Meta在7月打响了硅谷的AI人才争夺战,为打造“超级智能实验室”,Meta以千万美元薪酬招募数十位顶尖AI技术研究员,远超行业薪资水平,OpenAI、谷歌DeepMind成挖角重点。
新闻拓展:
重金留人!MiniMax发百万美元期权,AI人才争夺战升温
OpenAI支持AI动画电影《Critterz》,预计2026年全球上映
9月8日,据《华尔街日报》报道,OpenAI希望通过一部电影证明,生成式AI能够让电影制作比好莱坞目前的方式更快、更省钱。
为此,OpenAI正提供工具和算力资源,参与一部主要依靠AI完成的动画长片制作。影片名为《Critterz》,预计将在明年登陆全球院线。影片讲述了一群森林小动物在村庄被陌生人打乱后踏上冒险的故事。创意来自OpenAI的创意专家Chad Nelson,他早在三年前使用DALL-E尝试拍摄短片时,就开始绘制这些角色的草图。当前,Nelson已与伦敦和洛杉矶的制作公司合作,目标是在5月的戛纳电影节首映长篇版本。伦敦Vertigo Films联合创始人James Richardson表示,团队力争用九个月完成影片制作,而传统流程往往需要三年。《Critterz》的预算不到3000万美元,远低于大多数动画长片的成本。制作团队将聘请演员配音,并请艺术家绘制草图,然后输入OpenAI的GPT-5和图像生成模型。影片剧本由部分《帕丁顿熊在秘鲁》的编剧团队执笔,制作已经启动,配音演员将在未来几周敲定。资金由Vertigo的巴黎母公司Federation Studios提供。Nelson表示,参与制作的约30名工作人员将分享影片利润。Nelson指出,若《Critterz》成功,将证明AI能够支撑院线级作品,并推动好莱坞更快采用这项技术。同时,OpenAI的工具也能降低门槛,让更多人参与创作。OpenAI一名发言人表示,这部影片“体现了我们所倡导的创造力与探索精神”。不过,原创动画片上映风险极高,目前观众是否愿意买票仍未可知。影片团队还没有找到发行合作伙伴。Native Foreign联合创始人Nik Kleverov表示,虽然AI生成的内容无法获得版权,但由于影片使用了人类演员配音和艺术家手绘草图,仍有可能满足版权保护条件。
新闻拓展:
https://www.thepaper.cn/newsDetail_forward_31581432
9月9日,英伟达宣布推出首款专为大规模上下文处理而设计的专用GPU——Rubin CPX,适用于大规模编码和生成视频等高要求任务。
Rubin CPX通过将理解AI提示与生成响应的任务分离,提升客户处理效率。该硬件预计作为Vera Rubin平台的一部分运行,该平台整合了Vera CPU和Rubin GPU。全机架版本Vera Rubin NVL144 CPX拥有8 exaflops的AI性能。独立的Rubin CPX GPU包含128GB的GDDR7显存。英伟达承诺,新硬件具有3倍的attention capabilities,并使用公司的4-bit NVFP4精度提供30 petaflops的计算能力。英伟达CEO黄仁勋将Rubin CPX与RTX进行了比较,他说:“正如RTX革新了图形和物理AI,Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的1亿美元投资可以产生50亿美元的收益。英伟达表示,该硬件将得到其完整软件栈的支持,包括Nemotron——其一系列开放的多模态模型,专为构建企业级AI代理(旨在自主处理复杂任务的系统)而设计。Nemotron模型提供不同尺寸,从Nano用于设备端应用,到Super用于单GPU设置,再到Ultra用于大型数据中心。英伟达预计Rubin CPX将于2026年底推出。多家公司已表达合作意向。代码生成公司Cursor计划使用该技术进行代码生成,视频创作平台Runway将其应用于视频生成工作流程,AI研究公司Magic则计划利用该技术构建具有1亿token上下文窗口的基础模型。
新闻拓展:
英伟达发布Rubin CPX,瞄准超长上下文处理,黄仁勋称一次推理数百万token
全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成
9月12日,阿里云通义团队宣布推出其下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型(Instruct 与 Thinking)。
通义团队表示,Context Length Scaling和Total Parameter Scaling是未来大模型发展的两大趋势,为了进一步提升模型在长上下文和大规模总参数下的训练和推理效率,他们设计了全新的Qwen3-Next的模型结构。该结构相比Qwen3的MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。基于Qwen3-Next的模型结构,通义团队训练了Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿参数(仅激活30亿参数)、3B激活的超稀疏MoE架构(512专家,路由10个+1共享),结合Hybrid Attention(Gated DeltaNet + Gated Attention)与多Token预测(MTP)。该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。该模型原生支持262K上下文,官方称可外推至约101万tokens。据介绍,Instruct版在若干评测中接近Qwen3-235B,Thinking版在部分推理任务上超过Gemini-2.5-Flash-Thinking。其突破点在于同时实现了大规模参数容量、低激活开销、长上下文处理与并行推理加速,在同类架构中具有一定代表性。模型权重已在Hugging Face 以 Apache-2.0许可发布,并可通过Transformers、SGLang、vLLM等框架部署;第三方平台OpenRouter亦已上线。
阿里深夜干了件大事,成本暴降90%!
Thinking Machines发布首篇研究博客,揭示大语言模型推理中的不确定性根源
9月10日,由前OpenAI首席技术官Mira Murati创立的思维机器实验室(Thinking Machines Lab)在其全新发布的研究博客上抛出了一个令人震撼的研究方向:Defeating Nondeterminism in LLM Inference,克服大语言模型推理中的不确定性。
主要讨论的内容就是,为什么大模型每次的推理结果总是难以复现?这篇开创性的研究报告由思维机器实验室研究员Horace He撰写,他在文中提出了一个颇具颠覆性的观点。He认为,AI模型回答随机性的根源并不在于算法本身的复杂性,而是隐藏在更深层的技术架构中。具体来说,问题出现在GPU内核的运作方式上,这些运行在英伟达芯片内部的小程序在推理处理过程中的拼接方式直接导致了结果的不可预测性。推理处理是指当你在ChatGPT中按下回车键后所发生的一切计算过程。He大胆提出,通过精确控制这一层面的编排调度,完全有可能让AI模型变得更加确定性。这个看似技术性的改进实际上可能带来革命性的应用价值。对于企业和科学研究者而言,能够获得可重现的AI回答意味着系统的可靠性将得到质的提升。更为重要的是,He指出这种改进还能显著优化强化学习训练过程。强化学习是通过奖励AI模型正确答案来改进其性能的核心技术,但当答案总是略有不同时,训练数据就会变得嘈杂混乱。如果能够创造出更加一致的AI模型回答,整个强化学习过程将变得更加平滑和高效。这个技术方向的选择绝非偶然。根据The Information此前的报道,思维机器实验室已经向投资者透露,他们计划使用强化学习技术为企业客户定制专属的AI模型。这意味着确定性回答的研究直接服务于他们的商业战略,技术研发与市场需求实现了完美对接。Murati在今年七月曾经透露,思维机器实验室的首款产品将在未来几个月内正式亮相,这个产品将对研究人员和开发定制模型的初创公司特别有用。虽然具体的产品形态仍然成谜,但这次发布的研究内容很可能就是产品技术的重要组成部分。
新闻拓展:
她们估值840亿,刚发了第一个AI成果
理想汽车OTA 8.0开启推送:全球首个VLA司机大模型上车
9月10日,理想汽车宣布,其最新的OTA 8.0正式开启推送。此次更新包括54项新增功能,还对26项体验进行了优化。
其中理想汽车自研的新一代辅助驾驶技术架构——VLA(Vision-Language-Action)司机大模型向理想MEGA和理想L系列AD Max车型全量推送。理想汽车CEO李想发布微博宣称,伴随OTA8.0的发布,理想汽车的辅助驾驶和智能座舱,从“局部领先”进入“全面领先”。理想此次推出的VLA司机大模型,不再仅仅是执行指令的工具,而是试图成为一个具备“空间智能”“行为智能”和“语言智能”的“司机伙伴”。它围绕选路、控速、舒适、安心、沟通、效率六大维度,重新定义了辅助驾驶的用户体验。尤其值得注意的是VLA在沟通与信任构建上的突破。系统可实现“思维可视化”,在屏幕中实时展示决策过程,例如变道、绕行、红灯等待等场景下的推理逻辑。这一设计显著缓解了用户对“黑箱操作”的焦虑。更贴近用户的是其“车速记忆”功能。系统能学习用户在特定路段的驾驶偏好,之后再次通行即可自动恢复记忆车速。这种人车之间“默契”的建立,意味着AI正在从机械响应向情感化、个性化交互迈进。此次OTA中,“理想同学智能体”正式上线。它不再是简单的语音助手,而是进化成一个能听、能看、能操作应用的“智能执行者”。其推出的“桌面大师”功能,支持用户通过自然语言生成自定义桌面卡片,甚至开发简单应用和小游戏——这几乎是业内首次将低代码开发能力下沉至车端。另一方面,无麦K歌、支付宝停车缴费、美团秒提等高频场景功能的加入,也让车从“驾驶工具”进一步转向“生活伴侣”。尤其是“美团秒提”通过OCR识别与语音交互相结合,实现“说一句话,点单取餐”的全流程自动化,显示出智能车在本地生活服务中扮演更主动的角色。
新闻拓展:
OTA 8.0来了!“越开越新”的车,这次大有看头
AI新贵Perplexity据悉获2亿美元融资,估值升至200亿美元
9月11日,据消息人士称,人工智能(AI)搜索引擎公司Perplexity已从投资者处获得2亿美元的新融资承诺,公司估值达到200亿美元。目前尚不清楚最新一轮融资的领投方是谁。
Perplexity成立于2022年,其核心产品是由AI聊天机器人驱动的研究和对话搜索引擎。该公司早期投资者包括亚马逊创始人贝索斯、英伟达和风险投资公司New Enterprise Associates。根据PitchBook数据,自三年前成立以来,这家快速成长的AI公司累计融资已达15亿美元。Perplexity可能会将这笔资金用于并购。在过去一年里,该公司收购了浏览器开发商Sidekick、Carbon(该公司开发的软件使大语言模型能从不同应用中获取数据),并从AI应用与模型开发公司Rhymes AI挖走了一些员工。Perplexity被视为有望挑战谷歌在搜索领域的垄断地位。今年8月,Perplexity曾提出以345亿美元收购谷歌Chrome浏览器。此前,美国司法部指控谷歌存在反竞争行为,要求其剥离浏览器业务。不过,本月初,一名联邦法官裁定谷歌无需拆分搜索业务,这意味着谷歌可以继续保有Chrome。这并非该公司第一次提出“蛇吞象”式的收购。据央视财经今年1月援引知情人士报道,Perplexity曾向TikTok发出了合并提议,提议内容是将Perplexity AI、TikTok美国部门以及新的资本合作伙伴合并成一个新实体。Perplexity自身也是大公司的收购目标。据报道,苹果内部曾讨论收购Perplexity,以弥补其在AI领域落后于其他科技巨头的局面。不过,Perplexity首席执行官Aravind Srinivas此前表态称,他不希望公司被Meta和谷歌等大型科技巨头收购。Srinivas当时表示,他认为在AI竞赛中,大型科技公司和初创公司都有各自的发展空间。
新闻拓展:
https://www.huxiu.com/ainews/3424.html
AI编程独角兽Cognition融资4亿美元,估值102亿
9月8日,美国AI编程独角兽Cognition宣布获得超4亿美元的新融资,投后估值达到102亿美元,超越估值99亿美元的Anysphere(Cursor背后公司),成为全球AI编程赛道估值最高的企业。
今年8月15日,Cognition曾获得近5亿美元的融资,当时的投后估值为98亿美元。25天内,该公司已经斩获9亿美元的融资。Cognition成立于2023年,由华裔工程师Scott Wu、Steven Hao和Walden Yan联合创立,创始人均为国际信息学奥林匹克(IOI)金牌得主。 Scott Wu毕业于麻省理工学院,获计算机科学和数学学位,Steven Hao本科毕业于MIT计算机和数学专业,此前曾在Scale AI担任高级AI系统工程师,Walden Yan毕业于哈佛大学。 Cognition官宣的这轮融资由硅谷创投教父、PayPal创始人Peter Thiel旗下的Funders Fund领投,其他现有投资者也加倍投资,包括Lux Capital和8VC等。 这轮最新融资完成后,Cognition已经筹集了12亿美元的资金。AI编程企业在短时间内屡次获得高额融资并迅速抬升估值,显示出资本市场对这一市场的高度期待。同时,该领域的企业也逐渐开始整合。今年,除了Cognition、Anysphere、Lovable等几家头部企业之外,鲜少出现数亿美元级别的高额融资,未能获得持续融资的企业,可能会成为头部企业的潜在收购对象。
新闻拓展:
https://36kr.com/p/3459063073347208