一日三连发!OpenAI踏上开源路,Anthropic抢占AI编码高地,谷歌拿出最强世界模型

头部科技 2025-08-06 19:46
资讯配图
资讯配图
文丨丁灵波

今天,OpenAI、Anthropic和谷歌再次扎堆儿发布了各自的最新前沿模型,市场交锋更加激烈。


Anthropic推出了Claude Opus 4.1,相较于上代Opus 4性能改进显著,该模型在SWE-bench Verified基准上准确率提升至74.5%,超越了OpenAI 的o3模型(69.1%)和谷歌Gemini 2.5 Pro(67.2%),加强了在AI编码领域的市场地位。

资讯配图

谷歌拿出一款最新前沿世界模型Genie 3,用户仅用一段文本提示词描述即可创建交互式、可玩的动态世界环境,从仿真世界到游戏世界均可模拟。


OpenAI则在开源方向迈出了关键一步,发布了gpt-oss-120b和gpt-oss-20b,试图在开源市场分一杯羹,至于GPT-5何时推出、能不能远超竞争对手仍然存在悬念。


资讯配图
降维施压开源阵营

gpt-oss-120b和gpt-oss-20b是两款性能突出的轻量级模型,展现了OpenAI将部分封闭模型能力进行逐步开放的市场策略,试图对爆火的开源阵营进行降维压制。


这些模型在Apache 2.0许可下提供,与同等规模的开放模型相比,在推理任务中表现更优,并针对在高端硬件上部署进行了优化,可以在电脑或体积更小的手机上本地运行,而且专为在智能体工作流中使用而进行了优化,具备更好的指令执行能力、工具使用能力(如网页搜索或Python代码执行)以及推理能力。


资讯配图


Gpt-oss-120b模型在核心推理基准测试中与o4-mini模型几乎持平,同时能在单个80GB GPU上高效运行;Gpt-oss-20b模型在核心推理基准测试中与o3‑mini模型取得类似结果,可在仅配备16GB内存的边缘设备上运行,形成设备端应用、局部推理或耗费昂贵基础设施的快速迭代的理想选择。


资讯配图
资讯配图
资讯配图


有开发者表示:“OpenAI的开源模型要比Kimi K2、R1和Qwen 3更智能,我对所有模型都进行了一些测试,并得到了非常肯定的结果,OpenAI-OSS-120b更胜一筹。”


资讯配图
资讯配图

OpenAI目前备受外界关注的是其GPT-5模型,近期,Sam Altman在社交媒体制造各种悬念进行预热,并多次分享自己内测使用GPT-5时体验到AGI的“震撼”感受。
不过,炒作之余,据The Information援引多位内部人士消息透露,GPT-5的升级主要集中在解决数学问题和编写软件代码方面——可能无法与早期GPT模型的性能大飞跃相提并论,例如从2020年的GPT-3到2023年的GPT-4之间的改进,GPT-5更多是渐进式改进。
资讯配图
AI编码一枝独秀
在GPT-5发布之前,Anthropic的新Claude 4.1在AI编码领域加强了防守,其聚焦在AI编码领域的市场打法近期成效显著。
资讯配图

当前正值Anthropic业务惊人增长之际,行业数据显示,其年度经常性收入在过去短短七个月内增长了5倍,从10亿美元增至50亿美元,此次模型升级被视为是Anthropic在GPT-5推出之前巩固其行业地位的最新举措。


资讯配图

虽然专注于AI编程有利可图,但风险也大,最明显的是产生了明显的业务依赖性:其31亿美元的API收入中,近一半来自两家大客户——编码助手Cursor和微软GitHub Copilot,这两家公司合计带来了14亿美元的收入,如果GPT-5出现后吸引Cursor和GitHub Copilot转向OpenAI模型,对于Anthropic来说可能会出现剧烈营收震荡。


资讯配图
世界模型全新能力

作为目前综合AI实力最强的巨头,谷歌DeepMind新发布的Genie 3被视为是世界模型的全新分水岭。


这是一个通用世界模型,用户仅需一段文字提示词,Genie 3就能对任何能够想象的世界生成长达数分钟的实时多样化交互模拟,从照片般逼真的风景到奇幻的虚拟世界,AI生成世界的可能性无穷无尽。


资讯配图

世界模型是迈向通用人工智能(AGI)的关键基石,因为它们使得在丰富多样的模拟环境中训练AI代理和具身机器人成为可能,去年,谷歌就推出了Genie 1Genie 2两个基础世界模型,此外,通过Veo 2和Veo 3模型迭代推动AI视频生成技术的发展,如今走向了技术大融合。


资讯配图

DeepMind首席执行官Demis Hassabis表示:“它还在快速改进——总有一天,我们能真正建造出科幻片中的全息甲板。”


Genie 3的功能变得更加全面,可模拟世界的物理特性和相互作用,比如第一人称视角生成一个街道漫步视频,导航到一辆车并能打开车门。


资讯配图

比如提示穿飞行服穿越阿尔卑斯山,地形为陡峭的山崖峭壁,山上覆盖着绿色植被,岩石呈灰白色。


资讯配图

Genie 3生成的视频世界可实现高度的可控性和实时交互性,关键技术在于每一帧的自回归生成过程中,模型必须考虑先前生成的随时间增长的轨迹。


为了使AI生成的世界具有沉浸感,它们必须在很长一段时间内保持物理一致性,然而,自回归生成环境通常比生成完整视频更难,因为误差往往会随着时间的推移而积累,但Genie 3的环境在几分钟内仍能保持基本一致,视觉记忆可以追溯到一分钟前。


资讯配图

长期环境一致性是一项新兴能力,其他方法例如NeRF和高斯分布,也能实现一致的可导航3D环境,但依赖于提供明确的3D表示,相比之下,Genie 3生成的世界更加动态和丰富,因为它们是根据世界描述和用户操作逐帧创建的,较高的一致性可以支持执行更长的操作序列,使智能体在现实世界中发挥更大的作用。


不少首批上手Genie 3的开发者表示,这是尝试过的第一个泛化能力如此出色且具有长期世界一致性的世界模型,可能是迈向通用人工智能(AGI)之前的最后一块拼图,不过,目前Genie 3也仅支持几分钟的持续交互,无法支持长达数小时的交互。


三家世界头部AI公司的新动作正在悄然重构下一轮AI模型竞争格局,国内厂商们将如何跟进布局值得关注。


-END-

资讯配图
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【2025免费新年礼】:了解最新科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会,领取100份AI科技商业研报合集,加群共同探讨与成长——
扫描下方二维码,添加头部科技晶总微信!
资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI IC 开源
more
腾讯开源“世界生成器”,可漫游&仿真生成360度沉浸式{宇宙工厂},颠覆游戏引擎+3D建模!
刚刚,小米又开源一大模型,22个公开测评SOTA
Qwen新开源,把AI生图里的文字SOTA拉爆了
业界首个具身智能操作系统来了,智元机器人发布"灵渠OS"开源计划
OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑
Claude Opus 4.1代码实测惊人!OpenAI开源模型却只会写屎山?
【AI】科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗
小米模型实现声音理解新SOTA!数据吞吐效率暴增20倍,推理速度快4倍 | 全量开源
刚刚,腾讯混元一口气开源4款小模型,手机也能跑
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号