【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

人工智能产业链union 2025-09-27 14:55

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图1
【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图2

【导读】xAI重磅推出Grok 4 Fast,创新融合推理与非推理双模式,支持200万token上下文。在NYT Connections基准和AA智能指数中表现卓越,超越多家顶级模型,标志着AI智能获取门槛的进一步降低。

Grok 4 Fast官宣上线,马斯克再次兑现了承诺!

它首次将推理/非推理「双模式」合一,支持200万上下文,直接刷爆性价比SOTA。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图3

推理测试中,Grok 4 Fast直接碾压前代Grok 3 Mini,尤其是数学、编码性能大增。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图4

基准测试显示,Grok 4 Fast Reasoning登顶了扩展版NYT Connections Benchmark(纽约时报连线谜题基准测试,共759道题)。

Grok 4则排名第2,xAI在这个项目上展现了绝对的统治力。

对此,马斯克自豪地表示,这就是进展!

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图5

Grok 4 Fast Reasoning不仅击败了自家大哥Grok 4,也将GPT-5、o3-pro、Gemini 2.5 Pro、DeepSeek和Qwen 3等一众模型斩于马下。

Grok 4发布之后,基本上xAI一月一迭代,速度堪称惊人。


【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图6
25/1成本,堪比Gemini 2.5 Pro


技术博客中,介绍了Grok 4 Fast所具备的四大核心优势:

基于大规模RL技术,xAI团队将Grok 4 Fast智能密度推向了极致。

实测表明,新模型性能直逼Grok 4,但平均节省了40%推理token的消耗,成本直降98%。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图7

Grok 4 Fast不仅在NYT Connections Benchmark上表现出色,在著名的Artificial Analysis Intelligence Index(AA智能指数)上同样表现不俗。

它以大约25分之一的成本就实现了Gemini 2.5 Pro级别的智能

Grok 4 Fast是一个将reasoning和non-reasoning融合统一的模型。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图8

在推理模式下,Grok 4 Fast Reasoning在AA智能指数上取得了60分的亮眼成绩,与Gemini 2.5 Pro和Claude 4.1 Opus相当。

低于此前发布的Grok 4和GPT-5(high)。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图9

在编码评测中,Grok 4 Fast表现尤为出色,在他们的LiveCodeBench榜单上登顶第一,甚至超越其体量更大的自家大哥Grok 4。

成本方面Grok 4 Fast也挺有优势:输入0.2美元每百万Tokens,输出0.5美元每百万Tokens。而且输出效率很高。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图10

Artificial Analysis在对Grok 4 Fast的预发布API进行基准测试时,发现它的速度惊人非常迅速,达到了每秒344个输出Token——约为 OpenAI GPT-5 API的2.5倍。端到端时延仅3.8秒,是目前最快的前沿模型。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图11【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图12

Grok 4 Fast的发布延续了这个趋势:获取AI智能的成本正在快速下降

在过去一年半里,获取GPT-4级别智能的成本已下降约500倍;而且随着智能前沿不断被推进,获取成本仍在持续走低。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图13

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图14

原生工具调用


通过端到端工具使用RL训练,Grok 4 Fast特别擅长智能判断,何时调用代码执行、网页浏览等工具。

举个栗子,在搜索时,它可以像人类一样流畅地浏览网页和X平台,并用实时数据增强查询结果——

自动跳转链接、解析X上图文视频内容,并以闪电速度整合信息得出结论。

可以看出,Grok 4 Fast基准测试中,工具调用、深度研究等能力上完胜Grok 4。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图15

现在,通过API即可调用推理/非推理Grok 4 Fast,每100万token价格再创新低。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图16



【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图17
什么是NYT Connections Benchmark?


NYT Connections Benchmark(纽约时报连线谜题基准测试)的核心源于《纽约时报》推出的益智游戏「Connections」,后被转化为评估大语言模型「语义关联与分类推理能力」的重要基准。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图18

地址:https://github.com/lechmazur/nyt-connections/

其核心逻辑与原始游戏一致:给定16个看似无关联的词语,AI需从语义、逻辑或常识维度,将它们精准划分成4组(每组4个词),且每组需符合一个明确的「潜在关联主题」(例如不同类型的水果、计算机硬件部件、经典文学角色等)。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图19

而此次Grok 4 Fast参加的「扩展版」在基础规则上进一步提升难度——每个谜题额外增加多达4个「技巧词」(即易混淆、可能同时贴合多个主题的干扰词),更考验AI排除干扰、精准捕捉深层语义关联的能力。

举两个栗子。大家感受一下难度。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图20【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图21

在扩展版上模型的排名如下图,xAI一家占据前两名。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图22

为排除LLM的训练数据中包含答案的可能性,基准方还仅对最新增加的100道谜题进行了测试。

结果依然是xAI家的Grok 4、Grok 4 Fast Reasoning排名前两位,只不过这次大哥终于排第一了。

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图23

看来Grok 4 Fast Reasoning在智能上确实有两下子,结合其速度快、价格低的优势,很有可能成为开发者的新宠。

参考资料:
https://x.com/Prashant_1722/status/1969352801290436855
https://github.com/lechmazur/nyt-connections/
https://x.com/mark_k/status/1969423645463150990
https://x.ai/news/grok-4-fast
https://x.com/ArtificialAnlys/status/1969180023107305846

☟☟☟


精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:




 10份北京大学的DeepSeek教程

8份浙江大学的DeepSeek专题系列教程

4份51CTO的《DeepSeek入门宝典》

5份厦门大学的DeepSeek教程

10份浙江大学的DeepSeek公开课第二季专题系列教程

6份浙江大学的DeepSeek公开课第三季专题系列教程


相关阅读

干货推荐:

AI机器人设计推荐:
RPA 流程自动化系列推荐:
面试推荐:
大模型课程推荐:

人工智能产业链联盟高端社区




【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图24
精选主题推荐:

荐:
【中国风动漫】《姜子牙》刷屏背后,藏着中国动画100年内幕!

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图25
声明

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)

编辑:Zero

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图26


【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图27

【AI】马斯克Grok4Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini图28

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI EMI
more
阿里达摩院×浙大发布 | 具身大模型新SOTA:比 Gemini-2.5 Pro 还强 10.7 分!
活动预告|华大九天发力制造端,亮相制造年会&SEMI-e创新展
马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini
12/12 满分!Open AI 首次出征 ICPC 即满分夺冠,谷歌 Gemini 斩获10 题,最强程序员大学生惜败
刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平
刚刚,Gemini「灵魂人物」官宣加盟xAI!马斯克火速转推背书
SEMICON台湾技术论坛报告总结:AI时代半导体材料创新(二)先进封装、异质整合与协作战略
SEMICON台湾技术论坛报告总结:AI时代半导体材料创新(三)EUV光刻胶、先进封装与方形硅晶圆突破
谷歌与OpenAI同获ICPC 2025金牌!GPT-5满分夺冠,Gemini攻破人类队伍都没解出的难题
DeepMind团队万字实录揭秘:Gemini 2.5图像生成实现像素级精准编辑,不止P图那么简单,谷歌想让AI比你更懂你
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号