来自埃隆·马斯克 AI 宇宙的一则新动态
大家好,
又到了周末,xAI 在发布 Grok 5 之前,出人意料地为我们带来了一些新东西。
那么,Grok 4 Fast 究竟是什么呢?

核心规格速览
它的上下文窗口达到了惊人的 200 万 token,而成本比 Grok 4 便宜了整整 47 倍。
在多项基准测试中,它都击败了 GPT-5 mini 的高配版。
模型平均减少了 40% 的思考 token,无论是在推理还是非推理模式下,输入成本均为每百万令牌 0.2 美元,输出为 0.5 美元。
它在 LMArena 的搜索竞技场中排名第一,胜过了 OpenAI 的 o3-search,更是在 AIME 2025 和 HMMT 2025 这两个竞赛中超越了自家的 Grok 4。
听起来是不是相当厉害?
核心特性解析
Grok 4 Fast 是 xAI 开发的一款极具性价比的人工智能模型。它的核心设计目标是在提供高速响应的同时,保持与前代模型 Grok 4 近乎同等的准确性。
这款模型兼顾了企业级和消费级应用场景,将推理与非推理能力巧妙地整合在同一个框架之中。
速度与效率
它比 Grok 4 少用了 40% 的思考 token,成本降低高达 98%,性能却能在 GPQA Diamond (85.7%) 等基准测试中与之一较高下。其响应速度据称比 Grok 4 快 10 倍,延迟极低,首个 token 的生成时间仅为 2.55 秒,输出速度更是高达每秒 342.3 个 token。
超大上下文窗口
它支持 200 万 token 的上下文窗口,这意味着它能轻松处理极其庞大和复杂的输入内容。
多模态能力
模型在编码可靠性、图像理解和语音功能方面都有所增强,非常适合快速生成代码建议、进行实时问答和起草文稿等任务。
极高的性价比
输入定价为每百万 token 0.20 美元,输出为 0.50 美元。经 Artificial Analysis 机构证实,这比市面上许多竞争对手都要便宜得多。
获取与使用
用户可以通过官网 grok.com、xAI 的 iOS 和安卓应用、OpenRouter、Vercel AI Gateway 以及 xAI API 访问它。目前它正处于抢先体验测试阶段,部分平台提供限时免费,并已向 SuperGrok、X Premium 和 Premium+ 用户开放。

社区反响与背景
其实,Reddit 上的侦探们和 Testing Catalog 早在近一周前的 9 月 14 日就发现了它的踪迹。
虽然 xAI 的人员流动率看起来不低,但他们的 AI 基础设施确实让他们能够快速迭代。(自从离开特朗普政府的DOGE后,埃隆·马斯克一直专注于 xAI 的事务)。

xAI 官方声称,Grok 4 Fast 展现了业界顶尖的「性价比-智能比」,是其深度搜索功能的理想搭档。
这有点像我们从阿里巴巴的 Qwen 模型身上看到的效率提升。官方的说法是:“Grok 4 Fast 在基准测试上取得了与 Grok 4 相当的性能,同时平均使用的思考 token 减少了 40%。”
对于 Grok 4 Fast,Grok 自己是这样评价的:
“Grok 4 Fast 会优先保证简单查询的速度,同时为数学、逻辑分析和编码等任务保留强大的推理能力。这使它成为开发人员、分析师和知识工作者们的理想工具,满足他们对快速、可靠输出的需求。不过,与那些更大的模型相比,它在处理极其复杂的推理时,可能会牺牲一些深度。
如今,许多大语言模型实验室都将目光投向了科研、白领以及广大的知识工作者群体。

它到底有多强?

它的性价比和速度确实非常吸引人。

更多亮点功能
基准测试表现:在专业评估中表现卓越,例如在研究生级别的科学问题测试中得分 85.7%,在 AIME 2025 数学竞赛中得分 92%,展现了强大的解题能力。
token 效率:通过优化的“思考”过程,将计算开销降低了 40%,实现了更快的推理速度,且无需大幅增加硬件投入,非常适合规模化部署。
上下文处理:200 万 token 的窗口足以一次性处理整个代码库、超长文档或连续对话,无需进行繁琐的分块或摘要。
多模态整合:能够无缝处理文本、图像和语音输入。例如,它可以分析上传的工程图纸,或实时转录并回应语音提问。
编码能力增强:为 Python、JavaScript 和 Rust 等语言提供可靠的代码生成、调试和优化建议,专注于为快速原型开发提供简洁、可执行的输出。
语音模式:这是 Grok 移动应用独有的功能,通过自然的语音合成实现免提互动,对司机或多任务处理者等移动用户来说堪称完美。
企业级应用:它为商业工作流程量身定制,可用于自动生成报告、数据分析和构建客服机器人,并能通过 API 与 Slack、Jira 等工具集成。
消费级功能:在处理像菜谱改编或旅行规划这类日常问题时,它能给出快速而巧妙的回答,并保持 Grok 标志性的幽默感。
关注可持续性:更低的 token 使用量意味着每次查询的能耗也更低,这与 xAI 追求高效 AI 开发的目标不谋而合。
未来路线图:作为早期测试版,它为未来的功能升级铺平了道路,例如实时协作工具以及与 xAI 生态系统的深度整合。社区的反馈将是驱动其不断迭代的关键。

总而言之,Grok 4 Fast 看起来是一个相当不错的科研和应用选项。

它似乎正在推动整个大语言模型领域向前发展,就像谷歌和 Qwen 在 2025 年所做的那样,这在一定程度上弥补了 OpenAI 的 GPT-5 带来的平淡感。
尽管 Grok 4 Fast 不像 Anthropic 那样专注于 AI 编码,但它给人的感觉更像是一个面向消费者的模型,而非面向企业的。

市场表现与用户增长
Grok 应用的下载量在 2025 年有所提升,但截至 8 月,总下载量约为 1000万次,算不上惊艳。
考虑到其巨大的资金消耗和模型能力,xAI 若想成为行业内的重量级玩家,仍有很长的路要走。
截至今年 8 月,Grok 的月活跃用户大约在 3000 万的水平。

这个数据来自 Semrush。考虑到他们在 AI 基础设施上的巨大投入,这个成绩并不算理想。他们的市场、品牌和产品营销亟待加强。
在 2025 年 7 月发布 Grok 4 后,Grok 增加了 900 万月度用户。
预计 2025 年晚些时候发布的 Grok 5,可能会带来一波更大的增长。
虽然我不认为 Grok 4 Fast 是一次颠覆性的升级,但它无疑是一个非常实用的模型,大大提升了 Grok 的吸引力。
就我个人而言,我现在主要用它进行深度搜索,多数时候它取代了 Gemini、Claude 和 ChatGPT。但这也仅仅是我的个人习惯。
不过,凭借其出色的性价比,Grok 4 Fast 的 API 应该能抢占更多市场份额,吸引更多开发者使用。

2025 年 9 月 20 日的初次亮相相当不错:它的性能与 Gemini 2.5 Pro 大致相当,但价格却便宜了 25 倍。

另外,Grok 应用在 Google Play 商店的下载量也已超过 5000 万次。
它是有史以来推理速度最快的模型吗?

它会是 AI 搜索的颠覆者吗?

想到这一点很有趣。

它在编码方面也快如闪电

如果我们相信其基准测试数据,那么 xAI 在 2025 年的 AI 编码能力上,相对于其他对手确实取得了长足的进步(尽管 Claude 通常被认为是该领域的领导者)。
值得一提的是,Grok 在 2025 年 4 月与 Telegram 的整合,也对其用户增长和活跃度起到了推动作用。
目前,Grok 在印度市场增长迅速。在过去 18 个月里,Gemini 和 ChatGPT 已经在该市场取得了巨大的成功。
参考资料:https://www.testingcatalog.com/xai-launches-grok-4-fast-in-early-access-beta-with-up-to-10x-speed/
https://artificialanalysis.ai/models/grok-4-fast-reasoning
https://www.reddit.com/r/singularity/comments/1nlj6q0/xai_releases_details_and_performance_benchmarks/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!