【导读】GPT-5更近了！今天，神秘模型Horizon Alpha火遍全网，编码首测性能逆天，各种三方基准实测相继放出。就在发布前夕，OpenAI核心大脑专访坦言模型还有瓶颈，但坚信Scaling Law没有尽头。

GPT-5的发布前兆，愈发强烈了。

今早，一款神秘模型Horizon Alpha突然上线OpenRouter，各种榜单和测试席卷了全网。

Horizon Alpha模型的上下文为256K，响应极速，非常擅长创意写作。

它还具备了「推理」功能，不过，推理token的预算是o4-mini的两倍。

在编程方面，Horizon Alpha堪称无敌了。

它可以一句话生成「水果忍者」、「外星人抓奶牛」等各种游戏，能根据logo图直出广告，还能轻而易举地通过「六边形物理模拟」测试。

左右滑动查看

在写作EQ-Bench基准测试中，Horizon Alpha位列第一，远超o3、Gemini 2.5 Pro。

左右滑动查看

更令人惊叹的是，它竟能在30秒内，完成20位数与20位数的乘法运算。

此前被爆料的各种代号模型，比如lobster、zenith、summit等，在多项测试中惊艳了所有人。

种种迹象表明，GPT-5「全家桶」绝对是个地表最强模型。

谷歌收录GPT-5的OpenAI文档页面，目前404

关于Horizon Alpha的更多细节，全部浓缩在网友的实测中了。

神秘Horizon Alpha登场，编程强到逆天

目前，在OpenRouter平台上，即可开启对Horizon Alpha版本的测试。

传送门：https://openrouter.ai/chat?room=orc-1754007231-sX8GtgCUyNkHh6O6In2l

在模型推理时，相较于Claude Sonnet 4（60-80 token/s），Horizon Alpha的吞吐量是最快的，达120个token/s。

吞吐量对比测试，Horizon Alpha是目前最快的。

物理模拟惊艳，秒搭网页

有网友让其创建一个功能完整的Windows 95复古桌面，效果令人惊喜且生成速度极快。

另一个让小球在多边形中，模拟物理的测试。

不论是六边形，还是三角形，即便小球可运动的区间缩小，也不会影响效果。

再上点难度，20个球在旋转的七边形内弹跳。网友惊讶地表示，「这是自己目前见过最出色的版本之一」。

Horizon Alpha能够在3分48秒中，创建一个展示一系列简单有趣的浏览器小游戏的网页。

给Horizon Alpha同一个提示，「创建一个视觉上有趣的着色器，可以在 twigl 应用中运行，让它看起来像暴风雨中的海洋」。

沃顿商学院CS教授Ethan Mollick惊叹道，这是迄今为止最好的，而且创建速度非常快。

当网友要求其「创建一个与遛狗的商业网站」，Horizon Alpha爱问一大堆需要提前确认的问题；Sonnet 4则会直接给出解决方案。

左：Horizon Alpha；右：Claude Sonnet 4

最终，从搭建的效果来看，Horizon Alpha输出的质量高且简洁。Sonnet 4输出的更长，内容更全面，也更具创意。

上：Horizon Alpha；下：Claude Sonnet 4

Horizon Alpha还会自主搭建一个银行网站。

设计一绝，审美感在线

AI大佬Matthew Berman亲自测试其SVG创建和UI设计功能，Horizon Alpha瞬间生成了一张专业设计美感的图。

此前，AI圈大神Simon Willison曾表示，从一张「骑自行车的鹈鹕」就可以看透AI进化史。

如今，用Horizon Alpha生成同款SVG测试，是所有模型当中最强的那个。

其他一些SVG优秀案例。

左右滑动查看

需要注意的是，虽然各种测试表现不凡，不过根据多方推测，Horizon Alpha可能只是一款小模型。

不管是GPT-5中的哪一款，接下来就坐等OpenAI发布了。

OpenAI「双雄」专访，奥特曼盛赞

就在GPT-5发布前夕，OpenAI双雄——首席科学家Jakub Pachocki和研究主管Mark Chen重磅采访同时放出了。

这对黄金搭档，可是研发GPT-5的「双巨头」。

这篇由MIT Technology Review做的独家专访，没想到深得奥特曼的心。

他对此大加赞赏，「我通常认为这类文章说不到点上，但这篇确实抓住了两人合作精髓」。

能够得到奥特曼的高度认可，究竟讲了什么？

OpenAI最佳拍档

熟悉OpenAI内部人员变动的人都知道，Jakub Pachocki和Mark Chen都是后起之秀。

他们风格迥异，却形成了完美的互补。

Mark Chen，曾经的华尔街量化交易员，着装考究，谈吐间挥洒自如，可以说与AI毫不搭界。

入职OpenAI后，他迅速成长为DALL·E和GPT-4多模态能力、Codex背后的关键推手，擅长将复杂的研究转化为人人可用的产品。

而Jakub Pachocki，一位低调的理论计算机科学家，接替了离职后的Ilya，痴迷于突破AI逻辑与创造力的极限。

关于内部的角色分工，Pachocki是这么说的，「Chen负责组建和管理研究团队，而我负责设定研究路线图，并确立我们长期的技术愿景」。

他们之间合作模式，可以说是「无缝切换」。

不论技术难题多么复杂，Pachocki和Mark总能非常默契，迅速分工合力攻克。

AGI标尺，自主时间

当前，外界对GPT-5的期待，是一款更强、更快、更全能的巨兽。

采访中，Mark Chen虽未直面GPT-5问题，却坦言「我们始终在努力理解深度学习的技术瓶颈，即便是当前最强推理模型，也无法有效将知识串联起来」。

Pachocki补充道，「我们仍处于推理范式最开端」。

如何让一款模型进行长期的学习和探索，并提出新颖的想法，才是至关重要。

同时，在他们看来，Scaling Law远未触及天花板，通过投入更多计算资源、数据，模型就会变得越来越好。

被问题如何看待AGI时，Mark Chen提出了一个指标——模型能更长时间地自主工作的能力，即「自主时间」。

这个概念简单却深刻，它代表着AI在面对复杂问题时，能持续取得进展，而无需人类干预的时间长度。

这个愿景，远远超出了当前模型的能力，自主时间仅限于几分钟到一小时，遇到陌生场景往往会「卡住」。

数学+编程，摘下AI圣杯？

前段时间，OpenAI模型在两项顶级竞赛中取得佳绩：

一是，在AtCoder世界巡回赛总决赛中获第二名；二是，在IMO 2025大赛中夺下金牌。

在AtCoder比赛中，Psyho的胜利展现了人类独有的创造性思维，类似AlphaGo当年击败李世石的围棋比赛。

Pachocki表示，「我们在这里谈论的是编程和数学，但它实际上关乎创造力，提出新颖的想法，将不同领域的想法联系起来」。

在他们二人看来，数学和编程是「通用智能」的基石。

参考资料：

https://x.com/karminski3/status/1950987896565182587 https://x.com/chetaslua/status/1950784759799718161

https://www.technologyreview.com/2025/07/31/1120885/the-two-people-shaping-the-future-of-openais-research/

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

相关阅读

干货推荐：

【AI加油站】第一部：《大型语言模型应用检索增强生成：改变搜索、推荐和 AI 助手》附下载

【AI加油站】第二部：《程序员的自我修炼手册》（附下载）

【AI加油站】第三部：《大规模语言模型：从理论到实践》（附下载）

【AI加油站】第四部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第五部：《使用生成式人工智能和Python开始数据分析》（附下载）

【AI加油站】第六部：《时间序列：建模、计算与推断》（附下载）

【AI加油站】第七部：《因果关系的逻辑理论的好书-A Logical Theory of Causality》（附下载）

【AI加油站】第八部：《模式识别（第四版）-模式识别与机器学习》（附下载）

【AI加油站】第九部：《Python深度学习（中文版）》（附下载）

【AI加油站】第十部：《机器学习方法》（附下载）

【AI加油站】第十一部：《深度学习》（附下载）

【AI加油站】第十二部：《从零开始的机器学习》（附下载）

【AI加油站】第十三部：《Transformer入门到精通》（附下载）

【AI加油站】第十四部：《LLM 应用开发实践笔记》（附下载）

【AI加油站】第十五部：《大模型基础完整版》（附下载）

【AI加油站】第十六部：《从头训练大模型最佳实践》（附下载）

【AI加油站】第十七部：《大语言模型》（附下载）

【AI加油站】第十八部：《深度强化学习》（附下载）

【AI加油站】第十九部：清华大学《大模型技术》（附下载）

【AI加油站】第二十部：Prompt入门神书-《Prompt 学习指南》（附下载）

【AI加油站】第二十一部：吴恩达&open AI联合推出《大模型通关指南》（附下载）

【AI加油站】第二十二部：《李宏毅深度学习教程》值得反复阅读的神书！（附下载）

【AI加油站】第二十三部：Prompt经典中文教程-《提示工程指南》（附下载）

【AI加油站】第二十四部：爆火下载28万次！MIT最新神书《理解深度学习》（附下载）

【AI加油站】第二十五部：LLM4大名著，OpenAI专家强推《深度解析：大语言模型理论与实践》（附下载）

【AI加油站】第二十六部：NLP大牛Thomas Wolf等新书《Transformer自然语言处理》（附下载）

【AI加油站】第二十七部：哈工大博士耗时一年整理《PyTorch常用函数手册》，轻松掌握PyTorch的各种操作（附PDF下载）

【AI加油站】第二十八部：大模型炼丹大师必备《深度学习调优指南中文版-系统性优化模型》（附下载）

【AI加油站】第二十九部：炸裂发布！《大语言模型：导论》重磅发布！（附下载）

【AI加油站】第三十部：最值得读的LLM书！下载量10w+！《基于Transformer和扩散模型的生成式AI》（附下载）

【AI加油站】第三十一部：RL稀缺宝典！《强化学习的艺术》（附下载）

【AI加油站】第三十二部：一本醍醐灌顶的教科书！《大语言模型提示工程：构建LLM应用的艺术与科学》（附下载）

【AI加油站】第三十三部：机器学习好评榜第一《机器学习基础》（附下载）

【AI加油站】第三十四部：所有大模型领域学习者必读，没有之一！由深度学习三巨头联合撰写！（附下载）

【AI加油站】第三十五部：{AI炼丹神书}——从0到1榨干深度学习模型每一滴性能的终极战术手册《深度学习调优指南》（附下载）

【AI加油站】第三十六部：面向生产环境的大型语言模型实战手册《LLM 大语言模型构建指南》（附下载）

【AI加油站】第三十七部：《深度学习的数学导论：方法、实现与理论》从神经网络架构到物理信息模型的全景综述（附下载）

【AI加油站】第三十八部：下载量10w+！《大型语言模型：语言理解和生成》从文本分类到主题建模的实战指南（附下载）

【AI加油站】第三十九部：包教包会！《从零开始构建大语言模型的关键要点》大模型训练全景指南：从0到1的系统性最佳实践（附下载）

面试推荐：

【AI加油站】AI面试专题一：BIO,NIO,AIO,Netty面试题（附下载）

【AI加油站】AI面试专题二：Git常用命令面试题（附下载）

【AI加油站】AI面试专题三：Java常用面试题（附下载）

【AI加油站】AI面试专题四：Linux系统的面试题集（附下载）

【AI加油站】AI面试专题五：Memcached 面试题集（附下载）

【AI加油站】AI面试专题六：MyBatis框架的面试题（附下载）

【AI加油站】AI面试专题七：MySQL相关的面试题资料（附下载）

【AI加油站】AI面试专题八：Netty面试题资料（附下载）

【AI加油站】AI面试专题九：Nginx的面试题资料（附下载）

【AI加油站】AI面试专题十：RabbitMQ的面试题资料（附下载）

【AI加油站】AI面试专题十一：Redis的面试题资料（附PDF下载）

【AI加油站】AI面试专题十二：Spring的面试题资料（附PDF下载）

【AI加油站】AI面试专题十三：Apache Tomcat的面试题资料（附PDF下载）

【AI加油站】AI面试专题十四：Zookeeper的面试题资料（附PDF下载）

【AI加油站】AI面试专题十五：《阿里巴巴Java开发手册》终极版的面试题资料（附PDF下载）

【AI加油站】AI面试专题十六：大数据技术面试题资料（附PDF下载）

【AI加油站】AI面试专题十七：Java并发多线程面试题资料（附PDF下载）

【AI加油站】AI面试专题十八：设计模式的面试题资料（附PDF下载）

【AI加油站】AI面试专题十九：Java虚拟机（JVM）的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十：Elasticsearch的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十一：TCP UDP Socket Http网络编程的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十二：消息队列Kafka的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十三：Spring Boot的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十四：Spring Cloud的面试题资料（附PDF下载）

【AI加油站】AI面试专题二十五：Dubbo的面试题资料（附PDF下载）

大模型课程推荐：

【AI加油站】大模型课程系列一：大模型应用：从提示工程到AI智能体——系统化知识地图（附PDF下载）

【AI加油站】大模型课程系列二：大模型应用：从提示工程到AI智能体——系统化知识地图--合集（附PDF下载）

人工智能产业链联盟高端社区

精选主题推荐：

Manus学习手册

从零开始了解Manus

DeepSeek 高级使用指南，建议收藏

一次性说清楚DeepSeek，史上最全（建议收藏）

DeepSeek一分钟做一份PPT

用DeepSeek写爆款文章？自媒体人必看指南

【5分钟解锁DeepSeek王炸攻略】顶级AI玩法，解锁办公+创作新境界！

DeepSeek接入个人微信！24小时智能助理，随时召唤！

PS×Deepseek：一句话编写PS脚本，搞定PS批量导出图层

如何让AI给自己打工，10分钟创作一条爆款视频？

荐：

【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！

【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！

【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！

声明

免责声明：部分文章和信息来源于互联网，不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题，请立即与小编联系（微信号：913572853），我们将迅速采取适当的措施。本订阅号原创内容，转载需授权，并注明作者和出处。如需投稿请与小助理联系（微信号：AI480908961）

编辑：Zero