Karpathy：写了20年代码，现在像作弊

新智元 2026-03-15 15:30

新智元报道

编辑：倾倾

【新智元导读】vibe coding这个词，是一年前Karpathy造的，现在他自己不用了。110次实验，AI Agent自主跑完，全程没碰键盘，顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话：专家不会消失，但专家能做到的事，边界变了。

去年2月，Karpathy随手发文，「vibe coding」爆火。

码农们为这个词吵了好几个月。

一年后，他自己把它「杀」了。

今年3月，他连发多条推文，汇报了一件刚发生的事：AI Agent登录服务器、配置SSH密钥、下载模型、跑基准测试、搭Web UI、写完整报告。

全程30分钟，他一行代码没写，并且不在场。

vibe coding没出错，只是它太慢了。

Karpathy：写了20年代码，现在像作弊图2

Karpathy在睡觉，AI 已经做完了110轮实验

Karpathy最近开源了一个叫autoresearch的项目，逻辑很简单：给AI Agent一个真实的LLM训练环境，让它在你睡觉时自己跑实验。

Karpathy：写了20年代码，现在像作弊图4

代码传送门：https://github.com/karpathy/autoresearch

Agent修改代码、训练5分钟、检查结果、保留或丢弃，循环往复，不需要人盯着。

项目里有一段说明，戏谑但认真：

有一天，前沿AI研究曾经是由肉体计算机在吃饭、睡觉、娱乐的间隙完成的，偶尔通过声波互联协议——也就是组会——进行同步。那个时代早已过去。

结果是，在过去12小时内，AI Agent对nanochat仓库做了110次修改，验证损失从0.862415降到了0.858039，每小时约12次实验，wall clock时间不增加。

你睡一觉，它做完了100轮。

与此同时，他之前展示的家庭监控分析系统，同样交给Agent全程执行：登录服务器、配置权限、下载模型、搭前端、输出报告。

整个过程约30分钟。中途遇到报错，Agent自己搜索解决方案，自己修好，继续往下走，不需要他介入。

nanochat本身也在快速进化。同样规模的GPT-2量级模型，8xH100节点训练时间从一个月前的约3小时压到了2小时。

Karpathy最后定了一个新目标：

真正的基准测试应该是——什么样的研究机构Agent代码能最快让nanochat进步？

这才是新的游戏规则。

Karpathy：写了20年代码，现在像作弊图5

从「忘掉代码」到「不碰代码」，一年走了多远？

Karpathy是一个难得的「标本」。因为他每一次认知转变，都会公开写下来。

去年2月，vibe coding是他的个人消遣实验，他说那适合throwaway weekend projects，不建议用在正经项目上。

同年12月，他发了另一条推文：

我从未如此强烈地感到自己作为程序员落后了。

并说过去几周内他的工作流发生了20年来最大的变化：从80%手写+20%Agent，翻转成80%Agent+20%修改润色。

他用了一个比喻：

就像你手持AI在瞄准，它在发射弹药。有时会走火，但偶尔在你找到正确角度时，一道强力激光束突然射出，瞬间解决问题。

到了2026年2月，他给vibe coding做了1周年回顾，正式提出新词：agentic engineering。

agentic，因为新的默认模式是你99%的时间不在直接写代码，你在编排Agents并充当监督者；engineering，强调这其中有艺术与科学，有值得深耕的专业性。

两个词都有用意。agentic，新的默认模式是你99%的时间不在直接写代码，你在编排Agent、充当监督者。

engineering，这其中有艺术与科学，有值得深耕的专业性。

Box CEO Aaron Levie在Karpathy的推文下回应，说了一件和直觉相反的事：深度技术专长不会被稀释，而是被乘上了更大的杠杆。

Karpathy：写了20年代码，现在像作弊图7

Karpathy对此的回答印证了这个判断。有人问他，几百人的团队会不会被几个会提示词的人替代？他说：

Vibe coder现在确实能做到一些事，但在顶层，深度技术专长可能比以前更是一个乘数，因为加了更多杠杆。

工具变了，但谁用得好，取决于你对这件事理解有多深。

我们再也认不出编程的样子

这不是夸张。

今年1月，Karpathy发了另一条推文，说自己用Claude写代码时有一种的奇异感觉：

写了20年代码，从没有这种感觉。它曾经是自豪感和高智识的来源，突然变得免费和即时——这非常令人迷失。

他说那有点像在作弊，作弊的感觉是真实的，不适也是真实的。

他给这种现象起了个名字：slopacolypse——指大量AI生成的低质量代码汹涌而至、难以区分的局面。他说他正在「慢慢萎缩手动写代码的能力」。

数字在印证这个感受。Y Combinator 2025年冬季批次的初创公司，25%的代码库95%以上由AI生成。

Karpathy对推理成本的判断是每8周减半，从2024到2026年没有放缓。

当AI Agent处理越来越多的执行工作，懂得如何提出正确问题、验证正确结果、在正确节点介入——这个能力变成了稀缺资产。

这是分化的预言——会用杠杆的人，和不会用杠杆的人，正在以加速度分开。

Karpathy的autoresearch项目里有一个细节。

当你让Agent开始跑实验，它只能修改train.py这一个文件，其余全部锁定。

控制Agent的行动范围，保持diff可审查，确保人能读懂它在做什么。

一个人设定了AI Agent的边界，然后去洗桑拿了。

这也许是当下最准确的工程师画像。

参考资料：

https://x.com/karpathy/status/2030722108322717778?s=20

https://x.com/levie/status/2030714592238956960

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

Karpathy：写了20年代码，现在像作弊图9

Karpathy：写了20年代码，现在像作弊图10

声明：内容取材于网络，仅代表作者观点，如有内容违规问题，请联系处理。

AR

more

OpenAI推轻量版Codex模型GPT-5.3-Codex-Spark，首度搭载Cerebras芯片实现低延迟推理

科技区角 1个月前

OpenAI推轻量版Codex模型GPT-5.3-Codex-Spark，首度搭载Cerebras芯片实现低延迟推理

Gumloop获5000万美元B轮融资，Benchmark领投，AI原生工作流平台加速企业自动化

科技区角 3天前

Gumloop获5000万美元B轮融资，Benchmark领投，AI原生工作流平台加速企业自动化

ICLR 2026 | 7B小模型干翻GPT-5？AdaResoner实现Agentic Vision的主动「视觉工具思考」

机器之心 1个月前

ICLR 2026 | 7B小模型干翻GPT-5？AdaResoner实现Agentic Vision的主动「视觉工具思考」

亿航智能携手土耳其电信、Argela 共拓土耳其先进空中交通新生态

亿航智能EHang 6天前

亿航智能携手土耳其电信、Argela 共拓土耳其先进空中交通新生态

首期投资5亿，柳州Micro LED AR眼镜项目开工

JM Insights 集摩咨询 6天前

首期投资5亿，柳州Micro LED AR眼镜项目开工

苹果计划允许第三方语音控制AI聊天机器人接入CarPlay

盖世具身智能 3周前

苹果计划允许第三方语音控制AI聊天机器人接入CarPlay

追觅“追觅之夜”首曝三款SUV命名与定位，正式启用“STAR MOTOR星际穿越”品牌

科技区角 1个月前

追觅“追觅之夜”首曝三款SUV命名与定位，正式启用“STAR MOTOR星际穿越”品牌

Intel纯大核Bartlett Lake锁定嵌入式市场，消费级用户无缘使用

科技区角 1个月前

Intel纯大核Bartlett Lake锁定嵌入式市场，消费级用户无缘使用

Snap成立独立子公司Specs Inc.，全力推进2026年消费级AR眼镜上市

科技区角 1个月前

Snap成立独立子公司Specs Inc.，全力推进2026年消费级AR眼镜上市

地热新星Zanskar借AI突破传统勘探瓶颈，融资1.15亿美元加速开发

科技区角 1个月前

地热新星Zanskar借AI突破传统勘探瓶颈，融资1.15亿美元加速开发

Copyright © 2025 成都区角科技有限公司

蜀ICP备2025143415号-1

川公网安备51015602001305号