从 Hello, World
到 Hello, AI
:软件工程正经历一场深刻的变革,从最初的人机协作,到之后的人机编排,再到如今迈向完全自主的未来。
作者:JANELLE TENG
日期:2025年8月29日
原文发表于 Bessemer Atlas;由 Janelle Teng, Lauri Moore, Lindsey Li, 和 Libbie Frost 共同撰写。
第一个信号
2021年6月,GitHub Copilot 首次亮相,比 ChatGPT 引发全球热潮还早五个月。
它不仅仅是一个新工具,更是软件 3.0 时代的开端。在这个新时代,自然语言成为了主要的编程方式。
AI 代理不再仅仅辅助开发者,它们正在一步步进化成开发者本身。

站在变革的前沿
在 Bessemer,我们亲历了开发者工具的每一次重大演进。
从 Twilio 将复杂的通信能力封装成简单的 API,Auth0 帮助开发者告别繁琐的身份验证,再到 Zapier 让非技术人员也能轻松实现工作流自动化,以及 HashiCorp 用代码彻底改变了基础设施的管理方式。
我们始终与那些善于将开发者痛点转化为巨大平台机遇的技术创始人并肩作战。PagerDuty、Render、Fern 和 LaunchDarkly 这些公司,不仅创造了更好的工具,更是重新定义了软件的开发范式。
AI 改写了游戏规则
开发者工具领域的创新从未停歇。语言有起有落,框架潮流瞬息万变,开发者们的热情一旦消退,就很难再回来。
但过去很长一段时间,这些变化都像是小步快跑式的优化:更顺畅的 CI/CD 流程、更优雅的 API 设计、更快的部署周期。这些改进虽好,却谈不上颠覆。
直到 AI 的出现,彻底改写了游戏规则。
AI 与代码的天作之合
事实证明,编码是 AI 大展拳脚的绝佳领域。它逻辑清晰、结构严谨、语法驱动,还有数十年积累的开源代码可供学习,并有成熟的基准来衡量产出质量。
AI 编码工具从一个不起眼的新鲜事物,迅速成长为不可或缺的基础设施。
GitHub 在2024年的年收入高达20亿美元,其中超过40%的增长由 Copilot 贡献。这仅仅是一个缩影,但趋势已无比清晰:
我们预测,到2030年,超过95%的代码将由 AI 编写。在许多高速发展的公司里,这已经成为现实。
市场闻风而动,数十亿风险投资涌入 AI 开发者工具赛道,从编码助手到自主调试平台,不一而足。我们已经看到了一些足以撼动行业格局的重磅收购,而这一切才刚刚拉开帷幕。
当 Hello, World
遇上 Hello, AI
AI 正引领我们进入软件 3.0 时代。在这里,自然语言是主要的编程接口,模型可以直接理解并执行指令。
这是一个深刻的范式转移:提示词本身就是程序,而大语言模型则扮演着新型计算机的角色。
这绝不是开发者工具的简单升级。软件工程正在被从头到脚地彻底重塑。
AI 不仅颠覆了传统工作流,更在创造全新的开发者平台类别。
人们的目光大多还停留在 AI 如何赋能现有工作流程,但我们认为,这不过是 AI 颠覆开发者生态的序曲。
AI 的变革力量是如此彻底,以至于全新的赛道正在不断涌现。开发者们并非简单地用 AI 优化现有工作,而是在开发范式演变的浪潮中,从根本上改变着软件的创造方式。
我们已经在核心 AI 基础设施领域见证了第一波变革。现在,这股浪潮正席卷更广阔的开发者工作流生态。
驱动我们投资的五大核心主题
主题一:AI 增强,引爆开发者生产力
将繁琐重复的脏活累活交给 AI,让开发者专注于更高阶的创造性任务,这个长久以来的梦想终于照进现实。
无论是调试、代码审查、环境配置,还是事件响应和那些耗费一下午的底层修复,AI 正在接管这些消磨开发者心力的重复性工作。
这个转变意义非凡。过去,开发者大量时间被耗费在繁琐的维护、测试和文档上。
现在,AI 会率先处理这些耗时的工作,并将初步成果交给人类审核。这让工程师能真正专注于决定成败的关键环节:架构设计、创新性问题解决和高价值的功能开发。
由此带来的性能提升是惊人的。平均故障恢复时间可以从数小时甚至数天,缩短到短短几分钟;新功能的交付周期被极大压缩;新员工的上手时间也从几个月锐减到几天。
这已不是微小的改进,而是数量级的飞跃,它从根本上重新定义了小团队的能力上限。
主题二:AI 赋能,软件开发走向大众化
大语言模型和新兴工具正在打破技术壁垒,让软件开发不再是少数专业开发者的特权。
英语,正成为当下最热门的新型编程语言。
“提示词生成代码”和“设计稿生成代码”等平台的出现,让毫无编程经验的人也能构建功能完备的应用,他们需要做的,仅仅是清晰地描述需求或上传一张设计图。
这彻底改变了软件创新的游戏规则。创造力、领域知识和产品感,正变得比掌握特定语法或框架更加重要。
未来,顶尖的医疗应用可能出自一位深谙患者流程的医生之手,而非一个精通 React 框架的开发者。
与此同时,“代理式工程”的兴起,正推动我们超越传统的人在回路(human-in-the-loop)模式。自主的 AI 代理正在无需持续监督的情况下,管理复杂流程、编排部署、甚至独立发现和修复错误。
这些系统不再只是辅助,它们是真正的执行者。
技术门槛的降低与 AI 自主性的提升,这两股力量的合流,将为更广泛的人群打开软件创造的大门。
任何能清晰表达想法并善用 AI 工具的人,都可以成为开发者。这极大地拓展了创新的边界,并重新定义了“开发者”的内涵。
主题三:为 AI 原生开发打造的下一代工具与技术
软件 2.0 时代,一系列关键基础设施的出现,极大地推动了 Web 开发的普及。
Auth0 让复杂的身份验证工作迎刃而解;Stripe 将繁琐的支付处理抽象为简单接口;Twilio 把令人头疼的电信集成变成了几行代码。
今天,我们正见证着相似的变革,AI 原生开发的基础层正在快速形成。
新的技术栈核心组件包括:
内存与上下文管理:为了克服大语言模型无状态的局限,像 Mem0、Zep、Subconscious 等工具应运而生。“内存即服务”提供即插即用的记忆层,能有效维持对话上下文和用户偏好,这对于需要提供连贯智能体验的 AI 应用至关重要。
AI 原生框架:正如 React 重新定义了 UI 开发,像 LangChain、LlamaIndex、DSPy 和 Crew 等框架正在将提示词链、工具调用和多步推理等复杂操作进行抽象封装。开发者可以更专注于业务逻辑,而将底层繁琐的工作交给框架处理。
运行时与部署基础设施:Modal、Replicate 和 Fireworks 之于 AI,就好比 Vercel 之于 Next.js。它们解决了 GPU 采购难、冷启动慢等部署难题,让开发者能像调用一个普通函数一样,轻松部署 AI 应用。
软件 2.0 的核心洞见在于,通过持续部署、安全防护和快速迭代来加速学习。比如 LaunchDarkly,它让团队能做到每天发布新功能,先推送给 1% 的用户测试,一旦发现问题便可立即回滚。这种紧密的反馈环,将学习周期从数月缩短到几小时。
AI 原生时代的迭代范式仍在形成,但轮廓已然清晰。
软件 2.0 时代,我们关心的是“功能是否正常工作”。而在 AI 原生时代,我们需要回答的是“这个提示词、模型或流程,是否产出了准确、安全且有价值的结果?”
挑战呈指数级增长。我们追踪的不再仅仅是点击率,而是语言理解的准确度、事实的正确性,以及与用户意图的契合度。
新兴的 AI 评估与可观测性领域,正聚焦于三大核心能力:
像功能开关一样管理提示词:Honeyhive 和 PromptLayer 等公司,允许用户在生产环境中对不同版本的提示词进行 A/B 测试,并在效果不佳时自动回滚。
建立持续的评估流水线:Bigspin.ai 等平台不仅提供部署前的测试,还能在生产环境中实时监控模型输出,并对照黄金标准数据集和用户反馈进行评估。
超越传统分析的语义指标:我们正从关注“点击率”转向关注“帮助度得分”和“事实准确率”。软件 3.0 需要像 Judgment Labs 这样的新工具,以及“大模型即评委”这样的新技术来定义和衡量高质量的评估指标。
这个领域的最终胜利者,将把 AI 开发从“上线靠祈祷”的模式,转变为自信的、由数据驱动的迭代模式。
它必须能无缝衔接本地开发评估与线上生产监控,支持在不重新部署代码的情况下热插拔模型和提示词,并能智能地检测到“按下葫芦浮起瓢”式的性能衰退。
最关键的是,它要能高效地规模化人在回路的反馈机制,将疑难案例自动分配给专家,再将专家的判断融入自动化评估系统,形成一个持续提升准确率的飞轮。
我们仍处在起步阶段,但这些基础模块的融合,必将带来软件 2.0 时代那样的开发效率的巨大飞跃。
而这一次,我们改变的不仅仅是屏幕上的像素,更是软件思考与推理的方式。
主题四:AI 时代,重塑人机交互的范式
如果模型上下文协议(MCP)成为行业标准,一系列重要的变革将会发生。
首先,上下文本身将变得可组合、可移植,信息得以在不同系统和应用间自由流动。
这将催生一个“上下文工程”的新时代,塑造、路由和管理上下文,将成为一门独立的专业学科,正如数据工程伴随数据库的兴起而诞生一样。
企业将开始投资于专门的流水线、工具和治理模型,以优化上下文的质量、来源和时效性。
因为上下文组织的微小差异,就可能导致模型性能的巨大不同。谁能更高效地编排内外部上下文,谁就能获得竞争优势。
我们还将看到,越来越多面向业务场景的上下文协议客户端会出现,它们不再局限于开发者的集成开发环境。
这些客户端将原生集成上下文工程能力,例如自适应的上下文窗口、关键决策提示的审计追踪,以及根据任务需求自动进行的上下文压缩或扩展。
长远来看,标准的建立会将上下文工程从一项幕后技术,推到产品的前台。
届时,企业的核心竞争力,将不仅体現在数据或模型上,更体现在他们构建更丰富、更纯净、更具可操作性的上下文的能力上。
主题五:代理体验将取代开发者体验
随着 AI 代理在开发流程中扮演越来越重要的角色,“开发者工具的用户”这一定义正在发生根本性的改变。
AI 编码代理不再仅仅是人类开发者的副驾,它们正开始自己掌控方向盘,自主完成代码的生成、修改、测试和部署。
这是一个重大的范式转变。AI 代理正成为软件的“一等用户”,它们需要的工具,必须超越为人类认知和交互设计的传统用户体验。
我们正从一个只关注“开发者体验”的时代,迈向一个必须同时优先考虑“代理体验”的时代。
我们看到,许多初创公司正积极拥抱这一变化,重新设计工具界面,使其更易于被 AI 代理理解、导航和控制。
为代理探索量身定制的合成浏览器、代理间的协作编排平台、以及为代理发现和访问而优化的文档协议,都是这一转变的早期信号。
与此同时,文档、身份验证等功能模块也在被重构,以变得更易于机器读取。
未来最优秀的开发者工具,将不再仅仅服务于人类。它们将支持一个 AI 代理与人类开发者高效协作的混合生态,甚至是一个由 AI 代理完全独立运作的环境。
一个构建未来的世代性机遇
我们正在见证的,是自云计算以来,软件开发领域最深刻的一场变革。
整个开发者工具生态正在被彻底重塑。 新的赛道不断涌现,传统的工作流正被以第一性原理重新构建。
与以往的技术浪潮不同,这一次的变革是指数级的:AI 工具正在创造更好的 AI 工具,形成一个以前所未有的速度加速创新的正向反馈循环。
AI 对开发者经济的颠覆才刚刚开始。我们深知 AI 并非完美,在隐私、监控、可靠性、上下文窗口限制和安全护栏等方面仍有许多关键问题需要解决,才能在企业中被广泛采纳。
但我们依然无比乐观,相信创业者们终将克服这些挑战。
对于软件 3.0 时代的建设者而言,前方的机会是巨大的。这不仅关乎生产力的提升,更关乎从根本上重塑软件的创造方式、创造群体,以及当开发周期从数月压缩到数分钟后,人类创新的无限可能。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!