2025年AI发展报告

智能情报所 2025-08-15 13:57

2025 年 AI 发展报告

资讯配图

人工智能大爆炸三年后,早期星系正在云 AI 宇宙中形成,但仍有大量“暗物质”在其中旋转。

作者:JANELLE TENG

日期:2025 年 8 月 15 日

原文发表于 Bessemer 的 Atlas;由 Kent Bennett、Talia Goldberg、Janelle Teng、Sameer Dholakia、Mike Droesch、Lauri Moore、Caty Rea、Lindsey Li、Maha Malik、Bhavik Nagda、Lance Co Ting Keh、Darsh Patel 和 Christine Deakers 共同撰写。


如果说 2023 年是人工智能大爆炸 (AI Big Bang),那么 2025 年则感觉像是第一缕曙光。早期混乱的迷雾正在散去——揭示出初具规模的基础公司集群、最佳构建实践以及初创企业的成功模式。虽然我们距离宣布任何形式的稳定状态还有很长的路要走,但这些早期的 AI 星系让我们比以往任何时候都更清楚地看到未来的形态。

我们首先应该毫不含糊地声明,我们坚信人工智能正在推动我们所见过的最大一波技术变革浪潮。每当风险投资家开口时,创始人们理所当然地会思考如何区分炒作与现实——但在人工智能领域,简单的数字就足以说明一切。如果说衡量初创企业现实最直接的标准是收入增长,那么我们已经更新了我们的基准,并重点关注了 20 家令人惊叹的 AI 初创公司,以帮助定义一家优秀的 AI 初创公司是什么样的。虽然这些基准在未来几年无疑会演变,但很明显,在 SaaS 时代构成一家优秀初创公司的标准已经不够了。

当然,人工智能时代并非只为初创公司和投资者带来好消息。

一些增长信号可能具有误导性。买家渴望,AI 演示令人眼花缭乱,销售额可能飙升,但并非所有产品都能提供真正的价值。留存率可能很脆弱,尤其是在转换成本较低的情况下。早期的超高速增长本身比以往任何时候都意义更小。

而且,大爆炸是难以忽视的,因此竞争强度达到了历史最高水平。有前景的领域吸引的竞争对手数量是过去几年的 2 到 3 倍。除此之外,SaaS 巨头们正在觉醒,意识到 AI 的重要性,其中包括我们投资组合中的许多公司,例如 Intercom,他们已经推出了一个价值超过 1 亿美元的 AI 产品。我们怀疑这些领导者在未来几年将带来更大的竞争压力(以及并购的诱惑!)。

我们仍然处在一个极度不可预测的时刻。今年我们头脑眩晕的速度可能慢了一些,但依然在转。模型上下文协议 (MCP)、AI 浏览器以及我们在本报告中标记为“暗物质”的许多其他领域的发展所带来的影响,仍然让我们挠头,对于这个 AI 宇宙的某些部分将如何演变,我们只有模糊的猜测。

然而,有一件事是确定的。没有 AI,云就不再是云了。

在 Bessemer,自 2023 年我们做出初步承诺以来,我们已经向 AI 原生初创公司投入了超过 10 亿美元的资本。此外,基本上所有传统的 SaaS 公司都在其产品和运营中利用 AI。无论我们是否感觉已完全准备好驾驭这个新的 AI 宇宙,我们现在都已身处其中。

在这份 AI 发展报告中,我们旨在:

  • 分享我们关于优秀 AI 初创公司标准的最新基准。
  • 巡览我们在基础设施、开发者工具、水平 AI、垂直 AI 和消费领域的路线图,并重点介绍每个领域中正在形成星座的稳定星系。
  • 揭示暗物质——那些存在重大未解问题的重要领域。
  • 提供我们对未来一两年内预期的五个预测。

接下来这份模糊的 AI 宇宙地图,是为那些能够容忍旅途中规则被实时改写的初创旅行者准备的。前方的路途可能颠簸,但至少不会无聊。我们为此而来。让我们开始吧。

*关于真正的 AI 大爆炸的争论仍在继续——有人指向 2012 年 AlexNet 在深度学习领域的突破;其他人则指向 OpenAI 的 2020 年扩展定律。在本报告中,我们将 ChatGPT 的大规模发布视为 AI 真正爆发并进入公众意识的时刻。


AI 基准:2025 年,优秀的初创公司是什么样的

基准一直是评判初创公司的一种不完美方式——但在 AI 时代,它们甚至更不可靠。特别是,一些 AI 初创公司实现了世界前所未见的增长率,这让每个 AI 创始人都想知道,到底什么才算好。因此,我们更新了基准,承认一些 AI 初创公司正在玩一场完全不同的游戏。

两种 AI 初创公司的故事和新的 “T2D3”

为了制定我们新的基准,我们研究了我们投资组合内外 20 家高增长、持久的 AI 初创公司,包括 Perplexity、Abridge 和 Cursor 等突破性公司。

虽然所有这些 AI 明星都展现出惊人的增长,但仔细研究后可以清楚地发现,AI 时代有两种不同类型的惊人:超新星和流星。

资讯配图

AI 超新星

超新星是那些增长速度堪比软件历史上任何公司的 AI 初创公司。这些企业在极短的时间内,通常是在商业化的第一年,就从种子轮冲刺到 1 亿美元的年度经常性收入 (ARR)。它们既是我们所见过的最激动人心的公司,也是最令人恐惧的。几乎可以定义为,这些数字源于收入可能显得脆弱的情况。它们涉及快速采用,这要么掩盖了低转换成本,要么预示着巨大的新颖性可能与长期价值不符。这些应用通常与核心基础模型的功能非常接近,以至于可能被贴上“薄包装”的标签。在竞争激烈的领域,利润率通常被压缩到接近于零甚至为负,因为初创公司会使用一切手段来争夺赢家通吃的奖项。

我们调查的十家 AI 超新星初创公司平均在商业化第一年达到了约 4000 万美元的 ARR,在第二年达到了约 1.25 亿美元的 ARR。当然,顶线 ARR 并不总能保证健康的业务。可持续增长依赖于强大的留存率、参与度和资本效率。平均而言,这些 AI 超新星的毛利率只有 25%,通常是为了在短期内用利润换取市场分发。尽管毛利率很低,这些 AI 超新星似乎展现出惊人的每全职等效员工 (FTE) 113 万美元的 ARR,这是典型 SaaS 基准的 4-5 倍。这种收入效率可能预示着在规模化后,它们有潜力成为非常高效的企业。

AI 流星

相比之下,流星看起来更像是卓越的 SaaS 公司:它们迅速找到产品市场契合点,保留并扩大客户关系,并保持强劲的毛利率——由于增长更快和适度的模型相关成本,其毛利率略低于 SaaS 同行。它们平均增长速度超过其 SaaS 前辈,但其增长率仍然感觉与扩展组织的传统瓶颈相挂钩。这些企业可能尚未占据头条,但它们深受客户喜爱,并正走在创造软件历史的轨道上。

平均而言,这些流星在实现收入的第一年内达到约 300 万美元的 ARR,同比增长四倍,毛利率约为 60%,第一年的每 FTE ARR 约为 16.4 万美元。

如果说 T2D3(三倍、三倍、两倍、两倍、两倍)定义了 SaaS 时代,那么 Q2T3(四倍、四倍、三倍、三倍、三倍)则更好地反映了我们从当今 AI 流星公司看到的五年发展轨迹。这些初创公司的增长速度明显快于传统 SaaS,但其运营基准仍比爆炸性的 AI 超新星更接近 SaaS。

虽然我们热爱超新星,但我们相信这个时代将由数百家流星公司来定义,而非少数几个异类。这使得流星成为 AI 创始人最重要的奋斗目标。

资讯配图

对 AI 创始人的新基准关键启示: 我们分享这些公认的怪异新基准,是为了展示当下杰出 AI 初创公司的现实。尽管如此,建立一家标志性的 AI 公司并不需要一夜之间增长四倍。许多最强大的公司仍将采取更为审慎的路径,这取决于产品的复杂性和竞争动态。

然而,速度比以往任何时候都更重要。AI 已经解锁了更快的产品开发、市场进入 (GTM) 和分发——使得“Q2T3”(四倍、四倍、三倍、三倍、三倍)成为一个雄心勃勃但越来越可实现的基准。数十家初创公司已经证明了其可能性——我们相信你也可以!

*坦白说,我们还没有看到五年的数据,所以也许未来几年我们会发现这些公司并不会真的增长三倍,但 Q2 T1 D2 远没有那么上口。


AI 宇宙路线图

在 Bessemer 追踪的每一份路线图中,我们都看到 AI 技术栈的许多元素在过去一年中得到了有意义的明确化,从而形成了几个早期的星系。我们将考察每个路线图中的这些星系,同时指出我们仍在猜测未来走向的许多“暗物质”领域。

I. AI 基础设施

正在形成的星系:模型层

让我们从显而易见的说起:少数几家公司,如 OpenAI、Anthropic、Gemini、Llama 和 xAI,继续主导着基础模型领域,提升模型性能,同时探索垂直整合。现在很清楚,大型实验室正在超越仅仅提供基础模型和模型开发工具的范畴——这些实验室现在正在推出用于编码、计算机使用和 MCP 集成的代理。与此同时,计算成本在软件创新和端到端硬件优化的推动下,继续可预测地下降。

像 Kimi、DeepSeek、Qwen、Mixtral 和 Llama 这样最先进的开源模型也继续证明,开放生态系统仍然能够超越其自身体量,常常在效率和专业任务上与专有模型相媲美或超越。

在研究方面,我们正看到一波创新浪潮:谷歌最近的递归混合通过一种自适应深度的方法推动了扩展假设,该方法平衡了推理吞吐量和少样本准确性。专家混合 (MOE)架构也正在通过结合专家的独特新方法而复兴。最后,像测试时强化学习 (RL) 和自适应推理这样的推理时技术正在获得发展势头,垂直领域可能会看到一些最重要的突破。

这些模型层面的创新只是更大规模平台重塑的一部分。

随着公司构建 AI 原生和 AI 嵌入式产品,一个新的基础设施层已经出现——涵盖了模型、算力、训练框架、编排和可观测性。我们在 2024 年的AI 基础设施路线图中强调了这一演变。这种专业化的技术栈为构建者提供了所需的速度和灵活性,但随着各方进入邻近领域以占据技术栈的更多部分,捆绑正在加速。虽然迄今为止已取得了显著进展,但我们认为 AI 基础设施的快速演变远未结束。

正在形成的星系:AI 基础设施的第二幕

AI 的第一个时代是由重大的算法突破定义的——反向传播 (Backpropagation)、卷积网络、Transformer。该领域主要通过算法改进和扩展方法来推进。相应地,基础设施也反映了这种思维方式,催生了基础模型、计算能力和数据标注等领域的巨头。

但下一章可能会更加深远。

正如 OpenAI 的 Shunyu Yao 最近观察到的那样,“AI 的下半场——从现在开始——将把焦点从解决问题转向定义问题。”

在 AI 基础设施的第二幕中,行业将从证明 AI 能够解决问题,转向构建能够凭经验、清晰度和目的性来定义、衡量和解决问题的系统。

大型实验室正从追求基准得分的提升转向设计能够与现实世界有效交互的 AI。与此同时,企业正从概念验证阶段毕业,进入生产部署阶段。

所有这些转变都为新一波基础设施工具的出现奠定了基础——这些工具不仅是为了规模或效率而构建,更是为了将 AI 根植于运营情境、现实世界经验和持续学习之中。一些例子包括:

  • 通过 Fleet、Matrices、Mechanize、Kaizen、Vmax 和 Veris等平台进行强化学习环境和任务策划,因为人类生成的标注数据已不足以支持生产级 AI。
  • 像 Bigspin.ai、Kiln AI 和 Judgment Labs 这样的新颖评估和反馈框架,实现了持续和具体的反馈循环。
  • 复合 AI 系统,不仅关注原始模型的能力,还结合了知识检索、记忆、规划和推理优化等组件。

我们正处于这一转变的开端——从作为概念验证的 AI,转变为作为定义问题并嵌入现实世界经验的自适应系统。

暗物质:AI 的惨痛教训

Rich Sutton 的「惨痛的教训」提醒我们,历史上 AI 最有效的进步来自于利用计算和通用学习,而不是依赖于手工制作的特征或人类设计的启发式方法。随着 AI 基础设施进入下一章,当实践者试图嵌入情境、理解和领域专业知识以确保现实世界的实用性时,哪种技术将被证明最有效或最具可扩展性,这仍然是一个悬而未决的问题。

II. 开发者平台和工具

正在形成的星系:AI 工程成为软件开发不可或缺的一部分

除了基础设施栈,AI 显然已经改变了软件开发。自然语言已成为新的编程接口,模型执行指令。在这种范式转变中,软件开发的根本原则正在改变,因为提示现在是程序,而大语言模型 (LLM) 成为一种新型计算机。

AI 不仅仅意味着开发者工具的渐进式演变,它还开创了一种全新的软件开发方式。我们将在即将发布的路线图《软件 3.0 的开发者工具》中详细介绍这一领域。

如今,问题不在于你的团队是否使用 AI,而在于你如何将其有效地编排成一个复合的、高速度的系统。这种软件开发模式感觉像是 AI 原生开发的“已形成星系”。最优秀的工程团队不仅仅是用 AI 编写代码——他们正在构建能够在每个周期中学习、适应和更快交付的系统。

正在形成的星系:模型上下文协议

一个新的基础设施层将对 AI 开发产生深远影响——模型上下文协议 (MCP)。由 Anthropic 于 2024 年末推出,并迅速被 OpenAI、Google DeepMind 和 Microsoft 采纳,MCP 正在成为代理访问外部 API、工具和实时数据的通用规范。

正如 MCP 的创造者所描述的,它可以被看作是 AI 的 USB-C。它支持持久记忆、多工具工作流以及跨会话的精细权限管理。有了它,代理可以链接任务、对实时系统进行推理,并与结构化工具交互——而不仅仅是生成输出。

对于开发者来说,MCP 极大地简化了集成。对于创始人来说,它为构建真正的代理式产品打开了大门——AI 不仅辅助用户,还代表他们在各个系统中采取行动。现在还为时过早,而且需要注意的是,MCP 是一本食谱,而不是厨师。为了真正开始烹饪,我们需要像 Prefect 的 FastMCP 这样的生态系统(它使构建 MCP 服务器变得更容易),以及像 Arcade 和 Keycard 这样的工具(它们促进了代理授权和权限管理)。随着围绕 MCP 连接器、治理框架和代理专用工具的星座不断形成,我们预计它将像 HTTP 对互联网一样,成为代理原生网络的基础。

暗物质:记忆、上下文及其他

随着 AI 原生工作流的成熟,记忆正在成为一个核心产品原语。跨时间记忆、适应和个性化的能力,是让工具从有用提升到不可或缺的关键。优秀的 AI 系统正在超越回忆,与用户共同进化。在 2025 年,大上下文窗口和检索增强生成(RAG) 使得更连贯的单会话交互成为可能,但真正持久的、跨会话的记忆仍然是一个开放的挑战。虽然基础模型公司正在研究记忆,但像 mem0、Zep、SuperMemory 和 Langchain 的 LangMem 这样的初创公司也在努力。

上下文是模型在推理期间看到的数据。记忆指的是跨交互保留的信息——支持多步推理、个性化和代理连续性。它们共同为下一代 AI 应用提供动力。

我们认为领先的技术栈最终将结合以下几点:

  • 通过扩展的上下文窗口(根据模型和架构,从 128k 到 1M+ tokens)实现的短期记忆。
  • 通过向量数据库、记忆操作系统(例如 MemOS)和 MCP 风格的编排实现的长期记忆。
  • 通过混合 RAG 和新兴的 episodic 模块实现的语义记忆,专为富含上下文的回忆而设计。

然而,权衡依然存在:长上下文会增加延迟和成本。没有智能的上下文工程——动态选择、压缩和任务隔离是关键——持久记忆是脆弱的。

代理应用——开发代理、客户副驾驶、创意工具——正在引领多模态记忆层和有状态工作流的采用。与此同时,对神经记忆、持续学习和局部上下文缓冲区的研究表明,可扩展的回忆已触手可及。

对于 AI 应用创始人来说,上下文和记忆可能是新的护城河。在 AI 领域,对于解决了这些问题的构建者来说,转换成本几乎可能变成情感上的。当你的产品比其他任何东西都更了解用户的世界时,更换它感觉就像从头再来。无论是精通你团队代码库的编码助手,还是嵌入你客户关系管理 (CRM) 和通信栈的销售代理,积累的关于用户及其特定环境的智能都将成为最粘性的资产。

许多未知数仍然存在,但获胜的初创公司未来可能需要同时掌握基础设施和界面:

  • 构建具有低延迟回忆能力的灵活、记忆感知的系统。
  • 为隐式学习和与核心工作流的深度集成进行设计。
  • 将上下文转变为复合优势——跨越数据、分发和愉悦感。

创始人应将记忆视为产品,而不仅仅是后端管道。今天以记忆感知方式构建的初创公司将塑造明天最智能、最个性化、最粘性的 AI 系统。

III. 水平与企业 AI

正在形成的星系:记录系统面临压力

在企业软件领域,AI 开始暴露出让初创公司颠覆一些最大的水平记录系统 (Systems of Record, SoR) 的机会。几十年来,像 Salesforce、SAP、Oracle 和 ServiceNow 这样的 SoR 凭借其深厚的产品界面、实施复杂性以及对业务关键数据的中心地位而屹立不倒。这些企业享有软件领域最坚固的护城河。转换成本太高,很少有初创公司敢于尝试取代它们。现在,那些护城河正在退化。

凭借 AI 结构化非结构化数据和按需生成代码的能力,迁移到一个新系统比以往任何时候都更快、更便宜、更可行。代理式工作流正在取代死板的数据录入,那些曾经需要系统集成商大军和多年工作的典型实施项目,正在被加速几个数量级。

这些新平台不仅仅是存储信息——它们还能对信息采取行动。像 Day.ai 和 Attio 这样的 CRM 工具能自动记录来自电子邮件、电话和 Slack 的客户互动。Everest、Doss 和 Rillet 等 AI 原生 企业资源规划 (ERP) 能够自动化财务预测和采购流程。生产力的巨大差异正变得无法忽视。创始人不再仅仅是构建更好的记录——他们在构建行动系统 (systems of action)。

对于构建行动系统的创始人来说,关键的解锁点是什么?

  • AI 特洛伊木马功能:使初创公司能够通过一个有价值的切入点工具进入数据流,让他们在第一天就无需替换记录系统即可开始捕获所有流入的数据。
  • 实施:通过代码生成工具和 AI 将自然语言描述的业务逻辑翻译成代码的能力,实施速度提高了 90%。
  • 数据:自动摄取,利用 AI 在不同模式之间进行翻译的能力,实现 1 天数据迁移,使历史上的供应商锁定几乎过时。
  • 投资回报率 (ROI):与传统系统相比是 10 倍,而不仅仅是增量提升;代理式工作流减少了专业服务支出并加速了价值实现时间。

我们感觉正处在一个代际转变的开端——从记录系统到行动系统。

正在形成的星系:下一代 CRM、HR 和企业搜索

最大的问题是:AI 原生挑战者是在创造全新的类别——还是终于在威胁现有巨头?在 CRM 领域,颠覆的早期迹象令人鼓舞。这些 AI 原生工具不仅仅是替代现有的 CRM——它们提供了一种全新的体验。它们同时为销售团队卸下了大量的手动工作,这也为销售经理提供了基于所有渠道自动合成的交易信号的智能建议,告诉他们应该把时间花在哪里。这是 10 倍的飞跃,而不是 10% 的改进。

我们在以下领域也看到了类似的切入点:

  • 人力资源和招聘:用于候选人筛选、入职和绩效跟踪的 AI 副驾驶。
  • 企业搜索:基于内部知识训练的水平副驾驶正在取代以前由 SharePoint 或 Notion search 扮演的角色。
  • 财务规划与分析 (FP&A):AI 原生的 FP&A 工具允许财务分析师集中来自许多不同孤岛的数据,并对其进行复杂分析,而无需数据工程团队的支持。

真正的制胜法宝是什么?从一个 AI 切入点——一个相邻的、高价值的功能——开始,并逐步扩展为一个完整的记录系统。这使得挑战者能够随着时间的推移收集专有数据,同时仍然与传统工作流良好兼容。像知识产权 (IP) 管理领域的 Tradespace 或 IT 服务管理 (ITSM) 领域的 Serval 就是这种方法的绝佳例子。

现在还为时尚早,但在全新类别和真正的 SoR 替代之间,清晰的战线已经开始形成。这将是一个值得关注的有趣领域。

暗物质:企业 ERP 和记录系统 (SoR) 的长尾

尽管有如此多的势头,一些最大的企业领域仍然出人意料地未被颠覆:

  • 企业级 ERP:虽然我们看到 AI 原生会计和 ERP 平台有大量令人兴奋的活动,但今天它们大多专注于中小型企业和中端市场客户,主要是在软件和服务等领域,这些领域比那些拥有高度复杂的制造、供应链和库存需求的行业要简单。尽管如此,我们认为 AI 可以在这些更复杂的环境中提供巨大的价值,但新进入者需要时间来建立服务这类更复杂客户所需的产品广度,我们认为真正的企业 ERP 替代周期还需要很多年。
  • SoR 的长尾:虽然在谈到记录系统时,CRM 和 ERP 吸引了大部分注意力,但还有一个更长的记录系统尾巴,也代表着未来巨大的颠覆机会。这些范围从企业安全中的身份平台到公共安全中的计算机辅助调度系统,再到网页设计中的内容管理系统。我们认为所有这些类别都已成熟,可以被颠覆,但这将是一个长达十年的旅程,企业家们才刚刚开始将注意力转向这些类别。

前景是巨大的——但执行仍然难以捉摸。展望 2026 年,我们相信下一波明星可能会在这些领域诞生,但现在预测还为时过早。

IV. 垂直领域 AI

去年,我们提出了一个大胆的论点:垂直领域 AI 有潜力超越甚至最成功的传统垂直 SaaS 市场。我们对这一论点的信念比以往任何时候都更加坚定。采用率持续加速,特别是在那些长期以来一直是手动的、服务密集型的或被认为抵制技术的垂直工作流中。这重塑了我们对所谓“技术恐惧症”垂直领域的看法。实际上,问题从来都不是缺乏采用新工具的意愿,而是传统 SaaS 未能解决多模态或语言密集型的高价值垂直特定任务。垂直领域 AI 终于在用户所在的地方满足了他们的需求,其产品感觉更像是真正的杠杆,而不是软件。

正在形成的星系:垂直特定工作流自动化

多个行业,令人惊讶的是,许多在过去被认为是技术恐惧症的行业,都显示出有意义的垂直领域 AI 采用的明确迹象。例如:

  • 医疗保健:Abridge 用生成式 AI 自动化临床笔记记录,减轻了提供者的倦怠,同时提高了文档质量。SmarterDx 通过自动化复杂的编码工作流,帮助医院追回错过的收入。OpenEvidence 自动化医学文献审查,并在护理点提供即时答案。
  • 法律:EvenUp 将数天的手动工作变成几分钟,生成法律索赔函,使审判律师和人身伤害律师事务所能够扩大案件处理量。Ivo 帮助法律团队自动化合同审查,并在业务合同中进行自然语言搜索。Legora 加速法律研究、审查和起草,同时在整个工作流中实现协作。
  • 教育:像 Brisk Teaching 和 MagicSchool 这样的公司为教师提供 AI 驱动的工具,以简化评分、辅导和内容创建等任务。
  • 房地产:EliseAI 自动化了以前劳动密集型的手动物业管理工作流,从潜在客户和住户沟通到租赁审计。
  • 家庭服务:Hatch 扮演着 AI 驱动的客户服务代表 (CSR) 团队的角色。Rilla 使用现实世界的音频分析现场销售对话,大规模地指导销售代表。

我们看到了突破性公司如何处理这些垂直领域的清晰模式:

  • 引人注目的切入点:早期的赢家从解决一个核心痛点开始,这个痛点通常是语言密集型或多模态的,因此在以前的软件浪潮中服务不足。最好的切入点产品是直观的,并且通常嵌入到现有工作流中,使采用变得无缝。语音/音频作为一种神奇切入点的共同方面反复出现。
  • 上下文是关键:防御性源于领域专业知识:为垂直特定需求构建的集成、数据护城河和多模态界面。最强大的团队迅速超越微调,进入深度、垂直化的实用性。
  • 为价值而生:从第一天起,投资回报率就清晰可见,无需 Excel 电子表格向用户解释。这些工具能解锁 10 倍的生产力,将劳动力重新分配到更高价值的工作上,降低成本,或推动顶线增长。价值是立竿见影的,而不是“锦上添花”。

暗物质:垂直领域 AI 中的未解之谜

尽管势头强劲,但在垂直领域 AI 的三个关键领域仍然存在真正的未知数:

  • 与传统记录系统的交互:下一代垂直领域 AI 公司会继续与现有记录系统集成并扩展其效用(今天的现状),还是开始直接与它们竞争?我们能否看到一个未来,这些传统记录系统不再是核心,而是被 AI 原生的、垂直特定的行动系统所取代?
  • 来自现有巨头的竞争:在那些根深蒂固的巨头并未掉以轻心的垂直领域,规模和分销是否会胜过初创公司的创新,还是新一代公司会冲破重围?
  • 可持续的数据护城河:随着垂直领域 AI 公司扩大其范围,它们能否在数据分散、隐私敏感且通常难以大规模访问或标准化的行业中保持有意义的数据优势?

V. 消费级 AI

随着底层技术的演进,挖掘新消费需求的机会也在增加。去年,大多数消费级应用倾向于生产力驱动的任务,如写作、编辑和搜索,因为消费者在探索 AI 的新颖性和实用性。但我们开始看到向更深层次用例的转变,包括治疗、陪伴和自我成长。AI 不再仅仅是任务辅助工具,它正在深入消费者生活中更有意义的领域。

正在形成的星系:用于日常任务和创作的 AI 助手

各个年龄段的消费者越来越多地转向通用 LLM,特别是 ChatGPT 和 Gemini,以获得每日或每周的帮助(截至 2025 年 3 月,其周活跃用户估计分别为 6 亿和 4 亿)。最初的新奇事物已成为一种习惯,这些工具现在每周为数亿用户服务。即使出现了大量的专业应用,大多数消费者仍然依赖这些通用助手来满足广泛的需求,包括研究、规划、建议和对话。

在过去的一年里,语音成为消费者与这些应用交互的一种强大模式。与 Alexa 或 Siri 等传统助手不同,由 LLM 驱动的语音 AI 可以处理开放式问题,促进反思,并支持更流畅、更具对话性的交流,为与技术互动提供了一种直观、无需动手的方式。像语音 AI 领域的 Vapi 这样的平台正在帮助消费者以一种跨越语言、上下文和情感的方式与机器互动。

也许最有意义的转变之一是消费者搜索信息和与整个网络互动的方式。[在这个不断演变的格局中,Perplexity 已成为一颗耀眼的明星。其模型无关的编排和极快的用户体验使其成为 AI 原生搜索的首选。随着其代理式浏览器 Comet 的推出,该公司正在进一步推动前沿,它很可能成为下一代环境感知和主动型代理的决定性形态。

除了作为卓越助手的新兴角色外,AI 还在降低创作门槛,将每个消费者都变成潜在的创作者。消费者正在使用像 Create.xyz、Bolt 和 Lovable 这样的工具构建应用,用 Suno 和 Udio 生成音乐,用 Moonvalley、Runway 和 Black Forest Labs 等平台制作多媒体,并用 FLORA、Visual Electric、ComfyUI 和 Krea 等工具加速构思和迭代。AI 正在将普通消费者转变为创作者,推动我们曾经认为可能的界限。

正在形成的星系:专用 AI 助手

随着消费者希望将 AI 更深入地融入日常生活,一波满足特定需求的消费应用应运而生。增长最快的领域之一是心理健康和情绪健康。虽然“ChatGPT 疗法”持续受到关注,我们也看到以自我反思和个人成长为中心的专用工具的兴起。这包括像 Rosebud 这样的 AI 日记和导师,以及像 Finch 这样游戏化的自我护理伴侣,它帮助用户设定个人目标,建立健康习惯,并跟踪情绪健康。Character.AI 是消费者对情感表达型 AI 需求的早期信号,但在过去一年中,这种需求已成为主流,由 LLM 驱动的工具越来越多地被设计用于支持长期记忆、情绪恢复力和自我发展。

另一个新兴类别是电子邮件和日历工作流。越来越多的初创公司正试图使用 AI 简化日程安排、收件箱管理和待办事项列表自动化。但由于这些是信任敏感的用例和竞争激烈的领域,拥有强大的现有者(例如 Gmail),客户获取和留存一直是一个挑战。

虽然在膳食规划、健身和育儿等更小众的消费用例中有大量产品,但我们不太确定在这些小众领域是否会出现明确的赢家。尽管有这些选择,大多数消费者仍然默认使用通用 LLM,认为它们对于许多这些任务来说“足够好”。专业应用要想脱颖而出,就需要提供明确的差异化价值,通过量身定制的体验来解决粘性的、经常性的用日志,以证明其在主屏幕上占有一席之地。

暗物质:明显的未解决的消费者痛点

一些最明显的消费用例仍然服务不足,不是因为缺乏需求,而是因为它们仍然需要用户进行过多的手动操作。虽然早期的代理产品正在出现,但底层技术仍在成熟中。

围绕安全、自主性和可靠性的问题仍未解决,因此能够代表用户采取行动的代理还处于早期阶段。

那些显而易见、迫切等待代理基础设施跟上的用例包括:

  • 旅行:旅行预订仍然 fragmented 且耗时。个性化、端到端的旅行管家的机会是巨大的,但仍未被占据。
  • 购物:当起点不再是谷歌,而是代表消费者处理浏览、比价甚至结账的代理时,电子商务有机会被彻底重塑。

谁将拥有这些用例?是控制 AI 原生浏览器的玩家,是通用 LLM 助手,还是一波新的消费者端到端代理应用?答案可能决定下一代消费平台赢家。


Bessemer 对 2025 年 AI 的五大预测

与每年一样,我们调查了我们的合伙人,以确定我们对未来几年 AI 的五个最重要的预测。我们从几十个预测中筛选出了这五个至少达到某种程度共识的预测。那么,闲话少说:

1. 浏览器将成为代理式 AI 的主导界面

资讯配图

随着代理式 AI 的发展,浏览器正成为自主执行的潜在环境——不仅仅是导航工具,而是整个数字世界的可编程接口。

虽然语音在某些情境下仍将是一种自然的模式,但浏览器提供了更强大的东西:一个嵌入日常工作流中的环境感知、情境化的界面。浏览器无缝集成到消费者和企业系统中,允许代理在用户已经依赖的应用中原生观察、推理和行动。

下一代代理式浏览器——如最近推出的 Comet 和 Dia——将远不止是插件。它们将在操作层嵌入 AI,实现多步骤自动化、跨标签页和会话的智能交互以及实时决策。与传统扩展不同,这些浏览器可以解释用户意图并端到端执行工作流。

我们预计很快会看到来自 OpenAI、谷歌和其他公司的新 AI 原生浏览器,每一款都将推动代理在会话中能做的事情的边界。浏览器的普遍性、灵活性和集成深度使其成为跨 B2B 和 B2C 用例的代理式 AI 最有能力——也是最必然的——接口层。让新的浏览器战争开始吧!

2. 2026 年将是生成式视频之年

资讯配图

2024 年标志着生成式图像模型的主流拐点。2025 年,在延迟、感知、人性化和定制化方面的改进,加上成本的大幅降低,语音领域也出现了类似的突破。2026 年正准备成为视频跨越鸿沟的一年。模型质量——在谷歌的 Veo 3、Kling、OpenAI 的 Sora、Moonvalley 的 Marey 以及新兴的开源栈中——正在加速提升。我们在可控性、可及性和真实感方面正接近一个临界点,这将使生成式视频在商业上大规模可行。

视频历来是最昂贵和最复杂的媒介。生成式视频和多模态模型正在瓦解这些障碍,使视频变得可行和可及。我们已经看到生成式视频模型在娱乐、营销、教育、社交媒体和零售领域获得了主流采用。我们预计将有大量初创公司和工具涌现,解决特定的用例——从电影叙事和虚拟形象动画到实时客户互动和产品视频。

我们还预计未来 12 个月将明确生成式视频的市场结构:

  • 大型实验室会赢下一切吗?像谷歌的 Veo 3 这样的模型正在为视频真实感和控制设定基准。Higgsfield 正在通过在现有前沿模型之上使用上下文学习构建差异化应用而引起轰动——表明你不一定需要训练自己的模型来构建强大的产品。
  • 开源会赶上吗?与图像生成领域开源模型表现优异不同,视频领域的开源领导者较少。视频模型是计算和数据密集型的,训练成本高昂,评估复杂。尽管如此,我们预测强大的开源视频模型将在 2026 年出现——Qwen 的开源视频模型是一个早期的赢家,势头正在增强。
  • 实时或低延迟用例是否有优势?我们正在关注像 Lemonslice 这样的早期团队在流媒体视频和实时推理方面的实验,其中速度和响应能力本身就可以成为产品护城河。

我们正在关注的几个顶级用例:

  • 电影级视频:为创作者、工作室和营销团队提供的工具,如 Moonvalley。
  • 实时、低延迟生成:直播、虚拟影响者、游戏。
  • 极端真实感:照片级真实感叙事、虚拟制作。
  • 个性化内容和社交身份。
  • 使创建视频应用和输出更容易的开发者工作流。

然而,随着技术进步而来的是围绕知识产权 (IP) 日益增长的复杂性。生成式视频的版权和监管环境仍在追赶,因为主要制片厂已开始对滥用受版权保护的资产采取行动。在该领域运营的初创公司应深思熟虑并积极主动地进行数据许可、负责任地采购训练集,并制定尊重创作者的版税结构。这不仅关乎法律风险——更关乎长期的信任、差异化和防御性。

无论生成式视频是成为由少数实验室主导的市场,还是一个富含应用、基础设施和开放创新的生态系统,有一点是明确的:一个新的视频创作时代已经到来——它将重塑互联网。

3. 评估和数据血缘将成为 AI 产品开发的关键催化剂

资讯配图

企业 AI 部署中最大的未解决瓶颈之一是评估 (Evals)。产品、功能、算法的改变“表现如何”?人们喜欢它吗?它是否增加了收入/转化/留存?几乎每家公司仍在努力评估一个模型在他们特定的、真实世界用例中是否表现可靠。像 MMLU、GSM8K 或 HumanEval 这样的公共基准最多只能提供粗粒度的信号——并且常常无法反映真实世界工作流、合规约束或决策关键情境的细微差别。

这就是为什么 2025-2026 年将标志着一个转折点:AI 评估将变得私有化、有根据和可信——企业部署将因此增长 10 倍。

今天的企业不仅仅寻求性能;他们寻求信心。而信心需要根据他们自己的数据、用户和风险环境量身定制的可信、可复现的评估框架。这种转变已经开始:公司不再追逐排行榜得分,而是构建内部评估套件,以衡量 AI 在隐私敏感工作流、客户支持、文档解析和代理决策中的表现。

下一个 AI 衡量时代将由以下几点定义:

  • 基于专有数据的私有、特定用例的评估。
  • 基于业务的指标,如准确性、延迟、幻觉率、客户满意度。
  • 与生产系统和反馈循环紧密集成的持续评估管道。
  • 血缘和可解释性,特别是在医疗、金融和保险等受监管的垂直领域。

像 Braintrust、LangChain、Bigspin.ai 和 Judgment Labs 这样的初创公司正在开创这个新时代的基础设施栈——提供评估工具、代理基准环境、实时反馈循环等。

随着企业买家变得越来越成熟,他们不仅会要求性能——还会要求可证明、可解释和可信的性能。DataHub 让企业相信他们的 AI 模型只在被允许的情况下使用来自谁、为了什么和在哪里的数据,并为额外的验证和合规提供血缘关系。AI 供应商将需要在购买前,而不仅仅是部署后,提供有效性的证据。在这种背景下,评估和数据血缘不仅仅是开发功能——它们成为 AI 栈的战略层,以及采购和治理的核心要求。

我们所知的产品开发一直渴望是数据驱动和用户知情的,像 LaunchDarkly 这样的平台实现了实验和测量。在 AI 的世界里——预测性而非确定性的用户体验占主导地位,这些产品开发原则的基础已经被动摇。像 Arklex、Kiln AI 和 Pi Labs 这样的公司提出了一种在 AI 原生时代思考测量和反馈循环的全新方式。

在这个领域构建的创始人应优先考虑:

  • 多指标评估的工具(例如,准确性、幻觉风险和合规性)。
  • 用于压力测试代理的合成评估环境。
  • 与日志记录、检索和反馈系统的互操作性。
  • 支持模型漂移和随时间持续更新。

随着基础模型性能的趋同,真正的差异化因素将不是原始的准确性——而是在你的环境中,确切地知道你的模型如何、何时以及为何工作。能够使评估可扩展、可解释且企业就绪的初D公司将解锁下一波 AI 部署——并定义下一个伟大的基础设施前沿。

4. 一个新的 AI 原生社交媒体巨头可能出现

资讯配图

消费技术的重大转变历来为新的社交巨头铺平了道路。PHP 成就了 Facebook。移动摄像头使 Instagram 成为可能。移动视频的进步推动了 TikTok。很难想象生成式 AI 带来的新能力不会导致类似的突破。

我们还不知道下一个社交媒体巨头将采取何种形式。它可能是一个 AI 代理悄悄确保我们不会错过生日、朋友的更新或我们当地的重要事件的网络,帮助我们在网上和现实生活中成为最好的自己。或者,它可能是一个由情感智能的 AI 影响者和 AI 克隆人居住的世界。像 Character.AI 和 Replika 这样的平台暗示了 AI,而非人类,可能成为主角的社交空间。

无论它采取何种形式,语音交互、长期记忆以及图像和视频生成的突破都为下一个社交媒体的爆发提供了明确的燃料。获胜的平台可能会以主流轰动的方式推出,或者从一个利基社区中崛起,然后迅速扩展为一个完整的生态系统。

5. 巨头反击,AI 并购升温

资讯配图

经过 AI 原生初创公司两年的快速颠覆后,企业巨头们正在反击——不是从零开始重建,而是通过收购他们需要的能来赶上。在 2025 年和 2026 年,我们预计将看到并购活动的激增,因为现有巨头将积极行动,通过收购进入 AI 时代。

战线在垂直软件领域最为清晰。随着 AI 原生初创公司深入行业特定工作流——自动化保险索赔、法律简报或收入周期管理——传统 SaaS 玩家面临着一个严峻的选择:进化或被淘汰。对许多公司来说,最快的创新途径是收购。我们预计在医疗、物流、金融服务和法律科技等高服务性、受监管的行业将出现一波整合浪潮。

但这不仅仅是附加 AI 功能。垂直领域 AI 的兴起正在迫使结构性转变——软件和服务的界限变得模糊。AI 工具正变得如此深入地嵌入到领域工作流中,以至于它们类似于智能服务提供商。对现有巨头来说,收购这些公司不仅仅是 AI 升级——这是对其价值主张的重塑。

与此同时,对 AI 基础设施和工具的需求将推动在模型编排、评估、可观测性和记忆系统方面的战略收购。企业不仅仅是在购买应用——他们在购买 AI 原生栈的构建模块。

对创始人的启示:

  • 准备好迎接战略兴趣:如果你正在构建一个领域特定或基础设施层的 AI 产品,预计会收到希望填补空白的传统玩家的联系。
  • 争取杠杆:定位最好的初创公司将拥有强大的技术护城河、客户吸引力以及难以复制的嵌入式工作流。
  • 了解收购方的路线图:了解现有巨头在你所在领域落后的地方。如果你能提供他们无法足够快地构建的东西,你就是有价值的。

对投资者来说,这波整合浪潮既代表了流动性机会,也验证了论点:现有巨头正在通过他们的钱包确认——AI 原生公司正在设定新标准。AI 原生颠覆的时代可能始于初创公司,但第二幕正在上演——巨头们正在整装待发。


创始人在 AI 宇宙中的优势

我们不再处于 AI 的黎明——我们已深入其展开的星系。今天的顶尖初创公司不仅仅是在构建更快的软件。他们在设计能够看、听、推理和行动的系统——将智能嵌入到工作和生活的结构中。

但事实是:AI 的成功不仅仅在于速度。它关乎矢量,即朝着正确方向的速度。最具标志性的公司不会是那些仅仅随波逐流的公司,而是那些塑造浪潮的公司——将指数级的能力与现实世界的清晰度相结合。

AI 不再是理论性的。它是可操作的。它正在产生收入,建立关系,并重写行业规则。然而,许多问题仍未解决:记忆、上下文、治理、代理。这就是这个时刻的力量所在——地图仍然模糊,但前沿是真实的。

AI 应用创始人的核心要点

  1. 两种 AI 初创公司原型正在获胜:平均而言,超新星在 1.5 年内达到约 1 亿美元的 ARR——但通常伴随着脆弱的留存率和微薄的利润;流星则像卓越的 SaaS 一样增长:在 4 年内从 300 万美元增长到 1 亿美元,拥有强大的产品市场契合度和健康的利润率。
  2. 记忆和上下文是新的护城河:最具防御性的产品将能够记忆、适应和个性化。持久的记忆和语义理解创造了情感和功能上的锁定。
  3. 行动系统正在取代记录系统:AI 原生应用不仅仅存储数据——它们对数据采取行动。不要将 AI 附加到传统软件上——重新构想整个工作流。
  4. 从一个 AI 切入点开始:解决一个狭窄、高摩擦的问题(例如,法律研究、销售笔记)。快速提供 10 倍的价值——然后扩展。
  5. 浏览器是你的画布:代理式 AI 正在转向浏览器层——现在是一个可编程的环境,代理在其中观察和执行。为这个界面构建;它是新的操作层。
  6. 私有的、持续的评估至关重要:公共基准是不够的。企业要求可信、可解释的性能。从第一天起就构建评估基础设施。
  7. 实施速度是一种战略优势:曾经需要数月的入职现在只需数小时。代码生成、自动映射和自然语言接口瓦解了供应商锁定。
  8. 垂直领域 AI 是新的 SaaS:“技术恐惧症”行业正在迅速采用 AI。通过深度嵌入、从第一天起证明 ROI 并快速扩展来获胜。
  9. 现有巨头已经觉醒——并且热衷于收购:SaaS 巨头正在通过收购进入 AI 领域。构建技术和数据护城河。做好被并购的准备,但要像你将拥有整个类别一样运营。
  10. 品味和判断力是你的差异化因素:在一个充满代理和自动化的世界里,人类的洞察力是优势。那些凭直觉知道应该存在什么——而不仅仅是可以存在什么的创始人——将定义下一个时代。

创始人的优势正在转变。单靠速度是不够的。你需要产品直觉、同理心和明确的目标。你不仅需要一个更好的模型——你需要一个更好的世界模型。下一批获胜的公司不会做更多的 AI。他们会在正确的高度,用正确的结果,做正确的 AI。

AI 宇宙正在迅速扩张。现在是时候建立起能将你的星系凝聚在一起的引力了。我们出发吧。


本文章及其所呈现的信息仅供参考。本文所表达的观点仅为作者个人观点,不构成出售要约、购买建议或任何证券的要約邀请,也不构成任何投资产品或服务的推荐。虽然本文中包含的某些信息是从被认为是可靠的来源获得的,但作者及其任何雇主或其关联公司均未独立核实此信息,无法保证其准确性和完整性。因此,对于本信息的公正性、准确性、及时性或完整性,不作任何明示或暗示的陈述或保证,也不应依赖于此。作者及所有雇主及其关联人士对本信息不承担任何责任,也无义务在未来更新本信息或分析。

原文地址:https://www.bvp.com/atlas/the-state-of-ai-2025

一键三连点赞」「转发」「小心心

欢迎在评论区留下你的想法!


声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
【AI】“还我GPT-4o”!奥特曼强推GPT-5惹怒网友,紧急公关来了
GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
AI 的下一个战场:端侧模型崛起
打开高德的理由又多一条!全球首个「需求链智能调度」AI地图上线
当AI从“炫技”走向实用,自主可控才真正站得住脚
北大校友孙之清C位出镜,小扎看OpenAI直播夺人!1亿刀薪酬光速被签
2025年AI发展报告
哈曼AudioworX集成赛轮思音频AI全面提升车载体验
快讯|400亿A股上市龙头赴港IPO ;日媒:中国AI迅猛追赶,资本涌向人形机器人企业;智元发布行业首个机器人世界模型开源平台等
独家观点|上海交通大学长聘教轨副教授顾磊磊:AI要从刚需出发
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号