
“我当时并不在场,我是后来被叫去调解的。”Bret Taylor 回忆起那次 OpenAI 的“逼宫”危机时说道。
Taylor 身上的标签非常多:助理产品经理、集成电路产品经理、工程师、首席产品官,以及三家企业的联合首席技术官,其中还包括一家上市公司。他的履历十分丰富:
Taylor 曾担任 Salesforce 公司联席 CEO,同时也担任过 Salesforce 首席产品官(CPO)与首席运营官(COO)。他加入谷歌时担任的是助理产品经理,用周末时间开发出了谷歌地图。现在他是 OpenAI 的董事会主席,还曾担任过 Twitter 的董事会主席。
Taylor 曾创立三家公司,一家社交网络公司、一家名叫 Quip 的生产力文档服务商,还有现在的 Sierra(去年 10 月,路透社报该公司年营收已超过 2000 万美元)。他还为 Friend Feed 发明了点赞按钮、新闻推送功能等。
当初 OpenAI 遭遇危机之时,Taylor 原本并不打算再参与 OpenAI 的董事会工作。但妻子问他:“你以后会不会在临终前后悔没帮 OpenAI 一把?”这让 Taylor 重新思考。“生活就是复杂的。如果你想做出有意义的决定,就不能逃避复杂性。你得硬着头皮做决定,并学会分清轻重缓急。
当 Taylor 接到电话时,他自己也很迷茫,尤其是要面对如此复杂的局势。“为什么是我?为什么是我来处理这个问题?”然而,Taylor 表示知道为什么会是他:“圈内有个玩笑,说我是‘董事会
问题修理工’。这名声不是我主动挣来的,但似乎就是这么传开了。”
Taylor 回忆道,“我之前其实和 Sam 还有几个董事会成员聊过是否要加入董事会,我那时候是拒绝的,因为我想专注在自己的初创公司 Sierra 上,而且我其实也不太想再花时间搞董事会这套。然后,到了那周四还是周五,Sam 被解雇了,我接到了其中一个董事会成员的电话,对方说他们正在想办法寻找解决路径,问我愿不愿意帮忙。于是,我打电话给 Sam,因为我知道这是件非常麻烦的事,如果我要跳进去,我必须先搞清楚自己到底卷入了什么。”我和 Sam 本来就认识,我也认识 Adam D’Angelo,他以前是 Facebook 的 CTO,现在做 Quora。我想听听 Sam 会说什么。”
“后来,无论是 Sam 还是董事会,都表示希望我能帮忙。这很有意思,因为这事儿显然很复杂,但我猜能够同时被 Sam 和董事会双方接受的人,可能真不多。”
作为一名创业者,Taylor 意识到,如果没有 OpenAI,很多如今的 AI 初创公司可能都不会存在。“没有 OpenAI,我们现在不会处在这个位置。虽然可能有人会做出类似 Transformers 论文之后的扩展工作,但正是 ChatGPT 引起了全世界的关注,创造了如今的 AI 繁荣。”
“能参与拯救这样一家从非营利研究实验室走出来的、却抓住全球关注的机构,是非常值得做的是一件事。”Taylor 表示。
当时,OpenAI 的员工发布了公开信,说如果 Sam 不回来,他们就会集体辞职。对此,Taylor 的理解是这些员工也搞不清楚到底发生了什么,然后他们呼吁“重启”公司。
当 Taylor 与 Larry Summers、Adam D'Angelo 一起重组董事会时,他们的出发点就是“重启”:先让 Sam 回来,然后做一次彻底、独立的回顾调查。“我们想要一个尽可能让人信服的过程,给所有人一个交代。”
Taylor 强调,进入这个过程时,他们并没有预设立场,因为当时没有人知道真相,他自己也不知道。“我只是想把一切归零,然后再通过事实调查,做一个具有程序正义的决策。”
之后的事情大家都知道了,现在他还是进入了 OpenAI 董事会中。“我是 OpenAI 的董事长,也运营着一家相当成功的应用型 AI 公司,但我依然很难跟上这个领域的所有进展。”Taylor 在一次对话中坦诚道。
从监督 OpenAI 的进步到观察竞争对手的快速崛起,他忙得不可开交。然而,就连他也觉得头晕目眩。“我可能是世界上最适合这样做的人……所以我现在的感觉只能用‘疯狂’来形容,”Taylor 补充道。
作为硅谷知名的连续创业者和资深工程师,Bret Taylor 近日做客 Lenny’s Podcast,分享了他对 AI 市场格局与创业机会的深度判断。他提出,AI 市场最终将演化为三个主要板块:前沿基础模型、AI 工具层,以及最令人期待的应用型 AI 市场,并重点看好 Agent 生态的爆发潜力。在技术路径和 go-to-market 模式方面,Taylor 也结合自己的实战经验,指出了代码审查、根因分析等值得关注的方向,以及开发者主导、产品驱动和直销三种可行的市场进入方式。此外,他还讲述了自己在谷歌早期一次差点被炒鱿鱼的产品评审经历,这次“失败”最终促成了 Google Maps 的诞生。本篇内容基于节目对话翻译整理,保留核心观点,以飨读者。
Taylor: 虽然不一定是最大的错误,但让我印象最深的是在谷歌担任产品经理时出的一次问题。它对我来说意义重大,也彻底改变了我作为产品设计师的职业生涯。
我从 2000 年底到 2003 年初在谷歌效力,也是公司最早的助理产品经理之一,起初负责搜索系统,将我们的索引量从 10 亿网页扩展到了百亿网页。虽然现在看起来不算什么,但这在当时可绝对非同小可。而且我干得还不错。所以我的上司 Marissa Meyer 又给了我个机会,让我领域一个新的产品项目。
这对我来说意义重大,毕竟谷歌可不会随便让年轻的新晋产品经理执掌重量级事务,我也接受了严格审查。
我当时的工作重点是本地搜索。那时黄页仍然占据主导地位,谷歌虽然擅长网络搜索,但仍然做不好联系水管工或者找餐厅这类在互联网上占比还不太大的信息收集。为此,我们需要打造一套不同于以往的搜索平台。
在对技术、产品和内容等因素的综合考量之下,我们打造出我担任产品经理的首个产品版本,名叫 Google Local,本质上就是把谷歌搜索跟黄页对接起来。通过精心设计的查询,用户可以在搜索结果顶端看到这些列表,并在 local.Google.com 上建立独立网站。谷歌主页还专门给我们开了专区,在搜索结果中显示网页图片和本地信息,连最好的显示位也给了我们。
当时谷歌主页上排名靠前的任何东西都能火,可我们的表现却不好,真心有点尴尬。你应该可以想象,公司已经给了那么大的流量、那么有力的宣传支持,而作为产品负责人和项目经理,我做出来的东西却没能吸引到相应的人气。
回想起来,最大的问题就是我们没能做出差异性,毕竟人家干嘛非要用 Google Local 呢,继续用雅虎的不就好了?好在经过老板们的严格审查,他们觉得我这款产品做得也还不错,所以我并没有被炒掉。但无论如何,我的形象因为项目失利而受损。
于是,他们又给了个机会,让我继续做第二版。当时我感觉这就是自己的最后一搏,而这种从炙手可热的新晋产品经理到普通新人的感觉也着实让我沮丧。于是我花了很多时间思考,努力做出一款有吸引力的产品,跟黄页和市面上其他同类产品拉开差距。最终,我们找到了思路,最终推出的是谷歌地图。我们从 Map Quests 处获得和授权,可以在搜索结果旁添加这种小地图。其实我们内部对 Map Quests 的评价并不高,所以也做了很多大刀阔斧的改造。
我们后来又找到了 Lars Rasmussen 和 Yens Rasmussen 两兄弟,把这两位做 Windows 地图产品的人才拉进了公司。通过探索,我们最终整合了多款不同产品,把地图、本地搜索、驾车路线等等独立功能都融合为一。
这可以说重新定义了整个行业,当然也改变了我的职业生涯。最重要的是,这段经历改变了我作为负责人对产品的理解方式。在此之后,无论做什么,我都会先想想自己为什么要用这款产品。这是个很重要的问题。
当时还有几个有趣的瞬间。谷歌地图刚问世时,第一天就有上千万人使用。考虑到那会互联网规模还不是特别大,这已经是个可观的数字了。2005 年 8 月 20 号,我们收购了 Keyhole 的卫星图像(即谷歌地球),当天用户高达 9000 万人。发布时,每个人都想看看自家屋顶,这真让人难忘、也代表着一种美妙的产品体验。
新技术的意义绝不是简单将原有的东西数字化,而是要创造一种全新体验、解答客户提出的新问题。谷歌地图的成功就在这里,它不是一份数字版的地图,而是真正融入了网络平台。还有卫星图像——虽然算不上谷歌地图中最重要的组成部分,但也确实掀起了热潮,而且早在“病毒式传播”之前就达成了同样的效果。产品上线后开发团队的大家也都很兴奋,通过短信相互讨论。
总之这让我在构思产品时,首先考虑用户为什么会用、产品的持久价值是什么。在后续的每个项目中,我都保持着这样的思维。
Taylor: 确实,这些经历都让我感到自豪。还有一点特别有趣,每次遇到老同事,我会发现他们还是会以我当初职务的那个角度来看待我。比如去见 Facebook 的同事,他们就把我当成工程师;去见谷歌的同事,他们把我当成产品经理;去见 Salesforce 的同事……那就比较复杂了,因为我待过的岗位太多,可能既像领导又像工程师吧。毕竟我周末的时候也会出于兴趣写写代码。
我有个原则,就是 别把自己的角色限定得太死。不只是工程师,我觉得自己更像是个创造者,喜欢打造产品。虽然开源项目也不错,但我始终觉得企业才是孕育精彩产品的最佳温床,科技与资本的融合能为客户带来难以想象的成果。总之,要想真正打造出有意义的事物、成为伟大的创始人,就必须善于摆脱僵化的观点或者身份认同。
还有一点,我觉得推 销能力是创始人的重要技能之一,包括说服投资者支持你的公司、说服应聘者留下来工作、说服客户使用你推出的产品。良好的设计品味不单体现在产品上,更要体现在营销手段上,而这切的本质就是要吸引新客户。而待在 IT 领域的好处,就是这里同时会把技术放在第一位,让整个领域始终充满变革和机遇。
说到这,我要对 Sheryl Sandberg 表达谢意,她改变了我对待新工作的心态。
当时我刚刚出任 Facebook 的 CTO,那时候汇报工作的团队规模还不是很大, 因此在有些项目中,我还需要扮演资深架构师的角色,亲自参与开发。后来, 扎克伯格重组了公司,划分出了好几个不同的部门。最终我手下管理着一支非常庞大的团队,我自己主要负责管理移动部门,还有产品、设计和工程部门。于是我的团队成员就从几个人迅速增加到上千人。
我在谷歌虽然也做过管理,但团队规模不算大,我做得也就……还行吧。有一次 Sheryl 看到了我,当时正帮一位同事完善演示文稿。我一边做一边吐槽,而她把我拉到单独的房间,提醒我要严格要求自己的团队、让同事们也能跟我一样做到高标准。如果有人实在做不到,就得有魄力把他们赶出公司。
她是位非常出色的导师,总能给出非常直接的反馈——虽然有时会让人不太舒服,但你知道她是为自己好、她的意见值得认真对待。那晚回到家里,我其实挺郁闷的,这是种很自然的抗拒心理。但第二天醒来,我意识到她是对的,而我自己的顽固心态其实在限制自己的成就。我总是按个人喜好去处理工作,所以会耗费很多时间在我所热衷的产品和技术上。但从那里起,我开始以管理者的角度思考问题,比如要让我们的移动和开发者平台取得成功,最需要做的是什么?换了切入点之后,最应该做的事情就完全不同了。
而我从中获得的最大惊喜,就是这事真的有乐趣。之前我一直以为自己是喜欢工程和做产品的,但实际上在改造了组织、让它越来越成功之后,我才真正感到巨大的喜悦。我们的开发者平台有很多伙伴,我们在改善合作关系上花了不少时间,而且效果相当显著。我们的平台更健康了、合作伙伴也更成功了。我为这份成功感到深深自豪,干劲也越来越足。
我意识到自己真正喜欢的不只是工程或者产品设计,而是造成影响。所以在那次跟 Sheryl 的谈话之后,我每天醒来都会问自己,今天能做哪些真正造成影响的事。所谓影响,就是有助于向目标迈进的行动。可以是招聘、可以是产品、可以是工程,也可以是销售。我会更多自我反思,考虑哪些事情真正重要。我更享受工作中的方方面面了,所以真的很感激那番点拨。
现在给其他人提反馈建议时,我也会按这个思路来走,毕竟我自己的职业轨迹就是这样改变的。我的所有功劳都离不开她的指引。
Taylor: 是的,但这事其实挺难的。对于创始人和产品经理来说,特别是对创始人来说,最不能犯的错误就是做错判断。比如坚持认为大家不喜欢这款产品是因为某某原因,然后把这个结论讲给自己、讲给团队,把自己的感觉强行定义成事实。这时候我们只能祈祷自己是对的,因为一旦判断错了、而我们又围绕这个判断建立了一整套策略,那公司就完蛋了。
那该怎么判断为什么一笔交易没能达成吗?我们应该跟负责客户的销售人员聊聊、跟产品经理聊聊。这时候一定要保持理性和坦诚。有时候我们会一厢情愿地认为是平台太贵了,销售人员也可能觉得这个原因。但也许真正的原因是用户看不到平台的价值,所以就找了个价格太贵的理由搪塞销售人员。但实际上,产品差异化不足才是关键,而这显然是个层次更深也更难解决的问题。
要学会分清客套话。 很多提出分手的人都会说“不是你的问题,是我的问题”,人际往来就是这样,大家都是为了面子上过得去,所以讲出来的未必是事实。
所以单纯听取客户和用户意见,往往得不到正确答案。我们得学会找寻真相。我从实效创业者身上观察的一个共同点,就是大家往往会依托自身技能情况,把所有问题都归到这上面去。比如说如果是优秀的工程师创业,那公司里几乎所有问题都是工程问题。如果是设计师创业,那所有问题就都是设计问题。而在接触过大量创业者后,就会发现真正的成功源自积极合作。只有建立起合作关系,一切才会改变。
作为创始人,我们必须意识到,自己会无意间选择自己身上最大的优势来解决问题。但事实上,自己的优势未必最适合解决当前挑战,所以要时常质疑。
比如,我们总以为自己的整个职业生涯都是在用最好的方式解决问题,但其中至少有 30% 的情况并非“最好”,而只是自己最熟悉、最舒适。所以好的联合创始人和领导团队,必须有能力让产品经理、合作伙伴、工程师、市场营销团队都发挥出最大潜能。各方真诚对话,才能保证事情走上正轨。所以做最真正能造成影响的事看似容易,但人们往往会不自觉地自欺欺人。我认为准确回答这个问题,就已经成功了一半。
Taylor: 肯定的,我就踩过坑。我参与创建的第一家公司叫 Frenche,在巅峰时期有 12 名员工,他们都很优秀。这家公司是由 Jim Norris 创办的,创我在斯坦福上学时就认识的工程师。还有曾打造 Gmail 的 Paul Boo 和 Gmail 项目团队首位工程师 Sanjeev Singh。看到了吧,这里有谷歌地图的成员,还有 Gmail 的成员,阵容相当豪华了。
我们建立了一个社交网络。你前面也提到,我们发明了很多新闻推送方面的流行概念,还有点赞按钮。可虽然偶有亮点,但我们的产品也只在土耳其、意大利和伊朗比较受欢迎,有段时间还被伊朗给屏蔽了。总之这生意做得算不上成功。
我们做的是个以粉丝为导向的社交网络,而不是以好友关系为导向的社交网络。就是说我们更像 X 或者 Twitter,而非 Facebook。这里有很多报刊杂志、兴趣爱好和科学交流社群。那段时间,Twitter 看起来比 Facebook 风头更盛,很多名人都上去做了认证号,我也有点被带偏了。我们 12 个人里有 11 个是工程师,但光有技术是不够的。Twitter 的人会告诉大家,让更多名人和公众人物加入才是正确之举。而我们太过于专注完善产品,在人气巅峰期也有点自信过头了。总之,我们的产品创新速度更快、功能更全,也始终保持着全面盈利。但它做不了太大,也承受不了风浪。
我还要强调一点,其实 谷歌并不是培养伟大企业家的好地方。 毕竟搜索引擎赚钱太容易了,雄厚的财力让人们很难透彻理解并玩转分销、产品设计乃至商业模式。所以从谷歌出来的人总觉得是产品本身没做好、没做全面,但往往不是这样。没做好可能是因为我们拉不到足够多的名人给自己站台。
做产品或者说创业就是这样,靠谱的建议不是太少、而是太多,从中筛选出正确答案其实相当困难。当时我们确实有点短视,没有从外人的视角上听取哪些地方可能出错、哪些方面可以做得更好、还有哪些短板需要补齐等等。而这就是董事会的意义所在。
也正因为如此,我们才需要寻找合适的顾问,听取那些我们不想听、但确实有质量的建议。这认为这正是我们当初最大的缺陷所在。真希望那时候能意识到这个问题,我自己也从中吸取到了深刻的教训。现在我非常信任董事会,也会认真听取他们的建议。
Taylor: 这确实很难,一方面要看对方的眼光、一方面要看对方的人品。另外讲个反直觉的,一个人在表达意见时的自信程度,其实跟建议质量之间并没有很强的关联性。当然,也不是负相关,反正就是关系不大。
我自己对有些问题还满懂的,我发现 很多最雄辩、最自信的陈述往往最不准确,只是听起来有说服力而已。而这确实需要很好的判断力。我认为重要的不只是积极寻求建议,还要考虑向谁寻求建议,而答案之间的共性就是判断的准绳。另外在寻求建议时,不要只问该怎么做,还要问为什么。只要问出足够多的为什么,我们才能理解他人提出建议的逻辑框架。
建议里经常会说“永远不要这样或者那样”,但这只是他们少数人生经历的总结,往往作不得数。这次如果就是这样或者那样做,结果可能反而更好。这就是所谓“身边统计学”,结论往往是极其荒谬的。只有向三个人征求建议,他们都给出类似的观点,那才能建立起类似于第一性原理的框架,由此衍生出相对可靠的方法。所以说,良好的判断力永远是最重要的。
这事很难直接传授,但我在招聘员工时很看重这点。我觉得判断力可能更多源自自我反省,比如作为企业家或者产品经理,我们得为自己的决定负责。在做了错误的决定后,我们得花时间反思、尝试理解背后的原因,并不断提升自己的判断力。优秀的企业家和产品经理就是这样诞生的。
另外,在获得建议后,还要真正理解它是怎么来的、背后的是什么,这样才能逐渐形成自己的观点。要记住,绝大多数建议根本没有统计学意义,哪怕是大多数咨询公司都做不到。反正掉一回坑就都明白了。
Taylor: 我一直认为学编程就是在学习计算机科学,而学习计算机科学显然是有价值的。当然,计算机科学不止于编程,它能帮助我们理解符号或复杂性理论、掌握算法、明确随机算法的工作原理,还有两种相同复杂度的算法为什么一种比另一种在实践中表现更好、为什么缓存未命中是个大问题等等。
首先强调一点,我觉得软件开发确实正从在终端或 VSCode 里打字,向着操作代码生成器转换。我认为这应该是软件开发的未来。但操作代码生成器更需要系统思维,而计算机科学是学习系统思维的最佳专业之一。最终,AI 将把软件开发提升至新的高度。
未来几年我们可能会迎来更多变数,多到超出想象。但作为代码生成器的操作者,我们的工作本质仍然是制造产品或者解决问题。这就要求我们具备出色的系统思维,只有这样才能管理好机器、让机器负责执行大量繁琐的工作,比如生成按钮或者接入网络。
一切技术最终都要跟商业问题融合,而系统化的思维方式永远是产品设计中最困难的部分。举个简单的例子,Facebook 就是其中的典型代表。我们都曾花很长时间设计新闻推送功能,但 Facebook 展示的新闻推送就是更精致:图片漂亮、帖子语法正确、长度合理、评论和显示模式堪称完美。再回头看看自己的新闻推送,到处充斥着粗糙。毕竟不是每个人的照片都选得那么好,再加上帖子里乱七八糟的链接和评论,最终的观感就很差。然后我意识到,设计新闻推送就像是做 Photoshop 软件,这套系统的意义就是在内容和视觉设计上呈现出愉悦体验,尽可能让用户发的东西更好看。
我认为无论是用 AI 编写代码、进行设计还是做其他事情,我们自己都需要先在头脑中构建起这样一个系统——明确区分哪些难、哪些简单,哪些可行、哪些不可行。顺带一提,AI 也能帮助我们做好这件事。这种明确的判断和清晰的思路是项非常重要的技能。
总之,我认为随着 AI 智能体的出现,特别是 AI 在某些领域越来越接近超级智能,我们的工具储备将会发生很大变化。而继续做好工作的最佳方式,就是保持一种松弛又紧密的参与状态。我们熟悉的一切终将成为过去。当初 NASA 发明的人力计算器就曾引起过恐慌,很多人觉得自己擅长的东西没用了。但这没关系,我们最好早点接受这个现实。
有些人在选专业时有点太功利了,比如他们会说别学数学,因为在职业生涯里用不到。学习数学非常重要,它会教我们如何思考、教我们理解世界的运转逻辑。物理和数学都是这样。而计算机科学将永远成为软件开发的基础,特别是在跟 AI 这种很可能比人类更聪明的工具交互时,没有基础学科的支撑我们根本无法理解该如何约束它、如何引导它产生想要的结果。
Taylor: 我不知道最终会不会以编程语言的形式存在。我觉得称之为编程系统会更准确,语言还是太局限了。
纵观过去四十多年的计算机发展历程,我个人的概括就是:我们创造了计算机硬件、发明了打孔卡,借此告诉计算机该做什么。到了 70 年代中后期,我们又发明了早期操作系统和分时系统。从贝尔实验室和伯克利发明 Unix 系统开始,又催生出 Tran、C 语言及其他更高级的编程语言。这一路走来,抽象层次越提越高。很明显,几乎没人会直接写汇编语言。有些人用 C、有些人用 Rust,也有很多人用 Python、TypeScript 之类的语言。
随着抽象层越来越多,软件开发也越来越简单。
回想起来,谷歌地图中的很多功能,比如说可拖放地图完全可以交给如今的 React 程序员完成。这就是技术发展的意义。
我一直觉得 Python 可能是最主流的代码生成目标,毕竟它在训练数据中占比最高。数据科学家们喜欢 Python,我也是。然而,它也是有史以来最低效的编程语言之一,可是把 AI 害苦了。比如说全局解释器锁,它运行速度很慢。我写过不少相当复杂的 Web 服务,性能就卡在这块,而且难以验证。虽然不至于像 Pearl 那么糟糕,但任何大型 Python 程序都会在实际运行后冒出一堆发布前很难测出来的错误。可尽管如此,Python 的设计特别符合人体工学、跟人类编写的伪代码几乎一致。正是这种令人愉悦的开发体验,让它成为数据科学家们的最爱。
所以。如果真的到了 AI 大量编写代码的时代,需要关心的 就不再是编程语言的人体工学水平,而 是怎样更好地确保机器以代码形式完成我们指定的任务。 如果做不到要怎么帮忙、生成的结果能不能轻松修改等等。
在这方面,Rust 语言似乎更有优势。比如 C 程序中有没有内存泄漏就很难判断,对于规模大的 C 程序就更是让人头痛了。但要验证 Rust 程序有没有内存泄漏,那编译一下就行。它具有编译时内存安全性,所以只能能编译成功就证明内存没问题。
我认为我们还需要更多类似的方案,免得未来 AI 生成的每行代码还得由人来审查。真的去审又看不过来,不审的话就相当于把一大堆不安全、未经验证的雷埋到了项目当中。
所以问题在于,如何让人更好地用计算机替代自己完成编程?最简单的当然是由 AI 监督 AI 来做代码审查。除此之外,也可以配合一些相对过时的技术,比如形式验证和单元测试等。当我们真正转换了思路,考虑如何让代码生成器的操作者能以极快速度生成高度复杂的大规模软件,并确保它能够正常工作,那么以这样的设计为中心,就必然会推动语言、系统乃至一切的转变。以往很多看似重要的限制,到那时候也就不再重要了。
这对应着一整套最适合的语言、编译器、测试、反思和监督模型,所以与其说这是一种编程语言,不如说是一种编程系统。但我对此表示乐观,相信它的出现真能帮助开发者和创作者产出极其健壮且复杂的成果。
我也一直在关注氛围编程,我觉得原型开发的高门槛一直限制着软件的进一步发展。而氛围编程能够建立起愈发复杂的系统,并且灵活地做出修改。网景在跟 IE 浏览器竞争中的落败已经证明,软件开发并不困难,维护才是大问题、更难的是如何保证成果始终健壮。我们目前正处于探索这种全新软件开发范式的早期阶段,我也非常期待见证它的终极形态。
Taylor: 我认为 AI 市场会最终演化出三个主要的、有分量的市场板块,最后我会讲一下整体会怎么演进。
首先是前沿模型市场,也叫基础模型市场。
我认为 这个市场最终只会剩下少数几个超大规模的公司和实验室,就像今天的云计算市场一样。原因很简单:训练基础模型是一个纯粹依赖资本开支的游戏。你必须拥有极其强大的融资能力,才能负担起训练这些模型的成本。
目前几乎所有试图做基础模型的创业公司,几乎都被合并了,比如 Inflection、Adept、Character 等等。对初创公司来说,这条路几乎已经走不通了。模型开发所需的资本量级太大,你很难靠融资撑到“起飞点”。而且更糟的是,作为一个资产类别,模型本身的价值会迅速贬值。所以除非你有足够的规模,能够快速收回投资,否则根本无法获得合理回报。
所以我的观点是:不要创业去做基础模型,完全不建议。
Taylor: 是的,他当然是个例外。他能融上几十亿美元,这是普通创业者比不了的。他是这个时代最强的人物之一,你不能拿自己和他比较。
第二个板块是 AI 工具层市场。
这个有点像“淘金热时卖铲子的人”,比如数据标注服务、数据平台、评估工具、专用模型等。
这类工具产品市场还是有一定风险的,因为它离基础设施提供商太近了。比如云服务市场中,Confluent、Databricks 这样的公司虽然做得不错,但 Amazon、Azure 等云厂商也在这些领域推出了直接的竞品。因为每一家基础设施厂商都都想往上延伸来差异化,他们会不断发布和你功能重叠的产品。虽然也有 Snowflake、Databricks、Confluent 这些成功例子,但也有很多类似公司被取代了。
所以做工具的风险在于:你永远不知道哪一天,某个大厂的开发者大会上就发布了一个和你一模一样的产品。因此,你必须提前思考:“如果他们也做了这个功能,用户为什么还要选择我?” 工具市场是一个好市场,但确实离基础厂商们太近,需要谨慎。
第三个市场是我最感兴趣的应用型 AI 市场。
这会对构建 AI Agent 服务的公司产生影响。我认为,“智能体就是新的 App”。未来,Agent 会成为 AI 应用的主要产品形态。
比如我们公司 Sierra 就帮助企业构建智能体,来处理客户来电、聊天回复等客服类场景。像 Harvey 这样的公司做法律和合规审查的智能体,包括合同审阅、反垄断分析等,还有的公司做内容营销、做供应链分析。
这些公司本质上是提供服务的企业,利润率更高,因为他们销售的是能带来商业成果的产品,而不是靠底层模型本身来赚钱。当然,他们也会向模型厂商“缴税”。这就是为什么虽然基础模型厂商的规模会很大,但利润率可能稍低。
而且我认为这类产品的技术门槛会越来越低,未来更多是拼“产品体验”和“业务价值”,而不是模型层的技术。
就像 SaaS 产品今天没人关心你用的是哪个数据库,大家只在乎功能一样。1998 年 Marc 和 Parker 创立 Salesforce 时,能把数据库跑在云上就算是了不起的技术突破了。但现在随便在 AWS 或 Azure 上建个数据库,根本不值一提。同理,今天构建一个 Agent 的 Orchestration 看起来很复杂、很前沿,但三五年内也会变成“傻瓜式操作”。
所以未来大家讨论智能体公司时,不会问你“模型怎么调用的”,而是问你:“你能解决哪个业务问题?”“你是帮助销售团队拿到更多线索?还是帮采购部门降低支出?”你提供的价值越清晰,你的公司就越有竞争力。
总的说来,基础模型市场不建议创业者进入,这是个资金密集型、已经高度集中的赛道,除非你很有远见,那就放手一搏。 我对后面两个市场很看好,尤其期待当构建 Agent 变容易后,会出现很多长尾的 Agent 公司。
我最近在看一个“全球市值前 50 的软件公司”榜单,前几名当然是微软、亚马逊、谷歌这些巨头,但接下来的几十家,基本都是各类 SaaS 公司,有些产品甚至很无聊,但市场非常大。我相信智能体市场也会出现类似的发展轨迹——除了客服、软件工程这些大类场景,还会有大量垂直、冷门但有真实需求的长尾场景。比如一些企业每天要花费大量人力和时间处理的业务,一个 Agent 就能解决它。这些产品需要真正懂业务的创业者来打造。这才是最大的价值所在,也是我最看好的市场。
Taylor: 如果你去问经济学家,比如 Larry Summers(他也是 OpenAI 董事会成员),他们会告诉你,技术的价值体现在推动生产力上。
回顾历史,上一次生产力真正大跃升还是在 90 年代。很多人认为上次飞跃源于第一波计算机化浪潮。企业开始上 ERP,把会计、财务这些东西搬到计算机、数据库里,尤其对于那些有大量账目处理的大型跨国公司来说,它确实改变了各个部门的工作方式。
我举个简单的例子。我父亲刚退休,他是一名机械工程师。他跟我聊起他上世纪 70 年代末刚工作时的情景。当时的机械工程公司里,大部分员工都是制图员。他们要把工程设计图从不同角度绘制出来,分层画图,然后交给承包商实施。而现在,制图员这个职业在他所在公司已经完全消失了。现在只需要做设计,最开始是 AutoCAD,现在是 Revit 直接生成 3D 模型,根本就不需要人工绘图了。制图这项工作直接被技术替代、彻底消失了。
这才是真正的生产力提升。工程公司的核心是做设计,绘图只是给承包商的必要输出,不创造价值,相当于供应链的一环。而现在这一步被技术消灭了,释放了大量人力。
从 PC 时代之后,软件产业当然也有推动生产力的进步,但从未再现那种质变式的大飞跃。我不知道具体原因,但确实很有意思,技术承诺的生产力红利,好像一直没有兑现得那么彻底。
而我认为 Agent 的出现,将重新拉升这条曲线。因为我们从“让人工作更高效”进化到了“由软件直接完成任务”。它不再只是辅助,而是完成工作本身。所以就像机械制图员被取代一样,很多原本需要人做的岗位将不再需要,那些人可以去做更高杠杆、更有价值的工作。
从这个角度看,企业能用更少的人完成更多的事,真正实现了经济上的生产效率提升。
你如果做过企业软件销售,就会知道和客户谈价值时有多绕:“我们的销售工具能让每个销售多卖 5%,所以你该付我们 100 万”。但这种归因很难。这也是生产力软件难卖的原因:你怎么证明 “让所有人效率提高 10%” 是真的?会不会有其他因素?
但智能体不一样,它不仅能自主完成工作,而且效果可衡量。这些加起来,意味着软件会迎来根本性变革:它自主完成工作,生产力提升更明显,还能衡量。这也是我相信软件应该按 “成果定价” 的原因。
这一切的影响不亚于云计算,甚至在技术上更重大。但就其如何彻底改变了软件行业的商业模式,两者前后有差别。就像现在已经很少有人再买本地部署、永久授权的软件了,未来我们也会看到类似的事情:整个市场会转向智能体、转向按效果定价的模式。不是因为这是唯一的办法,而是这显然是构建和销售软件的正确方式,市场本身会推动大家走上这条路。
Taylor: 我先讲讲 Sierra 的例子,然后再拓展到通用逻辑。
Sierra 帮企业做面向客户的 AI 智能体,主要用于客服,广义上是客户体验。比如你在 Sirius XM 卫星广播遇到问题,打电话或报告给他们的智能体;ADT 家庭安防的警报坏了,也能直接找他们的 AI 智能体。这些品牌背后用的都是我们帮他们部署的智能体。很多品牌都在用。
现在设想一个呼叫中心,它的每通电话都是有成本的,大部分是人工成本,包括人工接听、处理问题。一通电话的成本可能在 10 到 20 美元之间。
而如果 AI 智能体独立解决了客户的问题,公司就节省了这笔人力开销,比如省了 15 美元。那我们就按这个结果收费:只要智能体解决了问题,客户满意、无需人工介入,我们就按照提前约定的单价计费。我们称之为“按问题解决次数收费”或“按结果定价”。此外,我们还有一些销售场景下的智能体,会按销售成交额提成,真的有点像“机器人销售员”。
我们的理念是 AI 智能体就是你品牌的数智化门面,是客户体验的核心,我们希望我们的商业模式跟客户的商业目标完全一致。
当然,这个前提是智能体必须能自主完成任务、而且结果必须可衡量。 虽然这在所有场景下未必都能做到,但在大多数情况下是可以的。
为什么这个模式特别好?你去问任何一个 CFO 或采购负责人,他们都很头疼供应商报价单上那堆名目繁多、堆满术语的计费项,根本不知道值不值。过去流行的是“按用量计费”,比如按 token 或按调用计费。但我也不确定 token 是否真的能很好地衡量 AI 的价值。
举一个例子。现在很多编程 Agent 按 token 或使用量收费,但有个著名故事:苹果的一个工程师遇到了一个糟糕的经理,要求每天汇报写了多少行代码(工程师们都知道这是衡量效率的蠢办法)。他不服气,干脆上报了一个负数:他做了大重构,删了一堆代码。
逻辑很简单:“写得多”不代表“更好”。同样地,模型调用的 token 多,不代表效果就好。 你可能 token 烧了不少,客户问题还是没解决,反而弄得更糟——客户再打一次电话、上网吐槽,这个 AI 就是负价值了。
这就是为什么“按使用量计费”和“按效果计费”差别巨大,特别是在 AI 场景下,它们可能根本没相关性。
我是真心相信这套逻辑的。因为它让软件公司不再是供应商,而是客户真正的合作伙伴。当然,做到这一点,要求企业整个形态都要不一样:你必须能够帮助你的客户实现那些成果。不能甩个软件给客户就完了,因为你办不到就拿不到报酬。当你以正确的方式做到这一点,你的定位就变得极度以客户为中心。
我认为,这只是软件行业行业的一个升级版本。这从根本上来说是对的,对采购方友好,对整个世界也有好处。
Taylor: 我对 AI 带来的生产力提升非常看好,但现在的工具和产品还比较不成熟,而且有些地方其实挺反直觉的。比如,现在几乎所有软件公司都会用像 Cursor 这样的工具,但大多数人把它当成一种代码自动补全工具,虽然它也有很多基于 Agent 的功能,还有 OpenAI 的 Codex、Anthropic 的 Claude Code 等。
有意思的是,由于技术不够成熟,生成的代码常常有问题。所以很多人用了之后发现效率没提升。有经验的工程师都知道,改自己写的代码很容易,但 review 别人的代码(尤其是找里面微妙的逻辑错误)很难,比改自己的代码难多了。换句话说,如果 AI 生成的代码有问题,你要花很多精力和时间去修复,甚至可能因此给客户带来很多问题,导致 “功能做了不少,但系统一团糟”,这就很麻烦。
我觉得现在有几个技术路径值得关注。
一个是很多 AI 创业公司在做代码审查。
我认为“自我反思”这一概念在 Agent 里非常重要——让 AI 来监督 AI 其实很有效。试想:如果一个 Agent 90% 的时间是对的,那再做一个 Agent 找出剩下 10% 的错误,这可能不难。假设后者 90% 的时间也是对的,把它们结合起来,正确率就能到 99%。
这其实是一个数学问题。本质上,你用一个 AI 生成代码,再用另一个 AI 来审查代码,本质上是用计算资源来模拟人的思维能力。你还可以继续叠加更多层级的认知、思考和推理,从而让系统越来越可靠。我对这点非常乐观。
另外一个重要的方向是“根因分析”。
Sierra 有个工程师专门负责 MCP 服务器,支撑我们的 Cursor 实例。我们的理念是:如果 Cursor 生成了错误的代码,我们不只是要做修复,还要搞清楚“为什么错了”,争取让它下次就能生成正确的代码。这就是一种“上下文工程”:我们要弄清楚 Cursor 在生成错误代码时缺少了哪些关键上下文信息。只有搞清楚这个,它才有可能做对。
所以,那些想在软件工程等领域用 AI 提升效率的人,不应该指望模型“自己变好”。现在就要建立根因分析系统:找出每一行错误代码的原因,提供正确的上下文,构建合适的系统,让模型现在就能发挥作用。以后可能不需要这么多 “上下文工程”,但现在必须把它当成一个系统来对待。
很多人还在“等模型变好”,这确实会发生,但如果你想现在就看到效果,就得自己去做这些工作。这也是为什么应用型 AI 公司会存在的原因。这并非易事,但是可以做到的。
以 Sierra 的客户为例,虽然 AI Agent 不完美,但我们构建了一个系统,能让客户通过不断循环改进,提升整个效率。如果想把问题的自动解决率从 65% 提升到 75%,我们有一整套工具来帮助你用 AI 达成目标,比如找到改进点、分析用户不满的原因,给 Agent 加新功能提升解决率等。AI 的作用就是帮你从“干草堆”中把“针”拣出来,这才是优化系统的正确方式。
Taylor: 我认为有一小部分 go-to-market 模式已被证明是有效的,关键在于为你的产品类别选对合适的模式。
有一种是“开发者主导型”。
最典型的是 Stripe 和 Twilio,他们做得特别好。这种模式的核心是吸引 CTO 部门里有责任、有自主权的工程师,自己选解决方案。如果你的产品是平台型的,这招管用;但如果是面向业务线的,就不太行了,因为业务线通常没有专门的工程师团队,也没权限随便下载新库或用新 web 服务。这种模式在创业公司里很有效,因为创业公司的工程师在选择工具上往往有很大的自主权。
接下来是“产品主导增长型”。
这是个宽泛的说法。显然,每个公司的产品都很重要,但这种方式的具体含义是:用户可以直接从网站注册、试用,还能用信用卡直接买几个账号。这种方式适用于“用户和买家是同一个人” 的场景。比如面向小企业的软件,几乎都可以这么卖。早期的 Shopify 就是典型例子。但如果用户和买家不是同一个人,就不行了。比如费用报销软件,用户是员工,买家是财务部门,这时候让员工注册用信用卡买就不合理了。
第三种是 “直销型”。
我不想说它过时了,回顾一些靠直销成功的公司,你可能会想到 Oracle、SAP、ServiceNow、Salesforce、Adobe 等。近些年,产品主导增长型很受欢迎,确实也促成了很多优秀的产品,但这意味着不接触软件的实际买家,就很难增长。但最近我发现很多 AI 公司又开始用直销了,因为很多 AI 产品的使用者和购买者并不是同一个人。这就需要一个专门面向“买方”的市场推进方式。
创业者常犯的错误是:他们选定了一种 go-to-market 策略,却没有认真思考买方的购买流程、评估软件价值的流程等重要问题。我觉得大家需要回归“第一性原理”,用更基础、理性的方法去思考市场策略。
坦率地说,我认为很多公司应该更频繁地采用直销模式。虽然直销模式有时候因为某些公司的产品质量问题名声不太好,但我很高兴看到它在 AI 市场中逐渐回归并变得重要。
Taylor: 我不知道我是否在以不同的方式教育他们,但我确实一直鼓励他们把 AI 融入到生活中。
我最近在想,我 97、98 年参加 AP 微积分考试,当时是可以用图形计算器的。我很好奇,在允许使用计算器前后,微积分考试是不是有过变化?我本来想在聊之前问问 ChatGPT,不过之后再查吧。
我猜是有的。因为一旦允许用计算器,就不能让是否使用计算器影响题目的最终结果。这实际上迫使出题人重新思考题目设置方式:你必须设计出能真正考察微积分知识、而不是靠死记硬算或者图形计算器能直接解决的问题。
我觉得现在的教育体系,很多时候都没考虑到 “口袋里就有个超级智能”的情况。比如现在学生写一篇读后感,用 ChatGPT 很容易就能编出一篇,还可能好到老师都看不出来是 AI 写的。
那该怎么教育孩子?这对老师来说真的很难,因为我们还没有完成“考试加入计算器”这个等价的转型过程。很多评估学生的机制,现在都被 ChatGPT 和类似工具打破了,所以我们正处于一个很尴尬的过渡期。
但我们可以教孩子如何思考、如何学习。我相信教育系统最终会赶上来的,我甚至觉得 这些模型可能会成为历史上最有效的教育工具之一。 我喜欢阅读,不太喜欢听讲座,那种方式对我不管用。现在,如果你遇到一个教学风格不适合你的老师,你可以回家让 ChatGPT 用你喜欢的方式再教一遍。我家孩子在考试前用 ChatGPT 做测验,文字模式或者音频模式,都比抽认卡好。我女儿带了本莎士比亚的书回家,拍了不懂的页面,ChatGPT 给她的解释比我好多了。
我真的觉得世界上每个孩子都能有一个个性化的导师,可以根据你的学习方式(无论是偏好视觉、听觉还是阅读,都可以来教你、出题考你。这是一种“增强主动性”的工具。那些有主动性、渴望学习的孩子,可以使用一个结合了所有优秀老师优点的工具来学习。
所以,我大女儿开始学编程、做网站,每次她来问我问题时,我都让她去问 ChatGPT,并不是因为我不想管,而是我希望她学会使用这个工具。这工具太强大了。我努力让他们学会在生活中建设性地使用 AI。
我对现在的老师也充满同情,技术的发展速度已经远远超过了教育系统的应变能力。尤其是在“评估方式”这方面,现在对老师们来说很有挑战。我也担心,这些技术能放大主动性,但反过来也是一样的:如果你是个不想认真学习的学生,这些工具也提供了大量逃避学习的方法。所以对父母和老师来说,这也是挑战。
我之所以提到 AP 微积分考试,是因为图形计算器显然不是 ChatGPT。但我们总能想办法围绕现有技术来设计作业、课堂学习和考试,而且到目前为止做得还不错。我相信这次也能搞定。
更积极的一点是,我小时候读的是公立学校,有时候会遇到一些不怎么样的老师。现在不一样了,你不再需要成为有钱人家的孩子才能去辅导班了。如果你数学很好但学校没有高级统计课,没关系,现在靠 AI 就能学了。所以,对有主动性的孩子来说,这是极具民主意义的力量。太让人兴奋了,我甚至相信现在一个 11 岁的孩子在 10 年后会创办一家超棒的公司,而 ChatGPT 可能就是他的主要导师。
Taylor: 我个人认为,ChatGPT 与前两者不同。我并不认为手机在学校是个好东西,也不太适合孩子,我个人主张尽量晚一点给手机。但我认为 ChatGPT 更像是 Google 搜索。你口袋里有一个会成瘾、推送通知的设备是一回事,而使用 AI 来学习是完全另一回事。我觉得这两者是不同类型的工具。
我从根本上认为 AI 是一种实用工具。在 ChatGPT 之前,没有多少父母会问“我应该什么时候让我的孩子开始用 Google 搜索?”
Taylor: 我读很多非非虚构类的书。如果从我们今天谈论的话题出发,我会推荐《Competing Against Luck》(与运气竞争),这本书提出了“Jobs to be Done(待完成的任务)”这个我非常信奉的框架。说实话,我觉得大多数商业书都应该浓缩成一篇文章。所以可以买这本书,然后丢给 ChatGPT 生成个摘要(笑)。这本书是 Clayton M.Christensen 写的,它确实是一个很好的思考“如何通过产品交付价值”的框架,对我影响很大。
另外一本我会推荐的是《Endurance》(坚忍号),讲的是 Shackleton 探险南极的故事。书里一半内容是他和队员挨饿、在冰船上吃海豹肉的经历。这是我见过最能体现 “坚韧” 的真实故事,太了不起了。如果你是创业者,遇到困难时读这本书,会觉得 “还好,情况没那么糟”,真的很棒,而且是真实的故事。
Taylor:最近没追什么新剧。我刚和孩子们一起看了《盗梦空间》,他们特别喜欢,也让我重新欣赏 Christopher Nolan。这部电影太酷了,创意也很棒。我喜欢那种看完之后还能讨论两三天的电影。它真的很棒。
Taylor: 我现在特别喜欢 Cursor。我一直热爱写代码,所以对 AI agent 也非常兴奋。当初看到 OpenAI 的 Codex 出现时,我就很激动。Cursor 目前的形态我认为是一个“过渡型产品”,我知道他们也在开发 Agent,但我非常享受这个工具带给我的新写代码方式,它和我的热爱的事情太相关了。我在这款产品上花了很多时间,它真的很精致。
Taylor:“预测未来最好的方法是去创造它。”这句话我归功于 Alan Kay,他发明了很多现代计算的核心抽象。我是个创业者,喜欢造东西,所以这句话成了我的座右铭。
Taylor: 那时候还没有 emoji。看 FriendFeed 的评论,至少 70% 是“酷”“哇”“好棒”“真不错”这种词。而 FriendFeed 的主要用途之一是围绕某个帖子展开讨论,你发一个内容,下面是非常完整的对话。相比 Twitter 等平台,这里更适合深入讨论。
我们最初的想法是 “一键评论”。我做的第一个版本用的是 “心” 形图标, Anna Yang(现在叫 Anna Muller)当时在公司,她讨厌这个设计,说 “如果每个帖子都有心,我会吐的,太夸张了”。而且有个问题:如果帖子是悲伤一些的,用 “心” 就不合适。后来发现 “喜欢” 这个词很难翻译,因为它很微妙,是一种积极但尽可能中性的情绪,能适用于更复杂的内容,这就是为什么最后用了 “喜欢”。
参考链接:
https://www.youtube.com/watch?v=U-MmY897-BA&t=5338s
https://www.youtube.com/watch?v=qImgGtnNbx0
声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。
首届 AICon 全球人工智能开发与应用大会(深圳站)将于 8 月 22-23 日正式举行!本次大会以 “探索 AI 应用边界” 为主题,聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!
今日荐文
Claude 小升级就赢了OpenAI 9年“开源神作”?高强度推理直接歇菜、幻觉率高达50%,写作还被Kimi 2吊锤?
用户集体大逃亡!Cursor“自杀式政策”致口碑崩塌:“补贴”换来的王座,正被反噬撕碎
马斯克挖不动的清华学霸,一年造出 “反内卷 AI”!0.027B参数硬刚思维链模型,推理完爆o3-mini-high
GPT-5发布前,Anthropic对OpenAI封锁API;特斯拉被曝拖欠账款致两小企破产;人均在职7个月?字节回应|AI周报

你也「在看」吗?👇