“编者按:关于通用人工智能何时到来,业界预测两极分化,或长达二十年,或仅在两年之内。播客主理人Dwarkesh Patel结合其上百小时的亲身实践,提出了一个更为审慎的见解。
他认为,当前人工智能发展的真正瓶颈,在于其持续学习能力的缺失。文末附播客地址,详细内容如下:
对于一个流传甚广的观点——即即便技术停滞,现有AI的变革潜力也已超越互联网——我持保留意见。
当下的大语言模型固然神奇,但世界500强企业并未用其彻底重塑工作流,这并非因为管理层保守。
根本原因在于,我们很难从这些模型中获得真正稳定、类人的劳动输出,这背后反映出它们在核心能力上的根本性缺失。
百小时实践,洞见大模型能力幻觉
我自认是AI的积极探索者,曾投入上百小时,试图为我的播客后期制作打造一套自动化工具。
我尝试让模型重写文稿以提升可读性,或从文本中精准识别出精彩片段,甚至与我逐段共创文章。
这些本应是模型最擅长的纯语言任务,其表现却只能算差强人意。正是这些碰壁的经历,反而拉长了我对通用人工智能到来的预期。
问题的症结在于,大语言模型无法像人类一样,通过持续学习实践而日渐精进。这种持续学习能力的缺失,是一个巨大无比的瓶颈。
你无法像指导员工一样,通过给予高层次反馈来让模型成长,你只能被困在它开箱即用的初始能力中。
人类的宝贵之处,不在于其原始智力,而在于他们能在实践中积累背景知识、反思失败、并不断发掘微小的改进空间。
萨克斯风的隐喻:为何我们无法教会AI
如何教一个孩子吹萨克斯风?你会让他尝试,倾听声音,然后根据结果进行微调,这是一个不断反馈、迭代的闭环。
现在想象另一种教学模式:学生A试一次,犯错后便被请走。你写下详尽的错误分析,交给学生B,让他直接挑战大师名曲。
学生B失败后,你再优化指令,交给学生C。如此往复,终将一事无成。无论指令多么完美,没人能仅靠阅读说明书就学会一门乐器。
这,恰恰就是我们今天教导大语言模型的唯一模式。它并非人类学习那种深思熟虑、主动适应的动态过程。
现有方案的局限
一个有趣的现象是,模型在单次对话中确实能即时学习。当我多次修正它的草稿后,它后续的建议质量会显著提升。
然而,这种对我的风格与偏好的微妙理解,会在对话结束后彻底遗忘,无法沉淀为长期能力。
有人提出用滚动上下文窗口来解决,但将丰富的隐性经验压缩成纯文本摘要,其过程必然是脆弱且充满信息损耗的。
观点交锋与未来预测
基于此,我无法认同一些研究员的乐观看法,他们认为五年内多数白领工作将被自动化。
我的判断是:若AI技术今天停滞,被取代的白领岗位将不足25%。因为缺乏持续学习能力,模型无法真正融入组织,成为一名合格的员工。
尽管短期悲观,这却让我对长远未来极为乐观。一旦持续学习被攻克,AI模型的价值将迎来一次巨大的、非线性的飞跃。
届时,AI将被广泛部署,像人类一样在工作中学习。更关键的是,它们能整合所有副本的经验,一个AI相当于在同时学习经济体中的所有工作。
我的两个50/50赌注
我对未来有两个具体的50/50概率判断:
一、AI能端到端为我的小企业完成报税:2028年。
我认为,在计算机自动化使用(browser use )领域,我们尚处GPT-2时代。尽管面临数据稀缺、长周期反馈等挑战,但强大的基础模型和资源投入或将加速进程。从GPT-2到GPT-4,我们用了四年。
二、AI能在任何白领工作中像人类一样在职学习:2032年。
虽然目前尚无明确的技术路径,但七年在人工智能领域足以发生翻天覆地的变化。七年前,GPT-1才刚刚问世。
未来十年:见分晓,或路漫漫
你或许觉得我的观点矛盾:既强调瓶颈巨大,又预言变革近在咫尺。
这是因为,通用人工智能的实现很可能呈「对数正态分布」——若非在这十年内爆发,便可能遥遥无期。
过去十年的进步,主要由训练算力的指数级增长驱动。但这种每年超四倍的增长,无论从芯片、能源还是经济角度看,都无法持续到2030年以后。
届时,进步将更多依赖算法创新,而其低垂的果实也终将被摘尽。因此,通用人工智能实现的可能性在未来十年后将急剧下降。
这意味着,我们必须为两种截然不同的未来同时做好准备:一个是在未来数十年都风平浪静的世界,另一个则是在这个十年内就迎来真正疯狂变革的世界。
参考资料:https://www.youtube.com/watch?v=nyvmYnz6EAg&list=WL&index=4&ab_channel=DwarkeshPatel
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!