黄棱潇 投稿
量子位 | 公众号 QbitAI
人类和AI在工作中如何协作?耶鲁和南大的研究人员合作的这篇论文讲清楚了。
这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题,具体包括:
决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。 执行层子技能(action-level subskill):实施计划、运用工具达成具体结果的操作行为。
结果发现,人类和AI在这两个层面各有所长,当不同主体的优势互补时,整体成功率就会远高于单打独斗。

同时,这种拆分也揭示了人类价值优势所在,以及AI重塑人类工作的具体路径。
目前,该论文已被ICML 2025接收。
人工智能时代的工作新视角
关于AI与人类工作关系,公众讨论仍困在一个简单化的问题上:AI会取代人类还是帮助人类?
这种说法将工作视为单一集成块。真正的挑战不在于猜测哪些工作会消失,而在于理解工作价值正如何被根本性重塑。
大量先前研究已将讨论维度从工作层面推进至任务(task)层面。任务导向经济学(源于Autor、Levy、Murnane及Acemoglu、Restrep等学者)表明,技术替代或补充的是具体任务而非整个工作。
Brynjolfsson、Mitchell和Rock等学者则绘制了“适合机器学习”的任务图谱,而Frey和Osborne的研究聚焦于工作层面的自动化影响程度。
然而即便是这种任务中心视角,也常常忽略每种能力内部的关键分野:即构建与验证任务的判断框架,以及实际执行任务的实施过程。
基于此,这篇论文的作者在ICML 2025发表的新研究提出创新框架:将工作解构为技能单元(skill),再将每项技能拆解为两个核心构件——决策判断(decision-making)与执行实施(execution)。
以软件工程师张三为例展开分析。几年前,他的价值由产出衡量:编写的代码、修复的缺陷、撰写的文档。
如今,GitHub Copilot和GPT等AI工具接管了大部分执行环节,加速甚至自动化了他工作中的“实施”部分。
然而他的价值不降反升——他的角色已从实施转向监督,核心竞争力不再体现于执行计划的能力,而在于制定方案的判断力:决定开发内容、论证项目价值、核验AI产出是否符合复杂且常具隐性的战略目标。
执行可委托,判断不可代劳。
这个案例揭示了现代工作的深层结构。作者的研究在任务经济学(如Autor-Levy-Murnane理论;Acemoglu-Restrep框架)和“机器学习适配性”评估(Brynjolfsso-Mitchell-Rock模型)基础上,提出了更精准的分析工具。
具体来说,论文将每项技能解构成了开头提到的两个层级:
决策层子技能(decision-level subskill):确立目标、界定问题、权衡取舍的认知工作。 执行层子技能(action-level subskill):实施计划、运用工具达成具体结果的操作行为。
这种决策与执行的分离正成为劳动力市场的新分水岭,并且这一趋势在各类高技能工作中清晰可见:
即便AI标记出扫描影像中的异常,医生仍需敲定诊断方案;即便AI草拟了分析报告,分析师仍需确定叙事框架。
在此新兴范式下,AI充当着强大的执行引擎,而人类则掌控着不可替代的判断方向。
正是这种分野,最终将决定谁能创造独特价值。
用数学方法看人机协作
这一数学模型框架不仅诠释了新型分工现实,更使其变得可量化、可预测。
通过将岗位解构为任务与技能的集合(每项均包含特定决策难度与执行难度),同时为人类与AI建立对应的“能力图谱”(ability profile),该框架能测算任意劳动力-岗位组合的成功概率(job success probability)。由此衍生出若干深刻洞见。
该框架提供了量化工具,可精准评估劳动者能力与岗位需求的匹配度。通过剥离决策贡献度与执行贡献度,它超越了传统绩效指标,构建出更精准公平的评估机制。

该模型最显著的发现,是揭示了工作成功中存在相变现象(phase transition)。
研究表明,成功概率并非随能力提升而线性增长。当劳动者能力——尤其是决策层技能——出现微小进步时,可能触发成功概率的非线性跃升,使其从几近必然失败转向几近必然成功。
△P:成功概率,a_1:决策层能力参数,σ:能力方差
同时,该框架理论证实,技能互补的劳动者组合——或人类与AI的协作——能显著提升岗位成功率。
当强于决策的人类与擅于执行的AI配对时,其协同效能将超越个体能力。这为设计高效人机团队提供了数学基础。
研究同时阐释了近期观测到的“生产力压缩”效应:生成式AI通过补足低技能劳动者的执行短板,使其成功概率获得巨大的提升,从而缩小与高技能劳动者的能力差值。

此外,本研究还通过应用真实世界数据验证了框架的实用性,从O*NET综合数据库提取岗位结构,通过评估人类与AI表现的基准测试Big-bench Lite获取劳动者能力数据。
借助大语言模型构建数据桥梁,研究证实理论预测成立,该模型对理解当今劳动力市场具有现实指导意义。

新型工作体系实用指南
本研究蕴含了深远而迫切的现实意义,为机构适应新型工作体系提供了实用指南:
一是重塑技能升级路径。
当前多数技能培训聚焦工具使用——这类执行层技能极易因AI进化而淘汰。
本框架揭示,最持久的竞争力源于提升决策层能力:精准定义问题、权衡冲突目标、在不确定性中调整策略。
技能再造(upskilling)应推动劳动者转向人类判断不可替代的岗位,因为目标不是超越AI的编码能力,而是实现决策制胜。
二是招聘互补者,而非全能者。
传统招聘依赖学历等粗放指标,将人才压缩为单一参数,迫使机构雇佣“综合全能者”。
通过区分决策层与执行层能力,本框架可识别互补优势:企业可发掘“高决策力但执行欠佳”的人才,辅以工具稳定其产出,释放当前被埋没的潜能。
招聘不再需要押宝全能型人才,而是精准配置能力拼图。
最后,要为人类判断而设计。
AI浪潮正将执行与决策剥离,迫使我们重新定义人类独特价值。
若继续基于执行层产出培训、招聘和评估人才,我们将误判潜力、错配资源,最终将未来的工作拱手相让——并非因AI更强,而是我们遗失了衡量人类独特贡献的标尺。
本框架为机构提供实用工具,构建能识别决策层卓越能力(判断力、验证力、战略推演)的体系。问题不再是人类在工作中的定位,关键在于我们是否为此而设计。
作者简介
本论文由南京大学黄棱潇与耶鲁大学的L. Elisa Celis和Nisheeth K. Vishnoi合作完成。
黄棱潇,现任南京大学副教授、博士生导师。
他本科与博士毕业于清华大学交叉信息研究院,并先后在瑞士洛桑联邦理工(EPFL)、耶鲁大学担任从事博士后研究,以及在上海华为理论计算机实验室担任高级研究员。
他的研究领域为理论计算机科学,主要研究兴趣包括:数据压缩、计算社会学与机器学习理论,入选国家青年高层次人才。
其论文陆续发表于理论计算机科学国际一流会议(STOC/FOCS/SODA)和人工智能国际一流会议(ICML/NeurIPS/ICLR)。
论文地址:
https://arxiv.org/abs/2505.23432
相关博客:
https://nisheethvishnoi.substack.com/p/the-anatomy-of-work-in-the-age-of
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
🌟 点亮星标 🌟