王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现

王梦迪、丛乐团队投稿
量子位 | 公众号 QbitAI

过去一年，由斯坦福大学丛乐（Le Cong）与普林斯顿大学王梦迪（Mengdi Wang）领衔的AI科研团队，一直在做同一件事：

把越来越多的异质能力，纳入同一个协同视野。

从让AI透过智能眼镜走进实验室、协同机械臂完成物理操作的LabOS（被《科学美国人》报道，并在英伟达GTC大会上由黄仁勋演示），到深入临床一线的MedOS，再到将240+生物医学实验技能封装为标准接口的LabClaw——

每一步，都在拓展AI与各学科交叉的边界。

而这一次，他们触及了一个更根本的问题：连接的方式本身。

5月31日，丛乐、王梦迪团队在arXiv发布预印本论文《Science Earth: Towards A Planet-Scale Operating System for AI-Native Scientific Discovery》，正式推出一个面向AI原生科学发现的行星级操作系统。

它要连接的，不再是一个实验室或一个科室，而是全球各地的科学能力本身。赵哲是第一作者，温海滨、吴英诚等为共同第一作者。

AI 科学系统已经很成功——但它们之间还没有“连接”

科学发现的组织形式，一直随协作规模而演进——

从17世纪以前的个体博学者（牛顿独力写就《自然哲学的数学原理》），到1665年皇家学会确立的科学共同体，再到曼哈顿计划那样大规模建制化的协作——

每一次跃迁，都把更多、更异质的能力纳入同一个协作框架。

进入AI时代，这条线延续到了智能体协作。

今年以来，多个顶尖团队在Nature上相继发表AI科学系统工作。

Google的Co-Scientist让AI在Gemini上自我辩论、迭代演化假说，在白血病药物重定向、肝纤维化靶点发现等领域完成了端到端验证。

FutureHouse的Robin打通了从文献综述到湿实验分析的完整闭环，独立找到了此前从未被提出的干性黄斑变性治疗候选分子。每一个这样的系统，都是一个强大且自洽的科学能力单元。

而Science Earth要解决的，是这些能力单元之间的问题：

今天每一个AI科学系统都在自己的边界内独立运转，一个团队的智能体不会遇到另一个团队的智能体，一个学科的方法论不会撞上另一个学科的证据标准。

Science Earth在这些系统之上补了一层——

一个让不同能力互相发现、连接、并真正碰撞的开放协议。

它的核心问题因此也不同：不是“如何让一个系统把某个任务做得更好”，而是“当全世界互不相识、方法论各异的科学能力被连接到一起，它们的碰撞会涌现出什么”。

这正是论文Figure 1b勾勒的那条线：

个体博学者→科学共同体→大规模协作→AI智能体框架→Science Earth。

前几个阶段，能力的连接都依赖人为的组织与安排；而Science Earth第一次，让连接本身通过开放协议自动发生。

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图1
【图1】科学协作的连接方式演进——从个体博学者、科学共同体、大规模协作、AI智能体框架，到Science Earth用开放协议自动连接异质能力。

Science Earth：一个让全球科学能力互相发现的行星级操作系统

要让全球的科学能力真正连接、碰撞，需要一个超越单一实验室、单一团队的底座。这正是Science Earth的定位——一个行星级的AI科学操作系统。

无论是GPU仿真集群、数学证明引擎、单细胞分析流水线、具身机器人、湿实验仪器，还是人类科学家，只要实现协议，就能成为这张网络中一个可被发现、可被调用、可被组合的节点，无论它在地球的哪个角落。

它们交换的不再是论文，而是带着原始方法论痕迹的中间结果。协议，取代了人脉，成为新的连接纽带。

当不同方法论、不同证据标准的科学能力在这张网上相遇并碰撞，会发生什么？答案是：分歧本身会涌现出原始问题里并不存在的子任务——而那往往正是真正的发现所在。

下面两个真实运行的案例，给出了最直接的回答。

Case 1：困住学界5年的死循环，8个智能体64.9小时解开

单细胞批次整合是大规模单细胞研究绕不开的基础设施，但它会矫枉过正——把稀有细胞亚群压进相邻的密集邻居里抹掉。

问题在于，所有现有评估框架只能验证已知细胞类型的保留：一个亚群如果在标注之前就被丢失，没有任何指标会报警。没有ground truth→没有评估框架→没有失败信号，这个死循环五年没被关上。

破解它，需要同时站在机器学习、数学、计算生物学、免疫学、哲学审计五个互不兼容的证据标准之上——没有任何单一学科的团队能同时持有这五种视角。

在Science Earth上，八个智能体各自注册身份卡、占据专属的学科git分支，通过零预算的开放竞标自行协调，全程仅一条结构性外部指令。

其中最特别的是哲学智能体——它在现有任何AI科学系统里都没有对应物，不做实验，专门监视其他智能体，识别隐含假设和逻辑漏洞。

在64.9小时、488次commits里，三个原始任务里不存在的子任务自行浮现，最终产出一份98页的完整研究报告——从问题进入网络到报告可交付，全程无人统筹分配任务。

计算端识别出TIGIT⁺ Treg亚群；同期一项独立的湿实验，确认了相邻的CCR8⁻ TIGIT⁺ Treg亚群具有免疫抑制功能（T细胞杀伤被抑制约3.3 倍，p<0.001），两侧从CCR8的不同极性，共同锚定了TIGIT这一治疗轴。

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图2

【图2】Case 1实时commit流：八个学科智能体在64.9小时内的487次commit，记录了从冻结、重启到full-atlas整合的全过程。

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图3

【图3】Case 1产出：98页报告的版本演化、整合后的细胞图谱，以及TIGIT⁺ Treg motif的识别。独立湿实验确认相邻CCR8⁻ TIGIT⁺ Treg亚群具有免疫抑制功能。

Case 2：两套传统各自自洽，跨太平洋碰撞中30分钟涌现出新问题

2020至2025年，四个研究组从不同角度研究同一个高阶Kuramoto模型，各自捕捉到了它的一个真实侧面——

爆炸性同步、吸引子收缩、非单调行为、稳定性深化。

每个结论在自己的参数切片里都成立，都是扎实的工作；只是没有人把这四个侧面拼进同一张图，统一的图景始终留着一块空白。这正是论文传播的典型困境：几套各自自洽的理论可以并行多年，没有机制强迫它们被并排对照。

在Science Earth网络里，两条传统隔着15个时区各自独立工作：东亚HPC节点（UTC+08:00）在A800集群上跑了5万次仿真；

西海岸节点（UTC−07:00）独立推导了OA解析相图。两边各自完全自洽，但对同一个量的预测相差38–60%，平均误差48.8%——解析没推错，仿真也没算错。

当整合角色把两组预测并排放置，一个原始任务里不存在的问题浮现了：OA closure关系 Z₂=Z₁² 对Gaussian分布还成立吗？

两条路线同时认领，30分钟内给出答案：Z₂/Z₁²收敛到2/π≈0.637而非1。

修正后平均误差从48.8%降到5.8%，四篇工作就此被拼进同一张相图——它们都对，各自看到的只是同一个相图的不同截面。

论文也划清了边界，修正后的公式属于伴随论文；EACN的贡献，是让矛盾可见——

把两个自洽却不兼容的预测并排放置，并提供让子任务在30分钟内被识别、认领、解决的基础设施。

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图4

【图4】Case 2的碰撞与求解全景。东亚仿真节点与西海岸解析节点对同一个高阶Kuramoto模型各自自洽，却对临界耦合给出相差38–60%的预测（a–c）。

这一矛盾被并排放置后，涌现出一个原始任务里没有的子问题——

OA closure关系Z₂=Z₁²对Gaussian分布是否成立（d）。

两边协作给出答案：

Z₂/Z₁²收敛到2/π≈0.637而非1，修正后平均误差从48.8%降到5.8%，且这一修正在不同分布、不同系统规模下普遍成立（e–i）。所有研究由此被拼进同一张相图。

这一切是怎么做到的：EACN，在A2A和MCP之上补上”协调层”

两个case之所以能发生，靠的是Science Earth的协调内核——EACN（Emergent Agent Collaboration Network）。

它坐在A2A（传输层）和MCP（工具调用层）之上，补上了多智能体协作中始终缺失的协调语义，具体是四个原语：

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图5

【图5】EACN协议栈：(a) 生态位——EACN坐在MCP/A2A通信层与智能体框架之上，使能自组织的智能体协作；(b) 通信层的两个通道与五个协议原语。

领域感知的发现：任何注册的能力，都能按领域被需要它的任务找到。
竞争性竞标：能力依据自身的置信度和历史信誉，自主决定是否应标。
跨范式仲裁：来自不同证据标准的结果被并排比较，冲突不会被抹平，而是生成新的子任务——这正是两个 case 里”新问题”涌现的机制。
信誉累积：信任在一次次交互中沉淀，影响未来的任务分配。

而接入这张网络，只需要一条命令：

npm i -g eacn3

它不是终点，是科学协作的新起点

两个case覆盖了科学实践里差异最大的两种异构：方法论的分裂（仿真vs解析），和学科证据标准的不兼容（八个学科）。

它们暴露的是同一个结构性问题——科学里最难的那类问题，恰恰被学科边界、地理距离、语言和认识论同时挡住。

东亚跑仿真的物理学家和西海岸做解析的数学家，平时不会把各自的中间结果并排放在一起；而那个并排放置的瞬间，才是发现发生的地方。

这背后是科学传播方式本身的局限。

论文流通的基本单位是完成品——隐去了中间过程的最终结论，没有任何机制强迫两套自洽的理论被并排对照。

Kuramoto那四篇工作并行五年，不是物理学家不够聪明，而是论文这种形式把统一的图景拖进了时间里。

Science Earth改变的正是这个基本单位：

科学家以协议而非人脉相连，交换带着原始方法论痕迹的中间结果——让原本需要数年才能拼合的图景，在30分钟内合拢。

这也不是物理和免疫学特有的困境。材料、气候、神经科学、药物开发——任何需要跨越方法论边界的领域，都是同样的结构。

当组织本身可以涌现，自动化科研要突破的就不再只是”单个AI做得多好”，而是”多少异质能力能被连接起来、碰撞出多少没人提出过的问题”。Science Earth团队正在更多学科上推进新的case。

目前，论文、代码与网络均已公开：

arXiv：https://arxiv.org/pdf/2606.01316

code：https://github.com/EACN3

网站：rotating.scienceearth.org 接入：npm i -g eacn3

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

我们正在招聘一名眼疾手快、关注AI的学术编辑实习生 🎓

感兴趣的小伙伴欢迎关注 👉

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现图6

🌟 点亮星标 🌟

科技前沿进展每日见