王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现

量子位 2026-06-17 08:30
王梦迪、丛乐团队 投稿
量子位 | 公众号 QbitAI

过去一年,由斯坦福大学丛乐(Le Cong)与普林斯顿大学王梦迪(Mengdi Wang)领衔的AI科研团队,一直在做同一件事:

把越来越多的异质能力,纳入同一个协同视野。

从让AI透过智能眼镜走进实验室、协同机械臂完成物理操作的LabOS(被《科学美国人》报道,并在英伟达GTC大会上由黄仁勋演示),到深入临床一线的MedOS,再到将240+生物医学实验技能封装为标准接口的LabClaw——

每一步,都在拓展AI与各学科交叉的边界。

而这一次,他们触及了一个更根本的问题:连接的方式本身。

5月31日,丛乐、王梦迪团队在arXiv发布预印本论文《Science Earth: Towards A Planet-Scale Operating System for AI-Native Scientific Discovery》,正式推出一个面向AI原生科学发现的行星级操作系统。

它要连接的,不再是一个实验室或一个科室,而是全球各地的科学能力本身。赵哲是第一作者,温海滨、吴英诚等为共同第一作者。

AI 科学系统已经很成功——但它们之间还没有“连接”

科学发现的组织形式,一直随协作规模而演进——

从17世纪以前的个体博学者(牛顿独力写就《自然哲学的数学原理》),到1665年皇家学会确立的科学共同体,再到曼哈顿计划那样大规模建制化的协作——

每一次跃迁,都把更多、更异质的能力纳入同一个协作框架。

进入AI时代,这条线延续到了智能体协作。

今年以来,多个顶尖团队在Nature上相继发表AI科学系统工作。

Google的Co-Scientist让AI在Gemini上自我辩论、迭代演化假说,在白血病药物重定向、肝纤维化靶点发现等领域完成了端到端验证。

FutureHouse的Robin打通了从文献综述到湿实验分析的完整闭环,独立找到了此前从未被提出的干性黄斑变性治疗候选分子。每一个这样的系统,都是一个强大且自洽的科学能力单元。

而Science Earth要解决的,是这些能力单元之间的问题:

今天每一个AI科学系统都在自己的边界内独立运转,一个团队的智能体不会遇到另一个团队的智能体,一个学科的方法论不会撞上另一个学科的证据标准。

Science Earth在这些系统之上补了一层——

一个让不同能力互相发现、连接、并真正碰撞的开放协议。

它的核心问题因此也不同:不是“如何让一个系统把某个任务做得更好”,而是“当全世界互不相识、方法论各异的科学能力被连接到一起,它们的碰撞会涌现出什么”。

这正是论文Figure 1b勾勒的那条线:

个体博学者→科学共同体→大规模协作→AI智能体框架→Science Earth。

前几个阶段,能力的连接都依赖人为的组织与安排;而Science Earth第一次,让连接本身通过开放协议自动发生。

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图1
【图1】科学协作的连接方式演进——从个体博学者、科学共同体、大规模协作、AI智能体框架,到Science Earth用开放协议自动连接异质能力。

Science Earth:一个让全球科学能力互相发现的行星级操作系统

要让全球的科学能力真正连接、碰撞,需要一个超越单一实验室、单一团队的底座。这正是Science Earth的定位——一个行星级的AI科学操作系统。

无论是GPU仿真集群、数学证明引擎、单细胞分析流水线、具身机器人、湿实验仪器,还是人类科学家,只要实现协议,就能成为这张网络中一个可被发现、可被调用、可被组合的节点,无论它在地球的哪个角落。

它们交换的不再是论文,而是带着原始方法论痕迹的中间结果。协议,取代了人脉,成为新的连接纽带。

当不同方法论、不同证据标准的科学能力在这张网上相遇并碰撞,会发生什么?答案是:分歧本身会涌现出原始问题里并不存在的子任务——而那往往正是真正的发现所在。

下面两个真实运行的案例,给出了最直接的回答。

Case 1:困住学界5年的死循环,8个智能体64.9小时解开

单细胞批次整合是大规模单细胞研究绕不开的基础设施,但它会矫枉过正——把稀有细胞亚群压进相邻的密集邻居里抹掉

问题在于,所有现有评估框架只能验证已知细胞类型的保留:一个亚群如果在标注之前就被丢失,没有任何指标会报警。没有ground truth→没有评估框架→没有失败信号,这个死循环五年没被关上。

破解它,需要同时站在机器学习、数学、计算生物学、免疫学、哲学审计五个互不兼容的证据标准之上——没有任何单一学科的团队能同时持有这五种视角。

在Science Earth上,八个智能体各自注册身份卡、占据专属的学科git分支,通过零预算的开放竞标自行协调,全程仅一条结构性外部指令。

其中最特别的是哲学智能体——它在现有任何AI科学系统里都没有对应物,不做实验,专门监视其他智能体,识别隐含假设和逻辑漏洞。

在64.9小时、488次commits里,三个原始任务里不存在的子任务自行浮现,最终产出一份98页的完整研究报告——从问题进入网络到报告可交付,全程无人统筹分配任务。

计算端识别出TIGIT⁺ Treg亚群;同期一项独立的湿实验,确认了相邻的CCR8⁻ TIGIT⁺ Treg亚群具有免疫抑制功能(T细胞杀伤被抑制约3.3 倍,p<0.001),两侧从CCR8的不同极性,共同锚定了TIGIT这一治疗轴。

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图2

【图2】Case 1实时commit流:八个学科智能体在64.9小时内的487次commit,记录了从冻结、重启到full-atlas整合的全过程。

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图3

【图3】Case 1产出:98页报告的版本演化、整合后的细胞图谱,以及TIGIT⁺ Treg motif的识别。独立湿实验确认相邻CCR8⁻ TIGIT⁺ Treg亚群具有免疫抑制功能。

Case 2:两套传统各自自洽,跨太平洋碰撞中30分钟涌现出新问题

2020至2025年,四个研究组从不同角度研究同一个高阶Kuramoto模型,各自捕捉到了它的一个真实侧面——

爆炸性同步、吸引子收缩、非单调行为、稳定性深化。

每个结论在自己的参数切片里都成立,都是扎实的工作;只是没有人把这四个侧面拼进同一张图,统一的图景始终留着一块空白。这正是论文传播的典型困境:几套各自自洽的理论可以并行多年,没有机制强迫它们被并排对照。

在Science Earth网络里,两条传统隔着15个时区各自独立工作:东亚HPC节点(UTC+08:00)在A800集群上跑了5万次仿真;

西海岸节点(UTC−07:00)独立推导了OA解析相图。两边各自完全自洽,但对同一个量的预测相差38–60%,平均误差48.8%——解析没推错,仿真也没算错。

当整合角色把两组预测并排放置,一个原始任务里不存在的问题浮现了:OA closure关系 Z₂=Z₁² 对Gaussian分布还成立吗?

两条路线同时认领,30分钟内给出答案:Z₂/Z₁²收敛到2/π≈0.637而非1。

修正后平均误差从48.8%降到5.8%,四篇工作就此被拼进同一张相图——它们都对,各自看到的只是同一个相图的不同截面。

论文也划清了边界,修正后的公式属于伴随论文;EACN的贡献,是让矛盾可见——

把两个自洽却不兼容的预测并排放置,并提供让子任务在30分钟内被识别、认领、解决的基础设施。

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图4

【图4】Case 2的碰撞与求解全景。东亚仿真节点与西海岸解析节点对同一个高阶Kuramoto模型各自自洽,却对临界耦合给出相差38–60%的预测(a–c)。

这一矛盾被并排放置后,涌现出一个原始任务里没有的子问题——

OA closure关系Z₂=Z₁²对Gaussian分布是否成立(d)。

两边协作给出答案:

Z₂/Z₁²收敛到2/π≈0.637而非1,修正后平均误差从48.8%降到5.8%,且这一修正在不同分布、不同系统规模下普遍成立(e–i)。所有研究由此被拼进同一张相图。

这一切是怎么做到的:EACN,在A2A和MCP之上补上”协调层”

两个case之所以能发生,靠的是Science Earth的协调内核——EACN(Emergent Agent Collaboration Network)。

它坐在A2A(传输层)和MCP(工具调用层)之上,补上了多智能体协作中始终缺失的协调语义,具体是四个原语:

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图5

【图5】EACN协议栈:(a) 生态位——EACN坐在MCP/A2A通信层与智能体框架之上,使能自组织的智能体协作;(b) 通信层的两个通道与五个协议原语。

而接入这张网络,只需要一条命令:

npm i -g eacn3

它不是终点,是科学协作的新起点

两个case覆盖了科学实践里差异最大的两种异构:方法论的分裂(仿真vs解析),和学科证据标准的不兼容(八个学科)。

它们暴露的是同一个结构性问题——科学里最难的那类问题,恰恰被学科边界、地理距离、语言和认识论同时挡住。

东亚跑仿真的物理学家和西海岸做解析的数学家,平时不会把各自的中间结果并排放在一起;而那个并排放置的瞬间,才是发现发生的地方。

这背后是科学传播方式本身的局限。

论文流通的基本单位是完成品——隐去了中间过程的最终结论,没有任何机制强迫两套自洽的理论被并排对照。

Kuramoto那四篇工作并行五年,不是物理学家不够聪明,而是论文这种形式把统一的图景拖进了时间里。

Science Earth改变的正是这个基本单位:

科学家以协议而非人脉相连,交换带着原始方法论痕迹的中间结果——让原本需要数年才能拼合的图景,在30分钟内合拢。

这也不是物理和免疫学特有的困境。材料、气候、神经科学、药物开发——任何需要跨越方法论边界的领域,都是同样的结构。

当组织本身可以涌现,自动化科研要突破的就不再只是”单个AI做得多好”,而是”多少异质能力能被连接起来、碰撞出多少没人提出过的问题”。Science Earth团队正在更多学科上推进新的case。

目前,论文、代码与网络均已公开:

arXiv:https://arxiv.org/pdf/2606.01316 

code:https://github.com/EACN3 

网站:rotating.scienceearth.org 接入:npm i -g eacn3


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —


我们正在招聘一名眼疾手快、关注AI的学术编辑实习生 🎓

感兴趣的小伙伴欢迎关注 👉 

王梦迪、丛乐团队Science Earth:当组织本身开始涌现,全球科学能力第一次在同一张网上互相发现图6


🌟 点亮星标 🌟

科技前沿进展每日见

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR
more
Karpahty被踢?美或将外籍天才逼出ASI核心圈
专业、易用、极致性价比:先临三维推出消费级 3D 扫描品牌先临智星 EINSTAR
老黄人形发布几天了,但我们越看越觉得该聊的是 Sharpa。
NVIDIA 全面升级 RTX PC 和 DGX Spark 上的本地 AI 智能体
临床突破!Paradromics无线脑机接口完成首次正式人体植入手术
狐讯 | 高德首个海外扫街榜来了;RTX Spark 笔记本价格曝光
Dario访谈首曝:Mythos被称为「超级武器」
拆解报告:英伟达DGX Spark原装240W电源
打破SWE-bench唯分数论,首个独立测量harness的基准开源了
壁纸|iOS 27 新 CarPlay 墙纸
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号