Nature点赞!哈佛MIT最新作:AI科学家时代来了

新智元 2025-10-20 11:10

Nature点赞!哈佛MIT最新作:AI科学家时代来了图1



  新智元报道  

编辑:LRST
【新智元导读】AI科学家时代正在到来,哈佛MIT最新推出的ToolUniverse,通过一个统一平台,让AI用自然语言操作600+科学工具,推动科研自动化的全面升级,迎接科学发现新范式。

科学史的每一次飞跃,往往伴随着工具的革新。随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:「AI科学家」。

在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体「能否」解决特定科学问题,转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。

Nature近期发布的新闻解析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse

Nature点赞!哈佛MIT最新作:AI科学家时代来了图2

新闻链接:https://www.nature.com/articles/d41586-025-03246-7

ToolUniverse开放的在线环境让研究人员能够用自然语言将各类大模型和智能体 连接到不同科学领域常用的工具,为打造AI科学家奠定了基础。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图3

项目主页:https://aiscientist.tools

论文详解:https://arxiv.org/abs/2509.23426

代码开源:https://github.com/mims-harvard/ToolUniverse


Nature点赞!哈佛MIT最新作:AI科学家时代来了图4
当AI生成模型不再足够
AI科学家为何而来?


传统LLM(大语言模型)的核心能力是 「文本生成」,但科学研究需要的远不止于此:

它需要分解复杂问题(如 「如何优化降胆固醇药物」)、规划实验步骤、调用专业工具(如分子模拟软件)、验证数据合理性,甚至在结果偏离预期时自我修正。这种 「推理 + 行动」 的闭环,正是AI从 「模型」 升级为 「科学家」 的关键。

AI智能体的突破在于将 LLM 与三大机制深度耦合:

但科学研究的特殊性给 AI智能体 其提出了更高要求:不同学科(生物、化学、物理)的工具格式不统一、数据需可复现、实验流程需严谨验证。

若仅依赖通用的工具调用协议(如MCP,模型上下文协议),无法解决 「如何让AI理解质谱数据格式」「如何协调分子模拟与临床数据库的输出」 等专业问题。而这,正是ToolUniverse解决的核心问题之一。


Nature点赞!哈佛MIT最新作:AI科学家时代来了图5
ToolUniverse
科学AI Agent的生态基石


ToolUniverse并非单一工具,而是一套 「连接 LLM 与科学工具」 的标准化生态(图 1)。

它的核心目标是:让任何LLM都能通过统一接口,调用600 +科学工具,完成从 「提出假设」 到 「验证结论」 的全流程研究。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图6

图1:ToolUniverse 是一个用于打造AI科学家的生态系统。通用型大语言模型(LLM)、推理模型与智能体可连接ToolUniverse提供的600余种科学工具,实现科研工作流自动化。


Nature点赞!哈佛MIT最新作:AI科学家时代来了图7
统一科学工具的「HTTP」
解决三大痛点


就像HTTP协议统一了互联网通信,ToolUniverse为AI科学家定义了专属的 「科学工具交互标准」(图 2),既能够无缝集成本地部署的开源工具,也能安全、规范地连接强大的闭源模型与API服务,解决了MCP协议在科研场景中的三大痛点:

Nature点赞!哈佛MIT最新作:AI科学家时代来了图8

图2: ToolUniverse通过统一协议连接机器学习模型、智能体、科学软件工具、数据库与API。它引入了标准化的工具规范框架,使语言模型能够一致地发现、调用并解析各类工具。类似于HTTP在互联网通信中确立标准的方式,ToolUniverse 协议通过两项核心操作:Find Tool(查找工具) 与Call Tool(调用工具), 定义了AI科学家如何请求工具并接收结果。

这种标准化设计,让AI从 「会用工具」 升级为 「会用科学工具解决问题」。


Nature点赞!哈佛MIT最新作:AI科学家时代来了图9
四大核心组件
支撑AI科学家的完整生命周期

ToolUniverse 通过四大组件(图 3),覆盖了AI科学家从 「工具获取」 到 「 workflow 优化」 的全流程需求,真正实现 「可编程的科学协作」。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图10

图3: ToolUniverse 提供了六项关键能力,支持AI科学家完整的生命周期:查找工具、调用工具、添加新工具、将工具串联为工作流、从自然语言生成新工具,以及优化工具规范以提升可用性


Nature点赞!哈佛MIT最新作:AI科学家时代来了图11

Tool Manager:工具的 「注册与管理中心」

它解决了 「如何将新工具接入生态」 的问题:

本地工具(如实验室自研的数据分析脚本)只需提交 「功能描述 + 参数格式 + 输出示例」,即可被自动纳入统一 schema;

远程工具(如云端分子模拟平台)通过 MCP 协议接入,无需暴露内部代码,兼顾安全性与兼容性;

自动验证工具有效性(如 「输入错误分子结构时是否返回提示」),确保AI调用时的可靠性。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图12

Tool Composer:科学 workflow 的 「搭建者」

科学研究很少依赖单一工具,比如 「药物筛选」 需要串联 「靶点数据库→化合物库→分子对接工具→毒性预测工具」。Tool Composer 的作用就是:

定义工具间的数据流(如 「分子对接工具的输出结构,直接作为毒性预测工具的输入」);

支持条件逻辑(如 「若毒性预测超标,则返回上一步重新筛选化合物」);

生成可复现的 workflow 脚本,方便人类科学家追溯或修改。

通过智能体系统,实现工具间调用关系的自动构建与优化。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图13

Tool Discover:工具的 「自动生成器」

当现有工具无法满足需求(如 「需要一种新的基因表达数据可视化工具」),AI 可通过自然语言描述需求,Tool Discover 会:

将文本描述转化为结构化工具规格(如 「输入:CSV 格式表达矩阵;输出:热图 + 火山图」);

自动生成代码、测试用例,通过 「预期行为 vs 实际输出」 的反馈循环迭代优化;

无需人工编码,让工具库随科研需求动态扩展。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图14

Tool Optimizer:工具的 「质量守护者」

科学研究强调可复现性,Tool Optimizer 通过三大动作保障工具稳定性:

定期生成测试用例(如 「用已知活性的化合物验证分子对接工具的准确性」);

分析工具输出与规格的偏差(如 「某工具预测的结合能与实验值误差突然增大」);

自动更新工具文档或参数设置,确保AI调用时的一致性。


Nature点赞!哈佛MIT最新作:AI科学家时代来了图15
跨模型兼容
让每类LLM都能成为科学助手


不同科研场景对LLM的需求差异极大:实验室本地分析可能需要轻量开源模型(如 Llama 3),而复杂 hypothesis 推理可能依赖云端大模型(如 Claude 3),生物医药研究还需专业模型(如 TxAgent)。

ToolUniverse的兼容性设计打破了 「模型绑定」 局限(图 4):将工具调用转化为 「标准化函数调用」,无需修改 LLM 的权重或Tokenizer——只需通过轻量级包装器,向模型传递 「工具列表 + 参数格式」,模型输出即可被解析为工具调用指令。

这种设计的价值在于:

科研团队可根据成本、隐私需求选择模型,无需担心 「换模型就要重写工具调用逻辑」;

能在相同实验条件下对比不同模型的性能(如 「用Gemini-CLI vs Claude 3做药物筛选,哪个准确率更高」);

支持专业模型与通用工具的结合(如 「让TxAgent调用 ChEMBL 数据库,分析药物 - 靶点相互作用」)。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图16

图4: ToolUniverse 为构建不同类型的AI科学家提供了简洁而高效的协议:既可用于基于通用大语言模型(如左图的 Claude),也可用于具备更强推理与控制能力的智能体系统(如右图的 Gemini-CLI),以及专注于生物医学研究的AI智能体(如 TxAgent)。



Nature点赞!哈佛MIT最新作:AI科学家时代来了图17
案例实证
AI科学家如何优化降胆固醇药物


理论架构需要实践验证。我们以 「寻找更安全的降胆固醇药物」 为例,看看 ToolUniverse 构建的AI科学家(基于 Gemini-CLI agent)如何完成全流程研究(图 5)。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图18

图5:展示了一个基于 ToolUniverse 构建并应用于药物发现的AI科学家实例。该系统与 Gemini-CLI 智能体相连,能够识别生物学靶点、筛选并优化候选药物、评估分子性质,并利用计算工具验证结果。整个工作流程展示了AI科学家如何在药物研发的各个阶段进行推理、整合多源证据,并在必要时融入人类反馈。

步骤1:靶点识别 —— 锁定 「关键蛋白」

AI首先调用 「文献挖掘工具」 和 「药物 - 靶点数据库」,通过分析 thousands of 研究论文与临床数据,得出结论:HMG-CoA 还原酶是胆固醇合成的关键酶,且该酶在肝脏外的过度抑制会引发肌肉疼痛等副作用。这一步完全复刻了人类科学家的 「靶点发现」 逻辑,但效率提升 10 倍以上。

步骤2:起始化合物筛选 —— 从现有药物入手

AI通过ToolUniverse查询 「已上市降胆固醇药物库」,筛选出以 HMG-CoA 还原酶为靶点的药物,最终选择 「洛伐他汀(lovastatin)」 作为起始化合物 —— 理由是 「临床验证充分,但肝外组织渗透率高,存在副作用风险」。

步骤3:化合物优化 —— 提升安全性与有效性

AI调用三大工具协作:

ChEMBL 数据库:获取洛伐他汀的100 +结构类似物;

Boltz-2 工具:预测每个类似物与 HMG-CoA 还原酶的结合能(数值越低,结合越强);

ADMET-AI工具:预测类似物的肝渗透率、脑渗透率、代谢稳定性。

通过综合排序,AI筛选出两个候选:

普伐他汀(pravastatin):已知药物,肝外渗透率低,副作用更少(验证了AI的可靠性);

CHEMBL2347006/CHEMBL3970138:新化合物,结合能比洛伐他汀高 30%,脑渗透率降低 50%,生物利用度提升 25%。

步骤4:专利与验证 —— 规避法律风险

最后,AI调用 「专利检索工具」,发现新化合物已被注册用于心血管疾病治疗,虽无法直接开发,但为后续结构修饰提供了方向。

整个过程中,AI不仅完成了 「调用工具」 的动作,更体现了科学推理能力:它能解释 「为何选择该靶点」「为何淘汰某化合物」,甚至能根据副作用风险调整优化方向 —— 这正是 「AI科学家」 与普通工具调用的本质区别。


Nature点赞!哈佛MIT最新作:AI科学家时代来了图19
从用到建
当「使用者」成为「共创者」


一个健康的生态系统,其生命力不仅来源于使用,更来源于创造与贡献。

ToolUniverse内置了Tool Discover和Tool Optimizer等核心组件。前者允许用户通过自然语言描述,自动化生成新工具的规范与代码框架;后者能通过多轮测试与反馈,持续优化现有工具的说明与易用性。

这一机制巧妙地将用户从纯粹的「消费者」转变为潜在的「共建者」,激励社区智慧反哺生态,形成一个自我完善、持续生长的良性循环。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图20

ToolUniverse的终极愿景,是赋能各个科学领域的专家,而不仅仅是AI专家。当生物学家、化学家、药物研发人员能够基于一个稳定、丰富的工具生态,轻松定制符合其独特研究需求的「AI科研伙伴」时,或许将迎来一个真正AI辅助科研的全新时代。

AI科学家不仅能调用数据库、模拟器,还能通过标准化协议控制实验室自动化设备(如液体处理机器人、质谱仪),实现 「提出假设→设计实验→自动执行→分析结果」 的全流程闭环。

当AI能真正理解科学问题、自主协调工具、与人类共同推进认知边界时,我们或许正站在 「科学发现新范式」 的起点。

Nature点赞!哈佛MIT最新作:AI科学家时代来了图21
ToolUniverse开发团队
参考资料:
https://arxiv.org/abs/2509.23426

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
张亚勤院士:AI五大新趋势,物理智能快速演进,2035年机器人数量或比人多
「AI向善播播间」倒计时1天!关于「性」,那些跟爸妈张不开嘴的,能和AI聊吗?
全球首个「长肌腱」AI机器人量产!Nature盛赞的中国方案惊艳IROS现场
NVIDIA 中国开发者日与您重聚苏州,一天解锁 AI 全栈开发技能!
当AI全面落地双11:阿里妈妈和商家们的增长转向
OpenAI也缺卡!僧多粥少,自曝内部抢卡抢到发疯
六问讯飞 AI:新品耳机发布背后,如何理解讯飞 AI 翻译战略与技术创新?
【硬件资讯】AI冲击,存储类产品疯狂涨价!到底是天灾还是人祸??
Nature点赞!哈佛MIT最新作:AI科学家时代来了
赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号