万用科研助手:浙大推出SciToolAgent构建多工具协同科研平台

ScienceAI 2025-08-28 16:30

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

资讯配图


资讯配图

编辑丨@

现代科研离不开智能工具,从分子模拟到数据统计,从文献追踪到实验设计,研究者每天要在不同的软件和平台间来回切换。然而这些工具往往互不兼容,导致科研工作流程支离破碎。

而且更尴尬的是,即使是最新的 LLMs,在调用多种科研工具时也会频繁出现任务进度卡死,无法顺利完成端到端的复杂任务。

在这种背景下,浙江大学提出了一个由大型语言模型驱动的智能体 SciToolAgent,通过基于图谱的检索增强生成来实现智能化的工具选择与执行,可以很好地自动化复杂科学工作流。

这项研究以「SciToolAgent: a knowledge-graph-driven scientific agent for multitool integration」为题,于 2025 年 8 月 20 日发布在《Nature Computational Science》。

资讯配图

论文链接:https://www.nature.com/articles/s43588-025-00849-y

知识图谱驱动的任务

SciToolAgent 的核心是一个 知识图谱(Knowledge Graph, KG),通过基于图谱的检索增强生成来实现智能化的工具选择与执行。

研究者通过知识图谱建立了任务语义与工具功能之间的对应关系,相当于为 AI 配备了科研语义大脑。当面对复杂任务时,系统不会盲目尝试工具,而是根据图谱进行合理调度。

资讯配图

图 1:SciToolAgent 概览。

与传统的多智能体架构相比,SciToolAgent 避免了任务割裂和上下文丢失。它不仅能理解单点指令,还能维持整个科研任务链条的逻辑一致性。例如,在材料学模拟中,它能先调用数据库检索材料参数,再衔接分子动力学工具,最后输出可供进一步实验的预测结果。

跨领域泛化验证

先前的概述中已提到,即使是最新提出的 LLM,也会面临任务调用时的卡死风险,所以对于 SciToolAgent 来说,性能的评估将会是研究团队最为关注的方面。

SciToolEval 的评估数据集包含 531 个跨领域科学问题,分两级:Level-1(152 题,单工具)和Level-2(379 题,多工具),通过率、工具规划准确率和最终答案准确率被作为评估指标。

与最先进的基线(ReAct, Reflexion, ChemCrow, CACTUS)相比,SciToolAgent 在所有评估指标和级别上均表现更优,在在解决多工具问题时优势尤其显著。

资讯配图

图 2:不同代理和基础模型的比较结果。

为了验证泛化性,团队设计了覆盖物理、化学、材料学、生命科学的测试集。

相比单一 LLM agent,SciToolAgent 在复杂多步骤任务中完成率显著提高。相比单一 LLM agent,SciToolAgent 在复杂多步骤任务中完成率显著提高,这凸显了它在各个领域中的适应性。

举个例子来说,在化学任务中,普通 LLM agent 往往停留在调用失败缺乏上下文的状态,而 SciToolAgent 则能完成参数查询、反应路径分析和模拟结果解释的完整流程。这种连贯性,正是知识图谱赋予的优势。

除此之外,研究团队还特意安排了 SciToolAgent 与传统单工具 agent、以及简单的 LLM+API 调用方式进行比较。结果显示,即便加上多智能体协作,仍存在上下文割裂、信息冗余的问题;SciToolAgent 则能在不同场景中维持高稳定性,说明它不只是能用工具,而是真正学会了如何合理组合工具

小结

SciToolAgent 的突破点并非性能暴涨一个数量级,而是展示了一种新的科研工作模式:智能体能够在跨领域环境中自动泛化,不必依赖繁琐的人工微调。

AI 在科研中不必局限于单点突破,而可以成为工具生态的整合者。对研究者来说,未来或许只需描述任务目标,AI 就能自动匹配并调用最合适的工具链条。

从更长远的角度看,这类知识图谱驱动的多工具智能体,可能成为科研数字化转型的关键枢纽。它们让 AI 从擅长单一工具成长为懂得选择合适工具的科研助手。而正是这种跨学科的泛化能力,为下一代科学研究平台打下基础。

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号