将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch

量子位 2025-10-14 12:00
InternAgent团队 投稿
量子位 | 公众号 QbitAI

将复杂科研过程自动化落地,上海人工智能实验室推出FlowSearch!

在GAIA、HLE、GPQA以及TRQA等科研基准上,FlowSearch不仅实现了性能全面领先,还展示了AI在复杂科研任务中的动态协作与深度推理能力。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图1

展开来说,当AI在问答基准和标准化测试中表现卓越之时,其进行科学研究的能力也在被更多关注。

科学研究不同于解题或信息检索,它是一个开放性、长期且复杂的认知过程——研究者需要提出原创问题、设计实验方案、收集并整合多源证据,并在不断迭代中形成系统结论。

这样的过程远超计算能力本身,它要求的是创新思维、动态推理能力以及对复杂知识关系的精准掌控。

FlowSearch,正是一个由动态结构化知识流驱动的深度科研智能体

它通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

与传统“输入—计算—输出”的封闭式AI不同,FlowSearch更像一个理解你研究思路的伙伴——当发现新信息,它会主动调整计划;当证据链不完整,它会引导进一步探索;当推理偏离目标,它会进行自我修正。

研究团队表示,它标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,让科学发现不再只是等待AI输出结果,而是与AI一起探索、不断前进。

FlowSearch:让AI成为你的科研探索伙伴

FlowSearch由三大核心模块组成,每个模块都像科研团队中的“关键成员”,协同完成复杂任务:

1、Knowledge Flow Planner:规划研究路线,像科学家一样拆解问题、逐层细化制定任务;

2、Knowledge Collector:执行任务、收集信息,就像勤奋的实验助理一样整理数据;

3、Knowledge Flow Refiner:反思和优化整个研究流程,确保科研思路清晰、连贯、可持续。

当你提出研究问题时,FlowSearch先由Planner构建初步的知识流——每个节点代表一个子问题或关键概念,节点之间的连接描绘了知识依赖关系。

随后,多名“智能体”同时开始执行任务,Collector不断填充节点内容,而Refiner会根据中间结果动态调整流程——增删任务、优化依赖,让科研路径像有生命一样逐步演化。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图2

动态结构化知识流:科研的逻辑网络

FlowSearch使用有向无环图把科研任务和知识关系可视化。每个节点都携带任务类型(检索、求解、回答)、描述和知识上下文,而节点间的边定义了信息流向。

这种设计让科研推理不再依赖线性顺序,而能同时展开多条探索路径,每一步都可追踪和验证。

换句话说,它不仅让 AI 能“想清楚每一步”,也让你能随时理解科研过程的脉络。

递归式知识流规划:逐层拆解科研问题

高质量的科研规划源于逐层细化的专家式思维。Planner模块采用递归扩展策略——从总问题出发,识别每一层需要细化的子任务,生成新的节点和依赖关系。

这一过程持续进行,直到形成完整的初始知识流。FlowSearch中的InternPlanner模型经过结构化科研任务数据微调,能够学习专家的拆解方式,让AI的规划既逻辑清晰,又稳健可靠。

知识采集与动态反思:让科研像“活”起来

Knowledge Collector执行任务、收集信息,并把结果整理成节点知识,为后续推理提供输入。

任务执行完成后,Knowledge Flow Refiner会启动反思机制:它能根据新信息调整节点和依赖关系,优化任务顺序,确保知识流持续进化。

这意味着FlowSearch不只是一个执行工具,它具备自组织、自纠错、自优化能力,可以在复杂科研任务中保持全局一致性,同时灵活应对局部变化。

以上设计让FlowSearch同时具备:

无论是复杂跨学科研究,还是大规模数据分析,FlowSearch都能让科研不再只是“等待AI输出”,而是真正的与AI共同探索。

实验结果与分析

1、综合性能突破

FlowSearch在三大权威基准GAIA、GPQA-diamond、HLE上,全面超越现有方法。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图3

在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图4

2、模块有效性验证

去除动态知识流建模或反思模块均导致显著性能下降,验证了结构化规划与动态调整机制在提升推理深度与系统稳定性方面的关键价值。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图5

3、Internplanner模型训练效果

经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图6

4、案例分析

通过FlowSearch与OWL的对比案例可以看出,FlowSearch通过显式依赖建模与中间结果整合,有效避免了证据丢失与逻辑链断裂,展现出更高的推理透明度与可解释性。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图7

同时,FlowSearch不仅能够高质量地完成科研问答任务,还能直接适配于科学调研与报告生成任务,产出完整、全面且逻辑清晰的科学调研成果。

将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图8
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图9
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图10
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图11
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图12
将科研脏活累活真·丢给AI!上海AI Lab推出深度科研智能体FlowSearch图13


左右滑动查看更多


应用前景与科研影响

团队表示,FlowSearch的提出标志着科研智能体从“任务执行”向“知识驱动推理”的关键转变。

更重要的是,FlowSearch的动态结构化框架为未来可解释科研智能体自演化科学发现系统奠定了通用基础——使智能体具备类研究者的思考、探索与自我反思能力,推动人工智能从工具向真正的科研伙伴演进。

论文链接:https://arxiv.org/abs/2510.08521
GitHub仓库:https://github.com/Alpha-Innovator/InternAgent

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI AR
more
【投融资】开源数据库Supabase估值冲50亿美元,ARR升至7000万,AI编程热潮助推
700万参数击败DeepSeek R1?不用思维链,不靠测试时推理,三星TRM如何在ARC-AGI等硬核推理任务上超越主流大模型
2026-2027CMF趋势预测 劳尔、PeclersParis、WGSN、POP趋势前瞻研究院这样分析
自研梦碎!CARIAD被打入“冷宫”,小鹏XNGP上车“激化”竞争
【Open Car】哇还有实体店
一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军
高通收购Arduino
比亚迪高管确认:已规划在国内推出SHARK皮卡!
两部全新通航规章,CCAR120、122部来了!民航局发布《通用航空运营许可程序管理规定(征求意见稿)》等两部规章征求意见稿
PPO,GRPO,DPO,ARPO算法及其 40+变种|HF Papers 论文盘点
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号