直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了

ScienceAI 2025-10-08 12:25

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图1


直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图2

作者 | 论文团队

编辑 | ScienceAI

面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。

来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图3

它有三点最值得关注:

更重要的是,这不是「做题型」模型的又一次包装:它以 206B 级多学科科学数据为基础,覆盖科学文本、纯科学序列(DNA/RNA/ 蛋白 / SMILES)、科学序列 — 文本 / 科学序列 — 科学序列成对数据,并在此之上统一建模、统一标注、统一度量,让「读 — 思 — 设」闭环可以被数据真实地驱动与校核。

科学数据「读 — 思 — 设」专精的基座模型

这是一套统一的科学推理基座:在 206B 级跨学科科学语料与数据上预训练,随后经「三段式」对齐 —— 大规模指令微调(≈4000 万样本)、退火式冷启动(诱导长链思维)、以及引入任务分组与连续化科学奖励的强化学习(DAPO)—— 把自然语言与异构科学表示(DNA/RNA/ 蛋白、分子 SMILES、材料结构与文本等)深度对齐,覆盖从文本↔科学格式互译、知识 / 要素抽取、性质预测 / 分类到序列生成与可约束设计在内的完整工作流,单模型覆盖 5 大能力,共 103 个子任务。

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图4

与「做题型模型」的区别:

三大方法学亮点

1)自适应科学推理(Adaptive Scientific Reasoning)

模型区分「即时型(instant)」与「思考型(thinking)」两类任务:前者保留直接答案监督,后者用思维链数据全量替换,确保在真正需要多步推理时给出连贯可查的理由,而简单任务保持高效直答。进一步的实证结论:在任务级别进行「思维链替换」优于在同一任务内混配 CoT 与非 CoT 目标,避免风格 / 长度不一致带来的校准偏移。

2)任务分组奖励(Task Grouped Rewarding)

将科学任务划分为距离度量型(数值预测)、匹配度量型(检索 / 抽取)与专业工具校验型三类,分别设计可比的质量度量与优势估计,提升跨任务的泛化与鲁棒性。

3)科学奖励「软化」(Scientific Reward Softening)

把原本难以优化的 0/1 正确性信号,统一映射为 [0,1] 的连续奖励(如把 BERTScore、RMSE 等标准量规规范化),显著改善复杂科学推理任务的收敛性与性能提升。

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图5

覆盖「全栈」科学智能

直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了图6

能落地到哪些场景

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
ASO
more
清华最新综述!迈向Deep Reasoning的Agentic RAG,200篇工作尽览~
Jason Wei也被小扎带走:思维链开创者、o1系列奠基人!这次真挖到OpenAI大动脉了
RAG-Reasoning系统综述
微软提出Reward Reasoning Model
思维链(CoT)作者,OpenAI 研究员Jason Wei的深夜自述:我是如何停止模仿,开始真正成长的
HF每日论文: InternVL3.5、Visual-CoG、MV-RAG、T2I-ReasonBench
突发|思维链开山作者Jason Wei被曝加入Meta,机器之心独家证实:Slack没了
上海AI Lab最新开源!SciReasoner:跨学科科学数据推理的统一基座模型
快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!
直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号