
从2023年Google DeepMind的GNoME系统发现220万种新晶体材料——相当于近800年的传统研究积累,到2024年Hinton和Hopfield因神经网络基础理论获得诺贝尔物理学奖,同年AlphaFold实现生物大分子结构预测及蛋白质设计研究斩获诺贝尔化学奖,“AI for Science”时代已正式到来。然而,这场科学革命的前景越是光明,其背后的分歧与挑战就越是引人深思。当前,各学科构建的领域专用AI系统虽已崭露头角,却普遍困于数据孤岛、幻觉频发与生态封闭的泥潭,大多仍停留在“科研助手”的初级阶段。一个根本性的问题被抛到了台前:我们是该继续深耕垂直领域的“专才模型”,还是应全力构建一个能贯通学科壁垒的“通用科学基座大模型”?
2025年7月27日,世界人工智能大会(WAIC 2025)举办以“通用智能与领域专家的融合之道”为主题的高端思辨会。本次思辨会邀请中国科学院科技基础能力局副局长、自动化研究所副所长曾大军,华为公有云业务部副总裁鲍亮和中国科学院上海微系统所副所长俞文杰等顶尖学者与产业领袖齐聚一堂,围绕“科学基座大模型的必要性”、“AI for Science的‘第四条Scaling Law’”以及“技术架构的根本性突破”三大核心议题,展开了多轮深度讨论与观点碰撞。这场思辨不仅探讨了技术路径的选择,更触及了未来科研范式变革的根基——AI究竟是科学的工具,还是即将成为科学的“新主体”?
议题背景:随着通用大模型参数规模的不断增加,其科学通识和求解科学问题的能力也在不断增强。从大模型在复杂数学推理和物理概念理解上的逐步改善,到多模态模型处理科学文献和实验数据的能力提升,通用模型是否已足够强大?是否还有专门去构建科学基座模型的必要?
产业界视角
华为公有云业务部副总裁鲍亮首先阐述了科学基座大模型的必要性:“通用模型的数据更新速度跟不上科学数据的先进性;在科学计算和仿真精度上无法满足科研要求,特别是在医疗、能源、气象等高风险、高精度需求的科研领域,因此,科学基座大模型非常必要。华为希望通过生态共建,联合科研院所、企业与高校,建立数据共享与算法开源机制,共同构建能够加速科学创新发展的基础设施。”
中信集团科技部技术与产业促进处处长宋微波从材料科学的AI for Science实践出发,提出了更为深层的思考:“科学基座大模型擅长从数据知识中发现规律,但科学本质要求严格的逻辑性、实证性和可靠性。目前大模型基于scaling law,主要依靠因果关系和统计学关系显现逻辑性,但还未真正掌握科学逻辑的规律。以金属材料研究为例,我们需要准确理解从微观到宏观的层次结构,深刻把握金属的相变结构关系及热稳定性等科学要素。在这方面,目前的大模型还不具备足够好的理解能力。”
宋微波进一步分析了专用模型的优势与局限:“目前主流的专用模型的数据要求和算力要求较少,能够有效解决特定场景的专有型任务。但多数专用模型无法真正理解科学,无法从第一性原理进行新材料发现,更多停留在工艺优化和性能预测环节。”
基于这些观察,他提出了对科学基座模型的三点期待:“第一,希望它能从第一性原理出发,为科学家的日常工作赋能,推动新理论发现和新技术创造;第二,希望它能打通不同数据,实现跨学科融合;第三,希望它能成为生态平台的载体,一方面提供科学计算力,另一方面促进产业界参与,真正实现从科技创新到产业转化的闭环。”
科研一线的共性需求
中国科学院上海硅酸盐研究所刘建军研究员同样认可了科学基础大模型的必要性,他进一步阐述道:“在研究过程中,各个学科都存在共性问题——都需要进行干湿实验,都需要提出科学问题,都需要解析和建模。这些共性流程为我们提供了思路:能否在科学大基座之上建立统一平台,为进一步深入材料、化学、生物等领域提供更好的支撑?以薛定谔方程为例,无论在量子化学还是材料科学中,我们都需要求解这一基础方程。这种跨领域的共性为科学基础大模型提供了理论依据。”
中国科学院上海微系统与信息技术研究所副所长俞文杰从技术特征角度分析:“建立科学基础大模型非常有必要。科学数据具有多模态、高维度、强结构化的特点,科学研究过程要求精确性并遵循定律,还需要具备深度的工具使用能力来完成理论、实验、计算模拟的闭环流程。目前的通用大模型无法满足这些要求,需要专门的科学基座模型。当然,也不排除通用大模型通过不断进化而具备这些能力的可能性。”
议题背景:除了当前存在的关于高质量数据、算力、参数规模的scaling law,在“AI+科学”领域是否存在第四个scaling law——即关于覆盖的学科和领域数目的scaling law?换言之,随着科学基座模型覆盖学科数量的增加,其整体性能是否会呈现类似的规律性提升?跨学科的知识整合能否带来超越单一领域的能力涌现?
俞文杰副所长从认知科学角度提出了乐观的观点:“人类文明积累的知识本身就是贯通的,各个学科的知识都是相互关联的。人工智能与生物智能有许多相似之处。设想一下,一个人是否有可能把所有知识都贯通?我认为完全有可能。只要有足够的学习能力,物理、化学、生物以及各个细分学科的知识都摆在那里,通过学习完全可以掌握并融会贯通。但人类有局限性——每天只有24小时,需要睡觉休息,还有惰性等各种因素限制持续学习。人工智能没有这些限制,只要给予足够的算力支持,它能比自然人进行更加充分的学习。”
高能物理所研究员李科结合粒子物理实验的实际经验,支持了跨学科融合的可行性:“我认为AI for Science是一个大趋势。不同学科间最大的障碍是学科知识与应用领域之间的特性差异,而AI和大模型可以作为桥梁,将各个领域连接起来。我们在实验中就有实际案例:将不同探测器的数据结合后,实验结果有显著提升。目前我们正在做的工作,就是希望将领域内的不同实验结合起来。更进一步,我们希望能将不同领域结合起来,这在理论上是可行的。”
上海交通大学安泰经济与管理学院副教授魏煊提出了更为详细的发展路径分析:“这个问题应该分两个层面理解:第一是科学基础模型能否拓展科学边界;第二是科研范式会发生什么变化。关于打破科学边界,我认为这是一个循序渐进的过程,需要分短期和长期来看。短期来看,可以参考AlphaFold的发展历程,先在某个领域深入做好,然后拓展到相关的广度领域——一个由点到面的过程。科学基础大模型也会遵循类似路线:先在多个学科内打破小领域边界,比如气候、流体、遥感等的小领域,化学和生物的细分领域。先实现跨小领域的学科融合,再实现各学科的相互合并。因此,我认为发展路径是:先打破领域边界,再打破学科边界。”
魏煊教授进一步阐述了科研范式的变化:“科研范式将从‘Science+AI’向‘AI+Science’转变。以电力革命来类比:在第一次工业革命时,所有布局都围绕蒸汽机展开;到电力革命时代,我们没有把发电机放在中间,而是重新设计了整个流程,因为电力更高效。科学基础大模型就像新的‘电力’。‘Science+AI’是用AI工具替代原有流程中的某些环节,比如更好的文献搜索,这是相对初级的应用。而‘AI+Science’则是围绕AI工具重新布局整个科研流程:我们需要的能力不再是撰写文稿,而是评判AI产出的能力和更好的科学洞察力。因此对人员架构和能力的需求都会不同,这是一个根本性的范式转变。”

议题背景:面对科学问题的复杂性和多样性,科学基础大模型是否需要突破现有Transformer等架构的局限性?新架构需要具备哪些当前大模型所缺乏的核心能力——是更强的结构感知与物理一致性、符号推理与数学建模等能力,还是能够在原子、分子、细胞、组织、系统等多个尺度之间进行知识迁移与建模?有哪些可行的技术路径能够支撑这一愿景的实现?
复旦大学张军平教授提出了“快慢思维结合”的创新架构理念:“现有架构存在的核心问题是缺乏快慢思维的结合能力。让我用一个生活例子来说明:大家平时走路时,没有人会特意观察地面情况——这是快思维;走路的同时可以喝水、刷视频、看新闻。但如果遇到下雨天滑倒,就会立即进入慢思维过程,所有感官都会调动起来。
目前的机器学习模型大部分采用慢思维做法,不具备快思维能力。快思维的价值在于直觉性的跳跃。这就像学霸考试:在刷题达到一定程度后,考试时看到一些题目就知道答案,根本不需要详细推理过程。
未来如果要在现有基础上改进架构,可能需要增加类似科学发现的‘跳跃连接’机制。这种跳跃连接能够将模型转化为直觉,而直觉正是科学发现最需要的能力。现在的大模型还不具备这种能力,这应该是未来努力的重要方向。”
宋微波处长从产业应用角度强调了架构创新的重要性:“这是一个非常技术性的问题。虽然我更多从产业角度考虑,但我想强调:如果能够在架构上做创新,其产生的价值一定比单纯的数据堆叠要大得多。DeepMind过去的一系列工作一直在进行架构层面的创新。目前来看,大模型能力边界的拓展主要通过两个途径:一是强化学习,通过生成思维链的方式让模型具备一定推理能力;二是多智能体系统,帮助进行目标设定、路径规划、工具调度等。但从目前情况看,这些方法只能拓展边界,还不能实现全面的颠覆性创新。这确实是科学家和专家们下一步攻克的难点。”
宋微波还分享了中信集团的多模型协同集群的实践探索:“在特种钢材领域的实践中,我们提出了‘多模型全智能大模型集群’的应用架构,构建了支持多个子模型开发和协同分布式运行的大模型体系。
以材料研发为例:首先基于密度泛函理论建立计算模型,实现材料性能预测;在性能预测基础上,通过决策分析模型进行反向设计,确定成分构成方案;最后涉及工艺层面,通过模拟仿真实验模型自动实现过程仿真。通过这种机理约束数据、数据反哺机理的方式,实现材料领域的创新。”宋微波特别强调了生态建设的重要性:“这不光是技术问题,也是组织实施和应用生态问题。产业界的参与非常重要,一方面,这是检验模型效果、转化能力的标准,能够反向迭代优化模型;另一方面,观察美国头部企业在AI for Science中的高参与度,我们发现还需要考虑商业模式问题:例如,在给科学家或产业界使用时,是否收费以及如何收费?如果大幅开源免费,背后需要大量资金支持。这些资金不能仅依靠政府和科研院所投入,需要引入风险投资和企业资金,形成技术端到应用端的完整生态闭环——包括资金闭环、数据闭环等。因此,未来需要在技术架构和商业架构上做更多工作,才能有真正突破性的发展。”
通过三个问题的深入讨论,与会专家达成了重要共识:
必要性共识:全体嘉宾一致认可构建科学基础大模型的战略意义,认为这是实现AI for Science的关键基础设施。
发展路径:科学基础大模型将采取渐进式发展路径,先实现小领域融合,再逐步扩展到跨学科整合,最终实现科研范式的根本性转变。
技术突破:未来需要在架构层面实现创新,例如快慢思维结合、跨领域知识传递等机制,这比单纯的数据堆叠更有价值。
生态建设:技术创新必须与产业应用、商业模式创新相结合,形成完整的生态闭环,才能真正推动AI for Science的突破性发展。
科学基础大模型的构建不仅是技术挑战,更是一个需要跨界协作、生态共建的系统工程。随着技术的不断进步和产业的深度参与,我们有理由相信,AI将从科研助手真正转变为科研伙伴,开启科学发现的新纪元。




