从AI4S到AI4E：国产首个千卡工科智算集群落地同济

👆如果您希望可以时常见面，欢迎标星🌟收藏哦~

当国内算力建设普遍涌向通用大模型的规模竞赛时，一条更贴近实体产业的垂直算力赛道正在浮出水面。6月25日，同济大学与海光信息在上海同济大学签署战略合作协议，国内首个国产千卡级工科智算集群正式启用，同时挂牌成立“高校海光算力优化中心”。

这一项目不仅是校企产教融合的标杆事件，更标志着国产AI基础设施正式从科学智能（AI4S）向工程智能（AI4E）完成关键延伸，为高端工程科研与制造业数字化补上了专属算力底座的关键一块。

从AI4S到AI4E：算力的“最后一公里”

AI赋能产业的浪潮正在从消费端向生产端纵深渗透。

过去几年，AI for Science（AI4S）在国内高校已形成较为成熟的算力支撑体系。从极端天气预测到大脑神经分析，从外太空模拟到微观材料计算，大科学装置级别的算力集群正在驱动基础科学的范式变革。

但面向工程设计、工业研发、智能建造等场景的AI for Engineering（AI4E）方向，专属算力基础设施长期缺位。工科院系大多依托通用平台开展研究，AI技术难以深入工科教研一线。与此同时，工程智能对算力有着更为复合的要求——既要承载大模型训练推理，又要满足高精度工程仿真，还需兼容工程师日常使用的主流软件工具。

海光信息总裁沙超群在接受媒体采访时，将这一差异讲得很透彻：“大模型训练遵循Scaling Law，模型参数从百亿、千亿发展到万亿，对算力规模、集群扩展能力要求不断提升，具备高算力、高吞吐的密集型特征；而海量并发推理场景，侧重优化Token输出成本。但AI4E的应用方向，涵盖多类工业垂直场景，这类场景并不需要超大算力模型规模，但对模型的适配能力、通用迁移能力要求很高，需实现快速落地移植。”

在他看来，AI4E并非突然出现，这一趋势的深层逻辑要追溯到更久远的脉络：“今天大家讲AI4E，可以从十几二十年前国家提的两化融合说起——信息化和工业化融合，到如今的人工智能时代，‘人工智能+’战略赋能实体，信息化、智能化对实体经济的赋能，最终必然落到工程计算与制造业升级的核心场景中。”

海光与同济联手打造的全国首个AI4E千卡工科智算集群，正是对这一行业空白的直接回应。

“懂工程”的算力：精度、迁移与实时性

据介绍，该千卡集群以全国产的海光DCU为核心算力底座，采用超智融合架构，可同步承载高端计算与AI训练推理任务。在工程应用层面，集群对结构仿真、流体力学等核心工科场景进行了深度适配，并通过海光自研软件栈兼容主流工程软件生态，使已有工程代码能够低成本迁移至国产算力平台。

沙超群在采访中进一步阐释了工程算力与通用算力的本质区别：“工程计算场景对精度要求很高，大模型训练以FP16等低精度计算为主，推理场景对精度要求更低；但工程仿真与科学计算对数值准确性要求苛刻，结构力学、流体模拟等场景必须依赖FP64等高精度计算能力，“工程计算不能算错”是不可突破的底线。

另一方面，AI4E与通用大模型算力在场景复杂度与迁移门槛方面也面临显著差异。据介绍，通用大模型场景相对统一，以Transformer架构为主，但工程计算场景高度分化，可分为计算密集型、数据密集型、通讯密集型等不同类型，同时行业内积累了数十年的历史代码与海量商用工程软件。AI4E平台的核心挑战，是让这些存量资产实现低成本、快速迁移，对平台的兼容性、易用性提出了远高于通用算力的要求。

生态突围：双芯融合+光合组织的纵深布局

国产算力规模化普及，绕不开一个现实难题：应用生态的适配成本。

海光信息副总裁吴宗友在采访中坦言：“过去使用海外算力平台时，高校师生只能被动适配芯片逻辑，需求难以得到及时反馈；而海光可向高校开放底层逻辑，根据师生的科研建议迭代优化产品，甚至针对特定应用场景做定制化升级。目前，该集群已对结构仿真、流体力学等同济核心工科场景完成深度适配，通过海光自研软件栈兼容主流工程软件生态，已有工程代码可实现低成本迁移。”

简言之，国产算力可以做到深度响应用户需求。

光合组织副秘书长王圣勇则指出了海光独特的技术基因：“海光CPU完美兼容X86架构，DCU也是可无缝迁移CUDA生态，很多国产工业软件上来就能跑起来，这是海光先天优势。”

目前，光合组织已积累6000多家企业伙伴，互认证证书达到近5000个。今年年底计划突破近一万家，未来两三年内将进一步聚集上下游伙伴，构建更完整的国产先进计算开放生态。

吴宗友进一步强调了教育生态的战略意义：“这帮学生走向社会就会走向各行各业，我们希望未来这些学生走向社会对海光的产品、生态、软件非常了解，第一时间可能也会选择跟海光相关的上下游企业去就业，这样整个国产化生态就起来了。”

在技术架构层面，海光拥有CPU和DCU的“双芯”布局，以及配套 Scale-up 场景的 HySwitch 高速交换芯片。沙超群指出，AI应用正在进入深水区：“无论是对于智能体的编排，还是记忆上下文的调度，CPU要承担更多的工作。未来从系统层面也不再是单一的纯GPU芯片。”

吴宗友补充道：“过去异构算力平台中，用户需要分别针对CPU和算力芯片做调优，不同架构的协同往往带来效率损失；而海光CPU与DCU基于统一架构打造，用户无需再关心算力来自CPU还是DCU，系统层面即可实现一体化协同，大幅节省科研人员的调优精力。”海光同时将DCU软件栈开源，并将CPU的HSL总线开放出来形成工作组，邀请业内芯片合作伙伴共同繁荣生态。

从同济出发：可复制的“工程智能样板”

目前，千卡集群已接入同济校级算力服务体系并投入使用。由于集群方案对主流工程软件的高度兼容，同类代码可实现低成本迁移，这意味着该方案具备向更多工科院校复制推广的条件。

王圣勇在签约仪式上表示，全国首个国产千卡工科智算集群在同济大学启用，标志着国产计算系统完成了从技术生态向应用生态、从“可用”到“好用”的跨越。这座集群直接锚定工程学科的实际应用场景，推动工程智能直接解决现实问题，并通过软硬件全栈协同优化，实现了好用易用的体验升级。

根据协议，双方将在联合科研创新、人才培养与交流、产业孵化与成果转化等方面深化务实合作，打造全国高校首个海光DCU千卡集群，建立算力优化中心，重点支撑AI4E、AI4S等关键场景的算力需求，设立校企合作联合课题，共同促进成果转化，并联合开展人工智能领域的人才培养和智慧教学模式的创新探索。

众所周知，同济大学在土木、建筑、交通、环境等工程学科保持着长期领先地位，是国内最早系统推进AI与工程教育融合的高校之一。同济大学智算中心于2025年4月正式启用，同年底启动国产海光千卡集群建设，面向大模型推理服务、智慧教学场景分析及AIGC社区建设开展先行探索。此次选型过程中，同济团队基于多年工程仿真实践，从算力性能、场景适配、生态兼容与数据安全四个维度进行系统比对，最终决定依托DCU打造智算集群。

同济大学党委书记、中国工程院院士郑庆华在致辞中表示，算力是人工智能的底层支撑平台，同济正以工程智能为突破口，系统推进AI赋能学科建设、人才培养与科学研究。依托集群算力支撑，学校将推动科研范式向科学智能与工程智能融合驱动模式转变，创新育人机制，探索“师机生协同”的教学模式，为国家培养更多兼具工程素养与AI能力的复合型人才。

海光信息和同济大学携手打造的全国首个千卡工科智算集群落成，既是高校在“人工智能+教育”深水区的一次标志性实践，也是国产算力从AI4S到AI4E纵深落地的一次开创性攻关。“海光将尽最大的努力，为同济师生团队提供‘懂教育’‘懂工程’的算力，共同探索工程智能创新和教育数智化新路径。”沙超群强调。

结语

当行业普遍追逐通用大模型的规模竞赛时，海光选择深耕AI4E垂直赛道，本质上是国产算力走向应用深水区的必然选择——从追规模到重价值，从通用底座到场景深耕，算力的价值最终要落到实体产业的效率提升上。

从“两化融合”到“人工智能+制造”，从AI4S到AI4E，国产算力正在叩开工程之门。这座落地同济大学的千卡集群，或许正是那把钥匙。

点这里👆加关注，锁定更多原创内容

*免责声明：文章内容系作者个人观点，半导体芯闻转载仅为了传达一种不同的观点，不代表半导体芯闻对该观点赞同或支持，如果有任何异议，欢迎联系我们。

推荐阅读