从AI4S到AI4E:国产首个千卡工科智算集群落地同济

半导体芯闻 2026-06-29 18:48
从AI4S到AI4E:国产首个千卡工科智算集群落地同济图1
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~

当国内算力建设普遍涌向通用大模型的规模竞赛时,一条更贴近实体产业的垂直算力赛道正在浮出水面。6月25日,同济大学与海光信息在上海同济大学签署战略合作协议,国内首个国产千卡级工科智算集群正式启用,同时挂牌成立“高校海光算力优化中心”。


这一项目不仅是校企产教融合的标杆事件,更标志着国产AI基础设施正式从科学智能(AI4S)向工程智能(AI4E)完成关键延伸,为高端工程科研与制造业数字化补上了专属算力底座的关键一块。


从AI4S到AI4E:算力的“最后一公里”


AI赋能产业的浪潮正在从消费端向生产端纵深渗透。


过去几年,AI for Science(AI4S)在国内高校已形成较为成熟的算力支撑体系。从极端天气预测到大脑神经分析,从外太空模拟到微观材料计算,大科学装置级别的算力集群正在驱动基础科学的范式变革。


但面向工程设计、工业研发、智能建造等场景的AI for Engineering(AI4E)方向,专属算力基础设施长期缺位。工科院系大多依托通用平台开展研究,AI技术难以深入工科教研一线。与此同时,工程智能对算力有着更为复合的要求——既要承载大模型训练推理,又要满足高精度工程仿真,还需兼容工程师日常使用的主流软件工具。


海光信息总裁沙超群在接受媒体采访时,将这一差异讲得很透彻:“大模型训练遵循Scaling Law,模型参数从百亿、千亿发展到万亿,对算力规模、集群扩展能力要求不断提升,具备高算力、高吞吐的密集型特征;而海量并发推理场景,侧重优化Token输出成本。但AI4E的应用方向,涵盖多类工业垂直场景,这类场景并不需要超大算力模型规模,但对模型的适配能力、通用迁移能力要求很高,需实现快速落地移植。”


在他看来,AI4E并非突然出现,这一趋势的深层逻辑要追溯到更久远的脉络:“今天大家讲AI4E,可以从十几二十年前国家提的两化融合说起——信息化和工业化融合,到如今的人工智能时代,‘人工智能+’战略赋能实体,信息化、智能化对实体经济的赋能,最终必然落到工程计算与制造业升级的核心场景中。”


海光与同济联手打造的全国首个AI4E千卡工科智算集群,正是对这一行业空白的直接回应。


“懂工程”的算力:精度、迁移与实时性


据介绍,该千卡集群以全国产的海光DCU为核心算力底座,采用超智融合架构,可同步承载高端计算与AI训练推理任务。在工程应用层面,集群对结构仿真、流体力学等核心工科场景进行了深度适配,并通过海光自研软件栈兼容主流工程软件生态,使已有工程代码能够低成本迁移至国产算力平台。


沙超群在采访中进一步阐释了工程算力与通用算力的本质区别:“工程计算场景对精度要求很高,大模型训练以FP16等低精度计算为主,推理场景对精度要求更低;但工程仿真与科学计算对数值准确性要求苛刻,结构力学、流体模拟等场景必须依赖FP64等高精度计算能力,“工程计算不能算错”是不可突破的底线。


另一方面,AI4E与通用大模型算力在场景复杂度与迁移门槛方面也面临显著差异。据介绍,通用大模型场景相对统一,以Transformer架构为主,但工程计算场景高度分化,可分为计算密集型、数据密集型、通讯密集型等不同类型,同时行业内积累了数十年的历史代码与海量商用工程软件。AI4E平台的核心挑战,是让这些存量资产实现低成本、快速迁移,对平台的兼容性、易用性提出了远高于通用算力的要求。


生态突围:双芯融合+光合组织的纵深布局


国产算力规模化普及,绕不开一个现实难题:应用生态的适配成本。


海光信息副总裁吴宗友在采访中坦言:“过去使用海外算力平台时,高校师生只能被动适配芯片逻辑,需求难以得到及时反馈;而海光可向高校开放底层逻辑,根据师生的科研建议迭代优化产品,甚至针对特定应用场景做定制化升级。目前,该集群已对结构仿真、流体力学等同济核心工科场景完成深度适配,通过海光自研软件栈兼容主流工程软件生态,已有工程代码可实现低成本迁移。”


简言之,国产算力可以做到深度响应用户需求。


光合组织副秘书长王圣勇则指出了海光独特的技术基因:“海光CPU完美兼容X86架构,DCU也是可无缝迁移CUDA生态,很多国产工业软件上来就能跑起来,这是海光先天优势。”


目前,光合组织已积累6000多家企业伙伴,互认证证书达到近5000个。今年年底计划突破近一万家,未来两三年内将进一步聚集上下游伙伴,构建更完整的国产先进计算开放生态。


吴宗友进一步强调了教育生态的战略意义:“这帮学生走向社会就会走向各行各业,我们希望未来这些学生走向社会对海光的产品、生态、软件非常了解,第一时间可能也会选择跟海光相关的上下游企业去就业,这样整个国产化生态就起来了。”


在技术架构层面,海光拥有CPU和DCU的“双芯”布局,以及配套 Scale-up 场景的 HySwitch 高速交换芯片。沙超群指出,AI应用正在进入深水区:“无论是对于智能体的编排,还是记忆上下文的调度,CPU要承担更多的工作。未来从系统层面也不再是单一的纯GPU芯片。”


吴宗友补充道:“过去异构算力平台中,用户需要分别针对CPU和算力芯片做调优,不同架构的协同往往带来效率损失;而海光CPU与DCU基于统一架构打造,用户无需再关心算力来自CPU还是DCU,系统层面即可实现一体化协同,大幅节省科研人员的调优精力。”海光同时将DCU软件栈开源,并将CPU的HSL总线开放出来形成工作组,邀请业内芯片合作伙伴共同繁荣生态。


从同济出发:可复制的“工程智能样板”


目前,千卡集群已接入同济校级算力服务体系并投入使用。由于集群方案对主流工程软件的高度兼容,同类代码可实现低成本迁移,这意味着该方案具备向更多工科院校复制推广的条件。


王圣勇在签约仪式上表示,全国首个国产千卡工科智算集群在同济大学启用,标志着国产计算系统完成了从技术生态向应用生态、从“可用”到“好用”的跨越。这座集群直接锚定工程学科的实际应用场景,推动工程智能直接解决现实问题,并通过软硬件全栈协同优化,实现了好用易用的体验升级。


根据协议,双方将在联合科研创新、人才培养与交流、产业孵化与成果转化等方面深化务实合作,打造全国高校首个海光DCU千卡集群,建立算力优化中心,重点支撑AI4E、AI4S等关键场景的算力需求,设立校企合作联合课题,共同促进成果转化,并联合开展人工智能领域的人才培养和智慧教学模式的创新探索。


众所周知,同济大学在土木、建筑、交通、环境等工程学科保持着长期领先地位,是国内最早系统推进AI与工程教育融合的高校之一。同济大学智算中心于2025年4月正式启用,同年底启动国产海光千卡集群建设,面向大模型推理服务、智慧教学场景分析及AIGC社区建设开展先行探索。此次选型过程中,同济团队基于多年工程仿真实践,从算力性能、场景适配、生态兼容与数据安全四个维度进行系统比对,最终决定依托DCU打造智算集群。


同济大学党委书记、中国工程院院士郑庆华在致辞中表示,算力是人工智能的底层支撑平台,同济正以工程智能为突破口,系统推进AI赋能学科建设、人才培养与科学研究。依托集群算力支撑,学校将推动科研范式向科学智能与工程智能融合驱动模式转变,创新育人机制,探索“师机生协同”的教学模式,为国家培养更多兼具工程素养与AI能力的复合型人才。


海光信息和同济大学携手打造的全国首个千卡工科智算集群落成,既是高校在“人工智能+教育”深水区的一次标志性实践,也是国产算力从AI4S到AI4E纵深落地的一次开创性攻关。“海光将尽最大的努力,为同济师生团队提供‘懂教育’‘懂工程’的算力,共同探索工程智能创新和教育数智化新路径。”沙超群强调。


结语


当行业普遍追逐通用大模型的规模竞赛时,海光选择深耕AI4E垂直赛道,本质上是国产算力走向应用深水区的必然选择——从追规模到重价值,从通用底座到场景深耕,算力的价值最终要落到实体产业的效率提升上。


从“两化融合”到“人工智能+制造”,从AI4S到AI4E,国产算力正在叩开工程之门。这座落地同济大学的千卡集群,或许正是那把钥匙。


点这里👆加关注,锁定更多原创内容


*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。


推荐阅读

从AI4S到AI4E:国产首个千卡工科智算集群落地同济图2

喜欢我们的内容就点“在看分享给小伙伴哦~从AI4S到AI4E:国产首个千卡工科智算集群落地同济图3

从AI4S到AI4E:国产首个千卡工科智算集群落地同济图4

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
扔掉PPT模板!我用AI工具3分钟搞定,打工人救星来了
24项举措 四川为AI产业链“添柴加火”
对话Clipto.AI创始人康洪文:没有记忆的AI,只是一个“失忆”的聪明人
AI宠物,真的很火
AI短剧都用同一张脸,看得人生理性厌恶
百亿真实数据,首个面向AI Infra的运维智能体评测基准正式开源
5G独立专网政策破冰,为工业场景物理AI打造专属"神经系统"
万亿市场格局未定:「端侧原生」,一家中国AI公司给物理AI抛了个新解法
800V架构,AIRMATIC空气悬架,39.1英寸无缝MBUX超联屏,续航703km!
啥?做AI短剧可以免费,免费,免费了!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号