今年10月,欧洲芯片公司VSORA(总部位于法国巴黎)宣布开始生产其AI推理芯片Jotunn8,这也令VSORA成为欧洲唯一一家推出高性能AI推理芯片的公司。公司表示,Jotunn8预计将在2026年一季度实现全面量产。 近日,台积电参股的GUC(Global Unichip Corp.)宣布与VSORA建立合作关系,共同提供一站式ASIC设计服务,以确保Jotunn8数据中心AI推理处理器的按时上市。通过此次合作,GUC展示了其在复杂芯片组架构设计以及利用2.5D先进封装技术实现HBM3E集成方面的强大能力,进一步体现了该公司在帮助客户提升产品性能与效率、加速技术创新方面的优势。 GUC为Jotunn8项目提供了全面的设计服务,涵盖了从网表生成到产品制造的整个流程。该解决方案整合了GUC的先进封装技术IP库,其中包括支持17.2 Gbps数据传输速率的GLink-2.5D芯片间互连技术,以及具备8.4 Gbps传输能力的HBM3E物理层芯片及控制器。 这些技术采用了3倍光刻尺度的2.5D先进封装工艺及5纳米制程技术。GUC的贡献还包括复杂的芯片结构设计、芯片模块的划分与集成,以及信号传输、功耗控制与热管理方面的协同优化。该团队还实现了显著的红外辐射与功耗优化,从而显著提升了产品的能效与整体系统性能。 VSORA官网显示,Jotunn8定位为“世界上最高效的 AI 推理芯片”,核心目标是实现 “大规模 AI 部署的极速、低成本、无妥协可扩展性”,同时兼顾可持续性基础设施建设,平衡高吞吐量、低延迟、优化功耗三大核心需求。 性能上,Jotunn8基于台积电5nm制程,配备最高288 GB HBM3E,FP8精度稠密算力高达3200 TFLOPS,在 Llama3 405B模型上,输出速度显著超越市场同类产品,具体表现为实时任务响应效率提升;采用 VSORA 专属架构,支持多算法平滑整合,实现 “接近理论性能”。 Jotunn8采用多算法整合架构,突破单一模型适配限制,实现推理模型、生成式 AI、智能体 AI 的平滑集成,无需额外硬件改造,降低复杂 AI 系统的部署门槛。通过架构优化实现“速度与成本的双向提升”,核心逻辑是“降低单位推理成本的同时提升吞吐量”,而非单纯追求算力堆砌。 另外,Jotunn8硬件设计兼顾能源效率与碳足迹控制,符合数据中心“绿色 AI”部署趋势,官网明确将可持续基础设施作为核心设计目标。 应用场景上,官方着重介绍了三类场景:实时交互类,比如聊天机器人(对话生成)、欺诈检测(实时风险识别)、搜索引擎(精准结果返回);高并发服务类,包括推荐引擎(电商 / 内容平台个性化推荐)、LLM API 服务(第三方开发者调用的生成式 AI 接口);复杂协同类,比如多模型融合系统等。 总体来看Jotunn8 的核心竞争力是面向真正的商业落地场景,3200 TFLOPS 的 FP8 算力为性能基石,超低延迟与超高吞吐量满足实时/高并发场景需求,多模型整合架构提升硬件复用率,而成本与功耗的优化则解决了大规模部署的核心痛点。与此同时,作为欧洲本土为数不多的AI芯片产品,这也是欧洲算力本土化的重要一环。