欧洲之光！5nm，3200 TFLOPS AI推理芯片即将量产

今年10月，欧洲芯片公司VSORA（总部位于法国巴黎）宣布开始生产其AI推理芯片Jotunn8，这也令VSORA成为欧洲唯一一家推出高性能AI推理芯片的公司。公司表示，Jotunn8预计将在2026年一季度实现全面量产。

近日，台积电参股的GUC（Global Unichip Corp.）宣布与VSORA建立合作关系，共同提供一站式ASIC设计服务，以确保Jotunn8数据中心AI推理处理器的按时上市。通过此次合作，GUC展示了其在复杂芯片组架构设计以及利用2.5D先进封装技术实现HBM3E集成方面的强大能力，进一步体现了该公司在帮助客户提升产品性能与效率、加速技术创新方面的优势。

GUC为Jotunn8项目提供了全面的设计服务，涵盖了从网表生成到产品制造的整个流程。该解决方案整合了GUC的先进封装技术IP库，其中包括支持17.2 Gbps数据传输速率的GLink-2.5D芯片间互连技术，以及具备8.4 Gbps传输能力的HBM3E物理层芯片及控制器。

这些技术采用了3倍光刻尺度的2.5D先进封装工艺及5纳米制程技术。GUC的贡献还包括复杂的芯片结构设计、芯片模块的划分与集成，以及信号传输、功耗控制与热管理方面的协同优化。该团队还实现了显著的红外辐射与功耗优化，从而显著提升了产品的能效与整体系统性能。

VSORA官网显示，Jotunn8定位为“世界上最高效的 AI 推理芯片”，核心目标是实现 “大规模 AI 部署的极速、低成本、无妥协可扩展性”，同时兼顾可持续性基础设施建设，平衡高吞吐量、低延迟、优化功耗三大核心需求。

性能上，Jotunn8基于台积电5nm制程，配备最高288 GB HBM3E，FP8精度稠密算力高达3200 TFLOPS，在 Llama3 405B模型上，输出速度显著超越市场同类产品，具体表现为实时任务响应效率提升；采用 VSORA 专属架构，支持多算法平滑整合，实现 “接近理论性能”。

Jotunn8采用多算法整合架构，突破单一模型适配限制，实现推理模型、生成式 AI、智能体 AI 的平滑集成，无需额外硬件改造，降低复杂 AI 系统的部署门槛。通过架构优化实现“速度与成本的双向提升”，核心逻辑是“降低单位推理成本的同时提升吞吐量”，而非单纯追求算力堆砌。

另外，Jotunn8硬件设计兼顾能源效率与碳足迹控制，符合数据中心“绿色 AI”部署趋势，官网明确将可持续基础设施作为核心设计目标。

应用场景上，官方着重介绍了三类场景：实时交互类，比如聊天机器人（对话生成）、欺诈检测（实时风险识别）、搜索引擎（精准结果返回）；高并发服务类，包括推荐引擎（电商 / 内容平台个性化推荐）、LLM API 服务（第三方开发者调用的生成式 AI 接口）；复杂协同类，比如多模型融合系统等。

总体来看Jotunn8 的核心竞争力是面向真正的商业落地场景，3200 TFLOPS 的 FP8 算力为性能基石，超低延迟与超高吞吐量满足实时/高并发场景需求，多模型整合架构提升硬件复用率，而成本与功耗的优化则解决了大规模部署的核心痛点。与此同时，作为欧洲本土为数不多的AI芯片产品，这也是欧洲算力本土化的重要一环。

欧洲之光！5nm，3200 TFLOPS AI推理芯片即将量产图1