公众号记得加星标⭐️,第一时间看推送不会错过。

由首席执行官Jim Keller领导的人工智能计算公司Tenstorrent今日在TT-Deploy JP大会上,在语言和视频处理方面创下新的性能记录,发布了用于智能体人工智能的TT-Ascalon S RISC-V CPU IP,并详细介绍了其迄今为止规模最大的部署项目——在日本构建的通用异构人工智能系统。所有这些成果都基于同一基础:单一架构,其运行大型人工智能工作负载的速度比GPU更快,并且可以通过标准以太网从可授权的核心扩展到Tenstorrent Galaxy™超级集群。
这使得 Tenstorrent 的网络化 AI 架构成为一种不同的解决方案——开放、通用、灵活,适用于异构或独立部署,并由 AI 专家提供支持——能够承受 AI 行业的不断变化。
Tenstorrent 在以往性能的基础上继续提升,分享了最新的 LLM 和视频唇音同步及音频基准测试结果。在企业目前正在部署的最新型号中,Tenstorrent Galaxy Blackhole 超级集群的测试结果如下:
Kimi K2.6:每秒每用户 900 个token,比 GPU 快 3 倍
DeepSeek-R1-0528 671B:每用户每秒处理 400 多个token,高于 TT-Deploy SF 的 350 多个token/秒。
LTX 2.3 Fast:以 144 帧/秒(24 fps)的速度生成约 6 秒的视频,支持音频和唇音同步,速度比 GPU 快 4 倍。
不同的模型系列,同一个系统,容量随着Galaxy的增加近乎线性增长。Tenstorrent的高性能使企业能够高效地扩展高级推理工作负载。
TT-Ascalon S:Tenstorrent 通过 TT-Ascalon S 扩展了 TT-Ascalon 产品组合,该 S 适用于新兴的智能 AI 工作负载。
在今天于 TT-Deploy JP 大会上,Tenstorrent 发布了 TT-Ascalon S,这是一款面向智能体 AI 的高密度 RISC-V CPU。智能体 AI 对 CPU 的依赖方式发生了改变,它不再仅仅依赖于原始计算能力,而是更多地受到编排、I/O 和延迟的限制,而 TT-Ascalon S 正是为此而生:
密度: TT-Ascalon S 以 TT-Ascalon X 为基础,专为尺寸缩小约 50% 而设计,每平方毫米可提供约 140% 的性能。
效率:紧凑、节能的设计,适用于高吞吐量执行层。
延迟: TT-Ascalon S 针对代理运行时典型的混合、分支密集、工具连接的执行模式进行了调整,有助于实现更可预测的执行。
除了智能体人工智能之外,TT-Ascalon S 还适用于高效服务器、网络和存储 SoC 以及数据中心边缘部署。作为可授权的 RISC-V IP,它使客户能够将相同的架构基础扩展到定制的芯片设计中。
Tenstorrent 的网络化 AI 将加速器和 CPU 连接起来。该架构通过标准以太网统一了计算、内存和网络,并采用开源软件栈。Tenstorrent Galaxies 和超级集群既可独立运行,也可无缝集成到现有 GPU 集群中,无需更换现有基础设施。客户无需依赖单一模型、工作负载或供应商即可扩展容量;系统性能可随模型变化而持续提升;基础设施始终掌握在客户手中。对于构建下一代私有 AI 基础设施的企业和国家而言,这种独立性和灵活性至关重要。
TT-Ascalon CPU介绍
在去年年底,Tenstorrent 宣布推出高性能 RISC-V CPU TT-Ascalon™。RISC-V 是一种开源指令集架构 (ISA) 规范,用于计算机处理器,在全球范围内得到迅速普及,应用范围涵盖嵌入式系统到高性能计算。Ascalon 的发布带来了业界性能最高的 RISC-V CPU IP。
Ascalon 提供真正的高性能计算能力,其性能超越市面上所有现有的 RISC-V CPU,使其在众多其他专有指令集架构中与领先的高端处理器并驾齐驱。Ascalon 的性能得到了行业标准 SPEC CPU 基准测试的支持,SPECint® 2006/GHz 超过 22,SPECint® 2017/GHz 超过 2.3,SPECfp® 2017/GHz 超过 3.6,并且在三星 SF4X 工艺节点上运行频率超过 2.5 GHz,这凸显了其稳健的设计和在先进工艺节点上的可扩展性。
Ascalon 为从服务器和 AI 基础设施到汽车高性能计算 (HPC) 和高级驾驶辅助系统 (ADAS) 等各种应用提供了一套完整的高性能解决方案。它完全兼容 RVA23 规范,其中包括高性能的符合 RVV1.0 标准的矢量引擎。Ascalon 支持硬件虚拟化、高级内存管理和高级中断架构。此外,Ascalon 还支持安全性和 RAS(可靠性、可访问性和可维护性)功能,包括侧信道攻击缓解措施。
Tenstorrent 同时宣布全面支持 GCC、LLVM 和 Qemu 上的 Ascalon 架构,该支持已提交至上游,开发者和客户可立即部署。此次发布使开发者确信,为 RVA23 构建的软件能够在 Ascalon 以及任何兼容 RVA23 的处理器上无缝运行。
“RISC-V 内核几乎适用于所有应用,但真正的高性能一直是其缺失的一环,”Tenstorrent 产品战略副总裁 Aniket Saha 表示。“Ascalon 填补了这一空白,它是一款专为高级计算而设计的 RISC-V CPU,完全符合出口标准,并可在全球范围内销售。我们在中国市场获得了强劲的市场反响,并将优先满足中国客户的需求,首先推出全球版本。”
“Ascalon 是一款完整的解决方案,它集成了高性能内核、系统 IP、符合 RVA23 标准的工具链以及全面的配套资源,”Tenstorrent 的 RISC-V 内核副总裁 Divyang Agrawal 表示。“这为客户提供了开发从高性能计算到机器人等各种平台所需的关键构建模块,并使开发人员能够扩展 RISC-V 生态系统。”
Tenstorrent 通过其创新许可计划提供了一条获得知识产权所有权的途径,因为他们意识到许多公司都希望拥有并定制自己的知识产权。该计划使合作伙伴能够在 Tenstorrent 的技术基础上构建差异化且自主的解决方案。此外,Tenstorrent 还与 CoreLab 建立了合作关系,旨在为该地区提供卓越的客户支持和设计优化,并帮助客户高效地采用和扩展其知识产权。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
END
今天是《半导体行业观察》为您分享的第4454内容,欢迎关注。
推荐阅读
★
★
★
★
★
★
★
★

加星标⭐️第一时间看推送


