Positron发布第二代AI推理芯片Asimov,能效宣称达英伟达Rubin五倍

科技区角 2026-02-05 13:31

【科技纵览】2月5日报道,美国人工智能芯片初创公司Positron近日正式对外披露其第二代专用集成电路(ASIC)设计——Asimov。该公司声称,该芯片在每瓦特和每美元所能处理的Token数量上,均可达英伟达即将推出的Rubin GPU的五倍。



Positron指出,当前基于Transformer架构的大模型推理性能瓶颈主要来自内存带宽,而非计算能力。因此,Asimov采用“内存优先”设计理念,实现了高达90%的内存带宽利用率,并通过硬件架构优化,从源头上减少远程数据迁移带来的延迟与能耗。

该芯片由两个计算模块构成,每个模块集成支持多种数据格式的脉动阵列,并配备432GB LPDDR5x内存。此外,通过PCIe 6.0与CXL 3.0接口,还可连接最多720GB专用于KV缓存的附加内存。整颗芯片热设计功耗(TDP)为400W,总内存容量达2304GB,内存带宽合计2.76TB/s,且仅需风冷散热即可运行。

Asimov还支持16Tbps速率的芯片间互连,可灵活适配多种拓扑结构。其配套的Titan推理服务器采用标准19英寸4U机架规格,单台设备集成4颗Asimov芯片,能够高效运行参数规模高达16万亿的模型,并支持1000万Token级别的上下文窗口。整个系统最大可扩展至4096台Titan服务器。

Positron表示,Asimov芯片计划于2026年底完成流片,2027年初开始量产。这一产品路线图凸显了行业正加速从通用GPU向高能效、高内存密度的专用推理芯片演进的趋势。在大模型推理负载持续攀升、内存墙日益成为性能制约的背景下,以Positron为代表的新兴厂商正试图通过架构创新,重构AI硬件竞争格局。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 芯片 英伟达
more
存储芯片价格飙升重创手机厂商,传音净利润腰斩凸显中低端市场承压
Positron发布第二代AI推理芯片Asimov,能效宣称达英伟达Rubin五倍
一家中国公司,为何能够成为UWB芯片的引领者?
Z80古董芯片成功运行轻量AI,开发者挑战AI体积极限
4家PC大厂考虑采用中国存储芯片
爱芯元智AI 芯片突围,踩中边缘 AI 发展窗口
摩尔线程推国产AI编程服务,实现芯片与大模型协同突破
苹果或仅限M系列芯片采用英特尔18A-P工艺,iPhone代工传闻遭散热质疑
对话后摩智能项之初:端侧AI芯片已就绪,等待下一个“iPhone 4”
超睿科技UR-DP1000桌面级 RISC-V芯片通过《半导体集成电路 中央处理器(CPU)计算性能技术规范》国家标准符合性验证 性能表现优异
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号