Positron发布第二代AI推理芯片Asimov，能效宣称达英伟达Rubin五倍

【科技纵览】2月5日报道，美国人工智能芯片初创公司Positron近日正式对外披露其第二代专用集成电路（ASIC）设计——Asimov。该公司声称，该芯片在每瓦特和每美元所能处理的Token数量上，均可达英伟达即将推出的Rubin GPU的五倍。

Positron指出，当前基于Transformer架构的大模型推理性能瓶颈主要来自内存带宽，而非计算能力。因此，Asimov采用“内存优先”设计理念，实现了高达90%的内存带宽利用率，并通过硬件架构优化，从源头上减少远程数据迁移带来的延迟与能耗。

该芯片由两个计算模块构成，每个模块集成支持多种数据格式的脉动阵列，并配备432GB LPDDR5x内存。此外，通过PCIe 6.0与CXL 3.0接口，还可连接最多720GB专用于KV缓存的附加内存。整颗芯片热设计功耗（TDP）为400W，总内存容量达2304GB，内存带宽合计2.76TB/s，且仅需风冷散热即可运行。

Asimov还支持16Tbps速率的芯片间互连，可灵活适配多种拓扑结构。其配套的Titan推理服务器采用标准19英寸4U机架规格，单台设备集成4颗Asimov芯片，能够高效运行参数规模高达16万亿的模型，并支持1000万Token级别的上下文窗口。整个系统最大可扩展至4096台Titan服务器。

Positron表示，Asimov芯片计划于2026年底完成流片，2027年初开始量产。这一产品路线图凸显了行业正加速从通用GPU向高能效、高内存密度的专用推理芯片演进的趋势。在大模型推理负载持续攀升、内存墙日益成为性能制约的背景下，以Positron为代表的新兴厂商正试图通过架构创新，重构AI硬件竞争格局。