【科技纵览】2月5日报道,美国人工智能芯片初创公司Positron近日正式对外披露其第二代专用集成电路(ASIC)设计——Asimov。该公司声称,该芯片在每瓦特和每美元所能处理的Token数量上,均可达英伟达即将推出的Rubin GPU的五倍。

Positron指出,当前基于Transformer架构的大模型推理性能瓶颈主要来自内存带宽,而非计算能力。因此,Asimov采用“内存优先”设计理念,实现了高达90%的内存带宽利用率,并通过硬件架构优化,从源头上减少远程数据迁移带来的延迟与能耗。
该芯片由两个计算模块构成,每个模块集成支持多种数据格式的脉动阵列,并配备432GB LPDDR5x内存。此外,通过PCIe 6.0与CXL 3.0接口,还可连接最多720GB专用于KV缓存的附加内存。整颗芯片热设计功耗(TDP)为400W,总内存容量达2304GB,内存带宽合计2.76TB/s,且仅需风冷散热即可运行。
Asimov还支持16Tbps速率的芯片间互连,可灵活适配多种拓扑结构。其配套的Titan推理服务器采用标准19英寸4U机架规格,单台设备集成4颗Asimov芯片,能够高效运行参数规模高达16万亿的模型,并支持1000万Token级别的上下文窗口。整个系统最大可扩展至4096台Titan服务器。
Positron表示,Asimov芯片计划于2026年底完成流片,2027年初开始量产。这一产品路线图凸显了行业正加速从通用GPU向高能效、高内存密度的专用推理芯片演进的趋势。在大模型推理负载持续攀升、内存墙日益成为性能制约的背景下,以Positron为代表的新兴厂商正试图通过架构创新,重构AI硬件竞争格局。