近日,国产处理器厂商龙芯中科在互动平台回复称,龙芯首款GPGPU专用芯片 ——9A1000已成功完成设计研发,预计将于本季度内交付流片。
据悉,龙芯9A1000将采用先进的芯片设计架构,具备高吞吐量的并行计算能力,旨在满足AI推理、边缘计算和部分高性能计算场景的需求。9A1000定位为入门级显卡,支持AI加速,性能对标AMD RX550,具有一定的推理能力,支持OpenGL 4.0;在终端AI计算性能方面,INT8性能大于32TOPS。同时,9A1000还将集成视频处理模块,支持H.264/H.265编解码。
据公司首席工程师、通用GPU处理器研发负责人苏孟豪介绍,龙芯9A1000相比其前代产品——集成于2K3000芯片中的第二代GPGPU核心LG200,实现了性能5倍以上的巨大飞跃,其AI算力更是达到了40TOPS(每秒40万亿次运算)。
该芯片得益于9A1000的GPU内核进行了全面升级,图形流水线翻倍,主频也提升了25%,同时流处理器面积减小了20%,轻负载功耗降低了70%。最关键的是,9A1000的GPU整体规模达到了前代LG200核心的4倍。该芯片将会在2026年推出。
公司进一步披露了其GPGPU产品线的规划蓝图——面向中高端市场的独立显卡芯片龙芯9A2000。这款芯片将四颗成熟的9A1000芯片集成在一个先进的封装内,图形API升级到OpenGL 4.6,并加入了对于虚拟化的支持,除了支持INT8和INT4,张量单元也增加了对BF16、FP8等浮点数据类型的支持。
在算力方面,9A2000单精度浮点算力达5TFLOPS,INT8 AI算力达160TOPS,内存带宽256GB/s。9A2000最引人注目的特性之一是支持双片互联,使得整体性能还可再提升一倍,达到同等工艺下国际先进水平。
龙芯中科董事长胡伟武曾强调,“以自力更生实现更低成本、更高性能、更优生态。”他透露,后续的9A3000是一款更高性能的GPGPU,若采用先进的Xnm工艺,性能可能提升3-5倍。
长期以来,中央处理器(CPU)和图形处理器(GPU)构成了现代计算系统的两大核心。龙芯中科凭借其自研的LoongArch指令集和“龙芯”系列CPU,在通用计算领域取得了显著成就,广泛应用于政务、电力、交通等关键行业。而龙芯9A1000的研发成功,将进一步推动GPU国产化。
此次研发完成并计划三季度流片,意味着芯片设计已进入最终验证和制造阶段。流片成功后,龙芯将进行样片测试和性能验证,为后续的量产和商业化应用铺平道路。
THE END
关注“电子工程专辑”加小编微信
现已开放地区群,请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号
