英伟达将推出新推理芯片

半导体芯闻 2026-03-05 17:33
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~


过去两天,韩国基准指数KOSPI跌幅均超过10%,创下2008年以来最大两日跌幅。


市场普遍认为,特朗普对伊朗动武引发的全球资金避险情绪,令包括韩国在内的亚洲股市承受了惨烈的跌幅。然而,有最新分析指出,英伟达为韩国惨跌也做了“贡献”。


一则关于英伟达的技术传闻对韩国内存股造成了精准打击。据韩国Citrini7分析师Jukan引述独立分析机构KIS的评论,有报道称英伟达正在开发一种利用Groq片上SRAM架构的新型推理芯片,并计划在3月的GTC大会上公布。


这一消息导致韩国内存股走弱,投资者担忧SRAM的使用会减少对包括HBM在内的主内存的需求。


不过韩国股市今日出现了强劲反弹。最新行情显示,韩国KOSPI指数今日涨幅扩大至11%,科技巨头三星电子大涨13%,SK海力士飙升15%。


英伟达将推出新推理芯片图1


SRAM推理芯片冲击HBM、DRAM?可能误判了


然而,市场可能误判了SRAM推理芯片的冲击。


KIS明确指出:“声称‘低成本’SRAM推理芯片的出现将减少HBM等现有主内存使用的观点,反映了对内存的糟糕理解。”


从物理特性来看,SRAM的单元面积更大,密度低于DRAM,导致其每比特成本显著更高。对于相同容量,SRAM通常需要DRAM 5到10倍的裸片面积。因此,SRAM历史上一直用于需要极低延迟的缓存或片上缓冲应用,而非作为存储大量数据的主内存。


英伟达将推出新推理芯片图2


SRAM或将推动内存层级多元化


SRAM架构并非DRAM的替代品,而是一个独立的选项。与DRAM相比,以SRAM为中心的架构具有访问延迟低得多和数据移动最小化的优势。


KIS分析称,英伟达计划利用Groq架构,是为了针对GPU难以处理的特定推理工作负载进行优化。采用SRAM架构应被理解为针对需要超低延迟的特定数据中心工作负载,以及需要实时响应的物理AI边缘应用(如机器人和自动驾驶)的独特选择。事实上,OpenAI已经在其数据中心部署了Cerebras的SRAM芯片,基于这些芯片构建的推理服务收取比标准GPU推理服务更高的API费用。


随着AI产业的进步,基于Groq的SRAM架构的普及将进一步细分AI基础设施内的内存层级。HBM和DRAM将继续作为大规模模型训练和通用推理服务器的主内存。KIS总结道:“涵盖SRAM、HBM和DRAM的内存层级将变得越来越具有多层次性,最终推动整个内存行业总潜在市场(TAM)的扩张。”


(来源:内容转自华尔街见闻,谢谢


点这里👆加关注,锁定更多原创内容


*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。


推荐阅读

英伟达将推出新推理芯片图3

喜欢我们的内容就点“在看分享给小伙伴哦~英伟达将推出新推理芯片图4

英伟达将推出新推理芯片图5

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
芯片 英伟达
more
SambaNova发布SN50芯片亮剑英伟达,卡位AI推理黄金赛道
40亿美元!英伟达投资两家光学公司,加码AI算力生态
苹果考虑引入长鑫、长江存储;英伟达去年每秒净赚2万5;指责中国AI抄袭的Anthropic遭美国封杀
豪言自家芯片比英伟达GPU强10倍,这家AI公司再获融资
英伟达的 AI 芯片,被卖马桶和织布的「卡」了脖子
英伟达40亿美元投资Lumentum及Coherent
英伟达已出售所持全部Arm股份;苹果3月4日发布会或推平价版MacBook;谷歌Pixel 10a手机发布;苹果iPad Pro将进入“挤牙膏”时代...
2159亿美元“算力税”,英伟达大客户想逃离了
英伟达的AI神话,倒在满分财报里
英伟达被起诉,用盗版训练大模型成行业潜规则?
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号