导火索:DeepSeek的评论与市场反应
8 月 21 日,DeepSeek 正式发布了其 V3.1 模型。而该公司在评论区发布的一条补充评论,则点燃了中国国产算力股的暴涨行情。
在沉寂了两个多月后,昨天推出了其下一代模型 DeepSeek-V3.1。在官方微信公众号的文章中,该公司提到:“DeepSeek-V3.1 使用 UE8M0 FP8 Scale 作为参数精度。”
或许是觉得这种关于计算支持的描述过于晦涩难懂,该公司亲自在评论区补充道:“UE8M0 FP8 是为即将到来的下一代国产芯片设计的。”
就是这一句话,足以在 A 股市场掀起一场狂热。一夜之间,超过 2800 支股票上涨。算力股全线爆发,多支个股涨停。芯片股同样飙升:寒武纪涨停并创下历史新高,中芯国际 (SMIC) 大涨 14%,海光信息也触及涨停。
分析人士指出,市场并非简单地追逐一个口号,而是在 DeepSeek 的表述中,看到了中国国产芯片在算力上取得国际前沿突破的真实可能性。对许多人而言,这是中国 AI 硬件价值链上一次罕见的共鸣。
技术核心:为何 UE8M0 FP8 是游戏规则改变者?
UE8M0 FP8
之所以备受关注,是因为它有潜力解决国产芯片在运行大模型时长期存在的性能瓶颈。FP8 是一种 8 位浮点格式,它能极大地降低 AI 训练和推理过程中的内存带宽压力。然而,大多数中国芯片仅原生支持 FP16,这意味着像 DeepSeek 这样的模型会遭遇性能折扣。
UE8M0
改变了这一点:它是一种微缩放格式指数,采用一种超简化的 8 位纯指数表示法进行设计。它避免了繁重的浮点运算,同时扩展了动态范围,使得训练速度更快、效率更高,且更不容易出现精度损失。
在实际应用中,它将内存带宽开销降低了 75%,这对于仍在追赶高带宽内存技术的国产芯片来说,是足以改变游戏规则的关键。简而言之,UE8M0 FP8
就像是为中国 AI 芯片按下了「快进键和省电模式」——既弥补了过去的短板,也为下一代的竞争力开辟了道路。
国产 AI 生态的脱钩与崛起
从产业角度看,DeepSeek 的声明不仅仅是一项技术选择,更是对国产生态系统的一次公开背书。
多年来,中国最顶尖的模型对英伟达硬件的严重依赖一直被视为一个软肋。此次发布标志着一种渐进式的脱钩,DeepSeek 公开表达了对国产芯片发展的支持。
“
UE8M0 FP8
的采用也意味着,国内玩家如今正在交付端到端的能力——涵盖浮点格式、编译器优化和框架适配——这展现了多年来软硬件协同发展所取得的实质性进展。
至于 DeepSeek 暗示的下一代国产芯片究竟是哪家,许多人首先想到了华为。但据凤凰网科技报道,几乎所有中国领先的芯片制造商都在与 DeepSeek 进行洽谈。
其中几家已经支持 FP8。股价涨幅最大的寒武纪,其思元 590 和 690 系列芯片已具备 FP8 能力。摩尔线程的 MUSA 架构也原生支持 FP8 张量加速,并与 UE8M0 FP8 Scale
高度契合,与 FP16 相比,其 FLOPs
实现翻倍,并提升了带宽效率。
自今年年初以来,DeepSeek 一直在为中国 AI 芯片产业踩下加速踏板。在美国《人工智能行动计划》誓言要向海外推广美国 AI 技术栈的背景下,中国也在竞相构建自己的体系。加速国产大模型与国产芯片的深度融合,将在相当长一段时间内成为决定性的行业趋势。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!