埃隆・马斯克在与罗恩・巴伦交谈时透露,他正在研发一款芯片,性能可达英伟达同类产品的 2 至 3 倍,成本却仅为后者的十分之一。
“这款芯片的整套物理设计方案我都烂熟于心,整个架构在我脑海里清晰可见。”
当台积电告知他新建一座芯片工厂需要耗时五年时,马斯克表示:“对我来说,五年太过漫长。我的规划周期一般以一到两年为单位,超过三年基本就等同于遥遥无期。” 正因如此,他决定自建芯片产线。
马斯克表示:“特斯拉自动驾驶系统目前累计行驶里程已突破100 亿英里,安全表现是人类驾驶员的四倍;搭载新款芯片后,安全水平将再提升至人类的十倍。”
对此,有分析师在社交媒体表示,这并不是天方夜谭,解读如下:

一款性能达到英伟达芯片 2 至 3 倍、成本却仅为其十分之一的产品,听着如同天方夜谭,但只要搞清楚英伟达实际售卖的是什么,就会明白其中逻辑。
英伟达GPU芯片需要适配所有客户、各类模型架构以及不同开发框架,同时还要维持长达 15 年的 CUDA 生态兼容。这种通用设计,必然会造成芯片硬件资源的冗余:为兼容老旧功能预留大量晶圆面积,为极少用到的数据传输搭建互联通道,还得按照无法预判的算力需求配置内存带宽。
而特斯拉 AI5 芯片,只为自家神经网络运行服务。工程师对芯片各模块间的数据流转路径了如指掌,因此直接砍掉了所有闲置的传输通路。凡是和特斯拉自有模型无关的功能 —— 老旧 GPU 兼容模块、图像信号处理器等,全部剔除。最终,只用一半的晶圆面积,就完成了同等核心任务。
再来看利润空间层面的账:英伟达毛利率约 73%,消费者实际支付的费用里,仅有四分之一真正用于芯片硬件本身。而特斯拉自产芯片,本身就是唯一使用方,完全按硬件成本定价。单靠垂直整合模式,就足以抹平九成左右的成本差距,这还没算上技术优化带来的优势。
谷歌早在 2015 年就凭借 TPU 芯片践行了这套思路,随后亚马逊推出 Inferentia、微软打造 Maia 芯片,也都沿用相同逻辑。比特币矿机领域更是最先印证这一规律:一旦算力任务定型,专用集成电路(ASIC)仅用两年时间就彻底取代了通用 GPU 挖矿。
这是行业通行规律:当算力应用仍在快速迭代时,通用芯片占据优势;一旦应用场景趋于稳定,专用芯片便能在各项核心指标上实现全面反超。
而这款芯片的局限性,恰恰印证了马斯克说法的可信度。AI5 并不支持前沿大模型训练,其他企业若想使用它,还需投入数年时间进行软件开发。它的定位十分纯粹:只为海量汽车与机器人场景,以最低的单位功耗成本,运行特斯拉的 AI 推理任务。
英伟达靠通用适配能力收取溢价,而特斯拉早已不再需要这类附加功能。
