吴雄昂:AI架构之争,越开放越成功

电子工程专辑 2025-07-26 09:10

“我曾在英特尔设计CPU,后来(2004年)加入Arm时,x86仍是绝对主流,但Arm通过‘Arm-Android生态’构建了更开放的体系,也因为这样的‘开放’支持了当时很多产业开拓者的成长和成功。”吴雄昂(Allen Wu),这位前安谋科技(Arm China)董事长兼CEO的职业生涯转折点,折射出行业对“开放”的渴望,“现如今无论是大公司还是创业公司,都认为AI需要新架构;而新架构必然是融合架构,因此必须具有更大的开放性——这也是我们选择RISC-V的重要原因。RISC-V的彻底开源性,让开发者真正成为生态的主人——你能想到的需求,都能在RISC-V架构里实现,因为它不受限。”

在7月的中国RISC-V峰会上,我们遇到了久未在行业中露面的Allen,他如今的身份已经是CoreLab Tech董事长——一家专注于RISC-V处理器IP和计算平台方案的科技创新企业。与他一起的还有Tenstorrent首席架构师练维汉(Wei-Han Lien)和Tenstorrent产品战略副总裁Aniket Saha——这是一家在业内有“硅仙人”之称的Jim Keller创办的RISC-V芯片公司。

资讯配图

CoreLab Tech董事长吴雄昂(Allen Wu)

在这场对话中,《电子工程专辑》与几位CPU行业的大佬共同探讨了RISC-V的崛起及其对AI时代的深远影响,不仅揭示了RISC-V的核心价值,也折射出全球半导体行业从封闭到开放的范式转变。

 

资讯配图

曾经的Arm架构大咖,为何都开始做RISC-V?

吴雄昂的行业经历堪称Arm架构在中国发展的缩影,2006 年他回国时,中国的半导体行业还处于发展初期,Arm 通过与 Android 的结合,构建了一个比 x86 更开放的生态系统,从而在移动设备上取得了巨大成功。

作为“Arm-Android生态”重塑移动计算格局的亲历者,吴雄昂谈及为何转向RISC-V时,答案直指开放性的本质:“Arm的生态虽然开放,但本质上仍是一种商业化的架构。而RISC-V的开放性是彻底的——它的指令集是开源的,开发者可以自由修改、定制,甚至创造属于自己的架构。这种无限制的自由,正是AI时代创新的关键。”

吴雄昂的判断并非孤例。练维汉曾担任苹果公司芯片架构师,主导Apple Silicon A系列芯片的研发,后加入Tenstorrent参与RISC-V架构的AI芯片设计。他指出:“在苹果时,我们追求的是标准化和效率。但AI的需求是高度定制化的,传统架构的封闭性反而成为创新的枷锁。RISC-V的模块化设计允许我们在硬件层面灵活调整,例如针对特定算法优化数据流路径,这在x86或Arm架构下几乎不可能实现。”

资讯配图

Tenstorrent首席架构师Wei-Han Lien

Aniket Saha也曾在Arm公司工作多年,负责高级安全产品线,后来看到RISC-V架构作为新兴技术的潜力,加入了Sifive公司,之后又在英特尔公司负责晶圆代工服务(IFS)的RISC-V战略布局。他从产业生态的角度补充道:“RISC-V的开放性为新兴市场提供了前所未有的机会。例如,在机器人领域,客户需求千差万别,传统架构需要漫长的适配周期,而RISC-V的灵活性可以直接针对应用场景进行IP定制。这种‘按需设计’的能力,是RISC-V区别于其他架构的核心竞争力。”

 

资讯配图

RISC-V的三大优势:开放、灵活与性价比

RISC-V 架构的开放性和灵活性是其最大的优势。与传统的 x86 和 Arm 架构不同,RISC-V 允许开发者在遵循开放标准的同时进行各种修改和创新。这种开放性不仅使得 RISC-V 能够适应 AI 时代数据多样化和计算算力快速增长的需求,还能够实现更灵活高效的架构演进。

资讯配图

“RISC-V的新机遇主要围绕AI领域,尤其是AI对功能的需求催生了很多需要定制化的东西。”练维汉以Tenstorrent开发的Tensix内核为例解释道,这项技术通过动态修正计算量,可以识别数据中的特定模式,精简算法并减少不必要的计算,从而使算力密度和能效比得到显著提升。

这种技术在GPU架构中难以实现,因为其硬件设计无法动态调整计算路径。而传统x86、Arm由于需要保持向后兼容性,积累了大量复杂且冗余的指令集,这不仅增加了芯片设计的难度,也使得在这些架构上开发新的操作系统或应用的门槛居高不下。

练维汉进一步解释道:“在AI训练中,预处理阶段消耗了50%的电力。传统GPU专注于加速计算,但数据移动和指令控制仍需依赖CPU。而RISC-V的模块化设计允许我们为不同场景定制CPU,例如在数据中心部署百万级优化后的CPU集群,从而应对多样化的计算需求。”

Aniket Saha则从技术生态的角度补充了RISC-V的另一个优势:“相比x86和Arm,RISC-V的IP授权成本更低,且不受单一厂商的限制。例如,我们在构建芯片生态系统时,不仅需要CPU IP,还需要系统IP和外围IP的支持。RISC-V的开放性让我们能够自主集成这些组件,形成完整的解决方案。”

资讯配图

Tenstorrent产品战略副总裁Aniket Saha

不久前,Tenstorrent收购了模拟芯片设计团队Blue Cheetah,对此Aniket Saha表示将有助于公司在构建芯片生态系统时拥有更自主的IP技术控制权,并探索下一代技术如存内计算等在芯片或IP中的应用。“我们已经与不少存内计算公司取得联系,这项技术将对Tenstorrent芯片的算力密度带来极大提升。尽管是否集成模拟电路功能尚未决定,但可以确定的是我们已经准备建立Chiplet生态,做一些Die-to-Die方面的技术布局。”

 

资讯配图

有希望打破GPU对AI的垄断吗?

在AI芯片领域,英伟达凭借其GPU架构和CUDA生态建立了近乎垄断的地位。

Tenstorrent创始人Jim Keller曾在接受 EETimes 美国版采访时提出“英伟达擅长什么,我们就做相反的事”的竞争策略。这一理念在练维汉的解读中得到了具体化:“英伟达用最贵的方案解决问题,而我们选择相反的路。”

资讯配图

“英伟达通过高算力和封闭生态占据市场,而Tenstorrent选择以性价比为核心,通过RISC-V的开源特性实现定制化创新。”练维汉认为,英伟达这种垄断并非不可撼动:“GPU的胜利源于其早期对生态系统的前瞻性布局,但AI的需求正在发生变化。未来,垂直优化的ASIC和融合架构将成为主流。”

一个很直观的例子是特斯拉FSD芯片通过自研架构实现了比英伟达方案更小的体积和更低的成本,同时满足自动驾驶的实时性需求。“这说明市场需要第二选择。”吴雄昂则从产业竞争的角度补充道:“英伟达的商业模式依赖高价格策略,而RISC-V的开源特性允许企业以更低的成本实现创新。这种性价比优势将吸引越来越多的初创公司和垂直行业玩家进入市场,从而打破GPU的垄断格局。”

练维汉和吴雄昂都认为,AI的多样性需求将推动融合架构的兴起,未来AI芯片可能同时包含GPU并行计算单元、CPU控制单元和专用加速器。例如,英伟达的Grace芯片和谷歌的TPU都在探索这种混合模式。而RISC-V的开放性使得不同组件的集成更加灵活,企业可以根据自身需求自由组合。

 

资讯配图

AI爆发,是RISC-V的黄金机遇

CoreLab Tech公司的口号是“where your imagination sets the architecture”——“你能想到的需求,都能在RISC-V架构里实现,因为它不受限。”谈到创立这家公司的初衷,吴雄昂表示正是基于对AI时代架构创新的判断。

 “我们看到许多前Arm工程师加入RISC-V公司,但他们共同面临一个挑战——如何将开放式架构转化为实际成果。”他提到:“CoreLab Tech的角色类似于Linux生态中的Redhat,致力于解决RISC-V的‘最后一公里’问题,帮助客户实现定制化方案的落地。”

AI 时代的计算需求与以往截然不同,数据的产生和处理方式发生了根本变化,从以人为主的数据(如工作数据、照片、聊天记录)转变为以机器为主的数据(如机器人视觉、自动驾驶传感器数据)。这种变化使得传统的 x86 和 Arm 架构难以满足新的需求,而 RISC-V 的开放性和灵活性正好填补了这一空白。

“不同AI设备的数据处理方式完全不同,RISC-V的开放性是唯一能适应这种变化的架构。”吴雄昂进一步强调,AI的发展将加速架构的多样化:“大模型仍在不断进化,无法预设所有公司都采用同一引擎(公版芯片),那样毫无差异化可言。例如,自动驾驶领域从Transformer转向VLAM,PC架构从PowerPC到x86的演变都证明了这一点。RISC-V的价值在于它赋予企业自由选择的权利——每个人都可以根据自身需求设计计算架构,而不是被单一技术路线束缚。”

“GPU架构在AI推理中的能效被高估了,当数据需要频繁搬运时,RISC-V的定制化CPU相较于GPU能大大减少延迟。”练维汉补充道:“在AI训练中,GPU虽然占据主导地位,但并非所有场景都需要它。例如,图像数据的缩放、旋转等操作,以及符号计算和智能控制规则的处理,更适合 CPU,而RISC-V的灵活性允许我们为这些场景定制专用CPU。这种多样性正是RISC-V生态的优势所在。”

一句话来说,AI技术架构尚未固定,英伟达还没有赢下所有的战争

 

资讯配图

Tenstorrent的技术产品布局

Tenstorrent的产品策略体现了RISC-V的开放性与实用性。练维汉透露,公司当前的Grayskull加速卡和Wormhole芯片已面向AI训练和高性能计算场景推出,而原计划于2024年推出的第二代Blackhole芯片因制造问题有所延迟,但软件研发进展顺利。

他解释道,尽管人手是限制因素之一,但今年公司全球范围内的研发团队正在不断扩充,人数已经从去年的200多人扩充到今年的1000多人。 

在技术策略上,Tenstorrent选择用SRAM替代HBM,主要是因为HBM的成本和供货周期不适合初创公司的快速迭代需求。虽然单核性能可能不如使用HBM的GPU,但对于客户来说,系统级方案的性价比才是关键。

资讯配图

Tenstorrent强调通过开源降低研发门槛。练维汉提到:“我们从硬件到软件全面开源,通过集体研究降低成本,同时最大化影响力。例如,Blackhole Galaxy系统通过以太网扩展算力,相较于英伟达的NVLink,这种方案更具普及性和成本优势,且在速度上没什么差别。”

据透露,Tenstorrent的目标是在2025年底推出基于Chiplet架构的Quasar和Grendel处理器,这也与Aniket Saha所说的“正在建立Chiplet生态”吻合。

在2025中国RISC-V峰会上,练维汉也详细介绍了Tenstorrent的开放式芯粒架构(OCA)。经过两年半的研发,Tenstorrent计划于今年底发布OCA,与业界分享其技术成果。OCA的独特之处在于其完全开放,从芯片设计到软件栈均不含任何收费组件,涵盖物理层、传输层、协议层、系统层和软件层等多个抽象层,结构清晰,易于理解。

资讯配图

资讯配图

关于中国市场

至于市场策略,Tenstorrent采取先与小公司合作的方式,通过少量销售快速获取反馈并优化产品。

“中国市场的潜力巨大,我们希望通过开源合作和本地团队(如CoreLab Tech)的协同,逐步渗透这一市场,而非直接设立研发中心。” 练维汉说道,“中国是一个充满活力的市场,通过开放源代码,我们可以吸引全球开发者参与。”他特别提到,中国工程师的创新速度和执行力令人印象深刻:“我们计划先向中国客户提供单芯片产品,根据反馈优化后再推进定制化合作。”

吴雄昂则强调了本地化服务的重要性:“CoreLab Tech在中国的关联公司众智齐芯,专注于RISC-V处理器IP和计算平台方案,团队拥有非常丰富的CPU IP经验和在中国本土服务客户的经验。我们希望通过与国内龙头企业的合作,加速RISC-V生态的落地。”

谈话最后,吴雄昂表示:“行业历史证明,越开放的技术越容易获胜。RISC-V的使命,就是让每个企业都能自由选择并优化自己的计算架构,从而推动整个行业的创新。而CoreLab Tech的使命,就是开发开放架构,赋能AI时代的新开拓者。”这场从Arm到RISC-V的范式转变,或许正是计算史上又一次最重要的变革。

 

资讯配图

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
首日速递|"AI 教父" 杰弗里辛顿来华首谈:我们已经不可能消除AI了,但我们必须管好它!
昨夜今晨全球大公司动态 | 黄仁勋与苏姿丰力挺特朗普AI计划;英特尔将持续进行大规模裁员
就在今天!星逻智能邀您共赴2025 WAIC世界人工智能大会
【AI加油站】第三十六部:面向生产环境的大型语言模型实战手册《LLM 大语言模型构建指南》(附下载)
刚刚,小扎任命清华校友为Meta AI首席科学家!GPT-4幕后功臣或取代65岁图灵奖得主
苹果的AI,为何不叫 AI?
让大模型不靠外部干预自己学习!这家非Transformer AI黑马,引爆WAIC
诺奖得主Hinton中国首讲,金句频出:人类或是大语言模型!一文看尽WAIC开幕式干货
RAG已是过去式?为何说「推理+强化学习」是AI应用的终极配方?软件吞噬服务的最后一块拼图:推理智能体来了
阿里首款自研AI眼镜亮相!夸克AI加持,淘宝支付宝都能用|WAIC2025
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号