云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025

芯东西 2025-10-17 19:20

云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025图1

打造基于国产工艺的推理芯片的端边云产业生态,推动中国第四次工业革命早日到来。
编辑 |  全球AI芯片峰会
9月17日,由智一科技旗下智猩猩联合芯东西举办的2025全球AI芯片峰会(GACS 2025)在上海举行,在峰会主论坛上,云天励飞董事长兼CEO陈宁博士以《芯智AI,推理未来》为主题发表演讲。
云天励飞董事长兼CEO陈宁谈道,在“政策+需求”双重驱动下,国产AI推理芯片正迎来绝佳发展机遇。
根据灼识咨询报告,中国NPU市场规模短期预计新增规模339.3亿元,长期预计新增规模1092亿元。
高效Token生成是衡量推理芯片性价比的关键指标。11年来,云天励飞已研发五代NPU,打造相关指令集、专用算子、存算一体架构、低比特混合量化等芯片硬件技术。
其“算力积木”架构是基于国产工艺的D2D Chiplet & C2C Mesh大模型推理架构,具有可扩展性强、灵活性强、实时性高等特点。
云天励飞提供“深穹”、“深界”、“深擎”三大AI推理芯片系列,分别面向大模型推理算力中心/超节点/一体机/加速卡、边缘网关/边缘盒子/家庭主机、及机器人/无人机/无人车等AI推理等应用。
目前,云天励飞正在研发新一代NPU Nova500,并基于Nova500推出多款性能更强的AI推理芯片。
以下为陈宁的演讲实录:
很高兴有机会跟大家分享一下关于人工智能2025年的最新变化趋势,以及变化背后对于AI芯片尤其是国产芯片带来的一些机遇和挑战,最后分享一下云天励飞在这里的思考和实践。
在讨论这个趋势前,我们把AI放到一个更宏大的叙事背景下。
中国在过去几千年依靠四大文明曾经一度引领全球的科技和社会发展,但300多年前第一台蒸汽机在英国的出现改变了这个格局。
依靠第一台蒸汽机在欧洲的出现,英国在第一次工业革命打造了日不落帝国。200年前的第一个灯泡也是出现在英国。
后来,美国依托电力时代,引领了全球的科技和经济的发展。在第三次工业革命,美国依靠计算机,再一次在科技、军事、金融、经济甚至文明、文化,引领定义了世界运行的规则。
当前,我们正站在以人工智能为基础的第四次工业革命的门前。过去几年,人工智能的快速发展令越来越多人相信,在未来五年,我们有可能全面进入第四次工业革命。
但在这个窗口期,(中国科技和海外科技)两条曲线可能再次交叉。
云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025图2
而人工智能的六个关键要素,算力、芯片、应用、人才、数据、系统中,人才是流动的,应用、数据、系统是中国的差异化优势
今年年初的DeepSeek,证明了我们在算法领域也有可能把差距压缩到几个月的时间。唯独AI芯片成为我们仍需追赶的、还有一定差距的核心关键要素。
这是中国在2030年第四次工业革命有没有机会推动两条曲线再次交叉的一个关键要素。这也是为什么大算力AI芯片不仅仅成为一个行业、一个领域,更是国家的一个核心战略。

01.
AI全面进入推理阶段
AI应用正大规模爆发


为什么芯片这么重要?
2022年11月30日,ChatGPT一夜之间把我们带入到人工智能大模型高速发展的加速阶段。过去两年多,AI大模型不仅是全球最高频的一个词汇,它把我们人类行行业业的科技突破性发展带入到一个快车道。
在此之前,重大的科学技术变革是以3-5年为周期。但是过去两年多,这个周期被压缩到了3个月甚至是几个小时的模型迭代和更新,不仅在大语言模型、多模态大模型,还在AI for Science、生物医药、AlphaFold、脑机接口、SpaceX甚至推动通信领域的AI融合等等各行各业。
越来越多人认为,2030年可能只有1%到5%的人需要工作,剩下的人类只需互相娱乐。从秦始皇时代开始的长命百岁愿望也变成了可能。哈佛提出我们可能在2030年突破平均150岁的寿命。
AI和大模型不仅给我们的电子产业、AI产业数字化智能硬件带来一系列变化,甚至对于人类文明的演进历程产生深远和重大的影响。
但是穿透这些快速迭代变化背后,我们看到一些趋势。
从2012年Hinton的AlexNet论文开启了这一轮深度学习小模型到大模型的变革,可以说,过去十多年是AI训练的时代。
当然,英伟达的GPU和CUDA系统,也依靠过去十多年从小模型赋能千行百业、长尾算法到Transformer赋能大模型的训练,赢得了它的高光时刻。
但在2025年,我们看到一个重大的趋势——AI正在由过去的学习训练阶段,全面进入到应用推理时代
未来5-10年是AI训练和AI推理并重的时代,多了一条路线。AI应用正在大规模爆发。
未来在6-12个月,只要有一款AI爆品,可能是一个AI数字人、一个AI情感伴侣,也可能是一个家庭的聊天机器人,或者一款毛绒玩具,让你产生情感联系,那么AI token的数量可能是以1~2个数量级激增。
如果这款爆品出现,很快AI推理芯片的市场需求、市场规模将会快速超过AI训练芯片的市场规模

02.
AI推理算力网络将像电网般无处不在


打一个比喻,如果跟第二次工业革命的电力时代相比,AI训练芯片就相当于是发电机。
但我们知道,发电不是目的,落地到每个寻常百姓家的使用,赋能各类电器,才是真正推动产业化革命的关键。所以,AI推理芯片是怎么把电更好地用起来,使能灯泡等家用电器的电动机。
很少有人知道国家电网的电厂里今天用的是什么牌子的发电机,但是很多人会关心比亚迪电动车里的电动机和发动机能否做到自主可控,可否把它的体积压缩1%,成本压缩到更小,能够驱动多轴人形机器人,赋能各行各业。
所以,AI推理芯片将成为AI赋能第四次工业革命、赋能千行百业,甚至改变我们每个人生活的关键的核心技术和产品。
在这个过程中,我们看到两大趋势
一是未来5-10年甚至更快,AI和大模型会重新定义我们人类的所有电子产品,从耳机、眼镜到手持的手机、Pad到扫地机器人、家用电器、无人驾驶汽车、人形机器人……都会开口讲话,变成我们各类场景的超级个人助手或者情感陪伴助手。AI推理芯片在端边云会赋能所有这些AI软件agent和硬件agent。
另外,未来5到10年,AI推理芯片赋能的AI推理算力网络,会像今天的电网和无线通信网络一样,作为一个最重要的第四次工业革命的基础设施,无处不在。
国家有大型的AI推理算力中心;每个城市有自己一定规模的、赋能城市超低时延响应的AI推理算力中心;甚至每个10万平以上的产业园区,也有专门提供coding的园区里企业边缘AI计算中心;甚至每个人的家庭里都会有计算主机,私有化大模型可以部署到家庭里,确保个人和智能隐私的安全;每个人办公室里的NAS硬盘也会添加AI推理芯片,去赋能日常办公,构成这样一张无处不在的AI推理算力网络。
两个月前,我到日内瓦开会,在联合国和ITO提出一个建议,由ITO牵头去定义未来AI推理算力全球网络的国际接入标准和行动方案。未来AI推理算力网络就像今年4G和5G通信网络一样,会有国际标准,会无处不在、智能硬件不仅在中国、美国,走到非洲偏远的乡村,也可以无缝接入这些token的服务。
两个重大的变化趋势:所有硬件都会吐出token,都会被AI重新定义;AI推理算力网络会无处不在,背后都是对于端、边、云的AI推理芯片激增的需求。
中国定制AI芯片(比如谷歌TPU、博通ASIC)包含各类架构的定制的AI推理芯片,统称“NPU”。它对应的是英伟达的GPGPU架构。
根据灼识咨询的市场分析报告预测,保守估计到2030年,在中国市场,以NPU为主导的AI推理芯片市场需求会达到4000亿元,这个数字会快速地被放大。
云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025图3
国务院近期发布了《关于深入实施“人工智能+”的行动方案》。上一次这么大力度的行动方案还是2015年的“互联网+”行动方案,推动了中国一批互联网巨头产业的形成。
今年的行动方案里有两个最重要的数字:
    • 到2027年,率先实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%
    • 到2030年,我国人工智能全面赋能高质量发展,新一代智能终端、智能体等应用普及率超90%
    不是力争达到,而是必须超过这两个数字。
    所以,中国在未来五年将成为全球人工智能渗透率最高的国家,并且依托这些样板和应用的案例,把大模型和芯片复制到全球。
    AI全球竞争,已经不再仅仅是谁能够训练出来最聪明的大模型,而是谁能够在全球70亿人口里,将AI的模型、芯片和应用占领更广阔的全球市场,引领第四次工业革命。

    03.
    云天励飞11年芯路:
    五代NPU、算力积木架构、落地三大赛道


    最后,简单介绍一下云天励飞和我们在AI推理芯片领域的一些探索。
    云天励飞是我在2014年带领一支美国海归工程师团队回到深圳,创立的一家AI推理芯片公司。我们可能是中国最早的一支聚焦在AI推理芯片领域的AI芯片公司之一。
    11年的时间,我们打造了五代神经网络处理器(NPU)面向端、边、云的AI推理芯片,像最早的安防、智慧城市到企业级的服务,到最近消费类服务的各类场景,打造了一系列应用产品和服务行业的样板。
    跟英伟达GPGPU在训练时代的主架构做一个简单类比,我认为可以分为三类。
    云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025图4
    AI的训练,现在无可争议的是,基于GPGPU的硬件架构,基于CUDA的软件生态,构建了一个训练的繁荣市场。这是过去十多年不仅对于AI训练,对于各类科学计算、天气预报甚至未来量子科研的研究,打造的一个全球繁荣生态。国内也有很多,像华为昇腾、寒武纪等,构建了国产训练生态。
    但是随着推理芯片、推理市场的兴起,我们认为未来两个新的领域:
    一个是基于GPNPU的云端AI算力中心的推理芯片市场会快速兴起,所有头部互联网企业都会在自己原有的智算中心里快速扩建AI大算力推理芯片市场。从AI的加速卡一体机到AI计算集群超节点,这些技术都会快速跟进。
    到未来AI端边的这些定制化细分场景。这些场景往往是基于NPU架构,可以提供更高性价比、更高能耗比的定制化、高性价比AI推理芯片。
    比如说,我认为今天的AI智能终端芯片,最优秀的一家公司是苹果,它的智能手机里NPU占比越来越高。
    甚至苹果预测未来它的手机端大模型,可能会有70%到80%的大模型推理任务将会基于苹果A系列手机芯片在本地完成。这需要高性价比的、基于NPU的推理芯片架构的设计。
    形成这样的三个赛道,解决不同场景、不同需求的灵活性和和性价比之间的最优平衡。
    云天励飞11年,我们从终端到边缘到云端,打造了5代神经网络处理器。
    从Nova 100第一代面向城市级的海量视频分析,包括人脸识别等应用场景,到第二代和第三代面向多维的各类视觉行为、视觉智能、视觉感知的智能分析,从终端到边缘,到目前正在商用的第四代Nova 400的基于Chiplet的神经网络处理器。
    尤其是我们开发了“算力积木”的架构创新,来解决国产工艺的大算力问题。
    目前在研的第五代Nova500中,我们结合了Chiplet和3D memory的封装来突破内存墙。
    算力积木是从2020年开始,我们跟国产的工艺和生产厂家联合,基于Chiplet的探索架构创新,可以实现算力scale up的扩展。基于相对成熟的12nm、14nm国产工艺,通过算力堆叠,就像搭积木一样,实现一次性的设计生产,多次封装,可以堆叠出来面向不同场景的不同规格的算力的不同芯片,来解决国产工艺相对落后的、应对不同算力规格的、尤其是(满足)大算力等市场的需求。
    经过11年的时间,基于我们NPU和GPNPU的底层算法芯片化的核心芯片设计技术平台,我们打造了面向消费级、企业级、行业级的三大类应用场景的产品和服务。
    云天励飞陈宁:国产AI推理芯片迎来历史性机遇丨GACS 2025图5
    面向消费级,我们去年可穿戴设备模组的出货量,比如说蓝牙耳机单品的出货量突破了3200万颗,服务中国所有头部手机品牌厂商,占到了所有手机品牌厂商蓝牙耳机的35%的中国市场份额,成为最大的可穿戴设备的硬件方案供应商。相信这些可穿戴设备,包括大家关注到最近苹果发布会,它的耳机已经可以做同声传译,这些都会被AI大模型重新定义和赋能。
    我们内部也孵化了AI的原生硬件“噜咔博士”,从两岁三岁的孩子开始提供知识类,包括我们下个月即将发布的毛绒玩具,情感陪伴类的,这些都有机会成为人工智能时代的智能硬件,人工智能时代的iPhone时刻,在未来6到12个月就有可能会出现。
    对于企业级,我们提供大算力的SoC芯片、一体机、计算集群超节点等等,通过AI芯片,结合我们上下游的合作伙伴,共同为企业生产力的提升去进行赋能。
    对于行业级,更是我们十多年沉淀的,在安防、交通、教育、智慧城市等多个行业,在中国的100多座城市打造了城市级的系统性的样板。
    尤其是我们三个系列AI推理芯片,面向云端大模型的大算力推理芯片,我们的“深穹”系列提供了一体机,今年年初也适配了满血版的DeepSeek,提供计算集群的产品和服务。
    第二个系列是我们沉淀十年的、面向边缘计算的各类碎片化场景,从视频高密到压缩版的大模型的推理的服务——“深界”系列
    面向边缘计算,我们今年也立了项,还继续去打造面向VLA具身智能的机器人大脑芯片——“深擎”系列,去赋能各类的机器狗机器人。





    声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
    AI 芯片
    more
    上海 杭州 倒计时!TI免费培训:ADAS|AIDSP|精密电机控制|多协议无线等
    AI+,国产EDA的逆袭利器!
    得一微全国产AI存力解决方案,领跑数字电网智能化转型
    4款豆包大模型上新!成本锐减,火山引擎进入AI落地深水区
    【AI加油站】机器人设计系列三十:从零打造 Arduino 机器人:从基础到进阶的全方位制作指南(附下载)
    程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
    不止于Sora 2!商汤Seko再次定义“成片智能体”,AI视频生成迎来杀手级应用
    AI招聘有多离谱?小哥在LinkedIn埋了行代码,钓出一堆AI,吸引900万人围观
    苹果iPhone Air预售5分钟售罄,搭载eSIM,起售价7999元
    黑洞物理学家加盟OpenAI,GPT-5 Pro半小时重现人类数天推导
    Copyright © 2025 成都区角科技有限公司
    蜀ICP备2025143415号-1
      
    川公网安备51015602001305号