云天励飞提出“Token成本百万倍降幅”目标,GPNPU路线图剑指NVIDIA Rubin

科技区角 2026-03-06 15:01

【区角快讯】2026年开年以来,AI智能体OpenClaw因具备全天候运行能力而广受关注,被用户昵称为“小龙虾”。尽管其应用场景丰富,但高昂的Token消耗令多数开发者难以长期承担。



近两个月,国产大模型调用量已超越谷歌、OpenAI及Anthropic等国际巨头,主因在于国内Token定价显著低于海外。然而,即便如此,当前成本仍不足以支撑大规模商业化落地。

云天励飞董事长兼CEO陈宁近日指出,未来五到十年,全球AI竞争重心将从“模型智能程度”转向“应用规模化落地能力”。他强调,当前制约AI普及的核心瓶颈正是推理成本,尤其是类似OpenClaw这类智能体所依赖的Token费用。

为此,陈宁提出雄心勃勃的目标:在“十五五”期间(2026–2030年),通过技术革新将推理成本降低100万倍,力争到2030年实现“百亿Token仅需1分钱”。

虽然具体实施路径尚未披露,但云天励飞已于今年初公布其新一代GPNPU芯片路线图。该芯片融合GPU与NPU特性,支持CUDA兼容,并宣称可通过“一行代码”完成从英伟达GPU到国产芯片的模型迁移。

在架构设计上,公司采用prefill与decode分离策略:P芯片聚焦计算密集型任务,D芯片则优化访存密集型操作,以提升整体推理效率与性价比。

此外,GPNPU将通过多芯片协同构建“超节点”系统。2026年首发的第一代超节点P芯片,算力对标英伟达Hopper架构;2027年将推出首代超节点D芯片,主打超低时延推理,对标Blackwell架构;至2028年,第二代超节点D芯片计划对齐Rubin架构,并有望实现毫秒级推理延迟。

在全球AI从训练转向推理的关键窗口期,此类高能效、低成本专用芯片或将成为国产算力突围的核心支点。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
重磅!华为算力海外首次亮相
华为896线激光雷达,有什么不一样?
华为卖爆!这种手机彻底火了
华为MWC放出绿色AIDC大招:重构AI发展“水电煤”,从技术突围到联合生态共建
华为字节联手,研发28nm存内计算芯片
Omdia:2025年第三季度,中国大陆云基础设施市场加速增长24%,阿里云继续保持领先地位,华为云和腾讯云紧随其后
华为修“天路”、中兴开“天眼”:国产通信巨头在MWC26争相「上天」
【一周热点】华为哈勃再出手;三星重返DRAM市场榜首;中芯国际406亿收购案新进展
2025年中国智能手机销量,华为第一!
华为智界再得一名大将
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号