云天励飞提出“Token成本百万倍降幅”目标，GPNPU路线图剑指NVIDIA Rubin

【区角快讯】2026年开年以来，AI智能体OpenClaw因具备全天候运行能力而广受关注，被用户昵称为“小龙虾”。尽管其应用场景丰富，但高昂的Token消耗令多数开发者难以长期承担。

近两个月，国产大模型调用量已超越谷歌、OpenAI及Anthropic等国际巨头，主因在于国内Token定价显著低于海外。然而，即便如此，当前成本仍不足以支撑大规模商业化落地。

云天励飞董事长兼CEO陈宁近日指出，未来五到十年，全球AI竞争重心将从“模型智能程度”转向“应用规模化落地能力”。他强调，当前制约AI普及的核心瓶颈正是推理成本，尤其是类似OpenClaw这类智能体所依赖的Token费用。

为此，陈宁提出雄心勃勃的目标：在“十五五”期间（2026–2030年），通过技术革新将推理成本降低100万倍，力争到2030年实现“百亿Token仅需1分钱”。

虽然具体实施路径尚未披露，但云天励飞已于今年初公布其新一代GPNPU芯片路线图。该芯片融合GPU与NPU特性，支持CUDA兼容，并宣称可通过“一行代码”完成从英伟达GPU到国产芯片的模型迁移。

在架构设计上，公司采用prefill与decode分离策略：P芯片聚焦计算密集型任务，D芯片则优化访存密集型操作，以提升整体推理效率与性价比。

此外，GPNPU将通过多芯片协同构建“超节点”系统。2026年首发的第一代超节点P芯片，算力对标英伟达Hopper架构；2027年将推出首代超节点D芯片，主打超低时延推理，对标Blackwell架构；至2028年，第二代超节点D芯片计划对齐Rubin架构，并有望实现毫秒级推理延迟。

在全球AI从训练转向推理的关键窗口期，此类高能效、低成本专用芯片或将成为国产算力突围的核心支点。