【区角快讯】2026年开年以来,AI智能体OpenClaw因具备全天候运行能力而广受关注,被用户昵称为“小龙虾”。尽管其应用场景丰富,但高昂的Token消耗令多数开发者难以长期承担。

近两个月,国产大模型调用量已超越谷歌、OpenAI及Anthropic等国际巨头,主因在于国内Token定价显著低于海外。然而,即便如此,当前成本仍不足以支撑大规模商业化落地。
云天励飞董事长兼CEO陈宁近日指出,未来五到十年,全球AI竞争重心将从“模型智能程度”转向“应用规模化落地能力”。他强调,当前制约AI普及的核心瓶颈正是推理成本,尤其是类似OpenClaw这类智能体所依赖的Token费用。
为此,陈宁提出雄心勃勃的目标:在“十五五”期间(2026–2030年),通过技术革新将推理成本降低100万倍,力争到2030年实现“百亿Token仅需1分钱”。
虽然具体实施路径尚未披露,但云天励飞已于今年初公布其新一代GPNPU芯片路线图。该芯片融合GPU与NPU特性,支持CUDA兼容,并宣称可通过“一行代码”完成从英伟达GPU到国产芯片的模型迁移。
在架构设计上,公司采用prefill与decode分离策略:P芯片聚焦计算密集型任务,D芯片则优化访存密集型操作,以提升整体推理效率与性价比。
此外,GPNPU将通过多芯片协同构建“超节点”系统。2026年首发的第一代超节点P芯片,算力对标英伟达Hopper架构;2027年将推出首代超节点D芯片,主打超低时延推理,对标Blackwell架构;至2028年,第二代超节点D芯片计划对齐Rubin架构,并有望实现毫秒级推理延迟。
在全球AI从训练转向推理的关键窗口期,此类高能效、低成本专用芯片或将成为国产算力突围的核心支点。