WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快

AI科技评论 2025-07-26 17:44
资讯配图


会自我学习自我生长的大模型。



作者丨郭海惟

编辑丨陈彩娴

资讯配图

Rock是石头,石头是这个世界最基本的组成元素,坚硬、基础、随处可见。

RockAI希望成为智能世界的石头。

资讯配图

01

离线智能

AI科技评论了解,在发布的18个月里,已经有量产设备搭载了Yan的大模型能力,这让这个以非Transformer路线著称的大模型建设者,一跃成为端侧智能中不可忽视的重要玩家。

如果打开官网,你第一眼就会看见醒目的一行大字,那是它给自己定义的使命:“让世界上每一台设备拥有自己的智能”。RockAI联合创始人邹佳思对AI科技评论说,这句话里其实有两个关键词,“每一台设备”和“自己的”。

前者意味着一个更高兼容能力、成本更友好、能力更普惠的设备,而后者则意味着一个拥有自主进化能力、不断生长的、可以广泛交互协作智能终端。

这不仅意味着RockAI在走一条非Transformer的智能岔路,也在走一条并不激进推高智能上限的技术小径。

但邹佳思不同意这是一条小径。

“端侧是一个庞大的市场”,他说,“这是世界上绝大部分人都需要的智能”。这不仅是因为,这是一个发展中国家人口主导的世界,它意味着也是因为人与智能的关系是需要体面的。

这种体面的方式之一就是离线的智能体。离线是端侧的潜台词,这意味着它只属于用户本人,不会将用户的数据上传到某个庞大冰冷轰鸣又陌生的服务器里,而只躺在用户最熟悉的被卡通硅胶壳包裹的手机里,拉丝金属制成的电脑里。

端侧很难,离线很难,但只端侧离线又是不够的。

小路也是路,是路就必须走。

邹佳思说,从1.3发布以来,干的最多的一件事情:踩坑。踩技术的坑,踩场景的坑——Yan落地量产设备量是这么来的,Yan 2.0 Preview也是这么来的。

自从1.3发布以来,不断有人问:2.0什么时候来?为什么还不来?如果来了,会长什么样?

RockAI选择在WAIC交出一个初步的答案:

Yan 2.0 Preview

这符合RockAI一贯以来的谦逊,Yan 2.0 Preview是这家公司的第四代产品,在此之前是1.01.21.3。他们拒绝像Transformer社区等科技世界常见的那样,将性能提升作为每一代产品的差异。

然而,这其实是RockAI目前最接近自己使命的一个产品。邹佳思对AI科技评论说,Yan 2.0 Preview有两个提升。

一个是视觉感知能力的跃升。

他们针对视频模态进行稀疏取帧,降低视觉信息的时序冗余,再通过视觉编码器对选取视频帧进行逐帧编码,生成视觉Token。用Token Merge(ToME)策略来降低视觉Token之间的语义冗余进而减少视觉Token序列长度

邹佳思表示,这让Yan 2.0 Preview可以拥有比1.3更加连贯的视频理解能力,“过去只是看图,而现在真的能看视频了”。

但更加重磅的是基于训推同步的自主学习能力。

RockAI通过可微的记忆模块来实现信息的存储、检索和遗忘。在这种架构下,记忆可以不断更新。尤其是通过创新机制实现了记忆强度的动态调节:既能通过门控式更新保留长期依赖,又能基于输入分布特性灵活整合新知识。这让Yan 2.0 Preview可以像生物大脑一样,不断忘记不重要的事情,留下重要的。

过去,训推同步往往是与大模型一体机相伴相生的,但RockAI决定将训推同步的概念下放到个人的端侧设备上。这种尝试,在外界看来,或许显得有些疯狂——因为这个概念之前没人做,也没被太多应用端从业者认真思考过,所以即便将产品做出来,它将如何被应用也是个待明确的问题。

据邹佳思透露,RockAI在和一些玩具公司做初步的探索。比如和一些国际头部玩具公司探讨能够自主学习的AI玩具,孩子可以对自己的玩具说话、下指令,而玩具会自己学习成长,从而成为属于孩子自己的独一无二的精神伴侣。

“我们把Preview版本放出来,也是希望看到更多上下游的需求”,邹佳思说,“我们绝对相信它有广阔的应用空间。”而广阔的空间,意味着它绝对不仅仅只在玩具场景得到使用。

如果说1.0是文本模型,1.3是具有图片与音频能力的多模态能力,那么2.0将成为一个能看懂视频、能自主学习、实现实时人机交互的全新智能底座。

资讯配图

02

场景、场景,还是场景

“踩技术的坑”,只是RockAI过去一年两大“年度工作总结”中的一个。而比技术的坑更大的,则是“场景的坑”。

场景很难,邹佳思对AI科技评论说,演示和落地之间存在鸿沟,量产化落地难上加难

假如说,Yan1.2部署在树莓派可以算得上一个写在公司手册里的里程碑事件。那么Yan1.3发布后,公司拿到了出海头部硬件公司的订单,则又算得上是业务里程的一大步。

邹佳思至今都记得,当合作伙伴把搭载着Yan1.3能力的PC拿给海外经销商的时候,合作伙伴的震动与兴奋。甚至一些实力雄厚的“巨头”友商代表,都专门到展台前面询问离线端侧功能是怎么实现的。

断网其实是一件比很多人想象得更重要的事情。

“离线端侧大模型在海外的需求是非常旺盛的”,邹佳思对AI科技评论表示,只是其中很多需求还没有获得最佳的解决方案。

首先,对于出海的硬件企业来说,海外关于信息安全的政策环境是很多样的。端侧可以规避大量信息传输、上云带来的政策风险与合规成本。

“海外对隐私的话题是非常敏感的”,邹佳思表示,“不同国家对个人信息保护的法律和审查都是不同的,如果要上传数据,便意味着主机厂需要去层层过关每一个国家的法律和监管体系。”

更不用说海外复杂的网络环境。

目前全球主要人口都是生活在第三世界国家,其中生活在农村的人口又远多于城市的人口。一份国际电信联盟2022年的调查数据显示,欧洲和北美国家,80%90%的人口使用互联网,而在阿拉伯国家和亚太国家这个数字降低至三分之二。而在非洲,互联网人口的比例则进一步降低至40%,而最不发达国家和内陆发展中国家的互联网覆盖率仅为36%。城乡差异也是如此,根据上述报告,即便在资源集中的城市,全球只有82%的城市居民可以在家上网,但这一比例竟然是农村的1.8倍。

而这份报告中涉及的只是网络覆盖率,尚没有涉及更加复杂的网络质量和网络资费等问题。

RockAI的愿景是“每一台设备”,不是“每一台欧美设备”或者“每一台中国设备”,也不是“每一台城市设备”,而是不加定语的“每一台设备”。

“很多设备连NPU、甚至GPU都没有,只有CPU,你要如何把大模型放进去?目前只有RockAI能做到。”邹佳思表示。

从某种程度上来说,未来一些海外用户接触的第一个AI大模型产品,或许就会是Yan

这也大概也是Yan 2.0 Preview合作伙伴的经销商们,会对一个AIPC产品惊讶的原因之一。

“他们没见过这种产品”,邹佳思说,“不用网络,直接就能在中低端CPU级设备上跑的AI产品,他们没见过。”

资讯配图

为了量产项目,RockAI投入了很多的资源,或许这不能叫投入,而是一场技术投资,这可能源于RockAI一种另辟蹊径的市场哲学:

“标杆战略”。

RockAI一直都被认为是一个不喜欢跟随BenchMark的公司。“我们会去测一些榜单,但不会打榜”,邹佳思说,公司并不是完全排斥榜单,只是对一些榜单的价值和意义确实有过一些怀疑。但未来团队会做去选择一些严肃的榜单参与,让外界更直观看到YAN的成果。

可即便如此,“也不会将重点放在这里”,邹佳思表示,因为RockAI是一个着重场景落地的团队,因此公司的业务逻辑是做“标杆”。

“就像ARM与德州仪器、诺基亚的关系——德州仪器把那时名不见经传的ARM推荐给了诺基亚,说希望在小型机上试一试。ARM花了很大的力气去说服诺基亚,最后诺基亚高管点头了,于是成就了诺基亚当年的手机霸主地位,也成就了今天的ARM。”邹佳思说。

RockAI或许没有奢望一个像诺基亚那样性感的贵人,邹佳思对标杆的期待就是一个跑通的、大家都能看见的、能被交付到用户手里的场景。

团队对潜在的标杆很重视。邹佳思回忆自己之所以能拿下头部公司的端侧设备订单,部分因为他们是唯一带了真实样机去客户公司展示的团队。

“一个见面前2周临时买的酷睿i5的小盒子,麦克风和显示器都是现场接的,折腾了十多分钟”,邹佳思说那个场景至今在他脑海里,“其实现场挺乱的”,他说,“但是其他厂家都带着PPT,只有我们带了真机样品直接开始演示。”团队甚至没有来得及好好介绍自己,对方已经有合作的意向了,缓过神来才问:

“你们公司啥时候成立的?”

虽然RockAI是这家头部公司接触最晚的,却是最终拿下合作的。于是才有了开头,那些激动的海外经销商和刺探情报的巨头友商。

榜单可能可以刷分,但用户是诚实的,商业订单也是。设备量产是RockAI的起点,也是YAN生态的一个起点。

资讯配图

03

留在牌桌上

没有人会怀疑,RockAI是在跟巨人作战。就像大卫面对歌利亚,当年手里也拿着这么几块石头。大卫用甩石机,让石头在手中形成一个小而有力的“飞轮”。

当然,YANTransformer社区之间并不是你死我活的关系,它们更像是一条河与大海的潮水竞速。

但对于一个闭源为主的大模型生态,节奏是很关键的。因为它既要做底座,也要做应用;既要做上层交互,又要做底层适配。要在技术与场景之间反复“踩坑”。

邹佳思说,RockAI在过去一年时间里,团队已经扩张到了近一百人,绝大部分都是研发。

对于一个商业公司来说,所谓节奏的含义,无非就是,哪些快,哪些慢;哪些抓紧,哪些放弃。

邹佳思不愿意将自己称为“闭源”大模型,他说RockAI会有自己的开源节奏,有些可能暂时没那么快披露,但他们已经对部分核心合作伙伴开源。比如芯片厂商,共享代码会大幅降低YAN落地的磨合成本。

有些事情RockAI是确实暂缓不做的,比如“生图”。邹佳思认为,设备端的主体诉求在感知、决策和行动这三个方面。

“就跟人一样”,邹佳思说,“人脑也不会直接输出图像,而只是转而使用工具,YAN其实也一样。”

而有些更远景的事情,暂不落地但却是行业趋势,邹佳思给RockAI的要求,则是要“留在牌桌上”。

在邹佳思看来,机器人就是一个场景在未来,但YAN要争取“留在牌桌上”的赛道。邹佳思认为,Yan天然是可以探索去跟机器人结合的架构。因为Yan不做生成,主要做以感知和认知为主的多模态能力。而在实验中,RockAI发现,以Yan为主的架构已经能实现部分轨迹复刻的能力了。

“我们这次在展台上放了一个灵巧手,可以玩游戏”,邹佳思说,“也有机器狗可以学习人的动作。”

RockAI的构想里,它将成为一个横跨上至无人机,下至机器人机器人、大到手机电脑这样的核心消费算力设备、小到智能眼镜、陪伴玩具等探索型低算力设备,每一台设备都成为

Yan的算力网络中的一部分,共同构成“群体智能”的未来世界途径——

谁说小石头不能成高山呢?

资讯配图
资讯配图
//

推荐阅读

资讯配图

离开优必选的日子


资讯配图

腾讯 Robotics X 无战事

资讯配图

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
「AI 罗永浩」带货爆卖 5500 万后,百度又发布了更强的数字人技术 | WAIC2025
就在今天!星逻智能邀您共赴2025 WAIC世界人工智能大会
广汽高域GOVY AirCab首台样机香港交付
文献速递 | 14 名 BrainGate 临床试验参与者的皮层内微电极阵列的长期表现
非Transformer架构落地之王,带着离线智能和原生记忆能力在上海WAIC浮出水面
直击WAIC:萝卜快跑入选「国家队」,AI数字人技术升级,百度全栈自研杀疯了
全能高手&科学明星,上海AI实验室开源发布『书生』科学多模态大模型Intern-S1 | WAIC 2025
字节跳动AIGC全栈战争:一场120亿美元的“算力炼金术”,正在重写中国AI秩序
摩尔线程技术分享日干货!打造“AI超级工厂”、原生支持FP8、DeepSeek R1推理加速150%
炉边对话 | 施密特与沈向洋议AI:靠竞争谋发展,靠合作守底线
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号