得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估

物联网智库 2026-06-09 17:00
得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图1
得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图2
作者:彭昭(智次方创始人、云和资本联合创始合伙人)
物女皇:经验比数据稀缺
物联网智库 原创

这是我的第420篇专栏文章。

上一篇,我把端侧智能比作一台冰箱,并留下了一个悬念:这台冰箱面临两个硬约束,一个是算力与能耗,对应冰箱的“电力”;另一个是数据,对应冰箱的“食材”。我们聊了液态AI如何让冰箱“省电”(按需耗能),今天,我们接着聊那个更棘手的问题:食材从哪里来?

在此前的文章中,我曾下过一个判断:台积电用三十多年在芯片端筑起了护城河,大模型公司用三年在模型端挖出了护城河,而下一道天堑,很可能建在数据端。这一篇,我们就借着“冰箱”的比喻,进一步来拆解一下这场数据暗战的底层逻辑。

最近国内有两幕场景,值得关注。

一边,京东宣布要依托零售、物流等海量真实业务场景,构建具身智能数据采集中心。他们甚至计划发动六十万人,戴上自研的穿戴设备JoyEgoCam,将做家务、劳作的第一人称画面“即戴即采”,目标是两年攒下一千万小时数据。

另一边,以优必选Walker S2为代表的工业人形机器人,已成批进入新能源车企、3C产线与物流仓库,把工种收敛到搬运、分拣、质检。从比亚迪、富士康到顺丰,这份“进厂打工”的名单正越来越长。

一家电商巨头发动几十万人去记录真实生活,一批机器人住进工厂流水线边干活边攒数据。当下最聪明的钱,正在用最笨的办法,去弄一种买不到的东西。

为什么买不到?因为互联网这座“超市”里摆满的文字、图片和视频,本质上只是人类对世界的“旁观记录”。而要在物理世界里行动的机器人,需要的是第一人称的“交互反馈”,推门时的阻力、关节的角度、物理世界的实时回应。这种数据超市不卖,只能自己下地去种、亲手去摘。

这篇文章将重点探讨三个核心议题:具身智能数据为何存在根本性的稀缺,存量物联网为何是解决这一痛点的最佳数据源,以及在这条重塑的价值链中,谁将掌握真正的主导权。

见底的是经验,而非数据

把行业瓶颈笼统地归结为“缺数据”,其实是个误读。互联网上的数据近乎无穷无尽,真正见底的是另一种东西:经验

这可能正是当前产业界的误区之一,把具身数据等同于视频数据。

互联网视频是“观察者”视角的记述,而具身智能需要的是“第一人称”的多模态行动数据。

文本大模型汲取的是“知识”,具身大模型需要的是“经验”,而真正的经验,必须包含在物理世界中试错并被纠正的过程。比如,要让机器人学会擦桌子,就必须在真实的物理交互中,以极高的时间同步率,记录下视觉、力觉、关节位置与电机指令等多维传感轨迹。这些数据,互联网上根本没有现成可用的。

这一区分,把问题的性质从“数量不够”变成了“类型不对”,而类型的缺口,是靠钱填不平的。2025年,有超过60亿美元的狂热资本涌入人形机器人赛道,但根本性的瓶颈丝毫未变,更多的钱能买来顶级硬件、招来天才工程师,却变不出根本不存在的训练数据。

此前我算过一笔账,文本大模型的训练语料是以“百亿小时”计的,而当前全行业高质量的具身智能数据存量,大约只有50万小时。从50万到百亿,是一道两万倍的鸿沟。这里还有一个强烈反差:全球正在运行的工业机器人为466.4万台(截至2024年),但与庞大的硬件存量相比,公开可用于机器人学习的高质量真实交互数据,仍主要停留在百万级轨迹量级。以Open X-Embodiment为例,这一代表性开源机器人数据合集包含100万+真实机器人轨迹,已经聚合了多种机器人形态和任务数据;但相较于数百万台正在真实工厂、仓库和服务场景中运行的机器人,其可训练数据规模依然显得稀薄。

更要命的是,这道鸿沟不仅体现在“量”上,更体现在“维度”上。

机器人的数据感官至少是六维以上的,视觉、听觉、力觉、触觉、本体感知等。然而,目前产业界九成的精力,依然停留在RGB视觉这一两个维度上。巨头们费尽心思采集的所谓“机器人数据”,在感知维度上充其量只解决了十分之一的问题;剩下的力觉、触觉、本体感受,至今没有现成的规模化采集路径。症结从来不在于数据“多不多”,而在于数据“对不对”。

沿着这个判断继续往下看:既然“经验数据”只能由亲身作用于物理世界的实体来生产,那么此时此刻,究竟是什么东西已经大规模地镶嵌在物理世界中,并且正在不间断地感知与动作?

答案,指向了一个被长期低估的存在:物联网。

油田与炼厂:物联网的价值必将重估

工业现场的传感器、街头的摄像头、腕上的可穿戴设备、路上的智能汽车、产线上的机械臂……这些共同构成的庞大“存量物联网”,是当前唯一一张已经大规模铺进物理世界,并且在持续感知的网络。

此前我们谈论数据采集,目光多盯着那些专为采集而建的“数据工厂”与“训练场”;但实际上,还有一座更庞大、却一直未被当作数据资产看待的矿藏,那些早已为其他目的部署、此刻仍在日夜运转的存量设备。

得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图3

它们,天生就是经验数据的采集管道。这意味着,物联网的价值坐标可能需要被重新标定:它必须从过去主打“连接与降本”的成本中心,重估为具身智能提供数据燃料的利润中心

但在这里,我们必须先回应一个质疑:既然工厂里早就堆满了传感器数据,为什么机器人还是“吃不饱”?

答案很残酷:绝大多数存量数据根本不达标,它们彼此孤立、缺乏标注、模态间不同步,更没有与动作指令形成配对。粗略统计,当前行业数据的“良品率”只有约三成。成本的大头根本不在采集设备上,而在于标注、验证与技能的抽象化。谁能把良品率从三成推到七成,谁就握有两到三倍的成本优势。

所以,油田虽然遍地都是,但炼厂依然稀缺。真正核心的,是那座能把“传感器废气”提炼成“可训练燃料”的炼厂。开采只是第一步,原油如果不炼成燃料,就烧不进任何一台机器。

可能有些朋友会反驳:世界模型完全可以用仿真环境合成数据,物理采集不过是权宜之计。这条赛道的热度确实毋庸置疑,然而从仿真到现实的鸿沟,本质上是物理规律的鸿沟,而不是工程问题。

电网里一度电的微小电压波动、车间地面摩擦系数的细微差别、一块皮革表面的复杂纹理,都足以让仿真环境里跑得完美的算法,在现实中瞬间翻车。合成数据想要可信,前提是必须有真实数据替它做锚定与校准。因此,物联网采集的真实经验,永远不会被合成数据取代;相反,它会沉淀为整个合成数据范式赖以成立的“物理底座”。

同时,我们需要承认,今天大量的存量物联网设备,采集的依然是温度、电流、振动这类“低维遥测数据”,这并不是机器人最渴求的“高维接触数据”。真正能构成具身智能底座的,是正在快速铺开的高保真、多模态边缘网络,高清摄像头、高精度可穿戴设备、车载多维传感,以及被全面深度感知化的生产线。

而这,恰好与上一篇专栏的内容互为表里:边缘端在长出更省电的“大脑”的同时,也在长出更敏锐、更丰富的“感官”。冰箱在变节能,而孕育智能的物理土壤,也在变得愈发肥沃。

价值链正在反转:得场景者,得具身智能

看清了“燃料”的来路,价值的落脚点也就清晰了。拆解具身智能的资本金字塔:最上层是机器人本体厂商,已是一片红海;中间层是数据采集设备与平台,蓝海初现;最底层则是数据要素基础设施,由国家队主导,越往下根系越深。

而这个具身智能金字塔的驱动逻辑,是数据飞轮:在真实世界部署设备,采集交互数据,喂养并强化模型,进而推动更广泛、更深度的部署。

得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图4

这个飞轮指向了一个反直觉的结论:它天然偏爱那些已经握有物理场景的“存量玩家”,而非纯做本体的创业公司。

谁手里握有源源不断产生数据的真实场景,谁就握住了胜券;至于机器人本体造得漂不漂亮,反倒退居其次。就连老牌工业机器人厂商也直言,自己的制造业客户群能直接接触到真实工件与真实生产环境,这种“充满物理质感”的数据,正是纯软件出身的具身智能开发者最匮乏的资产。

数据飞轮的瓶颈从来不在传感器,而在数据的确权、流通与标准化。而这,正被作为国家级的工程强力推进。今年初,全国首单具身智能数据集就已在江苏省数据交易所完成场内交易,实现了该品类数交所交易“零的突破”;国家数据局也明确,今年我国将推出三十余项数据领域国家标准,并在智能体、具身智能等前沿方向提前布局。

未来,具身智能时代的胜负手,未必落在造出多漂亮的机器人或多惊艳的模型上,而是落在能否率先建成那套制度与工程底座,把庞大的存量物理世界,真正转化为可交易的数据燃料。

写在最后

近期我的两篇文章形成一个系列,上一篇解决“按需耗能”,这一篇解决“持续供粮”。具身智能真正的护城河既非本体,也非大脑,而是那片能自我造血的“物理底座”。当这些设备连成大网,数据与价值该按何种规则交换?谁来定规矩?这是接下来的问题。

大象要真正走进物理世界,难题从来不止算力和能耗;数据、规则与价值分配,才是下一轮更硬的考题。

得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图5得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图6

得场景者得具身智能:当数据成了物理AI的"矿权",物联网的价值必将重估图7

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 物联网
more
AI 泡沫里的硅谷:清醒的赌徒,与疯狂加倍的牌桌
滴滴率先接入微信 AI 生态,一键唤起叫车服务全程不跳转
商家对AI的焦虑,阿里妈妈《超级产品100问》给出了答案
库克的“告别秀”!苹果举行WWDC大会,Siri AI终于来了,国内用户还要“等等”
告别「人工智障」,全新Siri深夜炸场,苹果AI「换心」Gemini成功
头部企业扎堆,供应链新资源现场对接!EAI SHOW上海站展位火热抢订中
赛豆新品牌AIVA公布!阿维塔:“撞脸”是荣幸,但也鄙视抄袭模仿
苹果WWDC26汇总:从Siri开始用AI重构一切
最先把 AI OS 带给 14 亿人的,居然是微信?
世界杯还没开赛,多个AI已经预测出同一个冠军
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号