黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国

量子位 2026-03-30 10:35
henry 发自 凹非寺
量子位 | 公众号 QbitAI

还记得Hugging Face去年推出的桌面机器人Reachy Mini吗?

在刚发布的时候,量子位曾第一时间报道过这只身高28cm、体重1.5kg的“萌物”

而在过去的大半年的时间里,这款桌面开源机器人已经交出了一份颇为亮眼的成绩单:

5天销售额突破100万美元、累计出货3000台以上,甚至还登上了黄仁勋的CES展台

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图1

也正因如此,很多人第一次意识到——

那个被称为“AI圈GitHub”的平台,正在把开源哲学真正带进具身智能世界。

不过,很少有人注意到,在这款299美元起售的小机器人背后,还有一家中国公司参与了关键一环。

它就是矽递科技(SeeedStudio),Reachy Mini正是由它打造。

作为一家开源硬件平台,矽递并不是像宇树那样做整机产品的机器人公司,也不是主打某一款人形机器人的厂商。

它在具身智能产业链里的角色,更像是一个硬件系统平台型公司

一方面深度参与英伟达Jetson计算平台生态,是英伟达的精英级合作伙伴;

另一方面,它也提供机器人大脑主控方案、电机关节、传感器以及一系列开源机器人套件,服务于开发者与初创团队。

换句话说,当Hugging Face从模型平台走向机器人硬件、当开源社区开始尝试“软硬结合”,像矽递这样的公司,正在成为连接模型、硬件与开发者生态的重要节点。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图2

而在与矽递科技AI机器人产品线的对话中,量子位也从一个少见的机器人硬件制造商视角,听到了他们对具身智能产业的观察与判断:

以下是与来自矽递的吴丹(机器人产品线负责人)和朱耀晖(机器人产品线应用工程师)的采访实录(在不改变原意的基础上,有删改):

Reachy Mini、开源硬件、制造商眼中的具身智能

Reachy Mini是什么?

Q:如何给一个就是不了解机器人去介绍Reachy Mini,它是一个怎样的一台机器人?目前最核心和最典型的能力是什么?

吴丹:Reachy Mini是一个高度开放的桌面的机器人。

它具备完整的多模态交互能力:搭载摄像头和麦克风,可以“看见”和“听见”,同时支持语音输出与用户对话。

此外,它拥有九轴运动能力,头部能够做出动作反馈,通过姿态变化表达状态与情绪,使互动更加自然生动。

如果向一个不做机器人的人介绍Reachy Mini,我会说它是一个可以放在桌面上、与大家互动的机器人,带有一定娱乐和陪伴属性。

同时,因为它是开源开放的平台,支持二次开发,所以应用场景会不断扩展。

另外,对于不做机器人,但了解大模型的(开发者)来说,Reachy Mini的核心能力依然是多模态交互。

它能够听、看、说,实现视觉、语音与动作的结合。同时,它可以连接Hugging Face上的各类大模型,支持灵活调用,也适合做智能体(Agent)开发,比如通过OpenClaw等方式接入。

所以,即使不是做传统机器人的开发者,对于算法工程师或偏软件背景的开发者来说,它同样是一个比较合适的平台。

Q:具体而言,Reachy Mini是怎么进行交互的呢?

朱耀晖:Reachy Mini目前有两个版本。

一个是不带主控的版本,用户可以把它接入自己的笔记本电脑,或者连接到外部主控设备,比如Jetson、树莓派,或者RK、地平线等芯片平台,然后基于这些设备进行开发,或者体验它原有的功能。

另外一个是无线版本,内部自带主控,采用的是树莓派方案,开机之后就可以直接使用,不需要额外连接设备。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图3

关于定位:AI陪伴产品与具身智能载体并不冲突

Q:作为一个一款桌面机器人,Reachy Mini更应该被理解为一个AI+陪伴产品,还是一个具身智能的载体,你们更倾向于哪一种定位?

吴丹:我觉得它目前更偏向于一个具身智能的载体。因为它本身是一个开放平台,核心是用来构建多模态机器人系统的,所以从定位上来说,它更适合做开发。

不过,它现有的功能里确实也包含一部分陪伴属性。所以我觉得这两点并不冲突。只是因为它的开发属性更强,对于开发者来说,它更像是一个具身智能的平台。

但从用户层面来看,也有很多家庭用户购买。比如有家长反馈,8岁的小朋友都可以自己把它搭建起来,并且玩得很好。对他们来说,它更像是一个陪伴型产品。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图4

所以我认为这两种定位是同时存在的。

如果用户只是希望有一个陪伴型机器人,那它现有的功能已经足够;如果是开发者想基于它去做智能体(Agent)或其他扩展开发,它也提供了充足的资源支持。

Q:做陪伴型机器人通常会强调情绪价值,外观也往往比较可爱。那Reachy Mini在设计和制造时,是否有特别考虑外形和“萌感”?

吴丹:有的。比如它的“大小眼”设计,就是一个比较萌的元素。另外,它头上的两个触角——也就是天线——是可以动的,这也是一个增强可爱感的小细节。

还有它下面那个圆圆的“大肚子”,整体设计其实就是从比较萌的方向出发的。

另外,因为它是开源的,用户是可以自己改动外观的。比如换颜色,或者做一些造型上的改造。之前PollenRobotics在万圣节时,就把它改造成南瓜的样子;

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图5

圣诞节的时候,也可以做成圣诞树的造型。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图6

所以一方面,它本身的设计就比较可爱;另一方面,它也很容易被二次改造。只要通过3D打印,就可以对外观进行个性化调整。

Q:如果我买一台Reachy Mini,想通过3D打印给它做一些外观配件,官方会提供相关教程或社区支持吗?

朱耀晖:会的。我们后续会持续补充相关内容。它本身就会提供3D打印的设计文件,用户可以基于这些文件进行打印和改造。我们也会在社区里逐步增加更多教程和设计示例,方便大家上手。

Q:现在也有很多桌面AI产品,比如带屏音箱、智能助手设备,它们同样能提供陪伴体验,但并不会把自己定义为“机器人”。为什么你们还是选择机器人这种形态?在形态设计上,最重要的取舍是什么?

吴丹:这个问题其实PollenRobotics(Reachy Mini的设计团队,被Hugging Face收购)团队之前也谈到过。

他们认为,我们已经被各种屏幕高度包围——iPad、手机、电脑,几乎无处不在。

这些设备里其实都已经有智能助手,但整体还是停留在“屏幕交互”层面,缺乏真正的参与感。

相比之下,机器人形态能带来更强的互动体验。比如Reachy Mini里有一个emoji功能,当你触发不同表情时,它会通过转动脑袋、摆动触角、配合声音做出反馈。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图7图源:推特网友Trtd6Trtd

这种结合动作和声音的表达,会让人感觉它在“回应你”,而不仅仅是屏幕上的一个界面变化。

所以我觉得,这是人与技术之间互动方式的一种变化。PollenRobotics希望打造的是一种更有参与感、更具互动性、也更人性化的形态。

他们认为,一个迷你机器人的形态,不仅要有吸引力,还要能够传递信任感和好奇心,同时带一点亲和、可爱的特质。某种程度上,它是在技术感和亲和力之间做了一个平衡。

Q:它现在眼睛、头部都可以活动,相比一般的桌面AI终端,可能会更耗电。那这款产品是需要一直插电使用,还是支持充电、无线使用?

吴丹:我们刚刚提到,它有两个版本。

其中一个版本是不带主控的,需要接外部设备,比如Jetson或者用户自己的电脑。这个版本是需要插电使用的。

另一个是无线版本,内部自带主控和电池,可以摆脱电源线,独立运行,不需要一直插电。

Q:有用户在社交平台分享,说买回Reachy Mini之后需要自己DIY拼装、下载模型、部署环境。对很多非技术背景的人来说,这听起来门槛不低。你们是如何在“可玩性”和“易用性”之间做平衡的?

吴丹:这个问题其实也和Reachy Mini设计的初衷有关。它最开始希望面向的是那些想探索开源机器人、尤其是希望尝试把Agent智能体模型集成到机器人里的用户。所以它既要有可开发性,也要兼顾娱乐和日常使用。

在易用性方面,其实我们做了很多优化。

用户收到产品后,会发现安装说明书非常详细,整个组装时间大概在2到3个小时左右,而且大部分结构已经预装完成,真正需要自己动手的部分并不复杂。

我之前提到过,8岁的小朋友都可以完成拼装,所以整体难度并不高。某种程度上,它反而成为一个很好的亲子互动或者朋友一起动手的过程。

另外,在软件层面,它也提供了很多“开箱即用”的应用。

安装完成之后,会有一个可视化UI界面,用户可以直接点击体验。Hugging Face和PollenRobotics也已经准备了不少示例应用和教程,帮助用户快速上手。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图8

至于可玩性,如果是开发者用户,我们也非常欢迎他们深度参与。

比如可以接入OpenClaw,做成语音助手;也可以接入Home Assistant,变成家庭智能家居的管理入口。

这样一来,Reachy Mini就不仅仅是一个桌面机器人,而是可以融入家庭或办公场景。

像在今年CES上,黄仁勋演讲中Hugging Face展示的一些Demo,比如,询问Reachy Mini计划,Reachy Mini 可以根据看到的计划表,再通过语音或者本地界面发给用户,这类能力都可以通过多模态大模型接入进来。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图9

所以我们希望它既能让普通用户轻松体验,也能给开发者足够空间去发挥。它的可玩性,其实来自于这些开放接口和多模态能力的结合。

它是可以融入到家庭或者是办公的一些场景的,结合的技术点会非常的多,就是刚刚提到的OpenClaw多模态的大模型、大语言模型,还有Home Assistant智能家居的系统。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图10

Q:它既然可以融入家庭场景,那重量怎么样?无线版本可以随手拎着走吗?

朱耀晖:它其实不重,不像市面上一些人形机器人那样需要固定摆放,是可以移动的。

大概相当于一台笔记本电脑的重量。它的外壳大部分是塑料件,内部只有少量金属结构和舵机组件,所以整体不会太重。基本上单手就可以拿起来,无线版本也可以随手移动。

桌面机器人制造中的难点

Q:像Reachy Mini这种桌面级小机器人,在制造过程中面临的挑战是什么?未来优化方向在哪里?

朱耀辉:Reachy Mini这种小型桌面机器人,挑战和大型人形机器人不完全一样,其中一个非常复杂的挑战其实来自声学设计。

因为它在执行动作时,多个电机会同时运转,舵机齿轮啮合会产生明显机械噪声。而它又是一台需要和人对话的机器人,麦克风阵列必须在运动状态下仍然保持清晰拾音。

所以我们和Hugging Face以及PollenRobotics一起,通过反复声学实验,从结构设计到算法层面做了联合优化,提升整体降噪能力和音频表现。

最终在我们自研的ReSpeaker麦克风阵列上实现了更稳定清晰的语音体验。这个麦克风阵列本身就带有降噪算法,再结合结构减振和算法滤波,才解决了“边动边听”的问题。这其实是桌面交互机器人非常核心的难点。

另外一个现实问题是算力和网络依赖。Reachy Mini本身需要联网来调用大模型。即便使用类似树莓派这样的本地计算平台,如果要调用云端模型,网络环境依然很重要。

所以我们也在探索边缘部署的可能性,比如基于NVIDIA平台做本地推理优化,让部分能力能够在边缘侧完成,从而降低延迟和对网络的依赖。

Q:我有一个比较基础的问题。语音模型到底是怎么运作的?是我说一段话,它完整听完再反馈吗?如果很多人在同时说话,它能区分指令吗?敲门声这种非语言声音它会不会误识别?它是怎么处理这些情况的?

朱耀晖:语音识别系统其实做了多层过滤。在嘈杂环境中,它会通过算法提取“概率最高”的那个人声信号,也就是主说话人的语音,然后尽量排除背景干扰,比如多人说话、环境噪声、敲门声等。

我们在声学实验室做了大量噪声测试,包括环境噪声测试和机器人自身运动噪声测试。Reachy Mini在运动时,舵机齿轮啮合声是最大的挑战,因为那是持续、结构性噪声,会干扰语音识别。

这个问题一开始确实影响很大,后来通过不断结构优化、算法调校和降噪策略叠加,才打磨出现在这个版本的声学效果。

Q:如果说话快慢不同,它能跟得上节奏吗?输出延迟有没有专门优化?

朱耀晖:这个和所用的大模型有关。它可以切换不同模型。

有些模型参数大、推理时间长,响应自然就慢一些;有些模型是轻量级的,响应速度很快,但准确率可能稍微低一点。

比如切换到国内一些小参数模型,输出会非常快,但理解能力可能不如大模型强。这本质上是速度与准确率之间的权衡。

它可以自行切换模型,包括国产模型和开源模型,都可以部署。

具身智能开发,少即是多

Q:现在不少机器人厂商会做类似“应用商店”的平台,用户可以直接下载动作或功能。相比那些能翻跟头、跑跳的人形机器人,Reachy Mini自由度相对有限。在动作能力不那么“炫酷”的情况下,你们如何发挥它的优势,创造不同的玩法?

吴丹:您提到的那些能完成复杂动作的人形机器人,确实越来越强大,看起来也很震撼。但从开发者学习和入门的角度来说,我反而觉得“少即是多”。

很多复杂动作,其实是通过精细编排的动作序列实现的,它们更偏向运动控制和硬件能力的展示。

而Reachy Mini,包括我们之前在Hugging Face上推动的一些机器人项目,更强调端到端的学习和执行能力,让机器人结合大模型去完成交互和决策。

如果在Reachy Mini上增加手、腿或者底盘结构,系统复杂度、开发成本和售价都会显著提升。

它现在的定位,是希望以相对可负担的价格,让更多人不管年龄、职业或技术背景都能接触具身智能。如果走向高复杂度的人形形态,价格可能会上万,那就偏离了它降低门槛的初衷。

当然,它目前的形态确实不能翻跟头、不能行走,但通过舵机驱动的头部和触角动作,已经可以完成大部分情绪表达和互动体验。

当然底盘和手,你想加的话也可以。但是基于它现在的一个产品的一个形态,我觉得它大部分的交互体验已经可以完成。

对于学习机器人原理、做软件和智能体开发来说,这样的复杂度是足够的。更高的复杂度,往往意味着更高的成本和更高的门槛。

市面上那些能跑能跳的人形机器人,核心在于运动控制能力,强调电机性能、步态算法和动作编排的流畅度。

而Reachy Mini更偏向让用户体验大模型、Agent,以及像OpenClaw这样的能力接入。

未来它更多是融入家庭或办公场景,比如接入智能家居系统,做陪伴或管理功能。所以我们更强调软件和应用层面的开发,而不是极限运动能力。

另外,关于类似“应用商店”的模式,Reachy Mini其实也在做。Hugging Face已经提供了一个类似应用市场的界面,用户可以直接下载并部署现成的功能。

社区的用户开发完一定的功能以后,也能上传到Hugging Face的社区。用户点击下载,就可以直接体验到其他人开发这个功能。

低成本机器人的分水岭不在价格,在可达性

Q:现在越来越多团队在做低成本、开源机器人,包括一些几百到一万元以内的小型四足或人形机器人。你们怎么看“低成本”的分水岭?是价格、能力、生态,还是使用门槛?未来随着人形机器人越来越便宜,像Reachy Mini这种桌面机器人会如何定位和发展?

吴丹:低成本真正的分水岭不只是价格,而是“可达性”(accessible)。

如果希望具身智能真正发展,首先要让机器人更容易被接触、被使用。当然,价格低是一个重要前提,但它不是唯一标准。

早期阶段,最关键的是开发者能否真正用起来。平台是否易于开发、足够开放、具有灵活性,这些都比单一价格更重要。

如果只是价格低,但系统封闭、扩展性差、交互能力单一,那很难吸引更多创新力量加入。相反,如果平台足够开放,就可以吸引更多人参与,一起推动行业生态的繁荣。

以Reachy Mini为例,它虽然是桌面形态,但具备扩展能力,比如可以加底盘、加手臂;在软件层面,也可以持续接入新的模型和能力。这种软硬件上的扩展性,会带来更长期的生命力。

从行业趋势来看,我认为机器人价格一定会越来越有竞争力。随着供应链成熟、规模化量产,以及前期试错逐渐完成,很多技术会趋向标准化,成本自然会下降。

但在现阶段拉开差距的,更多是开发友好程度和生态完整度。Reachy Mini作为一个全开源产品,在这方面是有优势的。

另外,PollenRobotics也一直强调,一个“好看”或者“动作炫酷”的机器人远远不够。

即使价格不错,如果缺乏可用性和用户基础,会面临很多挑战。因为具身智能最早的一批用户一定是开发者,他们会把机器人真正带到工厂、家庭或商业场景中。所以产品是否对开发者友好、是否容易落地,比单纯展示能力更重要。

同时,社区的力量非常关键。这也是我们坚持开源的原因。用户不仅可以基于它开发自己的应用,还可以在社区中交流、共享成果。这样产品才会不断进化,成为生产力。

Q:我这样理解对不对——如果一个机器人很贵,买的人少,开发者基数也小,那作为用户,可能就看不到太多技术文档或新的玩法分享;反过来,如果机器人便宜,买的人多,社区活跃,我就能从更大的用户基数中受益。可以这么理解吗?

吴丹:这个理解不完全准确。

价格高,确实会阻碍一部分人购买。不是每个人都能负担十万元级别的机器人,这一点是现实问题。

但价格低,本身并不是决定性分水岭。因为如果一个产品只是便宜,却不开放。文档不完整、软硬件生态封闭、二次开发不方便,那开发者其实也很难基于它做创新。

所以关键不只是便宜,而是开发体验要足够好。要开放、可拓展,让开发者真正愿意用它、改它、分享成果。

简单来说,光便宜还不够,还需要开放性和扩展性。只有这样,社区才会自然成长,生态才会形成正循环。

开源机器人最大的价值,是降低参与门槛

Q:Reachy Mini是一个非常开源的机器人,那么在你们看来,开源对机器人社区,尤其是具身智能社区,最大的价值是什么?

吴丹:我觉得开源机器人最大的价值,是降低参与门槛

具身智能仍然是一个非常新的领域。虽然现在越来越多的机器人开始标准化、量产化,但它的发展依然高度依赖更多人参与实验、验证想法、不断迭代和创新。这种开放式的参与,本身就是推动领域进步的重要力量。

在矽递,我们整个AI机器人产品线都秉承这个理念——让具身智能的开发门槛更低。这个“门槛低”体现在几个方面。

首先是产品层面。我们提供多种类型、经过工程师严选和验证的产品方案,让开发者可以直接在可靠基础上开发,从而缩短研发周期。

其次是时间成本。开发者不需要从零开始踩坑,可以站在已经验证过的硬件和系统之上,把精力集中在创新本身。

再者是价格。具身智能除了比较贵的工业机器人,还要有大众能够接受的、价格相对可接近的机器人。

另外还有教育资源。我们提供教程和课程,让不同技术背景的人都可以参与进来。

像Reachy Mini,或者Hugging Face在LeRobot框架下的一系列机器人,其实让开发者、研究者、学生能够完整理解从硬件到软件再到AI模型的整个技术栈。它提升了透明度和可复现性,也加快了创新节奏。

比如Reachy Mini,从组装那一刻起,你就能看到它的控制单元、感知单元、推理单元。你不仅理解“它能做什么”,而是理解“它是怎么做出来的”。

开发者可以在示例模型基础上接入自己的模型,或者接入其他先进模型,真正体验完整的技术栈。

同时,在我们CEO潘昊以及Matthieu Lapeyre(PollenRoboticsCEO)之前的访谈中也强调过,Reachy Mini的设计理念就是开放和简洁。

它采用白色外壳设计,方便快速个性化改造;软件栈与Hugging Face深度集成,开发者只需要几行Python代码就可以部署AI应用。甚至随着工具的进步,很多时候通过更高层级的接口,就能完成部署。

Q:对于做大模型的人来说,他们会说开源在某种程度上和企业利润是有冲突的。那回到机器人领域,做开源会不会和盈利产生矛盾?如果你把东西开源了,大家觉得是“免费的”,那企业怎么赚钱?

吴丹:首先,开源并不等于没有商业模式。

在开源机器人中,零部件清单是公开透明的,大家大概知道成本结构。但企业之间仍然存在供应链能力的差异,包括成本控制能力、规模化能力和整合能力。

同时,像Reachy Mini这样的产品,本质上并不是一个“只为盈利”的产品。它的首要目标是让更多开发者参与进来,建立社区,而不是赚一波钱就结束。

当然,它也不能长期亏损。任何产品都需要一个可持续的模式。但Reachy Mini的优先级排序,不是“利润最大化”,而是“生态构建优先”。

我们Seeed也是一家开源硬件公司,我们很理解Hugging Face做开源机器人的初衷。我们很多产品,包括图纸和PCB,都是开源的。

我们的想法是:通过开放、验证过的方案,帮助初创公司或个人团队节省前期开发成本。等他们基于我们的方案做出了产品,进入量产阶段,自然会回来寻找我们合作量产。

也就是说,开源不是终点,而是一个生态入口。社区用户在我们平台上创新,最终又反哺企业,形成长期合作关系。这是我们一直坚持的方式。

制造商眼中的具身智能

Q:你们觉得机器人硬件未来会像PC一样走向标准化吗?还是会根据不同场景、不同任务,发展出很多不同形态?

吴丹:我觉得这两种趋势会同时发生。

因为这个行业现在仍然处于非常早期的阶段。在这个阶段,比起急着完全标准化,更重要的是保持开放,降低门槛,让更多开发者进入这个领域。

随着生态逐步成熟,技术栈中的底层模块一定会趋向标准化和模块化。比如语音识别、感知算法、算力平台,以及更稳定可靠的基础模型,这些都会慢慢形成通用模块。

在矽递,我们也是从整体系统架构的角度来推荐产品方案,从感知、控制到推理,构成一个完整技术栈。底层模块未来一定会越来越标准化。

在应用层面,产品形态一定会保持多样化。因为场景差异非常大。学校、家庭、医院、办公环境,每个场景的任务目标、交互方式、物理空间都不同,对机器人结构和系统设计的要求自然也不同。

我觉得Reachy Mini作为一个开放的平台,就是也是为了承载这些应用去设计的,而开发者可以在一个共享的一个基础上进行实验构建,并且探索不同的具身智能的一个场景,这个平台从软件到硬件都是可以共享的。

Q:那我追问一个问题,就是咱们现在最主要的这个场景是什么呢?

吴丹:现在最主要的还是语音交互。

用户可以直接和它对话。同时,它可以结合视觉能力,比如让它描述它面前看到的东西,然后围绕这个视觉信息继续对话。

我们也在尝试让它接入更复杂的能力,比如类似OpenClaw这样的系统,让它在对话中不仅能回答问题,还能帮你生成内容,甚至触发具体动作,比如执行某个指令。

所以,目前主要是桌面场景,尤其是在办公环境中,就是放在桌面上进行交互。

Q:对于硬件制造商而言,什么样的具身智能demo是好的?如何定义一个好的任务?

吴丹:在我看来,一个好的Demo,首先必须是稳定、实时、可互动的

就是它的互动是不是流畅的?他是不是稳定去运行的?稳定就代表着说他是不是就做了一个这个动作,以后就不能复现了?

第二,它不只是展示技术或硬件实力,而是要让开发者能够基于这个Demo继续延伸

我并不认为只展示极限运动或复杂动作就是“好的机器人”。其交互能力、感知能力、理解能力,以及视觉、语音和关节协调响应能力是更重要的。

我们也和PollenRobotics讨论过这个问题。他们的观点是:真正重要的不是“机器人翻了一个跟头”,而是人们是否理解它是怎么翻起来的。

如果你只是看到一个炫技动作,但完全不知道系统如何运作,也不知道如何控制或停止它,那这种体验反而会带来距离感,甚至不安全感。没有人愿意面对一个不可控、不可理解的机器。

安全性和可控性是非常重要的。比如我们在机械臂设计中,会加入悬停或紧急停止按钮,让人始终拥有控制权。这种设计本身就是一种信任构建。对于人形机器人来说,这种安全考量就更加关键。

这也是为什么Reachy Mini的组装过程很重要。你不是只看到它做可爱的动作,而是亲手参与搭建,理解它的结构和原理。当你知道背后发生了什么,再去看它完成一个任务,那种感受是不一样的。

我认为,一个好的演示只是起点。通过亲自动手搭建机器人,用户不仅能够亲眼见证它如何出色地完成任务,更能深入理解其背后的运行原理。这个从动手实践到获得反馈的过程,还会自然地建立起人与机器之间的信任感,增加互动的深度。这种体验,远比单纯观看演示更有意义。

数据范式如何定义硬件

Q:现在很多人说具身智能硬件已经OK了,软件还不行?你们怎么看这种观点?

吴丹:在硬件的角度,我们一直在随着算法更新。

在机器人上,硬件和算法非常重要,但算法前期需要数据积累,所以现在大量的遥操作,其实本质上是在为算法铺路。很多规模化的数据工厂正在建立,专门做数据采集。遥操其实是算法训练阶段的一部分,而数采非常重要。

同时,因为数据非常重要,也出现了专门为数据采集设计的硬件,而随着数据越来越多,模型也会越来越稳健。

这就是我们制造商对模型的看法,对于硬件本身来说,我们不能只关注性能和成本,还必须考虑与数据需求和训练框架的适配性。

比如我们刚刚推出的一款全开源六轴机械臂(Seeed reBot-DevArm),它是电机版本的,已经适配了Hugging Face的LeRobot框架。这样它就可以更自然地融入标准化的数据采集和训练流程。

黄仁勋也站台的抱抱脸机器人卖爆了,背后公司竟来自中国图11

这其实也是硬件标准化的一部分。随着模型和数据格式逐渐趋于标准,硬件接口也会向这种标准靠拢。

另外,现在不仅是真实数据重要,仿真数据也越来越关键。例如英伟达GR00T这样的基础模型,就融合了多种数据来源:真实采集数据、仿真数据以及视频数据。多源数据融合能让模型更稳健。

所以在矽递这边,我们也会支持类似Isaac Sim这样的仿真生态。

让开发者既可以在真实环境中用我们的设备做数据采集,也可以在仿真环境中做规模化训练和测试。

然后所以就整体来说,我觉得硬件制造商要更注重开放性和接口设计,然后以及生态的兼容性,应该确保对数据和模型的一个这样的需求。

整体来说,数据和模型它肯定是分不开的,两者互相决定。

Q:我还是有一个困惑。之前很多论文都提到,不同硬件采集出来的数据是不一样的,还涉及跨本体的问题。你刚刚说硬件会越来越标准化,数据也会更容易共享。但另一方面,硬件形态又会很多样。那多样性和标准化怎么同时成立?我有点没理解这个过程。

朱耀晖:多样性其实就像采集数据集,它是想从a点搬运到b点人为遥操的时候,这个人的行为习惯和下一个人的行为习惯可能是不一样的,这就是它的多样性。

就像网上的一些数据,是不同形态的机械臂或者机器人,它们做一些动作的时候,它其实是不一样的路径或者风格,这就是多样性。

那么标准化其实就是说他们把这数据集采集到本地电脑上,实实在在能看到的数据格式,大家都会统一这样一个标准。

就是说我可以用我的算法直接训练你的数据集,而不需要再去进行一个一层转换,这就是标准化。

然后就像现在Hugging Face推出那个LeRobot那个框架,他们就是把所有的一些硬件接口、数据接口进行了标准化。

松灵、OpenArm等开源硬件,只要接口符合规范,就可以直接接入生态。

在数据集层面,Hugging Face也推出了统一规范版本的LeRobot4.0的数据集格式。开发者可以把自己的数据转换成这个标准格式,然后就能直接在不同硬件上部署或训练,这就打通了所有的硬件软件层面的差别,这就是他们的标准化做的一个非常大的贡献。

所以多样性是数据轨迹和姿态层面的差异,而标准化是数据格式统一,大家可以直接使用,不需要转换。

Q:具身智能中分工和全栈哪个更有未来?基于数据范式出现的专门制作数据的公司意味着什么

吴丹:我个人认为,这两种形态都会存在。

全栈公司通常是围绕自己的产品去做的。比如做医疗机器人,它是直接面向行业的解决方案,那一定要对医疗领域有一个自己的解决方案。

但同时,我也认为一定会有分工的流水线。比如专门做某些场景数据的团队,会做医疗、家庭等特定场景的数据采集。

刚刚你提到的数采类数据,和真正用于训练的机器人数据其实还是有区别的。

比如光轮智能,他们就是专门做仿真数据的。

仿真数据的优势在于,在保证精度的同时更容易获得。因为不是所有团队都有条件用硬件去做大规模真实采集,真实数据采集非常耗时,人力成本也很高。

我刚刚也提到,像一些大模型,比如英伟达的GR00T这一类,它们通常会融合不同来源的数据:真实场景数据、仿真数据,还有视频数据。不同数据类型结合在一起,效果会更好。

所以我觉得未来一定会出现这种分工流水线,类似模块化,比如做数据的公司专门就做数据,这个环节本身就在加速整个具身智能的开发。

但对于全栈公司来说,就要看它是不是只聚焦某一个落地场景。如果是单一场景,比如只做医院或者零售,它就需要对那个场景有非常深入的理解,这种情况下,全栈是有优势的。

而在模块化、流水线层面,通过分工和标准化数据,是可以实现整体加速的。

Q:所以可以理解为,在模型训练端会需要不同的数据“配方”,包括仿真数据、真实数据、视频数据等;对应到产业层面,就会出现专门的数据工厂负责采集或生成这些数据,从而形成更明确的分工,加速行业发展。而对于一些需要强场景落地的公司,它们会更倾向于围绕特定场景构建自己的数据体系。是这样吗?

吴丹:(是的)

Q:过去一年具身智能融资和项目大量出现,几乎每天都有新公司冒出来。很多人说2025年是量产元年,那我们现在到底处在一个什么时间节点?今年会出现怎样的发展?

吴丹:我觉得它仍然是一个早期阶段,但是今年我相信一定会看到越来越多的参考设计出现。

你刚刚提到2025年是量产元年,我觉得这意味着行业已经进入从概念走向方向逐步清晰的过渡阶段,它已经不再只是停留在概念阶段。

所以我认为,越来越多的参考设计会依托于社区和行业的发展出现。

社区里、行业里会有更多公司开始认真做产品。但这个行业一定还会有变化,所以我觉得无论是我们制造商,还是作为硬件平台,都要保持一个长期视角,去接受早期开发者这个阶段的状态。

我们刚刚也聊到模块化。模块化会越来越趋向标准化。我觉得现在正是建立产品化能力和模块化能力的关键时期。

包括我们自己产品的一些开源设计,比如机械臂、灵巧手、主控设计、感知模块选型等。同时我们也要加强成本优化、量产能力以及生态协作。

生态协作就是刚刚提到的,我们如何更高效地和模型结合,如何和机器人生态,比如像ROS这样的生态去结合。我觉得从社区、硬件到软件的同时加速,最终是为了推动商业化,加速商业化。

Q:那回到你们公司本身,你们在具身智能生态里处在一个什么位置?

吴丹:我觉得我们在具身智能的开发者生态里面,是一个比较有特点的平台。

首先从产品线来说,刚刚也提到,我们是从整个机器人系统的角度去给大家提供产品。

在主控,也就是机器人最重要的“大脑”层面,我们是英伟达的精英级合作伙伴。

同时,在英伟达的开发者生态里我们也非常活跃。我们有很多课程、教程,也提供开发者一键部署的能力。所以整体来说,我们是一个比较新兴、先进,而且非常活跃、对开发者友好的平台。

在机器人方向上,我们也提供了很多新的内容。比如像LeRobot这样的框架,很多早期想接触具身智能的开发者都会知道。它在GitHub上已经有两万多星,是一个影响力很大的开源框架。

我们在这个生态里推出了很多配套的套件、教程和产品,让开发者可以更快上手。

所以对于早期想进入具身智能领域的开发者来说,矽递是一个能够提供比较完整产品体系和完整教程支持的平台。

我们不会简单用“市场占有率”或者“单一产品做得最好”来定义自己。矽递本身是一家开源硬件公司。在AI机器人这条产品线上,我们的核心目标是降低具身智能的开发门槛。

在这一点上,我认为我们做得是比较好的。我们在开发者生态里足够活跃,也在持续给大家带来新的、有趣的、可实践的开发内容。

Q:那最后一个问题,什么是开源硬件?

吴丹简单来说,开源硬件就是用户可以基于开放的硬件和软件层来学习和二次开发。

在矽递,我们的使命是让科技随手可得。我们专注于为全球创客、开发者及科学家等创新者提供边缘AI、机器人及智能传感器系统等新兴技术, 赋能每一位创新者实现数字化转型。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
机器人
more
机器人视觉企业斩获船舶行业近2亿元订单;无框电机上市公司2025年订单突破12万台 | 市场观察
手残党跪了,Pi 0.6机器人15分钟学会拧螺丝,能进厂边干边学了
别再只盯着AI和机器人了,这条暗线才决定未来
从新能源车到具身机器人,卧龙电驱再遇老对手汇川技术
智元机器人万台通用具身机器人下线,人形机器人迈入规模化部署新纪元
雷军晒小米机器人灵巧手/支付宝 iPhone 门禁卡上线/苹果折叠屏12月发布
中国具身智能机器人企业名单(排名不分先后)
超30家机器人产业链企业获融资,单笔最高约20亿元,2月“吸金王”是谁?
杭州智能展现“量子理疗”机器人,涉事企业回应科学性质疑
Seeds | 法奥机器人完成近1亿美元C轮融资
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号