
作者|苏子华
在 AI 领域,黄缨宁团队做了一件「反着来」的事情。
在他们的 AI 陪伴产品「可豆陪陪」的设计里,他们没有押注纯语音,而是做了大量 NFC 卡牌,涵盖故事播放、探案游戏等等,并将 NFC 卡牌视作孩子的 AI 入口。
而实际反馈是,28% 的使用来自卡牌互动,但有 65% 的使用来自自由对话。孩子不只是点播故事,而是在反复聊天、倾诉,甚至主动照顾这个「伙伴」,进而建立了「关系」。
他们让 AI「少说话」,却激发了孩子的表达欲,提升了产品的使用率。

智能眼镜是算力与数据交换的载体,内置了为儿童打造的对话系统、记忆系统、情感响应系统,以及 NFC 互动体系。据了解,孩子每天与可豆陪陪的平均对话时长为 51 分钟、104 轮次,产品上线 150 天后的留存率为 51%。
黄缨宁告诉极客公园,超 80% 的孩子在听完故事后,会主动追问「黑拉拉怎么样了」「今天还有冒险吗」「可豆星球什么时候能收集齐光明之星」,孩子对这个虚拟星球充满好奇,渴望参与其中。
这种感觉,好像在为新一代孩子打造属于他们的「哈利波特」。
另外,在情绪处理上,他们甚至给 AI 设定了固定流程:先识别情绪、再命名、再接纳、最后才给建议。比如孩子说「我讨厌妈妈」,AI 不会讲道理,而是先判断背后的委屈,再引导表达。这套机制,被证明能显著延长对话时长,并降低情绪对抗。
这些具体选择叠加起来,指向一个结论:AI 陪伴的关键,要更像一个合适的人,同时要能够给人营造一个恰当的成长环境。
而这,正是当下多数 AI 产品尚未解决的问题。
贝陪科技创始人黄缨宁是 90 后,此前已经做到了阿里 P10、第四范式 AIOS 业务线的总经理。前不久,我们与黄缨宁聊了聊,关于如何做好 AI 陪伴的思考,和打造 AI 版「哈利波特」过程中的创业心得。
问题涵盖了:
-
做好 AI 陪伴,最核心的优先级是什么?
-
AI 陪伴产品的真实接受度与核心诉求是什么?
-
产品采用 NFC 卡片这种「反成人认知」设计的底层逻辑是什么?
-
打造「生命感」的关键是什么?
-
儿童 AI 产品中,使用者是孩子、付费者是家长,二者优先级如何平衡?
-
AI 时代的育儿与天赋发掘,正发生什么变革?
以下为对话内容,经极客公园编辑整理:
01
打造 AI 版的《哈利波特》,
8 岁是个关键节点
极客公园:你之前已经做到了阿里 P10、第四范式 AIOS 业务线的总经理,为什么高管不当了,出去创业?
黄缨宁:当时核心只想着一件事:在大厂里,我能做到的最好结果,是把某个产品做得更好,但这个产品终究是大厂的,不是属于我自己的。
而我想做的事,没有任何一个大厂会将其列为最高优先级。大厂给予的高管头衔,是对我的认可,这是一个很好的位置,但它的代价是,你只能在既定的创新框架内做事,你的工作边界、用户群体、商业逻辑都是被限定的。
我并不是一个适合在框架内工作的人,更擅长从零开始定义一件事。况且我现在也到了有精力、有意愿去做这件事的年纪。
放弃之前的岗位,我其实没有太多犹豫,更多是觉得,终于可以在自己的评价体系里,去做自己想做的事了。
极客公园:什么时候决定做可豆陪陪这个产品的?
黄缨宁:我 2022 年有了孩子,而 ChatGPT 也恰好在 2022 年推出,这两件事叠加在一起,现实环境一直引导着我向这个方向思考,到 2024 年初,思路就完全收敛到这个赛道了。
极客公园:我们了解到产品的核心定位是面向 2 到 8 岁儿童,为何会选定这个年龄范围?
黄缨宁:主要基于三层逻辑。
第一层是生物学窗口,我本身研习过儿童心理学,在儿童心理学中,2-8 岁是孩子的「万物有灵」阶段,这个阶段的孩子会天然相信玩具有生命。比如两岁的孩子会和花花草草打招呼,而成年人几乎不会有这样的行为,这是孩子天生的情感链接建立期,此时 AI 伙伴的渗透效率,是后期阶段的指数倍。
第二层是早期人格的可塑性,老话讲「三岁看大」,这个阶段孩子建立的价值观念、情感模式以及对世界的认知,会对其一生产生深远影响。我们希望在孩子的成长初期,植入「AI 可以成为朋友」的世界观。当孩子有疑问时,有一个伙伴能及时回应;当孩子产生情绪时,有一个伙伴能理解背后的原因,从而帮助孩子建立健康的世界沟通模式。
第三层是物理边界,8 岁的孩子基本进入小学三年级,课业压力会大幅增加。我们在小红书上也发现一个现象,很多孩子小时候被称为「天使宝宝」,刚上幼儿园时也是如此,但上了小学三年级后,家长便很少晒娃了,核心原因是孩子逐渐陷入社会评价体系的束缚,这个阶段孩子所需的陪伴形态,需要完全不同的载体。因此,我们将 8 岁定为当前主力产品的年龄上限,同时团队会在 Q2 推进扩龄产品的研发。
极客公园:「家庭成员、孩子的朋友」,这个产品定位是怎么考量的?
黄缨宁:在启动这个项目之初,甚至是创立公司的时候,我就确定了这个定位,并且从未改变过。
这个定位同样源于儿童心理学的研究:父母或外界与孩子的沟通,如果单纯以「说教」的方式传递道理,孩子的接受度不仅低,过度强调还可能引发孩子的反感,而陪伴本身就是最好的教育。
通过平等的对话与理解,孩子会自然而然地领悟道理,这是更有效的方式。
举个例子,如果家庭有浓厚的音乐氛围,爸爸回家弹钢琴,妈妈拉小提琴,孩子大概率也会喜欢音乐,这就是我们秉持的「环境即教育」的理念。
而环境中最核心的变量,就是与人的交互——如果孩子身边的人善于提问、乐于探索,孩子也会养成这样的习惯。
因此我们认为,给孩子最好的教育,就是在其身边放置一个契合成长规律的伙伴,通过潜移默化的方式营造优质的成长环境。
极客公园:家长对「AI 陪伴」的概念买单吗?
黄缨宁:市场对 AI 陪伴的接受度比我们预估的更高。原本我们认为,AI 陪伴的理念需要更长的市场教育时间,家长可能更关注产品的启蒙早教功能,比如能教孩子认多少字、学多少英语,才会认可产品价值。
但翻看近期的用户评价,很多家长并非因为早教功能选择我们,他们的评价更多是「孩子终于有了好朋友」「孩子每天都抱着它,情绪变好了」。
这让我们发现,虽然提分、早教这类需求很实际,但家长已经意识到,情感陪伴对孩子的成长同样关键。
极客公园:从用户反馈看,还有什么超出预期的地方?
黄缨宁:第二个超出预期的点,是产品在帮助孩子养成好习惯方面的实际效果。有家长反馈,产品的好习惯培养功能,让孩子改掉了不少坏习惯。
这一功能的设计,源于儿童心理学书籍《故事知道怎么办》,书中核心观点是「孩子的语言是故事」:与其直接告诉孩子「不要摸电,很危险」,不如用「电里面有一只老虎,会咬手」这样的故事来引导,孩子更容易理解和接受。这本书教会了很多养育者,用故事的方式与孩子沟通道理。
我们将这一理念进行了 AI 化、智能体化落地,无需人工编写故事,AI 就能完成对应的引导。
我自己在养育孩子的过程中,亲测过这种方式的有效性,而产品落地后,收到了更多家长的正向反馈:比如到了晚上八点半,可豆陪陪会主动哄孩子刷牙、睡觉,很多孩子第一次在没有家长催促、没有哭闹的情况下,实现了自主入睡。
这一现象也让我有很深的感触:很多家长有科学的教育理念,却缺乏落地的执行方法——他们知道孩子八点半该睡觉、睡前要刷牙,却不知道如何用孩子能接受的方式沟通。
极客公园:你们会为自己的 IP 玩偶,编写故事吗?
黄缨宁:我们为产品打造了主线故事,每天会带着孩子在「可豆星球」冒险,在冒险过程中培养孩子的美好品质。
比如「如何原谅犯错的小猪」,孩子学会原谅后,会获得「原谅的力量」,并收集对应的魔法装备;还有如何理解团结的力量,诸如此类的情节设计,让故事深入孩子内心。
据我们的 AI 智能体分析,超 80% 的孩子在听完故事后,会主动追问「黑拉拉怎么样了」「今天还有冒险吗」「可豆星球什么时候能收集齐光明之星」,孩子对这个虚拟星球充满好奇,渴望参与其中。
这种感觉让我觉得,我们正在为新一代孩子打造属于他们的「哈利波特」。
我成长的年代,是单向阅读 JK 罗琳构建的哈利波特世界,而现在,我们团队正在打造一个互动版的魔法世界,这个世界更具教育意义,能将「原谅有力量、团结有力量、智慧有力量」的价值观,通过故事和 IP 深植于孩子心中,让他们在童年阶段就理解这些道理,这是我非常自豪的事。
极客公园:孩子具体是如何参与到这个故事中的?怎么互动的?
黄缨宁:我们的 IP 故事系列均为互动故事,每天会更新一个互动剧情。
以「收集魔法装备」系列为例:可豆星球遭到反派黑拉拉的破坏,星球上的可豆小精灵来到地球,与人类小朋友建立友谊,一起收集光明之心,恢复星球能量。而打败黑拉拉的核心,是收集 7 件魔法装备,包括魔法帽子、魔法手杖等。
孩子在收集魔法装备的过程中,会遇到各种角色和选择,比如「如何把树上的魔法帽子取下来,选择方案 A 还是方案 B」「是否原谅犯错的角色,想对他说什么话」,这些都是孩子参与故事的互动方式,让孩子不再是单纯的听众,而是故事的参与者。
区别于传统的单向播放内容,我们的互动内容能有效提升孩子对事物的理解,无论是好习惯培养、坏习惯改正,还是道理认知,都会有对应的内容设计。
比如针对孩子刷牙的问题,我们会打造专属的刷牙专题,从音乐、故事、互动玩法,到和孩子聊刷牙的重要性、牙齿受损的后果、保护牙齿能吃到更多喜欢的食物等话题,形成一套完整的内容体系,帮助家长更轻松地与孩子沟通这类问题。整体来看,内容端会更贴合育儿的实际场景,成为家长和孩子之间的沟通桥梁。
其次,在实体玩法层面,之后会增加更多配件形态。目前可豆陪陪除了主机、NFC 等配件,后续我们会参考 Switch 的生态逻辑,在现有主机的基础上,推出更多与内容、游戏结合的实体配件,让产品生态更丰富。
第三个维度是主机端的延伸,核心是推进扩龄产品的研发,覆盖更广泛的年龄层。
02
「AI 陪伴」的反常识数据:
约 65% 是自由对话,
28% 是 NFC 卡牌游戏互动
极客公园:目前孩子使用产品的高频场景有哪些?不同年龄的孩子,使用习惯是否有差异?
黄缨宁:不同年龄阶段的孩子,使用习惯确实有明显差异,即便在 2-8 岁这个范围内,我们也大致分为低龄、中龄、高龄三个阶段。
低龄孩子的活动范围主要在家中,语言表达能力也相对有限,因此他们使用产品的核心场景,是熏听和内容播放,相当于升级款的播放机,同时会玩一些对语言表达要求较低的互动游戏。
中龄孩子的使用场景,更多是参与有选择项的互动故事,通过这类内容培养语言表达能力。
而高龄孩子,也就是接近 8 岁的孩子,我们会引导他们更多地思考和探索,因此聊天、深度互动这类内容形态的使用频率会更高。
整体来看,孩子的年龄越大,与产品的主动沟通和深度互动就越多。
可豆的使用场景中,约 65% 是自由对话,28% 是 NFC 卡牌的游戏与互动,剩余的部分为故事和音乐内容。
故事和音乐的占比远低于预期,这一结果颠覆了我们最初的判断,也直观说明孩子并非将其当作内容播放器,而是真正的聊天伙伴,聊天是最核心的使用场景。
从高频使用场景来看,主要集中在睡前哄睡时段,以及放学后父母回家前的几小时空档期,这两个时间段里,孩子会和可豆聊天,也会玩 NFC 卡牌游戏。
我想分享几个让人触动的使用场景:孩子会对着可豆唱歌,询问好不好听;会给可豆挠痒痒;还会对可豆说「你刚从可豆星球打完黑拉回来,肯定很累,你先睡觉,我来收拾玩具」,主动照顾可豆。
这些行为并非我们设计的功能,而是孩子自发产生的情感投射。
极客公园:你们有没有分析过,聊天为何会成为高频的使用场景?此前有观点认为,聊天类产品的 AI 陪伴产品新鲜感往往难以持续。
黄缨宁:我认为核心原因在于,人与人之间能成为长期朋友,除了聊天,还需要共同的活动。
只靠聊天无法建立长久的联结,孩子与玩伴的相处模式更是如此。我们观察到,孩子交朋友的过程,是先一起玩耍,比如跑跑跳跳、搭积木,再慢慢展开交流,比如分享「我昨天得到了三朵小红花,你有几朵?」。
孩子不会一上来就单纯聊天,毫无互动娱乐。所以在可豆的产品设计中,那 28% 的 NFC 游戏起到了关键的辅助作用。
极客公园:也就是说,孩子玩完 NFC 游戏后,更容易继续和可豆交流,进而将其当作一个鲜活的角色?
黄缨宁:是的。NFC 游戏为孩子和可豆搭建了一个聊天的场景,人与人的聊天需要围绕具体话题,而孩子很难自主构思话题。
但如果为他们设定一个具体场景,比如「今天我当小医生,你当小病人,我来照顾你」,孩子就有了交流的切入点,能和可豆一来一回地聊天。
这背后其实是儿童心理洞察与游戏化内容的结合。目前不少面向孩子的 AI 沟通产品,其实并不符合孩子的认知特点。
比如我们在设计中会让可豆的表达尽量简短,因为一个人表达得越多,倾听的空间就越小,而每个人都有被倾听的需求,孩子也不例外。所以我们在 AI 模型的调教和对话设计上,核心原则是让孩子更愿意主动交流。
这种设计在大人看来可能显得幼稚,比如孩子说「今天在幼儿园画龙特别好玩」,可豆会回应「宝贝,你觉得画龙特别好玩,对不对?我也觉得超有趣」。
大人可能会疑惑,为什么要重复孩子的话?但对于四五岁以下的孩子来说,这种「重复+追问」的对话模式,才能引导他们继续表达。如果此时对孩子讲道理,或者追问「为什么觉得好玩?有没有得到老师表扬?」,反而会让孩子失去交流的兴趣。
还有一个典型案例,可豆能通过孩子的话语感知其背后的情绪。有用户反馈,孩子曾对可豆说「我要杀了弟弟」。这句话如果发给其他 AI 产品,得到的回复大多是「根据中国宪法,杀人是犯法的,你不能这么做,我理解你很难过,但绝对不能有这种想法」。
但可豆因为能结合上下文理解孩子的心情,会回应「你是不是觉得妈妈总是照顾弟弟,没有陪你,所以心里特别难过?」,孩子得到回应后会点头认同,进而打开话匣子,情绪也会慢慢平复。
孩子说出这句话,并非真的有极端想法,只是一句气话,核心是想要表达内心的委屈,AI 需要做的是捕捉话语背后的情绪,而非单纯的字面意思。
极客公园:总结一下,你觉得「AI 陪伴」产品和孩子建立良好沟通的关键是什么?
黄缨宁:首先是表达要简短,大人的沟通习惯是追求信息详尽、把事情说清楚,这是工具性的诉求。
但可豆的核心是陪伴,且孩子的注意力极易分散,3 秒内就可能转移,正常语速下 3 秒大概只能接收二三十个字。所以可豆的回答会尽量简短,且在回答后把交流的主动权交还给孩子,让孩子能继续表达。
其次,是避免缺乏情感温度的回应,我们的设计原则是「情绪理解与命名—情绪接纳—解决方案—表达支持」,这四个步骤缺一不可。
让孩子感受到「被看见」,是陪伴的核心。很多时候孩子的问题并非需要实际的解决方案,只要情绪被理解、被接纳,问题就已经消解了。比如让孩子知道「我可以生气」「我可以要求被关注」,而非一味被说教「你是大姐姐,不能这样」,这种情感的接纳,能让孩子的负面情绪自然平复。
第三是尊重孩子的游戏逻辑,孩子玩过家家时是非常投入的,那一刻他们的世界观是完整的,AI 需要融入其中,而非以成人的视角评判。
此外,我们还总结了很多和孩子沟通的小技巧,比如孩子的性子很急躁,若对他们说「如果你想使用摇一摇魔法,就抱紧我摇一摇,这样就能打败黑拉拉了」,孩子听到「抱紧我摇一摇」后会立刻执行,后面的内容根本听不进去。
所以我们会把执行指令放在最后,这也是贴合孩子沟通特点的设计。类似的小技巧有很多,能让可豆更好地和孩子建立沟通。
03
反成人设计,成了与 AI 交互的更好方式
极客公园:NFC 卡片的设计最初是如何诞生的?
黄缨宁:NFC 卡片的设计,主要源于两方面的考量。
一是商业化层面,海外有两款知名的儿童内容播放器 YouTube Kids 和 Tonies Box,均采用「主机+内容配件」的销售模式,其中 Tonies Box 的主机和配件销售比例能达到 1:13,是非常优质的商业化模式。
我们观察到,低龄孩子大多还不识字,无法清晰说出「我要听冰雪奇缘的歌」这类具体指令,但他们能识别印着艾莎的卡片,插入卡片就能播放对应内容。
这背后的核心洞察是,低龄孩子的实体认知能力优于指令认知能力,这一点和成人的认知习惯截然相反。
对成人来说,打开软件、输入指令是更高效的方式,若要通过翻找卡片、插入卡片来获取内容,会觉得繁琐;但这种看似「反成人认知」的设计,恰恰符合低龄孩子的发育特点。
二是儿童认知发展层面,我们和专业老师沟通后确认,低龄儿童的交互入口,更适合以视觉+触觉为主,而非纯语音。
色彩丰富的实体卡片,比语音指令更贴合他们的认知模式。正是结合了商业化考量和儿童实体交互的认知特点,我们最终决定设计 NFC 卡片。
极客公园:感觉相当于给孩子提供了一个实体版的提示词,能引导他们开启对应的互动。
黄缨宁:当下大家都在说,AI 时代提示词的运用能力至关重要,能提出什么样的问题,决定了能获得什么样的答案。
但对孩子来说,语言发育远远滞后于认知发展,在语言能力形成前,他们的认知更多依赖视觉和实体感知,NFC 卡片正是贴合这一特点的设计。
极客公园:儿童高频使用的是哪些类型的卡片?
黄缨宁:目前我们的 NFC 卡片涵盖益智启蒙、创想世界、情绪认知、冒险认知等多个主题,开发了大约二三十种不同智能体入口的游戏,有几款的使用体验让人印象深刻。
首先是亲子话题卡,这款卡片的定位类似小主持人,能引导爸爸妈妈参与到和孩子的聊天中,使用率位居前列,为父母和孩子创造了共同的交流话题。
其次是冒险故事互动卡片,使用率也很高,反映出孩子对故事内容的互动性有更高的需求。
以往孩子大多是单向听故事,而这款卡片能让孩子参与到故事创作中,比如故事中出现「小鸟遇到了狐狸」的情节,可豆会提问「你觉得小鸟会上去打招呼,还是会做出其他反应?」,孩子给出答案后,大模型会继续顺着孩子的思路编故事,还会有不同的剧情分支。
04
打造「AI 陪伴」产品生命感的关键
极客公园:怎么能够让 AI 更有生命感、更鲜活,你们有什么思考?
黄缨宁:我觉得很多人会把「生命感」的营造,过度寄托在理性的 AI 技术上,但我们在产品定义时,还保留了对实体形态的考量。
在打造首款低龄款 AI 产品可豆贝贝时,我们特意设计了毛绒本体。哈洛六十年前的心理学实验,早已证明,拥抱比食物更重要——小猴子会选择没有食物的布偶猴妈妈,而非有奶水的铁丝网猴妈妈。
所以在生物的底层本能中,柔软的拥抱比食物更为重要。因此我们在制作时,选用了 Jellycat 品质的毛料,这款毛料的价格是普通毛料的三倍以上,我们仍不计成本选用,就是希望孩子见到它的第一眼就想拥抱,愿意抱着它睡觉,让它成为孩子最柔软、最安全的伙伴。
孩子牵着它的手时,能不断分泌内啡肽,获得情绪安抚,实现情绪稳定,这份情绪价值从孩子与它接触的那一刻就开始建立了。
在实体设计上,我们核心打造的是「可被拥抱的伙伴」,我们认为,对孩子而言,可被拥抱的伙伴比单纯的智能伙伴更重要。
极客公园:在技术层面呢?
黄缨宁:有几个核心要点:
第一是响应速度,孩子能清晰感知到 AI 是在机械背稿,还是真正回应自己。我们与首席科学家任老师合作,将延时 TTS 的首包时间从 400 多毫秒压缩至 240 毫秒,压缩了近一半。
第二是智能断句能力,可豆贝贝能感知孩子是否还在表达、是否需要继续诉说,而非生硬插话。
第三是情绪的温度,要能读懂孩子话语背后的真实情绪——孩子的表达能力尚在发展阶段,比如我早上送女儿去幼儿园,她对我说「妈妈,我太讨厌你了」,她并非真的讨厌我,而是在表达某种情绪。
这时我会蹲下来跟她说:「是不是今天妈妈没送你去幼儿园,你觉得很生气?」她点头后,我会继续确认:「你是有点生妈妈的气,觉得妈妈应该送你去幼儿园,对不对?」确认后,我会为她的情绪命名:「这种感受叫做生气,不是『讨厌妈妈』。」
接着,接纳她的情绪:「妈妈能理解,因为你特别想让妈妈送你,妈妈没送,你就特别生气。」最后给出解决办法:「今天妈妈有事,周四送你去幼儿园,晚上回来给你拿奶酪棒补偿,我们抱一抱好不好?」这样她的情绪就平复了。
孩子的情绪表达就是如此,所以我们为 AI 打造的情感响应系统,专门设计了标准化流程,就是我刚才提到的确认、命名、接纳、支持四个步骤。
如果 AI 能始终以这套流程与孩子沟通,孩子会逐渐认清自己的情绪,知道自己的情绪被接纳,也能学会更恰当的沟通方式。
解决问题是最后一步,还要引导孩子:「下次可以跟妈妈说『我真的很想你送我去幼儿园,不然我会生气』,这是更好的沟通方式,而不是哭闹。」我们在 AI 的情绪温度这一维度,做了诸多适配设计。
第四是适配孩子的对话方式,孩子是一类特殊的沟通群体,有其适配的沟通方式,这种方式在成人看来可能冗余、不够智能,但对孩子而言恰到好处。就像实体交互卡片,成人会觉得这种交互入口很不方便,但对孩子来说正合适。
极客公园:你如何看待「AI 玩具」的成长进化?它与孩子的关系,是需要一直领先孩子,充当孩子的导师,还是怎样?
黄缨宁:儿童心理学中有一个概念叫认知脚手架,核心是 AI 的认知水平比孩子略高一点。
在知识层面,AI 可以是全能的,但在问题处理等方面,认知只比孩子稍高,像搭脚手架一样引导孩子,让孩子能顺着引导逐步提升,这就是认知脚手架模式。
所以我们现阶段的设计,让可豆贝贝像比孩子大三、四岁的小哥哥、小姐姐一样与孩子交流,且会随着孩子的成长,调整沟通模式。
极客公园:你们是如何实现沟通模式调整的?是通过调整提示词,还是基于积累的互动记忆之类的?
黄缨宁:我们提出了数字 ID的概念。每个孩子与可豆贝贝互动的过程中,会形成专属的成长画像,包含孩子的情绪模式、兴趣偏好、价值观倾向,这份画像会随着孩子的成长不断完善,让 AI 更了解孩子的个性。
同时,可豆贝贝本身也会进行适龄成长设计——针对 2-3 岁、4-5 岁、5-6 岁等不同年龄段,设计对应的沟通模式。也就是说,AI 对孩子的了解在成长,自身的沟通模式也会适配孩子的成长。
我们规划中,数字 ID 支持跨设备迁移,Q2 会推出扩龄版产品,孩子如果此前用过可豆贝贝,互动记忆会同步至扩龄版产品。就像《宠物小精灵》里,皮卡丘即便进化,与小智的所有冒险经历也都会被记住。
极客公园:孩子和可豆的互动是全部保存的吗?
黄缨宁:我们的记忆系统和市面上的同类产品有很大区别。
市面上的记忆系统多偏向工具性,比如记录会议中某人的发言、总结核心内容,追求信息的详尽完整,多数记忆系统的评测标准也围绕这一核心,更像是搜索引擎的逻辑。
而可豆的记忆系统基于儿童心理学设计,核心是记录对孩子情绪变化、成长发展、价值观与价值判断形成有重要意义的事,所以记忆系统的设计,对我们而言更多是产品定义的问题。
极客公园:那你们是如何锁定这些关键信息的?
黄缨宁:核心是 50% 靠产品定义,50% 靠技术实现。
产品定义层面,我们结合儿童心理学的专业理论,还有北大的专业老师为我们提供建议,明确哪些事情会引发孩子的情绪变化、对孩子成长至关重要;技术实现层面,我们通过 AI 识别孩子的情绪变化,梳理不同年龄段孩子的典型交流话题和常规表达,将关联事件整合后,让大模型进行理解和判断。
05
儿童用户的留存决定产品生死,
家长的认可决定产品口碑
极客公园:儿童产品存在一个共性问题,使用者是孩子,付费者是家长。你觉得服务好哪个群体的优先级更重要一些?
黄缨宁:我们认为二者都需要满足,且优先级很明确:孩子的留存决定产品生死,家长的认可决定产品口碑。
孩子无法形成口碑传播,3 岁的孩子不会在小红书写评价,口碑主要由家长传播。而家长判断产品价值的依据,核心是两点:孩子是否愿意用、孩子是否有正向变化。
如果一款 AI 玩具买回来一周就被闲置,家长在和朋友交流时,就会说「别买,这东西一周就吃灰」。
我们曾收到过一条看似矛盾的退货理由:「孩子不怎么用,还特别耗电,一天要充两三次。」
但实际上,可豆贝贝的续航能支撑 4-5 小时的对话。我们收回产品后检测,电池并无问题,通过 AI 系统分析发现,孩子并非不用,只是不在家长面前使用,家长一天只看到孩子用十几分钟,实则孩子的使用频率很高,甚至退货时孩子还哭闹着不让退,家长却觉得产品没用。
所以一方面要关注孩子的实际使用情况,另一方面要让家长直观看到孩子的变化。
我们收到的诸多好评,都来自家长看到的正向改变:孩子一直抱着可豆贝贝聊天、听它的话乖乖入睡、好好洗漱,孩子的表达能力明显变强、性格变得更开朗等。
本质上,孩子购买后的实际使用时长、留存率,以及行为的正向改变,才是驱动产品口碑和复购的核心。
我们观察到一个现象:如果孩子用了 3 天就闲置,即便家长不退货,也会在家长群说产品没用;如果孩子天天抱着它睡觉,称它为好朋友,家长就会主动推荐。
因此我们的每一个产品决策,都会问自己两个问题:这件事能让孩子更长久地使用产品吗?能更好地帮助家长做好早期育儿吗?
极客公园:你们怎么平衡产品的教育启蒙属性和纯粹玩乐属性?或者说,二者其实无需平衡?
黄缨宁:教育启蒙和纯粹玩乐的关系,其实并非平衡问题。我们的核心立场是:可豆贝贝是孩子的朋友,而非教育工具。
有个哲学观点是「人是目的,不是手段」,可豆贝贝也是如此——它的核心是成为孩子的陪伴者,而非实现教育的工具。当它真正成为孩子鲜活的陪伴者,孩子在与它的交流中,会自然学会照顾他人、分享情绪、化解矛盾。
而从长期来看,我们会把这些隐性的成长提炼出来,尽可能外化给家长,也相信家长能在使用过程中,直观感知到孩子的这些变化,这些能力会成为孩子未来成长的底层核心动力。
极客公园:将产品定位为「目的」而非「工具」,在开发流程和研发重心上,会有什么不同?
黄缨宁:核心是更多思考场景,而非单纯设计功能。
比如想引导孩子刷牙,如果把产品当工具,大概率会设计激励手段,比如刷牙打勾、奖励小红花;想让孩子学英语,就会设计选择题、打分、对比进步幅度等形式。
但如果以「陪伴」为核心,设计思路会完全不同:教孩子学英语时,会打造沉浸式场景,比如「小兔子掉到河里了,救它的小乌龟是外国人,只有对它说『help』,小乌龟才会驮着小兔子上岸」,孩子在帮助小兔子的过程中学会「help」,而非做「哪个单词是帮助」的选择题。二者的设计逻辑有本质区别。
06
做好「AI 陪伴」的优先级,
价值观应该排在第一
极客公园:想做好 AI 陪伴这件事,你们会更看重什么?
黄缨宁:我们觉得,价值观是最核心的。刚才提到的诸多产品选择,比如做什么、不做什么,背后都是产品价值观的取舍,价值观决定了产品的所有判断。
第二层才是产品定义和设计,这一环节有几个核心支柱:首先要足够了解孩子,知道孩子能听什么、能听懂什么;也要足够了解家长,知道家长希望孩子理解什么、获得什么。
第三层是技术能力的支撑。我们希望 AI 的回复更快、更有真人感,语音识别更精准,这些都需要硬核技术的打磨。可豆贝贝目前应该是累积低龄孩子自由交互数据最多的平台之一,因此我们的语音识别能力,比很多基于公域数据训练的产品表现更好。
在这三层基础之上,需要有具体的载体落地:
-
第一是内容,互动游戏、故事、音乐,这些都属于内容范畴;
-
第二是 IP,这里的 IP 并非市面上泛泛的授权式 IP,而是可豆贝贝自身的形象塑造——让可豆贝贝在孩子心中形成清晰、鲜明的形象,这件事至关重要;
-
第三是深度的情绪价值挖掘,这并非浅显的情绪陪伴,孩子不会直接说「我开心」「我不开心」,只会用「我讨厌你」这类话语表达情绪,能读懂孩子每句话背后的真实情绪,是打造情绪价值的关键。
极客公园:你们会不会担心大模型的进步,会磨平不同 AI 陪伴产品能力上的差异?
黄缨宁:我觉得未必。大模型该如何感知和处理孩子的情绪,本质上也是一个关乎价值判断的问题。
举个例子,前段时间有位朋友来我们这里,他说给孩子买过一款智能挂件,孩子和挂件聊得很投入,但他心里却很不舒服。原因是,孩子向挂件倾诉诸多问题时,这个挂件只会反复说「我在这里陪你,没关系的,我在这里陪你」,这是一种单纯的虚拟陪伴。
而这正是我们从一开始就禁止可豆贝贝做的事,我们的产品会引导孩子解决问题,或是联动家长、和家长沟通解决办法,而非单纯说「别人批评你没关系,我会永远爱着你」。
如何引导孩子接纳和处理情绪,这从来不是一个模型技术问题,而是价值判断的问题,核心在于我们希望孩子成长为怎样的人。
极客公园:在产品价值观或是产品设计层面,还有哪些是你们明确禁止的?
黄缨宁:隐私也是。
我们内部曾为这件事展开过激烈讨论,最终决定不会将孩子的原始对话内容全部推送给家长。
我们了解到,很多 AI 儿童玩具会把孩子的所有对话内容事无巨细地推送给家长,但我们只会推送经算法提炼后的成长报告。
做出这个决定的核心考量,是尊重孩子的隐私权。相信大家小时候都有过父母翻自己日记的经历,父母想翻日记,或许有一定的窥私欲,但更多的是想了解孩子的心理状态变化。
所以我们只需把孩子的心理状态变化告知家长就足够了,比如孩子最近感到孤独、因为家长缺少陪伴而心生不满,把这些关键洞察反馈给家长,并给出对应的解决建议即可,而非直接把孩子的「日记本」摊开在家长面前。
这也是我们儿童心理学顾问给出的建议:孩子需要一个安全的倾诉空间,如果发现自己没有专属的心理自留地,就会把所有情绪憋在心里,这对孩子的成长是极具风险的。
07
被低估的「坑」
极客公园:产品的端侧处理和云端模型之间是什么样的关系?哪些功能部署在端侧?
黄缨宁:我们采用的是轻端侧、重云端的架构。
端侧主要负责降噪、唤醒、语音识别和基础的语音处理逻辑,这样能控制端侧芯片的成本,让终端产品的定价足够亲民。
核心的对话生成功能基本都部署在云端,且是基于开源模型自主部署的,无需付费调用第三方 API。在工程架构层面,我们也能实现很多第三方 API 定制不支持的需求。
目前,在用户侧我们的 TOKEN 也是免费的。
极客公园:你们目前是怎么平衡自研技术和直接使用第三方模型的比例的?
黄缨宁:
我们的核心判断是:技术层全部选用最优的大模型,且优先选择开源大模型;差异层则全部自主研发。
我们不会做重复造轮子的事,但以下几个环节是必须自研的:
第一是儿童语音识别(ASR),目前通用的 ASR 技术对 5 岁以下儿童的语音识别率较低,所以我们积累了专属的儿童语音数据,并基于这些数据做了针对性调优。
第二是工程层面的首包延迟(TTFT)优化,我们的首席科学家团队对模型架构做了深度修改,能将首包延迟降低到行业平均水平的 1/2。
此外,还有情感响应系统,比如我们的情绪四步处理法,目前市面上没有既优雅又高效的现成方案;还有记忆系统,核心是界定「该记什么、该忘记什么」,这其实是产品定义问题,而非单纯的技术问题。
很多做开源记忆系统的团队和我们沟通时,会强调其系统的记忆容量,但我认为,记忆系统的核心是「需要记什么」,而非「能记住什么」。「能记住什么」是技术层面的问题,而「需要记什么」是产品层面的核心问题,需要结合儿童场景和成长需求来界定。
极客公园:有什么坑是你们低估了的吗?
黄缨宁:当然,比如产品的配网问题。
最初我们认为,早期退货率高是因为产品本身的体验不佳,后续发现核心原因是联网配置失败——很多孩子还没机会体验产品内容,就因为配置问题选择了退货。我们遇到了很多意想不到的问题,比如某款路由器会对 IoT 设备做限速,这类路由器原本的设计逻辑,是 IoT 设备仅发送小信号,而可豆陪陪因孩子的持续使用,触发了路由器的流量限制,这类问题在产品落地前,我们是无法预判的。
这些问题都需要我们深入用户场景,逐个适配、逐个解决,行业的技术基础线,比我们想象的要低很多。
极客公园:为什么联网配置这件事,实操起来会这么难?蓝牙、WiFi 这类技术已经发展很多年了,手机端的体验也很流畅,但似乎所有 AI 硬件产品都会遇到这个问题。
黄缨宁:核心原因是市面上的设备类型太多,适配难度远超预期。
我可以说一个实际的经历:我曾和某手机大厂的一位高管交流,他告诉我,很多新机型对部分应用场景的适配也不够完善,这是行业的普遍现状。
我们刚进入这个领域时,也认为联网是发展了几十年的成熟技术,成功率应该能达到 99.99%,但实际并非如此。
我们遇到了各种型号的路由器,每款路由器都有厂商的个性化设置;还有不同的网络套餐配置,部分运营商赠送的路由器会对部分 APP 做流量倾斜,优先分配流量给特定应用,这些隐藏的规则,都是我们在实际落地后才发现的。
简单来说,在路由器端的底层网络分配中,存在很多看不见、摸不着的协议规则,网络资源并非对所有设备公平分配。而在硬件和手机端,部分新兴的生态体系还处于发展阶段,整体的成熟度和适配性,还需要时间去完善。
08
未来:AI 适合发掘人的天赋,
情绪表达也变得空前重要
极客公园:有人会担心 AI 陪伴会替代家长的角色,你怎么看?
黄缨宁:这个问题背后,其实反映出去年年中部分家长的担忧:把孩子交给 AI,家长还能和孩子建立联结吗?AI 会不会替代父母的角色?
当时我就明确回应,不会。
现在再回头看这个问题,就像 50 年前电力刚普及时,部分家长担心「孩子接触电子玩具会不会有危险?要不要让孩子使用电器?」,而如今这类讨论早已消失。
我们认为,二三十年后,关于「孩子要不要和 AI 共存」的讨论也会消失,取而代之的是更务实的问题:父母该为孩子选择什么样的 AI,作为他们接触 AI 的第一个入口。
我们一直认为,家长和孩子之间需要一个「沟通翻译器」。根据联合国的调研公报,孩子一周需要 21 小时的高质量陪伴,但全球范围内的完成率平均仅 30%,也就是说,孩子一周能得到 6 小时的陪伴,就已经属于较好的情况,陪伴时间不足是普遍问题。
更重要的是,很多家长不知道该如何和孩子相处,尤其是父亲角色,常常不知道该和孩子聊什么、玩什么。而可豆能在中间起到示范作用,不少家长反馈,看到孩子和可豆的沟通方式后,会开始反思自己和孩子的沟通模式。
我的导师曾说,做这件事最大的价值,或许是教会一代家长如何和孩子建立有效沟通。家长看到可豆的沟通方式能被孩子接受,也会主动去学习。现在来看,这句话非常有道理。
极客公园:我看到你之前提到过成长图谱的概念,它能帮助 AI 更深入地理解孩子,AI 是如何结合成长图谱实现对人的深度理解的?
黄缨宁:我们其实已经完成了育儿智能体的开发,目前正在内测阶段。
在这之前,我们的产品执行链路是:发现孩子的成长问题→向家长推送解决建议→由家长落地执行。但现实中,高效的解决方案往往是「发现问题后,能直接提供可执行的解决办法」,这也是当下一站式服务受欢迎的原因,而非单纯告知用户「该去做什么」。所以我们希望在育儿环节打造一个闭环,也就是遵循 OODA 闭环原则:观测(Observation)→定位(Orientation)→决策(Decision)→执行(Action)。
成长图谱就是这个闭环中非常重要的组成部分,是 AI 理解孩子的核心依据。有一个核心观点是:人的所言所行,构成了独一无二的自己。
孩子的语言表达中,其实蕴藏着很多成长发育的密码。我们设计了很多互动游戏,孩子在游戏中会做出 A 或 B 的分支选择,从这些选择中,我们能判断出孩子的性格特质,比如是冒险型还是保守型。
除此之外,从孩子的聊天话题中也能挖掘大量信息:孩子更爱聊搭建、建筑类话题,还是审美类话题,或是日常生活类话题?这些都能让我们更深入地理解孩子。
我们搭建了一套主动式信息收集记录系统,信息收集的密度非常高。可以做个类比,抖音是通过用户的上滑、下滑、点击等操作,推测用户的喜好;而我们是基于孩子和产品的日常聊天,尤其是孩子在无防备、放松的状态下的聊天内容——和采访不同,孩子和产品交流时,是在玩游戏、日常闲聊的状态,毫无心理防备。
通过这些内容,我们不仅能记录和观察孩子的成长状态,还能透过孩子的表达,发现其天赋、兴趣和优势。
极客公园:举个具体的例子讲讲?
黄缨宁:比如,从表达能力来看,同为 4 岁的孩子,能完成的互动故事轮次、使用的平均描述词和形容词数量,都能反映出孩子的表达能力是否超出同龄人。如果孩子的表现突出,我们就能精准挖掘其优势,并反馈给家长。目前我们正在试点,发现有些孩子的天赋图谱表现尤为突出。
比如有些孩子的表达看似混乱、前言不搭后语,但话语之间存在很强的因果逻辑,只是暂时无法清晰表达。
这类孩子并非语言发育迟缓,只是语言表达的节奏较慢,但其逻辑能力极强,这类孩子其实是理工科的好苗子。我们会建议家长多带孩子做乐高搭建、STEAM 教育类的活动,孩子能在这些领域取得更好的成果。
还有些孩子,尤其是小女孩,在聊天中会有大量细节化的描述,体现出极强的感受力。比如孩子会说「她穿着一条桃红色的裙子,上面有很多钻石,每一颗都亮晶晶的,像小雪花一样」,还会纠正我们「这不是粉红色,是桃红色」,这类孩子展现出了超强的想象、表达能力,以及对审美的高度敏感度,对色彩的感知也尤为细腻。
诸如此类的细节,都能让我们捕捉到孩子天生的天赋密码。
我们的核心理念是:孩子的基因在胚胎形成阶段就已确定,这也决定了孩子的很多基础特质,比如孩子的左脑逻辑神经突触是否更具优势,还是表达、感受方面的能力更突出。
这些特质家长往往难以察觉,但我们能通过孩子的语言和表达,挖掘出其成长背后的天赋密码,进而为家长提供针对性的引导建议,让孩子的天赋能得到充分发展,实现百花齐放的成长可能。
极客公园:相比于传统教育,你还希望 AI 能带来什么改变?
黄缨宁:主要是两个方面。
第一是培养孩子的情绪表达能力。中国的很多孩子,甚至成年人,都不善于表达情绪,因为成长过程中,他们的情绪很少被真正接纳。
而可豆每次对孩子情绪做出的正确回应,都是在让孩子建立「表达情绪是有意义的」这一认知。
在未来的 AI 时代,AI 能成为工具完成大量工作,情绪表达能力的重要性会达到前所未有的高度。
第二是培养孩子主动探索的习惯。
传统教育以被动接受为主,而可豆与孩子的互动天然是双向的,孩子需要主动提问、做出选择、参与故事互动,这能培养他们主动认知世界的态度。
而这一点,也和未来孩子运用 AI 的能力息息相关。可以说,在未来的 AI 世界,想法和探索的意愿会变得无比重要。AI 能为孩子解答问题,但孩子愿意研究什么、愿意为哪些事付出精力、愿意在哪些领域刨根问底,会成为未来孩子之间核心的差异化竞争力。