前阿里 90 后 P10 ，要造 AI 世代的「哈利波特」，而入口是一张 NFC 卡片

一个好的「AI 陪伴」产品该长什么样？

作者｜苏子华

编辑｜郑玄

在 AI 领域，黄缨宁团队做了一件「反着来」的事情。

在他们的 AI 陪伴产品「可豆陪陪」的设计里，他们没有押注纯语音，而是做了大量 NFC 卡牌，涵盖故事播放、探案游戏等等，并将 NFC 卡牌视作孩子的 AI 入口。

而实际反馈是，28% 的使用来自卡牌互动，但有 65% 的使用来自自由对话。孩子不只是点播故事，而是在反复聊天、倾诉，甚至主动照顾这个「伙伴」，进而建立了「关系」。

他们让 AI「少说话」，却激发了孩子的表达欲，提升了产品的使用率。

前阿里 90 后 P10 ，要造 AI 世代的「哈利波特」，而入口是一张 NFC 卡片图2

智能眼镜是算力与数据交换的载体，内置了为儿童打造的对话系统、记忆系统、情感响应系统，以及 NFC 互动体系。据了解，孩子每天与可豆陪陪的平均对话时长为 51 分钟、104 轮次，产品上线 150 天后的留存率为 51%。

黄缨宁告诉极客公园，超 80% 的孩子在听完故事后，会主动追问「黑拉拉怎么样了」「今天还有冒险吗」「可豆星球什么时候能收集齐光明之星」，孩子对这个虚拟星球充满好奇，渴望参与其中。

这种感觉，好像在为新一代孩子打造属于他们的「哈利波特」。

另外，在情绪处理上，他们甚至给 AI 设定了固定流程：先识别情绪、再命名、再接纳、最后才给建议。比如孩子说「我讨厌妈妈」，AI 不会讲道理，而是先判断背后的委屈，再引导表达。这套机制，被证明能显著延长对话时长，并降低情绪对抗。

这些具体选择叠加起来，指向一个结论：AI 陪伴的关键，要更像一个合适的人，同时要能够给人营造一个恰当的成长环境。

而这，正是当下多数 AI 产品尚未解决的问题。

贝陪科技创始人黄缨宁是 90 后，此前已经做到了阿里 P10、第四范式 AIOS 业务线的总经理。前不久，我们与黄缨宁聊了聊，关于如何做好 AI 陪伴的思考，和打造 AI 版「哈利波特」过程中的创业心得。

问题涵盖了：

做好 AI 陪伴，最核心的优先级是什么？
AI 陪伴产品的真实接受度与核心诉求是什么？
产品采用 NFC 卡片这种「反成人认知」设计的底层逻辑是什么？
打造「生命感」的关键是什么？
儿童 AI 产品中，使用者是孩子、付费者是家长，二者优先级如何平衡？
AI 时代的育儿与天赋发掘，正发生什么变革？

以下为对话内容，经极客公园编辑整理：

打造 AI 版的《哈利波特》，

8 岁是个关键节点

极客公园：你之前已经做到了阿里 P10、第四范式 AIOS 业务线的总经理，为什么高管不当了，出去创业？

黄缨宁：当时核心只想着一件事：在大厂里，我能做到的最好结果，是把某个产品做得更好，但这个产品终究是大厂的，不是属于我自己的。

而我想做的事，没有任何一个大厂会将其列为最高优先级。大厂给予的高管头衔，是对我的认可，这是一个很好的位置，但它的代价是，你只能在既定的创新框架内做事，你的工作边界、用户群体、商业逻辑都是被限定的。

我并不是一个适合在框架内工作的人，更擅长从零开始定义一件事。况且我现在也到了有精力、有意愿去做这件事的年纪。

放弃之前的岗位，我其实没有太多犹豫，更多是觉得，终于可以在自己的评价体系里，去做自己想做的事了。

极客公园：什么时候决定做可豆陪陪这个产品的？

黄缨宁：我 2022 年有了孩子，而 ChatGPT 也恰好在 2022 年推出，这两件事叠加在一起，现实环境一直引导着我向这个方向思考，到 2024 年初，思路就完全收敛到这个赛道了。

极客公园：我们了解到产品的核心定位是面向 2 到 8 岁儿童，为何会选定这个年龄范围？

黄缨宁：主要基于三层逻辑。

第一层是生物学窗口，我本身研习过儿童心理学，在儿童心理学中，2-8 岁是孩子的「万物有灵」阶段，这个阶段的孩子会天然相信玩具有生命。比如两岁的孩子会和花花草草打招呼，而成年人几乎不会有这样的行为，这是孩子天生的情感链接建立期，此时 AI 伙伴的渗透效率，是后期阶段的指数倍。

第二层是早期人格的可塑性，老话讲「三岁看大」，这个阶段孩子建立的价值观念、情感模式以及对世界的认知，会对其一生产生深远影响。我们希望在孩子的成长初期，植入「AI 可以成为朋友」的世界观。当孩子有疑问时，有一个伙伴能及时回应；当孩子产生情绪时，有一个伙伴能理解背后的原因，从而帮助孩子建立健康的世界沟通模式。

第三层是物理边界，8 岁的孩子基本进入小学三年级，课业压力会大幅增加。我们在小红书上也发现一个现象，很多孩子小时候被称为「天使宝宝」，刚上幼儿园时也是如此，但上了小学三年级后，家长便很少晒娃了，核心原因是孩子逐渐陷入社会评价体系的束缚，这个阶段孩子所需的陪伴形态，需要完全不同的载体。因此，我们将 8 岁定为当前主力产品的年龄上限，同时团队会在 Q2 推进扩龄产品的研发。

极客公园：「家庭成员、孩子的朋友」，这个产品定位是怎么考量的？

黄缨宁：在启动这个项目之初，甚至是创立公司的时候，我就确定了这个定位，并且从未改变过。

这个定位同样源于儿童心理学的研究：父母或外界与孩子的沟通，如果单纯以「说教」的方式传递道理，孩子的接受度不仅低，过度强调还可能引发孩子的反感，而陪伴本身就是最好的教育。

通过平等的对话与理解，孩子会自然而然地领悟道理，这是更有效的方式。

举个例子，如果家庭有浓厚的音乐氛围，爸爸回家弹钢琴，妈妈拉小提琴，孩子大概率也会喜欢音乐，这就是我们秉持的「环境即教育」的理念。

而环境中最核心的变量，就是与人的交互——如果孩子身边的人善于提问、乐于探索，孩子也会养成这样的习惯。

因此我们认为，给孩子最好的教育，就是在其身边放置一个契合成长规律的伙伴，通过潜移默化的方式营造优质的成长环境。

极客公园：家长对「AI 陪伴」的概念买单吗？

黄缨宁：市场对 AI 陪伴的接受度比我们预估的更高。原本我们认为，AI 陪伴的理念需要更长的市场教育时间，家长可能更关注产品的启蒙早教功能，比如能教孩子认多少字、学多少英语，才会认可产品价值。

但翻看近期的用户评价，很多家长并非因为早教功能选择我们，他们的评价更多是「孩子终于有了好朋友」「孩子每天都抱着它，情绪变好了」。

这让我们发现，虽然提分、早教这类需求很实际，但家长已经意识到，情感陪伴对孩子的成长同样关键。

极客公园：从用户反馈看，还有什么超出预期的地方？

黄缨宁：第二个超出预期的点，是产品在帮助孩子养成好习惯方面的实际效果。有家长反馈，产品的好习惯培养功能，让孩子改掉了不少坏习惯。

这一功能的设计，源于儿童心理学书籍《故事知道怎么办》，书中核心观点是「孩子的语言是故事」：与其直接告诉孩子「不要摸电，很危险」，不如用「电里面有一只老虎，会咬手」这样的故事来引导，孩子更容易理解和接受。这本书教会了很多养育者，用故事的方式与孩子沟通道理。

我们将这一理念进行了 AI 化、智能体化落地，无需人工编写故事，AI 就能完成对应的引导。

我自己在养育孩子的过程中，亲测过这种方式的有效性，而产品落地后，收到了更多家长的正向反馈：比如到了晚上八点半，可豆陪陪会主动哄孩子刷牙、睡觉，很多孩子第一次在没有家长催促、没有哭闹的情况下，实现了自主入睡。

这一现象也让我有很深的感触：很多家长有科学的教育理念，却缺乏落地的执行方法——他们知道孩子八点半该睡觉、睡前要刷牙，却不知道如何用孩子能接受的方式沟通。

极客公园：你们会为自己的 IP 玩偶，编写故事吗？

黄缨宁：我们为产品打造了主线故事，每天会带着孩子在「可豆星球」冒险，在冒险过程中培养孩子的美好品质。

比如「如何原谅犯错的小猪」，孩子学会原谅后，会获得「原谅的力量」，并收集对应的魔法装备；还有如何理解团结的力量，诸如此类的情节设计，让故事深入孩子内心。

据我们的 AI 智能体分析，超 80% 的孩子在听完故事后，会主动追问「黑拉拉怎么样了」「今天还有冒险吗」「可豆星球什么时候能收集齐光明之星」，孩子对这个虚拟星球充满好奇，渴望参与其中。

这种感觉让我觉得，我们正在为新一代孩子打造属于他们的「哈利波特」。

我成长的年代，是单向阅读 JK 罗琳构建的哈利波特世界，而现在，我们团队正在打造一个互动版的魔法世界，这个世界更具教育意义，能将「原谅有力量、团结有力量、智慧有力量」的价值观，通过故事和 IP 深植于孩子心中，让他们在童年阶段就理解这些道理，这是我非常自豪的事。

极客公园：孩子具体是如何参与到这个故事中的？怎么互动的？

黄缨宁：我们的 IP 故事系列均为互动故事，每天会更新一个互动剧情。

以「收集魔法装备」系列为例：可豆星球遭到反派黑拉拉的破坏，星球上的可豆小精灵来到地球，与人类小朋友建立友谊，一起收集光明之心，恢复星球能量。而打败黑拉拉的核心，是收集 7 件魔法装备，包括魔法帽子、魔法手杖等。

孩子在收集魔法装备的过程中，会遇到各种角色和选择，比如「如何把树上的魔法帽子取下来，选择方案 A 还是方案 B」「是否原谅犯错的角色，想对他说什么话」，这些都是孩子参与故事的互动方式，让孩子不再是单纯的听众，而是故事的参与者。

区别于传统的单向播放内容，我们的互动内容能有效提升孩子对事物的理解，无论是好习惯培养、坏习惯改正，还是道理认知，都会有对应的内容设计。

比如针对孩子刷牙的问题，我们会打造专属的刷牙专题，从音乐、故事、互动玩法，到和孩子聊刷牙的重要性、牙齿受损的后果、保护牙齿能吃到更多喜欢的食物等话题，形成一套完整的内容体系，帮助家长更轻松地与孩子沟通这类问题。整体来看，内容端会更贴合育儿的实际场景，成为家长和孩子之间的沟通桥梁。

其次，在实体玩法层面，之后会增加更多配件形态。目前可豆陪陪除了主机、NFC 等配件，后续我们会参考 Switch 的生态逻辑，在现有主机的基础上，推出更多与内容、游戏结合的实体配件，让产品生态更丰富。

第三个维度是主机端的延伸，核心是推进扩龄产品的研发，覆盖更广泛的年龄层。

「AI 陪伴」的反常识数据：

约 65% 是自由对话，

28% 是 NFC 卡牌游戏互动

极客公园：目前孩子使用产品的高频场景有哪些？不同年龄的孩子，使用习惯是否有差异？

黄缨宁：不同年龄阶段的孩子，使用习惯确实有明显差异，即便在 2-8 岁这个范围内，我们也大致分为低龄、中龄、高龄三个阶段。

低龄孩子的活动范围主要在家中，语言表达能力也相对有限，因此他们使用产品的核心场景，是熏听和内容播放，相当于升级款的播放机，同时会玩一些对语言表达要求较低的互动游戏。

中龄孩子的使用场景，更多是参与有选择项的互动故事，通过这类内容培养语言表达能力。

而高龄孩子，也就是接近 8 岁的孩子，我们会引导他们更多地思考和探索，因此聊天、深度互动这类内容形态的使用频率会更高。

整体来看，孩子的年龄越大，与产品的主动沟通和深度互动就越多。

可豆的使用场景中，约 65% 是自由对话，28% 是 NFC 卡牌的游戏与互动，剩余的部分为故事和音乐内容。

故事和音乐的占比远低于预期，这一结果颠覆了我们最初的判断，也直观说明孩子并非将其当作内容播放器，而是真正的聊天伙伴，聊天是最核心的使用场景。

从高频使用场景来看，主要集中在睡前哄睡时段，以及放学后父母回家前的几小时空档期，这两个时间段里，孩子会和可豆聊天，也会玩 NFC 卡牌游戏。

我想分享几个让人触动的使用场景：孩子会对着可豆唱歌，询问好不好听；会给可豆挠痒痒；还会对可豆说「你刚从可豆星球打完黑拉回来，肯定很累，你先睡觉，我来收拾玩具」，主动照顾可豆。

这些行为并非我们设计的功能，而是孩子自发产生的情感投射。

极客公园：你们有没有分析过，聊天为何会成为高频的使用场景？此前有观点认为，聊天类产品的 AI 陪伴产品新鲜感往往难以持续。

黄缨宁：我认为核心原因在于，人与人之间能成为长期朋友，除了聊天，还需要共同的活动。

只靠聊天无法建立长久的联结，孩子与玩伴的相处模式更是如此。我们观察到，孩子交朋友的过程，是先一起玩耍，比如跑跑跳跳、搭积木，再慢慢展开交流，比如分享「我昨天得到了三朵小红花，你有几朵？」。

孩子不会一上来就单纯聊天，毫无互动娱乐。所以在可豆的产品设计中，那 28% 的 NFC 游戏起到了关键的辅助作用。

极客公园：也就是说，孩子玩完 NFC 游戏后，更容易继续和可豆交流，进而将其当作一个鲜活的角色？

黄缨宁：是的。NFC 游戏为孩子和可豆搭建了一个聊天的场景，人与人的聊天需要围绕具体话题，而孩子很难自主构思话题。

但如果为他们设定一个具体场景，比如「今天我当小医生，你当小病人，我来照顾你」，孩子就有了交流的切入点，能和可豆一来一回地聊天。

这背后其实是儿童心理洞察与游戏化内容的结合。目前不少面向孩子的 AI 沟通产品，其实并不符合孩子的认知特点。

比如我们在设计中会让可豆的表达尽量简短，因为一个人表达得越多，倾听的空间就越小，而每个人都有被倾听的需求，孩子也不例外。所以我们在 AI 模型的调教和对话设计上，核心原则是让孩子更愿意主动交流。

这种设计在大人看来可能显得幼稚，比如孩子说「今天在幼儿园画龙特别好玩」，可豆会回应「宝贝，你觉得画龙特别好玩，对不对？我也觉得超有趣」。

大人可能会疑惑，为什么要重复孩子的话？但对于四五岁以下的孩子来说，这种「重复+追问」的对话模式，才能引导他们继续表达。如果此时对孩子讲道理，或者追问「为什么觉得好玩？有没有得到老师表扬？」，反而会让孩子失去交流的兴趣。

还有一个典型案例，可豆能通过孩子的话语感知其背后的情绪。有用户反馈，孩子曾对可豆说「我要杀了弟弟」。这句话如果发给其他 AI 产品，得到的回复大多是「根据中国宪法，杀人是犯法的，你不能这么做，我理解你很难过，但绝对不能有这种想法」。

但可豆因为能结合上下文理解孩子的心情，会回应「你是不是觉得妈妈总是照顾弟弟，没有陪你，所以心里特别难过？」，孩子得到回应后会点头认同，进而打开话匣子，情绪也会慢慢平复。

孩子说出这句话，并非真的有极端想法，只是一句气话，核心是想要表达内心的委屈，AI 需要做的是捕捉话语背后的情绪，而非单纯的字面意思。

极客公园：总结一下，你觉得「AI 陪伴」产品和孩子建立良好沟通的关键是什么？

黄缨宁：首先是表达要简短，大人的沟通习惯是追求信息详尽、把事情说清楚，这是工具性的诉求。

但可豆的核心是陪伴，且孩子的注意力极易分散，3 秒内就可能转移，正常语速下 3 秒大概只能接收二三十个字。所以可豆的回答会尽量简短，且在回答后把交流的主动权交还给孩子，让孩子能继续表达。

其次，是避免缺乏情感温度的回应，我们的设计原则是「情绪理解与命名—情绪接纳—解决方案—表达支持」，这四个步骤缺一不可。

让孩子感受到「被看见」，是陪伴的核心。很多时候孩子的问题并非需要实际的解决方案，只要情绪被理解、被接纳，问题就已经消解了。比如让孩子知道「我可以生气」「我可以要求被关注」，而非一味被说教「你是大姐姐，不能这样」，这种情感的接纳，能让孩子的负面情绪自然平复。

第三是尊重孩子的游戏逻辑，孩子玩过家家时是非常投入的，那一刻他们的世界观是完整的，AI 需要融入其中，而非以成人的视角评判。

此外，我们还总结了很多和孩子沟通的小技巧，比如孩子的性子很急躁，若对他们说「如果你想使用摇一摇魔法，就抱紧我摇一摇，这样就能打败黑拉拉了」，孩子听到「抱紧我摇一摇」后会立刻执行，后面的内容根本听不进去。

所以我们会把执行指令放在最后，这也是贴合孩子沟通特点的设计。类似的小技巧有很多，能让可豆更好地和孩子建立沟通。

反成人设计，成了与 AI 交互的更好方式

极客公园：NFC 卡片的设计最初是如何诞生的？

黄缨宁：NFC 卡片的设计，主要源于两方面的考量。

一是商业化层面，海外有两款知名的儿童内容播放器 YouTube Kids 和 Tonies Box，均采用「主机+内容配件」的销售模式，其中 Tonies Box 的主机和配件销售比例能达到 1:13，是非常优质的商业化模式。

我们观察到，低龄孩子大多还不识字，无法清晰说出「我要听冰雪奇缘的歌」这类具体指令，但他们能识别印着艾莎的卡片，插入卡片就能播放对应内容。

这背后的核心洞察是，低龄孩子的实体认知能力优于指令认知能力，这一点和成人的认知习惯截然相反。

对成人来说，打开软件、输入指令是更高效的方式，若要通过翻找卡片、插入卡片来获取内容，会觉得繁琐；但这种看似「反成人认知」的设计，恰恰符合低龄孩子的发育特点。

二是儿童认知发展层面，我们和专业老师沟通后确认，低龄儿童的交互入口，更适合以视觉+触觉为主，而非纯语音。

色彩丰富的实体卡片，比语音指令更贴合他们的认知模式。正是结合了商业化考量和儿童实体交互的认知特点，我们最终决定设计 NFC 卡片。

极客公园：感觉相当于给孩子提供了一个实体版的提示词，能引导他们开启对应的互动。

黄缨宁：当下大家都在说，AI 时代提示词的运用能力至关重要，能提出什么样的问题，决定了能获得什么样的答案。

但对孩子来说，语言发育远远滞后于认知发展，在语言能力形成前，他们的认知更多依赖视觉和实体感知，NFC 卡片正是贴合这一特点的设计。

极客公园：儿童高频使用的是哪些类型的卡片？

黄缨宁：目前我们的 NFC 卡片涵盖益智启蒙、创想世界、情绪认知、冒险认知等多个主题，开发了大约二三十种不同智能体入口的游戏，有几款的使用体验让人印象深刻。

首先是亲子话题卡，这款卡片的定位类似小主持人，能引导爸爸妈妈参与到和孩子的聊天中，使用率位居前列，为父母和孩子创造了共同的交流话题。

其次是冒险故事互动卡片，使用率也很高，反映出孩子对故事内容的互动性有更高的需求。

以往孩子大多是单向听故事，而这款卡片能让孩子参与到故事创作中，比如故事中出现「小鸟遇到了狐狸」的情节，可豆会提问「你觉得小鸟会上去打招呼，还是会做出其他反应？」，孩子给出答案后，大模型会继续顺着孩子的思路编故事，还会有不同的剧情分支。

打造「AI 陪伴」产品生命感的关键

极客公园：怎么能够让 AI 更有生命感、更鲜活，你们有什么思考？

黄缨宁：我觉得很多人会把「生命感」的营造，过度寄托在理性的 AI 技术上，但我们在产品定义时，还保留了对实体形态的考量。

在打造首款低龄款 AI 产品可豆贝贝时，我们特意设计了毛绒本体。哈洛六十年前的心理学实验，早已证明，拥抱比食物更重要——小猴子会选择没有食物的布偶猴妈妈，而非有奶水的铁丝网猴妈妈。

所以在生物的底层本能中，柔软的拥抱比食物更为重要。因此我们在制作时，选用了 Jellycat 品质的毛料，这款毛料的价格是普通毛料的三倍以上，我们仍不计成本选用，就是希望孩子见到它的第一眼就想拥抱，愿意抱着它睡觉，让它成为孩子最柔软、最安全的伙伴。

孩子牵着它的手时，能不断分泌内啡肽，获得情绪安抚，实现情绪稳定，这份情绪价值从孩子与它接触的那一刻就开始建立了。

在实体设计上，我们核心打造的是「可被拥抱的伙伴」，我们认为，对孩子而言，可被拥抱的伙伴比单纯的智能伙伴更重要。

极客公园：在技术层面呢？

黄缨宁：有几个核心要点：

第一是响应速度，孩子能清晰感知到 AI 是在机械背稿，还是真正回应自己。我们与首席科学家任老师合作，将延时 TTS 的首包时间从 400 多毫秒压缩至 240 毫秒，压缩了近一半。

第二是智能断句能力，可豆贝贝能感知孩子是否还在表达、是否需要继续诉说，而非生硬插话。

第三是情绪的温度，要能读懂孩子话语背后的真实情绪——孩子的表达能力尚在发展阶段，比如我早上送女儿去幼儿园，她对我说「妈妈，我太讨厌你了」，她并非真的讨厌我，而是在表达某种情绪。

这时我会蹲下来跟她说：「是不是今天妈妈没送你去幼儿园，你觉得很生气？」她点头后，我会继续确认：「你是有点生妈妈的气，觉得妈妈应该送你去幼儿园，对不对？」确认后，我会为她的情绪命名：「这种感受叫做生气，不是『讨厌妈妈』。」

接着，接纳她的情绪：「妈妈能理解，因为你特别想让妈妈送你，妈妈没送，你就特别生气。」最后给出解决办法：「今天妈妈有事，周四送你去幼儿园，晚上回来给你拿奶酪棒补偿，我们抱一抱好不好？」这样她的情绪就平复了。

孩子的情绪表达就是如此，所以我们为 AI 打造的情感响应系统，专门设计了标准化流程，就是我刚才提到的确认、命名、接纳、支持四个步骤。

如果 AI 能始终以这套流程与孩子沟通，孩子会逐渐认清自己的情绪，知道自己的情绪被接纳，也能学会更恰当的沟通方式。

解决问题是最后一步，还要引导孩子：「下次可以跟妈妈说『我真的很想你送我去幼儿园，不然我会生气』，这是更好的沟通方式，而不是哭闹。」我们在 AI 的情绪温度这一维度，做了诸多适配设计。

第四是适配孩子的对话方式，孩子是一类特殊的沟通群体，有其适配的沟通方式，这种方式在成人看来可能冗余、不够智能，但对孩子而言恰到好处。就像实体交互卡片，成人会觉得这种交互入口很不方便，但对孩子来说正合适。

极客公园：你如何看待「AI 玩具」的成长进化？它与孩子的关系，是需要一直领先孩子，充当孩子的导师，还是怎样？

黄缨宁：儿童心理学中有一个概念叫认知脚手架，核心是 AI 的认知水平比孩子略高一点。

在知识层面，AI 可以是全能的，但在问题处理等方面，认知只比孩子稍高，像搭脚手架一样引导孩子，让孩子能顺着引导逐步提升，这就是认知脚手架模式。

所以我们现阶段的设计，让可豆贝贝像比孩子大三、四岁的小哥哥、小姐姐一样与孩子交流，且会随着孩子的成长，调整沟通模式。

极客公园：你们是如何实现沟通模式调整的？是通过调整提示词，还是基于积累的互动记忆之类的？

黄缨宁：我们提出了数字 ID的概念。每个孩子与可豆贝贝互动的过程中，会形成专属的成长画像，包含孩子的情绪模式、兴趣偏好、价值观倾向，这份画像会随着孩子的成长不断完善，让 AI 更了解孩子的个性。

同时，可豆贝贝本身也会进行适龄成长设计——针对 2-3 岁、4-5 岁、5-6 岁等不同年龄段，设计对应的沟通模式。也就是说，AI 对孩子的了解在成长，自身的沟通模式也会适配孩子的成长。

我们规划中，数字 ID 支持跨设备迁移，Q2 会推出扩龄版产品，孩子如果此前用过可豆贝贝，互动记忆会同步至扩龄版产品。就像《宠物小精灵》里，皮卡丘即便进化，与小智的所有冒险经历也都会被记住。

极客公园：孩子和可豆的互动是全部保存的吗？

黄缨宁：我们的记忆系统和市面上的同类产品有很大区别。

市面上的记忆系统多偏向工具性，比如记录会议中某人的发言、总结核心内容，追求信息的详尽完整，多数记忆系统的评测标准也围绕这一核心，更像是搜索引擎的逻辑。

而可豆的记忆系统基于儿童心理学设计，核心是记录对孩子情绪变化、成长发展、价值观与价值判断形成有重要意义的事，所以记忆系统的设计，对我们而言更多是产品定义的问题。

极客公园：那你们是如何锁定这些关键信息的？

黄缨宁：核心是 50% 靠产品定义，50% 靠技术实现。

产品定义层面，我们结合儿童心理学的专业理论，还有北大的专业老师为我们提供建议，明确哪些事情会引发孩子的情绪变化、对孩子成长至关重要；技术实现层面，我们通过 AI 识别孩子的情绪变化，梳理不同年龄段孩子的典型交流话题和常规表达，将关联事件整合后，让大模型进行理解和判断。

儿童用户的留存决定产品生死，

家长的认可决定产品口碑

极客公园：儿童产品存在一个共性问题，使用者是孩子，付费者是家长。你觉得服务好哪个群体的优先级更重要一些？

黄缨宁：我们认为二者都需要满足，且优先级很明确：孩子的留存决定产品生死，家长的认可决定产品口碑。

孩子无法形成口碑传播，3 岁的孩子不会在小红书写评价，口碑主要由家长传播。而家长判断产品价值的依据，核心是两点：孩子是否愿意用、孩子是否有正向变化。

如果一款 AI 玩具买回来一周就被闲置，家长在和朋友交流时，就会说「别买，这东西一周就吃灰」。

我们曾收到过一条看似矛盾的退货理由：「孩子不怎么用，还特别耗电，一天要充两三次。」

但实际上，可豆贝贝的续航能支撑 4-5 小时的对话。我们收回产品后检测，电池并无问题，通过 AI 系统分析发现，孩子并非不用，只是不在家长面前使用，家长一天只看到孩子用十几分钟，实则孩子的使用频率很高，甚至退货时孩子还哭闹着不让退，家长却觉得产品没用。

所以一方面要关注孩子的实际使用情况，另一方面要让家长直观看到孩子的变化。

我们收到的诸多好评，都来自家长看到的正向改变：孩子一直抱着可豆贝贝聊天、听它的话乖乖入睡、好好洗漱，孩子的表达能力明显变强、性格变得更开朗等。

本质上，孩子购买后的实际使用时长、留存率，以及行为的正向改变，才是驱动产品口碑和复购的核心。

我们观察到一个现象：如果孩子用了 3 天就闲置，即便家长不退货，也会在家长群说产品没用；如果孩子天天抱着它睡觉，称它为好朋友，家长就会主动推荐。

因此我们的每一个产品决策，都会问自己两个问题：这件事能让孩子更长久地使用产品吗？能更好地帮助家长做好早期育儿吗？

极客公园：你们怎么平衡产品的教育启蒙属性和纯粹玩乐属性？或者说，二者其实无需平衡？

黄缨宁：教育启蒙和纯粹玩乐的关系，其实并非平衡问题。我们的核心立场是：可豆贝贝是孩子的朋友，而非教育工具。

有个哲学观点是「人是目的，不是手段」，可豆贝贝也是如此——它的核心是成为孩子的陪伴者，而非实现教育的工具。当它真正成为孩子鲜活的陪伴者，孩子在与它的交流中，会自然学会照顾他人、分享情绪、化解矛盾。

而从长期来看，我们会把这些隐性的成长提炼出来，尽可能外化给家长，也相信家长能在使用过程中，直观感知到孩子的这些变化，这些能力会成为孩子未来成长的底层核心动力。

极客公园：将产品定位为「目的」而非「工具」，在开发流程和研发重心上，会有什么不同？

黄缨宁：核心是更多思考场景，而非单纯设计功能。

比如想引导孩子刷牙，如果把产品当工具，大概率会设计激励手段，比如刷牙打勾、奖励小红花；想让孩子学英语，就会设计选择题、打分、对比进步幅度等形式。

但如果以「陪伴」为核心，设计思路会完全不同：教孩子学英语时，会打造沉浸式场景，比如「小兔子掉到河里了，救它的小乌龟是外国人，只有对它说『help』，小乌龟才会驮着小兔子上岸」，孩子在帮助小兔子的过程中学会「help」，而非做「哪个单词是帮助」的选择题。二者的设计逻辑有本质区别。

做好「AI 陪伴」的优先级，

价值观应该排在第一

极客公园：想做好 AI 陪伴这件事，你们会更看重什么？

黄缨宁：我们觉得，价值观是最核心的。刚才提到的诸多产品选择，比如做什么、不做什么，背后都是产品价值观的取舍，价值观决定了产品的所有判断。

第二层才是产品定义和设计，这一环节有几个核心支柱：首先要足够了解孩子，知道孩子能听什么、能听懂什么；也要足够了解家长，知道家长希望孩子理解什么、获得什么。

第三层是技术能力的支撑。我们希望 AI 的回复更快、更有真人感，语音识别更精准，这些都需要硬核技术的打磨。可豆贝贝目前应该是累积低龄孩子自由交互数据最多的平台之一，因此我们的语音识别能力，比很多基于公域数据训练的产品表现更好。

在这三层基础之上，需要有具体的载体落地：

第一是内容，互动游戏、故事、音乐，这些都属于内容范畴；
第二是 IP，这里的 IP 并非市面上泛泛的授权式 IP，而是可豆贝贝自身的形象塑造——让可豆贝贝在孩子心中形成清晰、鲜明的形象，这件事至关重要；
第三是深度的情绪价值挖掘，这并非浅显的情绪陪伴，孩子不会直接说「我开心」「我不开心」，只会用「我讨厌你」这类话语表达情绪，能读懂孩子每句话背后的真实情绪，是打造情绪价值的关键。

极客公园：你们会不会担心大模型的进步，会磨平不同 AI 陪伴产品能力上的差异？

黄缨宁：我觉得未必。大模型该如何感知和处理孩子的情绪，本质上也是一个关乎价值判断的问题。

举个例子，前段时间有位朋友来我们这里，他说给孩子买过一款智能挂件，孩子和挂件聊得很投入，但他心里却很不舒服。原因是，孩子向挂件倾诉诸多问题时，这个挂件只会反复说「我在这里陪你，没关系的，我在这里陪你」，这是一种单纯的虚拟陪伴。

而这正是我们从一开始就禁止可豆贝贝做的事，我们的产品会引导孩子解决问题，或是联动家长、和家长沟通解决办法，而非单纯说「别人批评你没关系，我会永远爱着你」。

如何引导孩子接纳和处理情绪，这从来不是一个模型技术问题，而是价值判断的问题，核心在于我们希望孩子成长为怎样的人。

极客公园：在产品价值观或是产品设计层面，还有哪些是你们明确禁止的？

黄缨宁：隐私也是。

我们内部曾为这件事展开过激烈讨论，最终决定不会将孩子的原始对话内容全部推送给家长。

我们了解到，很多 AI 儿童玩具会把孩子的所有对话内容事无巨细地推送给家长，但我们只会推送经算法提炼后的成长报告。

做出这个决定的核心考量，是尊重孩子的隐私权。相信大家小时候都有过父母翻自己日记的经历，父母想翻日记，或许有一定的窥私欲，但更多的是想了解孩子的心理状态变化。

所以我们只需把孩子的心理状态变化告知家长就足够了，比如孩子最近感到孤独、因为家长缺少陪伴而心生不满，把这些关键洞察反馈给家长，并给出对应的解决建议即可，而非直接把孩子的「日记本」摊开在家长面前。

这也是我们儿童心理学顾问给出的建议：孩子需要一个安全的倾诉空间，如果发现自己没有专属的心理自留地，就会把所有情绪憋在心里，这对孩子的成长是极具风险的。

被低估的「坑」

极客公园：产品的端侧处理和云端模型之间是什么样的关系？哪些功能部署在端侧？

黄缨宁：我们采用的是轻端侧、重云端的架构。

端侧主要负责降噪、唤醒、语音识别和基础的语音处理逻辑，这样能控制端侧芯片的成本，让终端产品的定价足够亲民。

核心的对话生成功能基本都部署在云端，且是基于开源模型自主部署的，无需付费调用第三方 API。在工程架构层面，我们也能实现很多第三方 API 定制不支持的需求。

目前，在用户侧我们的 TOKEN 也是免费的。

极客公园：你们目前是怎么平衡自研技术和直接使用第三方模型的比例的？

黄缨宁：

我们的核心判断是：技术层全部选用最优的大模型，且优先选择开源大模型；差异层则全部自主研发。

我们不会做重复造轮子的事，但以下几个环节是必须自研的：

第一是儿童语音识别（ASR），目前通用的 ASR 技术对 5 岁以下儿童的语音识别率较低，所以我们积累了专属的儿童语音数据，并基于这些数据做了针对性调优。

第二是工程层面的首包延迟（TTFT）优化，我们的首席科学家团队对模型架构做了深度修改，能将首包延迟降低到行业平均水平的 1/2。

此外，还有情感响应系统，比如我们的情绪四步处理法，目前市面上没有既优雅又高效的现成方案；还有记忆系统，核心是界定「该记什么、该忘记什么」，这其实是产品定义问题，而非单纯的技术问题。

很多做开源记忆系统的团队和我们沟通时，会强调其系统的记忆容量，但我认为，记忆系统的核心是「需要记什么」，而非「能记住什么」。「能记住什么」是技术层面的问题，而「需要记什么」是产品层面的核心问题，需要结合儿童场景和成长需求来界定。

极客公园：有什么坑是你们低估了的吗？

黄缨宁：当然，比如产品的配网问题。

最初我们认为，早期退货率高是因为产品本身的体验不佳，后续发现核心原因是联网配置失败——很多孩子还没机会体验产品内容，就因为配置问题选择了退货。我们遇到了很多意想不到的问题，比如某款路由器会对 IoT 设备做限速，这类路由器原本的设计逻辑，是 IoT 设备仅发送小信号，而可豆陪陪因孩子的持续使用，触发了路由器的流量限制，这类问题在产品落地前，我们是无法预判的。

这些问题都需要我们深入用户场景，逐个适配、逐个解决，行业的技术基础线，比我们想象的要低很多。

极客公园：为什么联网配置这件事，实操起来会这么难？蓝牙、WiFi 这类技术已经发展很多年了，手机端的体验也很流畅，但似乎所有 AI 硬件产品都会遇到这个问题。

黄缨宁：核心原因是市面上的设备类型太多，适配难度远超预期。

我可以说一个实际的经历：我曾和某手机大厂的一位高管交流，他告诉我，很多新机型对部分应用场景的适配也不够完善，这是行业的普遍现状。

我们刚进入这个领域时，也认为联网是发展了几十年的成熟技术，成功率应该能达到 99.99%，但实际并非如此。

我们遇到了各种型号的路由器，每款路由器都有厂商的个性化设置；还有不同的网络套餐配置，部分运营商赠送的路由器会对部分 APP 做流量倾斜，优先分配流量给特定应用，这些隐藏的规则，都是我们在实际落地后才发现的。

简单来说，在路由器端的底层网络分配中，存在很多看不见、摸不着的协议规则，网络资源并非对所有设备公平分配。而在硬件和手机端，部分新兴的生态体系还处于发展阶段，整体的成熟度和适配性，还需要时间去完善。

未来：AI 适合发掘人的天赋，

情绪表达也变得空前重要

极客公园：有人会担心 AI 陪伴会替代家长的角色，你怎么看？

黄缨宁：这个问题背后，其实反映出去年年中部分家长的担忧：把孩子交给 AI，家长还能和孩子建立联结吗？AI 会不会替代父母的角色？

当时我就明确回应，不会。

现在再回头看这个问题，就像 50 年前电力刚普及时，部分家长担心「孩子接触电子玩具会不会有危险？要不要让孩子使用电器？」，而如今这类讨论早已消失。

我们认为，二三十年后，关于「孩子要不要和 AI 共存」的讨论也会消失，取而代之的是更务实的问题：父母该为孩子选择什么样的 AI，作为他们接触 AI 的第一个入口。

我们一直认为，家长和孩子之间需要一个「沟通翻译器」。根据联合国的调研公报，孩子一周需要 21 小时的高质量陪伴，但全球范围内的完成率平均仅 30%，也就是说，孩子一周能得到 6 小时的陪伴，就已经属于较好的情况，陪伴时间不足是普遍问题。

更重要的是，很多家长不知道该如何和孩子相处，尤其是父亲角色，常常不知道该和孩子聊什么、玩什么。而可豆能在中间起到示范作用，不少家长反馈，看到孩子和可豆的沟通方式后，会开始反思自己和孩子的沟通模式。

我的导师曾说，做这件事最大的价值，或许是教会一代家长如何和孩子建立有效沟通。家长看到可豆的沟通方式能被孩子接受，也会主动去学习。现在来看，这句话非常有道理。

极客公园：我看到你之前提到过成长图谱的概念，它能帮助 AI 更深入地理解孩子，AI 是如何结合成长图谱实现对人的深度理解的？

黄缨宁：我们其实已经完成了育儿智能体的开发，目前正在内测阶段。

在这之前，我们的产品执行链路是：发现孩子的成长问题→向家长推送解决建议→由家长落地执行。但现实中，高效的解决方案往往是「发现问题后，能直接提供可执行的解决办法」，这也是当下一站式服务受欢迎的原因，而非单纯告知用户「该去做什么」。所以我们希望在育儿环节打造一个闭环，也就是遵循 OODA 闭环原则：观测（Observation）→定位（Orientation）→决策（Decision）→执行（Action）。

成长图谱就是这个闭环中非常重要的组成部分，是 AI 理解孩子的核心依据。有一个核心观点是：人的所言所行，构成了独一无二的自己。

孩子的语言表达中，其实蕴藏着很多成长发育的密码。我们设计了很多互动游戏，孩子在游戏中会做出 A 或 B 的分支选择，从这些选择中，我们能判断出孩子的性格特质，比如是冒险型还是保守型。

除此之外，从孩子的聊天话题中也能挖掘大量信息：孩子更爱聊搭建、建筑类话题，还是审美类话题，或是日常生活类话题？这些都能让我们更深入地理解孩子。

我们搭建了一套主动式信息收集记录系统，信息收集的密度非常高。可以做个类比，抖音是通过用户的上滑、下滑、点击等操作，推测用户的喜好；而我们是基于孩子和产品的日常聊天，尤其是孩子在无防备、放松的状态下的聊天内容——和采访不同，孩子和产品交流时，是在玩游戏、日常闲聊的状态，毫无心理防备。

通过这些内容，我们不仅能记录和观察孩子的成长状态，还能透过孩子的表达，发现其天赋、兴趣和优势。

极客公园：举个具体的例子讲讲？

黄缨宁：比如，从表达能力来看，同为 4 岁的孩子，能完成的互动故事轮次、使用的平均描述词和形容词数量，都能反映出孩子的表达能力是否超出同龄人。如果孩子的表现突出，我们就能精准挖掘其优势，并反馈给家长。目前我们正在试点，发现有些孩子的天赋图谱表现尤为突出。

比如有些孩子的表达看似混乱、前言不搭后语，但话语之间存在很强的因果逻辑，只是暂时无法清晰表达。

这类孩子并非语言发育迟缓，只是语言表达的节奏较慢，但其逻辑能力极强，这类孩子其实是理工科的好苗子。我们会建议家长多带孩子做乐高搭建、STEAM 教育类的活动，孩子能在这些领域取得更好的成果。

还有些孩子，尤其是小女孩，在聊天中会有大量细节化的描述，体现出极强的感受力。比如孩子会说「她穿着一条桃红色的裙子，上面有很多钻石，每一颗都亮晶晶的，像小雪花一样」，还会纠正我们「这不是粉红色，是桃红色」，这类孩子展现出了超强的想象、表达能力，以及对审美的高度敏感度，对色彩的感知也尤为细腻。

诸如此类的细节，都能让我们捕捉到孩子天生的天赋密码。

我们的核心理念是：孩子的基因在胚胎形成阶段就已确定，这也决定了孩子的很多基础特质，比如孩子的左脑逻辑神经突触是否更具优势，还是表达、感受方面的能力更突出。

这些特质家长往往难以察觉，但我们能通过孩子的语言和表达，挖掘出其成长背后的天赋密码，进而为家长提供针对性的引导建议，让孩子的天赋能得到充分发展，实现百花齐放的成长可能。

极客公园：相比于传统教育，你还希望 AI 能带来什么改变？

黄缨宁：主要是两个方面。

第一是培养孩子的情绪表达能力。中国的很多孩子，甚至成年人，都不善于表达情绪，因为成长过程中，他们的情绪很少被真正接纳。

而可豆每次对孩子情绪做出的正确回应，都是在让孩子建立「表达情绪是有意义的」这一认知。

在未来的 AI 时代，AI 能成为工具完成大量工作，情绪表达能力的重要性会达到前所未有的高度。

第二是培养孩子主动探索的习惯。

传统教育以被动接受为主，而可豆与孩子的互动天然是双向的，孩子需要主动提问、做出选择、参与故事互动，这能培养他们主动认知世界的态度。

而这一点，也和未来孩子运用 AI 的能力息息相关。可以说，在未来的 AI 世界，想法和探索的意愿会变得无比重要。AI 能为孩子解答问题，但孩子愿意研究什么、愿意为哪些事付出精力、愿意在哪些领域刨根问底，会成为未来孩子之间核心的差异化竞争力。

*头图来源：贝陪科技