
|
未来,VideoTutor希望成为超越多邻国的头部教育应用。
|
文|邓咏仪
编辑|苏建勋
2025年9月,VideoTutor创始人赵凯与币安创始人赵长鹏第一次在线上见面,进行了一次深聊。一个月后,他的第一笔融资顺利完成——赵长鹏YZi Labs宣布领投VideoTutor,成为这家初创的第一轮外部投资人。
赵凯表示,之所以能够迅速敲定融资,首要原因在于,双方对于教育的巨大热忱是一致的——赵长鹏也曾在功成名就之后,推出非盈利教育项目GiggleAcademy,为发展中国家的贫困儿童提供教育机会。
第二则是,VideoTutor团队展现出的快速迭代能力。投资完成后,赵长鹏对这位年轻人的唯一建议是:“坚持把产品做好,不要那么着急赚钱。”
这笔融资之后,一切都在加速。不久后,赵凯做出了一个更艰难的决定——正式办下辍学手续,开始全职创业。
如果让赵凯讲述自己的经历,就像一部剧情进展飞快的创业小说。
小学三年级时,他第一次读到《硅谷之火》和凯文凯利的书,让他第一次对大洋彼岸的科技世界有了初印象,并且开始不断折腾——自学编程,积极参加各类竞赛,拿奖,为来到硅谷做准备。
2023年,赵凯考入美国圣何塞州立大学,迅速开始了创业历程:大一时和学长一起研发大学生恋爱App,拿到20万美金融资,八个月后项目失败;大二时,参与创办数学学习应用MathGPT Pro,入选奇绩创坛,拿到早期投资。
但第二段创业让他觉得,纯文字类的拍照搜题App,已经触碰到天花板。于是,在2025年,他和谷歌AI工程师James、室友Nick正式成立了新公司VideoTutor,依旧围绕解题场景创业。
VideoTutor是一个AI解题应用——学生可以通过拍照或文字输入一道数学题(目前以SAT、AP等标准化考试题目为主),数十秒后,就能生成一段带有流畅的解题动画(如画函数图像、标注几何图形)、以及清晰的步骤拆解,体验非常接近一位优秀老师在白板上为你讲题。
目前,VideoTutor还在前期测试阶段,首次生成解题视频免费,此后每生成4条视频收费3.99美元。

△来源:VideoTutor
这个应用达到的成就是:产品上线20天,注册用户已超3万人,视频播放量破千万,生成了超10万条视频。
近期,VideoTutor还完成了一轮超过1100万美元的新融资。本轮融资由赵长鹏旗下的YZi Labs领投,BV百度风投、锦秋基金、Amino Capital、BridgeOne Capital 以及多位知名投资人联合参投。这也是近期北美学生创业中,融资金额颇高的天使轮融资。
赵凯说,之所以一直在教育和学生赛道里打转,除了因为创始团队都是学生,能更好理解学生群体的需求。
更深层次的原因在于,他自己也是通过接受高等教育,才有了今天的成绩:在国内上完高中,受到外国夫妇的资助,父母甚至卖房供他上学,最后才能来到美国硅谷求学,追逐创业梦想。
在完成这轮融资之前,VideoTutor还拒绝过一次高额的收购要约。
赵凯对《智能涌现》说,拒绝收购,是因为他认为如今的解题只是VideoTutor的起点——以后VideoTutor能够走得更远,能够拓展到更多科目、学习环节,成为一个多学科的产品,超越多邻国等头部教育应用。
从生成解题视频开始,瞄准备考人群
在解题场景,精准性很重要。VideoTutor的产品难点在于,如何让AI生成的视频做到精准?
赵凯解释说,首先是几何解析的难点。传统的OCR识别技术很难做到精准,VideoTutor在产品中,内置了一个几何解析器,能够把三角形、平面几何、线形等图形转化成大模型能够理解的机器语言,准确描述点、线、面之间的几何关系。
其次是动画渲染,以往的很多软件产品,在渲染动画时会出现元素错位问题,比如曲线没有出现在正确的坐标轴上。
针对这个问题,VideoTutor团队从底层开始重写了一套动画引擎渲染协议,能够把不同的元素精确放在不同位置,通过代码,可控地让引擎去渲染每一帧画面。
答案的准确性也是痛点之一。因为大模型有幻觉,很难保证答案100%准确。VideoTutor采用两层模型去对比答案——如果题目比较难,会通过Claude和Gemini两个模型校正,答案一致才输出,保证准确性。
最后是大量的真实样本训练。VideoTutor已经生成了超过10万条视频,并且组建了一个由SAT和AP的高分学生组成的团队。这些学生会负责标注AI生成视频哪部分讲解错了,正常学生学习时会怎么讲,这些真实反馈被用来重新训练模型。
“我们现在已经微调了数千个SAT和AP的样本视频。”赵凯说,“随着数据越来越多,生成视频的成本也在不断降低,并且会形成飞轮效应。”
这和以前的学习模式形成了鲜明对比。以往,老师需要用几何画板、PPT或其他可视化工具绘制图形,录屏讲解。准备一个小时的视频课程,至少需要后期一到两个小时的制作时间。而且这些视频是静态的、标准化的,无法做到千人千面。
这个环节甚至已经在北美催生出了著名IP,在YouTube上的3blue1brown频道,由斯坦福数学系的校友Grant Sanderson创立,同样以制作可视化的数学解题视频为主,已经吸引了近800万人订阅。
而现在,在VideoTutor的产品上,从学生输入问题到生成完整视频,只需要60-90秒。
VideoTutor的产品在上线后,也引发了不少关注。赵凯表示,团队在推特上发布了一个对比视频,把可汗学院真人老师录制的视频和AI生成视频放在一起,大家发现好像两者没什么区别。产品上线后,VideoTutor的20天注册用户已超3万人,视频播放量破千万,生成超10万条视频。
“势能为王”
不可否认,VideoTutor有一些好运气。
在访谈中,赵凯反提到了多次一句硅谷名言:“Momentum is King”(势能为王),意为初创在发展早期需要保持持续的增长势头,无论是产品迭代、用户留存、还是人才、资金吸纳速度,要保持加速的积极势头。
如今,VideoTutor的团队不到10人,团队一起租下了硅谷Sunnyvale的一座独栋别墅,离学校足够近,能够随时走访学生和老师,团队成员以天为单位迭代功能。“只有保持小团队规模、减少沟通成本,才能保证产品快速迭代。”赵凯说。

△VideoTutor团队
2025年,基础模型仍在快速发展之中,技术边界难以预料。创业时机无疑是重要的——在Claude 4.0以及GPT-5等模型发布后,基模的推理能力大大增强,这为VideoTutor的起步提供了非常好的基础。
在VideoTutor之前,硅谷也曾出现过模式类似的创业公司。2024年4月,由斯坦福大学一个学生团队研发的同类产品Gatekeep,同样专注在AI解题视频生成,曾拿到融资,引起轰动,但很快就暂停更新。
Gatekeep难以为继的核心原因,赵凯认为有两点:第一,Gatekeep创业时,当时基座模型的Coding能力不够成熟,Claude 4.0还没发布,Sora也没发布;第二,产品的动画引擎还暂时无法做到点、线、面的精准渲染。
不过,基模的发展也是双刃剑。比如,在VideoTutor成立公司没多久之后,ChatGPT就推出了Study模式。
我问赵凯,会害怕被基础模型吞没吗?
“想明白自己的价值很重要。”赵凯回答,“大模型厂商的核心使命是AGI,它们不太可能在所有细分领域都投入重兵,这为真正懂行业的应用层公司留下了生态位。我们的价值在于,比大厂更懂教育,更懂学生。”
对于赛道上的其他竞争对手,赵凯表示,VideoTutor和他们瞄准的场景并不完全相同。比如Chegg、Gauthmath对应的是日常作业辅导,学生使用动机更多是完成作业,需要快速得到答案。
“两者的根本区别在于学习动机,”赵凯解释道,“我们的用户目标非常明确——为了通过SAT或AP考试,他们有主动学懂、学会的强烈需求。而许多作业解答App更像是被动学习工具,如果只是快速得到答案完成任务,这种需求很容易被免费的通用大模型满足。”
从商业模式来看,VideoTutor目前希望让AI可以逐步替代部分线下的家教环节。如今,在美国请线下家教的价格至少是每小时100-400美金,线上网课也要约100美金一节课。从价格来看,VideoTutor如今生成四条视频仅收费3.99美元,价格已经降低数十倍。
VideoTutor希望能够先从备考人群出发,然后拓展到更多领域和科目。“K12领域的所有学科问题,理论上都可以生成讲解视频,因为K12有相对标准化的教材和知识点。”赵凯说,“未来,我们会从SAT、AP数学拓展到更多学科,从解题环节延伸到学习路径规划、效果评估,最终成为每个学生的专属AI导师。”
VideoTutor未来计划C端和B端市场同时发力。
目前,团队已经获得了第一批B端合作的意向订单。比如,一家拥有6万名学生的印度教培机构已经签署了合作协议,通过用VideoTutor让学校学习JEE Advanced(印度理工入学考试)。就在10月,VideoTutor刚刚又与美国校园社交平台Fizz达成合作,后者在美国有超过350所大学的用户覆盖。
赵凯用了十年的社交媒体头像是他最喜欢的角色——超能陆战队的主角Hiro,一位天才极客少年,用自己的科技才能去帮助他人、改变世界。
“美国有很多孩子请不起每小时400美金的家教,但他们同样需要好的教育。”赵凯说,在未来,VideoTutor最大的目标是能达到教育平权,让更多孩子拥有好的教育资源。
*Videotutor官网及招聘需求:https://videotutor.io/。
封面来源|企业官方