对话语鲸&深言达意:将Demo做成千万级用户产品,创企如何从「Early Adopter」向「Early Majority」拓展

量子位 2025-08-01 15:18
分析师 刘萌媛
量子位智库 | 公众号 AI123All
资讯配图

人们的生活被各种各样、浩如烟海的信息包围着,信息管理是每个人日常生活中或主动或被动的必备功课。而随着大语言模型的发展,AI的技术能力已渗透信息生成信息获取等不同领域,为人们的「信息管理」带来无数便捷。

在信息获取领域,市场已涌现一大批AI工具,在主动信息获取(有意识、有目的地去获取信息,以AI搜索、Deep Research产品为典型)和被动信息获取(不抱有目的、基于休闲社交或环境感知获取信息,以今天访谈涉及的「语鲸」为典型)层面都有覆盖。

现如今,一方面AI的普及使信息的“生产-分发-消费”链条发生了质变,新的机会成批出现;另一方面底层模型水平相对接近,核心场景已被巨头布局。在这一背景下,AI信息类产品如何寻找新切入口,完成差异化的功能设计,并做透场景呢?

近日,量子位智库AI产品Time栏目邀请到了「深言科技」创始人岂凡超,基于深言在AI搜索产品深言达意(原反向词典)和AI信息流工具语鲸上的成功经验,为我们给出答案。

资讯配图
「AI产品Time」深言科技直播截图

访谈公司和产品简介

深言科技旨在打造基于大模型的新一代智能信息处理平台,为数亿脑力劳动者和数千万信息密集型组织重塑信息处理全流程,目前已获得红杉中国等顶级机构数亿元投资。

旗下产品「反向词典WantWords」,正式运营2个多月用户数即达数百万,后续升级为「深言达意」,旨在满足用户遣词造句层面的需求,现用户数已过千万。近来深言又推出新产品「语鲸」,定位为让用户10倍提效的个性化信息助手,能够订阅、聚合、总结用户关心的信息,解决信息焦虑,焕新AI时代用户阅读体验,正在多模态内容和个性化的内容加工方式上持续迭代。

访谈Key Takeaways


以下为深言科技创始人岂凡超和量子位智库的详细对谈内容。在不改变原意的基础上,量子位智库进行了部分内容修改及简化。

01 从自身需求出发搭建产品框架,结合用户反馈持续迭代功能

量子位智库:首先请介绍一下深言科技的两款产品。

深言科技:先从我们更早的产品深言达意开始去介绍。目前它支持网页版,还有微信小程序。

深言达意,顾名思义,所谓达意,就是想要去找到合适的词语或者句子的语言表达,来精准的表达自己想表达的意思。它的Slogan就是懂文字,更懂你

核心功能主要包括三个模块:找词、找句和素材库。

资讯配图
深言达意,可根据模糊描述找词找句

深言达意其实来源于我在读博的时候做的一个小Demo,叫做反向词典,当时也是去做自然语言处理研究的时候,我们最早发现有了预训练模型,当时还是Bert。我们发现他对于语义的理解能力比之前强很多,就正好找到了这样一个使用场景。一方面,它是这个模型的语义表达能力的一个比较好的验证,另外一方面我们做完之后也发现这其实是一个挺有意思并且挺有用的一个使用场景。

我自己当时经常要写论文,不管是英文的论文,还是中文的一些项目材料,甚至汇报的PPT,经常会有这样的想要去找到合适的词语或者句子的需求。正式做了这样一个Demo后,通过一些用户和媒体自发的传播,到现在为止已经有超过1000万用户了,后面我们把它升级为深言达意这样一款产品。

我们最新推出的语鲸,核心想解决的问题就是——在越来越严重的信息爆炸的时代怎么去帮助我们用户去更高效地获取到有价值的信息。这个产品目前有网页版和APP,此外也可以通过网页插件和微信服务号去获取服务。

核心功能包括订阅、智能大纲、专题聚合,以及日报(APP端独有)。

资讯配图
资讯配图
语鲸,实现信息收集、分发、消费的全链路闭环的信息获取助手

量子位智库:深言很精准很微妙地把握到人们在信息获取中的一些需求,比如害怕遗漏信息或者得到错误的信息,然后把这种需求转化成有针对性的功能。深言推出的两个产品是怎么做到抓准需求、了解用户的呢?

深言科技: 深言达意的产品,小到二三年级的小学生,大到五六十岁的资深人士都有我们的用户,一些媒体人和编辑也在用这个产品。语鲸面向相对更年轻一些的用户,我们称之为「Young Professional」,向他们去提供更高效的信息获取的服务。

刚刚聊到说怎么去定义或决定这两款产品及里面的功能,从我这两个产品的经验,最核心的点就是从我自身的需求出发。前面也介绍到最早做深言达意的前身「反向词典」的时候,也是因为我当时写论文写报告遇到的卡点。我们在去做技术研发和一些新的研究方向确立的时候,碰巧碰到了这个点,把它做成一个Demo或者产品,一方面先满足我的需求,另外就是做完这个需求之后,我们其实没有做什么正经的产品运营和增长,我先开始用,然后推给实验室的其他同学,然后实验室的同学又推给隔壁实验室的其他同学,一圈一圈地去拓展。

我印象很深的是,读博读到后期时,AI已经开始朝着所谓大一统的方向去发展了,原来自然语言处理可能还分成自然语言理解、自然语言生成等不同的方向。但后面有了预训练模型之后,各个AI的研究领域开始趋同。我们称之为「百川入海」式地合成一个大的研究赛道。原来做不同领域的自然语言理解的任务开始统一用Bert模型来做了,做不同的生成领域的任务开始用GPT模型来做了,后面Bert和GPT不同理解和生成又开始做融合,GPT架构逐渐一统天下。再往后多模态、甚至是具身智能等不同领域的研究都开始用同样的模型架构去做。

我作为一个当时的研究人员就发现要看的论文越来越多了,要关注更多的研究成果,要关注的信息量比原来高非常多倍,决定创业之后,又不光要了解技术,还得去了解产品、商业、管理等。获取到的信息有一个爆炸式的增长,我当时的信息处理能力和我需要了解的信息之间有一个巨大的鸿沟,必须得有一个产品去辅助我解决这个问题。

我此前也是很典型的一个RSS阅读产品的用户,经常发现,订阅了很多的内容但是时间不够用,没法去消化完这么多信息,一下子动辄999+或者是几千篇的未读文章里,到底哪些对我最重要,其实我很难去挑选。从我的需求出发开始去想,是不是可以把相同的文章去聚合在一起,就不用每一篇都去看了。如果我今天太忙了或者想偷懒,想有个今天核心要点的信息速览和扫描,是不是有一个类似于日报的功能,把最重要的给挑出来,让我几分钟的时间就扫完。

所以都是从我自己的需求开始延伸,然后逐渐地去把语鲸的产品框架搭了出来,把这些功能一点一点做了出来。总结一下就是可能不同人去做产品都会有不同的思路,但是目前为止就深言达意和语鲸来讲,很多都是从我自己的切实需求出发去决定要做的。

量子位智库:两个产品现在发展的功能越来越复杂,其中有一些细分的需求是推出后根据市场的反馈添加上的。深言在对外的需求发掘上是否有一些心得?

深言科技: 日报的语音播报功能,其实我自己本身没有这个需求,我通勤时间短,也不开车,而且我觉得眼睛阅读的速度更快。日报功能推出后很多用户在后台反馈希望有一个语音播报的功能,我们收到这些反馈之后,就开始去挖掘用户背后的真正需求:到底是什么类型的用户在什么场景下,想要用这个功能去满足他的一个什么价值,或者说现有的产品功能为什么不能够去满足他现在想要的这个价值。我们约了很多的用户访谈。看看大家为什么会提这样的诉求,是一个什么样背景的人,平时怎么用这款产品,在什么时候用什么场景中去用。

了解清楚真正的需求和价值后,我们会进一步判断现阶段这个产品主要服务的目标人群,会不会有更大比例的人有这样需求。借助数据统计,看看类似的反馈是不是有很多,满足这样需求的画像的人群是不是比较多。最后可能就需要通过一些Sense上的判断:这个功能是值得做的,也是符合我们想要满足的目标人群的价值,也符合产品发展的主要方向。

我们非常重视用户反馈,不管是之前的深言达意还是现在的语鲸,我们主动会去做用户访谈,我自己平时每周至少会做五次的用户访谈,广泛地收集大家使用这个产品过程的反馈,挖掘到一些可能是我们自己作为用户的盲区的一些新的需求。大家的反馈进入到我们的需求池之后,综合地去判断哪些需求我们要去上。

02 信息管理本质是「5W1H」,AI让被动信息获取从「库存逻辑」变「订单逻辑」

量子位智库:两款产品都是信息管理类产品,您对信息管理整体的认知是什么?

深言科技:深言达意是一个更早的产品,它其实切入的是你在进行文字内容创作的过程中的一个步骤,或者说一个环节,我们称之为「遣词造句」的环节,来进行辅助。它更大的定位是在比较长的、以人为主的内容创作流程中,去满足其中一个环节,并且把这个环节做得比较深和彻底。是在信息生成环节来做的事。

语鲸是在信息获取环节,就是在前置的人的大脑从各种各样的媒介中获取信息的过程中,怎么去辅助人大脑去更高效地完成这个过程。信息获取也是我们近期聚焦的方向。

前段时间分享过「5W1H」的分析框架,包括What、Who、Why、When、Where和How。

对于信息获取而言,What本质上是指创作者把信息加工,编码成文字、图片、声音、视频等不同媒介的内容,再通过现有的各种各样的方式去分发出去,我可以在图文、视频、声音等内容平台获取到当时创作者创作出来的加工好的内容,然后我的大脑再去做解码。

Who包括信息的创作者、分发平台、信息的消费者这三个核心角色。

Why就是为什么我们要获取信息,获取信息不是目的,只是手段,获取信息一般有两个目标:功能性的需求情感性的需求。功能性需求是指为了获取某个知识,或者说解决某个问题,做出某个决策,需要去获取特定的信息。它反映的是人的脑区的变化,可能是你的突触或海马体会进行相应的变化。情感性的需求是指想要获得喜悦,缓解压力,或者缓解孤独等。它反映的是大脑中的激素和神经递质的变化,尤其是多巴胺的变化。

When就是什么时候我们需要去获取信息,可以概括为两种类型,一个是主动的获取信息,就是有意识的、有目的地去获取信息,很多功能性需求,其实是跟主动的获取信息是一致的。另外一类是被动的获取信息,不抱着任何的目的,看到什么算什么,可能是出于休闲社交,或者当前的环境感知等去发生的。当然这两种有时候会交替进行。

Where就是信息获取发生在哪里,可以分成不同的媒介,纸质书、数字媒介。数字媒介也分不同的终端,手机、电脑,甚至是VR、AR的设备等。信息获取还可以发生在不同的内容平台,视频平台、图文平台、音频平台等。

最后一个H就是How,就是怎么去获取信息,这也是我们认为在AI这个新的技术浪潮发生的背景之下,会有一个比较大的变化的点,即获取信息的方式。

信息获取发生的时机可以分成主动和被动两种,主动获取经历了不同的变化,最早是导航网站目录索引,后面又有了搜索引擎,作为迄今为止最主流的主动获取信息的方式。被动获取信息也经历了不同的技术革命,一开始有人工筛选,在门户网站上,然后又有了社交分发,最早是Facebook推出来的,包括我们在朋友圈看到的内容其实都是通过你的社交关系链,去把相应的内容推给你,后面又有了推荐引擎,很典型的就是2012年推出的今日头条,根据你的偏好,利用推荐引擎推荐你可能感兴趣的内容。

到了现在的AI时代,我们认为主动和被动获取信息其实都会发生比较大的方式的变化。主动获取信息很典型,现在越来越多AI搜索的产品出现,甚至我们在ChatGPT、DeepSeek这样的Chatbot里都可以用搜索的能力,我们现在可能都不再用传统的谷歌或者百度搜索引擎去获取信息,这是有了AI之后主动获取信息方面发生的变化。

那我们也在思考的是,被动的获取信息有了AI之后也会有一些大的变化,因为当前最主流的推荐引擎,这样的被动获取信息方式的变化其实已经发生了。有了AI之后内容的量会有一个爆发式的增长,越来越多的文章、视频都用AI辅助加速生成甚至全自动生成,这些都会导致创作内容门槛更低、成本更低,内容的供给会过剩,推荐引擎的一个特点就是有可能给你推一些重复的内容,而且是基于更多的大众的点击行为、浏览行为去给我推的内容,往往不一定是对我价值最大的内容,或者我感兴趣的内容,这是现在推荐引擎遇到的一些问题。最主要的是,它给我推的一整篇文章,或者说一整个视频,里面其实并不是所有的片段对我来讲都一样有价值

比如我看了一篇OpenAI出个新模型的文章介绍,再看另外一篇,发现百分之七八十的信息都是重复的,大部分片段对我来讲没有什么增量价值,只有个别的那些片段,可能额外引入了一些其他人的讨论,或者有自己独特的观点,这些才对我有价值。我们观察到很多用户去看一篇文章的时候,快速地去划,然后看到某个片段感兴趣停留下来去看完它,再去滑,寻找下一个感兴趣的点,在滑的过程其实我们认为是不太愉悦的,或者说不太高效的过程。同样视频我们也经常会出现长按加速或者拖进度条跳过某些片段。现在的推荐引擎的分发方式没法解决这个问题。

有了AI大模型之后,有可能去解决掉现在以推荐引擎为核心的,被动的信息分发方式的一些问题。当AI生产内容的成本足够低,效果足够好,速度也越来越快的前提下,原有的先生产再分发再消费的逻辑,可能就会从底层上发生变化

我们认为核心的解决办法,就是为每一个人做个性化的生成。原来可能是先有的内容,有什么你看什么,现在一个理想化的点就是,你想看什么我再给你做什么。从所谓的库存逻辑变成订单逻辑了,也从原来以生产方为核心去生产内容,变成以消费方为核心去定制化生成内容。有了这样的变化后,你看到的内容就是专门为你去定制的,不会有你不感兴趣的片段,甚至还可以批量地去制作,对你来讲价值最大的,不管是功能性需求,信息密度很高,还是说情感性需求,最能戳你笑点的或者说最能让你看得爽的内容,都可以根据你的偏好去做个性化的定制化的生成。这是我们认为说在AI大模型这样大的技术革命下,信息的获取和分发的方式可能会带来的非常Exciting的变化,尤其是被动的获取信息的分发方式。

量子位智库:听起来其实是一种超级个性化的方式,之前我们以单篇文章或者单个视频这样整个内容去做分发,现在可能是一段话或者一句话这样的信息力度去做分发。在AI时代,对于所有的信息类产品来讲,最关键的需求是什么?哪些新产生的需求值得关注?

深言科技: 分发的颗粒度非常关键。从最早门户网站,到后面的推荐引擎或者说社交分发,分发的颗粒度确实是在变小。我最早在02、03年接触互联网的时候,当时有很多的门户网站,新浪、搜狐等,网站里会分成很多的版块,财经、游戏、娱乐八卦等,我会在我的浏览器收藏夹里把感兴趣的版块收藏下来,有时间时我就点进去看一看今天又更新了什么内容。其实一组内容作为最小一个分发单元,我能收藏的就是那一个版块的URL链接。

后面有了社交或者推荐引擎的分发,内容颗粒度发生了变化。比如我对某个歌星很感兴趣,但我对其他的娱乐领域的内容可能都不感兴趣,放在原来门户网站时代,很难去做到这一点,因为之前要看就必须在整个娱乐板块里面去筛。假如我对周杰伦感兴趣,对林俊杰没有那么感兴趣,有了推荐引擎,它知道我的偏好,就可以去推荐周杰伦的相关文章而不会推荐林俊杰的八卦消息。颗粒度由原来的一组内容,变成单篇的内容。

到了AI时代,内容的颗粒度可以变得更强,可以小到我们称之为一个信息点。因为一篇文章或者一个内容里面包含了非常多的信息点,用户不一定对所有的信息点都感兴趣。将内容的颗粒度拆得更细,拆成更小的信息点之后,基于这些信息点再去分发,就能够去更极致地去满足用户的个性化需求。比如说我只对周杰伦新出的歌感兴趣,对他个人的家庭生活、八卦消息没有那么感兴趣。我会希望在包含了多种类型信息点的最新动态里,能够帮我挑出来跟他出新歌相关的消息。

信息分发的颗粒度变得越来越小,从第一性原理来讲,所有这些变化的本质都是都是为了追求更高的效率。底层的驱动力都是怎么能够更高效地达成获取信息的目的,以此来推导,我们认为更细的颗粒度以及更加个性化的生产,是符合这样的趋势的,所以它会成为接下来更多的信息分发和获取的产品的新功能。

量子位智库:市场上我们看到很多产品上线了Deep Research或者更深度的AI搜索功能,也有很多知识库产品的出现,那么对于不同类别的产品来说,如果按照提高信息获取效率的第一性原理,一个好的信息类产品的判断标准是什么?

深言科技:对于生产力场景,或者说功能性的信息获取需求来讲,会更容易衡量一些。

以刚刚提到的Deep Research这类产品为例,它属于主动的获取信息,比如我现在需要了解一个行业,或写一个文献综述、报告,想要AI快速帮我打个草稿,或者生成底稿,我的目的是比较明确的,是一个功能性需求。围绕这个需求,我原来可能要去搜资料、看到相关的片段就把它记到Word文档或笔记软件、再对照着搜到的内容去思考、然后去写草稿或写文章。

有了Deep Research,它能够帮我完成所有的链路。它自动帮我搜相关的文章、找到相关的片段,然后把这些片段组织起来搭一个提纲,并且沿着提纲去把具体的内容填充好。原来可能以周为单位的任务,现在能够以十分钟为单位来完成,这就是一个巨大的功能性需求的效率提升。

对于一些我们称之为娱乐性需求的信息获取任务也一样,它不太好度量,如果说我们有一个生物测量仪器,可以测量到用户激素分泌的情况,看一下是不是在单位时间内消费AI生产的个性化内容,能比刷现有内容平台的内容带来更多的多巴胺的分泌,或者说带来更强的刺激,严格来讲也可以去衡量,但是不像功能性需求的效率提升衡量起来那么方便。

03 传统产品融合AI能力,将清楚简单的功能打磨到极致

量子位智库:深言的两款软件都属于功能融合得很好的复合体,深言达意融合了写作和AI搜索,语鲸更像是AI总结和RSS订阅的结合,作为开发者,在功能融合过程中哪些细节是非常重要的?

深言科技: 举例而言,原来可能有RSS的产品功能,后面加了AI能力后,可以给它做一个总结,帮助人们看得更快。这个产品比较清楚和简单,但为了做好这个链路,其实我们还是下了很多功夫,有些功能做了很多打磨。

比如说做总结这个事。前面也提到现在的大模型做总结时可能会有幻觉和遗漏。人们不能够相信AI生产的内容有足够置信度。另外一方面,做总结看起来都是总结,但有不同的目的,有的总结是为了帮你去筛选内容,就是我看了这个总结之后再决定我要不要去看这篇文章的原文,或去了解其中的某个细节,有的可能我看完总结就跳过不用看这篇文章的细节了。还有一类总结,它希望能够让你通过看总结,就能够取代原文中的某些部分,可以不用去看原文的某些片段就能够了解其中对你最重要的信息。

为了满足不同人在不同场景下的总结需求,语鲸其实提供了不同颗粒度的总结,我们的每篇文章都会有一个全文速览的内容,它的字数我们控制得非常短。原来我们也测过150字左右的版本,现在我们又压缩到60字左右的版本,速览的一个核心价值点就是说让你判断这篇文章是不是值得看,甚至在我们新版的语鲸里,在内容列表中就可以快速去看完这六七十个字,都不用点进去就能快速知道这篇文章在讲什么事。尤其现在很多文章为了提高阅读量,会在标题上设置一些悬念,我们也会在速览里面尽可能地回答出来。

看完全文速览后,用户可以做第一个决策,要点进去看它了解更多细节,还是跳过它看下一个内容,如果要跳进去,要想看这篇内容的细节,我们层次化总结就再去进行引导,根据目录或第一层级的大纲,快速去找到感兴趣的那个片段。比如OpenAI发新模型了,我会关心测试效果和上一版本模型相比效果好了多少,那这篇文章里面第一部分讲了模型的基本情况、架构、参数量等,第二部分讲了它的效果,第三部分可能讲了一些后续的发展或者说其他人的评价。我就直接点第二部分,然后展开再去看它具体的细节就好了。

我们把整个从最粗粒度的筛选到不同层级粒度的,想要去定位和看细节的整个链路给串起来了。哪怕总结看起来一句话就可以说出来,但去深挖也会有很多的不同的场景和不同的用户需求的满足。

04 功能迭代需挖掘用户反馈背后的需求,小步迭代减少冗余可能

量子位智库:很多AI产品都想覆盖完整的工作流,开发越来越多的功能,去满足不同场景和用户的需求,那怎样控制功能开发的节奏和优先级呢?

深言科技: 我们在做产品的过程中会不断地思考,需要去做迭代的重要决策,做产品的过程中很容易就把功能做得越来越多、越来越泛,如果已有资源非常有限的情况下,可能天然会有客观条件限制,但如果说本身有一些资源可以去做很多的功能,怎么去做决策和选择,甚至比较克制地去做这个选择,是一个挺有挑战的事情。我们在做的过程中也是一边做一边思考,甚至反思我们之前做过的一些产品决策。

目前为止很重要的就是以用户需求为核心,前面也提到我们做日报播报功能时,先去收到很多用户的反馈,再去跟用户做了一些交流,了解清楚什么时候、什么场景下、什么样的人需要去用这个功能,能够满足什么样的价值。我们把这整个链路了解完之后,我可以想象出来,有了这个功能之后,这类用户会在什么场景下怎么去用这个功能,相比于没有这个功能的时候,用户是不是觉得用得更爽了,或者说给用户带来更多价值了,我们把这条路去想通之后再考虑去做。

还有一点我认为比较重要,就是小步迭代

还是以刚刚说的语音播报为例,目前我们只做了日报的语音播报,没有去做所有文章的总结内容的语音播报。这个功能之前也规划了很久,但一直没有上线,或者说分成了两个阶段,考虑先去上线日报的播报,再考虑说去上线每篇文章的播报。也就是说,我可以先去上线一个功能,上完后拿到更多的用户反馈,看看这个功能是不是能够达到预期。我们获得了一些新的认知和新的信息,再去做第二步的判断时也能够更明确一些。把大的功能拆分成更小的功能去分阶段上线,不用一下子把功能做得非常多或冗余。当然这个过程里面其实也有很多的不确定性,我们也很难说每一个决策都做得非常完美,也踩了一些坑,有时候容易把功能一下子做得更多,但后面就得再去迭代复盘,去做每一个功能的时候多去想是不是可以先拆解,是不是可以分阶段再去上。

05 做产品面临的决策点多于做模型,避免过度等待技术进步影响产品开发进度

量子位智库:除了拆解和分阶段去上线功能,如果现在回头去看,关于产品迭代可能会给当时的自己什么样的提醒,哪些事是不应该做的?

深言科技: 回过头来看,最大的可能会改变的一件事,就是尽量把技术的研发和产品的迭代解耦开来

其实我们23年的时候开始看到大模型可能会有幻觉的问题,而且我们团队本身之前也从0到1训过很多预训练大模型,我们当时技术上判断幻觉的问题是一个需要长期去考虑解决的问题。不会说大模型做一次迭代就能很快就把问题彻底解决,这也不太符合Transformer架构的概率语言模型第一性原理。我们决定要尝试尽可能去解决模型幻觉的问题,让它生成的内容更可控,更可信。围绕这一点需要做很多的技术的从零到一的研发,甚至在整个的学术界也是一个很有挑战的事情。当决定去做这个技术的时候,其实要考虑它有很大的不确定性,是属于研究探索阶段。

我们一边要考虑技术效果的迭代,一边要考虑想要让这个技术尽快去上线,让产品能够达到我们预期的效果,让产品也能尽快上线。这导致技术的研发和产品的研发迭代,两边会互相掣肘。我们总结下来,这是我们之后要去做一个有一定的技术创新的产品时要避免的一个问题。

量子位智库:做模型跟做产品之间,最关键的思路差异是什么?

深言科技: 不管做预训练模型也好,针对模型从0到1训练也好,做后训练一系列的工作也好,现在的范式是在朝着越来越明确和统一的方向去走的。模型的主体思路可能从22年的时候的InstructGPT开始,大的框架就确定下来了,当然后面又有了强化,通过更高效的、更多的采样来去提升上限,但是整体的框架是相对确定的。我们当时从零到一做预训练模型的过程中,发现要做的事、要解决的问题是相对明确的,而且大家的思路越来越一致,可借鉴的东西也越来越多。

后来做产品的话就会发现,因为模型的技术能力一直在变化,产品其实你能想到可以做的事是非常多的,它是个更大范围的不确定性,或者说是一个更大的空间中的优化问题。在这么大的空间里,你的选择非常多,尤其像你也想去做一些不一样的产品,而不是快速复刻一个产品,面临的决策点在一定程度上比从零到一做模型的过程中遇到的决策点要多很多。要考虑要满足什么样用户的什么需求,这个功能要怎么建,产品的边界怎么去确定,哪些功能要做,哪些功能不做,哪些先做而哪些后做。

06 基于用户真实使用场景测试模型能力,产品要有自己的技术判断才能避免被模型迭代覆盖

量子位智库:从用户体验和产品落地的角度,我们怎么去判断一个模型是好的?怎么去判断我们的产品在模型的哪一点上做改进,能够保证未来不会被模型自己的代际提升去吞噬掉?

深言科技: 第一个问题,怎么去评判模型。产品可能不需要用到模型的所有的能力,可能看重的就是它某一方面或者某几方面的能力

我们自己体会下来,需要去基于你的真实场景来测试这个模型的能力。如果有条件的话可能需要自己去构建一个测试集,这个测试集越逼真、越接近真实的用户的使用场景越好。有了这样一个测试集,可以快速地去测,看不同模型在这个测试集上的效果。当然怎么去搭测试集、怎么去做评测,以及怎么定评测的维度和指标,要展开的话又是一堆坑和问题,之前我们也花了很多时间。

你必须要对用户需求有比较深的理解,知道用户在这个场景下,或者说在你的这个产品上最看重的是什么,同时你要懂模型,怎么去充分发挥出来模型在这一点上的能力。有了这两方面的前提条件,你才能构建好一个评测集或者Benchmark,然后才能衡量出来不同模型的能力。当然这是一个相对来讲比较奢侈的方式。

更快的一个方式,就是不需要做这么严谨的评测,很多能力我在直观上判断,它可能已经能做到六七十分时,我先上一些模型,先把这个产品推出,然后让用户去反馈。后续再去不断做一些A/B Test,或者做一些不同模型的测试,把这些模型去换出来。甚至先上一个最强的模型,然后逐渐地换到更弱的模型。我看到有些做AI搜索或AI客服的公司就是这么做的,一开始上OpenAI最新的模型,后面开始用开源模型或更小的模型,然后发现用户用起来好像没有什么负反馈,或者用户使用数据没有明显的下跌,便宜的模型仍然可以满足用户的需求。

第二个问题是怎么避免技术研发被新的模型迭代覆盖掉,这可能是做大模型产品才要额外考虑的问题。

背后的底层原因是现在的大模型技术还在动态的演变的过程中,不像之前的互联网或者移动互联网时,技术是相对确定的,大部分能做的已经确定下来,后面的变化和发展不会影响非常大。但是现在大模型技术特点会变成什么样,大家还不知道,它会在多快的时间内达到什么样子,终点会是什么。它最终能达到什么样的AGI是不确定的,它需要多长时间达到又是不确定的,这两重的技术发展的不确定性,就会使得做产品的人就得额外去考虑这个维度。

我自己认为能做的有两点,第一点是多关注一些技术前沿,去找找在做最前沿模型的人聊一聊,比如OpenAI、Google DeepMind、DeepSeek等,看看他们在干什么,他们重点在解决什么问题,你能够收集一些前沿的信号,可能帮助你去判断未来的技术趋势。

第二点,也是我们做过思考的事,就是从第一性原理思考,或者说有一个技术的直觉和判断。我们之所以在23年底的时候决定去做低幻觉可控的技术,是来源于我们对模型底层技术原理的判断,因为它再怎么说也是一个概率语言模型,只要是概率语言模型,那每一个token生成时都有一定概率出错,生成得越长,累积起来出错的概率就会越大,完全避免出错是不可能的。模型的多样性和幻觉问题是一体两面的,绝对意义上的没幻觉是做不到的,如果卡得非常严格,把温度调得非常低,还是有可能有不确定性,而且当不确定性非常低的时候,它的创造能力也会非常弱。所以我们从第一性原理出发,认为解决或缓解模型幻觉是值得长期去投入的一件事,是模型一时半会不太能去解决的问题。后来去看,确实如此,像最新的一些推理模型,o3、o4、DeepSeek R1,这些模型的幻觉是比之前的非推理模型还要更强,这个问题会变得更严重。

量子位智库:Vibe Coding的出现,降低了产品开发的门槛,大家觉得直接调用现成的模型,或者直接用开源模型就可以做出好的产品,深言走的路线是两手抓,是基于什么样的考虑?

深言科技:创业像大航海一样,大家去做技术的探索,或者说整个行业的变化,不是一维线性的变化,而是可能无穷维的,谁也不知道下一步会怎么样、未来会发展成什么样的状态,所以大家就八仙过海,各显神通。我能够去先抓住一些确定性,我就先去做一些确定性的事,我能用现在的技术去跑通PMF,那自然是最好的,不管是AI Coding也好,还是AI搜索产品也好,其实一定程度上它的价值是被验证的,当然商业模式和商业化能不能跑通大家还在去做验证。但是我能够抓住一些确定性,能够至少让用户开始用,甚至愿意付费,这个事已经很不容易了。到现在为止,真正跑通PMF的AI原生产品还是相对有限的

另外一点,现成的模型,不管是用开源的也好,还是调用闭源的API也好,能把产品快速做出来,哪怕去年只是五六十分的水平,今年可能做到七十分,未来肉眼可见能做到80分甚至更高了,这已经是能够消除很多的不确定性,能够让这个产品至少能体验,用户能够用起来有个感受,这个事还是蛮重要的。对于做产品来讲。不能用对或错来衡量,大家找到各自的特点和最擅长的事,把它做好,本身就是一个挺有价值和挑战的事。

对于深言来讲,本身其实是有比较强的技术基因,在2023年时,模型整体技术能力还没有像现在这么强,我们选择的方向,产品需求上需要内容的可信度和可控性。技术上降低模型的幻觉是一个值得挑战、有价值,而且一时半会不会被覆盖的方向,正好将两者结合起来,发挥我们团队的特色和优势去,决定要去做一些新的技术研发,同时基于我们创新性的技术,再去做出一些新的产品来,这是最适合我们自己的一条路。如果非要说优势的话,我们的技术选型上可能比只用现成模型的公司而言,多了一些选择做产品的时候的可行性,以及自己技术的差异化优势。

07 现阶段很难达到稳固的PMF,指标主要看重用户留存

量子位智库:语鲸中的智能聚合和专属日报是属于典型的AI原生功能,那么AI原生产品PMF判断的关键流程跟指标是什么样的?

深言科技:坦白讲,我们也没有找到一个真正的所谓「金标准」或者明确的数值化的标准。

背后有几重原因,首先我当然可以用之前的产品指标,如果是IAA(In-App Advertising,应用内广告)产品,即靠广告变现的产品,我要去看用户的留存时长,然后去算一下用户的LTV,看一下现在的用户是不是能跑通等,尤其是像之前有很多经典的一些留存率的指标,这是之前传统的互联网或者移动互联网产品会看的。

如果是IAP(In-App Purchase,应用内购买)产品,看订阅的话,其实也可以去算ARPU,看我收入的指标,还有利润率等一系列指标。但是一方面我觉得还是早期,越大的技术变革,它的这种商业模式其实不确定性很大,而且产品本身是不是一个最终的可持续的产品其实也是值得思考的一个问题。

Google在找到搜索广告的商业模式之前,一直比较艰难地尝试看怎么能够赚钱,用户越来越多但成本一直收不回来,没有找到一个很合适的商业模式。如果没有很快地找到搜索广告的商业模式,可能早已经死掉了。但后面找到了搜索广告的商业模式之后,一下子快速达成了PMF。前期他有很多用户时,给用户带来很多价值,但在商业模式上没有跑通,那这个算不算PMF呢?我觉得这个也值得探讨。

对于现在的AI产品来讲,也有一些产品本身找到了商业模式,甚至已经在赚钱了。像之前的Midjourney,这样很典型的很不错的公司,很好的产品,但随着竞争的加剧,越来越多更新的技术出现,更低的成本能够去生成图像,甚至交互上也更方便、使用成本门槛更低,那原来的产品的PMF状态是否又会发生变化?这其实也是值得思考的一个问题。技术的动态演变非常快,有可能把原来的PMF状态破坏掉,原来能跑得通,现在跑不通了。

可能大部分的国内的或国外的,免费的IAA产品还没有尝试通过广告的商业模式来做变现,大家只能看用户,用户时长和留存是不是有可能被新的产品抢走,以及加了广告之后这个商业模式能不能跑通,推理成本能不能被广告收入覆盖到,其实都还有很大的不确定性。即使你是IAP产品,有了很多的收入,甚至是盈利的状态,有没有可能被新的产品突然覆盖掉,导致普通的商业模式不再成立,这个也有不确定性。

最后可能还是得回到我们具体的这些决策,要去评判说这个产品到底是什么样的状态、要不要继续再投入去做,我的北极星指标是什么,我应该先优化什么,这些事最终还是得落实到我们的具体的决策和行动上。一定程度上综合直觉来做判断。比如我认为现在我们最重要的是留存,那我们认为留存能够达到一定的指标,PMF就有可能跑通。或者说我能进入到下一个阶段,我可以再去追寻下一个指标的优化。然后我先有了用户,有了留存,有了市场,我再考虑商业化。还是说我现在就通过IAP,想尽办法去优化ARR。在这样动态变化的情况下,很难说稳固地真正达到了PMF。

量子位智库:语鲸目前关注的指标是什么?

深言科技:目前最关注的还是产品的用户留存。从上线到现在基本上没有太大的变化,只不过一开始我们关注的是短期的留存,后面会更加关注长期的留存,不断地去迭代。之所以去关注,是因为我们认为产品首先应该是一个有一定使用频率的产品,因为它要获取信息。对于我们的目标人群来讲,不一定周一到周日每一天都需要去用。但至少是平时工作的时候还是去看的。所以我们会关注在工作日的情况下,用户是不是有在持续地用这个产品。这个产品在交互上、在一些功能上和很多主流的获取信息的产品是有很多的不同。大家对它的认知和使用方式都有一些不太一样的地方。

我们最需要关注的是用户愿不愿意接受我们这样的使用方式,是不是开始形成习惯,愿意持续地用了。所以围绕这个目标,我们关注的最重要的指标就是留存。

08 产品初期增长需找到「Early Adopter」,找准核心用户出现平台并完善产品分享功能

量子位智库:语鲸部分AI原生功能在市面其他产品上没有见过,对于很多用户来说需要市场教育。要怎么样做产品初期的用户增长?怎样让用户认识到产品的付费价值?

深言科技:我们最近在思考和做一些尝试。比如说像专题聚合的功能,之前并不是完全没有,在一些传统的新闻媒体里面会有人去帮你整理一些专题,现在的推荐引擎,比如说今日头条,也会有一些专题内容,人工编辑把一个事件相关的不同来源的内容去整合到一起,做一些分类,比如说讲事实的、讲各方观点的、未来影响的等,人工去做聚合、归类和整理,没有AI自动做的功能。现在有了比较好的AI技术之后,可以靠AI来去做到这一点。

日报其实之前也是有人工编辑的日报,很多自媒体也都会发各种各样的类似于日报的内容,但是这些日报都是通用性的普适性的内容,每个人看到的都一样。我们做的事就是个性化日报,因为我们认为并不是说整个行业领域发生的事都需要关注,而是根据用户的需求去找到过去24小时里面最应该关心的内容去聚合和整理好。

所以一定程度上是之前都有一些人工版本,或者说非个性化的版本,但现在有了AI之后,可以自动去做到自动化的、个性化的版本,它的方向其实还是前面提到的,有了AI之后人们获取信息可以变得更加个性化,更加根据用户的需求来定制化地生产,都是符合这样一个趋势的。

怎么让更多的用户知道产品是干什么的,并且能够感受到它的价值,现阶段我们的策略就是先去找到那些所谓的 「Early Adopter」,就是找到那些真的在这个领域里有比较强的痛点,也尝试寻求过解决方案,但之前因为没有现成的技术或者产品,没有得到解决的这些人群。我们现在比较早期的一些用户,可能大家都是尝试过各种各样的信息获取的产品,很多人本身就是RSS类型产品的深度用户。他们可能在使用语鲸时发现,这个功能可能是我之前用传统RSS或者其他的获取信息的产品时没解决好的一点,大家会比较熟悉地很快上手,开始感受到这样的一些能力。这是我们从覆盖用户群的策略角度来讲。

从产品本身的角度来讲,要做的事就是降低这个产品的理解门槛和使用门槛。这个事我们也在源源不断地去做,最近一直在去做版本改版和功能迭代,我们根据后台的数据指标和用户反馈,尝试将功能做得更明确,将功能之间的关系做的更清楚,在产品设计上和交互设计上,尽可能做得更简单易懂。

量子位智库:深言主要通过什么方式挖掘首批种子用户?AI时代的用户推广和互联网时代的投流是否是不同的?

深言科技:还是从第一性原理来去看这个问题,归根到底要想的就是你的核心的那些用户,他们出现在哪。在这个物理世界出现在哪?数字世界出现在哪?尽可能去他们可能出现的地方去找到他们,这是第一。第二就是你要去介绍清楚,产品到底会给他们带来什么的价值,跟别人有什么不一样。在任何时代下,做Marketing,或者要把自己的东西给别人用、卖给别人,其实底层上都是这回事。

AI新时代之后,我们看到很多的产品会非常的爆火,或者说通过自媒体一下子做很快速的传播,形成很强的轰动效应,背后反映的点在于,大家的注意力放在AI会越来越多,这是一个行业的早期,或者说是一个新概念、新技术早期会有的特点。尤其像这波AI,各种各样的事件,让更多的人群都开始关注到了,所以大家会担心说AI会对我的工作、学习、未来带来什么样的影响,要去考虑怎么不被AI取代、怎么提升自己的能力。大家都会有这样的注意力,以AI为垂直的信息渠道天然就会获得更多的关注和流量。大家看到这样的新的技术,新的产品,会有更多的人主动表达自己的兴趣和注意力,自然就会出现很多爆款产品。这可能跟一个技术在瓶颈期,没有受到那么多的关注和注意力的时候不一样。而且现在这种产品还会有一定的连锁效应。当大家都在讨论的时候,你自己不知道,你就会很慌。是不是我又落后了,我又被新的技术和产品甩在后面了。它的效应不是线性的变化,而是更快速的一个方式去做到传播。

对于内容平台,或者说信息分发平台来讲,小红书是一个很好的渠道。它是以图为主要内容呈现方式,当然其实视频也不少。对于新产品来讲,写半天文字,不如直接给你发个产品的图和视频介绍来得更直观。再加上小红书本身很多用户也是高线城市的年轻人。对于新的AI产品来讲,大家普遍主打的Early Adopter的公约数其实还是年轻的高线城市的人群,自然在小红书上你的受众就会出现得更密集一些。所以在小红书上去做产品的宣传,自然就能有更高的转化率,能够更精准地触达到你的用户和人群。

语鲸其实在小红书上有开号,会定期地去发一些我们产品的进展,去介绍最新的更新,然后去做一些内容的传播。语鲸刚开始做时我们团队也很小,本身没有专门的人去做内容和增长的事情。几乎所有的宣传答疑、介绍的视频文章,都是我们的用户自发地帮我们做的。他用完之后觉得这个产品很不错,愿意主动去分享出来。

量子位智库:除了把功能做好,对于一款产品而言,还可以做些什么来获得更多自传播?

深言科技:从运营和增长的视角去看,产品可以去加一些功能,去增加产品的分享率或者传播率

举个例子,语鲸其实做了比较方便的「分享」,看到好的内容时可以比较方便地分享到微信的好友、群或朋友圈。好的内容分享出去之后,自然会有朋友或群友看到相应的内容,大家点击进来看到内容是之前没见过的层级化的总结,就开始了解到这个产品。因为本身语鲸作为一个能够获取信息、消费内容的产品,可以通过以内容为载体,让更多的用户来去分享,进而能扩展到更多的新用户,去了解到这款产品。

另外一个角度,因为它是一个需要用户去定制化获取信息的信源的产品,对于获取信息的效率有比较高要求的人群,其实是需要不断地去寻找最适合自己的、优质的信源。围绕这个功能我们也正在强化,就是我可以把优质信源,甚至是所有的信源订阅源的列表都分享出去,让大家可以一键Follow。比如我整理好了一些AI领域的高质量的信源,可以分享出去,其他人就不需要一个一个地收集,在语鲸上一键全部关注,这其实也是一个自然而然能够去促进用户分享和自传播的功能。

不同类型的产品需要因地制宜,要去根据产品的特点,去思考在功能设计上怎么能够让用户通过分享等,能够获得一些价值。比如说我分享出去好的内容,能够满足我的分享欲;我整理好列表之后我分享出去,都是一些高质量信源,能够满足我有更好的信源获取的形象的树立,同时还能帮助到别人。强化这样的产品功能,去提高产品的自传播效果。

深言达意这个产品我们没有做太多设计,增加用户的分享率或自传播。它是一个很简单的搜索的工具类产品。大家之所以愿意分享,更多是因为这个产品没见过,是一个创新性的独特的产品,然后用起来确实好用,能帮到用户,用户就愿意分享。就像我用了一个很好的工具,我也很喜欢安利给别人,告诉大家这个产品很好用,你可以去体验一下。

不同的人群可能也会有一些特色,像学生群体里面很容易去做分享。因为学生群体应该是唯一一个规模很大,大家需求非常类似,并且物理空间紧密在一起的群体。大学生都住宿舍,哪怕中小学生也都在上课,大家平时的沟通会非常紧密,每个人的需求又都大差不差。所以我有一个好的产品,就很容易在学生群体里面去做出自传播来。早期的Notion其实也在这方面做的很好。深言达意也是同样有很多的用户群体就是学生。

09 初创公司做好产品也有阶段性价值,强用户洞察+产品极致化带来一定竞争优势

量子位智库:现在头部的AI产品很多来自互联网大厂,互联网大厂有现成的流量矩阵,深言的AI原生产品和互联网公司的AI产品有哪些差异?是否担心未来会被互联网大厂的AI产品所挤占空间?

深言科技:其实我们回顾之前的移动互联网时代会发现,传统的PC互联网时代巨头,在移动互联网时代依旧能够占据非常多的市场机会。

移动互联网是一个非常大的技术变革。在这波技术变革里面出现了很多新兴的产品和新一代的巨头,像字节。但上一代的巨头,腾讯、阿里等,其实也都抓住了移动互联网的时机机遇,在原有的基础上又去做大。国外就更是了,Google、Meta,同样从PC互联网时代到移动互联网时代,在转型过程中获取到了最大的价值空间。PC搜索到移动搜索,PC社交到移动社交,当然也出现了一些新一代的产品。所以有上一代的巨头会继续去做,继续去抢占一些新的机会,也会有一些新兴的团队和公司抢到一些机会。

对于这波AI浪潮来讲,仍然有可能上一代巨头占据了更多的机会。因为从技术上讲,更大的互联网公司,技术实力非常强、人才储备足够多,并且战略上足够的重视,动作也非常快,而且他们掌握了已有的流量入口和很多的用户和数据,天然有很明显的优势。对于新兴创业公司来讲,是非常有挑战的。其实我们做的事情肯定也会担心会不会被新的,或者被已有的互联网大厂的产品覆盖掉。但是我们的策略总结下来就是两点,第一就是尽量先去做大家不一定会去考虑,不一定把它作为主线的,甚至是自己做起来比较难的事情

作为创新者的窘境,很典型的一个例子是Perplexity去做AI搜索。其实我在21年底、22年看到OpenAI推出了WebGPT的时候,当时就在考虑AI搜索这个市场。然后当时分析下来,觉得国外的谷歌也好,国内的百度也好,他们其实是万事俱备的。他们有现成的技术,这两家大模型本身做的也不错。然后有现成的数据,现成的用户,听起来他们去做AI搜索好像是一个最自然而然以及各种条件具备的的公司了。但没想到就是后面Perplexity能够发展得很快,成为AI搜索产品里面一个非常典型的占据了不少市场份额的新玩家。它未来是不是能够持续这个不好说,但至少现阶段它抓住了这样的时间窗口。

它之所以能够去抓住这个机会去做大,主要原因是对于Google这样的传统的搜索巨头来讲,去做AI搜索其实是比较别扭的一件事,尤其是它在传统搜索广告的商业模式非常稳固的基础上去做AI搜索。这个事情商业化路径不太明确,而且要跟自己已有的业务去抢夺市场份额的,换言之就是它需要自我革命。但做自我革命的事对于大厂、巨头来讲是最难的一件事情,它的壁垒不在于技术,不在于产品、用户等,最本质的在于对这些互联网巨头来讲,是不是能够做一些可能对自己当前的现金流业务有巨大影响的一些事,这个可能是创业公司最核心最主要的一个机会。

还有一点,在这个缝隙里面其实也有机会,比如Cursor。同样在21年的时候,当时GitHub跟OpenAI推出了Copilot,VS Code上面已经加了。当时我同样分析,去做AI Coding这件事,微软好像是一个最适合的,天时地利人和全具备的玩家。它当时和OpenAI合作,有现成的模型,买了GitHub,有大量的数据和用户心智,VS Code又占据了用户使用的入口,接下来去做AI Coding,应该是一个完美的选择。好像新的创业公司应该没有什么机会,但却发现Cursor能够去跑得这么快,从营收、用户心智上,远远超过了VS Code。当然现在VS Code也在努力去做。

从这个事上我学到的就是可能你去做出好的产品来,至少它是有阶段性的价值的,就是我能够去比大厂做得更快、对用户需求洞察得更深。产品可能看起来好像没有什么壁垒,前段时间和我们一个投资人去聊,他认为你说出来的壁垒,可能就不是真正的壁垒。你说Cursor有什么壁垒吗?也很难说出来,一大堆产品都在借鉴它、抄它,也没有什么自己的模型优势,虽然它开始训练了。那Cursor为什么能够做到这么大,其实也挺值得学习和思考。

所以能够真的去把产品做到极致,并有一个非常强的用户洞察,产品品味非常好,可能是让你有一定竞争优势。回到我们做的语鲸这个产品,一是它有一些技术差异化,就像前面介绍到的,不是简简单单调个现成的API就能够去把产品传出来。但这些技术并不是绝对的只有我们能做,这个太自大了,不客观。我们只是做了一些技术的选择,这个可能是别人并没有决定去做,没有投入资源去做的一件事,我们先去做了。在产品的选择上,我们现在覆盖的内容,不是这种全娱乐性的内容,还是偏有价值的、相对严肃的内容。这样的内容覆盖,目前我们看来没有一个产品能够完全满足这种内容的消费需求。随着用户人群的增加会越来越增加泛娱乐性的内容比例。所以我们还是先从相对有价值的偏严肃性的内容去切入,这一点可能也跟现在大家的关注点有所不同。

还有一点,就是产品细节的打磨,不管新的功能点也好,还是像我刚刚介绍的,哪怕我们去做总结,也希望做最好的总结,把这个需求能够去做透。这件事是不是只有我们能做?肯定也不是。但是我们决定把注意力花在这里,希望把它做深做透。这是学习了其他产品,包括我们自己思考完之后,在语鲸去做的差异化的选择。

量子位智库:对于语鲸和深言达意这两个产品来说,100分的样子会是什么样?现在距离100分的差异点是什么?

深言科技:深言达意,目前我们对它的定位相对来讲会更加克制一些,它更多解决的是在遣词造句层面的需求。我们没有指望它能解决用户所有的写作或者创作内容的需求。当时考虑过这件事,但后面没有真的直接去做。因为你真的想帮用户生成他想要的内容,比想象中要难很多。不光是语言通顺或者在生成内容上模型效果好就够了。它需要很强的对用户的个性化需求的理解,真的知道用户脑子里在想什么、想表达什么、想达到什么目的,才有可能生成用户想要的内容。所以对于深言达意来讲,我们觉得先满足好用户遣词造句的需求。这是深言达意产品的定位。

当然理想中在交互方式和内容覆盖上还有很多的事可以做,我们可以把更自然语言的表达直接输入给它,比如说表达天气很好的四字词,直接输给它,它自动给我转变成语义加一些筛选器,而不用我手动进行筛选器的勾选。我还可以找到更多的新的表达,比如说像新的网络用语,甚至是新的热门的梗等,这些事我们也都考虑去做。如果要说理想定位的话,就是成为大家心目中在解决遣词造句这个问题时,最先想到的产品,并且能够把用户在遣词造句上的需求都满足好。

对于语鲸,我们的定位是一个帮用户去提效的个性化信息助手。我们目标会更远大一些,希望现阶段更多以图文内容为主。多模态的内容也在我们的规划之中。我们现在已经有了语音的播报,将来还会有语音的输入,甚至视频的输入和视频的输出。

现在内容加工的方式其实还是比较单一,我们只是在内容源的选择上做了一定程度的个性化。在内容的加工方式上,我们也希望再做更多的个性化,现在已经有了一些我们在做试点的风格改写的频道,能够把用户关心的内容加工成想要的样子。比如我是一个产品经理,我没法去看最新的技术论文,我希望之后OpenAI或者其他研究机构发表一些比较有影响力的论文时,能够从产品经理的视角帮我去做个解读。我们在风格改写频道上,就是尝试解决这样的需求,只要有新的有影响力的技术突破,就能够用AI自动从产品经理的视角去加工解读。这种需求其实也是一种个性化的内容获取或信息获取上的需求。我们不光在信息的来源上做了个性化,在加工的方式上也要做个性化。那它最终的形态就成为你可信赖的、所有的内容都是专门针对你去生成的个性化信息助手。

量子位智库:达到刚刚描述的产品完美形态的过程,中间是时间问题,还是需要等底层模型的变化,或市场认知等其他外力的变化?

深言科技:是多方位的。从时间因素上讲,我们自己产品也需要去迭代,包括我们理想中的那个样子,到底怎么去一步一步实现,它具象化的呈现方式是怎样的,这些其实都还是模糊、不确定的,需要我们去摸索,去根据反馈迭代。

技术因素同样存在,就像刚刚说到的多模态这个例子,不管是多模态的理解,还是多模态的生成,以视频生成为例,目前它的效果、逼真程度,以及它的时长、成本,距离我们理想状态较远,还需要技术的升级来实现。用户的认知和使用习惯上的改变,也需要一点一点从Early Adopter再到Early Majority去拓展。

10 商业模式普遍在探索阶段,价值验证是IAP(应用内购买)方式的前提

量子位智库:产品做到什么程度时,会考虑商业化和变现?

深言科技:首先深言达意这个产品,它切的点其实是相对历史的一个点,但它的受众可能会比较广。我们希望把这样一个工具产品作为公司产品矩阵里,可以让更多的人知道我们这家公司,知道我们在做信息处理领域的一个产品。它可以让更多用户知道我们,同时通过深言达意,了解到更多我们的其他新产品。有一些语鲸的用户就是从深言达意过来的。

对于语鲸这样AI native的产品的商业模式,也是刚刚两个点。一是它到底什么样的方式去做变现,二是它什么时候可以开始去做变现。这两个问题我们也在思考,还没有确定性的答案。比较传统的IAA广告模式,有非常多的信息类产品都采取这样的方式。ChatGPT也在探索AI时代下的广告会是怎样的,和传统的信息流广告或搜索广告有什么样的区别。大家都在探索,我们也一边也看跑得更快的这些产品,会有什么样的探索出来的一些结论,一边自己也会做一些思考。更多的AI产品在尝试通过IAP的方式去做商业化,但这个方式就需要我们去验证用户真的习惯使用我们这个产品的功能和交互模式,产品确实给大家带来价值,并且我们衡量或粗略地估计出来给大家带来了多少价值,我们再去考虑说怎么去把这个价值的一部分去做收费。

量子位智库:全球范围之内,您最欣赏的ToC类的产品是什么?

深言科技:从学习和其他各个维度的角度,我想到的是Cursor这款产品。功能上让我觉得不错的、有新意的产品其实不少,但是真正能够赚到钱的,有收入的且收入规模增长比较快的产品,能跟Cursor比的还真的挺少的。而且它是一个比较小的团队去做的,20个人就能做到1亿美金的ARR,现在一百多个人将近5亿美金。这是一个很AI原生组织去做的一个很AI原生的产品。

第二点就是这个产品确实真实价值很大,我们公司很多同事都在用,甚至我了解到学校的一些师弟师妹,可能自己都没有收入的情况下都非常愿意给它充值,而且觉得很值很赚。能做到这一点是非常难得的,我了解的没有其他任何一个AI产品能做到这一点。

第三点就是它在一个很卷的赛道,赛道有巨头,有一大堆其他的甚至最早估值比它高的AI Coding公司,它能够去杀出来。它在产品细节的打磨上其实也有非常多值得学习的地方。这是一个很好的学习对象。

量子位智库:对于语鲸来说,从Cursor身上可能学到的最有价值的一点是什么?

深言科技:当然是想达到的那种状态,我非常羡慕或者说觉得非常厉害的点,就是能够让没有收入的学生为它付比较高的费用。它的费用其实不算便宜,对于国内的大学生来讲都觉得值,这一点真的极其难得。

但这件事可能不一定能学得来。我觉得能学得来的就是前面提到的,这个产品真正的壁垒是什么?AI编程的产品一大堆,但是你真的用完之后,让你觉得很丝滑、很爽的产品,可能就是为数不多的那一两个。这背后能学的点就是把需求理解到极致,然后真的去做透,在各个环节充分考虑用户的各种需求,做得让用户感觉到非常爽。这是我们在产品设计上值得学习的点。

11 产品从0到1先追求快速达到平均水平,再「摘树上最高的果子」

量子位智库:从语言模型学术研究再到两款产品的成功推出,您个人觉得在这个过程中,最有价值的一点收获和最反常识的一点收获分别是什么?

深言科技:我先说反常识的点。做一个算法类型的产品,我们之前觉得算法策略本身其实是非常重要的,所以我们比较奢侈地像当时做科研评测模型一样,去搭了很多的评测数据集,定了很详尽的评测标准,甚至让从产品经理到运营再到数据标注的同学去学习怎么去对模型效果做评测。对效果做评测听起来是一个非常科学严谨的方法,但是后来我在想,可能它并不一定适合从0到1、很早期的阶段。主要的点在于,我们原来做研究时,我们要做的事是把模型从一个最好的点再往上突破,让我训练的模型的效果达到最好,追求超过当前的SOTA,所以需要去做评测,比较精准地度量出来我到底是不是新的SOTA。

但在从0到1做产品的时候,其实不是这样的逻辑。我们当然希望把这个产品做到最好,做到体验最好、效果最好。但是这件事可能并不应该是第一步要做的事情。你现在从无到有,先达到一个六七十分再说,而不是我一开始就要去达到90分,达到第一名。我应该先去达到平均水平,这是第一步。而我要去达到平均水平的话,我可能不应该非常严谨、非常重地去做,用做评测SOTA的方式去做它。我应该更快、可能更低成本地去看它是不是达到了平均水平,不需要做那么精细。

最有价值的一点的话,就像我刚刚说的,八仙过海各显神通,每个团队每个人都会有自己最擅长的点,我可能擅长的是技术,我可能擅长的是产品,或者是运营,或者是增长等。对每个人而言最有价值的东西都不太一样。对于大多数非技术的人来讲,我觉得比较有价值的一点是,AI技术这件事没有想象中那么难,不需要有那么大的心理门槛和负担,就可以快速地用现在的AI工具,比如AI Coding,去完成一些产品的尝试,完成一些Demo的搭建。这可能是对更广大的非算法或非技术的同学有价值的一点。

量子位智库:如果您能和刚开始创业的自己说一句话,您会说什么?

深言科技:循序渐进,不要想一口吃成一个胖子,或者说,不要想一开始就去摘树上最高的那颗果子,这件事可能是我们最终的目标,但是我应该先把低垂的果子摘完,再去一层一层往上摘。


访谈完整视频回放可在B站查看:

https://www.bilibili.com/video/BV1dqbZz5EC2/

音频回放请移步小宇宙播客:

https://www.xiaoyuzhoufm.com/episode/68807f3ba12f9ff06a99091b

One More Thing


专属AI产品从业者的实名社群,只聊AI产品最落地的真问题

扫码添加小助手👇,发送「姓名+公司+职位」申请入群:

资讯配图

进群后,你将直接获得:
  • 最新最专业的AI产品信息及分析 🔍
  • 不定期发放的热门产品内测码🔥
  • 内部专属内容与专业讨论👂




如有兴趣参与1v1深度产品访谈栏目「AI 产品Time」,欢迎联系分析师:

资讯配图

—  —

【量子位智库】原创内容,未经账号授权,禁止随意转载。

点这里👇关注我,记得标星哦~





如有兴趣参与1v1 深度产品访谈栏目「AI 产品Time」,欢迎联系分析师

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AR
more
全栈芯基建:Marvell重构AI芯片高速公路(一)从XPU定制到光互连的深度布局
库克打气苹果AI:不拼首创,自信能主导市场;微信提现手续费下调至0.01元;Manus 推Wide Research|极客早知道
拆箱开源版Coze:Agent核心三件套大公开,48小时揽下9K Star
ThinkPad 推出 S2 2in1 2025 翻转商务本:ARL-U 平台,标配手写笔
新品 | iQOO Z10 Turbo+ 手机官宣;奇瑞 iCar V27 官图公布
EvaLearn:AI下半场的全新评测范式!
2700万参数硬刚大模型!1000个样本训出超强逻辑脑,资源消耗不到GPT-4的1%,在ARC基准上击败Claude,代码已开源
WAIC 上,国产 6nm ARM 架构 CPU 在端侧 AI 领域遍地开花
GPT-5发布倒计时,纽约大学教授Gary Marcus泼来7盆冷水,「GPT-5会很惊艳,但依旧愚蠢」
免费分享技术视频+PDF资料:Arteris 专为SoC集成打造的Magillem Connectivity工具
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号