我们每次分享的最后,也是最重要的环节,我们再次挑战一下自己,跟大家聊聊我们对接下来12个月到18个月的十大展望。1、基础模型上下文窗口突破今年的展望,第一个是关于基础模型。我们认为基础模型会有很多创新,但有一点,就是12个月内,中国和美国的头部基础模型就会达到一个200万Token的上下文窗口。从供给端看,注意力机制等架构的创新正在推动长文本能力迅速突破;而从需求端看,只有上下文窗口更长,才能生成出真正有细节、有连贯性的、贴合语境的高质量内容。2、通用视频模型进入实用期第二个是关于多模态模型。其实不光是我们启明自己的判断,我们也结合了很多企业家、科学家、创新者的智慧。在这个领域,我们判断未来一到两年之内,会出现真正的通用视频模型,可以处理在视频模态下的多种任务,包括生成、推理和任务理解,促进“内容生成”以及“交互方式”的革新。3、Agent迈入“数字员工”时代那下一个是关于AI Agent。AI Agent也是现在非常热的话题。我们判断在未来12到14个月,Agent的形态将从“工具的辅助”走向“真正的任务承接”。在未来,我们认为两年之内会有真正意义上的“首批数字员工”进入企业内部,广泛参与企业的研发、销售、运营和客户服务等重要环节。这意味着AI Agent不再仅作为助手存在,而是从“成本工具”走向了“价值创造”,具备主动承担OKR、主动反馈、协同作业等能力。4、多模态Agent将不断走向实用化多模态Agent将能够融合视觉、语音、传感器等多源输入,进行复杂推理、工具调用与任务执行,在医疗、金融、法律等行业率先实现突破。5、更多国设国造的GPU开启批量交付然后下面是关于AI的基础设施,第一个是关于芯片。我们认为未来12个月到18个月内,有望看到越来越多所谓“国设”且“国造”的GPU问世。不光是中国团队设计的GPU,而且是在中国的供应链中生产的GPU,能够真正走向市场,批量交付。这将是对中国AI行业一个巨大的好消息。但与此同时,我们也会看到很多新一代去颠覆传统GPU的“冯诺依曼架构”的AI芯片出现。比如说3D内存堆叠、通算融合等新一代AI芯片,也会慢慢走向市场、崭露头角。6、AI Infra侧将大幅降低Token成本接下来是我们对另一个AI基础设施层的判断。过去两年推理成本已下降了超百倍,我们判断这个趋势还会继续。未来12到24个月,Token的消耗量还会再提高1到2个数量级。集群推理优化、终端推理优化,和软硬件协同优化,将成为AI基础设施进一步降低Token成本的关键路径。7、AI催生“非屏幕中心”的新型硬件再说说应用,我们比较确信未来很快会看到一次“范式转移”。也就是说,过去或现在我们主要的应用,都是基于手机,基于“人+屏幕”的人机交互方式。手机这种屏幕中心的人机交互方式,已经越来越跟不上AI能力的发展。未来会出现很多更自然、更符合人性的“人机交互方式”,改变我们使用手机的习惯。也许会很快出现一种“能承载AI能力、又符合人性的交互”的新硬件形态。就像当年手机,在15年前、20年前把PC上的很多人类需求“转移”出来一样,新一代的硬件,也会把我们今天很多人类需求从手机上“转移出来”。8、垂类切入成为创业破局关键从我们投资人、创业者的角度,我们其实比较喜欢“go narrow and go deep”。我们的策略就是:应该找一个垂直细分场景,把它做深做透。这样企业才能更有效地与大厂形成差异化竞争,走出所谓大厂的“巨人阴影”。9、AI-BPO模式崛起另外一个关于AI应用的预测,我们也看到,过去几年,从卖license,到卖订阅,各种商业模式越来越丰富。而现在我们看到一种新模式正在异军突起,即“AIBPO”——也就是AI驱动的业务外包。AI BPO(业务外包)模式将在未来12-24个月实现商业化突破,从“交付工具”走向“交付结果”,并通过“按结果付费”的方式,在金融、客服、营销、电商等流程标准化行业快速扩张。10、具身智能将在三个场景率先落地最后一个预测,是这几个月最热的“具身智能”。很多媒体都在问我:“你们觉得具身智能机器人,最先会在哪些真正有用的场景落地?而不是只是舞台表演?”我们大胆预测,未来12至18个月内,会在挑选、搬运和组装三个场景率先落地,而且是“规模化落地”——我说的“规模化”是“上千台、上万台”的落地。我们觉得这点非常关键。只有在一些细分场景落地之后,才会形成“从模型、本体到场景数据”的飞轮效应,推动整个具身智能技术高速向前发展。