【科技24时区】近日,由斯坦福大学兼职教授、连续创业者Zain Asgar联合创办的初创公司Gimlet Labs宣布完成8000万美元A轮融资。本轮融资由Menlo Ventures领投,旨在加速其“多硅推理云”(multi-silicon inference cloud)技术的商业化落地。该技术通过软件层协调不同硬件资源,显著提升AI推理效率。

Gimlet Labs声称,其平台是业内首个也是唯一一个“多硅推理云”,能够将单个AI应用的工作负载智能拆分,并同时在多种异构硬件上并行运行——包括传统CPU、专为AI优化的GPU,以及高内存系统。据Asgar向TechCrunch透露:“我们基本上能利用任何可用的硬件资源。”Menlo Ventures合伙人Tim Tully在博客中进一步解释,现代AI代理任务通常包含多个步骤,而每一步对硬件的需求截然不同:推理阶段受计算能力限制,解码阶段依赖内存带宽,工具调用则受网络性能制约。
当前尚无单一芯片能高效处理所有类型的任务。随着新型硬件不断推出,大量旧款GPU被重新部署,形成庞大的“多硅舰队”。Tully指出,这一硬件生态“只缺一层软件来激活其协同潜力”——而这正是Gimlet Labs的核心价值所在。
据麦肯锡预测,若当前“堆算力”的趋势持续,到2030年全球数据中心支出将接近7万亿美元。然而Asgar强调,现有硬件的实际利用率仅为15%至30%。“换言之,每年有数千亿美元的算力资源处于闲置状态,”他表示,“我们的目标就是让AI工作负载的效率提升10倍。”
为此,Asgar与联合创始人Michelle Nguyen、Omid Azizi和Natalie Serrino共同开发了一套编排软件,可将复杂的代理式AI任务动态切片,并分配至最适合的硬件架构上执行。Gimlet Labs称,该方案可在相同成本与功耗下,将AI推理速度提升3至10倍,甚至能将大模型本身拆解,使其不同部分在最匹配的芯片上运行。
目前,Gimlet Labs已与英伟达(NVIDIA)、AMD、英特尔(Intel)、ARM、Cerebras及d-Matrix等主流芯片厂商建立合作关系。其产品以软件或API形式通过自有Gimlet Cloud提供,主要面向大型AI模型实验室与超大规模数据中心,而非普通开发者。
该公司于2025年10月正式公开亮相,并宣称首年即实现八位数美元营收(至少1000万美元)。Asgar透露,过去四个月客户数量翻倍以上,现已涵盖一家头部大模型公司和一家超大型云计算企业,但出于保密协议未披露具体名称。
创始团队此前曾共同创立可观测性工具初创公司Pixie,该公司在2020年推出仅两个月后即被New Relic以未公开价格收购。Pixie的核心技术现已成为Kubernetes开源生态的一部分。
据Asgar回忆,约一年前他偶然结识Tully,并获得多位斯坦福教授的天使投资后,风险投资机构开始密集接触。产品发布后,多家风投迅速递上投资意向书。“当我们释放融资信号时,立刻引来大量资金追捧,本轮融资很快超额认购。”截至目前,Gimlet Labs累计融资达9200万美元,除Menlo外,还包括Factory(种子轮领投方)、Eclipse Ventures、Prosperity7和Triatomic等机构。天使投资人阵容亦颇为亮眼,涵盖红杉资本前高管Bill Coughran、斯坦福教授Nick McKeown、VMware前CEO Raghu Raghuram,以及英特尔现任CEO陈立武(Lip-Bu Tan)。
目前,公司团队规模已达30人,正加速推进产品迭代与客户拓展,以应对AI基础设施效率革命的迫切需求。