斯坦福兼职教授创立Gimlet Labs，完成8000万美元A轮融资，破解AI推理瓶颈

【科技24时区】近日，由斯坦福大学兼职教授、连续创业者Zain Asgar联合创办的初创公司Gimlet Labs宣布完成8000万美元A轮融资。本轮融资由Menlo Ventures领投，旨在加速其“多硅推理云”（multi-silicon inference cloud）技术的商业化落地。该技术通过软件层协调不同硬件资源，显著提升AI推理效率。

Gimlet Labs声称，其平台是业内首个也是唯一一个“多硅推理云”，能够将单个AI应用的工作负载智能拆分，并同时在多种异构硬件上并行运行——包括传统CPU、专为AI优化的GPU，以及高内存系统。据Asgar向TechCrunch透露：“我们基本上能利用任何可用的硬件资源。”Menlo Ventures合伙人Tim Tully在博客中进一步解释，现代AI代理任务通常包含多个步骤，而每一步对硬件的需求截然不同：推理阶段受计算能力限制，解码阶段依赖内存带宽，工具调用则受网络性能制约。

当前尚无单一芯片能高效处理所有类型的任务。随着新型硬件不断推出，大量旧款GPU被重新部署，形成庞大的“多硅舰队”。Tully指出，这一硬件生态“只缺一层软件来激活其协同潜力”——而这正是Gimlet Labs的核心价值所在。

据麦肯锡预测，若当前“堆算力”的趋势持续，到2030年全球数据中心支出将接近7万亿美元。然而Asgar强调，现有硬件的实际利用率仅为15%至30%。“换言之，每年有数千亿美元的算力资源处于闲置状态，”他表示，“我们的目标就是让AI工作负载的效率提升10倍。”

为此，Asgar与联合创始人Michelle Nguyen、Omid Azizi和Natalie Serrino共同开发了一套编排软件，可将复杂的代理式AI任务动态切片，并分配至最适合的硬件架构上执行。Gimlet Labs称，该方案可在相同成本与功耗下，将AI推理速度提升3至10倍，甚至能将大模型本身拆解，使其不同部分在最匹配的芯片上运行。

目前，Gimlet Labs已与英伟达（NVIDIA）、AMD、英特尔（Intel）、ARM、Cerebras及d-Matrix等主流芯片厂商建立合作关系。其产品以软件或API形式通过自有Gimlet Cloud提供，主要面向大型AI模型实验室与超大规模数据中心，而非普通开发者。

该公司于2025年10月正式公开亮相，并宣称首年即实现八位数美元营收（至少1000万美元）。Asgar透露，过去四个月客户数量翻倍以上，现已涵盖一家头部大模型公司和一家超大型云计算企业，但出于保密协议未披露具体名称。

创始团队此前曾共同创立可观测性工具初创公司Pixie，该公司在2020年推出仅两个月后即被New Relic以未公开价格收购。Pixie的核心技术现已成为Kubernetes开源生态的一部分。

据Asgar回忆，约一年前他偶然结识Tully，并获得多位斯坦福教授的天使投资后，风险投资机构开始密集接触。产品发布后，多家风投迅速递上投资意向书。“当我们释放融资信号时，立刻引来大量资金追捧，本轮融资很快超额认购。”截至目前，Gimlet Labs累计融资达9200万美元，除Menlo外，还包括Factory（种子轮领投方）、Eclipse Ventures、Prosperity7和Triatomic等机构。天使投资人阵容亦颇为亮眼，涵盖红杉资本前高管Bill Coughran、斯坦福教授Nick McKeown、VMware前CEO Raghu Raghuram，以及英特尔现任CEO陈立武（Lip-Bu Tan）。

目前，公司团队规模已达30人，正加速推进产品迭代与客户拓展，以应对AI基础设施效率革命的迫切需求。