
【科技24时区】在多数业内人士看来,人工智能大模型市场的胜局已定:由谷歌、Meta、微软及部分亚马逊组成的“Big Tech”阵营,联合其首选模型开发商OpenAI与Anthropic,将主导未来。然而,一家仅有30人的美国初创公司Arcee AI却持不同看法。该公司近日正式推出名为Trinity的通用基础大模型,采用Apache 2.0许可证永久开源,并宣称其总参数量达4000亿(400B),是迄今由美国公司训练并发布的最大规模开源基础模型之一。
根据Arcee AI提供的基准测试数据(基于未经微调的基座模型),Trinity Large在多项关键指标上可与Meta的Llama 4 Maverick 400B以及中国清华大学智谱AI推出的高性能开源模型GLM-4.5相媲美。当前预览版的Trinity Large虽仅支持文本模态,但已展现出在编码、数学推理、常识理解与知识问答等任务上的强劲实力,部分测试中甚至略优于Llama系列。
尽管尚未实现多模态能力,Arcee AI明确表示正在开发视觉模型,语音转文本版本也已列入路线图。首席技术官卢卡斯·阿特金斯(Lucas Atkins)向TechCrunch透露,团队优先打造一个令开发者和学术界信服的文本基座模型,核心目标是吸引美国各规模企业放弃使用来自中国的开源模型。“要赢得这场竞争,唯一途径就是提供最好的开源权重模型,”阿特金斯强调,“要赢得开发者的心,就必须给他们最强的工具。”
值得注意的是,Arcee AI在短短六个月内,仅耗资2000万美元,便完成了包括Trinity Large在内的全系列模型训练,所用算力为2048颗英伟达Blackwell B300 GPU。这一投入在其迄今募集的约5000万美元融资中占比较大,但与行业巨头动辄数亿美元的投入相比仍显微薄。阿特金斯坦言:“对我们而言这是一笔巨款,但远不及大厂的投入。”他同时指出,团队凭借高度专注与高效执行,在有限资源下实现了超预期成果。
公司创始人兼CEO马克·麦奎德(Mark McQuade)曾任职于开源模型平台Hugging Face,他透露Arcee最初仅为SK Telecom等大型企业提供模型微调服务,依赖Llama、Mistral或Qwen等第三方开源基座进行后训练。
Arcee坚持采用Apache 2.0许可证,意在与Meta的Llama系列形成鲜明对比。后者虽标榜“开源”,但受制于Meta自定义许可协议中的商业使用限制,已被部分开源社区质疑不符合真正开源标准。麦奎德直言:“美国需要一个永久开源、Apache授权、且具备前沿竞争力的替代方案。”
目前,所有Trinity模型(包括Large、Mini与Nano)均可免费下载。其中Trinity Large将提供三种版本:Preview版(轻度指令微调,适用于通用对话)、Base版(纯基座模型)以及TrueBase版(完全无指令数据,便于企业或研究机构从零定制)。此外,Arcee计划在未来六周内推出托管API服务,Trinity Mini当前API定价为输入$0.045/千token、输出$0.15/千token,并提供限流免费额度。公司同时继续提供面向企业的模型定制与后训练服务。