
今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。

有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B。

另一位推特博主「Chubby」对此表示不可思议,「一个以前从来没听过的模型现在成了开源 SOTA,甚至超过了 Qwen 3.7。」

「这让所有人都挺意外。直到今天,巴西当地从业者几乎没人知道这个模型的存在。」

这已经是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的模型了。另一个是 Nex-N2-Pro 397B,同样基于 Qwen3.5-397B-A17B 构建,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。

Rio 3.5 的崛起让 Huggingface 联合创始人兼 CEO Clem Delangue 发出了感叹,「AI 的未来没有什么是注定的。接下来会发生,我们每个人都有选择和行动的空间:路径一:闭源 API,权力集中,未来由硅谷和华盛顿少数人决定。路径二:开源 AI,让每个人都能参与、拥有并共同构建,包括里约市这样的机构。选你的路吧,朋友。」

接下来,我们来了解一下 Rio 3.5 397B 模型的技术细节。

Huggingface 地址:https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B-35-open-397b
Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 开发。
该模型基于 Qwen 3.5 397B 进行后训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中达到了开源模型的领先水平,相比基座模型有显著提升,并且能够与全球最强的开源和闭源模型竞争。

模型核心特性包括如下:
397B 总参数,17B 激活参数,采用混合专家架构(MoE);
1,010,000 token,也就是 100 万级上下文窗口;
集成 SwiReasoning:可在显式推理和潜空间推理之间动态切换,在准确率和效率上实现更优平衡;
通用能力强:在智能体编程、推理、指令遵循和多模态任务上表现突出;
多语言能力强:在葡萄牙语、英语、中文以及数十种其他语言中都有较好表现;
采用 MIT 许可证:完全开放,可用于商业和研究用途。
其中,SwiReasoning 是一种免训练推理框架,基于 Shi 等人 2025 年的研究,可根据基于熵的置信度信号,在显式思维链推理和潜空间推理之间动态切换。这样既能提升准确率,也能大幅提高 token 效率。该模型在训练时,也明确针对潜空间推理带来的效率增益进行了优化。

论文地址:https://arxiv.org/abs/2510.05069
智能体编程与软件工程基准测试:

知识与推理基准测试:

数学基准测试:

多语言基准测试:

智能体与指令遵循基准测试:

参考链接:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191

© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com