AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队

机器之心 2026-06-14 13:01
AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图1
机器之心编辑部


今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图2


有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图3


另一位推特博主「Chubby」对此表示不可思议,「一个以前从来没听过的模型现在成了开源 SOTA,甚至超过了 Qwen 3.7。」


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图4


「这让所有人都挺意外。直到今天,巴西当地从业者几乎没人知道这个模型的存在。」


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图5


这已经是本周第二个基于 Qwen3.5 做后训练、并跻身前沿水平的模型了。另一个是 Nex-N2-Pro 397B,同样基于 Qwen3.5-397B-A17B 构建,性能可比肩 GPT-5.5 和 Opus 4.7 等顶级模型。


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图6



Rio 3.5 的崛起让 Huggingface 联合创始人兼 CEO Clem Delangue 发出了感叹,「AI 的未来没有什么是注定的。接下来会发生,我们每个人都有选择和行动的空间:路径一:闭源 API,权力集中,未来由硅谷和华盛顿少数人决定。路径二:开源 AI,让每个人都能参与、拥有并共同构建,包括里约市这样的机构。选你的路吧,朋友。」


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图7


接下来,我们来了解一下 Rio 3.5 397B 模型的技术细节。


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图8


Huggingface 地址:https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B-35-open-397b


Rio 3.5 Open 397B 是一款前沿级通用 AI 模型,由里约热内卢市政府旗下的市政 IT 公司 IplanRIO 开发。


该模型基于 Qwen 3.5 397B 进行后训练,在智能体编程、数学、STEM、多语言和多模态等基准测试中达到了开源模型的领先水平,相比基座模型有显著提升,并且能够与全球最强的开源和闭源模型竞争。

AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图9


模型核心特性包括如下:



其中,SwiReasoning 是一种免训练推理框架,基于 Shi 等人 2025 年的研究,可根据基于熵的置信度信号,在显式思维链推理和潜空间推理之间动态切换。这样既能提升准确率,也能大幅提高 token 效率。该模型在训练时,也明确针对潜空间推理带来的效率增益进行了优化。


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图10


论文地址:https://arxiv.org/abs/2510.05069


智能体编程与软件工程基准测试:


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图11


知识与推理基准测试:


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图12


数学基准测试:


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图13


多语言基准测试:


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图14


智能体与指令遵循基准测试:


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图15


参考链接:

https://x.com/kimmonismus/status/2065911865390063791

https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B

https://x.com/ZenMagnets/status/2065796012820848699

https://x.com/SemiAnalysis_/status/2065894494935933191


AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队图16


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源 大模型
more
余承东:负责华为盘古大模型,会从中国第一走向世界第一
内存暴降50倍且精度无损,MIT提出注意力匹配,能终结大模型显存危机吗?
ISEDA联合发布:大模型芯片验证成果,共同推动AI验证向工业级可靠发展
告别短视调度!中大SlidingServe让大模型推理服务容量提升30%,SLO违规率降低53%
云知声U2冲进第一梯队,大模型开始比拼“智能密度”|甲子光年
首个实时交互音频大模型Audio-Interaction问世!南洋理工等团队开启实时“感知-决策-响应”的音频交互新范式
不光答疑提效!中科闻歌的通用决策大模型,还帮我预测了Anthropic、OpenAI谁先上市
刚刚,余承东发誓把盘古大模型做到世界第一
吃透大模型SFT底层机理:终结实践争议,规避无效算力
SpaceX市值升至2.1万亿美元/大疆起诉影石,影石反诉/余承东:要带盘古大模型走向世界第一
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号