谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型

机器之心 2025-08-15 12:14
机器之心报道

机器之心编辑部

下载下来只有 241 MB。


本周四,谷歌正式发布了 Gemma 3 的最新一款模型。


Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任务的微调而设计,具备强大的指令跟踪和文本结构化能力。


它继承了 Gemma 3 系列的先进架构和强大的预训练功能,同时为小尺寸模型带来了强大的指令执行能力。谷歌展示的 IFEval 基准测试成绩所示,在同级模型上,Gemma 3 270M 树立了新的性能水平,使复杂的 AI 功能更容易应用于设备端和研究应用。


资讯配图

IFEval 旨在测试模型执行可验证指令的能力。


Gemma 3 270M 的核心功能主要包括如下几个方面:



对于 1.7 亿个嵌入参数,如何在训练过程中保证不出现嵌入崩溃,谷歌并没有对技术细节进行太多解释。不过在谷歌发布后,AI 社区很快开始了研究。


资讯配图


Sebastian Raschka 第一时间进行了简单的解读,他注意到了新模型的一些架构特点。


资讯配图


谷歌表示,Gemma 3 270M 是一款高质量的基础模型,开箱即用,适用于专业化的任务。在实践中,人们应从紧凑而强大的模型入手,进而构建出精简、快速且运营成本较低的生产系统。


这种思路已在现实世界中取得了很好的成果。谷歌举了 Adaptive ML 与 SK Telecom 合作的成果的例子。面对细致入微的多语言内容审核挑战,他们选择了专业化。Adaptive ML 没有使用大规模通用模型,而是对 Gemma 3 4B 模型进行了微调。从结果上看,专业化的 Gemma 模型达到甚至超越了更大型专有模型在其特定任务上的表现。


Gemma 3 270M 旨在让开发者更进一步利用这种方法,为定义明确的任务释放更高的效率。它是创建一系列小型专业模型的理想起点,每个模型都是各自任务的专家。


这种专业化的力量不仅适用于企业任务,还能帮助个人开发者构建创意应用程序。例如,Hugging Face 团队的成员使用 Gemma 3 270M 为一款使用 Transformers.js 的睡前故事生成器网页应用提供支持。可知,该模型的体量和性能使其非常适合离线、基于网页的创意任务。



谷歌表示,Gemma 3 270M 适用于以下场景:




现在,你也可以在 Colab 上尝试自行尝试微调,只需不到 5 分钟即可完成。


过去几个月,谷歌的 Gemma 开放模型系列经历了一系列发布。在 4 月到 5 月,谷歌推出了 Gemma 3 和 Gemma 3 QAT,为单云和桌面级 GPU 提供了不错的 AI 性能。随后在 6 月 25 日,面向移动端的 Gemma 3n 正式发布,为手机等设备引入了强大的实时多模态 AI 能力。


谷歌表示,截止上周,Gemma 系列的累积下载量已经突破了两亿次。


参考内容:

https://developers.googleblog.com/en/introducing-gemma-3-270m/


资讯配图


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
首个开源多模态Deep Research智能体,超越多个闭源方案
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
Nous Research新研究:揭示「Token效率」陷阱,开源大模型Token消耗最高超闭源10倍
全球首个AI-Native SCADA平台,工业智能“开源”炸场!
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界
快讯|400亿A股上市龙头赴港IPO ;日媒:中国AI迅猛追赶,资本涌向人形机器人企业;智元发布行业首个机器人世界模型开源平台等
GPT-5认为这个模型是开源界的Claude 3.5——陈天桥朋友圈里的 MiroMind ODR 让我眼前一亮
7B小模型逆袭GPT-4o!复旦&创智邱锡鹏团队造出「世界感知」具身智能体,代码数据完全开源!
谷歌版小钢炮开源!0.27B大模型,4个注意力头,专为终端而生
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号