作者 | 刘聪NLP 编辑 | 大模型之心Tech
点击下方卡片,关注“大模型之心Tech”公众号
本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询
到了9月的最后一天,时间过的太快了,7、8两月都做了开源大模型盘点,咱们9月继续!
整个9月,大模型开源社区依旧很卷,阿里开源Qwen3-Omni、Qwen3-Next、Qwen3-VL、Qwen3Guard-Gen等模型;腾讯开源7个模型,二位现在在开源社区都是量产,哈哈哈~
当然,还有美团LongCat-Thinking、快手Keye-VL1.5、面壁VoxCPM等等等等!
最后两天DeepSeek-V3.2、GLM4.6也都出了,
一字卷~
当然生图这个月字节的Seedream4.0很牛逼,可以没开源!
PS:觉得不错,给博主来个免费的三连吧!提前祝各位十一玩的开心。
9月1日,腾讯混元开源Hunyuan-MT-7B翻译模型,总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。

此外,还有一个翻译集成模型 Hunyuan-MT-Chimera-7B,是业界首个翻译集成模型,核心是根据原文和多个翻译模型给出的不同内容,再生成一个更优的翻译结果,对于一些有专业翻译需求的用户和场景,可以提供更加准确的回复。

阶跃星辰开源端到端语音大模型Step-Audio-2-mini,8B大小,将语音理解、音频推理与生成统一建模,在音频理解、语音识别、跨语种翻译、情感与副语言解析、语音对话等任务中表现突出,并率先支持语音原生的 Tool Calling 能力,可实现联网搜索等操作。

9月2日,腾讯混元开源HunyuanWorld-Voyager模型,是业界首个支持原生3D重建的超长漫游世界模型。

9月4日,快手开源Keye-VL 1.5模型,8B大小。

9月5日,Kimi开源Kimi-K2-Instruct-0905模型,MoE模型,1T参数,32B激活参数。

面壁智能开源MiniCPM4.1-8B模型,支持深度推理模式和非推理模式,能够在典型的终端芯片上实现超过5倍的生成加速。

9月8日,Bilibili开源IndexTTS2文本转语音模型,在情感表达和时长控制方面实现重大突破。

中国科学院自动化研究所开源SpikingBrain-7B模型,是一个受大脑机制启发的模型,集成了混合高效注意力、MoE 模块和脉冲编码。

9月9日,混元开源HunyuanImage 2.1模型,在复杂语义理解和跨领域泛化能力上有了显著提升,它支持最长达1000个tokens的提示词,可精准生成场景细节、人物表情和动作,实现多物体的分别描述与控制。

百度开源ERNIE-4.5-21B-A3B-Thinking模型,MoE结构,总参数21B,激活参数3B。

蚂蚁集团发布Ling-mini-2.0、Ring-mini-2.0模型,MoE架构,总参数16B,激活参数1.4B,Ling主打语言理解和生成,Ring主打推理。

9月10日,腾讯混元开源SRPO模型,主打去油,让人像真实感提升 3 倍。

9月12日,通义千问开源Qwen3-Next模型,有Instruct和Thinking两种,Next意味着Qwen即将进入下一代。

9月17日,通义实验室开源Tongyi-DeepResearch-30B-A3B,参数30B,激活3B,专为长时间、深度信息检索任务设计,同时开源DeepResearch框架。

蚂蚁集团开源Ling-flash-2.0 模型, 100B参数,6.1B激活参数,在 20T+ 高质量数据上进行训练,结合监督微调和多阶段强化学习。

面壁智能开源,尺寸为0.5B,实现真实的零样本语音克隆与语境感知语音生成。

9月19日,通义万相开源Wan2.2-Animate-14B模型,在角色动画和替换任务中,实现了整体运动与表情的高保真复制,对基础视频生成模型进行了重大升级。

小米开源MiMo-Audio-7B模型,在语音智能和音频理解基准测试中达到了开源模型的最先进水平,并能够处理训练数据中未出现的任务,如语音转换、风格迁移和语音编辑。

9月22日,百度开源Qianfan-VL模型,包括3B、8B、70B 3中尺寸,重点增强了智能办公和K12教育场景的多项任务能力,包括OCR识别、文档解析、拍照解题、图表理解、复杂表格解析等。

美团开源LongCat-Flash-Thinking模型,。

DeepSeek开源DeepSeek-V3.1-Terminus模型,提高语言一致性并优化代码agent和搜索agent的性能。

通义千问开源Qwen3-Omni模型,总参数30B,激活参数3B,新一代原生全模态大模型,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。

9月23日,阿里开源了3种模型,Qwen-Image-Edit-2509,在Qwen-Image-Edit上进行了迭代更新。

Qwen3Guard模型,有0.6B、4B、8B三种尺寸,为安全防护设计的护栏模型,针对安全分类任务进行了专项微调,输出细粒度的风险等级与分类标签,助力实现更负责任的 AI 应用。

Qwen3-VL多模态理解模型,

360开源TinyR1-32B模型,在安全能力上,TinyR1-32B超同等尺寸Qwen3-32B模型25分,以及最新版DeepSeek-R1-0528 17分。

9月26日,快手开源KAT-Dev-32B模型,是一个Code模型。

腾讯混元开源Hunyuan3D-Omni和Hunyuan3D-Part模型,让AI 3D建模更具实用性,加速3D生成模型在游戏、打印和AR/VR 等实际生产流程中的落地应用。

9月28日,腾讯混元开源HunyuanImage-3.0模型,。

9月29日,DeepSeek开源DeepSeek-V3.2-Exp模型,将模型稀疏做到极致,。

9月30日,智谱压哨开源 GLM-4.6 模型,在代码、agent、推理上有提高,但是模型仓库马上开。

时间匆忙,也许有遗漏的国内开源大模型,欢迎评论区补充!
你可以看到,国内开源大模型发展真是越来越好!
但实话实说,跟国外顶级依旧存在差距,同时开源模型尺寸越来越大!
大模型之心Tech知识星球交流社区
我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。
星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo、大模型预训练、后训练、知识蒸馏、量化、推理模型、MoE、强化学习、RAG、提示工程等多个版块)、科研/办公助手、AI创作工具/产品测评、升学&求职&岗位推荐,等等。
星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!