腾讯混元开源新一代翻译模型1.5 支持33种语言端云协同部署

科技区角 2025-12-30 16:00

科技区角快讯,2025年12月30日,腾讯混元正式发布并开源其最新一代翻译模型——混元翻译模型1.5版本。该版本包含两个核心模型:Tencent-HY-MT1.5-1.8B与Tencent-HY-MT1.5-7B,目前已同步上线腾讯混元官网,并开放于GitHub及Hugging Face等主流开源平台,供全球开发者免费下载与集成使用。

新模型支持33种国际语言之间的互译能力,同时覆盖5种中国少数民族语言及方言,不仅涵盖中、英、日等主流语种,还特别纳入捷克语、马拉地语、爱沙尼亚语、冰岛语等低资源小语种,显著拓展了多语言应用场景的边界。

其中,1.8B参数量的轻量化模型专为手机等终端设备优化设计。通过先进的量化技术,该模型可在仅1GB内存条件下实现离线实时翻译,无需依赖云端服务。在性能表现方面,其推理效率远超当前多数商用翻译API:处理50个tokens的平均响应时间仅为0.18秒,相较同类商用方案普遍0.4秒的延迟,提速超过一倍。更值得注意的是,在多项基准测试中,该轻量模型的翻译质量已达到闭源大模型如Gemini-3.0-Pro约90%的水平,部分场景下差距微乎其微。

而7B版本则是在此前WMT25机器翻译大赛中斩获30项语种冠军的模型基础上全面升级而来。新版重点优化了翻译准确率,有效解决了旧版中偶发的注释残留、语种混杂等问题,大幅提升了输出文本的专业性与可读性。

腾讯官方指出,在实际应用中,1.8B与7B模型可协同部署,形成“端侧+云侧”联动架构:轻量模型负责本地快速响应,大模型提供高精度云端增强,二者结合可显著提升整体翻译系统的一致性、稳定性与用户体验。

此外,新模型还支持术语库自定义、长上下文理解及带格式文本翻译等高级功能。用户可导入医学、法律、金融等垂直领域的专业词汇表,确保关键术语准确无误;模型亦能基于前文语境动态优化后续译文,适用于会议记录、小说连载等长文本场景;同时保留原始文档排版结构,提升网页、PDF等结构化内容的翻译可用性。

技术层面,1.8B模型采用On-Policy Distillation策略,由7B大模型作为“教师”实时引导训练过程,避免传统蒸馏中的信息损失,显著增强小模型的泛化能力。目前,该系列翻译模型已深度集成至腾讯会议、企业微信、QQ浏览器等核心产品中,并全面兼容Arm、高通、Intel及国产GPU厂商沐曦等主流硬件平台,为开发者和终端用户提供高效、灵活、低成本的多语言解决方案。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
大模型
more
商汤开源SenseNova-MARS,多模态自主推理模型突破AI执行边界
神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?
阶跃星辰全链路开源Step 3.5 Flash,Agent专用大模型登顶多平台榜单
月之暗面Kimi估值跃升至百亿美元,连续融资超12亿美元领跑大模型赛道
国产大模型同台PK:DeepSeek向左,Kimi向右,AI大升级来了?
Seedance2.0乱杀后,豆包2.0终于来了!字节在接近自己的Gemini 3时刻
蚂蚁集团开源全模态大模型Ming-Flash-Omni 2.0,树立开源多模态新标杆
美国初创公司Arcee AI发布4000亿参数开源大模型Trinity
Stripe推新计费功能,助AI初创企业将大模型成本转嫁用户并自动加价盈利
西班牙AI初创公司Multiverse推量子压缩大模型,瞄准企业级“主权AI”市场
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号