腾讯混元Hy3 preview开源:295B参数重塑AI实战性价比

科技区角 2026-04-23 17:00

【区角快讯】当大模型竞赛从单纯的参数堆砌转向落地实效,腾讯混元团队在4月23日交出了一份颇具分量的答卷。备受关注的Hy3 preview语言模型正式对外发布并开源,这不仅是混元体系重建后的首个成果,更标志着其技术路线向“实用主义”的深度转型。该模型采用快慢思考融合的混合专家架构,总参数量达295B,激活参数为21B,支持长达256K的上下文窗口。官方数据显示,其在复杂推理、代码生成及智能体(Agent)协同等维度的能力实现了跨越式提升。



回溯至今年2月,腾讯混元完成了预训练与强化学习基础设施的重构,并确立了三大核心原则:能力体系化、评测真实性以及极致的性价比。团队摒弃了单一能力的“偏科”倾向,强调推理、长文理解、指令遵循等多维能力的深度协同;同时,主动跳出易被刷分的公开榜单,转而通过自建题目、最新考试及人工众测等方式,评估模型的“真实战斗力”。这种对商业合理性的追求,旨在通过软硬协同设计降低任务成本,让智能真正变得“用得起、用得好”。

腾讯首席AI科学家姚顺雨指出,Hy3 preview仅是混元重建的第一步。团队希望通过开源获取社区的真实反馈,以优化后续正式版。与此同时,腾讯正持续扩大预训练规模,并与元宝、QQ、腾讯文档等全线产品进行深度Co-Design,以提升真实场景下的综合表现。目前,该模型已接入OpenClaw、KiloCode等主流开源Agent框架,并上架腾讯云TokenHub平台。

在硬核指标上,Hy3 preview的表现令人瞩目。其上下文学习与指令遵循能力在CL-bench等创新评测中显著增强,能够从容应对杂乱冗长的生产环境数据。在复杂推理方面,该模型在清华数学博士资格考试(26春)及全国中学生生物学联赛中取得优异成绩,展现了强大的泛化推理潜力。而在代码与智能体领域,得益于强化学习规模的提升,Hy3 preview在SWE-Bench Verified等基准测试中竞争力十足,并在内部后端工程任务集Hy-Backend中表现出极高的稳定性。

实际业务验证进一步佐证了其价值。在元宝端,经过精细化调优,模型在意图理解与文本创作上更具“活人感”;在ima知识库问答中,长文检索的准确性与覆盖度大幅提升。针对办公场景,CodeBuddy和WorkBuddy的首token延迟降低54%,端到端时长缩短47%,成功率突破99.99%,甚至能稳定驱动长达495步的复杂工作流。此外,在和平精英AI NPC场景中,模型展现出优秀的拟人化扮演能力;在腾讯文档AIPPT生成中,成功率提升20%且无幻觉现象。

效率与成本的平衡是此次发布的另一大亮点。通过全链路优化,Hy3 preview的整体推理效率较前代提升约40%。在腾讯云TokenHub平台上,其输入价格低至1.2元/百万tokens,输出价格为4元/百万tokens。腾讯云还推出了最低28元/月的个人版套餐,为开发者打造高性价比的Agent应用提供了有力支撑。这一系列举措表明,腾讯正试图通过技术重构,打破大模型落地的成本壁垒,推动AI从“炫技”走向“实干”。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源
more
重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw
开源了!pi*0.6 算法RECAP
多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读
超越DeepSeek-V4!罗福莉交出小米最强开源模型,首日适配5家国产芯片
从“卷模型”到“拼数据”,昂贵数采下的15个开源项目
WAM杀入导航了 !首个WorldVLN,全面开源
腾讯混元Hy3 preview开源:295B参数重塑AI实战性价比
超睿科技入选OpenHarmony + RISC-V 工作组首批共建单位:以高性能算力赋能开源生态新未来
浙大开源ClawGUI,打通GUI智能体训练、评估与部署全链路
生物学变天:小扎的新开源模型,彻底掀翻谷歌AlphaFold王座!
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号