腾讯混元Hy3 preview开源:295B参数重塑AI实战性价比

科技区角 2026-04-23 17:00

【区角快讯】当大模型竞赛从单纯的参数堆砌转向落地实效,腾讯混元团队在4月23日交出了一份颇具分量的答卷。备受关注的Hy3 preview语言模型正式对外发布并开源,这不仅是混元体系重建后的首个成果,更标志着其技术路线向“实用主义”的深度转型。该模型采用快慢思考融合的混合专家架构,总参数量达295B,激活参数为21B,支持长达256K的上下文窗口。官方数据显示,其在复杂推理、代码生成及智能体(Agent)协同等维度的能力实现了跨越式提升。



回溯至今年2月,腾讯混元完成了预训练与强化学习基础设施的重构,并确立了三大核心原则:能力体系化、评测真实性以及极致的性价比。团队摒弃了单一能力的“偏科”倾向,强调推理、长文理解、指令遵循等多维能力的深度协同;同时,主动跳出易被刷分的公开榜单,转而通过自建题目、最新考试及人工众测等方式,评估模型的“真实战斗力”。这种对商业合理性的追求,旨在通过软硬协同设计降低任务成本,让智能真正变得“用得起、用得好”。

腾讯首席AI科学家姚顺雨指出,Hy3 preview仅是混元重建的第一步。团队希望通过开源获取社区的真实反馈,以优化后续正式版。与此同时,腾讯正持续扩大预训练规模,并与元宝、QQ、腾讯文档等全线产品进行深度Co-Design,以提升真实场景下的综合表现。目前,该模型已接入OpenClaw、KiloCode等主流开源Agent框架,并上架腾讯云TokenHub平台。

在硬核指标上,Hy3 preview的表现令人瞩目。其上下文学习与指令遵循能力在CL-bench等创新评测中显著增强,能够从容应对杂乱冗长的生产环境数据。在复杂推理方面,该模型在清华数学博士资格考试(26春)及全国中学生生物学联赛中取得优异成绩,展现了强大的泛化推理潜力。而在代码与智能体领域,得益于强化学习规模的提升,Hy3 preview在SWE-Bench Verified等基准测试中竞争力十足,并在内部后端工程任务集Hy-Backend中表现出极高的稳定性。

实际业务验证进一步佐证了其价值。在元宝端,经过精细化调优,模型在意图理解与文本创作上更具“活人感”;在ima知识库问答中,长文检索的准确性与覆盖度大幅提升。针对办公场景,CodeBuddy和WorkBuddy的首token延迟降低54%,端到端时长缩短47%,成功率突破99.99%,甚至能稳定驱动长达495步的复杂工作流。此外,在和平精英AI NPC场景中,模型展现出优秀的拟人化扮演能力;在腾讯文档AIPPT生成中,成功率提升20%且无幻觉现象。

效率与成本的平衡是此次发布的另一大亮点。通过全链路优化,Hy3 preview的整体推理效率较前代提升约40%。在腾讯云TokenHub平台上,其输入价格低至1.2元/百万tokens,输出价格为4元/百万tokens。腾讯云还推出了最低28元/月的个人版套餐,为开发者打造高性价比的Agent应用提供了有力支撑。这一系列举措表明,腾讯正试图通过技术重构,打破大模型落地的成本壁垒,推动AI从“炫技”走向“实干”。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 开源
more
黄仁勋激辩对华芯片禁令:割裂AI生态是“失败者心态”
HPC收入碾压手机业务!台积电正式变身为一家“AI公司”
Meta启动2026年首轮裁员,8000人受影响,AI战略成核心驱动力
第一批学AI的大学生,已经笑不出来了。
揭秘!AI数据中心需要多少SiC、GaN、IGBT?
马斯克暴走官宣:Grok 5就是AGI!五月连轰两代万亿怪兽,OpenAI慌了
AirPods Max 2体验:颜值太绝了,H2芯片有惊喜
Omdia:AI网络压力下,Neocloud暴露关键短板
马斯克 600 亿美元锁定 Cursor;字节、荣威合作推出「AI 汽车」;传今年存储厂商人均奖金超 300 万元 | 极客早知道
AI非但未终结应用时代,反而引爆新一波App发布热潮
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号