阶跃星辰开源Step 3.5 Flash大模型,聚焦Agent场景与本地部署能力

科技区角 2026-02-02 20:30

阶跃星辰开放平台| AI工具导航

【科技纵览】2月2日,人工智能企业阶跃星辰正式推出并开源其新一代基座大模型Step 3.5 Flash。该模型专为智能体(Agent)开发设计,重点优化了在高并发、长时间运行场景下的稳定性与响应效率。

据官方披露,Step 3.5 Flash采用稀疏混合专家(MoE)架构,整体参数规模达1960亿。得益于其动态激活机制,每个处理单元(Token)仅调用约110亿参数,在保障推理性能的同时显著降低计算开销。在多项权威评测中,该模型表现亮眼,包括LiveCodeBench V6代码生成基准测试和AIME 2025数学竞赛任务,显示出与主流闭源模型相当的综合能力。

在性能指标方面,阶跃星辰表示,该模型在单请求代码类任务中最高推理速度可达每秒350个token。这一特性使其特别适用于需多步逻辑推演、复杂问题拆解及持续交互的Agent工作流。此外,模型支持在多种主流个人工作站硬件上本地部署,涵盖NVIDIA DGX Spark、Apple M3/M4 Max以及AMD AI Max+ 395等平台,以满足开发者对数据隐私保护和边缘算力利用的需求。

目前,Step 3.5 Flash已同步上线OpenRouter、GitHub及阶跃星辰自有应用平台,向全球开发者开放使用。与此同时,公司透露其下一代大模型Step 4的训练工作已正式启动,预示其在基础模型迭代上的持续投入。

此次发布不仅强化了阶跃星辰在开源Agent模型领域的技术布局,也反映出行业正从通用大模型向专业化、可部署、低延迟的智能体基础设施演进。随着芯片生态与模型架构的协同优化加速,本地化AI智能体或将成为下一阶段落地的关键路径。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源 大模型
more
突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆
智谱发布全球首款龙虾场景优化大模型GLM-5-Turbo
一文看懂DeepSeek与清北最新论文:剧透V4底层架构,或改写大模型推理格局
腾讯版“小龙虾”WorkBuddy上线;中国大模型上周第三方调用量再超美国;最高法明确醉酒后启用辅助驾驶要担刑责;微博宣布接入KimiClaw...
小模型读书大模型思考:上海AI Lab提出新知识推理解耦方法DRIFT,高效且「防越狱」
2026年4月中国大模型“双雄交卷”:DeepSeek V4与腾讯混元开启技术路径分野
GEO技术滥用引爆AI投毒危机,大模型“心智”成新流量战场
腾讯内测 QClaw,微信 QQ 双端接入;理想前 CTO 创业,半年融资超 20 亿;中国大模型用量连续两周超美国 | 极客早知道
Stripe推新计费功能,助AI初创企业将大模型成本转嫁用户并自动加价盈利
西班牙AI初创公司Multiverse推量子压缩大模型,瞄准企业级“主权AI”市场
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号