去创作

用微信扫描二维码

分享至好友和朋友圈

阶跃星辰Step3.5Flash:110亿激活参数实现前沿级智能

近日消息,阶跃星辰开源 Agent 基座模型 Step 3.5 Flash 上线仅两天成功登顶 OpenRouter 平台 Trending 榜单。该榜单排名来自全球知名大模型聚合平台 OpenRouter 数据,数据基于全球开发者与用户的实际模型调用量,直观反映出模型在真实应用场景中的受欢迎程度与市场接受度。

阶跃星辰 Step 3.5 Flash 荣登 OpenRouter Trending 榜首,不仅验证了该模型作为技术黑马在高吞吐与复杂推理场景下的强劲实力,更彰显了其作为兼具极致性能与稳定性的实-战首选地位作为面向实时 Agent 工作流场景的模型,Step 3.5 Flash 在推理效率上表现突出,最高推理速度可达每秒 350 个 token。该模型款稀疏混合专家(MoE)架构,在保持较为精巧的1960总参数量的同时,每个 token 在处理过程中仅需激活约 110 亿个参数,在保障模型性能的同时实现运行效率的优化,从而弥合前沿级智能体智能与计算效率之间的鸿沟。

在官方发布的Step 3.5 Flash Tech Report里显示,该模型聚焦于构建智能体的精准推理能⼒以及快速可靠的执行效率。Step 3.5 Flash 通过交错的 3:1 滑动窗口/全注意力机制(Sliding Window/Full Attention)和多 Token 预测(MTP-3)进行优化,以最小化多轮智能体交互的延迟和成本。为实现前沿级智能,Step 3.5 Flash 还采用了可扩展的强化学习(RL)框架,推动模型在数学、代码和⼯具使用等领域持续自我提升。

Step 3.5 Flash 在智能体、编码和数学任务中展现出卓越性能:在 IMO-AnswerBench 上达到 85.4% 的准确率,在 LiveCodeBench-v6(2024.08‒2025.05)上达到 86.4%,在 τ2-Bench 上达到 88.2%,在 BrowseComp(含上下文管理)上达到 69.0%,在 Terminal-Bench 2.0 上达到 51.0%——其性能与 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相当。通过重新定义效率边界,Step 3.5 Flash 为在真实工业环境中部署复杂智能体提供了高密度基础。Step3.5Flash 仅1960亿总参数、110亿激活参数,就能做到与前沿“巨模”在推理能力、智能体能力上性能相当。

上图:Step 3.5 Flash 仅需 110 亿激活参数(1960 亿 MoE 总参数)即可实现前沿级智能,性能比肩主流闭源和开源模型。

更多精彩内容,关注云掌财经公众号(ID:yzcjapp)

以上内容仅供学习交流,不作为投资依据,据此操作风险自担。股市有风险,入市需谨慎! 点击查看风险提示及免责声明
热股榜
代码/名称 现价 涨跌幅
加载中...
加载中 ...
加载中...

二维码已过期

点击刷新

扫码成功

请在手机上确认登录

云掌财经

使用云掌财经APP扫码登录

在“我的”界面右上角点击扫一扫登录

  • 验证码登录
  • 密码登录

注册/登录 即代表同意《云掌财经网站服务使用协议》

找回密码

密码修改成功!请登录(3s)

用户反馈

0/200

云掌财经APP下载

此为会员内容,加入后方可查看,请下载云掌财经APP进行加入

此为会员内容,请下载云掌财经APP加入圈子

云掌财经
扫码下载

更多功能与福利尽在APP端:

  • 精选会员内容实时推送
  • 视频直播在线答疑解惑
  • 达人一对一互动交流
关闭
/