nh1

省 56% Token!阶跃 Step 3.5 Flash 2603 双思考模式上线

栏目:行业   作者:司马穰苴    发布时间:2026-04-02 14:11   阅读量:14060   会员投稿

阶跃星辰 Step 3.5 Flash 2603 是基于 Step 3.5 Flash 持续优化的面向高频编程与日常 Agent 工作流的实用型开发者模型,围绕代码生成、调试、重构以及 Agent 工作流等场景进行了专项增强,Step Plan 订阅用户可直接调用该模型 API。在延续 Flash 系列高响应速度与低成本优势的基础上,Step 3.5 Flash 2603 在默认的 High 思考模式外,新增 Low 思考模式,进一步降低 Token 消耗并提升输出效率,同时优化了 Coding 与 Agent 框架的兼容性。

双思考模式,极致效率,更省成本

Step 3.5 Flash 2603 模型支持 High、Low 两档推理强度可调,智能分配算力与消耗,让每个 Token 都花在刀刃上。

在默认的 High 思考模式下,模型推理性能保持最佳质量,Token 消耗可节省 14.3%,Agent 任务执行时长缩短。

面对 Agent 用户常见的低复杂度任务、定时重复、批量处理等场景,用户还可以选择切换为 Low 思考模式,性能仅轻微回退 4%,但 Token 消耗直降了 56%,节省近半成本和时间,推理效率大幅提升。

Agent 原生,智能体做事更靠谱

Step 3.5 Flash 2603 延续 Flash 系列模型高响应、低延迟的特性,在多轮调用与工作流衔接场景中优化使用体验。针对 Coding 与 Agent 框架进行了专门的优化训练,提升 Step 3.5 Flash 2603 在这些场景下的使用体验、稳定性以及 Token 效率,真正实现“做事靠谱”。

ad