### [阶跃Step 3.7 Flash](https://hello123.com/)

**Published:** 2026-06-17T11:37:36

**Author:** hello123

**Excerpt:** 阶跃星辰于2026年5月开源的生产级Agent模型，采用196B参数稀疏MoE架构，激活参数仅11B，最高生成速度400 Tokens/s。在Toolathlon工具调用评测中得分49.5%，是首个稳定完成66工具调用测试的开源模型，单任务成本约为Claude Opus 4.6的1/9。访问阶跃星辰官网了解详情。

## 约 30秒看懂阶跃Step 3.7 Flash

想让AI独立完成多步骤任务，却总在工具调用时跑偏？**阶跃Step** 3.7 Flash专为生产级AI Agent（**智能体**）设计，在速度、成本和可靠性上找到了平衡。

![阶跃Step 3.7 Flash截图](https://cdn.hello123.com/wp-content/uploads/2026/06/step-3-7-flash-scaled.webp)

这款开源大模型由阶跃星辰于2026年5月29日发布并开源，采用稀疏MoE架构，总参数196B+1.8B ViT，激活参数仅11B。最高生成速度400 **Token**s/s，适合高频、多轮、低延迟的Agent应用。

### 它为什么专为Agent而生

Agent场景需要模型能看懂界面、主动搜索、稳定调用工具。阶跃Step 3.7 Flash围绕这些需求进行系统优化。它不只是回答问题，更要理解复杂输入、执行长程任务。官方用“See. Think. Act.”概括其设计理念。

### 196B参数，11B激活：稀疏MoE架构解析

作为一款原生**多模态**模型，它采用稀疏MoE（混合专家）架构。总参数196B+1.8B ViT（视觉编码器），但每次推理只激活11B参数。这就像一个大团队，每次任务只派最相关的专家上场。结果：性能强、速度快、成本低。

### 速度与成本的双重优势

据官方数据，它最高生成速度达400 Tokens/s。在Artificial Analysis榜单上，实测输出速度409 tokens/s，位列主流模型第一。成本方面，单任务成本约**Claude** Opus 4.6的1/9。速度与成本优势让它适合大规模**部署**。

## 拆解阶跃Step 3.7 Flash的能力清单

这款AI Agent模型的能力围绕自动化任务构建。它原生理解多模态信息，主动搜索验证，稳定调用工具，并兼容主流框架。下面逐一拆解。

### 原生多模态理解：从UI到代码的转化

作为多模态模型，它能直接理解UI、图表、文档、图片。比如，给它一张软件界面截图，它能识别按钮和菜单，生成操作脚本。它还能将图表转化为数据分析报告。这种能力让视觉信息直接变成可执行任务。

### 联网与视觉搜索：主动交叉验证信息

遇到不确定的信息，它会主动联网搜索。不仅搜文本，还能搜图像。然后交叉比对多个来源的证据。这增强了在开放信息环境中的实用性。比如，它可以搜索最新新闻并总结简报。

### 高可靠工具调用：长程任务不跑偏

在长程多轮**工作流**中，它能稳定调用**API**、浏览器、终端、Office工具。官方优化了任务轨迹一致性，降低跑偏风险。有开发者指出，它是首个稳定完成66个工具调用测试的**开源模型**。

### Agent生态兼容：无缝接入主流框架

它针对主流Agent框架做了兼容优化。支持Claude Code、KiloCode、RooCode、OpenCode等。也支持**MCP**（模型上下文协议）和Skills工具调用协议。这降低了开发者的接入成本。

## 从注册到第一次产出：5步走通阶跃Step 3.7 Flash

下面通过五个步骤，带你从零开始使用该工具。

### 第一步：访问官网并注册账号

打开浏览器，访问官网 stepfun.com。点击注册按钮，填写邮箱和密码。完成验证后登录。整个过程几分钟即可完成。

### 第二步：选择模型并创建API Key

登录后进入控制台。在模型列表中找到“Step 3.7 Flash”。然后进入API管理页面，创建一个新的API密钥。保存好这个密钥，后续调用需要用到。

### 第三步：配置本地开发环境

在你的电脑上安装`Python`和必要的库。打开终端，运行：pip install openai。然后设置环境变量：export STEPFUN\_API\_KEY="你的密钥"。环境就准备好了。

### 第四步：编写你的第一个Agent调用

用以下代码示例，让模型分析一张图片并生成描述。

```python
from openai import OpenAI

client = OpenAI(
    api_key="你的密钥",
    base_url="https://api.stepfun.com/v1"
)

response = client.chat.completions.create(
    model="step-3.7-flash",
    messages=[
        {"role": "user", "content": [
            {"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}},
            {"type": "text", "text": "描述这张图片的内容"}
        ]}
    ]
)
print(response.choices[0].message.content)
```

运行代码，你将得到图片的文字描述。

### 第五步：查看结果并优化提示词

查看模型返回的结果。如果不够详细，可以调整提示词。例如，加上“请用三句话描述”。反复测试，直到输出满意。提示词越清晰，效果越好。

## 阶跃Step 3.7 Flash vs 同类：差异在哪

为了看清定位，我们把它与**DeepSeek** V4 Flash、**MiniMax** M2.7、Claude Opus 4.6进行对比。

| 特性维度 | 阶跃Step 3.7 Flash | DeepSeek V4 Flash | MiniMax M2.7 | Claude Opus 4.6 |
| --- | --- | --- | --- | --- |
| 架构  | 稀疏MoE，196B+1.8B ViT，激活11B | 未公开 | 未公开 | 稠密，未公开参数 |
| 生成速度 | 最高400 Tokens/s | 较快  | 较快  | 较慢  |
| 工具调用 | 高可靠，长程稳定 | 良好  | 良好  | 优秀  |
| 多模态 | 原生支持UI/图表理解 | 有限  | 有限  | 有限  |
| 开源  | 完全开源 | 开源  | 开源  | 闭源  |
| 成本  | 低，约Claude的1/9 | 低   | 低   | 高   |

### 与DeepSeek V4 Flash的正面交锋

在编码基准测试中，该工具略占上风。据官方数据，SWE-Bench Pro得分**56.3%**，DeepSeek V4 Flash为**55.6%**。Terminal-Bench 2.1得分**59.6%**，对手为**55.1%**。速度上，它更快。

### 对比MiniMax M2.7：响应体验与成本

开发者反馈，该工具在响应速度上优势明显。成本方面，两者均属低价位。但该工具的多模态和工具调用可靠性更突出。

### 开源生态中的定位：与Claude Opus 4.6的成本较量

作为开源大模型，它可免费商用。Claude Opus 4.6是闭源API，成本高。据量子位报道，该工具单任务成本仅Claude的约1/9，但编程能力达到其**97%**。

## 这3类用户最适合用阶跃Step 3.7 Flash

不同用户能从中获得不同价值。下面列出三类典型人群。

### AI应用开发者：快速构建Agent原型

你可以利用它的工具调用和生态兼容性。快速接入Claude Code等框架，构建自动化Agent。多模态能力让你处理图像和UI任务更轻松。

### 企业自动化团队：处理复杂工作流

企业环境中，它可处理多步骤、多工具任务。比如，自动抓取数据、分析报表、发送邮件。高可靠性降低了流程中断的风险。

### 研究人员：探索多模态Agent的能力边界

研究人员可用它进行实验。联网搜索和多模态理解能力，适合探索开放域任务。开源特性也便于修改和微调。

## 阶跃Step 3.7 Flash能帮你节省什么

使用它能带来具体的时间、成本和效率收益。

### 开发时间：从小时级到分钟级

以前构建一个UI测试Agent可能需要几小时。现在用该工具，生成脚本只需几分钟。它理解截图后直接输出代码，省去手动编写步骤。

### 推理成本：降至Claude Opus 4.6的1/9

> 据量子位报道，单任务成本约Claude的1/9。对于每天运行成千上万次任务的企业，这能节省大量预算。

### 任务成功率：稳定完成66个工具调用

有开发者测试，它能稳定完成66个工具调用。这意味着复杂工作流不易失败。隐性成本如人工排查、重试时间都减少了。

## 阶跃Step 3.7 Flash近半年的演进

该模型发布不久，但已有显著动态。

### 从Step 3.5 Flash到3.7：Agent能力的飞跃

相比前代Step 3.5 Flash，它在编码和工具调用上提升明显。SWE-Bench Pro从**51.3%**升至**56.3%**。Terminal-Bench 2.1从**53.5%**升至**59.6%**。

### 登顶AA榜：速度与性价比的认可

据Artificial Analysis榜单，它以409 tokens/s输出速度位列第一。同时在端到端响应时长、智能效率、速度价格比上领先。

### 开源社区的热烈反响

发布两天后，它登上OpenRouter Trending全球第二。在HuggingFace上，下载量和讨论持续升温。开发者称赞其效率和工具调用能力。

## 阶跃Step 3.7 Flash的亮点与局限

客观看待它的优缺点，有助于你做出选择。

### 三大突出优点

1.  **速度极快**：400 Tokens/s生成速度，减少等待。
2.  **工具调用可靠**：长程任务中保持稳定，降低失败率。
3.  **多模态原生支持**：直接理解UI、图表，无需额外模型。

### 两个不可忽视的缺点

1.  **上下文长度有限**：256K Tokens，处理超长文档可能不足。
2.  **体系相对较新**：虽然兼容主流框架，但社区资源不如老牌模型丰富。

## 阶跃Step 3.7 Flash在国内的可用性

国内用户可以无障碍使用它。

### 访问方式：官网与API无障碍

官网 stepfun.com 可直接访问。API调用无需特殊网络配置。这为国内开发者提供了便利。

### 中文界面与文档支持

平台提供中文界面和文档。技术说明、API参考均为中文。这降低了语言门槛。

### 支付方式：适配国内习惯

据官网信息，支持支付宝、微信支付等国内常用方式。充值付费很方便。

## 参考资料

-   [腾讯网](https://news.qq.com/rain/a/20260529A02WZE00)（2026-05-29）— 阶跃星辰发布Step 3.7 Flash，介绍架构与能力。
-   [网易](https://m.163.com/tech/article/KUITIFMB00098IEO.html)（2026-06-04）— 报道AA榜单成绩，速度409 tokens/s。
-   [量子位](https://www.qbitai.com/2026/06/429294.html)（2026-06-05）— 成本对比Claude Opus 4.6，编程能力达**97%**。
-   [IT之家](https://www.ithome.com/0/956/860.htm)（2026-05-29）— 详细功能说明与开源地址。
-   [i黑马](https://www.iheima.com/article-397937.html)（2026-05-29）— 基准测试得分与Agent优化细节。


---