Step 3.7 Flash

Step 3.7 Flash：引领智能体效率新前沿的高效多模态大模型

介绍:

Step 3.7 Flash 是一款专为智能体（Agent）打造的高效 Flash 模型，发布于 2026 年 5 月 29 日。它具备原生多模态理解能力，在 Agentic Coding、搜索增强及 GUI 自动化领域表现卓越。凭借每秒高达 400 TPS 的处理速度和独特的 Advisor Mode，该模型在显著降低成本的同时，实现了接近顶级闭源模型的性能。它是构建企业级、高可靠智能体生态的理想基座。

记录:

2026-06-01

每月访客数:

--K

编程&IT

Step 3.7 Flash - AI Tool Screenshot and Interface Preview

Step 3.7 Flash 产品信息

Step 3.7 Flash：重塑智能体效率的先锋多模态大模型

在人工智能技术飞速发展的 2026 年，智能体的效率已成为技术竞争的新前沿。Step 3.7 Flash 作为一款专为现实世界智能体打造的高效 Flash 级别模型，正式于 2026 年 5 月 29 日发布。其核心使命是通过“看（See）、思（Think）、行（Act）”的有机结合，为开发者和企业提供极致的推理速度与卓越的执行能力。

什么是 Step 3.7 Flash？

Step 3.7 Flash 是由 StepFun 研发的最新一代 Flash 级大模型。它不仅具备极高的吞吐量（最高可达 400 TPS），更在架构设计上专注于智能体（Agent）的实际应用需求。Step 3.7 Flash 被定位为智能体基座模型，旨在解决从感知到行动的闭环挑战，使其在复杂的数字化办公、软件工程及多模态交互场景中能够游刃有余。

“智能体效率是新一代模型竞争的关键。” Step 3.7 Flash 正是通过原生多模态理解与精准的工具调用，打破了传统模型在执行长链路任务时的瓶颈。

Step 3.7 Flash 核心功能特性

1. 原生多模态理解与行动能力

Step 3.7 Flash 能够跨范围理解多种图像类型，包括产品 UI 界面、各类文档、复杂图表以及自然场景。它不仅能“看懂”，还能在此基础上编写代码或调用相关工具进行响应，实现从感知到执行的无缝衔接。

2. 网页与视觉搜索增强

该模型在搜索深度与广度上进行了深度优化：

网页搜索：覆盖更多来源，支持更深层次的追问与信息过滤。
视觉搜索：能够识别竞争对手难以捕捉的“长尾实体”和刚出现的新概念，极大地增强了信息的实时性。

3. 可靠的工具调用与编排

Step 3.7 Flash 具备驱动终端（Terminal）、浏览器、Office 办公工具及搜索模块的能力。即便在长周期的运行任务中，也能保持高度的逻辑连贯性，减少了工具调用中断（Broken toolcalls）和任务失败的情况。

4. 智能体生态兼容性

为了降低集成成本，Step 3.7 Flash 深度适配了主流的智能体框架，如 Claude Code、KiloCode、Hermes Agent 和 OpenClaw。开发者无需大规模重构现有工作流即可快速接入。

核心技术：Agentic Coding 与 Advisor Mode

在 Agentic Coding（智能体编程）领域，Step 3.7 Flash 表现尤为突出。代码是数字化智能体执行“计划-执行-观察-迭代”闭环的最纯粹形式。相比于前代模型，Step 3.7 Flash 在 SWE-Bench Pro 上提升了 5%，在 Terminal-Bench 2.1 上提升了 6.1%。

Advisor Mode：平衡性能与成本

为了在保持 Flash 级别效率的同时追求极致质量，Step 3.7 Flash 引入了 Advisor Mode（顾问模式）：

执行者模型：Step 3.7 Flash 负责全流程的端到端执行，包括调用工具和处理结果。
顾问模型：仅在规划受阻或遇到重复失败等关键拐点时，咨询更大规模的顾问模型。

这种策略使得 Step 3.7 Flash 能够以约 1/9 的成本（每项任务仅 $0.19，而 Claude Opus 4.6 需要 $1.76），达到顶级模型 97% 的编程性能，显著提升了生产环境下的投资回报率。

企业级应用与深层搜索行为

企业级任务优化

Step 3.7 Flash 针对企业办公环境进行了深度优化，尤其是在财务、会计和数据分析领域。通过与行业专家的深度合作，模型内置了专业知识。在 GDPval 职业评估中，它涵盖了 44 个职业场景，准确率达到 45.8%。

深度搜索与行为轨迹

在复杂的搜索任务中，Step 3.7 Flash 不再仅仅是 pack 知识，而是学会了如何“调用”知识。例如在法律冲突审查案例中，它能结合论文、官方规则和案例分析，捕捉到问题中隐藏的复杂陷阱，在 DeepSearchQA 任务中 F1 分数高达 92.82%。

视觉智能体：Agents That Can SEE

Step 3.7 Flash 强化了对视觉工具的调用能力：

Python 工具集成：支持裁剪（Crop）、缩放（Zoom）、像素绘图及边界框定位。在 V* 视觉感知测试中获得 95.29% 的高分。
GUI 操作：特别针对手机端（Phone-use）进行了优化。在 Android Daily 基准测试中，其稳定性和鲁棒性远超同类大尺寸模型，能够自主完成跨 App 的长链路任务。

使用场景 (Use Case)

自动化编程开发：通过集成到 IDE 中，自主修复代码漏洞、运行测试并迭代修复，适配各种主流智能体框架。
企业级知识工程：独立处理复杂的截图、文档和电子表格，生成可直接交付的研究报告或排程计划。
深度市场调研：利用增强型视觉搜索识别新奇产品，并结合网页搜索进行深度的竞争对手分析。
移动端自动化：在手机上执行跨 App 操作，如差旅规划、社交媒体管理等，支持从“草图”直接生成“网页”。

获取与部署方案

Step 3.7 Flash 提供灵活的部署选项：

API 平台：通过 platform.stepfun.ai 或 OpenRouter 接入。
本地化部署：支持在 NVIDIA DGX Station、AMD Ryzen AI Max+ 以及拥有 128GB 以上统一内存的 Mac Studio 上运行。
生态支持：全面兼容 vLLM、SGLang、llama.cpp 以及 NVIDIA NeMo 框架。

常见问题解答 (FAQ)

Q: Step 3.7 Flash 的处理速度有多快？
A: Step 3.7 Flash 在实际应用中最高支持 400 TPS，是目前市面上最高效的 Flash 级别模型之一。

Q: 什么是 Advisor Mode？它如何节省成本？
A: Advisor Mode 让 Step 3.7 Flash 作为主要执行者，仅在遇到难题时向更高级模型请教。这使得任务成本从传统顶级模型的 $1.76 降至 $0.19，降幅显著。

Q: 它支持中文界面和部署吗？
A: 是的，Step 3.7 Flash 完美支持中文与英文，并在国内 platform.stepfun.com 平台提供服务，支持多种国产及国际主流硬件环境部署。

Q: Step 3.7 Flash 能处理图形界面（GUI）吗？
A: 可以。它支持 GUI 视觉感知和动作执行，特别是在 Android 系统自动化操作方面表现优异，能自主完成跨应用的复杂交互任务。

Alternatives Tools

mectrics

mectrics：一款为 macOS 设计的轻量级开源菜单栏系统监控工具

mectrics 是一款免费、开源且轻量级的 macOS 菜单栏系统监控应用。它能够实时监控 CPU、内存、电池、网络、磁盘、GPU 以及温度和风扇状态。mectrics 极其重视隐私，所有数据均保留在本地。其独特的“紧凑健康”模式允许用户仅在系统触发特定阈值或面临热压力时接收提醒。此外，它还内置了强大的 CLI 命令行工具，支持对无头 Mac 进行监控，是开发者和高级用户的理想选择。

编程&IT

SKI

SKI：本地全双工语音编程助手，让您的 Coding Agent 实现高效自然对话

SKI 是一款革新性的本地语音编程工具，旨在为开发者提供与 Coding Agent 对话的能力。它支持 Claude Code、Cursor 等主流 Agent，具备 100% 本地化处理、全双工语音交互和会议转录功能。通过 SKI，您可以实现“你指挥，它构建”的无缝编程体验，且所有语音数据均不离开您的计算机，确保极致的隐私安全与极高的响应速度。

编程&IT

Claude Code usage tracking by LangWatch

LangWatch：全方位 Claude Code 使用追踪与 AI 成本优化平台

LangWatch 是一款专业的 AI 工程平台，旨在帮助开发者追踪 Claude Code、Cursor 及各类 AI 代理的使用情况。通过简单的 npx 命令，用户即可捕获完整会话追踪、监控 Token 消耗并分析理论成本。平台提供深度工具调用追踪、缓存命中分析及 PII 自动脱敏，是优化 AI 代理效能与成本的理想选择。

编程&IT

Prelint

Prelint：防止AI代码偏差的自动化产品评审工具，确保代码与产品规格精准对齐

Prelint是一款专为现代AI开发流程设计的自动化产品评审平台。它通过在GitHub拉取请求（PR）阶段实时检查AI生成的代码是否符合产品规格书，有效防止业务逻辑、合规性、架构标准和战略目标方面的“产品偏差”。Prelint能够识别AI无法理解的商业意图与约束，确保开发进度不脱离预定轨道，是提升AI驱动开发效率与质量的核心利器。

编程&IT

Prefactor

Prefactor：实时AI智能体评估与运行时干预平台，实现Agent生产环境闭环可靠性

Prefactor 是一款专为 AI 智能体（AI Agents）打造的实时评估与可靠性管理平台。它不仅能通过 SDK 和 CLI 快速集成并监控智能体运行，更能通过“观察-评估-行动”的闭环机制，在生产环境中实时评估质量、漂移和风险。不同于传统只提供仪表盘的工具，Prefactor 支持运行时干预，如自动拦截风险行为或挂起等待人工审批，确保 AI 智能体在受控、安全且高效的状态下运行。

编程&IT

Lottie Creator 2.0

Lottie Creator：让 Lottie 动画制作更简单的在线创作工具

Lottie Creator 是由 LottieFiles 推出的专业在线动画制作工具。它旨在让设计师和开发者无需复杂代码，通过直观的界面、关键帧编辑、丰富的图形资产库和实时预览功能，轻松创建、编辑和优化高性能的 Lottie 动画，适用于网页、移动应用及各类数字营销场景。

编程&IT

Claude Opus 5

Claude Opus 5：性能卓越且极具性价比的新一代前沿智能AI模型

Claude Opus 5 是 Anthropic 推出的最新旗舰级 AI 模型，在提供接近 Fable 5 顶尖智能的同时，成本仅为其一半。它在编码（Frontier-Bench）、知识工作（ARC-AGI 3）及科学研究（生命科学）等领域刷新了行业标准。凭借强大的自主迭代能力、更精准的视觉输出以及行业领先的对齐安全机制，Claude Opus 5 已成为 Claude Pro 和 Max 用户的首选默认模型，助力开发者与企业高效处理复杂任务。

编程&IT

Openbase

Openbase：专为工程师打造的语音 IDE 与 AI 编码代理协作平台

Openbase 是一款领先的语音 IDE，旨在通过语音指令驱动 Codex、Claude Code 和 Cursor 等 AI 编码代理。它允许开发者通过语音发起任务、审批敏感指令并审阅代码 Diff，即使离开办公桌也能通过手机保持开发流程。Openbase 提供了实时的转录、自动化的测试反馈以及深度集成的开发堆栈，是追求极致效率的真实工程任务的首选工具。

编程&IT

Loading related products...