Step 3.7 Flash

Step 3.7 Flash: 400 TPS의 초고속 효율성과 강력한 에이전트 기능을 갖춘 멀티모달 AI

소개:

Step 3.7 Flash는 '보고, 생각하고, 행동하는' 차세대 에이전트 기반 AI 모델입니다. 400 TPS의 압도적인 속도와 네이티브 멀티모달 이해력을 바탕으로 복잡한 코딩, 웹 및 시각 검색, 엔터프라이즈 업무 자동화를 완벽하게 수행하며 비용 효율적인 Advisor Mode를 지원합니다.

추가 날짜:

2026-06-01

월간 방문객:

--K

코드 및 IT

Step 3.7 Flash - AI Tool Screenshot and Interface Preview

Step 3.7 Flash 제품정보

Step 3.7 Flash: 에이전트 효율성의 새로운 지평을 여는 초고속 멀티모달 AI 모델

AI 기술의 발전이 단순한 질문 답변을 넘어 실제 행동을 수행하는 단계로 진화함에 따라, Step 3.7 Flash는 에이전트 효율성의 새로운 기준을 제시합니다. Step 3.7 Flash는 실세계의 에이전트 구동을 위해 설계된 고효율 플래시 모델로, 초당 최대 400개의 토큰(TPS)을 처리하는 놀라운 속도와 강력한 추론 능력을 결합했습니다. 이 모델의 핵심 철학은 **"See. Think. Act."**로 요약되며, 시각적 인식부터 복잡한 문제 해결, 그리고 도구 실행에 이르기까지 완벽한 에이전트 워크플로우를 제공합니다.

What's Step 3.7 Flash?

Step 3.7 Flash는 에이전트의 효율성을 극대화하기 위해 탄생한 차세대 AI 모델입니다. 단순히 텍스트를 생성하는 것에 그치지 않고, 디지털 환경 내에서 계획을 세우고, 실행하며, 관찰하고, 반복하는 '에이전트 루프'를 수행하는 데 최적화되어 있습니다. 특히 Step 3.7 Flash는 11B의 액티브 파라미터를 보유하면서도 196B 규모의 총 파라미터를 갖춘 구조로, 대규모 모델의 지능과 소형 모델의 속도를 동시에 확보했습니다.

이 모델은 네이티브 멀티모달 이해력과 행동 능력, 강화된 웹 및 비주얼 검색, 신뢰할 수 있는 도구 오케스트레이션, 그리고 기존 에이전트 생태계와의 완벽한 호환성을 특징으로 합니다. 실시간성이 중요한 에이전트 서비스에서 Step 3.7 Flash는 최고의 퍼포먼스를 발휘합니다.

주요 특징 (Features)

1. 네이티브 멀티모달 이해 및 행동

Step 3.7 Flash는 제품 UI, 복잡한 문서, 정밀한 차트, 자연스러운 장면 등 광범위한 이미지를 네이티브하게 이해합니다. 단순히 이미지를 묘사하는 것을 넘어, 시각적 정보를 바탕으로 코드를 작성하거나 도구를 호출하여 직접 행동을 취할 수 있는 능력을 갖추고 있습니다.

2. 웹 및 비주얼 검색의 획기적 강화

Step 3.7 Flash의 웹 검색 능력은 더 많은 소스를 탐색하고 심층적인 후속 질문을 수행할 수 있도록 설계되었습니다. 비주얼 검색 도구를 통해 다른 시스템이 놓치기 쉬운 롱테일 엔티티(long-tail entities)나 최신 개념까지 정확하게 인식하며, 이는 모델의 파라미터 한계를 지식 검색 도구로 보완하는 전략적인 구조를 보여줍니다.

3. 신뢰할 수 있는 도구 사용 및 오케스트레이션

터미널 구동, 브라우저 조작, Office 도구 활용 및 검색에 이르기까지 Step 3.7 Flash는 긴 실행 과정 속에서도 일관성을 유지합니다. 도구 호출 오류(broken toolcalls)나 실행 실패를 최소화하여 높은 신뢰도의 업무 자동화를 보장합니다.

4. 에이전트 생태계와의 완벽한 호환성

Step 3.7 Flash는 Claude Code, KiloCode, Hermes Agent, OpenClaw와 같은 주요 에이전트 프레임워크와 호환됩니다. 이는 기업이 기존 워크플로우를 대폭 수정하지 않고도 낮은 통합 비용으로 Step 3.7 Flash를 즉시 도입할 수 있음을 의미합니다.

5. 혁신적인 Advisor Mode

효율적인 플래시 모델의 속도를 유지하면서 더 높은 지능이 필요한 순간, Step 3.7 Flash는 Advisor Mode를 지원합니다. Step 3.7 Flash가 실행을 주도하되, 복잡한 판단이나 오류 복구가 필요한 시점에만 대규모 모델(Advisor)의 조언을 구하는 방식입니다. 이를 통해 Claude Opus 4.6 성능의 97%에 도달하면서도 작업 비용은 약 1/9 수준($0.19)으로 낮췄습니다.

활용 사례 (Use Case)

에이전트 기반 코딩 (Agentic Coding)

Step 3.7 Flash는 코딩 에이전트 분야에서 압도적인 성과를 보입니다. SWE-Bench Pro에서 56.3%, Terminal-Bench 2.1에서 59.6%를 기록하며 이전 모델인 Step 3.5 Flash 대비 비약적인 성장을 이루었습니다. 터미널 환경에서의 코드 실행 및 수정 능력이 탁월하여 개발 효율성을 극대화합니다.

엔터프라이즈 업무 자동화

기업의 실제 업무 환경에 최적화된 Step 3.7 Flash는 금융, 회계, 데이터 분석 분야에서 전문적인 지식을 발휘합니다. 복잡한 스프레드시트 분석, 증거 기반의 필터링, 정보 합성 등을 통해 생산 일정 관리나 열처리 분석과 같은 전문 공학 작업에서도 안정적인 결과물을 제공합니다. GDPval 벤치마크에서 44개 직종에 걸쳐 뛰어난 성능을 입증했습니다.

시각적 추론 및 GUI 조작

Step 3.7 Flash는 GUI(그래픽 사용자 인터페이스) 조작 능력이 탁월합니다. 특히 Android Daily 벤치마크에서 61.87%를 기록하며 여러 앱을 넘나드는 긴 호흡의 작업을 안정적으로 완수합니다. 사용자가 프론트엔드 코드를 작성하면, 모델이 직접 GUI를 통해 결과물을 테스트하고 수정하는 '코드-GUI 복합 행동'이 가능합니다.

사용 방법 (How to Use)

Step 3.7 Flash는 다양한 플랫폼과 인프라를 통해 즉시 이용 가능합니다.

플랫폼 접속:
- 글로벌 사용자: platform.stepfun.ai
- 중국 내 사용자: platform.stepfun.com
- OpenRouter 및 NVIDIA NIM을 통해서도 액세스할 수 있습니다.
배포 옵션:
- 클라우드 및 데이터 센터: 대규모 엔터프라이즈 환경을 위한 현대적 인프라 배포를 지원합니다.
- 로컬 배포: 128GB 이상의 통합 메모리를 갖춘 Mac Studio, Macbook Pro 또는 NVIDIA DGX Station 등 고사양 워크스테이션에서 실행 가능합니다.
오픈소스 인프라 활용: vLLM, SGLang, Hugging Face Transformers, llama.cpp 등을 통해 추론 및 서빙을 구현할 수 있습니다.
모델 커스터마이징: NVIDIA Nemo 에코시스템(AutoModel, Megatron Core 등)을 통해 맞춤형 개발이 가능합니다.

자주 묻는 질문 (FAQ)

Q: Step 3.7 Flash의 속도는 어느 정도인가요?

A: Step 3.7 Flash는 최대 400 TPS(Tokens Per Second)의 처리 속도를 제공하여, 실시간 응답이 필수적인 에이전트 작업에 최적화되어 있습니다.

Q: 멀티모달 기능을 지원하나요?

A: 네, Step 3.7 Flash는 텍스트뿐만 아니라 이미지를 보고 이해하며, 이를 바탕으로 코드를 작성하거나 도구를 사용하는 '네이티브 멀티모달' 기능을 지원합니다.

Q: Advisor Mode는 무엇이며 왜 중요한가요?

A: Advisor Mode는 Step 3.7 Flash가 실행을 담당하고, 필요할 때만 상위 모델의 조언을 받는 협업 구조입니다. 이를 통해 고성능 모델의 지능을 유지하면서도 비용은 90% 가까이 절감할 수 있는 혁신적인 기능입니다.

Q: 어떤 하드웨어에서 로컬 배포가 가능한가요?

A: NVIDIA DGX Station, AMD Ryzen AI Max+ 395 기반 시스템, 또는 128GB 이상의 통합 메모리를 탑재한 Apple Mac 기기 등에서 배포 및 실행이 가능합니다.

Alternatives Tools

mectrics

mectrics: macOS 메뉴바를 위한 가볍고 강력한 오픈 소스 시스템 모니터링 솔루션

mectrics는 macOS 사용자를 위해 설계된 경량 시스템 모니터로, CPU, 메모리, 네트워크 등의 핵심 데이터를 메뉴바에서 실시간으로 제공합니다. 오픈 소스 기반의 mectrics는 개인 정보를 엄격히 보호하며, 'Compact Health' 기능을 통해 불필요한 알림을 최소화하고 꼭 필요한 순간에만 상태를 보고합니다. 또한 CLI를 지원하여 헤드리스 Mac 환경에서도 효율적인 모니터링이 가능합니다.

코드 및 IT

SKI

SKI: 코딩 에이전트와 대화하며 개발하는 혁신적인 온디바이스 음성 코딩 솔루션

SKI는 개발자가 코딩 에이전트와 자연스러운 음성으로 소통하며 소프트웨어를 구축할 수 있게 해주는 혁신적인 도구입니다. 100% 온디바이스에서 작동하여 데이터 유출 걱정 없이 로컬 환경에서 음성-텍스트 변환과 신경망 음성 합성을 지원하며, 풀듀플렉스 기능을 통해 실시간 대화가 가능합니다.

코드 및 IT

Claude Code usage tracking by LangWatch

LangWatch: Claude Code 및 AI 에이전트 사용량 추적 및 비용 최적화 플랫폼

LangWatch는 Claude Code, Codex, Cursor 등 AI 에이전트의 사용량을 실시간으로 추적하고 분석하는 LLM 엔지니어링 플랫폼입니다. 전체 트레이스 기록 캡처, 상세한 토큰 및 비용 회계, 캐시 히트 추적 기능을 통해 AI 개발 흐름을 개선하고 정확한 운영 비용을 파악할 수 있도록 돕습니다.

코드 및 IT

Prelint

AI 코드의 제품 정렬을 유지하는 자동 제품 리뷰 솔루션, Prelint

Prelint는 AI가 작성한 코드에서 발생할 수 있는 제품 드리프트를 방지하기 위해 모든 풀 리퀘스트를 제품 사양과 대조하여 검토하는 혁신적인 도구입니다. 비즈니스 로직, 규정 준수, 전략적 일관성을 자동으로 확인하여 개발팀의 생산성을 높이고 오류를 사전에 차단합니다.

코드 및 IT

Prefactor

Prefactor: AI 에이전트의 품질, 드리프트 및 리스크를 실시간으로 평가하고 제어하는 플랫폼

Prefactor는 AI 에이전트가 운영 환경에서 수행하는 모든 동작을 실시간으로 평가하고 관리하는 혁신적인 플랫폼입니다. 단순 모니터링을 넘어 품질, 드리프트, 리스크를 즉각 점수화하고 문제가 발생하기 전에 개입하여 에이전트의 신뢰성을 보장합니다. SDK와 CLI를 통해 신속하게 설치 가능하며, LLM-as-judge와 런타임 실행 기능을 통해 안전한 AI 운영을 지원합니다.

코드 및 IT

Lottie Creator 2.0

Lottie Creator: 전문가 수준의 로티 애니메이션을 간편하게 제작하고 최적화하는 도구

LottieFiles에서 제공하는 Lottie Creator는 복잡한 코딩이나 디자인 기술 없이도 웹과 모바일용 로티(Lottie) 애니메이션을 쉽고 빠르게 제작할 수 있는 혁신적인 웹 기반 애니메이션 툴입니다. 직관적인 인터페이스와 강력한 편집 기능을 통해 초보자부터 전문가까지 모두에게 최적화된 제작 환경을 제공합니다.

코드 및 IT

Claude Opus 5

클로드 오퍼스 5 (Claude Opus 5) - 합리적인 비용으로 제공되는 최첨단 지능형 AI 모델

클로드 오퍼스 5는 Claude Fable 5 수준의 지능을 절반의 비용으로 제공하는 Anthropic의 차세대 모델입니다. 코딩, 과학 연구, 복잡한 문제 해결에서 압도적인 성능을 발휘하며 더욱 강화된 안전성을 자랑합니다.

코드 및 IT

Openbase

Openbase: 음성으로 제어하는 엔지니어링용 보이스 IDE 및 코딩 에이전트 솔루션

Openbase는 실제 엔지니어링 작업을 위한 세계에서 가장 진보된 보이스 IDE입니다. Mac과 연동되어 음성 명령으로 코드를 작성하고, 코딩 에이전트의 작업을 실시간으로 모니터링하며, 중요한 명령 승인 및 코드 차이(Diff) 검토를 수행할 수 있습니다. Codex, Claude Code, Cursor와 호환되어 책상을 떠나서도 효율적인 개발 환경을 유지해주는 혁신적인 보이스 컨트롤 허브입니다.

코드 및 IT

Loading related products...