Step 3.7 Flash favicon

Step 3.7 Flash

Step 3.7 Flash: 400 TPS의 초고속 효율성과 강력한 에이전트 기능을 갖춘 멀티모달 AI

소개:

Step 3.7 Flash는 '보고, 생각하고, 행동하는' 차세대 에이전트 기반 AI 모델입니다. 400 TPS의 압도적인 속도와 네이티브 멀티모달 이해력을 바탕으로 복잡한 코딩, 웹 및 시각 검색, 엔터프라이즈 업무 자동화를 완벽하게 수행하며 비용 효율적인 Advisor Mode를 지원합니다.

추가 날짜:

2026-06-01

월간 방문객:

--K

Step 3.7 Flash - AI Tool Screenshot and Interface Preview

Step 3.7 Flash 제품정보

Step 3.7 Flash: 에이전트 효율성의 새로운 지평을 여는 초고속 멀티모달 AI 모델

AI 기술의 발전이 단순한 질문 답변을 넘어 실제 행동을 수행하는 단계로 진화함에 따라, Step 3.7 Flash는 에이전트 효율성의 새로운 기준을 제시합니다. Step 3.7 Flash는 실세계의 에이전트 구동을 위해 설계된 고효율 플래시 모델로, 초당 최대 400개의 토큰(TPS)을 처리하는 놀라운 속도와 강력한 추론 능력을 결합했습니다. 이 모델의 핵심 철학은 **"See. Think. Act."**로 요약되며, 시각적 인식부터 복잡한 문제 해결, 그리고 도구 실행에 이르기까지 완벽한 에이전트 워크플로우를 제공합니다.

What's Step 3.7 Flash?

Step 3.7 Flash는 에이전트의 효율성을 극대화하기 위해 탄생한 차세대 AI 모델입니다. 단순히 텍스트를 생성하는 것에 그치지 않고, 디지털 환경 내에서 계획을 세우고, 실행하며, 관찰하고, 반복하는 '에이전트 루프'를 수행하는 데 최적화되어 있습니다. 특히 Step 3.7 Flash는 11B의 액티브 파라미터를 보유하면서도 196B 규모의 총 파라미터를 갖춘 구조로, 대규모 모델의 지능과 소형 모델의 속도를 동시에 확보했습니다.

이 모델은 네이티브 멀티모달 이해력과 행동 능력, 강화된 웹 및 비주얼 검색, 신뢰할 수 있는 도구 오케스트레이션, 그리고 기존 에이전트 생태계와의 완벽한 호환성을 특징으로 합니다. 실시간성이 중요한 에이전트 서비스에서 Step 3.7 Flash는 최고의 퍼포먼스를 발휘합니다.

주요 특징 (Features)

1. 네이티브 멀티모달 이해 및 행동

Step 3.7 Flash는 제품 UI, 복잡한 문서, 정밀한 차트, 자연스러운 장면 등 광범위한 이미지를 네이티브하게 이해합니다. 단순히 이미지를 묘사하는 것을 넘어, 시각적 정보를 바탕으로 코드를 작성하거나 도구를 호출하여 직접 행동을 취할 수 있는 능력을 갖추고 있습니다.

2. 웹 및 비주얼 검색의 획기적 강화

Step 3.7 Flash의 웹 검색 능력은 더 많은 소스를 탐색하고 심층적인 후속 질문을 수행할 수 있도록 설계되었습니다. 비주얼 검색 도구를 통해 다른 시스템이 놓치기 쉬운 롱테일 엔티티(long-tail entities)나 최신 개념까지 정확하게 인식하며, 이는 모델의 파라미터 한계를 지식 검색 도구로 보완하는 전략적인 구조를 보여줍니다.

3. 신뢰할 수 있는 도구 사용 및 오케스트레이션

터미널 구동, 브라우저 조작, Office 도구 활용 및 검색에 이르기까지 Step 3.7 Flash는 긴 실행 과정 속에서도 일관성을 유지합니다. 도구 호출 오류(broken toolcalls)나 실행 실패를 최소화하여 높은 신뢰도의 업무 자동화를 보장합니다.

4. 에이전트 생태계와의 완벽한 호환성

Step 3.7 Flash는 Claude Code, KiloCode, Hermes Agent, OpenClaw와 같은 주요 에이전트 프레임워크와 호환됩니다. 이는 기업이 기존 워크플로우를 대폭 수정하지 않고도 낮은 통합 비용으로 Step 3.7 Flash를 즉시 도입할 수 있음을 의미합니다.

5. 혁신적인 Advisor Mode

효율적인 플래시 모델의 속도를 유지하면서 더 높은 지능이 필요한 순간, Step 3.7 FlashAdvisor Mode를 지원합니다. Step 3.7 Flash가 실행을 주도하되, 복잡한 판단이나 오류 복구가 필요한 시점에만 대규모 모델(Advisor)의 조언을 구하는 방식입니다. 이를 통해 Claude Opus 4.6 성능의 97%에 도달하면서도 작업 비용은 약 1/9 수준($0.19)으로 낮췄습니다.

활용 사례 (Use Case)

에이전트 기반 코딩 (Agentic Coding)

Step 3.7 Flash는 코딩 에이전트 분야에서 압도적인 성과를 보입니다. SWE-Bench Pro에서 56.3%, Terminal-Bench 2.1에서 59.6%를 기록하며 이전 모델인 Step 3.5 Flash 대비 비약적인 성장을 이루었습니다. 터미널 환경에서의 코드 실행 및 수정 능력이 탁월하여 개발 효율성을 극대화합니다.

엔터프라이즈 업무 자동화

기업의 실제 업무 환경에 최적화된 Step 3.7 Flash는 금융, 회계, 데이터 분석 분야에서 전문적인 지식을 발휘합니다. 복잡한 스프레드시트 분석, 증거 기반의 필터링, 정보 합성 등을 통해 생산 일정 관리나 열처리 분석과 같은 전문 공학 작업에서도 안정적인 결과물을 제공합니다. GDPval 벤치마크에서 44개 직종에 걸쳐 뛰어난 성능을 입증했습니다.

시각적 추론 및 GUI 조작

Step 3.7 Flash는 GUI(그래픽 사용자 인터페이스) 조작 능력이 탁월합니다. 특히 Android Daily 벤치마크에서 61.87%를 기록하며 여러 앱을 넘나드는 긴 호흡의 작업을 안정적으로 완수합니다. 사용자가 프론트엔드 코드를 작성하면, 모델이 직접 GUI를 통해 결과물을 테스트하고 수정하는 '코드-GUI 복합 행동'이 가능합니다.

사용 방법 (How to Use)

Step 3.7 Flash는 다양한 플랫폼과 인프라를 통해 즉시 이용 가능합니다.

  1. 플랫폼 접속:
  2. 배포 옵션:
    • 클라우드 및 데이터 센터: 대규모 엔터프라이즈 환경을 위한 현대적 인프라 배포를 지원합니다.
    • 로컬 배포: 128GB 이상의 통합 메모리를 갖춘 Mac Studio, Macbook Pro 또는 NVIDIA DGX Station 등 고사양 워크스테이션에서 실행 가능합니다.
  3. 오픈소스 인프라 활용: vLLM, SGLang, Hugging Face Transformers, llama.cpp 등을 통해 추론 및 서빙을 구현할 수 있습니다.
  4. 모델 커스터마이징: NVIDIA Nemo 에코시스템(AutoModel, Megatron Core 등)을 통해 맞춤형 개발이 가능합니다.

자주 묻는 질문 (FAQ)

Q: Step 3.7 Flash의 속도는 어느 정도인가요?

A: Step 3.7 Flash는 최대 400 TPS(Tokens Per Second)의 처리 속도를 제공하여, 실시간 응답이 필수적인 에이전트 작업에 최적화되어 있습니다.

Q: 멀티모달 기능을 지원하나요?

A: 네, Step 3.7 Flash는 텍스트뿐만 아니라 이미지를 보고 이해하며, 이를 바탕으로 코드를 작성하거나 도구를 사용하는 '네이티브 멀티모달' 기능을 지원합니다.

Q: Advisor Mode는 무엇이며 왜 중요한가요?

A: Advisor Mode는 Step 3.7 Flash가 실행을 담당하고, 필요할 때만 상위 모델의 조언을 받는 협업 구조입니다. 이를 통해 고성능 모델의 지능을 유지하면서도 비용은 90% 가까이 절감할 수 있는 혁신적인 기능입니다.

Q: 어떤 하드웨어에서 로컬 배포가 가능한가요?

A: NVIDIA DGX Station, AMD Ryzen AI Max+ 395 기반 시스템, 또는 128GB 이상의 통합 메모리를 탑재한 Apple Mac 기기 등에서 배포 및 실행이 가능합니다.

Loading related products...