Step 3.7 Flash
Step 3.7 Flash: Высокоэффективная мультимодальная модель для автономных агентов и кодинга
Step 3.7 Flash — это инновационная мультимодальная ИИ-модель, оптимизированная для работы автономных агентов. С невероятной скоростью до 400 TPS она объединяет зрение, мышление и действие (See, Think, Act). Модель демонстрирует выдающиеся результаты в агентском программировании (SWE-Bench Pro 56.3%), глубоком поиске и управлении GUI. Уникальный режим Advisor Mode позволяет достигать производительности уровня Claude Opus при затратах в 9 раз ниже. Step 3.7 Flash поддерживает современную экосистему развертывания, включая vLLM и NVIDIA NIM, и идеально подходит для корпоративной автоматизации.
2026-06-01
--K
Step 3.7 Flash Информация о продукте
Step 3.7 Flash: Новая граница эффективности автономных агентов
В эпоху развития искусственного интеллекта фокус смещается с простого предоставления ответов на выполнение конкретных действий в цифровой среде. Step 3.7 Flash — это высокоэффективная мультимодальная модель нового поколения, созданная специально для современных автономных агентов. Под девизом «Видеть. Думать. Действовать.» (See. Think. Act.), эта модель обеспечивает беспрецедентную скорость генерации до 400 токенов в секунду (TPS), устанавливая новые стандарты производительности.
Что такое Step 3.7 Flash?
Step 3.7 Flash — это специализированная модель класса «Flash», разработанная для обеспечения работы агентов в реальном мире. Она сочетает в себе компактность и высокую скорость с глубоким пониманием мультимодальных данных и сложным планированием задач. С общим количеством параметров в 196 миллиардов (из которых 11 миллиардов являются активными), Step 3.7 Flash предлагает баланс между мощностью «тяжелых» систем и эффективностью, необходимой для мгновенного отклика.
Эта модель не просто обрабатывает текст; она спроектирована как ядро для агентских экосистем, способное управлять терминалами, браузерами, инструментами Office и сложными графическими интерфейсами.
Ключевые особенности Step 3.7 Flash
Нативное мультимодальное понимание и действие
Step 3.7 Flash способна анализировать визуальные данные любого типа — от пользовательских интерфейсов и сложных документов до графиков и природных сцен. После анализа модель может самостоятельно писать код или вызывать необходимые инструменты для взаимодействия с тем, что она «видит».
Агентское программирование (Agentic Coding)
Программирование является основой цифровой деятельности агентов. Step 3.7 Flash демонстрирует значительный прогресс в этой области:
- SWE-Bench Pro: 56.3% (значительный рост по сравнению с версией 3.5).
- Terminal-Bench 2.1: 59.6%. Модель оптимизирована для работы внутри сложных стеков, таких как Claude Code, KiloCode и OpenClaw, обеспечивая меньше разрывов в цепочках вызовов и более высокую согласованность длинных рабочих сессий.
Режим советника (Advisor Mode)
Для повышения качества без потери эффективности Flash-уровня, Step 3.7 Flash поддерживает Advisor Mode. В этом режиме модель выполняет основную траекторию задачи (вызов инструментов, чтение результатов, итерации), но консультируется с более крупной «моделью-советником» в критических точках планирования.
- Позволяет достичь 97% производительности Claude Opus 4.6 в кодинге.
- Снижает стоимость выполнения задачи до $0.19 (по сравнению с $1.76 у конкурентов).
Расширенный поиск и синтез информации
Step 3.7 Flash делает поиск нативной частью процесса рассуждения:
- Глубокий поиск: На бенчмарке DeepSearchQA модель достигла 92.82% F1-меры.
- Визуальный поиск: Способность распознавать редкие объекты и новые концепции, недоступные другим системам.
Управление графическим интерфейсом (GUI)
Модель демонстрирует прорыв в управлении мобильными устройствами. На бенчмарке Android Daily Step 3.7 Flash показала результат 61.87%, опережая более крупные модели по стабильности и надежности выполнения длительных задач в нескольких приложениях.
Сценарии использования (Use Case)
Step 3.7 Flash создана для решения сложных прикладных задач в различных индустриях:
- Корпоративная автоматизация: Независимое выполнение бизнес-задач, таких как финансовый анализ, бухгалтерский учет и планирование производства. Модель успешно проходит тесты GDPval для 44 различных профессий.
- Разработка ПО: Использование в качестве ядра для автономных кодинг-агентов, способных самостоятельно исправлять ошибки в репозиториях и развертывать фронтенд по наброскам (Sketch to Web Page).
- Глубокие исследования: Проведение сложных юридических проверок (например, на конфликт интересов) и анализ научных материалов с многоэтапным поиском.
- Визуальная аналитика: Анализ видео для создания резюме, работа с чертежами и сложными таблицами в формате скриншотов.
Доступность и экосистема
Модель Step 3.7 Flash доступна на платформе StepFun Open Platform (platform.stepfun.ai), а также через OpenRouter и NVIDIA NIM.
Варианты развертывания:
- Облако и дата-центры: Для крупномасштабных корпоративных нужд.
- Локальное использование: Поддерживается на станциях NVIDIA DGX, системах с AMD Ryzen AI Max+ и устройствах Mac Studio (минимум 128 ГБ объединенной памяти).
Поддержка инструментов:
Step 3.7 Flash интегрирована с популярными решениями для инференса: vLLM, SGLang, Hugging Face Transformers и llama.cpp. Модель также поддерживается в экосистеме NVIDIA NeMo.
FAQ (Часто задаваемые вопросы)
Вопрос: Какую скорость обеспечивает Step 3.7 Flash? Ответ: Модель поддерживает скорость генерации до 400 токенов в секунду (TPS), что делает её идеальной для интерактивных агентов.
Вопрос: Может ли модель работать с визуальными инструментами? Ответ: Да, Step 3.7 Flash поддерживает нативный мультимодальный вход и может использовать Python-инструменты для кроппинга, масштабирования и детального анализа изображений.
Вопрос: Чем Advisor Mode отличается от обычной работы? Ответ: В Advisor Mode модель-исполнитель (Flash) берет на себя 90% работы, обращаясь к более мощной модели только при сбоях или для сложного планирования, что экономит бюджет без потери качества.
Вопрос: Какие бенчмарки подтверждают возможности модели в кодинге? Ответ: Модель набрала 56.3% на SWE-Bench Pro и 59.6% на Terminal-Bench 2.1, что является одним из лучших показателей в классе Flash-моделей.
Вопрос: Поддерживает ли она русский язык? Ответ: Да, Step 3.7 Flash доступна через глобальную платформу и поддерживает многоязычное взаимодействие, включая русский язык.








