Step 3.7 Flash favicon

Step 3.7 Flash

Step 3.7 Flash: El modelo agente multimodal de alta eficiencia para codificación y tareas empresariales

Introducción:

Step 3.7 Flash es la nueva frontera de la eficiencia para agentes de IA. Este modelo multimodal destaca por su capacidad de ver, pensar y actuar, ofreciendo hasta 400 TPS. Diseñado para la codificación agentica y tareas empresariales complejas, Step 3.7 Flash supera a competidores en benchmarks como SWE-Bench Pro y Terminal-Bench 2.1. Con su innovador 'Advisor Mode', permite alcanzar el 97% del rendimiento de modelos Pro a una fracción del costo. Su ecosistema incluye soporte para vLLM, NVIDIA NIM y despliegue local en hardware de alto rendimiento. Ideal para automatización de GUI, búsqueda visual profunda y ejecución autónoma de tareas de larga duración.

Añadido:

2026-06-01

Visitantes mensuales:

--K

Step 3.7 Flash - AI Tool Screenshot and Interface Preview

Step 3.7 Flash Información del producto

Step 3.7 Flash: La Nueva Frontera de la Eficiencia en Agentes Multimodales

En el panorama actual de la inteligencia artificial, la evolución se ha desplazado de los modelos que simplemente responden preguntas a aquellos capaces de ejecutar acciones complejas. Step 3.7 Flash emerge como el modelo de cimentación agentica definitivo, diseñado específicamente para la eficiencia en el mundo real. Bajo el lema "Ver. Pensar. Actuar.", este modelo redefine lo que es posible en términos de velocidad y autonomía, alcanzando una tasa de procesamiento de hasta 400 TPS (Tokens Per Second).

¿Qué es Step 3.7 Flash?

Step 3.7 Flash es un modelo de IA de alta eficiencia perteneciente a la categoría "Flash", optimizado para actuar como un agente autónomo. A diferencia de los modelos tradicionales, Step 3.7 Flash no solo procesa texto, sino que posee una comprensión multimodal nativa, lo que le permite interpretar interfaces de usuario (UI), documentos, gráficos y escenas naturales para luego actuar mediante la generación de código o el uso de herramientas externas.

Lanzado el 29 de mayo de 2026, Step 3.7 Flash ha sido desarrollado para cerrar la brecha entre la comprensión intelectual y la ejecución técnica, posicionándose como una herramienta indispensable para desarrolladores y empresas que requieren automatización inteligente y confiable.

Características Principales de Step 3.7 Flash

El éxito de Step 3.7 Flash se basa en cuatro pilares fundamentales que lo distinguen de otros modelos de su clase:

1. Comprensión y Acción Multimodal Nativa

Step 3.7 Flash es capaz de "ver" a través de todo el espectro visual. Puede analizar desde una captura de pantalla de una aplicación empresarial hasta un diagrama técnico complejo, traduciendo esa información visual en código ejecutable o llamadas a herramientas precisas.

2. Mejora en Búsqueda Web y Visual

La capacidad de búsqueda de Step 3.7 Flash va más allá de lo convencional. Su búsqueda web profundiza en múltiples fuentes para seguimientos detallados, mientras que su búsqueda visual reconoce entidades de "cola larga" (conceptos poco comunes o recién emergidos) que otros sistemas suelen ignorar.

3. Orquestación y Uso Confiable de Herramientas

Este modelo está diseñado para manejar terminales, navegadores, herramientas de Office y motores de búsqueda de manera coherente. Step 3.7 Flash minimiza la deriva de tareas y los errores en las llamadas a herramientas (toolcalls), permitiendo ejecuciones de larga duración sin fallos estructurales.

4. Compatibilidad con el Ecosistema de Agentes

Para facilitar su adopción, Step 3.7 Flash es compatible con los principales marcos de trabajo (harnesses) como Claude Code, KiloCode, Hermes Agent y OpenClaw, lo que reduce drásticamente los costos de integración y la necesidad de reescribir flujos de trabajo existentes.

Rendimiento y Benchmarks: Step 3.7 Flash en Cifras

El rendimiento de Step 3.7 Flash ha sido validado en rigurosos entornos de prueba, superando frecuentemente a modelos de mayor tamaño:

  • Codificación Agentica: En el benchmark SWE-Bench Pro, Step 3.7 Flash alcanza una puntuación de 56.3, superando a DeepSeek V4 Flash (55.6) y Gemini 3.5 Flash (55.1).
  • Terminal-Bench 2.1: Con una puntuación de 59.6%, demuestra una capacidad superior para manejar interfaces de línea de comandos en comparación con su predecesor, Step 3.5 Flash (53.4%).
  • Capacidad Multimodal: En SimpleVQA, obtiene un 79.2%, compitiendo directamente con modelos de nivel Pro como GPT 5.5.
  • Tareas Empresariales: En el benchmark ClawEval-1.1, que mide la ejecución de tareas diarias autónomas, Step 3.7 Flash logra un impresionante 67.1%.

"Step 3.7 Flash combina la eficiencia de un modelo Flash con capacidades de investigación y recuperación profunda que anteriormente solo se veían en modelos de escala Pro".

El Innovador "Advisor Mode"

Para maximizar la calidad sin sacrificar la eficiencia, Step 3.7 Flash introduce el Advisor Mode. En este modo, el modelo Flash gestiona la trayectoria de la tarea de principio a fin, consultando a un modelo "asesor" más grande solo en puntos de inflexión críticos. Esto permite que Step 3.7 Flash alcance el 97% del rendimiento de modelos como Claude Opus 4.6, pero a tan solo un noveno del costo ($0.19 vs $1.76 por tarea).

Casos de Uso de Step 3.7 Flash

Gracias a su versatilidad, Step 3.7 Flash se adapta a múltiples escenarios profesionales:

  • Codificación Autónoma: Desde la creación de páginas web a partir de bocetos (Sketch to Web Page) hasta la conversión de borradores en código funcional.
  • Análisis Empresarial: Ejecución de tareas complejas en finanzas, contabilidad y análisis de datos. En el benchmark GDPval, el modelo demostró competencia en 44 ocupaciones distintas.
  • Operación de GUI: Step 3.7 Flash puede operar interfaces de teléfonos móviles (Android), completando tareas que requieren navegar entre múltiples aplicaciones con una estabilidad superior (61.87% en Android Daily).
  • Investigación Profunda: Uso de herramientas de búsqueda para resolver casos legales complejos o análisis técnicos de ingeniería, filtrando evidencia y sintetizando información de fuentes en vivo.

Disponibilidad y Despliegue

Step 3.7 Flash está disponible para una amplia gama de usuarios y empresas a través de múltiples plataformas:

  • Plataformas de API: Globalmente en platform.stepfun.ai y en China vía platform.stepfun.com.
  • Proveedores de Nube: Disponible en OpenRouter, NVIDIA NIM, DeepInfra, Fireworks AI y Modal.
  • Despliegue Local: El modelo puede ejecutarse en estaciones de trabajo de alto rendimiento como NVIDIA DGX Station o dispositivos Mac con al menos 128GB de memoria unificada (Mac Studio / MacBook Pro).
  • Infraestructura de Código Abierto: Soporte completo para vLLM, SGLang, llama.cpp y el ecosistema NVIDIA NeMo.

Preguntas Frecuentes (FAQ)

¿Qué velocidad de procesamiento ofrece Step 3.7 Flash? Ofrece una velocidad excepcional de hasta 400 TPS, ideal para aplicaciones que requieren respuestas e interacciones en tiempo real.

¿Es Step 3.7 Flash un modelo multimodal? Sí, es un modelo agentica con soporte nativo para entrada visual, lo que le permite procesar imágenes, documentos y GUIs mediante herramientas como Visual Search y Python Tool.

¿Cómo mejora el Advisor Mode el ahorro de costos? El Advisor Mode permite que Step 3.7 Flash actúe como ejecutor principal y solo escale la consulta a un modelo superior cuando es estrictamente necesario, manteniendo la mayor parte del flujo de trabajo al bajo costo de un modelo Flash.

¿Qué hardware se requiere para ejecutarlo localmente? Para escenarios locales, se recomiendan dispositivos con al menos 128GB de memoria unificada, como sistemas basados en AMD Ryzen AI Max+ 395 o hardware de Apple con Apple Silicon de alta gama.

¿Cómo se compara Step 3.7 Flash con GPT 5.5 en tareas de codificación? En benchmarks como SWE-Bench Pro, Step 3.7 Flash (56.3) muestra un rendimiento altamente competitivo, acercándose notablemente a los resultados de GPT 5.5 (58.6) pero con una eficiencia de recursos significativamente mayor.

Loading related products...