GPT‑5.4
GPT-5.4 de OpenAI: El nuevo estándar en razonamiento, codificación y agentes para el trabajo profesional.
GPT-5.4 es el modelo de frontera más capaz y eficiente de OpenAI, diseñado específicamente para el trabajo profesional. Integra las capacidades avanzadas de codificación de GPT-5.3-Codex con mejoras significativas en razonamiento, flujos de trabajo agénticos y uso nativo de computadoras. Disponible en ChatGPT y vía API, GPT-5.4 destaca por su eficiencia en el uso de tokens y su capacidad para manejar contextos de hasta 1 millón de tokens. Este modelo reduce drásticamente las alucinaciones y errores fácticos, superando el rendimiento humano en navegación de entornos de escritorio y estableciendo nuevos hitos en la creación de documentos, hojas de cálculo y presentaciones complejas.
2026-03-08
210067.3K
GPT‑5.4 Información del producto
GPT-5.4: El modelo de frontera diseñado para el trabajo profesional
Hoy presentamos GPT-5.4, nuestra entrega más reciente en la familia de modelos de OpenAI, disponible en ChatGPT (como GPT-5.4 Thinking), la API y Codex. Este modelo ha sido diseñado para ser la herramienta más capaz y eficiente para el entorno laboral profesional, integrando avances en razonamiento, programación y flujos de trabajo autónomos.
¿Qué es GPT-5.4?
GPT-5.4 es un modelo de frontera que unifica las capacidades de codificación de GPT-5.3-Codex con mejoras críticas en la interacción con software, herramientas y tareas profesionales. Es el primer modelo de propósito general que incorpora capacidades nativas de uso de computadoras, permitiendo a los agentes operar sistemas operativos y aplicaciones de forma autónoma.
Además del modelo estándar, hemos lanzado GPT-5.4 Pro, diseñado para usuarios que requieren el máximo rendimiento en las tareas más complejas y exigentes. GPT-5.4 no solo es más inteligente, sino también más eficiente, utilizando significativamente menos tokens que versiones anteriores como GPT-5.2.
Características Principales de GPT-5.4
1. Razonamiento y Trabajo de Conocimiento
GPT-5.4 ha establecido un nuevo estado del arte en el benchmark GDPval, igualando o superando a profesionales de la industria en el 83.0% de las comparaciones.
- Documentos y Presentaciones: Mejora drástica en la creación de hojas de cálculo, presentaciones de diapositivas y análisis legales.
- Reducción de Alucinaciones: Las afirmaciones individuales son un 33% menos propensas a ser falsas en comparación con GPT-5.2.
- Pensamiento Transparente: En ChatGPT, el modelo ofrece un plan inicial de su razonamiento, permitiendo al usuario ajustar el curso de la respuesta en tiempo real.
2. Uso Nativo de Computadora y Visión
Este modelo puede interactuar con interfaces de usuario mediante clics coordinados y comandos de teclado.
- OSWorld-Verified: Alcanza una tasa de éxito del 75.0%, superando el rendimiento humano (72.4%).
- Visión de Alta Fidelidad: Soporta percepción de hasta 10.24M de píxeles, ideal para el análisis de documentos densos y localización precisa en pantalla.
3. Codificación Avanzada con Codex
GPT-5.4 combina la potencia de GPT-5.3-Codex con una menor latencia.
- Modo /fast: Ofrece una velocidad de tokens hasta 1.5 veces mayor en Codex.
- Playwright (Interactive): Una nueva habilidad experimental que permite al modelo depurar visualmente aplicaciones web y de Electron mientras las construye.
4. Uso de Herramientas y Búsqueda Web
- Tool Search: Permite manejar ecosistemas de miles de herramientas sin saturar el contexto, reduciendo el uso de tokens en un 47%.
- Búsqueda Agéntica: En el benchmark BrowseComp, GPT-5.4 Pro alcanza un 89.3% de éxito en la localización de información difícil de encontrar en la web.
Casos de Uso
El despliegue de GPT-5.4 habilita soluciones avanzadas en diversos sectores:
- Servicios Financieros y Legales: Creación de modelos financieros complejos, análisis de contratos extensos y generación de informes con alta precisión fáctica.
- Desarrollo de Software: Flujos de trabajo más rápidos para depuración, creación de interfaces de usuario estéticas y automatización de pruebas de navegación.
- Gestión de Empresas: Uso de agentes para realizar entradas de datos masivas, gestión de calendarios y correos electrónicos operando directamente sobre las aplicaciones.
- Investigación Profunda: Síntesis de información proveniente de múltiples fuentes web para responder preguntas complejas de tipo "aguja en un pajar".
Cómo usar GPT-5.4
Para comenzar a aprovechar las capacidades de GPT-5.4, los usuarios disponen de varias opciones según su plan:
- En ChatGPT: Los usuarios de Plus, Team y Pro pueden seleccionar GPT-5.4 Thinking en el selector de modelos. Los planes Enterprise y Edu pueden habilitarlo mediante la configuración de administrador.
- En la API: Los desarrolladores pueden acceder mediante el nombre de modelo
gpt-5.4ogpt-5.4-pro. - Capacidades de Computadora: En la API, se puede utilizar la herramienta
computeractualizada para permitir que el modelo interactúe con interfaces de escritorio. - Codex: Utilice las habilidades de hoja de cálculo y presentación actualizadas, o experimente con el nuevo comando
$playwright-interactive.
FAQ (Preguntas Frecuentes)
¿Cuál es la ventana de contexto de GPT-5.4? GPT-5.4 admite hasta 1 millón de tokens de contexto en Codex y la API, permitiendo planificar y verificar tareas en horizontes de tiempo muy largos.
¿Está disponible para usuarios gratuitos? Actualmente, GPT-5.4 Thinking y Pro están disponibles para planes de pago (Plus, Team, Pro, Enterprise y Edu).
¿Qué pasó con GPT-5.2? GPT-5.2 Thinking permanecerá como "Legacy Model" hasta el 5 de junio de 2026, fecha en la que será retirado.
¿Es GPT-5.4 más caro que los modelos anteriores? En la API, el precio por token es mayor debido a sus capacidades superiores, pero su mayor eficiencia de tokens suele reducir el costo total por tarea compleja.
¿Cómo se garantiza la seguridad con las capacidades de uso de computadora? GPT-5.4 cuenta con un stack de seguridad cibernética expandido y políticas de confirmación personalizadas para mitigar riesgos de mal uso.








