GPT‑5.4 favicon

GPT‑5.4

GPT-5.4 de OpenAI: El nuevo estándar en razonamiento, codificación y agentes para el trabajo profesional.

Introducción:

GPT-5.4 es el modelo de frontera más capaz y eficiente de OpenAI, diseñado específicamente para el trabajo profesional. Integra las capacidades avanzadas de codificación de GPT-5.3-Codex con mejoras significativas en razonamiento, flujos de trabajo agénticos y uso nativo de computadoras. Disponible en ChatGPT y vía API, GPT-5.4 destaca por su eficiencia en el uso de tokens y su capacidad para manejar contextos de hasta 1 millón de tokens. Este modelo reduce drásticamente las alucinaciones y errores fácticos, superando el rendimiento humano en navegación de entornos de escritorio y estableciendo nuevos hitos en la creación de documentos, hojas de cálculo y presentaciones complejas.

Añadido:

2026-03-08

Visitantes mensuales:

210067.3K

GPT‑5.4 - AI Tool Screenshot and Interface Preview

GPT‑5.4 Información del producto

GPT-5.4: El modelo de frontera diseñado para el trabajo profesional

Hoy presentamos GPT-5.4, nuestra entrega más reciente en la familia de modelos de OpenAI, disponible en ChatGPT (como GPT-5.4 Thinking), la API y Codex. Este modelo ha sido diseñado para ser la herramienta más capaz y eficiente para el entorno laboral profesional, integrando avances en razonamiento, programación y flujos de trabajo autónomos.

¿Qué es GPT-5.4?

GPT-5.4 es un modelo de frontera que unifica las capacidades de codificación de GPT-5.3-Codex con mejoras críticas en la interacción con software, herramientas y tareas profesionales. Es el primer modelo de propósito general que incorpora capacidades nativas de uso de computadoras, permitiendo a los agentes operar sistemas operativos y aplicaciones de forma autónoma.

Además del modelo estándar, hemos lanzado GPT-5.4 Pro, diseñado para usuarios que requieren el máximo rendimiento en las tareas más complejas y exigentes. GPT-5.4 no solo es más inteligente, sino también más eficiente, utilizando significativamente menos tokens que versiones anteriores como GPT-5.2.

Características Principales de GPT-5.4

1. Razonamiento y Trabajo de Conocimiento

GPT-5.4 ha establecido un nuevo estado del arte en el benchmark GDPval, igualando o superando a profesionales de la industria en el 83.0% de las comparaciones.

  • Documentos y Presentaciones: Mejora drástica en la creación de hojas de cálculo, presentaciones de diapositivas y análisis legales.
  • Reducción de Alucinaciones: Las afirmaciones individuales son un 33% menos propensas a ser falsas en comparación con GPT-5.2.
  • Pensamiento Transparente: En ChatGPT, el modelo ofrece un plan inicial de su razonamiento, permitiendo al usuario ajustar el curso de la respuesta en tiempo real.

2. Uso Nativo de Computadora y Visión

Este modelo puede interactuar con interfaces de usuario mediante clics coordinados y comandos de teclado.

  • OSWorld-Verified: Alcanza una tasa de éxito del 75.0%, superando el rendimiento humano (72.4%).
  • Visión de Alta Fidelidad: Soporta percepción de hasta 10.24M de píxeles, ideal para el análisis de documentos densos y localización precisa en pantalla.

3. Codificación Avanzada con Codex

GPT-5.4 combina la potencia de GPT-5.3-Codex con una menor latencia.

  • Modo /fast: Ofrece una velocidad de tokens hasta 1.5 veces mayor en Codex.
  • Playwright (Interactive): Una nueva habilidad experimental que permite al modelo depurar visualmente aplicaciones web y de Electron mientras las construye.

4. Uso de Herramientas y Búsqueda Web

  • Tool Search: Permite manejar ecosistemas de miles de herramientas sin saturar el contexto, reduciendo el uso de tokens en un 47%.
  • Búsqueda Agéntica: En el benchmark BrowseComp, GPT-5.4 Pro alcanza un 89.3% de éxito en la localización de información difícil de encontrar en la web.

Casos de Uso

El despliegue de GPT-5.4 habilita soluciones avanzadas en diversos sectores:

  • Servicios Financieros y Legales: Creación de modelos financieros complejos, análisis de contratos extensos y generación de informes con alta precisión fáctica.
  • Desarrollo de Software: Flujos de trabajo más rápidos para depuración, creación de interfaces de usuario estéticas y automatización de pruebas de navegación.
  • Gestión de Empresas: Uso de agentes para realizar entradas de datos masivas, gestión de calendarios y correos electrónicos operando directamente sobre las aplicaciones.
  • Investigación Profunda: Síntesis de información proveniente de múltiples fuentes web para responder preguntas complejas de tipo "aguja en un pajar".

Cómo usar GPT-5.4

Para comenzar a aprovechar las capacidades de GPT-5.4, los usuarios disponen de varias opciones según su plan:

  1. En ChatGPT: Los usuarios de Plus, Team y Pro pueden seleccionar GPT-5.4 Thinking en el selector de modelos. Los planes Enterprise y Edu pueden habilitarlo mediante la configuración de administrador.
  2. En la API: Los desarrolladores pueden acceder mediante el nombre de modelo gpt-5.4 o gpt-5.4-pro.
  3. Capacidades de Computadora: En la API, se puede utilizar la herramienta computer actualizada para permitir que el modelo interactúe con interfaces de escritorio.
  4. Codex: Utilice las habilidades de hoja de cálculo y presentación actualizadas, o experimente con el nuevo comando $playwright-interactive.

FAQ (Preguntas Frecuentes)

¿Cuál es la ventana de contexto de GPT-5.4? GPT-5.4 admite hasta 1 millón de tokens de contexto en Codex y la API, permitiendo planificar y verificar tareas en horizontes de tiempo muy largos.

¿Está disponible para usuarios gratuitos? Actualmente, GPT-5.4 Thinking y Pro están disponibles para planes de pago (Plus, Team, Pro, Enterprise y Edu).

¿Qué pasó con GPT-5.2? GPT-5.2 Thinking permanecerá como "Legacy Model" hasta el 5 de junio de 2026, fecha en la que será retirado.

¿Es GPT-5.4 más caro que los modelos anteriores? En la API, el precio por token es mayor debido a sus capacidades superiores, pero su mayor eficiencia de tokens suele reducir el costo total por tarea compleja.

¿Cómo se garantiza la seguridad con las capacidades de uso de computadora? GPT-5.4 cuenta con un stack de seguridad cibernética expandido y políticas de confirmación personalizadas para mitigar riesgos de mal uso.

Loading related products...