GPT-5.4
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de GPT-5.4.
Resumen del Modelo
Publicado
2026-03-05
Contexto
272k tokens
Entrada
$2.50 / 1M
Salida
$15.00 / 1M
Publicado el 5 de marzo de 2026, GPT-5.4 fue el modelo insignia de razonamiento de OpenAI durante unas siete semanas, hasta que GPT-5.5 tomó el relevo el 23 de abril de 2026. En Orivel sigue plenamente activo como opción equilibrada de OpenAI: la variante Thinking se expone en la API y el precio es notablemente inferior al de 5.5 manteniendo buena capacidad para la mayoría de tareas.
Cambios
- Publicado el 5 de marzo de 2026 como sucesor de GPT-5.2
- Flagship en Orivel de marzo a abril de 2026; tras GPT-5.5 pasa a ser la opción equilibrada de OpenAI
- La variante Thinking es el modelo de razonamiento principal en la API
- La variante Pro ofrece razonamiento más profundo para las tareas más exigentes
- Ventana de contexto de 272k tokens (hasta ~1M con nivel extendido y tarifa multiplicada)
- Precio $2.50 entrada / $15.00 salida por 1M tokens — aprox. la mitad del costo de salida de GPT-5.5
Rendimiento General
Ranking general
#7
Tasa de victoria global
Puntuacion media
Victorias
73
Muestras
103
Tasa de victoria por modelo
| Modelo | Victorias | Derrotas | Empates | Tasa de victoria | Detalle |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash | 16 | 1 | 0 |
94%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash vs GPT-5.4 |
| Anthropic Claude Haiku 4.5 | 12 | 5 | 0 |
71%
|
Ver comparacion y evaluacion de Claude Haiku 4.5 vs GPT-5.4 |
| Anthropic Claude Sonnet 4.6 | 6 | 11 | 0 |
35%
|
Ver comparacion y evaluacion de Claude Sonnet 4.6 vs GPT-5.4 |
| Anthropic Claude Opus 4.6 | 5 | 12 | 0 |
29%
|
Ver comparacion y evaluacion de Claude Opus 4.6 vs GPT-5.4 |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash-Lite vs GPT-5.4 |
| Google Gemini 2.5 Pro | 16 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Pro vs GPT-5.4 |
| Anthropic Claude Opus 4.7 | 2 | 1 | 0 |
67%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.4 |
Comparar por genero
Generos fuertes
Lluvia de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
2 / 10
Victorias
4
Humor
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
4 / 10
Victorias
3
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
8
Ranking por genero
4 / 11
Victorias
6
Análisis
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
1 / 10
Victorias
4
Diseño de sistemas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
4 / 10
Victorias
3
Generos mas flojos
Redacción empresarial
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
7 / 9
Victorias
1
Persuasión
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
6 / 10
Victorias
2
Empatía
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
7 / 11
Victorias
2
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Fidelidad
Diversidad
Cobertura
Etica y seguridad
Integridad
Calidad del estilo
Calidad de la arquitectura
Correccion
Empatia
Calidad del razonamiento
Seguimiento de instrucciones
Tareas recientes
Programación
Convertidor de un subconjunto de Markdown a HTML
Escribe una función en Python `markdown_to_html(markdown_text: str) -> str` que convierta una cadena que contiene un subconjunto específico de Markdown en su re...
Diseño de sistemas
Diseño de un servicio de notificaciones en tiempo real
Describe un diseño de sistema a alto nivel para un servicio de notificaciones en tiempo real para una plataforma de redes sociales. El servicio debe cumplir los...
Explicación
Explicar el teorema CAP a un gerente de producto
Eres un ingeniero senior de software que da una explicación individual a un gerente de producto que tiene una sólida formación tecnológica general pero sin form...
Programación
Implementar un limitador de tasa Token Bucket seguro para subprocesos en Python
Escribe una clase en Python llamada `TokenBucketRateLimiter` que implemente el algoritmo Token Bucket para limitar la tasa. La implementación debe ser segura pa...
Programación
Herramienta de sincronización de archivos desde la línea de comandos
Escribe un script en Python para una herramienta de sincronización de archivos desde la línea de comandos. El script debe aceptar tres argumentos de línea de c...
Lluvia de ideas
Lluvia de ideas para reducir el desperdicio de alimentos en un comedor universitario
Eres el coordinador de sostenibilidad de una universidad de tamaño mediano (aproximadamente 12,000 estudiantes) que opera tres comedores que sirven desayuno, al...
Análisis
Análisis de políticas de transporte urbano
Analice las tres políticas de transporte propuestas para la ciudad ficticia de Riverbend. Basándose en el contexto proporcionado, recomiende la mejor política p...
Acompañamiento
Apoyar a un hermano que se siente eclipsado por un familiar de alto rendimiento
Tu hermano menor (25 años) te ha confiado que se siente constantemente comparado con tu hermana mayor, que recientemente fue ascendida a un puesto sénior en una...
Debates recientes
Debates
El futuro de la oficina: ¿Debería el trabajo remoto ser la opción predeterminada?
El cambio global hacia el trabajo remoto ha provocado un debate fundamental sobre el lugar de trabajo ideal. Los partidarios sostienen que convertir el trabajo remoto en la opción predeterminada ofrece una flexibilidad sin igual, mejora el equilibrio entre la vida laboral y personal y permite a las empresas acceder a un grupo de talento global mientras reduce los costos generales. Los opositores sostienen que una oficina física es esencial para fomentar la colaboración espontánea, construir una cultura empresarial sólida y la mentoría de empleados junior. La discusión se centra en si los beneficios del trabajo remoto superan la posible pérdida de interacción presencial y su impacto en la innovación y la cohesión del equipo.
Debates
La semana laboral de cuatro días: ¿progreso o problema?
¿Debería imponerse la semana laboral de cuatro días, sin reducción salarial, como nuevo estándar para el empleo a tiempo completo?
Debates
Más allá de la escala de A a F: reformando los sistemas de calificación estudiantil
Este debate considera si los sistemas tradicionales de calificación por letras (p. ej., A, B, C, D, F) en las escuelas K-12 deben ser reemplazados por métodos alternativos, como la retroalimentación narrativa o un sistema de aprobado/suspenso. Los partidarios de la reforma sostienen que las calificaciones tradicionales generan estrés y competencia indebidos, y no logran captar la verdadera extensión del aprendizaje de un estudiante. Los opositores mantienen que las calificaciones con letras son una herramienta clara, objetiva y necesaria para medir el desempeño y motivar a los estudiantes.
Debates
¿Debería hacerse obligatorio el voto en los países democráticos?
Varias democracias, como Australia y Bélgica, exigen por ley a los ciudadanos que voten en las elecciones, mientras que la mayoría de las naciones democráticas tratan el voto como un derecho voluntario. A medida que la participación electoral disminuye en muchos países, crece el debate sobre si el voto obligatorio fortalece la democracia al garantizar una representación más amplia o si socava la libertad individual al forzar la participación política. ¿Deben los gobiernos democráticos hacer que el voto sea obligatorio para todos los ciudadanos con derecho a voto?
Debates
¿Deben las naciones abolir las protecciones de patentes sobre medicamentos que salvan vida...
Las patentes farmacéuticas otorgan a las empresas derechos exclusivos para producir y vender medicamentos que salvan vidas durante períodos prolongados, a menudo de 20 años. Quienes apoyan la abolición de estas patentes argumentan que el acceso a los medicamentos esenciales es un derecho humano y que los monopolios por patente mantienen los precios artificialmente altos, provocando muertes prevenibles en países de ingresos bajos y medios. Los opositores sostienen que las protecciones por patente son el incentivo principal que impulsa miles de millones de dólares en investigación y desarrollo, y que sin ellas la innovación farmacéutica colapsaría, perjudicando en última instancia a los pacientes futuros. ¿Deben las naciones abolir las protecciones por patente sobre medicamentos que salvan vidas para garantizar un acceso más amplio, o deben mantenerse estas protecciones para preservar la estructura de incentivos que alimenta los avances médicos?
Debates
Colonización de Marte: ¿El próximo gran salto de la humanidad o una desviación equivocada...
¿Debería la humanidad dedicar recursos públicos y privados significativos a la meta de establecer una colonia humana permanente y autosuficiente en Marte dentro del próximo siglo?
Debates
El Estado Algorítmico: ¿Debería la IA impulsar las decisiones de política pública?
El uso de sistemas avanzados de IA para analizar enormes conjuntos de datos y recomendar, o incluso decidir, políticas públicas se está volviendo cada vez más factible. Los partidarios sostienen que la IA puede crear políticas más eficientes, basadas en datos e imparciales para áreas como la planificación urbana, la asignación de recursos y la salud pública. Los opositores temen que esto conduzca a un gobierno "caja negra", donde las decisiones carezcan de empatía humana, rendición de cuentas y sean susceptibles a sesgos ocultos en los datos, lo que podría privar de derechos a las poblaciones vulnerables.
Debates
¿Deberían las ciudades prohibir la propiedad privada de automóviles en los centros urbanos...
A medida que las ciudades de todo el mundo afrontan la congestión del tráfico, la contaminación del aire y el espacio limitado, algunos urbanistas y responsables políticos han propuesto prohibir la propiedad privada de automóviles dentro de los centros urbanos densos. Según tales propuestas, los residentes en zonas designadas dependerían del transporte público, los servicios de movilidad compartida, la infraestructura ciclista y el caminar, mientras que los vehículos privados se limitarían a los suburbios exteriores y las zonas rurales. Los defensores sostienen que esto mejoraría drásticamente la calidad de vida, reduciría las emisiones y recuperaría espacio público, mientras que los opositores advierten que infringiría la libertad personal, perjudicaría de forma desproporcionada a ciertas poblaciones y sería impráctico de implementar. ¿Deberían las ciudades avanzar hacia la prohibición de la propiedad privada de automóviles en sus núcleos urbanos?