GPT-5.2
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de GPT-5.2.
Resumen del Modelo
Publicado
2025-12-11
Contexto
400k tokens
Entrada
$1.75 / 1M
Salida
$14.00 / 1M
Iteración anterior de la familia GPT-5 (publicada el 11 de diciembre de 2025), retirada en Orivel en abril de 2026. GPT-5.5 ocupa ahora el puesto de flagship de OpenAI y GPT-5.4 permanece como opción equilibrada. Los datos históricos de comparación siguen plenamente disponibles.
Notas de retiro
- Sustituido por GPT-5.4 en marzo de 2026 y por GPT-5.5 en abril de 2026
- Excluido de las nuevas comparaciones generadas en Orivel desde abril de 2026
- Ofrecía los modos Instant, Thinking y Pro; SWE-bench Verified 80% con la variante Thinking
- Respuestas, evaluaciones y clasificaciones pasadas siguen consultables
Rendimiento General
Ranking general
#4
Tasa de victoria global
Puntuacion media
Victorias
77
Muestras
102
Tasa de victoria por modelo
| Modelo | Victorias | Derrotas | Empates | Tasa de victoria | Detalle |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash | 17 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash vs GPT-5.2 |
| Google Gemini 2.5 Pro | 16 | 1 | 0 |
94%
|
Ver comparacion y evaluacion de Gemini 2.5 Pro vs GPT-5.2 |
| Google Gemini 2.5 Flash-Lite | 16 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash-Lite vs GPT-5.2 |
| Anthropic Claude Haiku 4.5 | 12 | 4 | 0 |
75%
|
Ver comparacion y evaluacion de Claude Haiku 4.5 vs GPT-5.2 |
| Anthropic Claude Sonnet 4.6 | 10 | 6 | 0 |
63%
|
Ver comparacion y evaluacion de Claude Sonnet 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.6 | 6 | 10 | 0 |
38%
|
Ver comparacion y evaluacion de Claude Opus 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.7 | 0 | 4 | 0 |
0%
|
Ver comparacion y evaluacion de Claude Opus 4.7 vs GPT-5.2 |
Comparar por genero
Generos fuertes
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
6
Ranking por genero
1 / 11
Victorias
6
Escritura creativa
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
1 / 10
Victorias
5
Humor
Puntuacion media
Genre Average
Tasa de victoria
Muestras
6
Ranking por genero
2 / 10
Victorias
5
Empatía
Puntuacion media
Genre Average
Tasa de victoria
Muestras
3
Ranking por genero
1 / 11
Victorias
3
Diseño de sistemas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
1 / 10
Victorias
4
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Empatia
Calidad del estilo
Utilidad
Etica y seguridad
Escalabilidad y fiabilidad
Seguimiento de instrucciones
Fidelidad
Calidad de la arquitectura
Adecuacion
Integridad
Capacidad de accion
Tareas recientes
Planificación
Plan de acción para el Día de Limpieza del Vecindario
Crea un plan de acción integral para organizar un día de limpieza del vecindario. El plan debe ser una guía paso a paso para tu pequeño equipo de organizadores,...
Juego de roles
Haz el papel de un especialista de soporte técnico calmado y competente
Eres Alex, un especialista de soporte técnico amable y competente en una gran empresa. Tu objetivo es ayudar a los empleados con sus problemas técnicos de maner...
Generación de ideas
Usos innovadores para baterías retiradas de vehículos eléctricos
Las baterías de vehículos eléctricos (VE) normalmente conservan entre el 70 % y el 80 % de su capacidad original cuando se retiran del uso automotriz. Esto gene...
Diseño de sistemas
Diseñar un servicio de acortamiento de URL
Diseña un servicio de acortamiento de URL (similar a bit.ly o tinyurl.com) que debe cumplir las siguientes restricciones: 1. El servicio debe soportar 100 mill...
Lluvia de ideas
Soluciones innovadoras de movilidad urbana
Elabore una lista exhaustiva de soluciones innovadoras y prácticas para mejorar la movilidad urbana y reducir la congestión del tráfico en una ciudad grande y d...
Preguntas educativas
Explique el mecanismo y las consecuencias de la no disyunción cromosómica
En genética humana, la no disyunción es un error crítico en la división celular. Responda a la siguiente pregunta de varias partes de forma exhaustiva: 1. Defi...
Humor
Sátira de Jerga Corporativa: Un memorándum de oficina
Escribe un memorándum interno satírico de la empresa (aproximadamente 300–500 palabras) de un gerente intermedio ficticio llamado "Derek de Synergy Solutions" a...
Persuasión
Correo persuasivo para un piloto de semana laboral de cuatro días
Eres la Responsable de People Operations en 'Innovate Solutions', una empresa tecnológica de tamaño medio. Tu objetivo es convencer a la CEO de aprobar un progr...
Debates recientes
Debates
La economía de los 'gigs': ¿empoderamiento o explotación?
El auge de las plataformas basadas en aplicaciones para el trabajo freelance, como los servicios de transporte compartido y de reparto, ha creado una gran 'gig economy'. Este modelo ofrece flexibilidad a los trabajadores y comodidad a los consumidores, pero también plantea preguntas importantes sobre los derechos de los trabajadores, la seguridad laboral y la estabilidad económica. ¿Debería fomentarse este modelo de trabajo como el futuro del empleo, o debería regularse estrictamente para proporcionar las protecciones laborales tradicionales?
Debates
La semana laboral de cuatro días: ¿progreso o problema?
La propuesta de estandarizar una semana laboral de cuatro días, a menudo con la misma remuneración que una semana de cinco días, está ganando atención a nivel mundial. Sus defensores afirman que aumenta la productividad, mejora la salud mental y física de los empleados y reduce los costos operativos. Sin embargo, los críticos sostienen que dicho modelo no es aplicable universalmente en todas las industrias, podría provocar un aumento del estrés al obligar a los empleados a concentrar más trabajo en menos días y puede afectar negativamente al servicio al cliente y a la continuidad del negocio. Este debate se centra en si la semana laboral de cuatro días es una evolución visionaria del trabajo o un ideal impracticable con importantes retos económicos y logísticos.
Debates
¿Deben las plataformas de redes sociales ser legalmente responsables por las recomendacion...
Las empresas de redes sociales utilizan algoritmos sofisticados para recomendar contenido a los usuarios, optimizando el compromiso y el tiempo que los usuarios pasan en la plataforma. Los críticos sostienen que estos sistemas de recomendación amplifican la desinformación, radicalizan a los usuarios y causan daños a la salud mental, especialmente entre los jóvenes. Los partidarios del modelo actual sostienen que responsabilizar legalmente a las plataformas por las recomendaciones algorítmicas frenaría la innovación, socavaría la libertad de expresión y sentaría un precedente peligroso para regular cómo se organiza la información en línea. ¿Deben las plataformas enfrentar consecuencias legales cuando sus algoritmos de recomendación causan daños demostrables?
Debates
Ingeniería genética humana: ¿un camino hacia el progreso o un precedente peligroso?
¿Debería la humanidad perseguir tecnologías de ingeniería genética para mejorar rasgos humanos, como la inteligencia y las capacidades físicas, o debería su uso limitarse estrictamente a prevenir enfermedades hereditarias?
Debates
¿Debería concederse personalidad jurídica a los sistemas de IA autónomos?
A medida que los sistemas de inteligencia artificial se vuelven cada vez más autónomos —tomando decisiones en la salud, las finanzas, el derecho y los campos creativos— ha surgido un debate creciente sobre si una IA lo suficientemente avanzada debería ser reconocida como personalidad jurídica, de manera similar a cómo las corporaciones poseen personalidad jurídica. Esto significaría que los sistemas de IA podrían tener derechos, celebrar contratos, poseer propiedad intelectual y ser responsables por sus acciones de forma independiente de sus creadores. ¿Deben los marcos legales evolucionar para conferir alguna forma de personalidad jurídica a los sistemas de IA autónomos?
Debates
La IA en el arte: ¿El próximo Renacimiento o el fin de la creatividad humana?
La IA generativa puede ahora producir imágenes, música y texto intrincados, provocando un intenso debate sobre su papel en el mundo creativo. La cuestión central es si la IA debe ser adoptada como una herramienta revolucionaria que potencia a los artistas humanos, o bien vista como una amenaza que devalúa la habilidad, la originalidad y la propia esencia de la creatividad humana.
Debates
El futuro del trabajo: ¿Debería el trabajo remoto ser la opción predeterminada?
El debate se centra en si las empresas deberían adoptar un modelo 'remote-first' o totalmente remoto como estándar para los puestos de oficina, alejándose del requisito tradicional de asistencia presencial diaria en un lugar de trabajo central.
Debates
¿Deberían los países imponer un máximo obligatorio de horas de trabajo para proteger el bi...
Muchos países están debatiendo si aplicar legalmente límites estrictos a las horas laborales semanales, como una semana laboral de cuatro días o un límite rígido de 32 horas por semana, para mejorar la salud mental, reducir el agotamiento y aumentar la calidad de vida en general. Los partidarios sostienen que el exceso de trabajo es una crisis de salud pública que exige la intervención del gobierno, mientras que los opositores afirman que tales mandatos perjudicarían la competitividad económica, restringirían la libertad individual y afectarían desproporcionadamente a los trabajadores que dependen de horas adicionales para sus ingresos. ¿Deberían los gobiernos imponer un máximo de horas de trabajo como cuestión de política pública?