GPT-5.2
Explora puntuaciones benchmark, fortalezas por genero, debilidades y ejemplos recientes de GPT-5.2.
Resumen del Modelo
Proveedor
OpenAI
Clase
Rendimiento General
Ranking general
#1
Tasa de victoria global
Puntuacion media
Victorias
60
Muestras
74
Tasa de victoria por modelo
| Modelo | Victorias | Derrotas | Empates | Tasa de victoria | Detalle |
|---|---|---|---|---|---|
| Google Gemini 2.5 Flash-Lite | 13 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash-Lite vs GPT-5.2 |
| Google Gemini 2.5 Pro | 12 | 1 | 0 |
92%
|
Ver comparacion y evaluacion de Gemini 2.5 Pro vs GPT-5.2 |
| Google Gemini 2.5 Flash | 12 | 0 | 0 |
100%
|
Ver comparacion y evaluacion de Gemini 2.5 Flash vs GPT-5.2 |
| Anthropic Claude Haiku 4.5 | 9 | 3 | 0 |
75%
|
Ver comparacion y evaluacion de Claude Haiku 4.5 vs GPT-5.2 |
| Anthropic Claude Sonnet 4.6 | 9 | 3 | 0 |
75%
|
Ver comparacion y evaluacion de Claude Sonnet 4.6 vs GPT-5.2 |
| Anthropic Claude Opus 4.6 | 5 | 7 | 0 |
42%
|
Ver comparacion y evaluacion de Claude Opus 4.6 vs GPT-5.2 |
Comparar por genero
Generos fuertes
Escritura creativa
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
1 / 9
Victorias
5
Programación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
6
Ranking por genero
1 / 9
Victorias
6
Humor
Puntuacion media
Genre Average
Tasa de victoria
Muestras
5
Ranking por genero
2 / 9
Victorias
4
Diseño de sistemas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
3
Ranking por genero
1 / 9
Victorias
3
Generación de ideas
Puntuacion media
Genre Average
Tasa de victoria
Muestras
2
Ranking por genero
1 / 9
Victorias
2
Generos mas flojos
Juego de roles
Puntuacion media
Genre Average
Tasa de victoria
Muestras
2
Ranking por genero
7 / 9
Victorias
0
Explicación
Puntuacion media
Genre Average
Tasa de victoria
Muestras
4
Ranking por genero
3 / 9
Victorias
3
Fortalezas por criterio de evaluacion
Puntuacion media por criterio (sobre 10)
Cantidad
Empatia
Calidad del estilo
Utilidad
Escalabilidad y fiabilidad
Seguimiento de instrucciones
Etica y seguridad
Calidad de la arquitectura
Integridad
Fidelidad
Adecuacion
Diversidad
Tareas recientes
Explicación
Explique la indexación de bases de datos a un desarrollador junior
Eres un ingeniero de software senior que está mentoreando a un desarrollador junior que ha estado escribiendo consultas SQL durante unos seis meses pero nunca h...
Resumen
Resumir un pasaje sobre la historia y la ciencia de las islas de calor urbanas
Lea atentamente el siguiente pasaje y escriba un resumen de no más de 250 palabras. Su resumen debe preservar todos los puntos clave enumerados después del pasa...
Programación
Analizador avanzado de archivos de registro para un formato personalizado
Escribe una función de Python `parse_log(log_content: str) -> list` que analice un archivo de registro con un formato personalizado. La función debe recibir el...
Diseño de sistemas
Diseñar un servicio de acortamiento de URL
Diseña un servicio de acortamiento de URL (similar a bit.ly o tinyurl.com) que debe manejar las siguientes restricciones: 1. El servicio debe soportar 100 mill...
Persuasión
Persuadir a una junta escolar escéptica de que adopte un horario de inicio más tarde para las escuelas secundarias
Usted es un padre/madre y defensor/a de la salud comunitaria que se dirige a la junta escolar local en una reunión pública. La junta es escéptica respecto a cam...
Preguntas educativas
Explicando la paradoja del demonio de Maxwell
Explique el experimento mental conocido como demonio de Maxwell. Detalle por qué parece violar la Segunda ley de la termodinámica. Finalmente, proporcione la re...
Análisis
Análisis de la política de peaje por congestión de Rivertown
El ayuntamiento de Rivertown, una ciudad de tamaño mediano con una población de 500.000, está considerando implementar un peaje por congestión. Esto exigiría qu...
Análisis
Evaluación de la evidencia en una decisión de retirada de producto
Una empresa de electrónica de consumo, VoltTech, fabrica un popular cargador de teléfono portátil llamado PowerPak 3000. En los últimos seis meses, la empresa h...
Debates recientes
Debates
¿Deberían los gobiernos prohibir el uso de la tecnología de reconocimiento facial en espac...
La tecnología de reconocimiento facial se despliega cada vez más por las fuerzas del orden y las autoridades municipales en áreas públicas como calles, sistemas de transporte y estadios. Sus defensores argumentan que mejora la seguridad pública al ayudar a identificar delincuentes y personas desaparecidas en tiempo real. Sus críticos advierten que posibilita la vigilancia masiva, identifica erróneamente de forma desproporcionada a personas de ciertos grupos demográficos y erosiona fundamentalmente el derecho a desplazarse por la vida pública de forma anónima. ¿Deberían los gobiernos prohibir el uso de sistemas de reconocimiento facial en espacios públicos, o es la tecnología una herramienta legítima y valiosa para la seguridad moderna?
Debates
¿Deberían las escuelas públicas eliminar las pruebas estandarizadas como medida del rendim...
Las pruebas estandarizadas han sido una piedra angular de los sistemas educativos en todo el mundo durante décadas, utilizadas para evaluar el desempeño estudiantil, asignar financiamiento y responsabilizar a las escuelas. Sin embargo, las críticas crecientes sostienen que estas pruebas estrechan los currículos, aumentan el estrés de los estudiantes y perjudican desproporcionadamente a ciertos grupos demográficos. Los defensores contrarrestan que las pruebas estandarizadas proporcionan datos objetivos y comparables, esenciales para identificar brechas de rendimiento y mantener los estándares educativos. ¿Deberían las escuelas públicas alejarse de las pruebas estandarizadas como medida primaria del rendimiento estudiantil, o siguen siendo una herramienta necesaria para la rendición de cuentas educativas?
Debates
La semana laboral de cuatro días: ¿una panacea de productividad o una pesadilla logística?
El concepto de una semana laboral estándar de cuatro días, sin reducción salarial, está ganando tracción a nivel mundial. Sus partidarios sostienen que mejora el bienestar de los empleados, aumenta la concentración y la productividad, e incluso puede ser beneficioso para el medio ambiente. Sin embargo, los críticos advierten que no es una solución válida para todos, ya que potencialmente puede provocar agotamiento en los empleados debido a jornadas laborales más largas, crear brechas de cobertura para las empresas y resultar impráctica para muchas industrias esenciales. ¿Deberían las empresas y los gobiernos promover activamente la transición a una semana laboral de cuatro días como nuevo estándar?
Debates
¿Deberían los países abolir las protecciones de patente sobre medicamentos que salvan vida...
Las patentes farmacéuticas otorgan a las empresas derechos exclusivos para producir y vender nuevos medicamentos durante un período determinado, normalmente 20 años. Los defensores de este sistema sostienen que las patentes son esenciales para incentivar las enormes inversiones en investigación y desarrollo necesarias para llevar nuevos tratamientos al mercado. Los críticos argumentan que los monopolios de patentes mantienen los precios de los medicamentos artificialmente altos, lo que hace que los medicamentos que salvan vidas sean inaccesibles para millones de personas en todo el mundo, particularmente en los países de bajos ingresos. ¿Deberían los países abolir o debilitar drásticamente las protecciones de patentes sobre medicamentos que salvan vidas a favor de modelos alternativos para financiar el desarrollo de fármacos?
Debates
¿Deben las bibliotecas públicas ser reemplazadas por plataformas exclusivamente digitales?
A medida que avanza la tecnología digital y los presupuestos se aprietan, algunos sostienen que las bibliotecas públicas tradicionales con edificios físicos y colecciones de libros se han vuelto obsoletas y deberían ser reemplazadas completamente por plataformas digitales que ofrezcan libros electrónicos, bases de datos en línea y programación virtual. Otros insisten en que las bibliotecas físicas siguen siendo instituciones comunitarias insustituibles que desempeñan funciones sociales, educativas y democráticas vitales más allá del simple préstamo de libros. ¿Deberían los gobiernos eliminar progresivamente las bibliotecas públicas de ladrillo y mortero en favor de alternativas completamente digitales?
Debates
Renta Básica Universal: ¿Una solución para el futuro o un camino hacia la ruina?
Con los avances en la automatización que amenazan el empleo tradicional, algunos proponen una Renta Básica Universal (UBI): una suma regular e incondicional de dinero pagada a cada ciudadano. El debate se centra en si la UBI es una red de seguridad necesaria para una economía en cambio o una política fiscalmente irresponsable que desalienta el trabajo.
Debates
¿Debería ser obligatorio votar para todos los ciudadanos elegibles?
Varias democracias en todo el mundo, incluidas Australia y Bélgica, exigen que los ciudadanos elegibles voten en las elecciones o enfrenten sanciones como multas. Los partidarios sostienen que el voto obligatorio fortalece la legitimidad democrática y garantiza que los funcionarios electos representen todo el espectro de la sociedad. Los opositores sostienen que obligar a la gente a votar viola la libertad individual y puede conducir a opciones de voto no informadas o aleatorias que degradan la calidad de los resultados democráticos. ¿Deberían las naciones democráticas adoptar leyes de voto obligatorio para todos los ciudadanos elegibles?
Debates
¿Deberían las democracias bajar la edad para votar a 16 años?
Varios países y municipios han experimentado permitiendo que jóvenes de 16 años voten en elecciones. Los partidarios sostienen que los votantes más jóvenes son partes interesadas en las decisiones de política que configurarán sus futuros, mientras que los opositores se preocupan por la madurez cognitiva y la susceptibilidad a la influencia. ¿Deben las naciones democráticas reducir la edad mínima para votar de 18 a 16 años para todas las elecciones?