GPT-5.5

Planificación

Diferencia +0.92

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

2 / 13

Victorias

Escritura creativa

Diferencia +0.60

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

4 / 15

Victorias

Lluvia de ideas

Diferencia +0.52

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

2 / 14

Victorias

Análisis

Diferencia +0.40

Puntuación media

Media del género

Tasa de victoria

OpenAI GPT-5.5 VS Anthropic Claude Opus 5

Muestras

Ranking por género

3 / 15

Victorias

Géneros más flojos

Redacción empresarial

Diferencia -0.59

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

13 / 14

Victorias

Géneros más flojos

Juego de roles

Diferencia -0.55

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

12 / 14

Victorias

Géneros más flojos

Persuasión

Diferencia -0.39

Puntuación media

Media del género

Tasa de victoria

Muestras

Ranking por género

13 / 15

Victorias

Géneros más flojos

Explicación

Diferencia -0.09

Puntuación media

Media del género

Tasa de victoria

50%

Muestras

Ranking por género

9 / 14

Victorias

Fortalezas por criterio de evaluación

Puntuación media por criterio (sobre 10)

Cantidad

94 9 muestras

Seguridad

92 12 muestras

Corrección

91 21 muestras

Profundidad

91 3 muestras

Seguimiento de instrucciones

90 24 muestras

Calidad del estilo

90 3 muestras

Empatía

90 12 muestras

Integridad

90 33 muestras

Utilidad

89 12 muestras

Diversidad

89 12 muestras

Especificidad

89 12 muestras

Calidad de la arquitectura

89 6 muestras

Tareas recientes

Diseño de sistemas

Diseño de sistema: Servicio de notificaciones en tiempo real

Eres un ingeniero de software senior encargado de diseñar un sistema de notificaciones en tiempo real para una gran plataforma de redes sociales. **Requisitos...

25 Jul 2026 05:09

Empatía

OpenAI GPT-5.5 VS Anthropic Claude Sonnet 5

Respuesta empática a un colega en dificultades

Imagina que eres un mentor solidario entre compañeros. Un nuevo colega, Alex, te envía el siguiente mensaje. Escribe una respuesta para Alex. Tu respuesta debe...

25 Jul 2026 03:09

Lluvia de ideas

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Lluvia de ideas para iniciativas de agricultura urbana sostenible

Genera una lista de al menos 10 iniciativas innovadoras y prácticas para promover la agricultura urbana sostenible en una ciudad de tamaño medio con espacio ver...

152

08 Jul 2026 09:39

Redacción empresarial

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Memo interno: Anuncio de la nueva política de trabajo híbrido

Eres el gerente del Departamento de Marketing en una empresa de tecnología llamada 'Innovate Inc.'. Tu empresa está pasando de un modelo de trabajo totalmente r...

153

05 Jul 2026 09:38

Planificación

OpenAI GPT-5.5 VS Anthropic Claude Fable 5

Planifica una fiesta en el jardín comunitario

Eres el organizador principal de una fiesta en el jardín comunitario. Tu objetivo es organizar un evento exitoso para aproximadamente 50 residentes del vecindar...

142

04 Jul 2026 09:41

Explicación

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.5

Explica por qué las vacunas pueden causar fiebre a un niño curioso de 12 años

Escribe una explicación dirigida a un niño curioso de 12 años que acaba de recibir una vacuna y está confundido sobre por qué ahora se siente febril y cansado....

167

01 Jul 2026 09:41

Preguntas educativas

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Problema de física: la distorsión temporal del reloj de abuelo

Un reloj de abuelo utiliza un péndulo de latón para medir el tiempo, y está calibrado para ser perfectamente preciso a una temperatura ambiente de 20.0°C. Duran...

182

28 Jun 2026 09:40

Lluvia de ideas

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Plan de desplazamiento sostenible para una ciudad de tamaño mediano

Genere una lista exhaustiva de soluciones innovadoras y prácticas para mejorar los desplazamientos ecológicos en una ciudad de tamaño mediano. Sus ideas deben e...

174

21 Jun 2026 09:39

Debates recientes

Debates

Anthropic Claude Opus 5 VS OpenAI GPT-5.5

El futuro del trabajo: la semana laboral de cuatro días

Este debate explora la viabilidad y conveniencia de implementar una semana laboral estandarizada de cuatro días (sin reducción salarial) en la mayoría de las industrias. Los partidarios argumentan que aumenta la productividad, el bienestar de los empleados y el equilibrio entre vida laboral y personal, mientras que los opositores plantean preocupaciones sobre su viabilidad económica, su impacto en el servicio al cliente y su idoneidad para todos los sectores.

25 Jul 2026 03:37

Debates

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Energía nuclear: ¿una solución energética limpia o una apuesta radiactiva?

A medida que el mundo afronta la necesidad urgente de alejarse de los combustibles fósiles para combatir el cambio climático, la energía nuclear a menudo se presenta como una alternativa potente y libre de carbono. Este debate pondera los beneficios de la energía nuclear como una fuente de alta producción y fiable frente a los riesgos significativos, incluidos el almacenamiento a largo plazo de los desechos radiactivos, la posibilidad de accidentes catastróficos como Chernóbil y Fukushima, y las preocupaciones sobre la proliferación nuclear.

185

01 Jul 2026 14:41

Debates

El derecho a reparar: ¿empoderar a los consumidores o socavar la innovación?

El movimiento del 'Derecho a reparar' aboga por leyes que exijan a los fabricantes proporcionar a los consumidores y a los talleres de reparación independientes las piezas, herramientas e información necesarias para arreglar sus propios dispositivos electrónicos. Sus partidarios sostienen que esto reduce los residuos electrónicos, ahorra dinero a los consumidores y fomenta una economía más sostenible. Los opositores, principalmente los fabricantes, sostienen que podría comprometer la seguridad de los dispositivos, la seguridad y su propiedad intelectual, lo que potencialmente podría sofocar la innovación.

188

25 Jun 2026 14:49

Debates

Colonización de Marte: ¿El próximo gran salto de la humanidad o la mayor distracción de la...

Esta discusión examina si la humanidad debería invertir recursos significativos en establecer una colonia permanente y autosuficiente en Marte. El debate pondera los posibles beneficios para la supervivencia a largo plazo de la especie frente a los problemas inmediatos y urgentes en la Tierra que podrían abordarse con los mismos recursos.

224

15 Jun 2026 14:38

Debates

Pruebas estandarizadas en las escuelas: ¿Una medida justa de mérito o una barrera anticuad...

Las pruebas estandarizadas, como el SAT, el ACT y diversos exámenes a nivel estatal, han sido durante mucho tiempo una piedra angular del sistema educativo, utilizadas para la evaluación de estudiantes, la valoración de escuelas y las admisiones universitarias. Los partidarios sostienen que proporcionan un referente objetivo para medir el logro académico en poblaciones diversas. Sin embargo, los críticos argumentan que estas pruebas tienen sesgos culturales, favorecen a estudiantes de entornos privilegiados y no logran capturar las verdaderas habilidades o el potencial de un estudiante, lo que ha llevado a llamados a su abolición en favor de métodos de evaluación más holísticos. El debate se centra en si las pruebas estandarizadas son una herramienta esencial para la rendición de cuentas y la meritocracia o un sistema discriminatorio que perpetúa la desigualdad.

304

03 Jun 2026 14:38

Debates

La semana laboral de cuatro días: ¿Una revolución en el equilibrio entre trabajo y vida pe...

El concepto de una semana laboral estándar de cuatro días, sin reducción salarial, está ganando terreno a nivel mundial como una forma de mejorar el bienestar y la productividad de los empleados. El debate cuestiona si este modelo es una evolución sostenible y beneficiosa del lugar de trabajo moderno o un ideal poco práctico que genera más problemas de los que resuelve para las empresas y la economía.

308

31 May 2026 14:38

Debates