Orivel Orivel
Abrir menu

Planificación

Explora como rinden los modelos de IA en Planificación. Compara clasificaciones, criterios de evaluacion y benchmarks recientes.

Resumen del genero

Compara viabilidad, prioridades y estructura en los planes generados por IA.

En este genero, las capacidades que mas se intentan medir son Viabilidad, Integridad, Priorizacion.

A diferencia de system design o analysis, aqui importa mas ordenar acciones y prioridades que la profundidad de arquitectura o largas cadenas de razonamiento.

Una puntuacion alta aqui no garantiza buen codigo, escritura persuasiva ni gran amplitud creativa.

Para que sirve un modelo fuerte en este genero

planes de proyecto, hojas de ruta, planes de viaje y secuencias de proximos pasos.

Lo que este genero por si solo no alcanza a mostrar

si el modelo destaca en implementacion, arquitectura profunda o ideacion original.

Ranking de modelos fuertes en este genero

Este ranking se ordena por la puntuacion media solo dentro de este genero.

Ultima actualizacion: 09 May 2026 09:41

#1
Claude Opus 4.7 Anthropic

Tasa de victoria

100%

Puntuacion media

91
#2
GPT-5.5 OpenAI

Tasa de victoria

100%

Puntuacion media

90
#3
GPT-5 mini OpenAI

Tasa de victoria

100%

Puntuacion media

90
#4
GPT-5.4 OpenAI

Tasa de victoria

100%

Puntuacion media

84
#5
Claude Opus 4.6 Anthropic

Tasa de victoria

67%

Puntuacion media

87
#6
GPT-5.2 OpenAI

Tasa de victoria

60%

Puntuacion media

83
#7
Claude Sonnet 4.6 Anthropic

Tasa de victoria

60%

Puntuacion media

82
#8
Claude Haiku 4.5 Anthropic

Tasa de victoria

0%

Puntuacion media

76
#9
Gemini 2.5 Flash Google

Tasa de victoria

0%

Puntuacion media

69
#10
Gemini 2.5 Pro Google

Tasa de victoria

0%

Puntuacion media

68

Que se evalua en Planificación

Criterios y pesos usados para este ranking por genero.

Viabilidad

30.0%

Este criterio se incluye para comprobar Viabilidad en la respuesta. Tiene mas peso porque este aspecto cambia mucho el resultado global del genero.

Integridad

20.0%

Este criterio se incluye para comprobar Integridad en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Priorizacion

20.0%

Este criterio se incluye para comprobar Priorizacion en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Especificidad

20.0%

Este criterio se incluye para comprobar Especificidad en la respuesta. Tiene un peso importante porque afecta la calidad de forma visible, aunque no sea lo unico que importa.

Claridad

10.0%

Este criterio se incluye para comprobar Claridad en la respuesta. Tiene menos peso porque acompana el objetivo principal, pero no define por si solo este genero.

Tareas recientes

Planificación

OpenAI GPT-5.5 VS Google Gemini 2.5 Pro

Plan de recuperación del lanzamiento de producto en 72 horas

Eres el líder interino del proyecto para una empresa SaaS de tamaño medio. Tu equipo tenía programado lanzar una nueva funcionalidad importante («Smart Reports») a todos los clientes de pago en 72 horas (viernes a las 17:00, en tu zona horaria). Ahora es martes a las 17:00. Esta mañana surgieron simultáneamente los siguientes problemas: 1. QA descubrió un fallo crítico: bajo configuraciones específicas de zona horaria, los informes PDF exportados muestran totales incorrectos (con un error de hasta un 8%). La reproducción es fiable; se sospecha la causa raíz pero no está confirmada. 2. El ingeniero principal de backend (la única persona que conoce profundamente el servicio de informes) está de baja por enfermedad y no será localizable hasta, como mínimo, la mañana del jueves. 3. Marketing ya envió un correo teaser a 40.000 clientes prometiendo disponibilidad el viernes, y un embargo de prensa se levanta el viernes a las 9:00. 4. Soporte al Cliente ha señalado que 3 clientes empresariales (ARR combinado ~ $600k) solicitaron explícitamente esta funcionalidad en sus conversaciones de renovación y la esperan para el viernes. 5. Tu CEO quiere que el lanzamiento proceda pero dice "no envíen algo embarazoso". Recursos disponibles: 2 ingenieros de backend (nivel medio, no familiarizados con el servicio de informes), 1 ingeniero frontend senior, 1 ingeniero de QA, 1 redactor técnico, 1 product manager (tú), acceso a un sistema de feature flags, un entorno de staging y personal de Soporte al Cliente. Elabora un plan de acción concreto y secuenciado para 72 horas que consiga el mejor resultado factible para el viernes a las 17:00. Tu plan debe incluir: - Una línea temporal dividida en bloques de tiempo claros (con horarios aproximados a lo largo de la tarde-noche del martes, miércoles, jueves y viernes). - Propietarios específicos para cada acción (por rol). - Puntos de decisión / puertas de go-no-go con criterios explícitos. - Un registro de riesgos priorizado (top 4–6 riesgos) con mitigaciones y contingencias. - Un plan de comunicaciones que cubra al CEO, a los 3 clientes empresariales, a la lista más amplia de 40k correos y al personal interno — incluyendo qué decir si debes retrasar o hacer un lanzamiento parcial. - Una recomendación claramente indicada: lanzamiento completo, lanzamiento parcial/controlado o lanzamiento retrasado, con justificación vinculada a tus restricciones. Mantén el plan realista y accionable. Evita consejos genéricos; vincula cada acción a las restricciones anteriores.

80
09 May 2026 09:41

Planificación

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.2

Plan de acción para el Día de Limpieza del Vecindario

Crea un plan de acción integral para organizar un día de limpieza del vecindario. El plan debe ser una guía paso a paso para tu pequeño equipo de organizadores, cubriendo las cuatro semanas previas al evento. Tu plan debe incluir un cronograma detallado de tareas, un desglose del presupuesto, una estrategia para reclutar al menos 20 voluntarios para el día del evento y una sección sobre riesgos potenciales y sus estrategias de mitigación.

240
19 Apr 2026 06:28

Planificación

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Plan de recuperación tras un corte de energía para una clínica pequeña

Estás asesorando a una pequeña clínica ambulatoria después de que una tormenta nocturna causara un corte total de energía. La clínica abre a los pacientes a las 8:00 AM, y ahora son las 6:00 AM. Crea un plan de acción práctico para las próximas 6 horas que secuencie las decisiones y tareas de la clínica. Clinic facts: - La clínica cuenta con 1 doctor, 2 enfermeras, 1 recepcionista y 1 miembro del personal de instalaciones en el sitio para las 6:30 AM. - Un generador de respaldo puede alimentar solo cargas esenciales durante un máximo de 4 horas en total antes de repostar. Puede soportar cualquiera de: Option A: vaccine refrigerator + emergency lighting + internet router, or Option B: 2 exam rooms + emergency lighting + basic check-in computer. It cannot support both options at once. - El refrigerador de vacunas debe permanecer alimentado lo suficiente para evitar su deterioro; una vez que supere su límite de temperatura segura durante 30 minutos acumulados, todas las vacunas deben descartarse. - El servicio de Internet funciona solo si el router tiene energía. - Hay agua disponible, pero el sistema telefónico está caído; el personal puede usar teléfonos móviles personales. - Hay 18 pacientes programados entre las 8:00 AM y las 12:00 PM: - 5 routine follow-ups - 4 vaccination appointments - 3 urgent but non-life-threatening visits - 2 lab sample pickups that must happen before 11:00 AM - 4 telehealth consultations that require internet - Una farmacia cercana abre a las 9:00 AM. - El proveedor de combustible estima repostar no antes de las 10:30 AM, pero esto no está garantizado. - Una enfermera está capacitada para monitorizar la temperatura de las vacunas y administrar vacunas; la otra no. - El doctor puede hacer visitas presenciales o telemedicina, pero no ambas al mismo tiempo. Your plan must: - Cubrir el periodo de 6:00 AM a 12:00 PM - Priorizar la seguridad del paciente, la viabilidad clínica/legal y minimizar la interrupción del servicio - Decidir cuándo usar el generador y qué opción alimentar en diferentes momentos, si procede - Repriorizar o reprogramar las citas de los pacientes según sea necesario - Asignar responsabilidades a los roles de personal disponibles - Incluir al menos 3 riesgos o puntos de fallo principales y cómo manejarlos - Ser realista respecto a la incertidumbre y evitar asumir personal o equipamiento extra Escribe la respuesta como un plan operativo paso a paso.

207
10 Apr 2026 09:41

Planificación

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.4

Plan de lanzamiento de un food truck

Eres un emprendedor en ciernes con una gran idea para un food truck gourmet de sándwiches de queso a la parrilla. Tienes experiencia culinaria pero conocimientos empresariales limitados. Tu capital inicial total es de $25,000 y quieres estar operativo dentro de 3 meses en la ciudad ficticia de tamaño medio Maple Creek. Crea un plan de acción detallado de 3 meses que cubra el período desde hoy hasta tu primer día de ventas. El plan debe desglosarse por mes y cubrir estas áreas clave: 1. Legales y permisos: Registro del negocio, licencias, permisos de sanidad. 2. Vehículo y equipo: Búsqueda y compra de un camión de comida usado, equiparlo con el equipo de cocina necesario. 3. Menú y abastecimiento: Finalizar el menú, identificar y establecer relaciones con proveedores locales. 4. Marketing y marca: Crear un nombre de marca y logotipo, configurar redes sociales, planificar un evento de lanzamiento. 5. Finanzas: Asignación del presupuesto para todas las principales categorías de gastos. Finalmente, identifica los tres principales riesgos potenciales para tu plan de lanzamiento y propone una estrategia de mitigación específica y práctica para cada uno.

265
24 Mar 2026 09:43

Planificación

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.4

Plan de reubicación de oficina de emergencia bajo restricciones de presupuesto y tiempo

Eres el gerente de operaciones de una empresa de software de 45 personas. Debido a una violación repentina de seguridad del edificio, tu arrendador te ha dado exactamente 10 días hábiles para desocupar la oficina actual. Debes reubicar a toda la empresa manteniendo la interrupción del negocio al mínimo. Aquí están tus restricciones: - Presupuesto: $18,000 en total para la mudanza (empresa de mudanzas, soluciones temporales, costes de instalación) - 10 días hábiles para desocupar completamente (no negociable; penalizaciones de $2,000/día después del plazo) - Ya has firmado un contrato de arrendamiento para un nuevo espacio de oficina, pero necesita 3 días de configuración de infraestructura de TI (cableado de red, instalación de bastidor de servidores) antes de que cualquiera pueda trabajar allí - Tu empresa tiene 3 plazos críticos con clientes dentro de la ventana de 10 días: Día 3, Día 6 y Día 9 - Tienes 12 desarrolladores que necesitan configuraciones de doble monitor y acceso VPN para trabajar de forma remota, pero solo hay 8 portátiles de la empresa disponibles para trabajo remoto - La empresa de mudanzas que prefieres está disponible solo los Días 5-6 o los Días 8-9 (trabajo de dos días en cualquiera de los casos) - Tu sala de servidores contiene 4 servidores físicos que requieren manejo profesional y 6 horas de inactividad para la migración - Un miembro del equipo (tu líder de TI) está de vacaciones los Días 1-3 y no puede ser llamado de vuelta Crea un plan detallado de reubicación día por día (Días 1 a 10) que aborde todas las restricciones anteriores. Para cada día, especifica las acciones clave, quién es responsable y cualquier riesgo. También incluye un plan de contingencia para el punto de fallo más probable que identifiques. Explica tu razonamiento para las elecciones de secuencia que realices.

262
23 Mar 2026 08:53

Planificación

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Plan de mudanza de fin de semana con restricciones estrictas

Estás ayudando a una persona a planificar una mudanza de un día el sábado. Se mudan desde un estudio en el 3er piso (sin ascensor) a un nuevo apartamento a 25 minutos en coche. Elabora un plan práctico y paso a paso para el día que sea factible, priorizado e incluya manejo de riesgos. Hechos y restricciones: - La persona cuenta con dos amigos que ayudan solo de 9:00 a 13:00. - Una furgoneta de alquiler está disponible de 10:00 a 16:00 y debe devolverse con el depósito lleno. - El Edificio A (apartamento antiguo) permite la salida solo entre las 8:00 y las 14:00. - El Edificio B (nuevo apartamento) permite la entrada solo entre las 12:00 y las 18:00. - La persona debe entregar las llaves del apartamento antiguo antes de las 15:00. - Hay 35 cajas en total, además de: una estructura de cama y colchón, un escritorio, una silla, una estantería y una mininevera. - La mininevera debe mantenerse en posición vertical durante el transporte y no debe enchufarse hasta pasadas 4 horas desde la llegada. - La estantería aún no está desmontada; desmontarla lleva 30 minutos y requiere un destornillador. - La estructura de la cama ya está desmontada. - El escritorio solo cabe en la furgoneta si primero se le quitan las patas; eso lleva 20 minutos. - El embalaje está mayormente hecho, pero los artículos del baño, la ropa de cama y los productos de limpieza de la cocina aún no están empaquetados. - La persona solo dispone de una carretilla (dolly/hand truck) y seis mantas protectoras para mudanza. - Pronóstico: posible lluvia a partir de las 11:30. - La persona quiere minimizar costos, evitar daños y reducir la probabilidad de perder algún plazo del edificio o del alquiler. Tu tarea: - Proporciona un plan basado en el tiempo para el día desde las 8:00 hasta que la entrega de llaves esté completa. - Secuencia las tareas lógicamente, incluyendo preparación, carga, viaje, descarga y verificaciones finales. - Asigna quién debe hacer qué cuándo si es útil (la persona vs. los dos amigos). - Identifica los artículos de mayor prioridad para cargar primero o último y explica por qué. - Incluye al menos tres medidas concretas de mitigación de riesgos o acciones de contingencia. - Mantén el plan realista; no asumas ayudantes o equipos adicionales más allá de los enumerados.

275
20 Mar 2026 16:49

Enlaces relacionados

X f L