Explique la indexación de bases de datos a un desarrollador junior

Compara las respuestas de los modelos para esta tarea de benchmark de Explicación y revisa puntuaciones, comentarios y ejemplos relacionados.

Inicia sesion o registrate para usar me gusta y favoritos. Registrarse

X f L

Indice

Resumen de la tarea

Generos de Comparacion

Explicación

Modelo creador de la tarea El creador de la tarea se selecciona aleatoriamente entre los principales modelos de generacion de tareas de los proveedores compatibles.

Anthropic Claude Opus 4.6

Modelos participantes En este benchmark, los modelos del mismo proveedor que el creador de la tarea quedan excluidos de responder.

Respuesta A Google Gemini 2.5 Flash-Lite

Respuesta B OpenAI GPT-5.2

Modelos evaluadores La evaluacion usa exactamente 3 modelos evaluadores, excluyendo los modelos que responden. Al menos 1 evaluador se selecciona entre modelos de nivel superior, los modelos ligeros no se usan como evaluadores, y los 3 evaluadores provienen de 3 proveedores distintos.

OpenAI GPT-5.4 Anthropic Claude Opus 4.6 Google Gemini 2.5 Flash

Enunciado de la tarea

Mostrar mas ▼

Eres un ingeniero de software senior que está mentoreando a un desarrollador junior que ha estado escribiendo consultas SQL durante unos seis meses pero nunca ha creado ni pensado en índices de bases de datos. Acaba de quejarse de que sus consultas sobre una tabla con 10 millones de filas están funcionando muy lentamente. Escribe una explicación clara y estructurada sobre la indexación de bases de datos para este público. Tu explicación debe cubrir: 1. Qué es un índice de base de datos y por qué existe, usando al menos una analogía concreta que un principiante encuentre intuitiva. 2. Cómo funciona conceptualmente un índice B-tree básico (no hace falta detalle algorítmico completo, pero sí lo suficiente para que el lector entienda por qué las búsquedas se vuelven más rápidas). 3. Los trade-offs de los índices: cuándo ayudan, cuándo perjudican y qué costes introducen. 4. Orientación práctica sobre cómo decidir qué columnas indexar, incluyendo al menos dos ejemplos realistas de consultas y si/cómo se beneficiarían de un índice. 5. Una nota breve sobre índices compuestos (multicolumna) y por qué el orden de las columnas importa. Procura que la explicación sea exhaustiva pero accesible: evita jerga innecesaria, pero no simplifiques hasta el punto de ser inexacto. El lector debería terminar tu explicación sintiéndose lo suficientemente seguro para crear su primer índice y razonar sobre si le será útil.

Politica de evaluacion

Mostrar mas ▼

Una respuesta sólida debe evaluarse según las siguientes dimensiones. Primero, exactitud: todas las afirmaciones técnicas sobre cómo funcionan los índices, sus trade-offs y la estructura B-tree deben ser correctas y libres de simplificaciones que induzcan a error. Segundo, exhaustividad: los cinco temas solicitados deben ser tratados con profundidad significativa, no meramente mencionados de pasada. Tercero, claridad y adecuación al público: la explicación debe estar escrita a un nivel apropiado para un desarrollador junior con experiencia básica en SQL, usando lenguaje llano, analogías útiles y ejemplos concretos en lugar de teoría abstracta. Cuarto, valor práctico: los ejemplos de consultas y decisiones de indexación deben ser realistas e ilustrativos, ayudando al lector a construir intuición aplicable a su trabajo. Quinto, la discusión sobre índices compuestos debe transmitir correctamente por qué el orden de las columnas importa, idealmente con un ejemplo. Las respuestas que sean excesivamente breves, técnicamente inexactas o dirigidas al nivel equivocado (demasiado avanzadas o demasiado simplificadas) deben recibir una calificación baja.

Respuestas

Respuesta A: Google Gemini 2.5 Flash-Lite

¡Hola! Entiendo que estás teniendo problemas de rendimiento con tus consultas en esa tabla grande. Es un problema muy común y es precisamente donde los índices de bases de datos resultan útiles. Vamos a desglosar qué son y cómo pueden ayudar.

1. ¿Qué es un Índice de Base de Datos y Por Qué Existe?

Imagina que tienes un libro enorme con 10 millones de entradas y necesitas encontrar un tema específico. Sin un índice, tendrías que hojear cada página, una por una, hasta encontrar lo que buscas. Esto llevaría mucho, mucho tiempo.

Un índice de base de datos es como el índice al final de ese libro. Es una estruct...

Mostrar respuesta completa ▼

1. ¿Qué es un Índice de Base de Datos y Por Qué Existe?

Un índice de base de datos es como el índice al final de ese libro. Es una estructura de datos separada que el sistema de gestión de bases de datos (DBMS) mantiene. En lugar de escanear toda la tabla (que es como leer el libro entero), la base de datos puede usar el índice para localizar rápidamente las filas específicas que te interesan. Básicamente, crea una lista ordenada de valores de una o más columnas, junto con punteros a las filas reales de la tabla donde aparecen esos valores.

¿Por qué existe? Para acelerar las operaciones de recuperación de datos (como las consultas SELECT con cláusulas WHERE) y, a veces, las operaciones ORDER BY y JOIN. Sin índices, la base de datos tendría que realizar un escaneo completo de la tabla para muchas consultas, lo cual es increíblemente ineficiente en tablas grandes.

2. Cómo Funciona un Índice B-Tree Básico (Conceptualmente)

La mayoría de las bases de datos modernas utilizan una estructura de datos llamada B-tree (o una variación de ella) para sus índices. Piensa en un B-tree como un árbol de búsqueda balanceado y multi-vía. Está diseñado para almacenar y recuperar datos de manera eficiente, especialmente cuando esos datos no caben completamente en la memoria y residen en el disco.

Aquí tienes una vista simplificada:

Nodo Raíz: La parte superior del árbol. Contiene un rango de valores y punteros a nodos hijos.
Nodos Internos: Estos nodos también contienen rangos de valores y punteros a nodos hijos más profundos.
Nodos Hoja: Estos están en la parte inferior. Contienen los valores indexados reales y, lo que es crucial, punteros (como IDs de fila o direcciones físicas) a las filas correspondientes en la tabla principal.

Cuando buscas un valor (por ejemplo, WHERE user_id = 12345), la base de datos comienza en el nodo raíz. Compara tu valor con los rangos del nodo raíz y sigue el puntero apropiado hacia abajo al siguiente nivel. Repite este proceso, reduciendo el espacio de búsqueda en cada paso, hasta que llega a un nodo hoja. Una vez que encuentra el valor en el nodo hoja, utiliza el puntero asociado para saltar directamente a la(s) fila(s) correcta(s) en la tabla principal. Esto es mucho más rápido que leer cada fila secuencialmente.

Debido a que los B-trees están balanceados, la altura del árbol crece muy lentamente incluso a medida que aumenta el número de entradas. Esto significa que buscar un valor lleva una cantidad de tiempo logarítmica (O(log n)), que es significativamente más rápido que un escaneo lineal (O(n)) para grandes conjuntos de datos.

3. Las Compensaciones del Indexado

Los índices no son una bala de plata; tienen sus costos:

Espacio de Almacenamiento: Cada índice es una estructura de datos separada, por lo que consume espacio en disco. Una tabla con muchos índices puede ocupar considerablemente más espacio que la propia tabla.
Sobrecarga de Rendimiento de Escritura: Cuando INSERTAS, ACTUALIZAS o ELIMINAS filas en la tabla, la base de datos también debe actualizar todos los índices relevantes. Esto hace que las operaciones de escritura sean más lentas. Cuantos más índices tengas, más trabajo tendrá que hacer la base de datos por cada escritura.
Sobrecarga de Planificación de Consultas: La base de datos necesita decidir qué índice (si alguno) usar para una consulta dada. Este proceso de toma de decisiones (optimización de consultas) añade una pequeña sobrecarga.

Cuándo los Índices Ayudan:

Consultas que filtran datos usando cláusulas WHERE en columnas indexadas (por ejemplo, WHERE status = 'active').
Consultas que ordenan datos usando ORDER BY en columnas indexadas.
Consultas que unen tablas en columnas indexadas.
Consultas que usan columnas indexadas en cláusulas GROUP BY.

Cuándo los Índices Perjudican (o No Ayudan Mucho):

Consultas que escanean una gran parte de la tabla de todos modos (por ejemplo, WHERE age > 18 en una tabla donde la mayoría de los usuarios tienen más de 18 años).
Tablas con muy pocas filas (la sobrecarga de usar un índice podría ser mayor que un escaneo rápido).
Tablas que son intensivas en escritura y rara vez se leen (el costo de mantener los índices podría superar los beneficios de lectura).
Indexar columnas con baja cardinalidad (pocos valores distintos), como una columna booleana is_active, a menos que sea parte de un índice compuesto y la consulta filtre específicamente por ella.

4. Guía Práctica: ¿Qué Columnas Indexar?

Aquí hay algunas reglas generales:

Columnas usadas en cláusulas WHERE: Este es el caso de uso más común y efectivo. Si frecuentemente filtras tus resultados por una columna específica, indexala.
Columnas usadas en condiciones JOIN: Al unir dos tablas, indexar las columnas usadas en la cláusula ON (generalmente claves foráneas) en ambas tablas puede acelerar significativamente las uniones.
Columnas usadas en cláusulas ORDER BY y GROUP BY: Indexarlas puede ayudar a la base de datos a evitar costosas operaciones de ordenación.
Columnas de Alta Cardinalidad: Las columnas con muchos valores únicos (como user_id, email, transaction_id) son generalmente buenos candidatos para indexar.
Evita Indexar Todo: Sé selectivo. Indexa solo las columnas que se usan con frecuencia en consultas que se benefician de búsquedas más rápidas.

Ejemplos Realistas:

Supongamos que tienes una tabla users con 10 millones de filas y tiene columnas como user_id (clave primaria), email, username, created_at, last_login y status.

Consulta 1: SELECT * FROM users WHERE email = 'test@example.com';
- Beneficio: Alto. La columna email es probablemente única o tiene poca duplicación, y se usa en una cláusula WHERE para una coincidencia exacta. Crear un índice en email permitiría a la base de datos encontrar rápidamente la(s) fila(s) específica(s) sin escanear toda la tabla.
Consulta 2: SELECT username, last_login FROM users WHERE status = 'pending' ORDER BY created_at DESC LIMIT 10;
- Beneficio: Moderado a Alto.
  - Un índice en status ayudaría a encontrar rápidamente todos los usuarios 'pending'.
  - Un índice en created_at ayudaría con la cláusula ORDER BY, potencialmente evitando una ordenación.
  - Un índice compuesto (ver más abajo) en (status, created_at) podría ser aún mejor, ya que podría satisfacer ambas cláusulas WHERE y ORDER BY de manera eficiente.

Cómo Decidir:

Analiza tus consultas lentas: Usa las herramientas de tu base de datos (como EXPLAIN o EXPLAIN ANALYZE en PostgreSQL/MySQL) para ver si las consultas están realizando escaneos completos de tabla. Si es así, y las cláusulas WHERE u ORDER BY involucran columnas específicas, esas son candidatas principales para indexar.
Considera tus datos: Indexa las columnas que se consultan con frecuencia para igualdad (=), rango (>, <, BETWEEN), o ordenación (ORDER BY).
Monitorea el rendimiento: Después de agregar un índice, verifica si el rendimiento de la consulta ha mejorado. También, monitorea el rendimiento de escritura y el uso del disco.

5. Índices Compuestos (Multi-columna)

A veces, una consulta filtra o ordena por varias columnas. Un índice compuesto es un índice que cubre dos o más columnas.

Ejemplo: CREATE INDEX idx_user_status_created ON users (status, created_at);

Por Qué el Orden de las Columnas Importa:

El orden de las columnas en un índice compuesto es crucial. Un índice en (col1, col2) generalmente se puede usar de manera eficiente para consultas que filtran solo por col1, o por col1 y col2. Sin embargo, generalmente no es tan efectivo para consultas que filtran solo por col2.

Piénsalo como una guía telefónica ordenada primero por ciudad y luego por apellido. Puedes encontrar rápidamente a todas las personas en 'Nueva York', y dentro de eso, puedes encontrar a 'García'. Pero si solo quieres encontrar a 'García' en todas las ciudades, el índice no es tan útil porque no está ordenado principalmente por apellido.

Por lo tanto, al crear índices compuestos, coloca primero las columnas que se usan con más frecuencia para filtrar (especialmente comprobaciones de igualdad), seguidas de las columnas usadas para ordenación o comprobaciones de rango.

En Resumen:

Los índices son herramientas poderosas para acelerar las lecturas de la base de datos. Funcionan creando estructuras de datos ordenadas que permiten a la base de datos encontrar datos mucho más rápido que escaneando toda la tabla. Sin embargo, tienen costos en términos de almacenamiento y rendimiento de escritura. La clave es ser estratégico: indexa las columnas usadas en las cláusulas WHERE, JOIN y ORDER BY, especialmente aquellas con alta cardinalidad, y utiliza herramientas como EXPLAIN para guiar tus decisiones. Comienza indexando las columnas en tus consultas más lentas y siempre considera las compensaciones.

¡No dudes en intentar crear un índice en tu columna email y ver cuánto más rápida se vuelve esa consulta! Avísame si tienes más preguntas.

Resultado

Votos ganadores

0 / 3

Puntuacion media

Modelos evaluadores Anthropic Claude Opus 4.6

Puntuacion total

Comentario general

La Respuesta A es una explicación completa y bien estructurada que cubre los cinco temas requeridos. Utiliza un tono amigable y de mentoría, apropiado para un desarrollador junior. La analogía del índice de un libro es clara, la explicación del árbol B es precisa, las compensaciones están bien organizadas con listas útiles y la sección de índices compuestos incluye la excelente analogía de la guía telefónica. Los dos ejemplos de consulta son realistas y están bien explicados. Sin embargo, ocasionalmente tiende a ser un poco verbosa sin añadir profundidad proporcional. Faltan algunos matices técnicos, como la distinción entre árbol B y árbol B+, el concepto de índices de cobertura y el impacto de las funciones en el uso de índices. La guía de "indexar todo en las cláusulas WHERE" podría ser más matizada.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

La Respuesta A está escrita de forma clara con un tono amigable y conversacional. La analogía del libro y la analogía de la guía telefónica para índices compuestos son intuitivas. El uso de encabezados, texto en negrita y viñetas facilita la lectura. Ocasionalmente verboso sin ganancia de información proporcional.

Correccion

Peso 25%

Técnicamente preciso en los conceptos centrales. La explicación del árbol B es correcta a nivel conceptual. La sección de compensaciones es precisa. Sin embargo, no distingue entre árbol B y árbol B+, no menciona las limitaciones de los índices funcionales y la afirmación de que las columnas booleanas de baja cardinalidad son malos candidatos para índices es algo simplificada sin contexto.

Adecuacion al publico

Peso 20%

Excelente adecuación a la audiencia con un tono cálido y de mentoría. La apertura y el cierre conversacionales crean una atmósfera de apoyo. Las analogías están bien elegidas para principiantes. Quizás un poco demasiado informal en algunos lugares, pero en general bien adaptado para un desarrollador junior con 6 meses de experiencia en SQL.

Integridad

Peso 15%

Cubre los cinco temas requeridos con una profundidad razonable. Se proporcionan dos ejemplos de consulta realistas. Sin embargo, omite algunos conceptos valiosos: índices de cobertura, limitaciones de índices funcionales y la regla del prefijo más a la izquierda solo se cubre implícitamente. La sección de índices compuestos, aunque correcta, podría ser más profunda.

Estructura

Peso 10%

Bien organizado con encabezados claros que coinciden con las cinco secciones requeridas. Buen uso de viñetas, texto en negrita y formato de código. La sección de resumen lo une todo muy bien. Flujo lógico del concepto a la práctica.

Modelos evaluadores Google Gemini 2.5 Flash

Puntuacion total

Comentario general

La Respuesta A proporciona una explicación muy clara, conversacional y bien estructurada de la indexación de bases de datos. Sus analogías son intuitivas y cubre todos los puntos requeridos con buena profundidad. La guía práctica y la explicación de índices compuestos son sólidas, lo que la hace muy adecuada para un desarrollador junior. Adopta con éxito un tono de mentoría.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

La Respuesta A es muy clara y utiliza un tono atractivo y conversacional con excelentes analogías que ayudan a la comprensión.

Correccion

Peso 25%

Todas las afirmaciones técnicas en la Respuesta A son precisas y están libres de simplificaciones engañosas.

Adecuacion al publico

Peso 20%

La apertura conversacional de la Respuesta A y el tono de mentoría constante están perfectamente adaptados para un desarrollador junior, lo que la hace muy accesible.

Integridad

Peso 15%

La Respuesta A cubre a fondo los cinco puntos solicitados con buena profundidad y detalle.

Estructura

Peso 10%

La Respuesta A está bien estructurada con encabezados claros que se corresponden directamente con los requisitos de la indicación, e incluye una buena introducción y resumen.

Modelos evaluadores OpenAI GPT-5.4

Puntuacion total

Comentario general

La respuesta A es clara, está bien estructurada y cubre todos los temas solicitados con un tono amigable orientado a principiantes. Explica bien la analogía del índice de un libro, ofrece una descripción conceptual de los árboles B mayormente precisa, discute las compensaciones principales e incluye orientación práctica sobre indexación, además de una explicación útil de los índices compuestos. Sus principales debilidades son que algunos consejos son un poco generalizados, algunas afirmaciones se presentan de forma demasiado amplia y los ejemplos prácticos son menos matizados de lo que podrían ser para la planificación de consultas del mundo real.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

Claro y legible, con una sólida analogía del libro y explicaciones en lenguaje mayormente sencillo. Algunas secciones son un poco verbosas y genéricas, y los ejemplos podrían conectarse de manera más directa con la toma de decisiones.

Correccion

Peso 25%

Mayormente preciso en cuanto a lo que hacen los índices, los conceptos básicos de los árboles B y las compensaciones. Algunas afirmaciones son algo amplias o simplificadas, como la generalización de los beneficios para GROUP BY y JOINs sin suficientes advertencias.

Adecuacion al publico

Peso 20%

Bien adaptado para un desarrollador junior, con un tono accesible y una jerga mínima innecesaria. Es amigable y accesible, aunque a veces un poco parecido a un libro de texto.

Integridad

Peso 15%

Aborda las cinco áreas solicitadas con detalle significativo, incluyendo compensaciones, ejemplos e índices compuestos. Satisface bien la indicación, aunque algunas áreas podrían beneficiarse de un matiz práctico ligeramente más profundo.

Estructura

Peso 10%

Muy bien organizado en torno a los requisitos numerados de la indicación, lo que facilita seguirlo de principio a fin.

Respuesta B: OpenAI GPT-5.2

Qué es un índice (y por qué existe)
Un índice es una estructura de datos adicional que la base de datos mantiene para encontrar filas más rápido. En lugar de escanear cada fila en una tabla de 10 millones de filas para localizar las que deseas, la base de datos puede usar el índice para saltar directamente a las filas coincidentes.

Analogía intuitiva:

Imagina un libro enorme (tu tabla). Si quieres todas las páginas que mencionan "índice", podrías hojear cada página (escaneo completo de tabla). Eso funciona, pero es lento.
El índice de un libro (o la tabla de contenidos) es una búsqueda más pequeña y organ...

Mostrar respuesta completa ▼

Qué es un índice (y por qué existe)
Un índice es una estructura de datos adicional que la base de datos mantiene para encontrar filas más rápido. En lugar de escanear cada fila en una tabla de 10 millones de filas para localizar las que deseas, la base de datos puede usar el índice para saltar directamente a las filas coincidentes.

Analogía intuitiva:

Imagina un libro enorme (tu tabla). Si quieres todas las páginas que mencionan "índice", podrías hojear cada página (escaneo completo de tabla). Eso funciona, pero es lento.
El índice de un libro (o la tabla de contenidos) es una búsqueda más pequeña y organizada que te dice exactamente a qué páginas ir. Pasas un poco de tiempo consultando el índice, luego saltas directamente a las páginas relevantes.

Por eso existen los índices: para evitar leer la tabla completa cuando solo necesitas un pequeño subconjunto.

Cómo funciona un índice B-tree básico (conceptualmente)
La mayoría de las bases de datos relacionales comunes utilizan una estructura B-tree (o B+tree) para los índices estándar.

Imagen conceptual:

El índice almacena los valores de las columnas indexadas en orden ordenado.
Junto a cada valor, almacena un "puntero" a dónde se encuentra la fila real (o, dependiendo de la base de datos, un identificador de fila / clave primaria que se puede usar para recuperar la fila).
Los valores están organizados en un árbol balanceado: una pequeña página "raíz" apunta a páginas intermedias, que apuntan a páginas hoja.

Por qué es rápido:

Si los valores están ordenados, no necesitas comprobar cada fila. Puedes hacer una navegación "similar a una búsqueda binaria".
Con un B-tree, la base de datos lee unas pocas páginas de índice para navegar de raíz → rama → hoja.
Una vez que llega a la página hoja correcta, puede:
- Encontrar las claves exactas rápidamente, y
- Para consultas de rango (por ejemplo, fechas entre X e Y), escanear eficientemente las páginas hoja adyacentes.

En términos de Big-O (intuición aproximada):

Escaneo completo: el trabajo crece aproximadamente linealmente con el número de filas.
Búsqueda B-tree: el trabajo crece aproximadamente con log(número de filas). Con millones de filas, esa diferencia es enorme.

Detalle importante: un índice acelera "encontrar qué filas coinciden", pero la base de datos aún puede necesitar recuperar los datos reales de la fila de la tabla. Si tu consulta necesita muchas columnas que no están presentes en el índice, podría realizar muchas lecturas aleatorias para recuperar filas completas.

Compromisos: cuándo los índices ayudan, cuándo perjudican y qué cuestan
Los índices no son gratis. Son estructuras adicionales que deben almacenarse y mantenerse sincronizadas.

Ayudan más cuando:

Filtra en una columna con una condición selectiva (devuelve una pequeña fracción de la tabla), por ejemplo, WHERE user_id = 123, WHERE email = 'x', WHERE created_at >= ... AND created_at < ... .
Une tablas por una clave (búsquedas de clave externa), por ejemplo, orders.user_id = users.id.
Ordena/limita de una manera que coincide con un índice, por ejemplo, ORDER BY created_at DESC LIMIT 50.

Ayudan menos (o nada) cuando:

De todos modos, devuelve una gran parte de la tabla (por ejemplo, 40-80% de las filas). Escanear la tabla secuencialmente puede ser más barato que rebotar a través del índice y luego recuperar toneladas de filas.
El filtro tiene baja selectividad (pocos valores distintos), por ejemplo, status IN ('ACTIVE','INACTIVE') en una tabla donde el 90% son ACTIVE. Un índice podría no reducir mucho el trabajo.
Aplica funciones a la columna de una manera que impide el uso del índice, por ejemplo, WHERE LOWER(email) = 'a@b.com' (a menos que tenga un índice funcional o una forma normal almacenada).

Costos que introducen los índices:

Almacenamiento: el índice puede ser grande, especialmente en columnas anchas o múltiples columnas.
Escrituras más lentas: INSERT/UPDATE/DELETE también deben actualizar el índice. Más índices = más sobrecarga de escritura.
Sobrecarga de mantenimiento: los índices pueden fragmentarse/hincharse; las estadísticas necesitan actualizarse; la base de datos necesita elegir entre índices.

Regla general: los índices intercambian espacio adicional y escrituras más lentas por lecturas más rápidas.

Guía práctica: decidir qué columnas indexar
Piense desde la carga de trabajo hacia afuera:
A) Mire sus consultas más importantes/lentas

Identifique los filtros WHERE, las condiciones JOIN y los patrones ORDER BY/GROUP BY.
Confirme con la herramienta de plan de su base de datos (por ejemplo, EXPLAIN / EXPLAIN ANALYZE) si está escaneando la tabla.

B) Prefiera indexar columnas que sean:

Usadas frecuentemente para filtrar (WHERE) o unir (ON)
Cardinalidad relativamente alta (muchos valores distintos), para que el índice reduzca efectivamente los resultados
Usadas en consultas de rango u ordenación (fechas/marcas de tiempo, rangos numéricos)

C) Evite (o sea cauteloso con) indexar columnas que sean:

Raramente usadas en consultas
Cardinalidad muy baja y no combinada con otra columna
Actualizadas con extrema frecuencia (los índices aumentan el costo de actualización)

Dos ejemplos de consulta realistas
Ejemplo 1: Búsqueda de igualdad en una columna de alta cardinalidad
Consulta:
SELECT *
FROM users
WHERE email = 'ana@example.com';

Situación:

users tiene 10M de filas; email es único.
Sin un índice, la base de datos puede escanear todas las filas para encontrar la coincidencia.

Recomendación de índice:

Cree un índice único (o al menos un índice normal) en users(email).
Por qué ayuda:
El B-tree puede localizar rápidamente el valor exacto del correo electrónico y saltar a la fila.
Este es uno de los mejores casos para un índice.

Ejemplo 2: Filtro de rango + ordenación + límite
Consulta:
SELECT id, user_id, total, created_at
FROM orders
WHERE created_at >= '2026-01-01'
AND created_at < '2026-02-01'
ORDER BY created_at DESC
LIMIT 100;

Recomendación de índice:

Indexar orders(created_at) (posiblemente descendente dependiendo del soporte de la base de datos; muchas bases de datos pueden escanear un B-tree hacia atrás de todos modos).
Por qué ayuda:
El índice está ordenado por created_at, por lo que la base de datos puede saltar al rango de fechas relevante.
Puede producir filas ya en el orden correcto y detenerse después de 100 filas, evitando escanear los datos de un mes (o peor, toda la tabla).

Ejemplo 3 (enfocado en join): búsqueda de clave externa
Consulta:
SELECT o.id, o.total
FROM orders o
WHERE o.user_id = 123
ORDER BY o.created_at DESC
LIMIT 50;

Recomendación de índice:

Un índice compuesto en orders(user_id, created_at) suele ser ideal (más sobre índices compuestos a continuación).
Por qué ayuda:
La base de datos puede encontrar rápidamente las filas para user_id = 123, ya agrupadas en el índice, y luego leerlas en orden created_at para satisfacer ORDER BY/LIMIT de manera eficiente.

Una nota sobre "cubrir"
Si frecuentemente selecciona solo unas pocas columnas, algunas bases de datos pueden usar un escaneo solo con índice si el índice contiene todas las columnas necesarias (o puede incluir columnas adicionales). Eso reduce las búsquedas de tabla. Pero no indexe en exceso solo para cubrir todo: mida primero.

Índices compuestos (multicolumna) y por qué el orden de las columnas importa
Un índice compuesto indexa tuplas de columnas en un orden específico, como (user_id, created_at). Conceptualmente, está ordenado primero por user_id, y dentro de cada user_id, ordenado por created_at.

Por qué importa el orden (la idea del prefijo más a la izquierda):

Un índice en (user_id, created_at) puede soportar eficientemente:
- WHERE user_id = ?
- WHERE user_id = ? AND created_at >= ?
- ORDER BY created_at (cuando user_id es fijo), porque dentro de un user_id dado las filas ya están ordenadas por created_at
Pero generalmente no puede soportar eficientemente:
- WHERE created_at >= ? (sin user_id), porque created_at no es la clave de ordenación principal; el índice está organizado principalmente por user_id.

Cómo elegir el orden:

Ponga el filtro principal más selectivo y de uso más común primero (a menudo una condición de igualdad como user_id = ?).
Ponga las columnas de rango/ordenación a continuación (created_at para rangos de fechas y ordenación).

Qué hacer a continuación (pasos prácticos)

Elija una consulta lenta.
Ejecute EXPLAIN/EXPLAIN ANALYZE y confirme que está realizando un escaneo completo de tabla o una ordenación costosa.
Agregue el índice más pequeño y relevante (a menudo en una columna WHERE/JOIN; considere uno compuesto si la consulta filtra + ordena).
Vuelva a ejecutar EXPLAIN ANALYZE y mida la latencia antes y después.

Si comparte una de sus consultas lentas (y el esquema de la tabla + qué base de datos está utilizando), puede obtener una recomendación de índice muy concreta y cómo validarla con el plan de consulta.

Resultado

#1 | Ganador

Votos ganadores

3 / 3

Puntuacion media

Modelos evaluadores Anthropic Claude Opus 4.6

Puntuacion total

Comentario general

La respuesta B es exhaustiva, técnicamente precisa y muy práctica. Cubre los cinco temas con una profundidad significativa e incluye tres ejemplos de consulta en lugar del mínimo de dos, cada uno ilustrando un escenario de indexación diferente (igualdad, rango+orden, join+compuesto). Distingue correctamente entre B-tree y B+tree, menciona índices funcionales, índices de cobertura y la regla del prefijo más a la izquierda con ejemplos concretos. La sección de pasos prácticos al final ofrece próximos pasos accionables. El tono es ligeramente más técnico que la Respuesta A, pero aún accesible para un desarrollador junior. La explicación de cuándo los índices perjudican incluye el importante detalle de que las funciones impiden el uso del índice. La sección de índices compuestos es particularmente sólida con ejemplos claros de qué consultas puede y no puede soportar el índice.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

La respuesta B también está claramente escrita con un buen uso de la estructura y ejemplos concretos. Las explicaciones son precisas y están bien organizadas. Ligeramente más denso que A pero aún muy legible. La guía práctica paso a paso al final es particularmente clara.

Correccion

Peso 25%

Más preciso técnicamente en general. Señala correctamente la variante B+tree, menciona las limitaciones de los índices funcionales (WHERE LOWER(email)), explica los índices de cobertura y describe con precisión la regla del prefijo más a la izquierda. La discusión sobre la selectividad es más matizada. La nota sobre lecturas aleatorias al recuperar columnas no indexadas añade precisión importante.

Adecuacion al publico

Peso 20%

Buen ajuste a la audiencia que respeta la inteligencia del desarrollador junior y al mismo tiempo es accesible. Ligeramente más técnico en tono que A, lo que podría ser marginalmente menos accesible para algunos principiantes. Sin embargo, los ejemplos prácticos y la guía paso a paso al final se adaptan muy bien a la audiencia. La oferta de ayuda con consultas específicas es un buen detalle.

Integridad

Peso 15%

Cubre los cinco temas requeridos con excelente profundidad. Proporciona tres ejemplos de consulta realistas que cubren diferentes escenarios (igualdad, rango+ordenación, join+compuesto). Además, cubre índices de cobertura, limitaciones de índices funcionales, la regla del prefijo más a la izquierda explícitamente, y proporciona próximos pasos prácticos concretos. Va significativamente más allá de los requisitos mínimos.

Estructura

Peso 10%

Bien organizado con secciones numeradas claras que coinciden con los cinco temas requeridos. Buen uso de subencabezados, viñetas y bloques de código. La sección adicional 'Qué hacer a continuación' es una valiosa adición estructural. Progresión lógica de la teoría a la práctica.

Modelos evaluadores Google Gemini 2.5 Flash

Puntuacion total

Comentario general

La Respuesta B ofrece una explicación excepcionalmente clara, correcta y completa de la indexación de bases de datos. Destaca por proporcionar orientación práctica con múltiples ejemplos realistas y añade matices valiosos como la cobertura de índices sin sobrecomplicar el tema. Su enfoque estructurado y su precisión técnica ligeramente más profunda la convierten en una opción destacada, ofreciendo una guía muy sólida y práctica para un desarrollador junior.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

La Respuesta B es excepcionalmente clara, con un lenguaje preciso y explicaciones bien estructuradas, especialmente para el mecanismo B-tree y los compromisos. El uso de subsecciones dentro de los puntos mejora la legibilidad.

Correccion

Peso 25%

La Respuesta B es muy precisa, proporcionando detalles técnicos correctos e incluyendo matices valiosos como el concepto de índices 'covering' y el impacto de las funciones en el uso de índices, sin sobrecomplicar la explicación.

Adecuacion al publico

Peso 20%

La Respuesta B se adapta muy bien a un desarrollador junior, manteniendo un tono accesible al tiempo que proporciona información completa y práctica. Es ligeramente menos conversacional que la A, pero igualmente efectiva en su presentación.

Integridad

Peso 15%

La Respuesta B cubre de manera integral los cinco puntos solicitados y añade valor extra con un tercer ejemplo de consulta práctica y una nota breve e perspicaz sobre índices 'covering', mejorando su completitud general.

Estructura

Peso 10%

La Respuesta B está excepcionalmente bien estructurada. Utiliza encabezados claros y organiza aún más la información con subsecciones dentro de cada punto, lo que la hace muy fácil de seguir. La sección 'Qué hacer a continuación' es una excelente conclusión práctica.

Modelos evaluadores OpenAI GPT-5.4

Puntuacion total

Comentario general

La respuesta B es muy clara, técnicamente sólida y especialmente práctica para un desarrollador junior. Explica la indexación con analogías intuitivas, ofrece un modelo conceptual más preciso del comportamiento de los árboles B, cubre compensaciones importantes con mejor matiz y proporciona ejemplos de consultas realistas vinculados directamente a las recomendaciones de índices. Su explicación de índices compuestos es particularmente sólida porque transmite claramente el comportamiento del prefijo más a la izquierda y por qué el orden importa. La respuesta es ligeramente menos pulida en su presentación que la Respuesta A, pero en general es más informativa y útil.

Ver detalle de evaluacion ▼

Claridad

Peso 30%

Muy clara y concreta en todo momento. Utiliza analogías intuitivas, define términos en lenguaje sencillo y vincula los puntos conceptuales directamente con el comportamiento y el rendimiento de las consultas.

Correccion

Peso 25%

Técnicamente más sólida y con más matices. Explica con precisión la selectividad, los escaneos de rango, los costos de recuperación después de la búsqueda de índice, las columnas envueltas en funciones que afectan el uso del índice y el comportamiento de los índices compuestos.

Adecuacion al publico

Peso 20%

Excelente ajuste para alguien con experiencia básica en SQL. Se mantiene accesible al tiempo que preserva matices importantes, ayudando al lector a desarrollar intuición práctica sin abrumarlo.

Integridad

Peso 15%

Cubre todos los temas requeridos con solidez. Incluye múltiples ejemplos realistas, orientación práctica para la toma de decisiones, compensaciones, conceptos de árboles B y una sólida explicación de índices compuestos.

Estructura

Peso 10%

Bien organizada con secciones numeradas y ejemplos, aunque ligeramente más densa y menos pulida en su fluidez que la presentación de la Respuesta A.

Resumen comparativo

Para cada tarea y discusion, el orden final se decide por agregacion de rangos por evaluador (rango promedio + desempate Borda). La puntuacion media se muestra como referencia.

Evaluadores: 3

Google Gemini 2.5 Flash-Lite

Votos ganadores

0 / 3

Puntuacion media

Ver esta respuesta

Ganador OpenAI GPT-5.2

Votos ganadores

3 / 3

Puntuacion media

Ver esta respuesta

Ver historial total de esta pareja de modelos

Resultados de evaluacion

Modelos evaluadores OpenAI GPT-5.4

Gemini 2.5 Flash-Lite 85

GPT-5.2 Ganador 91

Motivo del ganador

La respuesta B gana porque obtiene una puntuación más alta en los criterios ponderados más importantes: claridad, corrección y adecuación a la audiencia. Ambas respuestas son sólidas y completas, pero la B proporciona una guía técnica más precisa, mejores advertencias del mundo real sobre el uso de índices y la selectividad, ejemplos prácticos más sólidos y una explicación más clara de los índices compuestos y el orden de las columnas. Dada la ponderación, la mayor corrección y claridad práctica de la B la convierten en la mejor respuesta general.

Modelos evaluadores Google Gemini 2.5 Flash

Gemini 2.5 Flash-Lite 92

GPT-5.2 Ganador 94

Motivo del ganador

La Respuesta B gana debido a sus puntuaciones ligeramente más altas en corrección, completitud, claridad y estructura, que son criterios de gran peso. Si bien la Respuesta A fue excelente en adecuación a la audiencia y claridad general, la Respuesta B proporcionó una explicación más sólida y matizada, incluyendo ejemplos prácticos adicionales e información importante como la cobertura de índices, lo que mejora su valor general y precisión para la audiencia objetivo. Las subsecciones estructuradas dentro de cada punto principal también contribuyen a su superior claridad y organización.

Modelos evaluadores Anthropic Claude Opus 4.6

Gemini 2.5 Flash-Lite 73

GPT-5.2 Ganador 78

Motivo del ganador

La respuesta B gana porque proporciona una mayor profundidad técnica y precisión, al tiempo que se mantiene accesible, incluye ejemplos de consultas más realistas y variados (tres en lugar de dos), cubre conceptos importantes adicionales como los índices de cobertura y las limitaciones de los índices funcionales, y ofrece una orientación práctica más útil. En el criterio más ponderado (Claridad, 30%), ambas respuestas funcionan bien, pero la respuesta B se adelanta en Corrección (25%) con sus detalles técnicos más precisos y en Adecuación a la audiencia (20%) al lograr un mejor equilibrio entre accesibilidad y precisión. La respuesta B también obtiene una puntuación más alta en Completitud (15%) debido a sus ejemplos y conceptos adicionales.

Explique la indexación de bases de datos a un desarrollador junior

Resumen de la tarea

Enunciado de la tarea

Respuestas

Respuesta A: Google Gemini 2.5 Flash-Lite

1. ¿Qué es un Índice de Base de Datos y Por Qué Existe?

1. ¿Qué es un Índice de Base de Datos y Por Qué Existe?

2. Cómo Funciona un Índice B-Tree Básico (Conceptualmente)

3. Las Compensaciones del Indexado

4. Guía Práctica: ¿Qué Columnas Indexar?

5. Índices Compuestos (Multi-columna)

Respuesta B: OpenAI GPT-5.2

Resumen comparativo

Resultados de evaluacion

Tareas relacionadas

Diseñar un servicio de acortamiento de URL

Persuadir a una junta escolar escéptica de que adopte un horario de inicio más tarde para las escuelas secundarias

Explicar la paradoja del Barco de Teseo en la filosofía de la identidad

Implementar una caché LRU concurrente sin bloqueo

Evaluación de opciones de transporte para una ciudad de tamaño medio

Responder a un amigo que acaba de perder su trabajo

Usos innovadores para baterías retiradas de vehículos eléctricos

Escribe una cadena de correos electrónicos de oficina humorística sobre una grapadora perdida

Enlaces relacionados