Expliquer l'indexation des bases de données à un développeur junior

Comparez les réponses des modèles pour cette tâche de benchmark en Explication et consultez scores, commentaires et exemples liés.

Connectez-vous ou inscrivez-vous pour utiliser les likes et favoris. Inscription

X f L

Sommaire

Vue d ensemble de la tache

Genres de comparaison

Explication

Modele createur de la tache Le modele createur de la tache est selectionne aleatoirement parmi les principaux modeles de generation de taches des fournisseurs pris en charge.

Anthropic Claude Opus 4.6

Modeles participants Dans ce benchmark, les modeles du meme fournisseur que le createur de la tache sont exclus de la reponse.

Reponse A Google Gemini 2.5 Flash-Lite

Reponse B OpenAI GPT-5.2

Modeles evaluateurs L evaluation utilise exactement 3 modeles evaluateurs, en excluant les modeles repondants. Au moins 1 evaluateur est choisi parmi les modeles superieurs, les modeles legers ne sont pas utilises comme evaluateurs, et les 3 evaluateurs proviennent de 3 fournisseurs distincts.

OpenAI GPT-5.4 Anthropic Claude Opus 4.6 Google Gemini 2.5 Flash

Consigne de la tache

Afficher plus ▼

Vous êtes un ingénieur logiciel senior encadrant un développeur junior qui écrit des requêtes SQL depuis environ six mois mais qui n'a jamais créé ni réfléchi aux index de base de données. Il/elle vient de se plaindre que ses requêtes sur une table contenant 10 millions de lignes sont très lentes. Rédigez une explication claire et structurée de l'indexation des bases de données pour ce public. Votre explication devrait couvrir : 1. Ce qu'est un index de base de données et pourquoi il existe, en utilisant au moins une analogie concrète qu'un débutant trouverait intuitive. 2. Comment fonctionne conceptuellement un index B-tree de base (pas besoin de détails algorithmiques complets, mais suffisamment pour que le lecteur comprenne pourquoi les recherches deviennent plus rapides). 3. Les compromis liés aux index — quand les index aident, quand ils nuisent et quels coûts ils introduisent. 4. Des conseils pratiques pour décider quelles colonnes indexer, incluant au moins deux exemples réalistes de requêtes et si/et comment elles bénéficieraient d'un index. 5. Une brève note sur les index composites (multi-colonnes) et pourquoi l'ordre des colonnes est important. Visez une explication à la fois complète et accessible — évitez le jargon inutile, mais ne simplifiez pas au point d'inexactitude. Le lecteur doit terminer votre explication en se sentant suffisamment confiant pour créer son premier index et raisonner sur son utilité.

Politique d evaluation

Afficher plus ▼

Une bonne réponse doit être évaluée selon les dimensions suivantes. Premièrement, la précision : toutes les affirmations techniques sur le fonctionnement des index, leurs compromis et la structure B-tree doivent être correctes et sans simplifications trompeuses. Deuxièmement, l'exhaustivité : les cinq sujets demandés doivent être traités avec une profondeur significative, et pas seulement mentionnés en passant. Troisièmement, la clarté et l'adéquation au public : l'explication doit être rédigée à un niveau adapté à un développeur junior ayant des connaissances SQL de base, en utilisant un langage simple, des analogies utiles et des exemples concrets plutôt que de la théorie abstraite. Quatrièmement, la valeur pratique : les exemples de requêtes et de décisions d'indexation doivent être réalistes et illustratifs, aidant le lecteur à acquérir une intuition qu'il pourra appliquer dans son travail. Cinquièmement, la discussion sur les index composites doit rendre correctement compte de l'importance de l'ordre des colonnes, idéalement avec un exemple. Les réponses trop brèves, techniquement inexactes ou mal adaptées au niveau (trop avancées ou trop simplistes) doivent être notées plus bas.

Reponses

Reponse A: Google Gemini 2.5 Flash-Lite

Salut !
J'entends dire que vous rencontrez des problèmes de performance avec vos requêtes sur cette grande table. C'est un problème très courant, et c'est exactement là que les index de base de données sont utiles. Décomposons ce qu'ils sont et comment ils peuvent aider.

1. Qu'est-ce qu'un index de base de données et pourquoi existe-t-il ?

Imaginez que vous ayez un livre énorme avec 10 millions d'entrées, et que vous deviez trouver un sujet spécifique. Sans index, vous devriez feuilleter chaque page, une par une, jusqu'à trouver ce que vous cherchiez. Cela prendrait très, très longtemps.

Un index de base d...

Afficher la reponse complete ▼

1. Qu'est-ce qu'un index de base de données et pourquoi existe-t-il ?

Un index de base de données est comme l'index à la fin de ce livre. C'est une structure de données séparée que le système de gestion de base de données (SGBD) maintient. Au lieu de scanner toute la table (ce qui revient à lire tout le livre), la base de données peut utiliser l'index pour localiser rapidement les lignes spécifiques qui vous intéressent. Il crée essentiellement une liste triée de valeurs provenant d'une ou plusieurs colonnes, avec des pointeurs vers les lignes réelles de la table où ces valeurs apparaissent.

Pourquoi existe-t-il ? Pour accélérer les opérations de récupération de données (comme les requêtes SELECT avec des clauses WHERE) et parfois les opérations ORDER BY et JOIN. Sans index, la base de données devrait effectuer un scan complet de la table pour de nombreuses requêtes, ce qui est incroyablement inefficace sur de grandes tables.

2. Comment fonctionne un index B-tree de base (conceptuellement)

La plupart des bases de données modernes utilisent une structure de données appelée B-tree (ou une de ses variantes) pour leurs index. Pensez à un B-tree comme à un arbre de recherche équilibré et multi-voies. Il est conçu pour stocker et récupérer efficacement les données, surtout lorsque ces données ne tiennent pas entièrement en mémoire et résident sur disque.

Voici une vue simplifiée :

Nœud racine : Le sommet de l'arbre. Il contient une plage de valeurs et des pointeurs vers les nœuds enfants.
Nœuds internes : Ces nœuds contiennent également des plages de valeurs et des pointeurs vers d'autres nœuds enfants.
Nœuds feuilles : Ils se trouvent en bas. Ils contiennent les valeurs indexées réelles et, surtout, des pointeurs (comme des identifiants de ligne ou des adresses physiques) vers les lignes correspondantes dans la table principale.

Lorsque vous recherchez une valeur (par exemple, WHERE user_id = 12345), la base de données commence au nœud racine. Elle compare votre valeur aux plages du nœud racine et suit le pointeur approprié vers le niveau suivant. Elle répète ce processus, en réduisant l'espace de recherche à chaque étape, jusqu'à atteindre un nœud feuille. Une fois qu'elle trouve la valeur dans le nœud feuille, elle utilise le pointeur associé pour sauter directement à la ou aux lignes correctes dans la table principale. C'est beaucoup plus rapide que de lire chaque ligne séquentiellement.

Parce que les B-trees sont équilibrés, la hauteur de l'arbre ne croît que très lentement, même lorsque le nombre d'entrées augmente. Cela signifie que la recherche d'une valeur prend un temps logarithmique (O(log n)), ce qui est considérablement plus rapide qu'un scan linéaire (O(n)) pour de grands ensembles de données.

3. Les compromis de l'indexation

Les index ne sont pas une solution miracle ; ils ont des coûts :

Espace de stockage : Chaque index est une structure de données séparée, il consomme donc de l'espace disque. Une table avec de nombreux index peut prendre beaucoup plus de place que la table elle-même.
Surcharge de performance d'écriture : Lorsque vous INSERT, UPDATE ou DELETE des lignes dans la table, la base de données doit également mettre à jour tous les index pertinents. Cela ralentit les opérations d'écriture. Plus vous avez d'index, plus la base de données a de travail à faire pour chaque écriture.
Surcharge de planification de requêtes : La base de données doit décider quel index (le cas échéant) utiliser pour une requête donnée. Ce processus de prise de décision (optimisation des requêtes) ajoute une légère surcharge.

Quand les index aident :

Requêtes qui filtrent les données à l'aide de clauses WHERE sur des colonnes indexées (par exemple, WHERE status = 'active').
Requêtes qui trient les données à l'aide de ORDER BY sur des colonnes indexées.
Requêtes qui joignent des tables sur des colonnes indexées.
Requêtes qui utilisent des colonnes indexées dans des clauses GROUP BY.

Quand les index nuisent (ou n'aident pas beaucoup) :

Requêtes qui scannent une grande partie de la table de toute façon (par exemple, WHERE age > 18 sur une table où la plupart des utilisateurs ont plus de 18 ans).
Tables avec très peu de lignes (la surcharge de l'utilisation d'un index peut être supérieure à un scan rapide).
Tables qui sont fortement axées sur l'écriture et rarement lues (le coût de maintenance des index peut l'emporter sur les avantages de lecture).
Indexation de colonnes avec une faible cardinalité (peu de valeurs distinctes), comme une colonne booléenne is_active, sauf si elle fait partie d'un index composite et que la requête la filtre spécifiquement.

4. Conseils pratiques : Quelles colonnes indexer ?

Voici quelques règles générales :

Colonnes utilisées dans les clauses WHERE : C'est le cas d'utilisation le plus courant et le plus efficace. Si vous filtrez fréquemment vos résultats par une colonne spécifique, indexez-la.
Colonnes utilisées dans les conditions JOIN : Lors de la jointure de deux tables, l'indexation des colonnes utilisées dans la clause ON (généralement des clés étrangères) sur les deux tables peut considérablement accélérer les jointures.
Colonnes utilisées dans les clauses ORDER BY et GROUP BY : L'indexation de celles-ci peut aider la base de données à éviter des opérations de tri coûteuses.
Colonnes à haute cardinalité : Les colonnes avec de nombreuses valeurs uniques (comme user_id, email, transaction_id) sont généralement de bons candidats pour l'indexation.
Évitez d'indexer tout : Soyez sélectif. Indexez uniquement les colonnes fréquemment utilisées dans les requêtes qui bénéficient de recherches plus rapides.

Exemples réalistes :

Supposons que vous ayez une table users avec 10 millions de lignes, et qu'elle contienne des colonnes comme user_id (clé primaire), email, username, created_at, last_login et status.

Requête 1 : SELECT * FROM users WHERE email = 'test@example.com';
- Avantage : Élevé. La colonne email est probablement unique ou a peu de doublons, et elle est utilisée dans une clause WHERE pour une correspondance exacte. La création d'un index sur email permettrait à la base de données de trouver rapidement la ou les lignes spécifiques sans scanner toute la table.
Requête 2 : SELECT username, last_login FROM users WHERE status = 'pending' ORDER BY created_at DESC LIMIT 10;
- Avantage : Modéré à élevé.
  - Un index sur status aiderait à trouver rapidement tous les utilisateurs 'pending'.
  - Un index sur created_at aiderait pour la clause ORDER BY, évitant potentiellement un tri.
  - Un index composite (voir ci-dessous) sur (status, created_at) pourrait être encore meilleur, car il pourrait potentiellement satisfaire efficacement les clauses WHERE et ORDER BY.

Comment décider :

Analysez vos requêtes lentes : Utilisez les outils de votre base de données (comme EXPLAIN ou EXPLAIN ANALYZE dans PostgreSQL/MySQL) pour voir si les requêtes effectuent des scans complets de table. Si c'est le cas, et que les clauses WHERE ou ORDER BY impliquent des colonnes spécifiques, ce sont des candidats de choix pour l'indexation.
Considérez vos données : Indexez les colonnes qui sont fréquemment interrogées pour égalité (=), plage (>, <, BETWEEN), ou tri (ORDER BY).
Surveillez les performances : Après avoir ajouté un index, vérifiez si les performances des requêtes se sont améliorées. Surveillez également les performances d'écriture et l'utilisation du disque.

5. Index composites (multi-colonnes)

Parfois, une requête filtre ou trie sur plusieurs colonnes. Un index composite est un index qui couvre deux colonnes ou plus.

Exemple : CREATE INDEX idx_user_status_created ON users (status, created_at);

Pourquoi l'ordre des colonnes est important :

L'ordre des colonnes dans un index composite est crucial. Un index sur (col1, col2) peut généralement être utilisé efficacement pour les requêtes filtrant uniquement sur col1, ou sur col1 et col2. Cependant, il n'est généralement pas aussi efficace pour les requêtes filtrant uniquement sur col2.

Pensez-y comme à un annuaire trié d'abord par ville, puis par nom de famille. Vous pouvez trouver rapidement toutes les personnes à 'Paris', et à l'intérieur, vous pouvez trouver 'Dupont'. Mais si vous voulez seulement trouver 'Dupont' dans toutes les villes, l'index n'est pas aussi utile car il n'est pas principalement trié par nom de famille.

Donc, lors de la création d'index composites, placez en premier les colonnes les plus fréquemment utilisées pour le filtrage (en particulier les vérifications d'égalité), suivies des colonnes utilisées pour le tri ou les vérifications de plage.

En résumé :

Les index sont des outils puissants pour accélérer les lectures de base de données. Ils fonctionnent en créant des structures de données triées qui permettent à la base de données de trouver les données beaucoup plus rapidement qu'en scannant toute la table. Cependant, ils ont un coût en termes de stockage et de performance d'écriture. La clé est d'être stratégique : indexez les colonnes utilisées dans les clauses WHERE, JOIN et ORDER BY, en particulier celles avec une cardinalité élevée, et utilisez des outils comme EXPLAIN pour guider vos décisions. Commencez par indexer les colonnes de vos requêtes les plus lentes, et considérez toujours les compromis.

N'hésitez pas à essayer de créer un index sur votre colonne email et voyez à quel point cette requête devient plus rapide ! Faites-moi savoir si vous avez d'autres questions.

Resultat

Votes gagnants

0 / 3

Score moyen

Modeles evaluateurs Anthropic Claude Opus 4.6

Score total

Commentaire global

La réponse A est une explication complète et bien structurée qui couvre les cinq sujets requis. Elle utilise un ton amical et de mentorat, approprié pour un développeur junior. L'analogie de l'index de livre est claire, l'explication de l'arbre B est exacte, les compromis sont bien organisés avec des listes utiles, et la section sur les index composites comprend l'excellente analogie de l'annuaire téléphonique. Les deux exemples de requêtes sont réalistes et bien expliqués. Cependant, elle tend parfois à être légèrement verbeuse sans ajouter une profondeur proportionnelle. Certaines nuances techniques manquent, telles que la distinction entre arbre B et arbre B+, le concept d'index couvrants et l'impact des fonctions sur l'utilisation des index. La recommandation d'indexer « tout ce qui se trouve dans les clauses WHERE » pourrait être plus nuancée.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

La réponse A est clairement rédigée avec un ton amical et conversationnel. L'analogie du livre et l'analogie de l'annuaire téléphonique pour les index composites sont intuitives. L'utilisation d'en-têtes, de texte en gras et de listes à puces facilite la lecture. Parfois verbeux sans gain d'information proportionnel.

Exactitude

Poids 25%

Techniquement exact sur les concepts de base. L'explication de l'arbre B est correcte au niveau conceptuel. La section sur les compromis est exacte. Cependant, elle ne distingue pas l'arbre B de l'arbre B+, ne mentionne pas les limitations des index fonctionnels, et l'affirmation selon laquelle les colonnes booléennes à faible cardinalité sont de mauvais candidats pour les index est quelque peu simplifiée sans contexte.

Adequation au public

Poids 20%

Excellent adéquation à l'audience avec un ton chaleureux et de mentorat. L'ouverture et la clôture conversationnelles créent une atmosphère de soutien. Les analogies sont bien choisies pour les débutants. Peut-être un peu trop informel par endroits, mais globalement bien adapté à un développeur junior avec 6 mois d'expérience SQL.

Completude

Poids 15%

Couvre les cinq sujets requis avec une profondeur raisonnable. Deux exemples de requêtes réalistes sont fournis. Cependant, il manque certains concepts précieux : les index couvrants, les limitations des index fonctionnels, et la règle du préfixe le plus à gauche n'est couverte qu'implicitement. La section sur les index composites, bien que correcte, pourrait être plus approfondie.

Structure

Poids 10%

Bien organisé avec des en-têtes clairs correspondant aux cinq sections requises. Bonne utilisation des listes à puces, du texte en gras et du formatage de code. La section de résumé relie bien le tout. Flux logique du concept à la pratique.

Modeles evaluateurs Google Gemini 2.5 Flash

Score total

Commentaire global

La réponse A fournit une explication très claire, conversationnelle et bien structurée de l'indexation de base de données. Ses analogies sont intuitives et elle couvre tous les points requis avec une bonne profondeur. Les conseils pratiques et l'explication des index composites sont solides, ce qui la rend très adaptée à un développeur junior. Elle adopte avec succès un ton de mentorat.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

La réponse A est très claire et utilise un ton engageant et conversationnel avec d'excellentes analogies qui facilitent la compréhension.

Exactitude

Poids 25%

Toutes les affirmations techniques de la réponse A sont exactes et exemptes de simplifications trompeuses.

Adequation au public

Poids 20%

L'ouverture conversationnelle de la réponse A et son ton de mentorat constant sont parfaitement adaptés à un développeur junior, ce qui la rend très accessible.

Completude

Poids 15%

La réponse A couvre en profondeur les cinq points demandés avec une bonne profondeur et des détails.

Structure

Poids 10%

La réponse A est bien structurée avec des titres clairs qui correspondent directement aux exigences de l'invite, et elle comprend une bonne introduction et un bon résumé.

Modeles evaluateurs OpenAI GPT-5.4

Score total

Commentaire global

La réponse A est claire, bien structurée et couvre tous les sujets demandés avec un ton amical orienté débutant. Elle explique bien l'analogie du livre et de l'index, donne une description globalement exacte des arbres B, discute des compromis essentiels et inclut des conseils pratiques sur l'indexation ainsi qu'une explication utilisable des index composites. Ses principales faiblesses sont que certains conseils sont un peu généralisés, quelques affirmations sont formulées de manière trop générale et les exemples pratiques sont moins nuancés qu'ils pourraient l'être pour la planification de requêtes dans le monde réel.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

Claire et lisible, avec une bonne analogie du livre et des explications majoritairement en langage clair. Certaines sections sont un peu verbeuses et génériques, et les exemples pourraient être plus directement liés à la prise de décision.

Exactitude

Poids 25%

Globalement exacte sur ce que font les index, les bases des arbres B et les compromis. Quelques affirmations sont quelque peu générales ou simplifiées, comme la généralisation des avantages pour GROUP BY et JOIN sans suffisamment de mises en garde.

Adequation au public

Poids 20%

Bien adaptée à un développeur junior, avec un ton accessible et un jargon inutile minimal. Elle est amicale et facile à aborder, bien que parfois légèrement scolaire.

Completude

Poids 15%

Aborde les cinq domaines demandés avec des détails significatifs, y compris les compromis, les exemples et les index composites. Elle répond bien à la consigne, bien que certains domaines mériteraient une nuance pratique légèrement plus approfondie.

Structure

Poids 10%

Très bien organisée autour des exigences numérotées de la consigne, ce qui la rend facile à suivre du début à la fin.

Reponse B: OpenAI GPT-5.2

Qu'est-ce qu'un index (et pourquoi il existe)
Un index est une structure de données supplémentaire que la base de données maintient pour trouver les lignes plus rapidement. Au lieu d'analyser chaque ligne d'une table de 10 millions de lignes pour localiser celles que vous souhaitez, la base de données peut utiliser l'index pour accéder directement aux lignes correspondantes.

Analogie intuitive :

Imaginez un énorme livre (votre table). Si vous voulez toutes les pages qui mentionnent « index », vous pourriez parcourir chaque page (scan complet de la table). Cela fonctionne, mais c'est lent.
L'index d'un liv...

Afficher la reponse complete ▼

Qu'est-ce qu'un index (et pourquoi il existe)
Un index est une structure de données supplémentaire que la base de données maintient pour trouver les lignes plus rapidement. Au lieu d'analyser chaque ligne d'une table de 10 millions de lignes pour localiser celles que vous souhaitez, la base de données peut utiliser l'index pour accéder directement aux lignes correspondantes.

Analogie intuitive :

Imaginez un énorme livre (votre table). Si vous voulez toutes les pages qui mentionnent « index », vous pourriez parcourir chaque page (scan complet de la table). Cela fonctionne, mais c'est lent.
L'index d'un livre (ou la table des matières) est une recherche plus petite et organisée qui vous indique exactement quelles pages consulter. Vous passez un peu de temps à consulter l'index, puis vous accédez directement aux pages pertinentes.

C'est pourquoi les index existent : pour éviter de lire toute la table lorsque vous n'avez besoin que d'un petit sous-ensemble.

Comment fonctionne un index B-tree de base (conceptuellement)
La plupart des bases de données relationnelles courantes utilisent une structure B-tree (ou B+tree) pour les index standard.

Image conceptuelle :

L'index stocke les valeurs des colonnes indexées par ordre trié.
À côté de chaque valeur, il stocke un « pointeur » vers l'emplacement de la ligne réelle (ou, selon la base de données, un identifiant de ligne / clé primaire qui peut être utilisé pour récupérer la ligne).
Les valeurs sont organisées en arbre équilibré : une petite page « racine » pointe vers des pages intermédiaires, qui pointent vers des pages feuilles.

Pourquoi c'est rapide :

Si les valeurs sont triées, vous n'avez pas besoin de vérifier chaque ligne. Vous pouvez effectuer un parcours « similaire à une recherche binaire ».
Avec un B-tree, la base de données lit quelques pages d'index pour naviguer de la racine → branche → feuille.
Une fois qu'elle atteint la bonne page feuille, elle peut :
- Trouver rapidement la ou les clés exactes, et
- Pour les requêtes de plage (par exemple, dates entre X et Y), parcourir efficacement les pages feuilles adjacentes.

En termes de Big O (intuition approximative) :

Scan complet : le travail croît à peu près linéairement avec le nombre de lignes.
Recherche B-tree : le travail croît à peu près avec log(nombre de lignes). Avec des millions de lignes, cette différence est énorme.

Détail important : un index accélère la « recherche des lignes correspondantes », mais la base de données peut toujours avoir besoin de récupérer les données réelles de la ligne à partir de la table. Si votre requête nécessite de nombreuses colonnes qui ne sont pas présentes dans l'index, elle peut effectuer de nombreuses lectures aléatoires pour récupérer les lignes complètes.

Compromis : quand les index aident, quand ils nuisent, et ce qu'ils coûtent
Les index ne sont pas gratuits. Ce sont des structures supplémentaires qui doivent être stockées et maintenues synchronisées.

Ils aident le plus quand :

Vous filtrez sur une colonne avec une condition sélective (vous retournez une petite fraction de la table), par exemple, WHERE user_id = 123, WHERE email = 'x', WHERE created_at >= ... AND created_at < ... .
Vous joignez des tables sur une clé (recherches de clés étrangères), par exemple, orders.user_id = users.id.
Vous triez/limitez d'une manière qui correspond à un index, par exemple, ORDER BY created_at DESC LIMIT 50.

Ils aident moins (ou pas du tout) quand :

Vous retournez de toute façon une grande partie de la table (par exemple, 40 à 80 % des lignes). L'analyse séquentielle de la table peut être moins coûteuse que de passer par l'index puis de récupérer de nombreuses lignes.
Le filtre a une faible sélectivité (peu de valeurs distinctes), par exemple, status IN ('ACTIVE','INACTIVE') sur une table où 90 % sont ACTIVE. Un index peut ne pas réduire beaucoup le travail.
Vous appliquez des fonctions à la colonne d'une manière qui empêche l'utilisation de l'index, par exemple, WHERE LOWER(email) = 'a@b.com' (sauf si vous avez un index fonctionnel ou une forme normalisée stockée).

Coûts introduits par les index :

Stockage : l'index peut être volumineux, surtout sur des colonnes larges ou plusieurs colonnes.
Écritures plus lentes : INSERT/UPDATE/DELETE doivent également mettre à jour l'index. Plus d'index = plus de surcharge d'écriture.
Surcharge de maintenance : les index peuvent devenir fragmentés/gonflés ; les statistiques doivent être mises à jour ; la base de données doit choisir parmi les index.

Règle générale : les index échangent de l'espace supplémentaire et des écritures plus lentes contre des lectures plus rapides.

Conseils pratiques : choisir les colonnes à indexer
Pensez à partir de la charge de travail :
A) Examinez vos requêtes les plus importantes/lentes

Identifiez les filtres WHERE, les conditions JOIN et les modèles ORDER BY/GROUP BY.
Confirmez avec l'outil de plan de votre base de données (par exemple, EXPLAIN / EXPLAIN ANALYZE) s'il effectue un scan de table.

B) Préférez indexer les colonnes qui sont :

Fréquemment utilisées pour filtrer (WHERE) ou joindre (ON)
De cardinalité relativement élevée (beaucoup de valeurs distinctes), de sorte que l'index réduise efficacement les résultats
Utilisées dans des requêtes de plage ou de tri (dates/horodatages, plages numériques)

C) Évitez (ou soyez prudent avec) l'indexation des colonnes qui sont :

Rarement utilisées dans les requêtes
De très faible cardinalité et non combinées avec une autre colonne
Mises à jour extrêmement fréquemment (les index augmentent le coût de mise à jour)

Deux exemples de requêtes réalistes
Exemple 1 : Recherche d'égalité sur une colonne à haute cardinalité
Requête :
SELECT *
FROM users
WHERE email = 'ana@example.com';

Situation :

users a 10 millions de lignes ; l'email est unique.
Sans index, la base de données peut analyser toutes les lignes pour trouver la correspondance.

Recommandation d'index :

Créez un index unique (ou au moins un index normal) sur users(email).
Pourquoi cela aide :
Le B-tree peut localiser rapidement la valeur d'email exacte et accéder à la ligne.
C'est l'un des meilleurs cas d'utilisation pour un index.

Exemple 2 : Filtre de plage + tri + limite
Requête :
SELECT id, user_id, total, created_at
FROM orders
WHERE created_at >= '2026-01-01'
AND created_at < '2026-02-01'
ORDER BY created_at DESC
LIMIT 100;

Recommandation d'index :

Indexez orders(created_at) (éventuellement en ordre décroissant selon le support de la base de données ; de nombreuses bases de données peuvent parcourir un B-tree en arrière de toute façon).
Pourquoi cela aide :
L'index est trié par created_at, de sorte que la base de données peut accéder à la plage de dates pertinente.
Il peut produire les lignes déjà dans le bon ordre et s'arrêter après 100 lignes, évitant ainsi d'analyser un mois de données (ou pire, toute la table).

Exemple 3 (axé sur la jointure) : recherche de clé étrangère
Requête :
SELECT o.id, o.total
FROM orders o
WHERE o.user_id = 123
ORDER BY o.created_at DESC
LIMIT 50;

Recommandation d'index :

Un index composite sur orders(user_id, created_at) est souvent idéal (plus d'informations sur les index composites ci-dessous).
Pourquoi cela aide :
La base de données peut trouver rapidement les lignes pour user_id = 123, déjà regroupées dans l'index, puis les lire dans l'ordre created_at pour satisfaire ORDER BY/LIMIT efficacement.

Une note sur la « couverture »
Si vous sélectionnez fréquemment seulement quelques colonnes, certaines bases de données peuvent utiliser un scan d'index uniquement si l'index contient toutes les colonnes nécessaires (ou peut inclure des colonnes supplémentaires). Cela réduit les recherches de table. Mais n'indexez pas trop pour tout couvrir ; mesurez d'abord.

Index composites (multi-colonnes) et pourquoi l'ordre des colonnes est important
Un index composite indexe des tuples de colonnes dans un ordre spécifique, comme (user_id, created_at). Conceptuellement, il est trié d'abord par user_id, et au sein de chaque user_id, trié par created_at.

Pourquoi l'ordre est important (l'idée du préfixe le plus à gauche) :

Un index sur (user_id, created_at) peut efficacement prendre en charge :
- WHERE user_id = ?
- WHERE user_id = ? AND created_at >= ?
- ORDER BY created_at (lorsque user_id est fixe), car au sein d'un user_id donné, les lignes sont déjà triées par created_at
Mais il ne peut généralement pas prendre en charge efficacement :
- WHERE created_at >= ? (sans user_id), car created_at n'est pas la clé de tri principale ; l'index est principalement organisé par user_id.

Comment choisir l'ordre :

Placez le filtre principal le plus sélectif et le plus couramment utilisé en premier (souvent une condition d'égalité comme user_id = ?).
Placez ensuite les colonnes de plage/tri (created_at pour les plages de dates et le tri).

Prochaines étapes (pratiques)

Choisissez une requête lente.
Exécutez EXPLAIN/EXPLAIN ANALYZE et confirmez qu'elle effectue un scan complet de la table ou un tri coûteux.
Ajoutez l'index le plus petit et le plus pertinent (souvent sur une colonne WHERE/JOIN ; envisagez un index composite si la requête filtre + trie).
Réexécutez EXPLAIN ANALYZE et mesurez la latence avant/après.

Si vous partagez l'une de vos requêtes lentes (ainsi que le schéma de la table + la base de données que vous utilisez), vous pouvez obtenir une recommandation d'index très concrète et comment la valider avec le plan de requête.

Resultat

#1 | Gagnant

Votes gagnants

3 / 3

Score moyen

Modeles evaluateurs Anthropic Claude Opus 4.6

Score total

Commentaire global

La réponse B est complète, techniquement précise et très pratique. Elle couvre les cinq sujets avec une profondeur significative et inclut trois exemples de requêtes au lieu du minimum requis de deux, chacun illustrant un scénario d'indexation différent (égalité, plage+tri, jointure+composite). Elle distingue correctement B-tree de B+tree, mentionne les index fonctionnels, les index couvrants et la règle du préfixe le plus à gauche avec des exemples concrets. La section des étapes pratiques à la fin donne des actions concrètes à entreprendre. Le ton est légèrement plus technique que la réponse A mais reste accessible à un développeur junior. L'explication des cas où les index nuisent inclut le détail important sur les fonctions empêchant l'utilisation des index. La section sur les index composites est particulièrement solide avec des exemples clairs de requêtes que l'index peut ou ne peut pas supporter.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

La réponse B est également clairement rédigée avec une bonne utilisation de la structure et des exemples concrets. Les explications sont précises et bien organisées. Légèrement plus dense que A mais toujours très lisible. Les instructions pratiques étape par étape à la fin sont particulièrement claires.

Exactitude

Poids 25%

Plus techniquement précise tout au long. Note correctement la variante B+tree, mentionne les limitations des index fonctionnels (WHERE LOWER(email)), explique les index couvrants et décrit avec précision la règle du préfixe le plus à gauche. La discussion sur la sélectivité est plus nuancée. La note sur les lectures aléatoires lors de la récupération de colonnes non indexées ajoute une précision importante.

Adequation au public

Poids 20%

Bonne adéquation à l'audience, respectant l'intelligence du développeur junior tout en restant accessible. Ton légèrement plus technique que A, ce qui pourrait être marginalement moins accessible pour certains débutants. Cependant, les exemples pratiques et les instructions étape par étape à la fin sont très bien adaptés à l'audience. L'offre d'aide pour des requêtes spécifiques est une belle touche.

Completude

Poids 15%

Couvre les cinq sujets requis avec une excellente profondeur. Fournit trois exemples de requêtes réalistes couvrant différents scénarios (égalité, plage+tri, jointure+composite). Couvre en outre les index couvrants, les limitations des index fonctionnels, la règle du préfixe le plus à gauche explicitement, et fournit des prochaines étapes pratiques concrètes. Va significativement au-delà des exigences minimales.

Structure

Poids 10%

Bien organisé avec des sections numérotées claires correspondant aux cinq sujets requis. Bonne utilisation de sous-titres, de listes à puces et de blocs de code. La section supplémentaire 'Que faire ensuite' est un ajout structurel précieux. Progression logique de la théorie à la pratique.

Modeles evaluateurs Google Gemini 2.5 Flash

Score total

Commentaire global

La réponse B offre une explication exceptionnellement claire, correcte et complète de l'indexation de base de données. Elle excelle dans la fourniture de conseils pratiques avec de multiples exemples réalistes et ajoute des nuances précieuses comme la couverture des index sans surcompliquer le sujet. Son approche structurée et sa précision technique légèrement plus approfondie en font une réponse remarquable, offrant un guide très robuste et pratique pour un développeur junior.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

La réponse B est exceptionnellement claire, avec un langage précis et des explications bien structurées, en particulier pour le mécanisme B-tree et les compromis. L'utilisation de sous-sections au sein des points améliore la lisibilité.

Exactitude

Poids 25%

La réponse B est très précise, fournissant des détails techniques corrects et incluant des nuances précieuses telles que le concept d'index 'couvrants' et l'impact des fonctions sur l'utilisation des index, sans surcompliquer l'explication.

Adequation au public

Poids 20%

La réponse B est très bien adaptée à un développeur junior, maintenant un ton accessible tout en fournissant des informations complètes et pratiques. Elle est légèrement moins conversationnelle que A mais tout aussi efficace dans sa présentation.

Completude

Poids 15%

La réponse B couvre de manière exhaustive les cinq points demandés et ajoute une valeur supplémentaire avec un troisième exemple de requête pratique et une note brève et pertinente sur les index 'couvrants', améliorant ainsi sa complétude globale.

Structure

Poids 10%

La réponse B est exceptionnellement bien structurée. Elle utilise des titres clairs et organise davantage l'information avec des sous-sections au sein de chaque point, ce qui la rend très facile à suivre. La section 'Prochaines étapes' constitue une excellente conclusion pratique.

Modeles evaluateurs OpenAI GPT-5.4

Score total

Commentaire global

La réponse B est très claire, techniquement solide et particulièrement pratique pour un développeur junior. Elle explique l'indexation avec des analogies intuitives, donne un modèle conceptuel plus précis du comportement des arbres B, couvre les compromis importants avec plus de nuance et offre des exemples de requêtes réalistes directement liés aux recommandations d'index. Son explication des index composites est particulièrement forte car elle transmet clairement le comportement du préfixe le plus à gauche et pourquoi l'ordre est important. La réponse est légèrement moins soignée dans sa présentation que la réponse A, mais dans l'ensemble, elle est plus informative et exploitable.

Afficher le detail de l evaluation ▼

Clarte

Poids 30%

Très claire et concrète tout au long. Elle utilise des analogies intuitives, définit les termes en langage simple et relie les points conceptuels directement au comportement et aux performances des requêtes.

Exactitude

Poids 25%

Techniquement plus solide et plus nuancée. Elle explique avec précision la sélectivité, les scans de plage, les coûts de récupération après une recherche d'index, les colonnes encapsulées dans des fonctions affectant l'utilisation de l'index et le comportement des index composites.

Adequation au public

Poids 20%

Excellent pour quelqu'un ayant une expérience SQL de base. Elle reste accessible tout en préservant une nuance importante, aidant le lecteur à développer une intuition pratique sans le submerger.

Completude

Poids 15%

Couvre chaque sujet requis avec une profondeur solide. Elle inclut plusieurs exemples réalistes, des conseils de décision pratiques, des compromis, des concepts d'arbres B et une explication solide des index composites.

Structure

Poids 10%

Bien organisée avec des sections numérotées et des exemples, bien que légèrement plus dense et moins soignée dans le flux que la présentation de la réponse A.

Resume comparatif

Pour chaque tache et discussion, le classement final est determine par agregation des rangs par evaluateur (rang moyen + departage Borda). Le score moyen est affiche a titre indicatif.

Evaluateurs: 3

Google Gemini 2.5 Flash-Lite

Votes gagnants

0 / 3

Score moyen

Voir cette reponse

Gagnant OpenAI GPT-5.2

Votes gagnants

3 / 3

Score moyen

Voir cette reponse

Voir le bilan global de cette paire de modeles

Resultats de l evaluation

Modeles evaluateurs OpenAI GPT-5.4

Gemini 2.5 Flash-Lite 85

GPT-5.2 Gagnant 91

Raison du gagnant

La réponse B l'emporte car elle obtient de meilleurs scores sur les critères pondérés les plus importants : clarté, exactitude et adéquation au public. Les deux réponses sont solides et complètes, mais B fournit des conseils techniques plus précis, de meilleures mises en garde pratiques sur la sélectivité et l'utilisation des index, des exemples pratiques plus solides et une explication plus claire des index composites et de l'ordre des colonnes. Compte tenu de la pondération, l'exactitude et la clarté pratique plus fortes de B en font la meilleure réponse globale.

Modeles evaluateurs Google Gemini 2.5 Flash

Gemini 2.5 Flash-Lite 92

GPT-5.2 Gagnant 94

Raison du gagnant

La réponse B l'emporte en raison de ses scores légèrement plus élevés en matière de correction, d'exhaustivité, de clarté et de structure, qui sont des critères fortement pondérés. Bien que la réponse A ait été excellente en termes d'adéquation au public et de clarté générale, la réponse B a fourni une explication plus robuste et nuancée, incluant des exemples pratiques supplémentaires et des détails importants tels que la couverture des index, ce qui améliore sa valeur globale et sa précision pour le public cible. Les sous-sections structurées au sein de chaque point principal contribuent également à sa clarté et à son organisation supérieures.

Modeles evaluateurs Anthropic Claude Opus 4.6

Gemini 2.5 Flash-Lite 73

GPT-5.2 Gagnant 78

Raison du gagnant

La réponse B l'emporte car elle offre une plus grande profondeur technique et une meilleure précision tout en restant accessible, inclut des exemples de requêtes plus réalistes et variés (trois au lieu de deux), couvre des concepts importants supplémentaires tels que les index de couverture et les limitations des index fonctionnels, et propose des conseils pratiques plus exploitables. Sur le critère le plus pondéré (Clarté, 30%), les deux réponses sont performantes, mais la réponse B prend l'avantage sur la Correction (25%) grâce à ses détails techniques plus précis et sur l'Adéquation au public (20%) en trouvant un meilleur équilibre entre accessibilité et précision. La réponse B obtient également un meilleur score en Complétude (15%) en raison de ses exemples et concepts supplémentaires.

Expliquer l'indexation des bases de données à un développeur junior

Vue d ensemble de la tache

Consigne de la tache

Reponses

Reponse A: Google Gemini 2.5 Flash-Lite

1. Qu'est-ce qu'un index de base de données et pourquoi existe-t-il ?

1. Qu'est-ce qu'un index de base de données et pourquoi existe-t-il ?

2. Comment fonctionne un index B-tree de base (conceptuellement)

3. Les compromis de l'indexation

4. Conseils pratiques : Quelles colonnes indexer ?

5. Index composites (multi-colonnes)

Reponse B: OpenAI GPT-5.2

Resume comparatif

Resultats de l evaluation

Taches liees

Concevoir un service de raccourcissement d'URL

Convaincre un conseil scolaire sceptique d'adopter un horaire de début plus tardif pour les lycées

Expliquez le paradoxe du navire de Thésée en philosophie de l'identité

Implémenter un cache LRU concurrent sans verrou global

Évaluation des options de transport pour une ville de taille moyenne

Répondre à un ami qui vient de perdre son emploi

Usages innovants pour les batteries de véhicules électriques mises hors service

Rédiger une chaîne d'e-mails de bureau humoristique au sujet d'une agrafeuse disparue

Liens associes