Implémenter un résolveur de dépendances de paquets

Comparez les réponses des modèles pour cette tâche de benchmark en Programmation et consultez scores, commentaires et exemples liés.

Connectez-vous ou inscrivez-vous pour utiliser les likes et favoris. Inscription

X f L

Sommaire

Vue d ensemble de la tache

Genres de comparaison

Programmation

Modele createur de la tache Le modele createur de la tache est selectionne aleatoirement parmi les principaux modeles de generation de taches des fournisseurs pris en charge.

Google Gemini 2.5 Pro

Modeles participants Dans ce benchmark, les modeles du meme fournisseur que le createur de la tache sont exclus de la reponse.

Reponse A OpenAI GPT-5 mini

Reponse B Anthropic Claude Sonnet 4.6

Modeles evaluateurs L evaluation utilise exactement 3 modeles evaluateurs, en excluant les modeles repondants. Au moins 1 evaluateur est choisi parmi les modeles superieurs, les modeles legers ne sont pas utilises comme evaluateurs, et les 3 evaluateurs proviennent de 3 fournisseurs distincts.

OpenAI GPT-5.2 Anthropic Claude Opus 4.6 Google Gemini 2.5 Flash

Consigne de la tache

Afficher plus ▼

Écrivez une fonction Python `resolve(requirements, package_index)` qui implémente un algorithme de résolution de dépendances. La fonction doit prendre deux arguments : 1. `requirements` : une liste de chaînes, chaque chaîne étant une exigence initiale de paquet (par exemple, `["A>=1.2.0", "B"]`). 2. `package_index` : un dictionnaire représentant tous les paquets disponibles. Les clés sont les noms de paquets. Les valeurs sont des dictionnaires où les clés sont des chaînes de version (par ex. '1.2.3') et les valeurs sont des listes de chaînes d'exigences de dépendances pour cette version. Votre fonction doit retourner un dictionnaire mappant chaque nom de paquet requis (y compris les dépendances transitives) à une unique chaîne de version résolue qui satisfait toutes les contraintes. Ceci est souvent appelé un « lock file ». Votre algorithme doit pouvoir gérer les dépendances transitives et les conflits de version. Si un ensemble valide de paquets ne peut pas être trouvé, la fonction doit lever une `ValueError` avec un message clair expliquant le conflit. Pour simplifier, vous pouvez supposer : - Les versions suivent le versionnage sémantique (par ex. '1.2.3'). - Les spécificateurs d'exigences sont l'un des suivants : `==`, `!=`, `>=`, `<=`, `>`, `<`. Une exigence sans spécificateur (par ex. "B") implique qu'une quelconque version est acceptable. - Votre solution doit viser à sélectionner la version la plus récente possible de chaque paquet qui satisfait toutes les contraintes.

Informations complementaires

Afficher plus ▼

Dans le développement logiciel, les gestionnaires de paquets (comme pip, npm ou cargo) sont des outils essentiels. Un composant central de tout gestionnaire de paquets est le résolveur de dépendances. Son rôle est de trouver un ensemble de versions de paquets compatibles qui satisfont les dépendances directes et indirectes (transitives) du projet. C'est un problème complexe de satisfaction de contraintes. Une approche naïve peut facilement aboutir à des résultats incorrects ou à des boucles infinies (dans le cas de dépendances circulaires). Voici un exemple de `package_index` : ```python { "A": { "1.0.0": ["B<2.0.0"], "1.1.0": ["B<3.0.0"], "1.2.0": ["C==1.0.0"] }, "B": { "1.5.0": [], "2.5.0": [] }, "C": { "1.0.0": ["B>=2.0.0"], "1.1.0": [] } } ``` Par exemple, si les `requirements` initiaux sont `["A>=1.1.0"]`, un conflit existe : `A==1.1.0` requiert `B<3.0.0`, tandis que `A==1.2.0` requiert `C==1.0.0`, qui à son tour requiert `B>=2.0.0`. Si nous choisissons `A==1.2.0`, nous avons besoin de `C==1.0.0`, qui nécessite `B>=2.0.0`. La seule version de B qui satisfait cela est `B==2.5.0`. Cet ensemble (`A=1.2.0`, `C=1.0.0`, `B=2.5.0`) est une résolution valide. Votre fonction doit la trouver.

Politique d evaluation

Afficher plus ▼

Une bonne réponse doit fournir une implémentation correcte, efficace et robuste du résolveur de dépendances. 1. **Exactitude :** Le critère principal est de vérifier si la fonction retourne un ensemble valide et complet de dépendances qui satisfait toutes les contraintes pour des entrées solvables. Elle doit correctement identifier les entrées insolubles en levant une erreur appropriée. La solution doit privilégier la sélection des versions valides les plus récentes des paquets. 2. **Algorithme et efficience :** La solution doit utiliser un algorithme solide, tel qu'une recherche par backtracking avec mémoïsation ou une approche basée sur les graphes, pour explorer l'arborescence des dépendances. Une solution naïve et inefficace qui performerait mal sur des graphes modérément complexes est considérée de faible qualité. 3. **Gestion des erreurs :** Pour des exigences non résolubles, le message de `ValueError` doit être clair et utile, en identifiant idéalement les paquets spécifiques et les contraintes de version en conflit. 4. **Qualité du code et conception :** Le code doit être bien structuré, lisible et utiliser des structures de données appropriées. La logique de parsing des chaînes de version et des spécificateurs d'exigences doit être robuste et gérer correctement tous les opérateurs spécifiés. 5. **Cas limites :** La solution doit gérer avec élégance les cas limites, y compris les dépendances circulaires (sans entrer dans une boucle infinie), les requêtes pour des paquets inexistants et les entrées vides.

Reponses

Reponse A: OpenAI GPT-5 mini

def resolve(requirements, package_index):
"""
Résoudre les versions des paquets à partir des exigences initiales et d'un index de paquets.

requirements: liste de chaînes d'exigences comme "A>=1.2.0" ou "B"
package_index: dict de paquet -> { version_str: [chaînes d'exigences des dépendances] }

Retourne: dict mappant paquet -> chaîne de version résolue
Lève ValueError en cas de conflit avec explication.
"""
import copy
import re

OPS = ["==", "!=", ">=", "<=", ">", "<"]

def parse_version(v):
    # Analyser la version sémantique en tuple d'entiers (major, minor, pat...

Afficher la reponse complete ▼

def resolve(requirements, package_index):
"""
Résoudre les versions des paquets à partir des exigences initiales et d'un index de paquets.

requirements: liste de chaînes d'exigences comme "A>=1.2.0" ou "B"
package_index: dict de paquet -> { version_str: [chaînes d'exigences des dépendances] }

Retourne: dict mappant paquet -> chaîne de version résolue
Lève ValueError en cas de conflit avec explication.
"""
import copy
import re

OPS = ["==", "!=", ">=", "<=", ">", "<"]

def parse_version(v):
    # Analyser la version sémantique en tuple d'entiers (major, minor, patch, ...)
    parts = tuple(int(p) for p in v.split('.'))
    return parts

def version_cmp_key(v):
    return parse_version(v)

def parse_requirement(req):
    req = req.strip()
    # Trouver l'opérateur si présent
    for op in OPS:
        if op in req:
            name, ver = req.split(op, 1)
            name = name.strip()
            ver = ver.strip()
            return name, op, ver
    # Pas d'opérateur signifie n'importe quelle version
    name = req
    return name.strip(), None, None

def satisfies_one(ver_str, op, ver_req_str):
    if op is None:
        return True
    left = parse_version(ver_str)
    right = parse_version(ver_req_str)
    if op == '==':
        return left == right
    if op == '!=':
        return left != right
    if op == '>=':
        return left >= right
    if op == '<=':
        return left <= right
    if op == '>':
        return left > right
    if op == '<':
        return left < right
    return False

def satisfies_all(ver_str, constraints):
    # constraints: list of (op, ver_str) où op peut être None
    return all(satisfies_one(ver_str, op, vreq) for (op, vreq) in constraints)

# Construire le dictionnaire initial de contraintes : package -> liste de (op, ver)
constraints = {}

def add_constraint(constraints_map, pkg, op, ver):
    if pkg not in constraints_map:
        constraints_map[pkg] = []
    # Éviter les contraintes identiques en double
    if (op, ver) not in constraints_map[pkg]:
        constraints_map[pkg].append((op, ver))

# Initialiser à partir des exigences de niveau supérieur
for req in requirements:
    name, op, ver = parse_requirement(req)
    if name not in package_index:
        raise ValueError(f"Le paquet '{name}' est requis mais est introuvable dans l'index des paquets")
    add_constraint(constraints, name, op, ver)

# Helper pour calculer la liste des versions autorisées pour un paquet sous ses contraintes
def allowed_versions(pkg, constraints_map):
    if pkg not in package_index:
        raise ValueError(f"Le paquet '{pkg}' est introuvable dans l'index des paquets")
    cons = constraints_map.get(pkg, [])
    versions = list(package_index[pkg].keys())
    # Filtrer
    filtered = [v for v in versions if satisfies_all(v, cons)]
    # Trier par version descendante (la plus récente d'abord)
    filtered.sort(key=version_cmp_key, reverse=True)
    return filtered

# Recherche par backtracking
def search(resolved, constraints_map):
    # Si chaque paquet ayant des contraintes est résolu, on a terminé
    to_resolve = [p for p in constraints_map.keys() if p not in resolved]
    if not to_resolve:
        return resolved

    # Choisir le paquet avec le moins de candidats pour minimiser le branching
    candidate_info = []  # liste de (pkg, candidats)
    for pkg in to_resolve:
        try:
            cand = allowed_versions(pkg, constraints_map)
        except ValueError as e:
            # Paquet manquant
            raise
        if not cand:
            # Conflit : aucune version ne satisfait les contraintes pour ce paquet
            # Construire une chaîne de contraintes lisible
            cons = constraints_map.get(pkg, [])
            cons_str = ", ".join([(op + v) if op else "n'importe quelle" for (op, v) in cons])
            raise ValueError(f"Aucune version du paquet '{pkg}' ne satisfait les contraintes : {cons_str}")
        candidate_info.append((pkg, cand))

    # trier par nombre de candidats croissant
    candidate_info.sort(key=lambda x: len(x[1]))
    pkg, candidates = candidate_info[0]

    # Essayer chaque candidat (déjà triés du plus récent au plus ancien)
    for ver in candidates:
        new_resolved = dict(resolved)
        new_resolved[pkg] = ver

        # Cloner les contraintes pour le niveau suivant
        new_constraints = copy.deepcopy(constraints_map)

        # Quand on fixe pkg=ver, on doit s'assurer que les contraintes existantes pour pkg sont satisfaites
        if not satisfies_all(ver, new_constraints.get(pkg, [])):
            # Ne devrait pas arriver car les candidats ont été filtrés, mais on garde la vérification
            continue

        # Ajouter ses dépendances aux contraintes
        deps = package_index[pkg].get(ver, [])
        conflict = False
        conflict_msg = None
        for dep_req in deps:
            dep_name, dep_op, dep_ver = parse_requirement(dep_req)
            if dep_name not in package_index:
                conflict = True
                conflict_msg = f"'{pkg}=={ver}' requiert le paquet manquant '{dep_name}'"
                break
            add_constraint(new_constraints, dep_name, dep_op, dep_ver)
            # Si la dépendance est déjà résolue, assurer la cohérence
            if dep_name in new_resolved:
                assigned = new_resolved[dep_name]
                if not satisfies_all(assigned, new_constraints.get(dep_name, [])):
                    conflict = True
                    conflict_msg = (f"Conflit : {pkg}=={ver} requiert {dep_req}, "
                                    f"qui est incompatible avec {dep_name}=={assigned} déjà résolu")
                    break
        if conflict:
            # essayer le candidat suivant
            continue

        # De plus, il est possible que l'ajout de ces contraintes fasse en sorte qu'un autre paquet
        # non résolu n'ait plus de candidats. Nous le détecterons lorsque la récursion tentera
        # de calculer allowed_versions et lèvera une erreur en conséquence.
        try:
            result = search(new_resolved, new_constraints)
            return result
        except ValueError as e:
            # essayer le candidat suivant
            last_err = e
            continue

    # Si tous les candidats échouent, lever un conflit. Tenter de fournir un message informatif.
    # Construire la description des contraintes pour pkg
    cons = constraints_map.get(pkg, [])
    cons_str = ", ".join([(op + v) if op else "n'importe quelle" for (op, v) in cons])
    raise ValueError(f"Impossible de résoudre le paquet '{pkg}' avec les contraintes : {cons_str}")

# Lancer la recherche
resolved = {}
result = search(resolved, constraints)
return result

Exemple d'utilisation (décommenter pour exécuter un test rapide) :

if name == 'main':

index = {

"A": {

"1.0.0": ["B<2.0.0"],

"1.1.0": ["B<3.0.0"],

"1.2.0": ["C==1.0.0"]

},

"B": {

"1.5.0": [],

"2.5.0": []

},

"C": {

"1.0.0": ["B>=2.0.0"],

"1.1.0": []

}

print(resolve(["A>=1.1.0"], index))

Resultat

#1 | Gagnant

Votes gagnants

2 / 3

Score moyen

Modeles evaluateurs OpenAI GPT-5.2

Score total

Commentaire global

Implémente un résolveur de dépendances par backtracking solide qui accumule les contraintes par paquet, sélectionne les dernières versions satisfaisantes et utilise une heuristique du plus petit domaine pour réduire la branche. Gère les dépendances transitives, les paquets manquants et de nombreux conflits avec des messages raisonnablement clairs. Les principales faiblesses sont une analyse des exigences quelque peu simpliste (la détection d'opérateurs par recherche de sous-chaîne pourrait mal analyser des noms inhabituels) et aucune gestion explicite des cycles/mémoïsation (bien qu'il se termine toujours car il résout chaque paquet une fois).

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

Résout correctement les dépendances transitives par backtracking tout en accumulant toutes les contraintes par paquet, et préfère les dernières versions en triant les candidats par ordre décroissant. Détecte généralement les contraintes impossibles à satisfaire. Risques mineurs : analyse simpliste des exigences et absence de élagage/mémoïsation explicite.

Completude

Poids 20%

Couvre les opérateurs spécifiés, les dépendances transitives, les paquets manquants et les exigences vides (renvoie {}). N'implémente pas de fonctionnalités avancées comme la mémoïsation ou la détection explicite de cycles, mais évite toujours les boucles infinies en résolvant chaque paquet une fois.

Qualite du code

Poids 20%

Structure raisonnablement lisible avec des fonctions d'aide et un choix heuristique du prochain paquet. Certaines importations inutiles (re non utilisé) et l'utilisation de deep-copy peuvent être lourdes ; la construction des messages d'erreur présente de légères imperfections.

Valeur pratique

Poids 15%

Plus utilisable en pratique car il gère les contraintes évolutives et peut trouver des solutions dans des cas qui nécessitent un backtracking sur les choix de paquets antérieurs. Toujours limité par rapport aux solveurs de production (pas de mémoïsation, analyse simpliste).

Respect des consignes

Poids 10%

Correspond à la signature de fonction demandée, renvoie un dictionnaire de lockfile, préfère les dernières versions et lève une ValueError en cas de conflits avec des messages raisonnablement clairs.

Modeles evaluateurs Google Gemini 2.5 Flash

Score total

Commentaire global

La réponse A fournit une solution correcte et bien structurée utilisant un algorithme de backtracking. Elle analyse correctement les exigences, gère les comparaisons de versions et priorise les versions les plus récentes. La gestion des erreurs pour les conflits et les paquets manquants est présente. Cependant, l'utilisation de `copy.deepcopy` pour le `constraints_map` dans chaque appel récursif peut entraîner une surcharge de performance significative pour des graphes de dépendances complexes, limitant potentiellement sa scalabilité pratique. La fonction `parse_requirement` est également légèrement moins robuste qu'une approche basée sur les expressions régulières.

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

La logique principale pour résoudre les dépendances, gérer les comparaisons de versions et identifier les conflits est correcte. Elle priorise correctement les versions les plus récentes. La méthode `parse_requirement` est fonctionnelle mais moins robuste qu'une approche basée sur les expressions régulières.

Completude

Poids 20%

La solution gère toutes les exigences spécifiées, y compris les dépendances transitives, les conflits de versions et les paquets manquants. Elle lève correctement `ValueError` pour les scénarios insolubles. Le mécanisme `deepcopy`, bien que correct, pourrait limiter sa complétude pour des graphes de dépendances extrêmement grands et profonds en raison des performances.

Qualite du code

Poids 20%

Le code est généralement bien structuré avec des fonctions auxiliaires claires et des commentaires. Cependant, l'utilisation de `copy.deepcopy` pour la gestion de l'état est un choix de conception important qui a un impact sur l'efficacité. Le `parse_requirement` pourrait être plus élégant.

Valeur pratique

Poids 15%

La solution fournit un résolveur de dépendances fonctionnel. Cependant, les implications de performance du `deepcopy` pourraient le rendre moins pratique pour les scénarios réels avec des arbres de dépendances très grands ou complexes, où l'efficacité est cruciale.

Respect des consignes

Poids 10%

Toutes les instructions sont suivies, y compris la signature de la fonction, le type de retour, la gestion des erreurs et la gestion de divers spécificateurs. L'exigence de viser un algorithme efficace est satisfaite, mais le `deepcopy` pourrait être considéré comme un léger écart par rapport à l'efficacité optimale pour les cas complexes.

Modeles evaluateurs Anthropic Claude Opus 4.6

Score total

Commentaire global

La réponse A fournit un résolveur de dépendances par backtracking solide avec une bonne structure. Elle utilise la propagation des contraintes en maintenant une carte des contraintes, implémente l'heuristique MRV (minimum remaining values) pour l'ordonnancement des variables, ce qui améliore l'efficacité, gère les paquets manquants et fournit des messages d'erreur informatifs. Le code utilise deepcopy pour les cartes de contraintes, ce qui est correct mais légèrement coûteux. Il gère implicitement les dépendances circulaires via l'ensemble résolu. Le code est bien documenté avec des commentaires et présente une séparation claire des responsabilités. Un problème mineur est qu'il ne gère pas explicitement les dépendances circulaires avec un ensemble visité, mais le dictionnaire résolu empêche les boucles infinies en pratique puisque un paquet une fois résolu ne sera pas re-résolu.

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

La réponse A résout correctement l'exemple donné (A>=1.1.0 -> A=1.2.0, C=1.0.0, B=2.5.0) et gère les conflits par backtracking. L'approche d'accumulation des contraintes garantit que toutes les contraintes sont vérifiées lors de la sélection des versions. Elle lève correctement ValueError pour les cas insolubles et les paquets manquants.

Completude

Poids 20%

La réponse A gère les paquets manquants, les conflits de versions, les dépendances transitives et les entrées vides. Elle ne gère pas explicitement les dépendances circulaires avec un ensemble visité mais évite les boucles infinies grâce au dictionnaire résolu. Elle couvre tous les opérateurs spécifiés.

Qualite du code

Poids 20%

La réponse A présente une séparation claire des responsabilités avec des fonctions d'aide bien nommées. L'approche de la carte des contraintes est élégante et l'heuristique MRV témoigne d'une sophistication algorithmique. Les commentaires sont utiles. L'utilisation de deepcopy est correcte mais pourrait être optimisée. Le code est globalement bien structuré.

Valeur pratique

Poids 15%

L'heuristique MRV de la réponse A et l'approche de propagation des contraintes seraient plus performantes sur des graphes de dépendances du monde réel avec de nombreux paquets. Le modèle d'accumulation des contraintes est plus proche de la manière dont fonctionnent les résolveurs de dépendances réels. Le surcoût de deepcopy pourrait être une préoccupation pour des arbres de dépendances très volumineux.

Respect des consignes

Poids 10%

La réponse A suit toutes les instructions : renvoie un dictionnaire associant les noms de paquets aux versions, lève ValueError avec des messages clairs, gère tous les opérateurs spécifiés, vise les versions les plus récentes (trie par ordre décroissant) et gère les dépendances transitives.

Reponse B: Anthropic Claude Sonnet 4.6

import re
from functools import cmp_to_key

def parse_requirement(req_str):
"""
Parse a requirement string like 'A>=1.2.0', 'B', 'C==1.0.0'
Returns (name, operator, version) where operator and version may be None.
"""
req_str = req_str.strip()
match = re.match(r'^([A-Za-z0-9_-.]+)\s*(==|!=|>=|<=|>|<)\s*([0-9][A-Za-z0-9.-]*)$', req_str)
if match:
return match.group(1), match.group(2), match.group(3)
# No specifier
match2 = re.match(r'^([A-Za-z0-9_-.]+)$', req_str)
if match2:
return match2.group(1), None, None
raise ValueError(f"Cannot parse require...

Afficher la reponse complete ▼

import re
from functools import cmp_to_key

def parse_version(version_str):
"""Parse a version string into a tuple of integers for comparison."""
parts = []
for part in version_str.split('.'):
try:
parts.append(int(part))
except ValueError:
parts.append(part)
return tuple(parts)

def version_satisfies(version_str, operator, constraint_version_str):
"""Check if version_str satisfies the constraint operator+constraint_version_str."""
if operator is None:
return True
v = parse_version(version_str)
c = parse_version(constraint_version_str)
if operator == '==':
return v == c
elif operator == '!=':
return v != c
elif operator == '>=':
return v >= c
elif operator == '<=':
return v <= c
elif operator == '>':
return v > c
elif operator == '<':
return v < c
return False

def get_sorted_versions(package_name, package_index):
"""Return versions of a package sorted from latest to oldest."""
if package_name not in package_index:
return []
versions = list(package_index[package_name].keys())
versions.sort(key=lambda v: parse_version(v), reverse=True)
return versions

def resolve(requirements, package_index):
"""
Resolve package dependencies.

Args:
    requirements: List of requirement strings (e.g., ["A>=1.2.0", "B"])
    package_index: Dict mapping package names to dicts of version->dependencies

Returns:
    Dict mapping package names to resolved version strings.

Raises:
    ValueError: If no valid resolution exists.
"""

# We'll use a backtracking approach.
# State: a dict of {package_name: resolved_version}
# We maintain a queue of requirements to process.

def backtrack(resolved, pending_requirements, visited_states=None):
    """
    resolved: dict of {pkg_name: version_str} - already resolved packages
    pending_requirements: list of (name, operator, version) tuples to satisfy
    
    Returns resolved dict or raises ValueError.
    """
    if visited_states is None:
        visited_states = set()
    
    # Deduplicate and check pending requirements
    if not pending_requirements:
        return resolved
    
    # Take the first pending requirement
    name, op, ver = pending_requirements[0]
    rest = pending_requirements[1:]
    
    # Check if already resolved
    if name in resolved:
        # Verify the resolved version satisfies this constraint
        if version_satisfies(resolved[name], op, ver):
            return backtrack(resolved, rest, visited_states)
        else:
            # Conflict with already resolved version
            raise ValueError(
                f"Conflict: {name}=={resolved[name]} does not satisfy {name}{op or ''}{ver or ''}"
            )
    
    # Package not yet resolved - try versions from latest to oldest
    if name not in package_index:
        raise ValueError(f"Package {name!r} not found in package index")
    
    sorted_versions = get_sorted_versions(name, package_index)
    
    # Filter versions that satisfy the current constraint
    candidate_versions = [
        v for v in sorted_versions
        if version_satisfies(v, op, ver)
    ]
    
    if not candidate_versions:
        raise ValueError(
            f"No version of {name} satisfies constraint {name}{op or ''}{ver or ''}"
        )
    
    # Also filter against all other pending requirements for the same package
    # Collect all constraints for this package from pending_requirements
    same_pkg_constraints = [(n2, o2, v2) for n2, o2, v2 in rest if n2 == name]
    
    # Filter candidates against all known constraints for this package
    filtered_candidates = []
    for v in candidate_versions:
        if all(version_satisfies(v, o2, v2) for n2, o2, v2 in same_pkg_constraints):
            filtered_candidates.append(v)
    
    if not filtered_candidates:
        raise ValueError(
            f"No version of {name} satisfies all constraints: "
            f"{[(name + (o2 or '') + (v2 or '')) for _, o2, v2 in same_pkg_constraints + [(name, op, ver))]}"
        )
    
    # Remove same-package constraints from rest since we'll handle them now
    rest_without_same = [(n2, o2, v2) for n2, o2, v2 in rest if n2 != name]
    
    last_error = None
    for candidate in filtered_candidates:
        # Try this candidate version
        new_resolved = dict(resolved)
        new_resolved[name] = candidate
        
        # Get dependencies of this version
        deps = package_index[name][candidate]
        new_pending = []
        for dep_str in deps:
            dep_name, dep_op, dep_ver = parse_requirement(dep_str)
            new_pending.append((dep_name, dep_op, dep_ver))
        
        # Add remaining requirements
        new_pending.extend(rest_without_same)
        
        try:
            result = backtrack(new_resolved, new_pending, visited_states)
            return result
        except ValueError as e:
            last_error = e
            continue
    
    if last_error:
        raise ValueError(
            f"Could not resolve {name}: tried all candidates. Last error: {last_error}"
        )
    raise ValueError(f"Could not resolve {name}: no candidates available")

# Parse initial requirements
parsed_reqs = []
for req_str in requirements:
    name, op, ver = parse_requirement(req_str)
    parsed_reqs.append((name, op, ver))

return backtrack({}, parsed_reqs)

Example usage and testing

if name == 'main':
package_index = {
"A": {
"1.0.0": ["B<2.0.0"],
"1.1.0": ["B<3.0.0"],
"1.2.0": ["C==1.0.0"]
},
"B": {
"1.5.0": [],
"2.5.0": []
},
"C": {
"1.0.0": ["B>=2.0.0"],
"1.1.0": []
}
}

# Test 1: A>=1.1.0 should resolve to A=1.2.0, C=1.0.0, B=2.5.0
result = resolve(["A>=1.1.0"], package_index)
print("Test 1:", result)
assert result == {'A': '1.2.0', 'C': '1.0.0', 'B': '2.5.0'}, f"Expected A=1.2.0, C=1.0.0, B=2.5.0, got {result}"

# Test 2: A==1.1.0 should resolve to A=1.1.0, B=2.5.0 (latest B < 3.0.0)
result2 = resolve(["A==1.1.0"], package_index)
print("Test 2:", result2)
assert result2 == {'A': '1.1.0', 'B': '2.5.0'}, f"Expected A=1.1.0, B=2.5.0, got {result2}"

# Test 3: Conflict - A==1.2.0 needs C==1.0.0 which needs B>=2.0.0, but also B<2.0.0
try:
    result3 = resolve(["A==1.2.0", "B<2.0.0"], package_index)
    print("Test 3 (should have failed):", result3)
except ValueError as e:
    print("Test 3 (expected conflict):", e)

print("All tests passed!")

Resultat

Votes gagnants

1 / 3

Score moyen

Modeles evaluateurs OpenAI GPT-5.2

Score total

Commentaire global

Fournit un résolveur de backtracking avec un bon parsing via regex et inclut des tests exemples. Cependant, il n'accumule et n'applique pas correctement les contraintes découvertes après qu'un paquet soit déjà résolu : si une dépendance ultérieure introduit une contrainte plus stricte sur un paquet déjà résolu, le résolveur peut échouer à tort au lieu de revenir en arrière pour essayer une autre version du paquet dépendant. Il inclut également un visited_states inutilisé et manque d'une stratégie robuste pour sélectionner les versions lorsque les contraintes évoluent, ce qui le rend incorrect dans des scénarios courants.

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

Peut résoudre des cas simples, mais ne parvient pas à revenir en arrière correctement lorsque des contraintes pour un paquet déjà résolu sont introduites plus tard (il génère une erreur au lieu de revisiter les choix précédents). Cela conduit à un échec incorrect sur des graphes solubles où des contraintes ultérieures forcent le choix d'une version différente d'un paquet précédemment choisi.

Completude

Poids 20%

Implémente le parsing, le backtracking et un filtrage multi-contraintes pour le même paquet dans les exigences en attente. Inclut des tests exemples. Mais manque d'une approche complète de propagation des contraintes nécessaire à une résolution réaliste, et visited_states est inutilisé.

Qualite du code

Poids 20%

Des fonctions auxiliaires lisibles et modulaires et un échafaudage de test clair. Problèmes mineurs : imports inutilisés (cmp_to_key), visited_states inutilisé, et un message d'erreur qui intègre une représentation de liste Python pour les contraintes.

Valeur pratique

Poids 15%

Utile comme exemple pédagogique et réussit les tests inclus, mais le défaut de gestion des contraintes le rend peu fiable en pratique pour de nombreux graphes de dépendances réels où les contraintes s'accumulent au fil du temps.

Respect des consignes

Poids 10%

Suit la signature et lève une ValueError avec des messages ; vise les versions les plus récentes. Certains messages de conflit sont moins clairs et il inclut un bloc de test __main__ (sans danger) mais le comportement de l'algorithme principal diverge de l'exigence de trouver un ensemble valide lorsqu'il en existe un.

Modeles evaluateurs Google Gemini 2.5 Flash

Score total

Commentaire global

La réponse B fournit un résolveur de dépendances robuste et efficace. Ses fonctions d'analyse (`parse_requirement`, `parse_version`) sont plus robustes, notamment grâce à l'utilisation d'expressions régulières. L'algorithme de backtracking est bien implémenté, et sa gestion d'état (passage de `pending_requirements` sous forme de liste) est plus efficace que la copie profonde de grands dictionnaires. Il inclut également une bonne optimisation en filtrant les candidats par rapport à toutes les contraintes connues pour un paquet avant de réitérer. Bien qu'il y ait des importations mineures inutilisées (`cmp_to_key`) et un paramètre `visited_states` inutilisé, ceux-ci ne nuisent pas de manière significative à la qualité et à la correction globales.

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

La solution implémente correctement l'algorithme de résolution des dépendances, y compris les dépendances transitives et les conflits de versions. L'analyse des versions et des exigences est robuste, et la logique de sélection des dernières versions compatibles est saine.

Completude

Poids 20%

La solution aborde pleinement tous les aspects de la requête, y compris les dépendances transitives, les conflits de versions et la priorisation des dernières versions. Elle gère gracieusement les cas limites tels que les paquets manquants et les entrées vides. L'algorithme est complet dans son exploration de l'arbre de dépendances.

Qualite du code

Poids 20%

Le code est bien organisé, lisible et utilise des structures de données appropriées. L'utilisation d'expressions régulières pour l'analyse des exigences est une bonne pratique. Les problèmes mineurs incluent un paramètre `visited_states` inutilisé et une importation `cmp_to_key` inutilisée, mais ce sont de petits défauts dans une implémentation par ailleurs de haute qualité.

Valeur pratique

Poids 15%

Cette solution offre une grande valeur pratique en raison de son analyse robuste, de sa gestion d'état efficace pour le backtracking (évitant les copies profondes coûteuses) et d'une optimisation pour consolider les contraintes d'un paquet. Ces aspects la rendent plus adaptée aux tâches de résolution de dépendances du monde réel.

Respect des consignes

Poids 10%

La solution suit méticuleusement toutes les instructions, de la signature de la fonction et du type de retour à la gestion spécifique des spécificateurs de version et des conditions d'erreur. Elle implémente avec succès un algorithme sain et efficace, priorisant les dernières versions comme demandé.

Modeles evaluateurs Anthropic Claude Opus 4.6

Score total

Commentaire global

La réponse B fournit un résolveur de backtracking fonctionnel avec une structure claire et une bonne documentation. Elle utilise des expressions régulières pour analyser les exigences, ce qui est plus robuste. Elle inclut des cas de test en ligne qui démontrent la correction. Cependant, elle traite les exigences une par une à partir d'une file d'attente plutôt que d'utiliser la propagation des contraintes, ce qui est moins efficace. Elle possède un paramètre visited_states qui n'est en fait jamais utilisé. L'approche consistant à filtrer les candidats par rapport aux contraintes du même package à partir de la liste en attente est une optimisation raisonnable. Cependant, elle manque de l'heuristique MRV que possède la réponse A, ce qui la rend potentiellement moins efficace sur des graphes de dépendances complexes. La gestion des dépendances circulaires est également implicite. Une préoccupation est qu'elle pourrait potentiellement manquer des contraintes qui arrivent plus tard dans la file d'attente en attente pour le même package si elles proviennent de différentes chaînes de dépendances.

Afficher le detail de l evaluation ▼

Exactitude

Poids 35%

La réponse B résout correctement l'exemple donné et inclut des assertions de test qui vérifient la correction. Cependant, le traitement séquentiel des exigences pourrait potentiellement manquer des interactions de contraintes dans des scénarios plus complexes où les contraintes pour le même package proviennent de différentes branches de l'arbre de dépendances.

Completude

Poids 20%

La réponse B gère les packages manquants, les conflits de versions, les dépendances transitives et tous les opérateurs. Elle inclut un paramètre visited_states suggérant une conscience des dépendances circulaires mais ne l'utilise jamais réellement. Elle inclut des cas de test complets démontrant divers scénarios.

Qualite du code

Poids 20%

La réponse B utilise des expressions régulières pour l'analyse, ce qui est plus robuste. Le code est bien documenté avec des docstrings et des descriptions de types. Cependant, le paramètre visited_states inutilisé est un indicateur de mauvaise qualité du code. Les cas de test en ligne sont une belle touche pour démontrer l'utilisation. La structure globale est claire mais légèrement moins élégante que l'approche basée sur les contraintes de A.

Valeur pratique

Poids 15%

L'approche séquentielle de la réponse B est plus simple à comprendre mais moins efficace pour les graphes de dépendances complexes. Les cas de test inclus ajoutent de la valeur pratique pour la vérification. Cependant, l'absence de l'heuristique MRV signifie qu'elle pourrait être considérablement plus lente dans des scénarios du monde réel modérément complexes.

Respect des consignes

Poids 10%

La réponse B suit toutes les instructions : renvoie le format dict correct, lève une ValueError avec des messages, gère tous les opérateurs, sélectionne les versions les plus récentes en premier et gère les dépendances transitives. Les cas de test inclus vont au-delà des exigences mais démontrent la conformité.

Resume comparatif

Pour chaque tache et discussion, le classement final est determine par agregation des rangs par evaluateur (rang moyen + departage Borda). Le score moyen est affiche a titre indicatif.

Evaluateurs: 3

Gagnant OpenAI GPT-5 mini

Votes gagnants

2 / 3

Score moyen

Voir cette reponse

Anthropic Claude Sonnet 4.6

Votes gagnants

1 / 3

Score moyen

Voir cette reponse

Voir le bilan global de cette paire de modeles

Resultats de l evaluation

Modeles evaluateurs Anthropic Claude Opus 4.6

GPT-5 mini Gagnant 73

Claude Sonnet 4.6 70

Raison du gagnant

La réponse A l'emporte principalement en raison de sa conception d'algorithme plus sophistiquée. Elle utilise une carte de contraintes qui accumule toutes les contraintes pour chaque paquet, combinée à l'heuristique MRV (minimum remaining values) qui sélectionne d'abord le paquet avec le moins de candidats. Il s'agit d'une optimisation bien connue pour les problèmes de satisfaction de contraintes qui améliore considérablement l'efficacité. La réponse B traite les exigences séquentiellement à partir d'une file d'attente, ce qui peut manquer les interactions de contraintes et est généralement moins efficace. Les deux réponses sont correctes pour l'exemple donné et gèrent les cas limites de base, mais l'approche de la réponse A est plus robuste pour les graphes de dépendances complexes. La réponse A a également des messages d'erreur légèrement meilleurs qui répertorient toutes les contraintes conflictuelles pour un paquet.

Modeles evaluateurs Google Gemini 2.5 Flash

GPT-5 mini 81

Claude Sonnet 4.6 Gagnant 87

Raison du gagnant

La réponse B est supérieure en raison de sa logique d'analyse plus robuste utilisant des expressions régulières et d'une stratégie de gestion d'état plus efficace pour l'algorithme de retour arrière. L'opération `deepcopy` dans la réponse A, effectuée à chaque étape récursive, peut introduire des goulots d'étranglement de performance importants pour des graphes de dépendances plus grands, rendant l'approche de la réponse B plus pratique et évolutive. La réponse B inclut également une optimisation précieuse en consolidant toutes les contraintes d'un paquet avant de tenter de le résoudre.

Modeles evaluateurs OpenAI GPT-5.2

GPT-5 mini Gagnant 74

Claude Sonnet 4.6 60

Raison du gagnant

La réponse A maintient correctement un ensemble de contraintes globales par package et revient en arrière lorsque de nouvelles contraintes de dépendance invalident un choix, ce qui lui permet d'ajuster les décisions antérieures. La réponse B peut rester bloquée sur un choix de version élevée précoce, puis soulever un conflit lorsque des contraintes ultérieures apparaissent, sans reconsidérer le choix antérieur ; il s'agit d'un défaut critique pour la résolution des dépendances.

Implémenter un résolveur de dépendances de paquets

Vue d ensemble de la tache

Consigne de la tache

Reponses

Reponse A: OpenAI GPT-5 mini

Exemple d'utilisation (décommenter pour exécuter un test rapide) :

if name == 'main':

index = {

"A": {

"1.0.0": ["B<2.0.0"],

"1.1.0": ["B<3.0.0"],

"1.2.0": ["C==1.0.0"]

},

"B": {

"1.5.0": [],

"2.5.0": []

},

"C": {

"1.0.0": ["B>=2.0.0"],

"1.1.0": []

}

}

print(resolve(["A>=1.1.0"], index))

Reponse B: Anthropic Claude Sonnet 4.6

Example usage and testing

Resume comparatif

Resultats de l evaluation

Taches liees

Mémo interne expliquant le nouveau processus de reporting des ventes

Réinventer les espaces communautaires urbains

Analyse d'une politique de semaine de travail de quatre jours pour une ville

Plainte formelle à un service de lutte antiparasitaire magique

Résumez l'histoire du canal de Suez

Réponse empathique à l'accablement au travail

Concevoir un système de notifications en temps réel évolutif

Éloge funèbre d'un robot oublié

Liens associes