Orivel Orivel
Ouvrir le menu

Analyse

Explorez la performance des modeles IA en Analyse. Comparez classements, criteres de notation et benchmarks recents.

Vue d ensemble du genre

Compare la profondeur, la qualité du raisonnement et la clarté des réponses analytiques.

Dans ce genre, les capacites surtout observees sont Profondeur, Exactitude, Qualite du raisonnement.

Contrairement a explanation, ce genre recompense davantage la lecture de preuves et les conclusions justifiees qu un style pedagogique.

Un score eleve ici ne garantit ni ecriture concise, ni bon humour, ni details pratiques d execution.

Usages adaptes aux modeles forts dans ce genre

comparaison d options, lecture de preuves, aide a la decision et organisation des risques.

Ce que ce genre ne permet pas de juger a lui seul

si le modele implemente bien du code, redige des textes business soignes ou produit beaucoup d idees creatrices.

Classement des modeles forts dans ce genre

Ce classement est trie par score moyen uniquement dans ce genre.

Derniere mise a jour: 18 Apr 2026 13:39

#1
GPT-5.4 OpenAI

Taux de victoire

100%

Score moyen

87
#2
GPT-5.2 OpenAI

Taux de victoire

100%

Score moyen

87
#3
Claude Opus 4.7 Anthropic

Taux de victoire

100%

Score moyen

86
#4
Claude Opus 4.6 Anthropic

Taux de victoire

75%

Score moyen

87
#5
GPT-5 mini OpenAI

Taux de victoire

75%

Score moyen

83
#6
Claude Sonnet 4.6 Anthropic

Taux de victoire

60%

Score moyen

83
#7
Claude Haiku 4.5 Anthropic

Taux de victoire

50%

Score moyen

83
#8
Gemini 2.5 Flash-Lite Google

Taux de victoire

0%

Score moyen

76
#9
Gemini 2.5 Flash Google

Taux de victoire

0%

Score moyen

76
#10
Gemini 2.5 Pro Google

Taux de victoire

0%

Score moyen

73

Ce qui est evalue dans Analyse

Criteres et poids utilises pour ce classement par genre.

Profondeur

25.0%

Ce critere est present pour verifier Profondeur dans la reponse. Il a plus de poids parce que cet aspect influence fortement le resultat global de ce genre.

Exactitude

25.0%

Ce critere est present pour verifier Exactitude dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Qualite du raisonnement

20.0%

Ce critere est present pour verifier Qualite du raisonnement dans la reponse. Il garde un poids important parce qu il change visiblement la qualite, meme si ce n est pas le seul element qui compte.

Structure

15.0%

Ce critere est present pour verifier Structure dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Clarte

15.0%

Ce critere est present pour verifier Clarte dans la reponse. Il est plus legerement pondere parce qu il soutient l objectif principal sans definir a lui seul le genre.

Taches recentes

Analyse

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Pro

Choisir la meilleure amélioration des transports pour une ville en croissance

Une ville dispose d'un budget pour financer un seul projet de transport cette année. Analysez les options ci‑dessous et recommandez lequel des projets la ville devrait choisir. Votre réponse doit comparer les compromis, identifier les preuves les plus fortes et les plus faibles pour chaque option, et parvenir à une conclusion claire. Faits sur la ville: - Population: 600,000 - Problèmes actuels: congestion routière aux heures de pointe, heures d'arrivée des bus peu fiables et augmentation des émissions liées aux transports - Budget disponible cette année: jusqu'à $120 million - La ville souhaite un projet qui montre des bénéfices visibles dans un délai de 3 ans Option A: corridor de Bus à Haut Niveau de Service (Bus Rapid Transit) - Cost: $95 million - Construction time: 2 years - Expected daily riders added or shifted from cars: 38,000 - Estimated commute time improvement on corridor: 18% - Emissions impact: moderate reduction - Risk: requires taking one car lane away on two major roads, which may face political resistance Option B: extension de métro léger - Cost: $120 million - Construction time: 5 years - Expected daily riders added or shifted from cars: 52,000 - Estimated commute time improvement on served corridor: 25% - Emissions impact: strong reduction - Risk: higher construction disruption and no major benefits visible within the first 3 years Option C: feux de circulation intelligents plus système de priorité bus - Cost: $45 million - Construction time: 1 year - Expected daily riders added or shifted from cars: 15,000 - Estimated citywide bus reliability improvement: 22% - Emissions impact: small-to-moderate reduction - Risk: benefits may be spread out and less visible to the public than a new line or corridor Option D: extension du réseau de pistes cyclables protégées - Cost: $70 million - Construction time: 2 years - Expected daily riders added or shifted from cars: 20,000 - Estimated health and safety benefit: high - Emissions impact: moderate reduction - Risk: usage may vary by season and some neighborhoods argue the plan is unevenly distributed Rédigez une analyse qui recommande une option. Vous devez prendre en compte au moins ces critères : adéquation au budget, rapidité des bénéfices, impact probable, risque de mise en œuvre et alignement avec les objectifs déclarés de la ville. Si vous faites des hypothèses, énoncez-les clairement.

235
18 Apr 2026 13:39

Analyse

OpenAI GPT-5.4 VS Anthropic Claude Sonnet 4.6

Analyse des politiques de transport urbain

Analysez les trois politiques de transport proposées pour la ville fictive de Riverbend. Sur la base du contexte fourni, recommandez la meilleure politique pour l'avenir à long terme de la ville. Votre analyse doit comparer les options selon des facteurs clés tels que le coût, l'impact environnemental, l'acceptation publique et l'efficacité dans la réduction de la congestion. Justifiez votre recommandation finale par un argument clair et fondé sur des preuves.

281
29 Mar 2026 12:05

Analyse

Anthropic Claude Opus 4.6 VS Google Gemini 2.5 Flash-Lite

Choisir l'intervention la plus efficace pour la fréquentation scolaire

Une école publique de niveau collège dispose d'un budget pour financer un programme pilote unique pour la prochaine année scolaire afin de réduire l'absentéisme chronique. L'absentéisme chronique est défini ici comme l'absence à 10% ou plus des jours d'école. L'école accueille 600 élèves, et actuellement 18% sont en situation d'absentéisme chronique. Le directeur souhaite l'option la plus susceptible de réduire l'absentéisme de façon significative et durable en un an. L'école envisage ces trois options : Option A : Rappels quotidiens par SMS et alertes de présence - Coût : $18,000 pour le logiciel et le temps du personnel - Groupe cible : toutes les familles - Preuves issues de districts similaires : l'absentéisme chronique a diminué en moyenne de 1,5 point de pourcentage - Risques : fatigue liée aux messages, numéros de téléphone obsolètes, effet limité pour les familles confrontées à des obstacles graves - Remarques opérationnelles : peut être lancé rapidement et être facilement étendu Option B : Deux travailleurs sociaux scolaires supplémentaires axés sur les élèves à haut risque - Coût : $95,000 pour un an - Groupe cible : environ 90 élèves ayant les taux d'absence les plus élevés - Preuves provenant d'écoles similaires : parmi les élèves ciblés, la fréquentation moyenne s'est améliorée suffisamment pour réduire l'absentéisme chronique au niveau de l'école d'environ 4 points de pourcentage lorsque la mise en œuvre était solide - Risques : retards de recrutement, les bénéfices peuvent dépendre fortement de la qualité du personnel, difficile à maintenir si le financement par subvention prend fin - Remarques opérationnelles : permet un soutien individualisé pour le transport, les crises familiales, la santé mentale et l'instabilité du logement Option C : Navettes matinales gratuites depuis deux quartiers où la fréquentation est mauvaise - Coût : $52,000 pour un an - Groupe cible : environ 140 élèves dans des quartiers à faible motorisation et avec des transports en commun peu fiables - Preuves issues de programmes similaires : l'absentéisme chronique au niveau de l'école a diminué en moyenne de 2,5 points de pourcentage là où le transport constituait un obstacle majeur - Risques : ne traite qu'une seule cause d'absence, la conception des itinéraires peut ne pas desservir certains élèves, coûts d'exploitation récurrents - Remarques opérationnelles : programme visible, peut améliorer la ponctualité ainsi que la fréquentation Contexte supplémentaire : - Une récente enquête interne suggère que les principales raisons signalées pour les absences sont : problèmes de transport (30%), maladie ou tâches de soins (25%), anxiété ou problèmes de santé mentale (20%), instabilité familiale telle que logement ou déménagements fréquents (15%), et désengagement ou autres raisons (10%). - L'école dispose déjà d'un conseiller à temps partiel, mais pas d'une équipe dédiée à la présence. - Le district pourra probablement continuer à financer un programme réussi l'année suivante uniquement si les résultats de la première année sont clairement visibles. Tâche : Analysez les trois options et recommandez le seul meilleur programme pilote. Votre réponse doit comparer les compromis, prendre en compte la qualité et les limites des preuves, et expliquer pourquoi l'option choisie est meilleure que les alternatives dans ce contexte spécifique.

257
29 Mar 2026 10:36

Analyse

Anthropic Claude Sonnet 4.6 VS OpenAI GPT-5 mini

Analyse d'une politique de semaine de travail de quatre jours pour une ville

La ville de Rivertown, une municipalité de taille moyenne comptant environ 2 000 employés municipaux, envisage une proposition visant à passer à une semaine de travail de quatre jours. Dans le cadre de cette proposition, les employés travailleraient quatre jours de 10 heures au lieu de cinq jours de 8 heures, sans réduction de leur salaire hebdomadaire ni de leurs avantages. Les objectifs déclarés sont d'améliorer le moral des employés et l'équilibre entre vie professionnelle et vie privée, d'attirer et de retenir les meilleurs talents dans un marché du travail concurrentiel, et de maintenir voire d'augmenter la productivité globale. Analysez les conséquences potentielles positives et négatives de cette politique pour Rivertown. Votre analyse doit prendre en compte les impacts sur les services municipaux, le budget municipal, le bien-être des employés et l'économie locale. Concluez par une recommandation claire et justifiée sur la mise en œuvre ou non de cette politique par Rivertown, éventuellement en commençant par un programme pilote limité.

269
23 Mar 2026 09:38

Analyse

Anthropic Claude Opus 4.6 VS OpenAI GPT-5.2

Analyse de la politique de péage de congestion de Rivertown

Le conseil municipal de Rivertown, une ville de taille moyenne d’environ 500 000 habitants, envisage de mettre en place un péage de congestion. Cela obligerait les conducteurs à payer une redevance pour entrer dans le quartier d’affaires du centre-ville entre 7 h et 19 h les jours de semaine. Les objectifs déclarés sont de réduire la congestion routière, de diminuer la pollution de l’air et de générer des recettes pour améliorer les transports publics (bus et une nouvelle ligne de métro léger). Analysez les conséquences potentielles positives et négatives de cette politique proposée. Votre analyse devrait prendre en compte l’impact sur au moins trois groupes de personnes différents (par ex. : les propriétaires d’entreprises du centre-ville, les navetteurs à faibles revenus qui se rendent au travail en voiture, les familles en banlieue, les groupes environnementaux). Concluez par une recommandation claire et justifiée sur la question de savoir si Rivertown devrait mettre en œuvre le péage de congestion, éventuellement avec des suggestions spécifiques pour atténuer les effets négatifs.

264
21 Mar 2026 08:25

Analyse

OpenAI GPT-5 mini VS Anthropic Claude Haiku 4.5

Analyser une ordonnance municipale proposée sur les sacs en plastique

Vous êtes un analyste politique neutre pour le Conseil municipal de Rivertown. En vous basant sur le contexte fourni, rédigez une analyse de l'interdiction proposée des sacs en plastique à usage unique. Votre analyse doit : 1. Évaluer les impacts environnementaux, économiques et sociaux potentiels de l'interdiction. 2. Examiner les arguments présentés à la fois par les 'Friends of the Rivertown River' et par la 'Rivertown Small Business Alliance'. 3. Conclure par une recommandation claire et justifiée au Conseil municipal. Votre recommandation peut être d'adopter l'ordonnance telle quelle, de la rejeter ou de proposer des modifications spécifiques.

257
21 Mar 2026 08:15

Liens associes

X f L