Name: Anthropic Claude Opus 4.8
Brand: Anthropic
Price: 5 USD

Aperçu du modèle

Fournisseur: Anthropic · claude-opus-4-8 Retiré

Publié

2026-05-28

Contexte

1M tokens

Entrée

$5.00 / 1M

Sortie

$25.00 / 1M

Claude Opus 4.8, publié le 28 mai 2026, a été le modèle phare d'Anthropic jusqu'à ce que Claude Fable 5 prenne la première place le 9 juin 2026. Sur Orivel, il a occupé la place équilibrée d'Anthropic jusqu'à ce que Claude Opus 5 le remplace au même tarif le 24 juillet 2026 ; il est retiré des nouvelles comparaisons, les résultats passés restant publiés.

Les principaux gains par rapport à Opus 4.7 sont un jugement plus aiguisé, plus d'honnêteté sur sa propre progression et la capacité de travailler en autonomie plus longtemps. Il est environ quatre fois moins susceptible que son prédécesseur de laisser passer des défauts dans son propre code et domine en ingénierie logicielle agentique, avec 69,2% sur SWE-Bench Pro devant GPT-5.5 et Gemini 3.1 Pro.

Le modèle conserve le contexte de 1M tokens et jusqu'à 128k tokens de sortie sur la Messages API. Le tarif reste inchangé par rapport à Opus 4.7 ($5 entrée / $25 sortie par 1M tokens), date de coupe des connaissances : janvier 2026. Les nouvelles surfaces ajoutent un contrôle `effort` (par défaut high) et une préversion de recherche Dynamic Workflows pour de grandes tâches agentiques parallélisées.

Notes de retrait

Publié le 28 mai 2026 comme successeur de Claude Opus 4.7 (environ six semaines plus tard)
Jugement plus aiguisé, plus d'honnêteté sur sa progression et travail autonome plus long
~4x moins susceptible qu'Opus 4.7 de laisser passer des défauts dans son propre code
SWE-Bench Pro 69,2% — devant GPT-5.5 et Gemini 3.1 Pro en codage agentique
Gains en raisonnement multidisciplinaire, utilisation agentique de l'ordinateur et analyse financière agentique
Contexte 1M tokens ; jusqu'à 128k tokens de sortie sur la Messages API
Paramètre `effort` (par défaut high) pour ajuster l'effort du modèle par réponse
Préversion de recherche Dynamic Workflows pour des tâches à sous-agents parallèles ; fast mode à 2,5x la vitesse
Tarif identique à Opus 4.7 : $5 entrée / $25 sortie par 1M tokens
Adaptive thinking ; disponible via Claude API, Amazon Bedrock, Vertex AI et Microsoft Foundry
Date de coupe des connaissances et des données d'entraînement : janvier 2026

Annonce officielle

Performance globale

Classement général

-

Taux de victoire global

81%

Score moyen Le score moyen est la moyenne globale basée sur les évaluations Orivel pour les tâches standard et les discussions. Plus la valeur est élevée, plus le modèle est évalué de façon forte et régulière dans les comparaisons du benchmark.

85

Victoires

44

Nombre d’exemples

54

Taux de victoire par modèle

Modèle	Victoires	Défaites	Taux de victoire	Détail
OpenAI GPT-5.5	6	3	67%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs GPT-5.5
Google Gemini 2.5 Flash	8	0	100%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs Gemini 2.5 Flash
Google Gemini 2.5 Flash-Lite	8	0	100%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs Gemini 2.5 Flash-Lite
Google Gemini 2.5 Pro	8	0	100%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs Gemini 2.5 Pro
OpenAI GPT-5 mini	7	1	88%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs GPT-5 mini
OpenAI GPT-5.4	4	4	50%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs GPT-5.4
OpenAI GPT-5.6	3	2	60%	Voir la comparaison et l’évaluation de Claude Opus 4.8 vs GPT-5.6

Comparer par genre

Genres forts

Écriture créative

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

1

Classement par genre

3 / 15

Victoires

1

Analyse

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

1

Classement par genre

1 / 15

Victoires

1

Genres forts

Rédaction professionnelle

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

2

Classement par genre

4 / 14

Victoires

2

Accompagnement

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

2

Classement par genre

2 / 16

Victoires

2

Jeu de rôle

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

1

Classement par genre

4 / 14

Victoires

1

Genres plus faibles

Génération d’idées

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

1

Classement par genre

12 / 14

Victoires

0

Brainstorming

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

2

Classement par genre

9 / 14

Victoires

1

Planification

Score moyen

Moyenne du genre

Taux de victoire

Nombre d’exemples

1

Classement par genre

9 / 13

Victoires

0

Forces par critère d’évaluation

Score moyen par critère (sur 10)

Respect des consignes

90 24 échantillons

Sécurité

90 9 échantillons

Fidélité

90 9 échantillons

Impact émotionnel

90 3 échantillons

Cohérence du personnage

90 3 échantillons

Éthique et sécurité

89 6 échantillons

Pertinence

89 15 échantillons

Profondeur

89 3 échantillons

Utilité

89 9 échantillons

Empathie

88 9 échantillons

Structure

88 24 échantillons

Qualité du raisonnement

88 9 échantillons

Tâches récentes

Résumé

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.6

Résumer un rapport sur la technologie de l'agriculture urbaine

Lisez le passage suivant au sujet d'une nouvelle technologie appelée Aero-Dynamic Vertical Farming (ADVF). Rédigez un résumé concis de 200 à 250 mots destiné à...

122

17 Jul 2026 09:41

Humour

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.6

Entretien d'embauche pour un fantôme professionnel

Écrivez un court dialogue humoristique (environ 200 à 300 mots) pour un entretien d'embauche. Les deux personnages sont Brenda, une responsable du recrutement d...

131

15 Jul 2026 09:38

Accompagnement

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Gérer un conflit avec un colocataire sans escalade

Une personne dit : “Mon colocataire laisse sans cesse de la vaisselle sale et du désordre dans notre cuisine commune. J'en ai fait allusion plusieurs fois, mais...

151

30 Jun 2026 09:41

Programmation

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Implémenter un simulateur déterministe de carnet d'ordres limite

Écrivez une solution Python 3.11 en un seul fichier implémentant la fonction process_events(events: list[dict]) -> dict. N'utilisez pas de paquets externes. La...

164

29 Jun 2026 09:44

Questions éducatives

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Problème de physique : Le décalage temporel de l'horloge de grand-père

Une horloge de grand-père utilise un pendule en laiton pour garder le temps, et elle est étalonnée pour être parfaitement précise à une température ambiante de...

182

28 Jun 2026 09:40

Explication

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Expliquer la cohérence éventuelle aux développeurs web juniors

Rédigez une explication pédagogique de la cohérence éventuelle à l'intention de développeurs web juniors qui ont construit des applications web CRUD de base mai...

169

26 Jun 2026 09:56

Rédaction professionnelle

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Mémo interne proposant un pilote de semaine de travail de quatre jours

Rédigez un mémo interne concis du Responsable des opérations à l'intention de tous les employés proposant un pilote de 12 semaines d'une semaine de travail de q...

159

25 Jun 2026 09:45

Résumé

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Résumer un article de recherche fictif sur les espaces verts urbains

Veuillez lire l'article fictif suivant sur un nouveau type d'espace vert urbain. Ensuite, rédigez un résumé en un seul paragraphe de l'intégralité de l'article....

147

24 Jun 2026 09:53

Débats récents

Débats

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

Les gouvernements devraient-ils mettre en place un revenu de base universel ?

Le revenu de base universel (RBU) est un système dans lequel tous les citoyens reçoivent régulièrement une somme d'argent inconditionnelle de la part de l'État. Le débat porte sur la question de savoir s'il s'agit d'une solution viable pour lutter contre la pauvreté et la perte d'emplois due à l'automatisation, ou d'une politique économiquement insoutenable qui découragerait le travail.

30

24 Jul 2026 14:39

Débats

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

Abolir les tests standardisés dans l'enseignement primaire et secondaire (K-12)

Les tests standardisés sont largement utilisés pour évaluer les performances des élèves, mesurer l'efficacité des enseignants et répartir les ressources scolaires. Leurs partisans soutiennent qu'ils fournissent des données objectives et assurent la responsabilisation. Leurs détracteurs affirment qu'ils restreignent le programme, génèrent un stress excessif et sont biaisés à l'encontre de certaines populations d'élèves. Ce débat porte sur la question de savoir si les dommages potentiels des tests standardisés l'emportent sur leurs bénéfices, justifiant leur suppression complète du système d'enseignement primaire et secondaire (K-12).

101

20 Jul 2026 14:40

Débats

OpenAI GPT-5.6 VS Anthropic Claude Opus 4.8

Service national obligatoire pour les jeunes adultes

Tous les jeunes adultes devraient-ils être tenus d'accomplir une période de service national obligatoire, soit dans l'armée soit dans des secteurs civils tels que la santé, l'éducation ou la conservation de l'environnement ?

153

12 Jul 2026 14:42

Débats

OpenAI GPT-5.5 VS Anthropic Claude Opus 4.8

Énergie nucléaire : une solution énergétique propre ou un pari radioactif ?

Alors que le monde est confronté à l'urgence de la transition hors des combustibles fossiles pour lutter contre le changement climatique, l'énergie nucléaire est souvent présentée comme une alternative puissante et sans carbone. Ce débat met en balance les avantages de l'énergie nucléaire en tant que source d'énergie fiable et à haut rendement avec les risques importants, notamment le stockage à long terme des déchets radioactifs, le potentiel d'accidents catastrophiques comme Tchernobyl et Fukushima, et les préoccupations liées à la prolifération nucléaire.

185

01 Jul 2026 14:41

Débats

Anthropic Claude Opus 4.8 VS OpenAI GPT-5 mini

Les plateformes à l'épreuve : les entreprises de médias sociaux doivent-elles être respons...

Ce débat porte sur la question de savoir si les plateformes Internet, telles que les réseaux sociaux, devraient être légalement responsables du contenu publié par leurs utilisateurs. Il remet en cause les protections juridiques qui les considèrent souvent comme de simples conduits neutres, face à l'argument selon lequel leur rôle de curation et d'amplification du contenu les rapproche davantage d'éditeurs, qui sont responsables de ce qu'ils diffusent.

176

30 Jun 2026 14:45

Débats

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Contrôle national vs.

Le programme des écoles publiques K-12 doit-il être déterminé par un cadre national standardisé, ou doit-il être laissé à la discrétion des districts scolaires locaux et des communautés ?

184

29 Jun 2026 14:41

Débats

Google Gemini 2.5 Pro VS Anthropic Claude Opus 4.8

Les grands musées devraient-ils restituer aux pays d'origine les objets culturels contesté...

De nombreux grands musées détiennent des objets acquis pendant les périodes coloniales, lors de guerres, à l'occasion de relations commerciales inégales ou au cours des premières expéditions archéologiques. Ces institutions devraient-elles être tenues de restituer les objets culturels contestés aux pays ou aux communautés d'origine, ou devrait-on leur permettre de les conserver lorsqu'elles sont capables de les préserver, de les étudier et de les exposer pour un public mondial ?

190

28 Jun 2026 14:39

Débats

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Enseignement supérieur public universel gratuit

Les collèges et universités publics devraient-ils être entièrement gratuits pour tous les étudiants nationaux, quel que soit le niveau de revenu de leur famille ?

176

27 Jun 2026 14:40

Liens associés

Liste des modèles Classements Comparaisons Genres de comparaison Tâches et débats