Orivel Orivel
Ouvrir le menu

Claude Opus 4.8

Explorez les scores benchmark, points forts par genre, limites et exemples recents de Claude Opus 4.8.

Apercu du Modele

Fournisseur: Anthropic · claude-opus-4-8 NOUVEAU

Publie

2026-05-28

Contexte

1M tokens

Entree

$5.00 / 1M

Sortie

$25.00 / 1M

Claude Opus 4.8 est le modèle phare actuel d'Anthropic, publié le 28 mai 2026 — environ six semaines après Opus 4.7. Anthropic le positionne comme son modèle le plus performant pour le raisonnement complexe, le codage agentique de longue haleine et le travail de connaissance à forte autonomie.

Les principaux gains par rapport à Opus 4.7 sont un jugement plus aiguisé, plus d'honnêteté sur sa propre progression et la capacité de travailler en autonomie plus longtemps. Il est environ quatre fois moins susceptible que son prédécesseur de laisser passer des défauts dans son propre code et domine en ingénierie logicielle agentique, avec 69,2% sur SWE-Bench Pro devant GPT-5.5 et Gemini 3.1 Pro.

Le modèle conserve le contexte de 1M tokens et jusqu'à 128k tokens de sortie sur la Messages API. Le tarif reste inchangé par rapport à Opus 4.7 ($5 entrée / $25 sortie par 1M tokens), date de coupe des connaissances : janvier 2026. Les nouvelles surfaces ajoutent un contrôle `effort` (par défaut high) et une préversion de recherche Dynamic Workflows pour de grandes tâches agentiques parallélisées.

Changements

  • Publié le 28 mai 2026 comme successeur de Claude Opus 4.7 (environ six semaines plus tard)
  • Jugement plus aiguisé, plus d'honnêteté sur sa progression et travail autonome plus long
  • ~4x moins susceptible qu'Opus 4.7 de laisser passer des défauts dans son propre code
  • SWE-Bench Pro 69,2% — devant GPT-5.5 et Gemini 3.1 Pro en codage agentique
  • Gains en raisonnement multidisciplinaire, utilisation agentique de l'ordinateur et analyse financière agentique
  • Contexte 1M tokens ; jusqu'à 128k tokens de sortie sur la Messages API
  • Paramètre `effort` (par défaut high) pour ajuster l'effort du modèle par réponse
  • Préversion de recherche Dynamic Workflows pour des tâches à sous-agents parallèles ; fast mode à 2,5x la vitesse
  • Tarif identique à Opus 4.7 : $5 entrée / $25 sortie par 1M tokens
  • Adaptive thinking ; disponible via Claude API, Amazon Bedrock, Vertex AI et Microsoft Foundry
  • Date de coupe des connaissances et des données d'entraînement : janvier 2026
Annonce officielle

Performance Globale

Classement general

#1

Taux de victoire global

100%

Score moyen

87

Victoires

14

Nombre d exemples

14

Taux de victoire par modele

Comparer par genre

Forces par critere d evaluation

Score moyen par critere (sur 10)

Quantite

97 3 echantillons

Respect des consignes

95 3 echantillons

Fidelite

93 3 echantillons

Securite

92 3 echantillons

Diversite

91 3 echantillons

Utilite

91 3 echantillons

Structure

89 6 echantillons

Couverture

89 3 echantillons

Ethique et securite

89 3 echantillons

Empathie

89 3 echantillons

Pertinence

89 6 echantillons

Utilite

89 3 echantillons

Taches recentes

Brainstorming

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Générer des idées de programmes peu coûteux pour adolescents en bibliothèque

Une bibliothèque publique de taille moyenne souhaite augmenter la fréquentation en personne des adolescents âgés de 13 à 18 ans pendant une période d'été de 10...

10
03 Jun 2026 10:19

Résumé

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Résumer la présentation générale du Télescope spatial James Webb

Lisez l'article suivant sur le Télescope spatial James Webb (JWST) et rédigez un résumé concis. Votre résumé doit être un seul paragraphe cohérent de 150 à 200...

30
02 Jun 2026 09:39

Accompagnement

Google Gemini 2.5 Flash VS Anthropic Claude Opus 4.8

Dire non à un voyage coûteux entre amis

Un utilisateur demande un conseil personnel du quotidien : « Mon ami proche organise un voyage d'anniversaire de quatre jours qui coûterait plus cher que ce que...

30
01 Jun 2026 09:37

Humour

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Humour familial : Le guide audio de musée trop honnête

Écrivez un court dialogue comique entre un visiteur de musée et un guide audio exceptionnellement honnête dans une exposition fictive appelée « Objets du quotid...

35
31 May 2026 09:35

Conception de systèmes

OpenAI GPT-5.4 VS Anthropic Claude Opus 4.8

Concevoir un système de tableau blanc collaboratif en temps réel

Vous devez concevoir une architecture système de haut niveau pour une application de tableau blanc collaborative en temps réel. **Exigences principales :** 1....

52
30 May 2026 09:41

Rédaction professionnelle

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Opus 4.8

Courriel client concernant un retard du déploiement d'une fonctionnalité

Rédigez un courriel destiné aux clients, émanant du Responsable produit d'une entreprise B2B SaaS, annonçant un retard du déploiement prévu d'une fonctionnalité...

56
29 May 2026 09:37

Persuasion

OpenAI GPT-5 mini VS Anthropic Claude Opus 4.8

Persuader un conseil municipal sceptique d'approuver le financement d'une nouvelle bibliothèque

Vous êtes un défenseur communautaire qui se prépare à prendre la parole lors d'une réunion du conseil municipal. Votre objectif est de persuader le conseil d'ap...

63
28 May 2026 23:35

Debats recents

Debats

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Les tests standardisés dans les écoles : une mesure équitable du mérite ou une barrière dé...

Les tests standardisés, tels que le SAT, l'ACT et divers examens au niveau des États, sont depuis longtemps une pierre angulaire du système éducatif, utilisés pour l'évaluation des élèves, l'évaluation des établissements et les admissions à l'université. Les partisans soutiennent qu'ils fournissent un référentiel objectif pour mesurer la réussite académique à travers des populations diverses. Cependant, les critiques affirment que ces tests sont culturellement biaisés, favorisent les élèves issus de milieux privilégiés et ne parviennent pas à saisir les véritables aptitudes ou le potentiel d'un élève, ce qui a conduit à des appels à leur abolition au profit de méthodes d'évaluation plus holistiques. Le débat porte sur la question de savoir si les tests standardisés sont un outil essentiel pour la responsabilisation et la méritocratie ou un système discriminatoire qui perpétue les inégalités.

12
03 Jun 2026 14:38

Debats

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Les transports publics devraient-ils être gratuits pour tous les usagers ?

De nombreuses villes sont confrontées à la congestion, à la pollution, au financement des transports et à un accès inégal aux services de mobilité. Une proposition consiste à supprimer les tarifs des bus, trams et métros pour tout le monde, en finançant le fonctionnement par des impôts ou d'autres recettes publiques. Les villes devraient-elles rendre les transports publics gratuits pour tous les usagers, ou devraient-elles maintenir les tarifs et concentrer les subventions sur ceux qui en ont le plus besoin ?

29
02 Jun 2026 14:37

Debats

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.4

Le rôle des tests standardisés dans l'éducation

Les tests standardisés sont largement utilisés pour mesurer l'aptitude des élèves, les acquis scolaires et la performance des établissements. Les partisans soutiennent qu'ils offrent un repère objectif pour la responsabilisation et la comparaison, tandis que les détracteurs estiment qu'ils sont inéquitables, source de stress et favorisent un programme scolaire étroit. Ce débat porte sur la question de savoir si les tests standardisés doivent rester une pierre angulaire du système éducatif.

35
01 Jun 2026 14:38

Debats

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

La semaine de travail de quatre jours : une révolution de l'équilibre vie professionnelle-...

Le concept d'une semaine de travail standard de quatre jours, sans réduction de salaire, gagne du terrain à l'échelle mondiale comme moyen d'améliorer le bien-être et la productivité des employés. Le débat se demande si ce modèle est une évolution durable et bénéfique du lieu de travail moderne ou un idéal impraticable qui crée plus de problèmes qu'il n'en résout pour les entreprises et l'économie.

44
31 May 2026 14:38

Debats

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Pro

Les villes devraient-elles remplacer la plupart des places de stationnement en voirie par...

De nombreuses villes disposent d'un espace limité au niveau du trottoir qui est actuellement utilisé pour le stationnement de voitures privées. Les gouvernements locaux devraient-ils supprimer la plupart des places de stationnement en voirie sur les axes principaux et reconfigurer cet espace pour des pistes cyclables protégées, des trottoirs plus larges, des arbres et des bancs publics ?

57
30 May 2026 14:37

Debats

Anthropic Claude Opus 4.8 VS Google Gemini 2.5 Flash

Les villes devraient-elles interdire les voitures particulières dans les centres-villes ?

De nombreuses villes envisagent de restreindre ou d'interdire les voitures particulières dans les quartiers centraux densément peuplés afin de réduire les embouteillages, la pollution et les décès liés à la circulation. Les gouvernements municipaux doivent-ils aller vers des centres-villes sans voitures, ou doivent-ils préserver un large accès aux véhicules privés ?

64
29 May 2026 14:37

Debats

Anthropic Claude Opus 4.8 VS OpenAI GPT-5.5

Revenu de base universel : une voie vers la prospérité ou la ruine économique ?

Les gouvernements devraient-ils mettre en place un revenu de base universel (RBU), versant à chaque citoyen adulte un paiement régulier et inconditionnel suffisant pour couvrir les frais de subsistance de base, indépendamment de leur situation professionnelle ?

80
29 May 2026 00:05

Liens associes

X f L